Está en la página 1de 462

?

ESTAASVTCA
illétodos y Z\pficaciones

Iidütin Galinclo

I'¡3O CII:N CIA EDITOI3ES


20ll
Capítulo 1

Análisis Exploratorio de Datos

Nuestra fe en Dios. El resto debe produc'ir datos.


Anónimo

En cualquier actividad de Ia ciencia, la técnica, Ios negocios o de la vida cotidiana, que dé como
resultado una serie de mediciones, se obtiene más información que las simples cifras recolectadas. El
cómo conseguir la información, su análisis e interpretación se puede realizar de muchas maneras, pero
primero se debe tener una idea clara de las características más importantes de los datos obtenidos.

Los datos pueden ordenarse en tablas; sin embargo, éstas no muestran su comportamiento global.
Su representación gráfica ayuda a captar fácilmente tendencias y establecer modelos probabilísticos.
Conjuntamente con el empleo de métodos numér'icos sencillos, se puede presentar datos, resumir in-
formación y dar una respuesta rápida del comportamiento global de Ias unidades de donde provienen
dichos datos.

En este capítulo examinaremos varios de estos métodos, que son aquellos que frecuentemente aparecen
en los paquetes computacionales de estadística.

1.1. Introducción

En primer lugar, demos una definición de la ciencia Estadística que recoge mucho de lo que ella realiza.

La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a


individuos, grupos, series de hechos, etc. y deducir de ello, gracias al análisis de estos datos. unos
significados precisos o unas previsiones para el futuro.

1.1.1. División de la EstadÍstica

Para su mejor estudio, a Ia EstadÍstica se Ia divide en dos grandes ramas: la Descriptiva y la Inferencial.

La Estadíst'ica Descriptiua -también conocida como Anó.lisis Erploratori,o de Datos- consiste, sobre
:odo, en la presentación de datos en forma de tablas y gráficos. Está diseñada para resumir o describir
los datos sin factores adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como
:ales.
Capitulo 7. AnáIísis Exploratorio de Datos

se deriva de mur:stras, de observ¿rciones hechas sólo ¿rcerca de una parte de


La Esto,dística I'nferencial
un conjunto numeroso de elementos y esto irnplica qrre su análisis requiere de generalizaciones que van
más allá de Ios datos. Como consecnerrcia, la caracter'ística más importante del reciente crecimiento
de la Estadística ha sido un cambio err el énfasis de los métodos que describen a métodos que sirven
para hacer generalizaciones. La Estadística Inferencial investiga o analiza una población partiendo de
la información obtenida a través de muestras.

!.L.2. Algunos problemas que resuelve la Estadística

Para aplicar los métodos estadísticos a la información disponible, es necesario tener presente los tipos
de problemas que esta ciencia resuelve.

Descripción de datos. El primer problema que, históricamente, aborda la Estadística es la des-


cripción de datos. Supongamos que se han tomado ciertas mediciones, que pueden ser los gastos de
alimentación en las familias, la producción de las máquinas de un taller, o las preferencias en un grupo
de votantes. Se trata de encontrar procedimientos para resumir Ia información contenida en los datos.

Análisis de muestras. Es frecuente que, por razones técnicas o económicas? no sea posible estudiar
los elementos de una población. Por ejemplo, para determinar Ia opinión de la población ante las
elecciones solo se investiga a un grupo pequeño, ya que es imposible consultar a todas las personas
en capacidad de votar. Análogamente, se acude a una muestra para estudiar la rentabilidad de un
proceso de fabricación o para de terminar el nivel de ocupación de la población.

La Estadística se utiliza para elegir una muestra representativa y para hacer inferencias respecto a la
población a partir de lo observado en la muestra. Este es el procedimiento aplicado para, por ejemplo:

Decidir si un proceso industrial funciona o no adecuadamente, de acuerdo a las especificaciones.

Estudiar la relación entre consumo de tabaco y cáncer.

. hzgar respecto a la demanda potencial de un producto, mediante un estudio de mercado.

Orientar la estrategia electoral de un partido polltico.

Interpretar una prueba de inteligencia.

Medición de relaciones. Los gastos en alimentación de una familia dependen de sus ingresos, pero,
es imposible determinar con exactitud cuál será el ga.sto de una familia de ingresos dados. Entonces,
no existe una relación exacta, sino estadística. Determinar y medir estas relaciones es importante
porque, debido a los errores de medición, las relaciones que observamos entre variables fÍsicas, sociales
o técnicas son, casi siempre, estadísticas.

Preguntas como: ¿Depende la calidad de un producto de las condiciones de fabricación y transporte?


¿Cómo se relaciona el rendimiento escolar con variables familiares o sociológicas? ¿Cuál es la relación
entre desocupación e inflación?, se responden en términos estadísticos.

Predicción. Muchas variables económicas y físicas tienen cierta inercia en su evolución y aunque
sus valores futuros son desconocidos, el estudio de su historia es informativo p¿rra prever su compor-
tamiento futuro. Este es el mecanismo que se emplea para prever la demanda de un producto, la
temperatura en un horno industrial o las magnitudes macroeconómicas.
7.2. Definiciones básicas

1.1.3. Obtención de información


Cuando se examina un proceso o un fenómeno podemos producil una variada información, entonces
es preciso determinar cuál es la de interés para Ios fines que tengamos y cómo conseguirla; así mismo,
se debe tener una idea del número de observaciones que son necesarias para disponer de informaciórr
confiable.

Para la obtención de información estadÍstica se emplean dos formas bien diferenciadas: los métodos
de muestreo y los experimentos diseñados.

Una investigación por muestreo es un estudio cuya finalidad es la recolección de datos y en el que
el investigador no tiene control sobre las condiciones o los individuos participantes. Ejemplos de
muestreos son los censos, las encuestas electorales o de consumo de un producto.

Un experimento es cualquier proceso o estudio en el que se realiza una recolección de datos donde el
investigador, usualmente, tiene control sobre algunas de las condiciones bajo las cuales el experimento
tiene lugar. Por ejemplo, en el desarrollo de un nuevo medicamento, en la preparación de una nueva
aleación de acero para usar en los automóviles, es necesario realizar experimentos para comparar su
efectividad con otros previamente existentes.

L.2. Definiciones b:ísicas

Las que antes indicamos son las principales aplicaciones de la Estadística, cuando esta ciencia se
utiliza para analizar procesos o fenómenos naturales a profundidad. Pero este no es nuestro caso, por
el momento, nosotros podemos pensar que la EstadÍstica es la ciencia de <<deducir hechos a partir de
datos y de figuras>>.

Aquí surgen varias ideas importantes en todo análisis estadístico: la unidad muestral,la población (o
uniaerso) y la muestra.

Definición (de unidad muestral o experimental) Una unidad es una persona, animal, planta o
cosa que es examinada por un investigador; es el objeto básico sobre el cual el estudio o experimento
se lleva a cabo.

Por ejemplo, una persona, un mono, un plato de semillas, un grupo de facturas.

Definición (de población o universo) Una población es una colección completa de personas,
animales, plantas o cosas de las cuales se desea recolectar datos. Es el grupo entero al que queremos
describir o del que deseamos sacar conclusiones.

Definición (de muestra) Es un grupo de unidades seleccionadas de la población de acuerdo con


un plan o regla, con el objetivo de obtener conclusiones sobre la población de la cual proviene.

EI núrmero de unidades que constituyen la muestra se denomina tamaño muestral.

Generalmente, se selecciona una muestra porque la población es demasiado grande para estudiarla
enteramente. La muestra debe ser representativa de la población general, lo que se logra mediante
una selección al azar de las unidades. También, es importante que el investigador defina, completa
y cuidadosamente, la población antes de recolectar una muestra, incluyendo una descripción de los
miembros a ser seleccionados.

A continuación damos varios ejemplos:


4 Capítulo 7. Análisis Exploratorio de Datos

7. la estructula demográfic4, pol edad, de lti población ecuatoriana. El universo


Se desea establecel
Io forman los datos de nacimientos existentes en las ofi.cinas clel Registro Civil. Una mr-restra
puede ser tomada considerando las persolas cuyo apellido comienza con ia letra A.

2. En un estudio se quiere conocer el <<rating>> de sintonía de los canales de teievisión de una


ciudad. La población está constituida por los hogares que poseen televisor y una muestra Ios
hogares de 40 manzanas distribuidas en la ciudad.

3. Una dueña de almacén desea estimar el gasto medio de compra de sus clientes en su almacén
en el último año. La población es todas las facturas de compra en el indicado periodo. Una
muestra de ciento veinte facturas seleccionadas aleatoriamente, serviría para tener una idea del
gasto medio de los clientes.

En los ejemplos anteriores solo se enunciaron posibles muestras para las distintas poblaciones, sin
importar que tan buena pudiera ser ésta.1

I-.3. Datos y escalas de medición


A Ias mediciones o valores obtenidos en un estudio estadístico se los denomina datos provenientes de
una variable estadística.

1.3.1. Tipos de datos


Los datos pueden ser:

1. Cualitativos (Descriptivos o categóricos): Cuando ellos describen caracterÍsticas que no son


medibles; por ejemplo, el sexo de un animal, el color de los zapatos, la profesión de una persona.

2. Cuantitativos (Numéricos): Cuando ellos describen caracterÍsticas que son medibles; por ejem-
plo, la temperatura del ambiente, el número de hijos de un matrimonio, el salario de una persona.
A su vez, las variables cuantitativas se clasifican en discretas y en continuas.
Datos discretos. Un conjunto de datos se denomina discreto si los valores u observaciones
que pertenecen a él son distintas y separadas; es decir, ellas pueden ser contadas (1, 2,3, ...).
Ejemplos de datos discretos son: el número de clientes que ingresa a un almacén en un día, el
número de años que vive una persona.
Datos continuos. Un conjunto de datos se denomina continuo si Ios valores u observaciones que
pertenecen a él pueden tomar cualquier valor en un intervalo considerado. Ejemplos de datos
continuos son: el tiempo que se demora en ejecutarse un programa en la computadora, el peso
de una persona.

L.3.2. Escalas de medición

Definición (de escala de medición) Una escala de medición es un instrumento de medida con
el que se asignan valores a las unidades estadÍsticas.

I
La elección apropiada de las muestras se explicará en profundidad en el CapÍtulo 13
7.4. Característ,icas de los datos

Escala nominal' Un conjrrnto de clatos cstá mecliclo en esca,l,a nomin,al si a los vaiorcs que pertcnccen
a é1 se lcs puedc asignar un código, en la forma cle nn nrimero, clonde los núrmeros
sor simpleme¡te ula
cticlueta' Los datos en escala nominal ptteclen ser contados, pcro no pueden ser orclen¿clos o medi¿os.

Por ejemplo) elr Lln registro de pclsonas, los hornbres pueden ser codificados como 0 y las mujeres
como 1; el estado civil de un indirriduo puede codifi.carsc como "1" si es casado y como ,,2,'
si no lo es.
Escala ordinal. IJn conjunto de clatos cstá medido <:n esca,la ord.inal si a los valores qne per.tenecen a
él se les puede asignar un orden o asociar una escala. Los datos en escala ordinal pueden
ser contados
y ordenados, pero no pueden ser medidos.
Las categorías, para un conjunto ordinal, deben tener un orden natural; por ejemplo, suponga que
a
ur grupo de personas se les pide que clasifiquen la calidad de la señal de las emisiones de radio, en
una escala de 5 a 1, que representan excelente, buena, regular, mala y pésima. Un puntaje de
b indica
mejor señal que un puntaje de 4. Así, los datos resultantes son ordinales.

Escala de intervalo. Un conjunto de datos está medid o en escala d,e interualo si los valores que
pertenecen a él pueden tomar cualquier valor dentro de un intervalo finito o infinito, con
la particula-
ridad de que existe un <<cero relativo>>. Los datos en escala de intervalo pueden ser contados, ordenados
y son válidas las operaciones de adición y sustracción) pero no las de multiplicación y división.

Ejemplos de datos en escala de intervalo son: la temperatura medida en grados centígrados (donde
hay un cero elegido arbitrariamente), los puntajes obtenidos en una pruebalaonae un puntaje
de cero
no significa que quien lo obtuvo no sabe nada).

Escala de razón. Un conjunto de datos está medido en escala d,e razón si los valores que pertenecen
a él pueden tomar cualqnier valol dentro dc un intcrvalo finito o infi.nito, con Ia particula'idad
de que
existe un <<cero absoluto>>. Los datos en escala de intervalo pueden ser coritados, ordenados y
son
válidas las operaciones de adición, sustracción, multiplicación y división.

Ejemplos de datos en escala de lazón son: la temperatura medida en grados Kelvin (doncle
hay un
cero absoluto), la estatura de una persona, cl tiempo de vida úrtil de una máqnina.

1.3.3. Valoresatípicos

Un valor atípico -también denominado valor inusual o valor extremo- en un conjunto de datos,
es
t una observación que es lejana, en valor, del resto de datos; es clecir, es un d.ato inusualmente
grande
o innsnalmente pequeño, cotriparado con Ios dern¿is.

Un valor atípico ¡>uede ser el rcsultado de un error en una medición, en cuyo caso distorsiona Ia
interpretación de los datos al tetrer una influencia excesiva sobre los cálculos a partir
de la muestra.
Si el valor atípico cs un lesultado genuino es importante, porque podría indicar nn
compoltamicnto
S extremo del proceso en estudio. Por esta razón, toclos los valores atípicos deben
ser exarni¡ados
) cuidadosamente antes de rcalizar un análisis formal y no se los debería eliminar
sin una.justificación
pre\¡1a.

L.4. Características de los datos

Todo conjunto de datos presenta ciertas características que perrniten, en rlna pr.imera
aproximación,
deducir el comportirmiento dcl proceso del cr-ral fueron obteniclos. Las tres principales
características
son: la localización, la dispersión y la simetría.
Capítulo 7. AnáIisis Exploratorio de Datos

o tr ocalización. La krcaliz¿tción <le nn conjrrnto clc clatos cs la Posición lelatir'¿r cltic cllos lllesentan.
En gc'rrcr:rl, se rrricle ¿L la localiz¿rción lror cl valcil que tiene el pLrnto mr:clio clel corrjurrto c.1e clatos.
Por cljernplo, r,:rr la rnedici<in cl<r la r¡st¿rttu'¿r rl<,r lrrr grlipo de personirFj) l¿)s medicioncs est¡rr'án
entre los trcirrta centírnetlos (clc los rcciérr naciclos) y los cLos mctlos veinl,e centíne-
localiza,cl¿¡.s
tros (clc los adultos muy altos), si se srrl>one qucl esta,turas rxayorcs no se prcsentar, y se pirede
caracterizal a todos ellos con una estatura prornedio de 1.70 mctros.
La iclea de localización fr-ic introcluci<la por R. A. Fisher er 7922.

Dispersión. Los valores obtenidos en url¿ mnestra no son todos iguales. La valiación cntre
estos valoles sc denomnzt dispe'rsión. Cu¿rndo sc mide la dispersión sc desea dctectar el grado
de disemirración de los valores individuales alrededor del centro de ias observaciones.
En los procesos de manufactura o de medición) una alta precisión está asociada con una baja
dispersión.
El concepto de dispersión fue introdr.rcido por F. Galton (en 1886) y por W. Lexis (en 1887) e
identificado como aqrrel en el que se reflejan las cliferencias entre las mediciones) provenientes de
una misma fuente o tomadas en condiciones semejantes.

Simetría y asimetría. Un conjunto de datos es sirnétrico cuando los valores de los datos están
distribuidos en la misma forma por encima y por debajo de su punto medio.
Los datos simétricos:

1. Son fáciles de interpretar, pLles los dal;os c¡re están por encima y por debajo del pr.rnto medio
pueden sel considelaclos con un misrrio critcrio;
2. Pelmitcn la fácii detección de valores atÍpicos;
d. Adrniten la comparación con conjurrtos de datos similales, en tér'minos de la dispersión.

Figula 1.1: Forma csqucrnática cle clatos simétricos y asimétricos.

La asimctría cn un conjrtnto cie datos es el ¿lgrtrpaniiento que ellos Jrresentan a un lado de su centro
Los valores situados a un lado de la rnitacl clc los datos ticnclen a estar rnás alejados qrre 1os \¡¿rlores
clue se enclrerrtran cn ei otro l¿rdo.

1"5. Distribución de f,recuenaias

La distribuci,ónde ,f'rec'u,en"cias cs Lrrre herrarnicnta que se emplea para resurnir', mediantc una tabla,
nurnerosos d¿tos dc rnancra qlle sc ponga de maniliesto l¿ loc¿rlización y Ia clispersión de l¿rs ol¡serva-
cloLcs.
7.5. Distríbución de frecuencias

Con ltna tabla de frccuencia,s se puedcn resurnir- da,tos ctrtegór'icos, nominales u ordiuales. Si los clatos
son continrros se pr-rede lesumillos l.ln¿r \rez qlle se los ha dividido cn grupos serrsiltlcs.

Si se dispone (le un núrrnelo alto dc obsclvacioues) r¿, se procede ¿r cstablccel cr,rántas vcccs se rcpite
cada nrta de ellas, pala cletelrninar sn frecu,en,ci,u o,bsolutct, n". A par:til dc esta información bá,sic¿r se
puede obtencl o1,la, que es converriente poncrla etl nna tabla.

Par'¿r la confección de ltna tabla, de distribución dc frecuencias es lecomcrrdablc segu.ir los sigrrientes
Pasos:

Procedirniento.

1. Se ordenan los datos tr7) :[2) . . ., rk en ur]a columna, de forma ascendentc, poniendo a continuación
k
sus frecuencias absolutas n1, TL2¡ ...¡ n¡. Nótese que D rLi: n.
i:r
2. Luego se forma una tercera columna en la que se pone Ia frecuenc'ia relat'iua; que resulta de
dividir la frecuencia absoluta n¿ para el núrmero total de observaciones: /¿ - 3. Xo es más que
TL
la proporción de aparecimiento de cada observación.

3. Pueden, también, calculalse dos columrlas correspondientes a las fi'ecuencias acumuladas, tanto
absoluta como relativa, que resultan de sumar las frecuencias de todas las observaciones ante-
riores hasta la considerada inclusive. Muchas veces, a las frecuencias relativas se las pone como
porcentajes, en lugar de números flaccionarios.

Una tabla de distribución de frecuencias tiene cl siguiente aspecto:

Valor de la Frecuencia Fbec. absoluta FYecuencia Flec. relativa


variable (r¿) absoluta (n¿) acumulada (¡/,) relativa (/') acumulada (8,)
rI TL1 l/r : nr ft Ft: ft
tr2 n2 Nz: Nt * nz Jz Fz: Ft t fz

rk TLI, l/¡:l/¡-1 *n¡ fr F*:Fn:I.fn


Total n 1

Ejemplo. En nna fábrica de muebles de rnaclera, se contlolóe1 tiempo (en minutos) neccsario para
completar un trabajo cle armado de ciertos anaqueles. Se obturrieron las siguientes mediciones del
tiempo empleado por los obreros:

32.9 JJ.4 33.9 tao JJ.J 32.8 J.).1 .1.). i ) J,]..) 33.5
Dt ¡<
.)r).J 33.6 1') n .),). I 33.6 óó.4 33.6 33.8 33.9 t')
.)J. J
o

at o Dt( tto ,]to


33.6 r),).rl 34.4 JJ.I) JÓ.4 ÓJ -L t)ú.! 33.6
,ta 2q7 ot 1 .1.).) .lc r
JJ.r) JJ. I 33.8 33.0 JJ. / r)r).1 ,),). t) r)r).,)
to .'), - ,/ 1 '?a r) ,¡) .\ 1D Á
33.8 .),1. ') L)J.+
Á
J.J. / J+.1 J¿i.- 33.6 32.9 JJ.t
32.9 33.9 33.8 c.t o
.ltr-L
tD t
r).).r) 33.9 34.0 ,1.).J ,u q
.),)-i
tt 1
JJ. l-
33.1
.)Á
J+.1 1 '),)
JJ.A 33.6 óJ. i) JJ. / óó. i 1'),4 a.)
.).).,)
.) .)t Á
!)().+
^

34.0 il :'t3.0 tD OD D
óó. DD
rlJ.+ r',
,1,1. ,),).4^ JJ.J JÓ.+ 33.6 33.6 /
.)t r '12 r) ,j.l 1
r)r).J 33.6 33.0 JJ.1 33.6 JJ.U 33.6 33.1 33.8
,),
J.J. / ,-),1., ) 33.8 JJ.
1
1 .),)..) 33.0 .).) ,.) 33.4 ÓJ. iJ 33.0
Capitulo 7. Análisis Exploratorio de Datos

La sigr-riente taJrla rrnrestra l¿i clistril¡rrción cle flecrrerrci¿ts dc clatos illrliviclrt¿rlns (crr 17 r':rl,rres).

Tierrrpcr f,tecuencia F\'ec. ¿rbsoluta Fl"ecuencia F!'cc. rel¿rtiva


(rnin) absoluta (n¿) acurmrlada (;\) rela.tiva ( l¿ ) acurnulada (,F,)
,t:.1 I t 0.01 0.01
32.8 I 2 0.01 0.02
e
32.9 5 003 0.05
33.0 5 10 0.05 0. 10
,t 1I 0.09 0.19
r)J. 9 19
aD o q 28 0.09 0.28
JJ.J 10 38 0.10 0.38
JJ.4 t2 50 0.12 0.50
I4 64 0.14 0.64
33.6 13 77 0.13 0.77
.)¿). r 8 85 0.08 0.85
33.8 6 9r 0.06 0.91
33.9 4 95 0.04 0.95
34"0 2 97 0.02 0.97
34.t 2 99 0.02 0.99
tÁ a 0 99 0.00 0.99
34.3 0 99 0.00 0.99
34.4 1 r00 0.01 1.00
Total r00 1.00

Sc ha presentado una distribución de frccuencias para 100 datos individuales, pero la tabla pr-rede
Ilegar a scr exterlsa; y si bicn prescnta la, información resunicla, puede ser conveniente resumirla aúrr.
rrrtis, c;r'eando cl¿rses. La agrr-rpac:ión cle clatos cn cl¿rscs sirnplificir Ia presentación y el estuclio cle la
distribución) allnqlle se pierden algunos rleta,lles.
A continuaciórr sc enLlnleran los ptrsos a scguir para constrllir una clistribr-rción de fiecnenci¿rs cle dat,os
agmpatlos en cl¿rses:

Decida el número de clases (ft). La siguienl,e talrl¿r puccle clar rura olientación adccuada cn
Ia rnayor'ítr de los casos.

Número de Número de clases


observaciones recomendado
20-50 6
51 - 100 7
101 - 2U0 B

201 - 500 o
501 - 1000 10
rnás clc 1000 t|-20
Calcule la iongitud de ia clase. La longitrrcl clc la cl¿lsc cs igual a Ia obsclrración rnayol menoil
dividido por cl nLilrrero de clases. Rcdonclcc este rcsulLado pala obtenel rrn rrúrnrero
li1 ttrcnor,
cor)venicnte) que tenga el mismo níurelo de decimales qlre los d¿rtos.
/nráx - frnín
.4
k

,) Construya las clases indicando los cxtremos de Ias misrnas. Cor¡ro ayllda parzr cálculos
J)ostcIioICS:

a) El extremo inferior' (16) plimera clase será cl lírrrrero ilrnediatarnentc rnerror- a1 r'alor'
de 1a
mÍnimo, quc tierle rrn clecirn¡rl rnás y qlle terlnrna cn cnco-
7.5. Distribución de frecuencias

b) f,os restantes extremos de las clases se obtienen ailadiendo repetidarnente la longitud de


clase al extrenro cle c1¿rse anterior, hasta cnbrir todo el rango cle valolcs.
L, : Li-t I A, .j : i,2,...,k.
4 Marque cada observación dentro de la clase que le corresponda. Determine la frecuencia
absoluta, 7r,¿, corr€spondiente a cada clase.

5. Calcule las columnas restantes. IJna vez que tiene la frecuencia absoluta, proceda a calcular
las frecuencias lelativa y acumuladas) como se explicó anteriorrnente.

Observación. El número de intervalos puede variar del inicialmente estimado al redondear el valor
de la longitud del intervalo y que se cumpla el paso 3 a).

Ejemplo. (Continuación.) Construir una distribución de frecuencias por clases de los datos de las
mediciones del tiempo necesario para armar anaqueles.

Solución: De acuerdo a la tabla los datos se distribuirán en k:7 clases. Los máximos y los mínimos
son:
r^5* -- 34.4, rmí. : 32.7, rmáx - trni. : L.7,

1n
longitud de la clase : ::: :0.24,
7

que se redondea a A:0.2.


Fijemos los extremos de los intervalos: el extremo inferior debe ser el número inmediatamente menor al
valor mínimo, que termina en 5 y tiene un decimal más que los datos; es decir, Lo:32.65. Luego, Ios
extremos siguientes se determinan sumando, sucesivamente, 0.2 al extremo inferior hasta sobrepasar
el máximo valor de las observaciones:
L1 : Lo * A: 32.65 * 0.2 : 32.85
L2 : Lt * A: 32.85 * 0.2 : 33.05
:

Ls : Le -l A:34.25 *0.2:34.45

Finalmente, se determinan las frecuencias de cada clase.

A continuación se muestran los resultados.

Tiempo FYecuencia FYec. absoluta -tYecuencia Flec. relativa


(min) absoluta (n¿) acumulada (.11,) relativa (/¿) acumulada (fl)
JZ.ti5 - J2.E5 2 0.02 0.02
32.85 - 33.05 10 0.08 0.10
33.05 - 33.25 r8 28 0.18 0.28
33.25 - 33.45 22 50 0.22 0.50
33.45 - 33.65 27 77 0.27 0.77
33.65 - 33.85 t4 91 0.14 0.91
33.85 - 34.05 97 0.06 0.97
34.05 - 34.25 99 0.02 0.99
34.25 - 34.45 100 0.01 r.00
Total 100 1.00

Nótese que por efecto del redondeo en Ia longitud del intervalo ha dado un total de 9 clases. Queda
para el Iector realizar el mismo ejercicio redondeando la longitud de Ia clase a 0.3.
10
Capítulo 7. Análisis Exploratorio de Datos
1.6. Representaciones gráficas
de los datos
una rnanera rntly eficiente cle co'oce.
gráficamente' ya que permite
el corn¡lo.ta'riento de un conjunto
dar rtna descripciin a. cre datos es re¡rrese'tar.lo
-"r,lr" rápida y ráit de entender. La importancia
i: ::rff ;Tfi:,::l il:T:T.5 f*13¡,T# l.:, :ll" : ".o an ¿,isis ". t J.t i"o de b e ir acomp añado

1.6.1. Diagrama de puntos


un di'aqrama d'e puntos es una
forma de resumir datos cuantitativos,

;'":T::1,1J*?ll""Til*'q,,:T: ffiñJ: il#;' en ra que cad.a observación


si se disponu a"'lo,"r,os datos, se
cada punro
El diagrama de puntos deja apreciar:

1' Larocarización general de ras


observaciones.
2. La dispersión de las observaciones.

3' La presencia de observaciones


inusuales o valores atípicos.

se aconseja utilizar este diagrama


para representar hasta
un máximo de 20 0bservaciones
individuales,
ffi :JJ.:ffi .H;.:".rTT:i :::il'Ji :* ::,,'*x;:::.: *. i;;#;, s e p ue d en combi
n ar

lli"t-,;,TJrij:"ffi"#::;HX'uu au ru"' i","n,",."iuJl'TT:#il"l'?;:X[::?l".;;


iT;':
cuando se construye un.diagrama de puntos se
deben toma¡ dos decisiones.
La primera es determinar
;i,:JffffJil,:HTJ;:::il;.1*:: ;:;**:."","11fT1,,"*u,0" ;.;l;; ,í,*u
"."u,u
apropiada que
Para datos nominales u ordinales,
un diagrama de puntos es.simirar
barras reemplazadas por a un gráfico de barras, con
una serie de puntos. Para ras
a un histograrl&, con ros iatos contin,os, un diagiama
rectangurás ieemplazado, de puntos es similar
oorl.,-riior. (vcase r" ,'"*io" r.o.a¡
#:;::i:;"tü;1:"::"t'"T"1il mediciones (en milímetros) de ros días de lruvia en er verano de 2006

6'4 4'0 3'2 4'6 3'2 8.2 6.0 0-2


4.6 5.2 0.6 2.0 11.8 16.4 3.2.
El diagrama de puntos está
dado en la Figura 1.2.

i'if?sii u.,n*
Figura 1.2: Diagrama de puntos.

En el diagrama observamos que:


7,6. Representaciones gráficas de los datos 11_

1. Los datc¡s están agnrpados ccrca del valor 3, antes que, digamos B o 10.

2. Las observaciones sc cxtiencleu en ah'ecledor clc 17 uriidacles) con Llua concentración entre 0 y 8.
o
a 3. EI valor 16.4 puede ser calificado de atípico, porque se clcuentra alejado del grupo principal de
o datos.

L.6.2. Diagrama de tallo y hojas


El diagrama de puntos tiene algunas desventajas: es difícil regresar de los puntos a los datos y puede
hacerse confuso si se tiene un número alto de datos. Entonces, es conveniente utilizar otras herramien-
;e
to
tas para realizar su representación gráfica.

El diagrama de tallo g hojas, que es una técnica semigráfica que se emplea para ilustrar las principales
características de los datos (localización, dispersión y simetría). Además, tiene la ventaja de presentar
Ios valores de los datos. Por la forma en que se construye, se debe emplear para un conjunto de hasta
100 datos.

Mediante un ejemplo, veamos cómo se realiza el diagrama, p6o a paso.

Consideremos los siguientes datos:

08 19 77 01 07 09 05 16
13 04 15 02 00 o4 01 12
es)
tar A los datos los clasificaremos considerando las decenas; así tendremos dos grupos, uno que empieza
trá con 0 y otro que empieza con 1. Ellos forman el tallo, al colocarlos de manera vertical:
)o
0
rar 1

lue
A continuación, para cada observación anotamos el segundo dígito (de las unidades) a la derecha de
la barra vertical, que vienen a constituir las hojas. La primera observación 08 da
las
üar
0
1
006
Al agregar la segunda observación 19, da

0 8
1 9

Y así, se van añadiendo las observaciones hasta obtener:

0 8L79542041
1 976352

Los valores que forman las hojas pueden reordenarse de menor a mayor, así:

0 0LI2445789
1 235679
12 Capítulo 7. Análisis Exploratorio de Datos

Podemos crear dos categorías en cada una de las decenas, en las cuales los dígitos de las unidades del
0 al 4 formen un F,rupo y los dígitos del 5 a 9 foimen otro; de esta manera se tiene:

t) r42047
0 8795
1
to
¿¿
1 9765

Cuando los datos constan de más de dos cifras, se deben escoger los rangos para las agrupaciones
que se realizarán;luego aI llcnar las hojas se separan mediante una coma para evitar confusiones. Si
disponemos de los siguientes datos:

qD
DJ 55 79 106 188 47 118 248
47 58 82 113 208 60 88

Se pueden realizar dos diagramas de tallo y hojas:

0 33,47,47,55,58, 60, 79, 82, 88


1 06, 13, 18, BB
2 08, 48

que está agrupado por centenas. El siguiente diagrama está agrupado en intervalos de 50:

0 33,47,47
0 55,58,60, 79, 82,88
1 06, 13, 18
1 88
2 08, 48
2

Asimismo, se pueden usar diagramas múltiples para comparar dos conjuntos de datos, para ello se
coloca un tallo común y las hojas de un conjunto se ponen a la izquierda del tallo y las hojas del
segundo conjunto a la derecha del tallo, de la siguiente manera:

4371 1 44
ft 9888655 1 5779
310 2 0L23344
99875 2 678
311 3 03
.) 5
4

Se observa que los datos de la izquierda están más agrupados en los valores bajos, con un rango mayor
y fuerte asimetría; mientras que el conjunto de la derecha es muy simétrico y con menor dispersión.

También, se emplean estos diagramas para representar datos con decimales; por ejemplo, si tenemos
los datos:

1.3 0.8 1.6 2.0 r.7 7.2 0.5 1.9 0.6 2.2 0.5 1.6.
7.6. Representaciones gráficas de los datos 13

El cliaglanra rcsrrltalte <rs:

0. 5568
1. 236679
2. 02

1.6.3. Gráfico de sectores y gráfico de barras


Los gráficos de sectoles y de barras son dos formas de ¡lrcsentar gr-tlficamente datos categóricos.
Supongamos que los datos aparecen resumidos en una tabla como Ia siguierrte:

FYecuencias Fbecuencias
Categorías
absolutas (n¿) relativas (/¿)
Ct u f,
Cz n2 fz

Cn ;, ir
Total n, 1

Un gráfico de sectores es un círculo dividido en segmentos, donde el área de cada uno de los sectores
es proporcional a la frecuencia relativa de esa categoría. El ángulo central de la categoría es igual a
fi x 360".
Junto a cada uno de los sectores que constituyen el gráfico, se suele indicar el nombre, el número de
elementos y el porcentaje de cada categoría.

También, se puede resumir datos cualitativos mediante rn gró.fi,co de baryas. En éstos, los datos
se exhiben mediante rectángulos, del mismo ancho, cada uno de los cuales representa una categorÍa
particular. La longitud (y por lo tanto el área) de cada rectángulo es proporcional al número de casos
en la categoría que representa.

Si los datos son nominales, las categorÍas se pueden colocar en cualquier orden; pero si los datos son
ordinales, las categorías deben estar ordenadas.

Los gráficos de barras se pueden presentar de manera horizontal o vertical y usualmente hay un espacio
entre los rectángulos. Junto a cada uno de los segmentos que componen el gráfico se coloca el nombre
el número de elementos y el porcentaje de cada grupo.
Con el gráfico de barras se distinguen las principales caracterÍsticas de los datos, como aquellas causas
que son más importantes o que más frecuentemente se presentan en un proceso. También, tiene la
ventaja de que se pueden realizar gró,,ficos de barras agntpadas, que consiste en representar sobre el
mismo gráfico más de dos variables -siempre que estén medidas en las mismas unidades-, permitiendo
realizar comparaciones,

Ejemplo. En una empresa financiera, los empleados disponen de computadortrs portátiles de distintas
marcas. Un resumen del número de máquinas, de acuerdo a su respectiva marca, se presenta en el
siguiente cuadro.

Marca Número de % Marca Número de %


respuestas respuestas
Toshiba 135 42 Lenovo 43 13
Dell 76 23 No sabe 19 6
HP 53 16
t4 Capítulo 7. AnáIisis Exploratorio de Datos

Representar mediante gráficos de sectores y de barras.

Solución: Los gráficos se encuentran err Ia Figura 1.3.

Toshiba

Toshiba Dell HP Lenovo No sabe

Figura 1.3: Gráficos de barras y de sectores.

L.6.4, Histograma

Un histograrna es un conjunto de rectángulos, cada uno de los cuales representa un intervalo de


agrupación. Sus bases son iguales al intervalo de clase empleado en la distribución de frecuencias
y las alturas son proporcionales a la frecuencia absoluta,fi,¿ o relativa /¿ de la clase.

El histograma es apropiado para datos continuos, medidos con una misma escala y se lo emplea
cuando un diagrama de tallo y hojas es tedioso de construir. Igualmente, puede ayudar a detectar
observaciones atípicas y cualquier brecha entre los datos.
Ejemplo. (Continuación.) El histograma correspondiente a la tabla de distribución de frecuencias
de los tiempos de ensamblaje de anaqueles se presenta a continuación.

Figura 1.4:

1.6.5. PolÍgono de frecuencias y ojiva

Un polígono de frecuenci¿s es un gráfico que se obtiene uniendo con segmentos de recta los puntos que
tienen proporcionalmente como abscisa a la marca de clase y como ordenada la frecuencia respectiva.
Se cierra en ambos extremos en las marcas adyacentes con frecuencia cero.
7.7. Ejercicios 15

La ojiua es un polígono de frecuencias acumuladas; es decir, en las abscisas se colocan los límites
superiores de cada intervalo de clase y en Ias ordenadas se coloca la frecuencia acumulada (absoluta o
relativa) de la clase. La ojiva es útil para:

1. Calcular el número o el porcentaje de observaciones que corresponden a un intervalo determinado


de Ia variable.

2. Calcular los percentiles de la distribución de los datos.

Ejemplo. (Continuación.) El polígono de frecuencias y la ojiva, correspondientes a la tabla de


distribución de frecuencias de los tiempos de ensamblaje de anaqueles se presenta a continuación.

Figura 1.5: Polígono de frecuencias y ojiva.

Una vez que se ha confeccionado una tabla de frecuencias y se ha realizado Ia representación gráfica
correspondiente, es necesario disponer de valores que permitan describir y compara¡ los conjuntos de
datos, mediante números que indiquen su posición, su variabilidad y su forma. Ésto se realiza con las
llamadas medidas estadísticas o simplemente estadísticos.

L.7. Ejercicios
1. Dé ejemplos (preferentemente de su propio campo) de poblaciones y muestras.

2. Para cada uno de los distintos tipos de datos: discretos (categóricos, ordinales y nominales) y
continuos, enuncie al menos dos ejemplos. Justifique sus respuestas.
3. En una encuesta de opinión acerca de las preferencias de bebidas gaseosas, por sus colores: negro
l
(N), blanco (B) V R (rojo), 20 consumidores dieron las siguientes respuestas:
i

N, B, B, N, R, B, B, N, N, B, N, B, B, R, N, B, N, R, N, B.
I
Construya el gráfico de sectores circulares.

4. Los siguientes datos corresponden al porcentaje de alumnos de cuarto grado de escuela, clasifi-
cados según su rendimiento académico en la materia lenguaje.

Calificación %
Insuficiente 53
Regular 26
tre
Bueno 15

ta. Muy bueno 5


Sobresaliente 1
16 Capítulo 7. Análisis Exploratorio de Datos

a) ¿,Con quó tipo d<; datos est¿i ustcd tlalra,jauclo? Explique.


b) Retrlir:e los gr'áficos cle pastel y dc barrtr,s clc los d¿rtos.

c) ¿.Qué porcenta.jc de los alurnrros cle cuarto graclo tien<:u urr renclirnierrto <<bucno>> o mejor
que bueno?

E
i). En Ia siguiente tabla se describe diferentes razas d<r perros, según varias caracterÍsticas obser-
vadas.
R,aza Tamaño Peso Velocidad Agresividad Función
basset 11 I 2 2
boxer' 22 2 2 I
bauceron 32 2 2 r)

bulldog 11 I 1 1

caniche 11 2 1 1

chiguagua 11 1 1 1

cocker 2I 2 2 1

colley 32 3 1 1

doberman 32 3 2 3
dogo 33 3 2 ,
r)

fox hound 32 3 2 2
galgo 32 3 1 2
labrador 22 2 1 2
mastin 32 3 2 3
pekinés 11 1 1 I
podenco 22 2 1 2
pointer 32 3 1 2
san bernardo 33 1 2 3
teckel 11 1 1 1

teI'ranor¡a 22 1 1 3

donde la codificación es la siguiente:

Tamaño: 1 tamaño pequeño; 2 tamaño mediano; 3 tamaño grande.


Peso: 1 peso pequeño; 2 peso mediano; 3 peso grande.
Velocidad: 1 velocidad leve;' 2 velocidad mediana; 3 velocidad grande.
Agresividad: 1 agresividad leve; 2 agresividad grande.
Función: 1 compariía;2 caza;3 utilidad.
a) ¿A qué tipo de datos pertenece cada caracterÍstica definida en la tabla?;
b) Para cada variable, realice el gráfico de pastel o el gráfico de barras;
c) Compare los distintos gráficos y deduzca cuáles variables están relacionadas. Explique su
respuesta.

6. Se tiene la siguiente información acerca de la composición del cuerpo humano.

Figura 1.6: Distribución de materiales en el cuerpo y distribución de las proteinas.


7.7. Ejercicios t7

¡,Qué porcentaie del peso total del cuerpo humano corresponde al peso total de la piel?

7. Se registró Ia distancia diaria (en km) que el representante comercial de una empresa recorre
para visitar a sus clientes:

8.2 13.3 10.1 11.5 13.5 7.6 r0.4


4.6 10.5 72.6 13.0 t2.0 4.3 7.7
5.9 10.0 10.8 13.1 14.1 5.0 t2.0
6.5 L2.7 15.0 10.4 t3.2 8.3 13.6

a) Realice un diagrama de puntos para los datos;


b) Realice un diagrama de tallo y hojas;
c) Determine la tabla de frecuencias;
d) Dibuje el histograma;
e) Compare este último con los diagramas de puntos y de tallo y hojas.
8. La inversión anual, en miles de dólares, de una muestra de 40 pequeñas empresas fueron:

36 19 29 37 33 22 29 31 2L 35
2042534 24 27 27 24 26 31
27 77 31 10 28 15 41. 30 18 39
46 26 12 23 18 33 25 28 23 28
a) Elabore una distribución de frecuencias con 7 intervalos de clase;
b) Realice el diagrama de tallo y hojas;
c) Determine el porcentaje de empresas con una inversión entre 14 mil y 20 mil dólares.

9. Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribu-
ción de frecuencias simétrica de 5 intervalos de clase de igual amplitud, resultando como ingreso
mÍnimo 125 dólares, marca de clase del cuarto intervalo: 300. Si el 8 % de los ingresos son
menores que 165 dólares y el 70 % de los ingresos son menores que 275 dólares. ¿Cuál es el
porcentaje de los ingresos que son superiores a 285 dólares?

10. Se tiene la siguiente tabla acerca de las edades de los obreros de cierta empresa:
No. de
Edades
obreros
22-27 L4
27 -32 17
32-37 25
37-42 10
42-47 I4

Encuentre el porcentaje de obreros cuyas edades están comprendidas entre 35 y 40 años.

11. La siguiente tabla muestra la distribución de las notas en un examen.

Nota No. alumnos


0-5 7
5-10 18
10-15 i5
r5-20 10

¿Qué porcentaje tuvieron una nota comprendida entre 8 y 17?


18 Capítulo 7. AnáIisis Exploratorio de Datos

12 Al clasifical las no+"as cle 0 a 100 cn un exarnen,se obtuvo una distribución simét,rica, con 5
intervalos de clase de iglral ancho. Si el 10% desaprotró con rnenos de20, rnientra-s qurcel 40o/o
obtlrvo notas comprendidas entre 40 y 60, ¿,qrré porcentaje de alurrinos obtuvo una nota rnenor
de 60?

13. En la tabla se indi,can los tiempos de espera en las ventanilias de un banco.

Tiempo (rnin) Frec. absoluta Frec. relativa


03 32
3-6 0.30
6-9
9-12 8 005
12- 15 0.10

Halle el tamaño de Ia muestra y complete la tabla de distribución de frecuencias.

14. Los pesos de n artículos se ordenaron en una tabla de distribución de frecuencias de 7 intervalos
de igual ancho de clase, donde: mín : 50 g, máx : 120 g.

Además, ft : fz, fs: fs, fs t fa I fz :0.36, n1-l nz I n3 -r n4 -_- 560 y U. :64.

a) Determine el valor de n;

b) ¿Cuántos de estos artículos tendrán un peso mayor o igual a 60 g y menor a 110 g?

15. Halle el tarnaño de la muestra y reconstruya Ia siguiente tabla simétrica de distribución de


frecuencias.
Frec. relativa
Intervalo Frec. absoluta Frec. relativa
acumulada
10- t2 7
12- 0.24
0.52
5
18-20

16. La tabla muestra la distribución del ingreso familiar mensual de 80 familias.

Frec. absoluta
Intervalo Frec. absoluta Frec. relativa
acurnulada
640 - 680
680 - 720 48 60
720 - 760 0.r25
760 - 800 0.075
800 - 840

Determine el número de familias que tienen un ingreso menor a 800 dólares mensuales.

17. Dado el siguiente histograma de frecuencias relativas. ¿Cuántas observaciones hay en el rango
[c, /], si el total de la rnuestra es de 400? 2(
7.7. Ejercicios 1_9

Figura 1.7:

i8. En el siguiente gráfico se muestra el consumo de energÍa en una fábrica.

¿Qué porcentaje del consumo diario se utiliza desde las 19h hasta las 24h?

19 En la siguiente ojiva se representan los porcentajes de personas que componen un grupo de


personas) según su edad.

100

55
45
25
10
12 17

Figura 1.9:

Determine qué porcentaje de personas tienen edades comprendidas entre 10 y 15 años.

go
20. Dada la ojiva correspondiente a los gastos en servicios de los hogares de una ciudad.
20 Capítulo 7. Análisis Exploratorio de Datos

/D

Figura 1.10:

Reconstruya la tabla de distribución de frecuencias.

1.8. Medidas de localización

Cuando se dispone de un conjunto de observaciones, es de interés encontrat el valor en torno al cual


se agrupan la mayorÍa de ellas o el centro de las mismas. Las medidas descriptivas que permiten
especificar estos valores se denominan medidas de localización o md,idas de tendencia central.

Existe una amplia variedad de medidas de localización; nos concentraremos en las m¿ís empleadas: el
promedio, la mediana, la moda, la media geométrica y la media armónica.

1.8.1. La media muestral o promedio

Definición (de promedio o media aritmética) El promedio, notado como 7, de un conjunto


de n mediciones 21, r2t...,,rn es igual a la suma de sus valores dividido entre n; es decir,
n

rt*rz*.'.*rn Drn
i=l
&-
n

. Si las observaciones están agrupadas en una tabla de frecuencias de datos individuales como la
siguiente:
Observación Flec. absoluta
rI fLy
I2 n2

rk nk

donde n¿ es la frecuencia absoluta de la observación ,ri, el promedio se calcula por

k
Dnn'n
¿:t
&
sa
I: ---=-,
n
COn n: z_rn.
d:l
7,8. Medidas de localización 2L

. Si los datos se presentan en una tabla de frecuencias, agrupados por clases:


Clase LIC LSC Punto medio Frec. absoluta
1 l1 5t rl Tr1

2 I2 S2 r2 TL2

k t"¡ 9p ;r rLk

se calcula el punto medio cle cacla clase rromo iri :; l¿ I s¡' ' '
Q,:1,2,, .. , k) y el promedio es
k
I
i1
rr,¡ r¡ k

t con 7¿:l n¿.


n
i:7

Ventajas e inconvenientes del empleo del promedio:

1. Se expresa en Ias mismas unidades que la variable.


2. En su cálculo intervienen todos los valores de la distribución.
ual
ten 3. Es el centro de gravedad de toda la distribución, representando a todos Ios valores observados.

4. Es único.
;EI 5. Su principal inconveniente es que se ve afectado por la presencia de valores atípicos.

Ejemplos

1. Calcular el sueldo promedio de diez personas que ganan (en dóIares):


170 r72 168 165 173 t78 180 165 767 172.

Soluci,ón: Se dispone de n : 10 observaciones sin agrupar, entonces


11*rzl..'*rn
&-
n,
170 + 172 +168 + 165 + 173 + 178 + 180 + 165 + 767 + r72
10
: I7L.

2. Calcular la estatura promedio de 46 señoras, cuyas medidas se dan a continuación.


ro la
1 It 1 ta
Estatura 1.45 1.48 1.50 t,du 1,55 L,(, f 1.60 i.63 1.65
t
Flecuencia 2 4 5 B 72 7 4 t) 1

Solución: Como las mediciones están agrupados en una tabla de datos individuales, aplicamos
Ia fórmula que considera la frecuencia de cada una de ellas.
Téngase presente que el número de clases €s k : 9 y el tamaño de la muestra es n: 46.
I
I n'¡r¡
r:i:l
n,
2x I.45*4 x 1.48+... +3 x 1.63 * 1 x 1.65
46
r.545.

Los 46 señoras examinadas tienen una estatura promedio de 1.545 metros.


22 Capítulo 7, AnáIisis Exploratorío de Datos

3. En una cooperativa de ahorro y crédito se realizó Ia tabla de frecuencias de Ios montos de los
ahorros de sus socios (en dóIares), según se presenta en la tabla,

Desde Hasta Fbecuencia


0 100 72
100 200 28
200 30 46
300 400 77
400 500 186
500 600 224
600 700 209
700 800 r22
800 900 53
900 1000 19

Calcular el promedio de los ahorros de los socios de la cooperativa.


Soluci'ón: Los datos están agrupados en 10 clases. En primer lugar encontraremos el punto
medio de cada clase y los pondremos en la tabla:

Desde Hasta Punto medio (z¿) Flecuencia (n¿)


0 100 50 72
100 200 150 28
200 30 250 46
300 400 350 7r
400 500 450 186
500 600 550 224
600 700 650 209
700 800 760 722
800 900 850 53
900 1000 950 19

Ahora, empleamos Ia fórmula que considera la frecuencia de cada una.


10
Tenemos que k : 10 y D n¿:970. Por tanto,
i:1
10

D'¿*n
Á t--l
TL

12 x 50*28 x 150+.,. +53 x 950* 19 x 950


970
: 555.155.

El ahorro promedio de los cooperados es de b5b.16 dólares.

1.8.2. La mediana
La mediana fue por primera vez utilizada, como una medida de localización, por A. A. Cournot en
1843 y redescubierta por F. Galton en L882, año desde el cual su empleo se ha generalizado.

Definición (de mediana) La mediana de un conjunto de datos xr, z2: .. ., rn es el valor que se
encuentra en el punto medio, cuando se ordenan los valores de menor a mayor.
1.8. Medidas de localización 23

Se la nota como Q2 o Med y tiene la propiedad de que a cada lado del valor se encuentra el 50 % de
las observaciones.

Si disponemos de un conjunto de datos individuales, para el cáIculo de Ia mediana se procede de


Ia siguiente manera:

1. Se ordenan las n observaciones rt,12,. ..,rn de manera creciente.


2. Si el número de observaciones es impar, entonces n:2rnl1, La mediana es la observación
que se encuentra en eI lugar m * I. AsÍ, si disponemos de r¿ : 29 observaciones ordenadas
de manera creciente, m : 14 es decir, Ia mediana es la observación que se encuentra en el
lugar14*1:15.
3. Si el número de observaciones es par, entonces n:2m. La mediana es igual a la suma de
las observaciones que se encuentran en los lugares m y rn * 1, dividido para dos. Así, si el
número de observaciones es de n : 30, entonces rn: 15; Ia mediana es el promedio de Ias
observaciones que se encuentran en los lugares 15 y 16.

Si los datos están resumidos en una tabla de distribución de frecuencias de datos individuales.

1. Ordene las observaciones de manera creciente, con sus respectivas frecuencias acumuladas.
2. Calcule I2"v red.ondee al entero más cercano. Determine en Ia columna de Ia frecuencia
acumulada a qué dato pertenece, comparando el valor obtenido con el valor de la frecuencia
acumulada que es igual o inmediatamente superior; éste valor es la mediana.

Si los datos están resumidos en una tabla de distribución de frecuencias por clases, la mediana
se determina por interpolación, asÍ:

1. Establezca en qué intervalo está el valor mediano. Para ésto, se determina la primera
n
clase cuya frecuencia acumulad.a se
a mayor o igual a Dicho intervalo se denomina clase
5.
med'iana.
2. La mediana se calcula con la fórmula
n,
; - nl-r
Med,: L¡_t-r
donde: =-A,
,L¿-1 es el límite inferior de la clase mediana.
At-r es la frecuencia acumulada del intervalo inmediatamente anterior al intervalo de la
mediana.
n¿ esla frecuencia absoluta de la clase mediana.
A es Ia longitud de la clase de Ia mediana.
La interpretación gráfica del cálculo de la mediana se encuentra en la Figura 1.11.

Nótese que la mediana de un conjunto de datos no necesariamente pertenece a éste. La propiedad


fundamental de la mediana es dividir al conjunto de observaciones en la mitad.

Ventajas e inconvenientes del empleo de Ia mediana:

1. Es la medida m¿is representativa en el caso de variables que solo admitan la escala ordinal.

2. Es fácil de calcular.

.). En Ia mediana solo influyen los valores centrales y es insensible a la presencia de valores atÍpicos.

4. En su determinación no intervienen todos los valores de Ia variable.


24 Capítulo 7. AnáIisis Exploratorio de Datos

L¡¡ MC L¡
lal
Figura 1.11: Interpretación geométrica del cálculo de la mediana.

Ejemplos

1. Determinar la mediana de los siguientes datos:

5.5 6.9 7.0 3.0 4.8 4.t 3.2 4.3 5 5 6.5 4.3.

Soluci,ón: Se tienen n : IL observaciones, por Io que Tn : 5, entonces Ia mediana está en el


lugar 5*1. Ordenemos los datos

3.0 3.2 4.7 4.3 4.3 4.8 5.5 5.5 6.5 6.9 7.0.

La mediana es la observación que se encuentra en el sexto lugart Qz:4.8.


2. (Continuación.) Calcular Ia mediana de los sueldos de diez personas que ganan (en dólares):

t70 r72 168 165 L73 178 180 165 167 L72.

Solución: Se tiene n: 10 observaciones, que ordenadas dan


1,
165 165 767 168 r70 772 772 773 178 180.
I
Por lo tanto, la mediana es el promedio entre las observaciones quinta y sexta: fi
I
^ 770+172
er: *
i:171. ET

la
3. (Continuación.) Calcular la mediana de la estatura de 46 señoras, cuyas medidas son:

Estatura Fbecuencia FYecuencia


(r¿) absoluta (n¿) acurnulada (¡lr)
7.45 2 2
1.48 4 6
1.50 5 11
1.53 8 19
1.55 T2 31
r.57 nl 38
1.60 4 42
r)
1.63 J 45
1.65 1 46
7.8. Medidas de localización 21:

Soluci,ón: Las mediciones están agrupados en una tabla de datos individuales y el tamañ0,d,9,1,1i
muestra es n: 46. , . .iJ,ríiri,!
Calculamos 2 : ZZ y vemos en Ia columna de Ia frecuencia acumulada que hay los valoles 19 y
2
31, que cumplen que 19 < 23 < 31.
i"r;i'r;'irt:;'/
Así, Ia mediana es el valor cuya frecuencia acumulada es 31; es d,ecir, Q2: 1.55-.i "
4. Para la liquidación del impuesto a Ia renta, en una pequeña empresa, se calcularon lcs'ingbesoS
anuales (en dólares) de todos los empleados. La tabla de distribución de frecuencias es la
siguiente: ,i'¡_l-
Número de Fbecuencia
Ingreso anual
personas (n¿) acumulada (Nr)
,,,r.1 t,
2400 - 3000 3 3
3000 - 4200 20 23
,,r,; r ¡ix llri.il
4200 - 5400 35 58
5400 - 7250 25 83
7250 - 9000 15 98
9000 - 12000 2 100

Solución: Los datos están dados en una tabla de frecuencias por clases con r¿: 100.

i-nel Entonces, ?2:50; por tanto, la mediana se encuentra en el intervalo (a200;5¿00)';'de!t'nánera


que A: 5400 - 4200: 1200.
Ahora, tenemos que

* - *n-,
Med: L;I*TO
!{-es): : 4200 + tO:"rrg¡ :5L25.7. 'i rr,','i;trÍ :'.i r1i',¡'¡1,\q;?.
35
t;i ir1¡;({ l:
La mediana del ingreso anual de los empleados de la empresa oist25'.1¿lil*áJ]
'" -- 1--.\' lrii:Lli-'rr "i'j ..'ilrrrrrri
r

'rli;rl.lirll;l

1.8.3. La rnoda r"i I

Definición (de moda) L" moda de un conjunto de ddüob'es aquel valor que tiene la mayor
frecuencia absoluta.

Se la nota como Mo. Hay ocasiones en las cuales los datos pueden tener dos o más modas, o no puede
existir, cuando todos los datos tienen igual frecuencia. Para su determinación es útil construir una
tabla de frecuencias de los datos.

. Si los datos están resumidos en una tabla de distribución de frecuencias por clases, la m'6dr
"e
determina mediante la fórmula: ii ,,'t:) i, ri ) lfl;'{

I = :,(' i,¿ ;i,


Mo:L¿¡* dt,O' trz, O
t li) il);jii-),1fli ii lfrli/.

donde:
tr¿-1 es el límite inferior de la clase modal.
d1 es la diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.
d,2 es la diferencia entre la frecuencia de la clase modal y la frecuencia de Ia clase siguiente.

A es la longitud de la clase de la mediana. , r ¡;iri:,rt ¡;,I


Capítulo 7. AnáIisis Exploratorio de Datos

Aunque la icle¿r de <<valol rn¿1s fiecuente>> es mny trrrtigurr, no fue ernpleacla en estaciística, dc rn¿lnela
forrnal, hasta c¡re Ia po¡lrlirlizó K. Pe¿u'son en 1894.

Ventajas e inconvenientes del empleo de la moda:

1. Es fácil de calcular e interpletar.

2. Es la única medida de Iocalización que ptiede obtenerse en Ias variables de tipo cualitativo.

3. En su determinación no intervienen todos los valoles de la distribución.

Ejemplos

1. Supóngase que las notas de un examen de estadística fueron las siguientes:

9.4 8.1 9.0 5.6 7.0 9.0 6.5 9.0 3.8 7.0.

Soluc'ión: La moda de este conjunto es Mo:9.0, que es el valor que más veces se repite.

2. Calcular la moda de los siguientes datos:

Observación 2.7 4.5 6.0 8.7 9.2


Fbecuencia 5 6 .) 2 4

Solución: La mayor frecuencia es 6, correspondiente al valor 4, por lo tanto Mo:4.

3. Para la liquidación del impuesto a la renta, en una pequeña empresa, se calcularon los ingresos
anuales (en dólares) de todos los empleados. La tabla de distribución de frecuencias es la
siguiente:
Número de
Ingreso anual
personas (n¿)
2400 - 3000 3
3000 - 4200 20
4200 - 5400 35
5400 7250 25
7250 - 9000 15
9000 - 12 000 2

Solución: La clase modal es el tercer intervalo, ya que tiene la mayor frecuencia (hs : 35).
I
: 50; por tanto, la mediana estará el el intervalo
Entonces,,2I (4200; 5400), de manera que
dr :35 -20:15, d¿:35 - 25:10 y A:5400 - 4200:7200. l
:
Ahora, tenemos que

A[o : L¡.--t* ,O' ,O


d't -l d'z
: 4200+,,,15,.1200 : 4920. I
15+10
i,
La moda del ingreso anual de los empleados de la empresa es 4920 dólares. :-
7.8. Medidas de Iocalizaciót't 27

1.8.4. La media geornétrica

Definición (de media geométrica) La media geornét,rica, notaclzr corno .{lG, clc urr conjunto dc
n, meclicion€s r1, 12:.. ., nr es igrral a Ia taíz r¿-ésirna de su ltroclucto; es decir,

AIG: Vqxrrx-xrk.

Si las obselvaciones están agrupadas en una tabla de fi'ecuencias de datos individuales,

MG: {r:7, x...xr'tlt.


"";,
Si las observaciones están agrupadas en una tabla de frecuencias por clases, la expresión es la
misma, pero utilizando el punto medio de Ia clase z¿.

El empleo más frecuente de la media geométrica es el de promediar variables tales como porcentajes,
:asas, números Índices; es decir, en los casos en los que se supone que la variable presenta variaciones
acumulativas.

Ventajas e inconvenientes del ernpleo de la media geométrica:

1. En su cálculo intervienen todos los valores de Ia distribución.


2. Los valores extremos tienen menor influencia que en la media aritmética.

3. Es úrnica.

1. Su cálculo es más complicado que el de la media aritmética y solo se la puede calcular cuando
todos los valores son positivos.
50s
;la
Ejemplo. Calcular la media geométrica de la estatura de cinco personas que miden (en metros):

t.70 r.72 1.68 1.65 r.73.


Solución: n:5 observaciones; por tanto,
Se dispone de

MG : (r¡x12x-xrn
: otT
11.70 x I.72 x 1.68 x 1.65 x I.73: 1.696.

La media geométrica de las citadas estaturas es 1.696 m.

1.8.5. La rnedia armónica


que
Definición (de media armónica) La media armónica, notada como NI H, de un conjunto de n
mediciones rrt r2t . . . , rt. es el recíproco de la media aritmética de los recíprocos de esos n valores;
es decir,

Su empleo no es aconsejable en distribuciones de variables con valores pequeños. Se suele utilizar para
promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc.
28 Capítulo 7. AnáIisis Exploratorio de Datos

Ventajas e inconvenientes del empleo de la media armónica:

1. En su cálculo intervienen todos los valores de Ia distribución.


2. Su cálculo no tiene sentido cuando algún valor de la variable toma valor cero.

3. Es única.

Ejemplo. Calcular la media armónica de la estatura de cinco personas que miden (en metros):

1.70 t.72 1.68 1.65 r.73.

Solución: Se dispone de n:5 observaciones; por tanto,

11111 : 1.696.

L.70 I.72 1.68 1.65 r.73


-_r-r-_r-_L-
La media armónica de las citadas estaturas es 1.696 m.

1.8.6. Percentiles, cuartiles y quintiles


Antes de finalizar esta sección, es conveniente referirnos a varios términos que son de uso común
en la prríctica estadística: los cuartiles, Ios quintiles y los percentiles. Estas medidas estadísticas
corresponden a lo que se denomina medidas de posición no central.

A un conjunto de datos ordenado se lo puede dividir en un número fijo de partes iguales; cuando se lo
divide en cien partes se tienen los percentiles.

Definición (de percentiles) Los percentiles son cada uno de los 99 valores que dividen a la
distribución de los datos en 100 partes iguales.

A los percentiles se les nota como P¡. Con ellos se puede encontrar regiones donde se acumulan los
datos; así, el 30 % de los datos están por debajo del trigésimo percentil.

Para su cálculo se procede de Ia siguiente manera:

. Si los datos no estrín agrupados o están en una tabla de datos individuales, se efectúa la siguiente
descomposición:
nk
: j *r,
100
donde:
j es la parte enter u a" !.
100

r es la parte fraccionaria a. *.
100
Entonces, se tiene que
si r:
"+-,
rj+L, sir>0.
o;
7.8. Medídas de localización 29

Si los rl¿rtos i:sttirr rr¿Jrup¿rclos crr c:lascs, sc c:¡rlctila ruccli¿rnt<r

,tk, _
l{r.
"
I'A,:LA-ta 1oo ',1,
,

7Lk'

rlor rcler:

,L¿ 1 es cl lírrrite inferior del intervalo ñ (cuva fi'ecucrrcia ¿rcurnulada es la primera mayor o igr.ral
tt,A:
a _).
100'
lü-l cs la fi'ecuencia acumulada hasta .L¡-1.
n¡ es la frecuencia absohrta del intervalo h.
A es la longitud del intervalo h.

Ejemplos

1. Calcular los percentiles de orden 20 y 33 de la estatura de diez personas que miden (en cm):
165 165 167 168 170 L72 r72 r73 178 180.

Solu,c'ión: Tenemos eue n: 10.

. Par-a P2g, k :20


nk
: j *r
100
10x20 : 2+0
100
Entottces,r':0y j:2;
P¡,

Pzo

. Para P33, li; : 33


10 x33 :3+0.3.
n los 100
Entonces, r:0.3 y j:3.
P¡ : rj+t
PS¡ : r¿:168.
úente
2. (Continuación.) Calcular el percentil de orden 86 de los ingresos anuales de los empleados de
Lrna enlpresa.

Número de FYecuencia
Ingreso anual
personas (n¿) acumulada (¡/r)
2400 3000 3 ,)

3000 - 4200 20 23
4200 - 5400 35 58
5400 - 7250 25 83
7250 9000 15 9B
9000 - 12000 2 100

Soht,ción: Teuemos qlte ?¿ : 100.


30 Capítulo 1. Análisis Exploratorio de Datos

Parzr,l)66. k :86 y n,k: 100 x 86 : 86.


100
- 100
-
EI intcrrr¿rio h cloncle se cricu<rutrrr P5¡; cs (7250, 9000) y Lt-t:7250.
Tarnlriétt, sc tierre qr,tc ly'¡,-1 :83, r¿*.:15 y A:9000 -72;.¡0:1750
Con estos datos, obtenemos:

'k n,.
,I)A, . - 100 -
L¡-I
nk
D-
rSri 72t¡o +
tLUv |
uu - 83 trrn
15
: 7600.
--'l

Dos casos particulares, y muy utilizados, resultan cuando al conjunto de datos se Io clivide en cuatlo
o cinco partes iguales, que corresponden a los cuartiles y a los quintiles, respectivamente.

Definición (de cuartiles) Son valores que dividen a la distribución de los datos en 4 partes, cada
una de las cuales engloba eI25% de los mismos.

Los cuartiles son 3:

. El cuartil inferior (Qr), qre deja a su izquierda el 25% de los ctatos v se curnple eue Qr : P2ó.

. El cuartil medio (Qz), qre deja a sr.r izquierda el 50 % de Ios datos, coincide con la mediana y se
cttmple que Q2 : Pso.

. El cuartil superior (Q3), que deja a su izquierda el 75 % de los datos y se cumple eue Qe - Pzó.

AsÍ, para el cálculo de los cuartiles solo se deberá tener en cuenta que ellos son los percentiles de orden
25, 50 y 75, respectivamente (Figura 1.12).

500Á 500

mln Qt Qt Q¡ max

Figura 1.12: Disposición de los cuartiles en un conjunto de datos.

Definición (de quintiles) Los quintiles son valores que dividen a la distribución de Ios datos en
cinco grupos, cada uno de los cuales contiene el 20% de las observaciones.

Los quintiies son 4:

. El primer quintil (qr), q.t" deja a su izquierda el 20% de los datos y se cumple que qr - P2o.

¡ El segundo quintil (qz), qrr" deja a su izquierda el 40% de los datos y se cumple eue 9z - P4o.

. El tercer quintil (qs), qn" deja a su izquierda el 60% de los datos y se cumple que qB - Poo.
r El cuarto quintil (g¿), qr" deja a su izquierda el 80% de los datos y se cumple que q4 - P80.
7.8. Medidas de localización 31

Ejernplos

1. (Continuación.) Dctcrrniuar los cuartilcs infcliol y su¡rcliol cle las estaturas de 46 señoras,
cuyas ntedid¿rs son:

Estatura Fbecuencia Frecuencia


(r¡) absoluta (n¿) acumulada (¡i,)
r.45 2 2
1.48 4 b
1.50 5 11
1.53 E 19
1.55 72 31
L.57 7 3B
1.60 4 42
1.63 .)
,,1 l

1.65 1 46

Sohtción: Tenemos que n : 46.

. Para el cuartil inferior, Q1 : P25, por tanto, k:25 y


nk ,
Pz¡. i00
lr
46x25 :
)'se
11 + 0.5.
100

De manera que, r: 0.5 y


Pn.
p¡, : r j+t
rrden
PZs : rn: I.53.

. Para el cuartil superior, Q¿ : Pzs, k :75 y


nk
100
tlr
46x75
35 + 0.5.
100

Es decir, r: 0.5 y

P¡, * l-rt
Pzs : rsa : 1.57.

2 (Continuación.) Determinar Ios cuartiles inferior y superior de los ingresos anuales de los
empleados de una empresa.

Número de FYecuencia
Ingreso anual
personas (r¡) acumulada (Nr)
2400 - 3000 t) J
3000 4200 20 23
D'lu.
4200 - 5400 Jd
DT
58

P+0.
5400 - 7250 25 83
7250 - 9000 15 9B

'60. -
9000 12000 2 100

D-^
EU' Solu,ción: Tenemos que n : 100.
32 Capítulo 7. AnáIisis Exploratorio de Datos

109ri.25
. Cuartil inferior: Qt : Pz;, k::25 J, Y: : Z¡.
100 100
El irrtelr'¿rlo l¿ doncle se enc:uentra Q1 es @200;5a00) y Lt-t:4200.
Tambiérr, se tiene que N¡- t : 23,nt :
35 y A :54U0 - 4200 : 1200.
Entonces, lesrrlta que:
t'/t
- Ar,.-,
P¡, : Lt-tI loonk "'¿
t<_t?
Pzs : 4200 +'",;;'" 1200
Ji)
: 4268.6.

:75 tO?ñtt : tt.


Cuartil superior: Qs: Pzs, k t #:
El intervalo h donde Lxt:540A.
se encuentra P75 es (5a00; 7250) y
También, se tiene que N¡-1 : 58, n¡ :25 y A :7250 - 5400 : 1850.
Con estos datos, obtenemos:
nb
- e-t,
P¡ : Ln-t-t rá nk
: 75;58raso
Pzs b4oo+
25
: 6658.

1.9. Medidas de dispersión

Luego de determinar Ia localización de las observaciones, es conveniente medir su grado de clispcrsión


alrededor del centro. Las medidas que permiten especificar esta característica se denomínan n¿edidas
de dispersión.

Estas medidas deben tener la propiedad de que si los datos están ampliamente extendidos, la medida
será alta; y cuando los datos se encuentren muy agrupados, será baja.

Existen varias medidas de dispersión, nosotros vamos a analizar la desviación estándar, el rango y el
rango intercuartil.

1.9.1. La desviación estándar


llna vez que se ha calculado el promedio de las mediciones, un indicador de su variabilidad es la
desviación de cada medición particular corr respecto al promedio, r¿- r. Pero ésta da r.rna información
válida para cada medición y no para toda la muestra. Para tal efecto se emplea la desviación estándar,
medida de dispersión fue introducida por K. Pearson en 1894.

Definición (de desviación estándar o desviación típica) La desviación estándar, notada como
s, de nn corljunto de n mediciones 11, 12, ...¡ 2,, es la raíz cuadrada de la suma de los cuadrados
de Ias desviaciones de las mediciones, respecto al promedio z, di'l'idida entre n - 1; es clecir,

n-I D,@,
i:l
7.9. Medidas de dispersión 33

\ótese que la desviación estándal es siempre positiva y sus nnicladcs de medicla son las rnisnrrrs clrLt:
aquellas que corresponden a los datos originales.

Para su cálculo tambiéu se cnrplea la fórnrula equivalente

- n \r)'
n-I

De la misma manera que para Ia media aritmética se consideran los siguientes casos:

' Si las observaciones están agrupadas en una tabla de frecuencias de datos individuales:

Observación FYec. absoluta


Il TL1

r2 n2

x) te ;o
la desviación estándar se calcula por

k
DnnrT
i:I
- n(T)2 k
o s: con n:, ni.
n-7 i:r

ión ' Si los datos se presentan en una tabla de frecuencias, agrupados por clases:
úas
Clase LIC LSC Punto medio Flec. absoluta
1 ly Sl I1 TL1

ida 2 l2 S2 I2 n2

: : : :

rel k l¡" Sk rk nk

s se calcula por

k
Ln¿rí - nlI)'
O /-\ñ
k
¡la o 8: i:l
con n: \-nr.
ión -itn¿(r¡-r)2
i:7 n-I /-¿;-l

ilar,

Ventajas e inconvenientes del empleo de la desviación estándar:

l. Se expresa en Ias mismas unidades que los datos originales.

2. En su cálculo intervienen todos los valores de la distribución y por ello puede ser complicado.

3. Es única.

4. Se ve muy afectada por la presencia de valores atípicos.


34 Capítulo 7. Análisis Exploratorio de Datos

Ejemplos

1. (Continuación.) Calcular la clesviación estárrdar cle los srreldos cle diez l)crsonrrs que ganan
(en dólares):
r70 t72 168 165 173 178 180 165 167 t72.

Solu,ción: Previamente se habÍa calculado el promedio 7: L7I. Con ésto, resulta que:

*i@n-,¡'
(170 - t7L)2 + (I72 - I7r)2 +...+ (167 - tTL)2 + O72 - LTr)2
10-1
1.

Esos sueldos tienen una desviación estándar de 5.1 dólares.

2. (Continuación.) Calcular la desviación estándar de Ia estatura de 46 señoras, cuyas medidas


son:
Estatura t.45 1.48 1.50 1.53 1.55 L.57 1.60 1.63 1.65
Frecuencia 2 4 5 8 t2 7 4 3 1

Solu,c'ión: Anteriormente se determinó que :46, k - 9 y r:1.545.


71.

Para realizar el cálculo, obtengamos el valor a. f nor'n,


i:t
k

D"nr? :2(t.+s)2 + 4(t.458)'+'" + 3(1'63)2 + 1(1.65)2 : 109.9615


i:1
Entonces, se tiene que

Dn *?-n@)2 ffi
o:, , :.@:0.04627.
n-r
D-
n-l V ¿o-t
La estatura de las señoras analizadas tiene una desviación estándar de 4.6 cm.

3. (Continuación.) Calcular la desviación típica de los montos de ahorros de los socios de una
cooperativa de ahorro y crédito:

Desde Hasta Punto medio (r¡) FYecuencia (ni)


0 100 50 12
100 200 150 28
200 30 250 46
300 400 350 77
400 500 450 186
500 600 550 224
600 700 650 209
700 800 750 r22
800 900 850 53
900 1000 950 19

Solución: Antes se determinó que n : 970, k : 10 y V -- 555.155.


7.9. Medidas de dispersión 35

Calculemos lzr siguiente sumatona:

I,,r r,l : 12(rtQ2 + 28(150)2 +'. . + b3(850)2 + 19(950)2 : 330025000


'i-7

De manera que la desviaciórr típica es

k
D ro"? - "(")2
,i.:1

n-7
:V/33002ffiéro-i :riYü¡'

tlonjuntamente con la desviación estándar se suele definir la uarianza muestral de un conjunto de


ratos, notada s2, como Ia suma de los cuadrados de las desviaciones respecto a su promedio, dividido
:or el uno menos que el número de observaciones en el conjunto de datos y se calcula mediante

las "ln: {'o - 7)2


" ;\f ,;-1

r,9.2. EI rango y el rango intercuartil

Definición (de rango o recorrido) El rango de n mediciones es igual a la diferencia entre los
'.'alores mayor y menor de las mismas:

Rango : T..'áx

Ei rango se puede utilizar para hallar una aproximación de la desviación estándar mediante las si-
--rrientes relaciones :

R.anso
s = --É-) para n 176, para 16 q 7¿ ( 100,
1/n
R,anso
para100<n(400, para n > 400.
"=--,

Ventajas e inconvenientes del empleo del rango:

1. En su cálculo solo intervienen los dos valores extremos de Ia distribución y por ello se ve muy
afectado por Ia presencia de valores atípicos.

2. trs fácil de calcular.

Definición (de rango intercuartil) EI rango intercuartil, notado por RIQ, de un conjunto de
latos es igual a Ia diferencia entre ios cuartiles superior e inferior; es decir,

RIQ: Qs - Qt.

Las definiciones de los cuartiles superior e inferior y del rango intercuartil fueron dadas por F. Galton
en 1882.
36 Capítulo 7. AnáIisis Exploratorio de Datos

Ventajas e inconvenientes del empleo del rango intercuartil:

1. Es fh<:il cle calcul.¿rr'.

2. Se vc Poco afect¿rcio por la Plerselcia dc r,¿r.lores atípicos.

3. En su deterrninación no intclvierre l¿r tot¿iliclad cle los clatos.

Ejemplo. (Continuación.) Calcular' la desviación estárrd¿rl de l¿r cst¿rtur¿r clc 46 señoras, cllvas
meclidas sc reslrmen en la siguierrtc t¿tbl¿r:

Estatura r.45 r.48 r.50 1.53 1.55 1.57 1.60 r.o.) 1.65
Fbecuencia 2 4 Ir 8 12 7 4 3 1

Solución: Antes se dcterminó que Q1 :1.53 Y Qs:I.57. Además, zmí':7.45y r,'á*:1.65.


Entonces,

Rango Tmáx - fnrín : 1.65 - I.45 : 0.20.


RIQ Qs - Qt : 1.57 - 1'53 : 0.04.

Además, podemos calcular una aproximación de la desviación estándar de los datos:

Rango 0.20
sFr : 0.05.
4 4

Como se ver el valor aploximado cs bastante cercano al exacto, calcuiado con la fórmula respectiva.

1.9.3. El coeficiente de variación


Definición (de coeficiente de variación) El coeficiente de variación, notado y>ot CV, es ig-ual
a la desviación estándar- dividid¿r por la medi¿r, rrritmética; es riecir,
s
CT':1
T

Esta rnedicl¿r se utiliz¿r l)¿lra conlp¿r'¿rr las rnccliciones de tun¿r misrna magnitrici rc¿liz¿rri¿r cn distintas
unidades o por distintos individuos.

Si u.rr conjurrto de cl¿rtos es honrog(rneo, CV < 1; si Cf/ > 1.5. los dzrtos poclrían ser hctclogóncos.

Ventajas e inconvenientes dei empleo clel coeficiente de variación:

1. Es urr¿r medida ¿rdimensioual.

2. En sn cálculo interviencn toclas las obscrvaciones. pr-rclicnclo ser nluv iufluido pol valoles atípicos.

3. Puede ser difícil de interpretar.

4. Picrde su significtrdo si el prorredio es iguai a cero.


7.7A. Medidas de fornta Dta
JI

Ejernplo. (Continuaciórr.) C¿rlcrrl¿rr r:l c:oerficrierrtc clc r'¿rriaciórr clcrl srrclclo clc cliez pcrsorr¿rs clllc
-irr¿1rr (crL ckilzrrcs) :

170 rT2 168 165 r73 r78 180 165 167 r72.

: :,1 uc,i¡ir¿: Pleviarrx:rrtc s<t It¿rbía cirlculaclo clur: r: 177 1' ,s - 5.1. Con ésto, r'esulta que:

5'1 :0.02982.
CV:! T - 777

--omo
el valor de coeficiente es muy ba.jo, los datos son homogéneos.

1.10. Medidas de forma

-{asta ahora, heruos arralizado la localización y la dispersión cle una distribución, pero necesitamos
. r'locer más sobre el comportamiento de los datos. En esta sección, analizaremos las medidas de
-,)
- )inla'.

- as medidas de forma de ttna distlibución se clasifican en dos grllpos: medidas dc asinietr'ía y medidas
-- cttrtosis.

1.10.1. Asirnetrra

coet'íczente d,e a,s'intetría, dc nrra variable midc cl grado de asimetr'ía de la distribuciórr r,le sus datos
tolno ¿r sti meclia. Es aclirncnsional v se definc corno srg=Lre:

\-1.r, _ ,):t ln,


/_-' ' '
I
,i.:
As: t

,s3

--,--.
crtl,o,s cle nn¿L variable cstárr coltstituidas por los r.alores alejaclos de la medía (r,a.1oles cxtrcmos).
--:,a l'¿rriable es ¿l,sinií:tric¿r si srr
col¿ ;r nn 1¿rclo cs rnás larga que sr1 col¿r al otro y sinrétric¿r si amb¿rs
-es solr igual cle largas.

si As > 0. la clistribui:ión ser¿i asiurótiic¿r a l¿r clcrccli¿r. La cola a la clerech¿r es más lirrga que 1a
cola a la izquierrl:r.

. si As - 0la distlilncicin ser'á sirnéttic¿r. AnLbas colas son igual dc luugirs.

. si As < 0 la clistribrrciórt ser¿i ¿rsirnétlica a ltr izcluicrcla. La cola a lur izqnierd¿l es más lrrrgir que
la cola a I¿r clelech¿r.
rEn la definición cle las trreclicl¿rs rte ti¡rma no hal,'unidac.l cle criterios cntre los especi:rlista,s, por lo clrLc hay una amlrlia
r i cclacl
38 Capítulo 1. AnáIisis Exploratorio de Datos

L,lO.2. Apuntamiento o curtosis


EI coeficiente de apuntamiento o curtosis de una variable sirve para medir el grado de concentración
de los valores que toma en torno a su media. Se elige como referencia una variable con distribución
normal, de tal modo que para ella el coeficiente de apuntamiento es cero.

ir", - *)n l,
i:t ,
Ap: e4 -J.

Según su apuntamiento, una variable puede ser:

Leptocúrtica, si Ap ) 0; es decir, es más apuntada que Ia normal. Los valores que toma la
variable están muy concentrados en torno a su media y hay pocos valores extremos.

Mesocúrtica, si Ap:0; es decir, es tan apuntada como la normal.

Platicúrtica, si Ap ( 0; es decir, es menos apuntada que la normal. Hay muchos valores extremos,
Ias colas de la variable son muy pesadas.

Figura 1.13: Curtosis de curvas simétricas.

Ejemplo. (Continuación.) Calcular los coeficientes de simetría y apuntamiento de los sueldos de


diez personas que ganan (en dólares):

t70 172 168 165 r73 178 180 165 t67 172.

Solución: Previamente se había calculado que 7 : l7l y s : 5.1. Además,

i@n-e)'
i:7 (170 - 171)3 + 072 -171)3 + .
+ (167 - i71)3 + O72 - t7D3
10
55.8.

i{,n-n)n
i:l - LTDA + $72 - I7I)4 +. . . + (167 - LTD4 + G72 -
(170 I7D4
n 10
1191.
7.77. Otras representaciones gráfrcas 39

- ntOnCeS,

In
\-.
T).

\ r; - ( T\'' lr¡,
1J"
'i-I 55.8
)11
As: t
so (5.1)3
0.42r.

ir", - ,)n l,
i:t 1191
Ap: s4
-J-
t
(5.1)n -.)
-t.239.
Ia
-,cs datos son levemente asimétricos, con asimetría hacia la derecha; también, son platicúrticos,
;,,rsible presencia de valores atípicos.

x) 1.11. Otras representaciones grÍificas


-
os gráficos analizados anteriormente no requieren realizar cálculos de medidas estadÍsticas. Los
==áficos que a continuación se presentan, sí los emplean; por tanto, son más poderosos al realizar un
'-nálisis.

1.11.1. Diagrama de balanza


FI di,agrama de balanz¿ fue introducido en el año 2000, como una herramienta que muestra, en un
lismo gráfico, la forma de los datos, su valor central y su variabilidad al representar el promedio, el
:-ínimo, el máximo y Ia desviación estándar de los datos.

?ara su construcción se procede de la siguiente manera:


de
1. Se calcula el promedio, la desviación estándar, el mínimo y el mríximo del conjunto de datos que
se analiza.

) Sobre una recta se ubican los valores del promedio, el mínimo y el máximo. Los segmentos que
unen el promedio con el mÍnimo y con el máximo se denominan brazos de Ia balanza.

3 Sobre la misma recta se ubican dos puntos -uno a la izquierda y otro a Ia derecha de la media-,
a una distancia igual a la desviación estándar.

I Debajo del valor del promedio se dibuja un triángulo.

EI diagrama queda así:

x .x+.s

Figura 1.14:
40 Capítulo 7. AnáIisis Exploratorio de Datos

El rliagrarri¿r clc. brrl¿rnzir st: iritc:r'plet¿r clc 1a sigrricrrtc luirrrcr'¿r:

1 Si los cl¿tos solL sinrírtlic:os, r:l valor del plonreclio se sitú¿r r¡rr r:l <:c:rrtLo rlci grálico.

2 Si los d¿rtc¡s est¿ilr agrrrptrdos en torno ¿ri ccntlcl. los l¡r¿-Lzos rlr: l,r bal¿rnz¿ ser'¿ilr cortos; pr"u cl
contrzlricl, si ir"rs tlat,os estiirr dispclsos eu tor-rr<l ¿r.l coutlor lt-,s lrr'¿rzos clc l¿r bal¿rnza s<)r'¿'rir liilgos.

,) Si nno dc los rlos bl¿rzos clc 1¿r b¿rlarrz¿ es muchr¡ rl¿rs largo c¡rc r:l otlo, nos inclica (llre los (l¿1tos
sorl asirr)étricos y clue hay posible prcsencia cle r'¿rloles atípicos en l¿s obselv¿ciones.

Puede ser irtil combin¿rr' (solrre el mismo gr'áfico) con un cliagrzrma clc prrni;os pzrra visualiz¿rl Ia, Irillr(:lr'&
en que se distlibuycn ias observaciones.

Ejemplo. Realizal el diagrama de balanza de los siguientes datos:

5 5 5 5 1010202027 35
39 55 55 60 60 60 68 75 90 90

Soluci,ón,: Estos datos tieneu las siguientes carac;ter'ísticas:

rnírr:5, rnáx:90, r:39.7, s:29.3

Entonces,

:L
-S 39.729.3:10.4.
-
T *s 39.7+29,3:69.0.

El ciizrglirlr¿r <lc balarrz¿r ¡ie nuÉrstl¿t it crorrtirn.r¿rcirjn:

st0 28 3ü 4C 5S 60 1fi 80 gCI

Figura 1 .15;

Scgirrt sc obscrvit crr i'i giálico, el prornedio no se encuentra crr cl centro del ralgo. entonces sc dr:drrc<:
quc los cltrtcs sotr asirtrétricros. Arlcrriás, lcs br'¿rzr¡s cie i¿r b¿l¿rnza rro ticrierr ig'ral longitnri, lo <1rri.r ri<rrtot¿r
la posrble plcserrcia cle vakrrcs atípicos elr cl ex1 r'errro clcrecho.

1.11"2. Diagrarna de ca.ja

El rli,o,qt'ant,a" de c:o,.jo, fr-re irrtroduciclo r:n 1977, pol JoLrn \\I. Tuliey conLo lur¿l herranrierrtzr quc rrurcslr'tr,
er Lrn misuro gr:ific:o, l¿r foltna de los clatos, sn r'¿r,lol ccntlal y srr rrariabilicl¿rcI irl rcprr:sentar i¿r rne<li¿rrra.
los crr¿rtilc¡s) el r'¿1rlgo intercualtil y el rango c1e las observacicxrcs.

Para su constlucción se procede de la sigr.riente rn¿Inera:

l. Soble lrn¿ líne¿l holizontal se loc¿rliz¿rn l¿ mcdiana. Ios cuartiles inferior y supr:rior ¡'los clatos
nrínilro I'm¿ixirno.
7.77. Otras representaciones gráfrcas 4L

,l
Se constrrtye rtna ca..ja angosta qlre une a Qt y Qz; a continu¿rción, se clivicle estar caja cn clos
mecliatrte una línea qne pase por Qz.

t
.J. Finalrnente, se ttazan las uallas, que son dos rectas, una desde cada extremo de la ca.ja, hacia el
valor rnínimo y hacia el valor máximo de los datos.

:n la Figura 1.16 se mnestra un diagrama de caja.

I trt I
min Qt Qz Qr max

Figura 1.16: Diagrama de caja.

;--n diagrama de caja es especialmente útil para examinar la simetrÍa de los datos, la presencia de
-"-:lores atípicos y para comparar dos conjuntos de muchos datos.

Ejemplos

1. (Continuación.) Trazar el diagrama de caja correspondiente a los datos de la estatura de 46


señoras, cuyas medidas son:

Estatura r.45 1.48 1.50 1.53 1.55 L.57 1.60 1.63 1.65
Flecuencia 2 4 5 8 12 7 4 3 1

Solución: Antes se determinó que Qr : 1.53, Qz : L.55, Qs : t.57, rrnín: I.45 y z¡16* : 1.65.

El diagrama de caja es el siguiente:

. -lttc:cr
, lr rt¿i

I I

t.4s 1.55 r.60 1.65

: .tliI) Figura 1.17:


.l(lIJ¿Ir

Como se observa, los datos son bastante simétricos, con una fuerte concentración en torno al
centro y -puesto que las vallas son largas- con la posible presencia de valores atípicos (el mínimo
y el máximo).
clirlos
Se recogieron los datos de los ingresos mensuales de 200 hombres y 250 mujeres, que realizan
42 Capítulo 7. Análisis Exploratorio de Datos

tlab:r.jos rro c:¿llificaclos, olrtcniéudosc ltr sigtticttto tabl¿:

Ingreso flombres Mujeres


180 10
190 5 55
200 20 75
270 ')ri)
.f 25
AN
220 40
230 75 45
240 20

Comparar los ingresos de los dos grupos mediante sus diagramas de caja.
Solución: Se tiene la siguiente tabla que resume las medidas descriptivas reqtteridas:

mIn Qt Qz Qs max
Flombres i90 270 220 230 240
Mujeres 180 190 200 220 230

Con todos estos elementos, los diagramas de caja son

240

230

22O
o
ut
fl
s zro
tr
200

190

'180

Sexo

Figura 1.18:

En el diagrama correspondiente a las mujeres, observamos que la mediana no se encuentra en Ia


mitad de la caja, denotando una asimetrÍa, con fuerte concentración hacia valores bajos. Como
Ias vallas son cortas, podemos inferir que no hay presencia de valores atípicos.
En el diagrama que corresponde a los hombres, se observa que Ia mediana está en Ia mitad de la
caja, indicando que Ios datos son simétricos. Como la valla inferior es más larga qr-re la superior,
rros indica que rlrl valor de 190 es atípico para los hombres.
De acuerdo a las posiciones de los diagramas, se observa que) en general, las mujeres tienen
ingresos menores. Tarnbién, se aprecia que los ingresos de los hombres están más concentrados
alrededor de la rnediana qne los de las mujeles, denotando que aquellos son más homogéneos.

L.1-2. Ejercicios
i. Una persona está rnanejando un carro en una autopista a 70 km/h y nota que el número de autos
a los que pasa es igual al número de autos que a ella le pasan. Los 70 km/h son el promedio, la
mediana o la moda de las velocidades de los autos en la carretera. ¿Por qué?
7.72. Ejercícios 43

2. Dadas r¿ : 8 nrccliciones: 4, 2, 6. 5, 7, 5, 4, 6.

Deterrnine: rr) f; lr) l¿r niecliarr¿r; c) ,s; cl) el lango; e) la asimetría; f) Ia cr-rrtosis.
3 Dadas n : I mediciones: 5, 8, 8, 4, 4, 9, 7, 5, 4.

Deterrnine: a) 7, b) la mediana; c) s; d) el rango; e) el RIQ; f) la asimetría; f) curtosis.

1. En 1904, Cushny y Peebles publicaron en el artículo <The action of optimal isomers>> (Journal
of Physiologg), un estudio sobre el efecto de dos isómeros de Ia molécula hidrocinamida hidro
bromida en prodrtcir sueño. Se presentó la variación en el núrmero de horas de sueño por noche
al usar las dos versiones de Ia droga:

Paciente Dextro Levo


1 +0.7 +1.9
2 -1.6 +0.8
.) -0.2 +1.1
4 -L2 +0.1
5 -0.1 -0.1
6 +3.4 +4.4
7 +3.7 +5.5
8 +0.8 +1.6
I +0.0 +4.6
10 +2.0 +3.4

a) Realice un diagrama de puntos para cada uno de los dos tipos de drogas y comparárelos.
¿Cuál de los dos isómeros es más efectivo en producir aumento en las horas de sueño?
b) Realice un diagrama de tallo y hojas con los datos.
c) Calcule el promedio, la mediana y la desviación estándar de los datos de las dos drogas.
¿Cuál es más efectiva? Explique.

¿. Un inversor tiene ahorros repartidos en 3 depósitos con 2000, 5000 y 10000 dólares, respectiva-
mente. Si el primero le rinde un 5To anual, el segundo un 4To anual y el tercero un 2To anual.
¿Cuál es el tipo de interés que recibe?
tenla
En una empresa se registró la edad (en años completos) de sus empleados, resultando la siguiente
Como
tabla:
31 49 36 39 56 29 57 4t 40 51
Idela 45 61 40 39 47 27 36 37 16 37
)ertor, 51 18 29 42 38 62
34 31 28 25
36 40 46 37 49 25 2r 39 35 37
trenen 56 35 48 44 42 43 49 22 25 28
trados
teos.
a) Determine el número de clases que se debe utilizar en la distribución de frecuencias;
b) Construya la tabla de frecuencias y el histograma;
c) ¿Qué porcentaje de los empleados es menor que 50?;

: autos
d) ¿Qué porcentaje de los empleados es mayor que 35.5?
dio, la
7. En una bodega de venta de licores se registró las principales. características de 25 marcas de
44 Capítulo 7. AnáIisis Exploratorio de Datos

rn'hiskys:
No. de Precio Proporción Tiempo de Nota de
Categoría
whisky de venta de malta añejarniento calidad
.,
I 70 20 1 5 J

2 60 20 1 5 2
, 65 20 1 7.5 2
4 74 25 I I2 2
5 70 25 I t2 3
6 ,J 30 1 5 0
7 70 30 1 8 0
8 55 30 I 5 2
9 93 J,l 2 6.5 I
tt
Jd 2 8 3
10 62
tt
JJ 2 8.5 3
11 87
T2 78 35 2 8.5 2
13 83 40 2 8 4
t4 90 40 2 5.5 2
15 110 40 2 T2 1

16 113 40 2 8.5 1

t7 96 40 , T2 dt
18 82 45 2 12
,
d

19 r27 45 2 8.5 4
20 160 100 3 L2 3
2I 90 100 3 12 4
22 86 100 3 12 2
23 100 100 3 10 3
q
24 100 i00 3 11 d

25 95 100 3 T2 0

a) Identifique el tipo de dato que representa a cada una de las variables;


b) Realice un diagrama de talloy hojas para el precio de venta y ei tiempo de añejamiento;
c) Calcule el promedio, la moda y la mediana del precio, la proporción de malta y el tiempo
de añejamiento;
d) Encuentre la desviación estándar, el RIQ V el coeficiente de variación del precio, la propor-
ción de malta y el tiempo de añejamiento;
e) Calcule los coeficientes de asimetría y de apuntamiento del precio, la proporción de malta
y el tiempo de añejamiento;
f) Realice un gráfico de barras de Ia categoría y de la nota de calidad.

8. Calcule el promedio, la mediana y la moda de las edades de 25 personas:


32 33 34 31 32 31 34 32 34 32 31 34 31
31 32 32 34 34 32 33 34 33 33 34 31
9. Dados los datos y sus frecuencias:

Halle: a) e; b) Mo; c) s; d) el rango.


10. Dados los datos v sus frecuencias:

Halle: a) Qz; b) 7; c) s; d) RIQ.


7.72. Ejercicios 45

il. Sc rcirlizti rttta irrr'<rstigaciírn sobtc cl prccic'r rlc zapzrlos <lcportivos. clcr sirnilarets <:¿rr¿rctetrístic¿rs
crr rlivrtlsos ¿tllutr:ctttts clc l¿r trirrrl¿rcl, ob1<:nií:rrr[os<t los sigrricnt<:s cL¿ttos (cl<ilarcs):

50 4:l 39 43 40 38
,)-
r),J oi
,¡l
.)-
r) I
.)o
r)i
49 43 39 44 40 38 33 26 36 30
49 43 39 44 4U 38 33 27 36 30
+t 41 39 45 40 37
.).)
,),)
,)a
,l ') E
,)r)
J)^
.)t,

46 47 38 46 40 37 32 28 35 28

a) Determine la dislribución de frecuencias inclivicluales de los datos;


b) Elabore la distribución de frecueuci¿rs con datos agnrpaclos l)or clases;
c) A partir de la distribución obtenida, trace el histograma.

-2. A continuación se dan los resultados de la estatrrra de 100 estudiantes:

Esratura (en cm) | 155 160 165 170 \75 180 185
No. de eslrrdiantes I 10 14 26 28128
Halle:

a) Ia estatura promedio y Ia desviación estándar;


b) la media armónica y la media geométrica;
c) Ia mediana y eI RIQ.

A partir de la siguiente distribuciórr de liecuencias,

o;

lpo

ror- Encuentre:

rlta a) los cuartiles inferior y superior y la mediana;


b) Ia media armónica;
c) la media geométrica.

-=. La siguiente tabla muestra la temperatura nocturna (en "C) clr.rrantc 200 días:

Intervalo Flecuencia Intervalo Frecrrencia


qA
21 12-14 I4
4-- b 16 74 16 20
6-B 15 16 18 22
8-10 26 18 20 1E
l0 12 OD
L¿ 20 22 :,-)

a) Deterrrile: cl plomedio, Ia mecliana y los cuartiles inferior y superior;


b) Constmya el cliagrama de ca.ja de los datos.

Los siguientes datos se obtuvieron de una encuesta sobre las condiciones de vida, en el área nrral
dc los cantones dc Zapotillo y N{zrcará y corresponden al núrrnero de hornbres y de rnujeres que
Capítulo 7. AnáIisis Exploratorio de Datos

intcgran las f¿rmilias encuestadas.

Hombres \4ujeres Hornbres X4ujercs Hombres X4ujercs Homblr:s \tlujercs


4 2 2 2 7 4
c .) t
5 4
1 .) t) .) 2 2
2 , 2 4 4 4
1 4 4 6 5 4
4 4 b 7 2 4
I 7 4 2 5 2
t
2 .) 2 d 4 J
8 3 5 4 4 1

a) Realice un diagrama de puntos de los datos, clasificados por sexo;

b) Realice la tabla de frecuencias y el histograma de los datos, según el sexo de los encuestados;

c) Construya el diagrama de caja de los datos;

d) Interprete y compare los resultados obtenidos en a), b) y c);

e) Determine el número total de miembros en cada familia. Con estos nuevos datos trace eI
diagrama de puntos, el diagrama de tallo y hojas, la tabla de frecuencias, el histograma y
el diagrama de caja. Interprete lo obtenido.

16. Las siguientes temperaturas fueron tomadas al medio día en Quito (en 'C) durante una semana:

22, 24, 2r, 24, 20, 22, 19.

a) Calcule el promedio y la desviación estándar de dichas temperaturas;


b) Para transformar los grados Celsius (c) en grados Fahrenheit (/) ." usa la ecuación / :
1.Bc * 32. Determine el promedio y Ia desviación estándar de las temperaturas en grados
Fahrenheit;
c) Encuentre alguna relación entre los promedios y las varianzas calculados en a) V b).

17. En una investigación sobre la razón por Ia que frecuentemente habÍan colas muy largas en las
cajas de un banco, se obtuvo información del tiempo (en minutos) requerido para atender a los
clientes. Se tomaron 50 mediciones en una caja, las cuales se dan a continuación:

6.0 5.9 4.0 3.1 1.9 5.3 2.7 5.2 2.9 5.2
4.8 4.8 5.1 6.0 4.2 4.4 5.3 7.4 4.4 4.1
5.2 2.8 4.7 1.8 5.1 5.8 2.9 5.7 3.8 5.8
3.6 4.4 2.0 2.8 4.8 3.1 1.5 5.9 3.6 4.6
3.7 4.5 3.9 2.3 5.5 5.3 5.8 2.4 5.5 3.7

a) Calcule la desviación estándar y su aproximación a partir del rango;


b) Determine (,' * s), (r I2s) y (e + 3s);
c) Determine el número de observaciones que se encuentran en cada uno de los intervalos;
d) Construya el diagrama de caja de los datos y compare con los resultados de la parte b).
¿Qué observa?
7.72. Ejercicios 47

18. La siguientc tabla muestra los tiempos de duración (en minutos) de las versiones en DVD de 22
películas dirigidas por Alfred Hitchcock:

Película Tiempo Película Tiempo


The Birds 119 Dial M fbr Murder 105
Family Plot 120 Foreign Correspondent 120
Frenzy 116 I Confess f08
The Man Who Knew Too Much 120 X4arnie 130
North by Northwest 136 Notorious 103
The Paradise Cane 116 Psycho 108
RearWindow 113 Rebecca 132
Rope 81 Shadow of a Doubt 108
Spellbound 111 Strangers on a Train 101
To Catch a Thief 103 Topaz 126
Under Capricorn Il7 Vertiso 128

ios;
a) Construya un diagrama de tallo y hojas de los datos;
b) Calcule la mediana de los tiempos;
c) Calcule los cuartiles inferior y superior. Use esta información para detectar algún valor
:e el y
atípico para trazar el diagrama de caja;
ray
d) Determine el promedio y la desviación estándar;
e) Represente los datos mediante un diagrama de balanza. ¿Cuáles datos influyen más en los
valores calculados?
f) Calcule los coeficientes de asimetría y de apuntamiento.

19. Las notas de un examen de 6 alumnos son: 6, 5, 9, 19, 3 y 18. Un alumno aprueba si su nota es
mayor o igual que el promedio y que Ia mediana de las notas. ¿Qué porcentaje de los alumnos
aprobaron el examen?
+-
J-
ados 10. Un automóvil ha recorrido los 832 km que separan Loja de Esmeraldas, permutando regularmente
las 5 llantas (incluida la de emergencia) para que todas tengan igual desgaste. ¿Cuál es el
recorrido promedio de cada llanta?

11. El kilometraje que marca un auto, luego de 4 años de uso, es 100 mil kilómetros. Si el dueño
r las lo compró nuevo y lo hace descansar 1 dÍa, luego de usarlo 4 días seguidos, ¿cuál es el recorrido
a los promedio diario de los días manejados, considerando años de 365 días?

')2. De 400 alumnos de un colegio, cuya estatura promedio es 165 cm, 150 son mujeres y su estatura
promedio es 160 cm. ¿Cuál es la estatura promedio de los varones?

13 Se tiene cuatro números. AI añadir el promedio de tres de ellos al número restante, se obtienen
los números 17, 2I, 23 y 29. Si se excluye al mayor de estos números) ¿cuál es el promedio de
los tres restantes?

)/ El promedio de 53 números es 600. Si se eliminan 3 números consecutivos, se observa que el


nuevo promedio aumenta en 5To. ¿Cuál es el mayor de dichos números consecutivos?

25. Calcule la mediana de las siguientes temperaturas:


6:

e b). Temp. ("C) 20.5 20.0 19.5 19.0 18.5 18.0 t7.5
No. días 2 4 3 13 3 4 2
48 Capítulo 7. Ar¡álisis Exploratorio de Datos

26 Calculi: I¿r mecliatr¿r v I¿r urocla <lc krs sigrri<lrtcs clatcls

Iutclr¡¿rlo I'r'ccucucia
10 - 2i) 3
.)
20 -30 'J
30 - 4i) 12
40 50 B
50 60 5

27. Los sueldos en una emprcsa son las siguierrtes:

1 gelente: 10 000
1 secretaria: 650
3 empleados: 500 (cada uno)
2 ayudantes: 400 (cada uno)
1 conserjc: 300

¿Cuál es la medida de localización más representativa?

28 En una reunión hay 50 varones con una edad media de 20.5 años y 25 mu.jeres, las que en
promedio ,or, ] miís jóvenes qne los \¡arones. Halle el núrmero entero más próximo a la edacl
'10
media de las personas de dicha leunión.

29. Un ftrmador dice que su vicio empezó con un cigarrillo en la primera sernana, 2 en la segunda,
4 en la tercera, 8 en la cuarta, y así sucesivamente; hasta fumar casi 2 ca.jetillas diarias de 20
cigarrillos cada una, en promedio.

a) ¿,A cuántas semanas de habcl empezado ocnrrió ésto?;


b) ¿Cuántos cigarr-illos diarios, cn prornedio, fumó hasta la primera ser)ana que llegó al nláximcr
de su consumo?

30. Si cada uno de los 28 millones de habitantes de cierto país come) el promedio, 12 kg de pescadcr
al año, entre conservas enlatadas y pescado fresco, siendo este rubro 4 veces el de conserva.
¿Cuántas toneladas de pescado fresco se consumen? en promedio, por año?

31. En una muestra de 20 empresas florÍcolas se obtuvieron los siguientes datos sobre el núrnero de
empleados y sus ingresos anuales, en miles de dólares:

No. dc Ingresos anlrales


empleaclos 50 - 100 100 - 250 250 - 1000
10 30 6 2 0
30 s0 i 1 0
50 - 100 0 0 10

Calcule:

a) el ingreso medio anual de las ernprcsrrs;


b) el número de empleados promedio.

32. De los datos de rrna tabla de distribución de frecuencias, con 5 intervalos de clase ;r ancho de
clase cornítn, se observó que: Qz:24, x:¡ : l$, 13 :24, nB : 2'n,r, n5 : )71r. ¿.Qué porcerrtaje
del total sor nrenores de 30?
7.72. Ejercicios 49

cuánto es igual la suma de cifras dc la media aritmética de la siguiente serie de números'/

r¿ cifr¿rs n cifr¿rs r¿ <rifi¿ls r¿ cifr¿rs

34. La siguiente tabla muestra la distribución de sueldos de 210 trabajadores de una empresa.
Sueldo Trabajadores
600 700 100
700 800 20
800 - 900 60
900 1000 20
1000 1100 10

a) Halle Ia moda de los sueldos;


b) Debido al aumento de Ia productividad, los sueldos sufrieron un incremento del 70%o y,
adicionalmente, un aumento de 50 dólares. Halle el nuevo sueldo promedio.

35. En una muestra de 1000 trabaiadores, se registró sus sueldos en una tabla de frecuencias:
Sueldo Trabajadores
ue en 0 400 150

, edad
400 - 800 300
800 - 1200 200
1200 - 1600 250

¡rnda,
1600 2000 100
de 20
a) Calcule la moda de los datos;
b) ¿Qué porcentaje de los trabajadores tiene sueldos comprendidos entre el promedio y la
mediana?

irimo 36 En la siguiente ojiva se muestran los sueldos de Ios traba.jadores de un organismo estatal.

scado
lser\¡4.

rero de

Figura 1.19:

Halle la diferencia entre el promedio y Ia mediana.

37 En Ia sección de pediatría de un hospital, Ios niños atendidos se clasifi.caron según su edad,


obteniendo la siguiente tabla:
Frec. absoluta Frec. relativa
Edad Frec. absoluta Frec. relativa
acumulada acumulada
03 0.2
rcho de 3-6 20
centaje 6-9 0.85
9-12 80
50 CapÍtulo 7. Análisis Exploratorio de Datos

Calcrrle el pronrr:clio, la rnecliarr¿r v la clesvi¿rciól estánclar cle la cclacl de los niuos ¿rtcndirlos.

38 Err la sigr.rierite tabla se rnuestr'¿r i¿r clistlilncióu ck: frecnencias clc l¿rs vcntas rc¿rlizad¿ls pol' lc¡s

60 locales de uu ccntro comelcial popr-tlal de Ia ciudad cle Quitrt.

Punto Frec. absoluta


Frec. relativa
medio (r¿)

Si Ios intervalos tienen igual longitud, halle el promedio, la mediana y la desviación estándar de
Ias ventas.

39 En Ia siguiente tabla se muestra la distribución de frecuencias de los pesos de 100 personas:

Peso Frec. relativa


Frec. absoluta Frec. relativa
(t e) acumulada
0-24 0.18
24-48 26
48-72 0.78
72-96

Calcule la mediana del peso de estos individuos.

40 La siguiente tabla incompleta muestra Ia distribución de frecuencias de los dcpósitos bancarios


realizados por 50 clientes, siendo el ancho de clase es constante e igual a 200.

Punto Frec. absoluta Frec. absoluta Frec. relativa


Intervalo
medio (r¿) ("0) acumulada (l/r) (f)
9
0.22
I 100 t2

7
0.06

Luego de completar la tabla, calcule:

a) ¿cuántos clientes realizaron depósitos menores a 1000 dólares?;


b) ¿qué porcentaje de clientes realizaron depósitos entre 1200 5' 1600 dólares?;
c) el promedio, la mediana y la moda de los depósitos.
Capítulo 2

El Concepto de Probab¡l¡dad

Las preguntas más importantes de Ia uida son, para la


tnaAor parte, realmente solo problemas de probabili,dad
Pierre Simon Laplace

-r la naturalezay en la vida cotidiana se presentan fenómenos cuyo resultado se determina antici-


-.damente mediante la aplicación de ciertas leyes o fórmulas; por ejemplo, los resultados de mediciones
:-rmétricas, los cálculos financieros o ciertos procesos físicos.

-enrbién existen fenómenos cuyo resultado no puede ser anticipado con cetteza, sino que existe una
:tbabi,Iidad de que un cierto resultado se dé; por ejemplo, la ganancia que obtendrá un inversionista
-=-pués de dos años, el tiempo que sobrevivirá un cónyuge a la muerte de su pareja o el número de
;-ros eu€ pasan por una esquina durante una hora determinada. Es evidente que nadie puede dar
-, resultado certero con anticipación a los tres euentos considerados, entonces si se da una respuesta,
-:'iste una incertidumbre en el resultado.

?ara dar una explicación matemática a aquellos resultados que aparecen en experiencias en que está
-r'olucrado el azar, se desarrolló la teoría de probabilidades.

2.L. Reseña histórica


-
a presencia del hueso de astrágalo de oveja, que constituye el antecedente inmediato del dado, en las
=-<cavaciones arqueológicas más antiguas, parece confirmar que los juegos de azar tienen una antigüedad
-: más de 40mil años. En Ia India, en el Rig-Veda (aproximadamente 1000 años a.C.), se menciona un
;:ego de dados como un intento de medir la probabilidad. En Grecia, Sófocles atribuye a Palámedes
-= invención del juego de dados, durante el sitio de Tloya. Así, en casi todas las culturas antiguas
= posible encontrar referencias que nos indican que el estudio de los fenómenos aleatorios (dados,
-Jresencia de lluvia, el clima, etc.) fue muy importante.

=n el Renacimiento se produjo un abandono progresivo de explicaciones teológicas, lo que condujo a


';¡a reconsideración de los experimentos de resultado incierto, y los matemáticos italianos del siglo
\VI empezaron a interpretar los resultados de experimentos aleatorios simples. Por ejemplo, Cardano,
:n 1526, estableció, por condiciones de simetría, la equiprobabilidad de aparición de las caras de un
jado. Por su parte, Galileo (1564 - 7642), respondiendo a un jugador que le preguntó por qué es
n¿ís difícil obtener 9 tirando tres dados que obtener 10, razonó que de las 216 combinaciones posibles

51
52 Capítulo 2. El Concepto de Probabilidad

ccluiplobables, 25 coticltrcett a 9 y 27 a 10. Galileo publicó estos rcsult¿rcios en un tlat¿rclo liarnaclo


C o n,si, d, eraz'i, o ne. s o'p'ra,'il q i,r t, oco d,e,t, d,o,rli.

El desarrolio clel an¿ilisis rnatenrático los juegos dc azal se produjo dur¿rnte los siglos XVI y XVII.
c,le
Algunos autores consideran como origen del cálculo de probabilidades la lesolución del prolrlema de los
puntos en la correspondencia entre Pascal y Fermat en 1654. El problema planteado a estos autores
por Chevalier de Meré, fue cónro debería repartirse el dinero cle las apuestas, depositado en la mesa,
si los jugadores se ven obligados a finalizar la partida sin que existiera un ganador. Aunque ningur<-r
de estos dos matemáticos publicó al respecto, sí lo hizo Huygens en su tratado Ratioci,n'iis 'in In,do alae
(Razonamientos relativos al juego de dados). Su escrito tiene Ia trascendencia de ser el primer liblo
de probabilidades de la historia.

Durante el siglo XVIII, el cálculo de probabilidades se extendió a problemas físicos y de seguros


marítimos. El factor principal de su desarrollo fue el conjunto de problemas de astronomía y de
física que surgieron ligados a la constatación empírica de la teoría de Newton. Un primer problerna
fue el tratamiento de los errores de medición: se disponía de varias medidas independientes de una
determinada magnitud física y se presentaba el interrogante de cómo combinarlas para obtener un
resultado más preciso. Daniel Bernoulli (1700 - 1782) proporcionó la primera solución al problema de
calcular una cantidad desconocida a partir de un conjunto de mediciones de su valor que) por el error
experimental, presentan variabilidad.

Pierre Simón Laplace (I749 - 7827), introdujo la primera definición explícita de probabilidad y desar-
rolló la ley normal como modelo para describir la variabilidad de los errores de medida. En esta época
también hubo importantes contribucfones de matemáticos como Legendre (1752 - 1833) y Gauss (1777
- 1855) para tratar de realizar predicciones del comportamiento de ciertos fenómenos.
Durante el siglo XIX, los matemáticos y astrónomos continuaron ampliando la teorÍa, de manera que
a mediados de este siglo ya existían Ias herramientas que permitieron su consolidación como una rama,
científica. A pesar de ello, la aplicación de estos principios se restringÍa a Ia Física y la Astronomía.

Una descripción axiomática de la idea de probabilidad fue dada en 1933, por A. N. Kolmogorov. Ello
constituyó la base de la moderna teoría, tal como hoy la conocemos. Con ésto, se consiguió elaborar
modelos complejos y aplicar las probabilidades a muchas ciencias y campos de Ia vida.

En las últimas décadas, el empleo de la teoría de probabilidades en las modernas ciencias naturales,
en las ciencias sociales y en ramas de aplicación, como la ingeniería, el cálculo actuarial o la economía
ha crecido enormemente y su conocimiento es una necesidad imprescindible.

Antes de iniciar el estudio de la probabilidad, revisemos los principales conceptos del análisis combi- E
natorio.
_I--

: .

2.2. Fundamentos de análisis combinatorio

Primero, definamos eI factori,al de un número entero positivo z¿ como el producto

n!:nx(n-1) x x2xl. con0!:1

Ahora, consideremos un conjunto finito compuesto por n elementos diferentes: {a1,a2,...,a,-}. Se


desea formar una colección constituida por k elementos (k I El número de estos subconjuntos
").
depende de si los conjuntos son ordenados o no. Las colecciones ordenadas se llaman uariaciones y
las no ordenadas combinaci,ones.
2.2. Fundantentos de análisis contbinatorio 53

Definición (de variación) Se clenornin¿r variaci(rrr a c¿r.cla nrro cle los irrrcgJ,os orclcrr¿rrlos clc /'
lenreutos, tornaclos cle otlo cle n r:lernentos (k ( n). cle rnanel'¿l cluc estos arrcrglos rlificrcrL cn algúur
.-enientr.i o en el orden de colocación.

r- rrúrrnero cle r'¿rri¿rciones de A; elementos qne pueden obtenelsc a partir: de rin coujlurto rl<r it, clcrrtcutos,
--.lotado por Vf,, es igual a
Wn:-
,nl
'n (n-A:)!

Definición (de combinación) Se denomina combinación a cada uno de los subcorr.juntos de k


.-ementos, tomados de otro de n elernentos (A: ( n), sin tener eu cttenta el ordcn de los rnismos, de
--.anera que no pueden haber dos combinaciones con los mismos elernentos.

:- número de combinaciones de k elementos que pueden obtenerse a partir de un conjunto de n


.-:mentos, denotado por Cf., es igual a

nl.
kt(n - k)t'

{ Cf se le denomin a coef.ciente bi,nomi,al.

E.jemplo. Encontrar el núrmero de variaciones y de combinaciones de dos elementos que se pueden


-.'tener a partir del conjunto {a,b,c}.

-:'lución: Se tiene n : 3 y lr : 2.

V! : .--
3! : 6 :
a) Se pueden formar
(3-2)! ;1 6 variaciones, qlle soII:

(a, b), (b, a), (a,r), (c,a), (b,c), (c,b).

'o) Se pueden formar 3! :


^2
"3 - 2(3 - 2)! ^-L
2.r 3 combinaciones:

{o,b}, {o,"}, {b,r}.

Definición (de permutación) Una permutación de n elementos es cada una de las variaciones
r: los n elementos distintos.

=- número de permutaciones de n elementos es igual a

Pn: n!'

Ejemplo. Encontrar Ias permutaciones que se pueden forurar a paltir del conjunto {a,b,c}.
I 'iuc'ión: Son P3 : 3! : 6 permutaciones; éstas son:

(a,b,c), (a,c,b), (r,o"b), (c,b,a), (b,c,a), (b,a,c).

-dirora, consideremos dos conjuntos de rn y n elementos, respectivamente:

A: {at,a2,.".,a,r} y B : {h,bz,...,brr}.
54 Capítulo 2. El Concepto de Probabilidad

Parejas. Con los n¿ elementos <.lc A y los tr elerucntos cle B cs posible forrn¿rl nt,xTt ptrlejirs (rt,¡,lt¡,)
<¡rr: contcngan lln cleniento rle c:¿rd¿r con.jrrnto.

Ejemplo. En uu¿r f¿ibrica cle calz¿rc,lo se confcccir¡n¿rn 4 Lnodcl<¡s de zapatos lttlla. clirmas, en 6 tztrrrarius
cliferentes. Por lo tanto, se pr-reden fabricar 4 x 6 : 24 distintos tipos de zapatos.

Gencralicemos estc concepto a arreglos mírltiplcs.

Arreglos múltiples. Consideremos los conjuntos A: {at,a2,...,a,rr} de n¿ elementos, B :


{ú,b2,...,b,r}dcnelementos,yasísucesivamentehastaG:{g,g2,...,g"}deselementos. Con
ellos es posible formar rnxn x...x s arreglos (a¡,b¡,...,gr) que contienen un elemento dc cada
corr.lunto.

Otra forma de ver este concepto es considerar un procedimiento A que se puede realizar de m maneras;
un procedimiento B de n maneras; y así sucesivamente, hasta un procedimiento G de s rnaneras.
La acción consistente en realizar el procedimicnto A, seguido del procedimiento B, hasta llegar al
procedimiento G; se puede efectuar de m x n x - -' x s maneras diferentes.

Ejemplo. Suponga que se clasifica a un grupo de estudiantes universitarios según su sexo, estado
civil y la carrera que estudian. El sexo puede ser masculino o femenino; el estado civil puede ser
soltero, casado o divorciado; y, digamos que hay 7 carreras. Entonces, hay un total de 2 x3 x7 : 42
clasifi.caciones diferentes.

Anteriormente, se examinó las permutaciones de elementos de un conjunto, pero sin repetición; si ahora
queremos determinar las permutaciones con repetición, bastará considerar en los arreglos múltiples el
mismo conjunto.

Definición (de perrnutación con repetición) llna permutación con repetición, de k elementos
obtenidos a paltir de un conjunto de n elementos, es un arreglo de k elementos ordenados en el que
los elementos pueden repetirse arbitrariamente.

El número de permutaciones con repetición es igual a

P,\, : nk

Ejemplo. Con los elementos del conjunto A: {a,b,c}, ¿cuántas permutaciones con repetición, de
dos elementos, se pueden formar?

Soluc'ión: Se van a formar parejas considerando dos veces el conjunto A, por Io tanto se tiene n:
y k :2; entonces, hay un total de 32 : 9 permutaciones con repetición; ellas son:
(a, a), (a,b), (a,c), (b,o), (b,b), (b, c), (c,a), (c,b), (c,c).

2.3. Eventos y espacios muestrales

Examinemos un ejemplo: el lanzamiento de un dado una sola vez. Como resultado de la prueba se
pueden producir diferentes resultados: <<sale dos>>, <<sale cinco)>, <<€l número que aparece es par>>, etc.
Esto nos conduce a definir \os euentos.
Definición (de evento) Se llama evento, notado como (r, a cualquiera de los resultados posibles
de un experimento u otra situación que involucre incertidumbre.

Los eventos se clasifican en: elementales, aquellos que constan de un solo resultado: r compuestos,
que consisten de más de un resultado. Por ejemplo, <<sale dos>> es un evento elemental: mientras
2.4. Defrnición axiotnática de la probabilidad bl)

llre <<cl nrimcro qrre aparece es pal>> es un evento conpuesto, l)orque cstá conformado de Los cventos
-lementales <(sale dos>>, <s¿rle c;uatro>> y <<sale seis>.

,Jbselvernos que todo cvento relacionado con una pn,reba se pr"rede desclibir en términos de evertos
.lenrenta,les.

Definición (de espacio muestral) La colección de todos los eventos elementales, notirdo por Q,
-e denomina espacio muestral:

A: {rl o es evento elemental}.

lntonces, un evento no es más que un subconjunto del espacio muestral O.

Señalemos que el concepto de espacio muestral fue introducido por Gaiileo para resolver el problema
-e por qué en el lanzamiento de tres dados "10" y "11" aparecen más frecuentemente qr-re "9" y "72" .
?ara resolverlo listó todos los casos posibles.
-,
olviendo al ejemplo, si consideramos el número de puntos que aparecen al arrojar un dado, tenemos:

Espacio muestral: Q : {1, 2,3,4,5,6}.

A-- { el número que sale es par }: {2,4,6}.


-''rmo los eventos se asocian a conjuntos, es natural pensar que sus operaciones tienen algún significado
rmo eventos.

::an A y B dos eventos de O, en el siguiente cuadro se presentan 1as equivalencias entre las proposi-
--rnes de las teorías de probabilidades y de conjuntos y en la Figura 2.1 se encuentran los diagramas
-r Venn correspondientes.

lnterpretación en la teoría Interpretación en la teoría


Notación
de conjuntos de probabilidades
Elemento o punto Evento o suceso
0 Conjunto de puntos Espacio muestral (suceso seguro)
0 Conjunto vacío Evento imposible
.4r B Unión de conjuntos Por lo menos uno de los eventos A o B ocurre
-4. B Intersección de conjuntos Ambos eventos A y B ocurren
.4\B Diferencia de conjuntos A ocurre y B no ocurre
-4':CI\A Conjunto complementario No ocurre A
A)B:A Conjuntos disjuntos A y B se excluyen mutuamente (incompatibles)
,4C B A es subconjunto de B Si A ocurre, también B

:s claro que estos conceptos se extienden a cualquier sucesión de eventos.

:
2.4. Definición axiomática de la probabilidad
Lna probabilidad provee una descripción cuantitativa de la posibilidad de ocurrencia de un evento
;,articular y se puede pensar que es su frecuencia relativa, en una serie larga de repeticiones de una
-rrueba, en la que uno de los resultados es el evento de interés.
s

IS Formalmente, la probabilidad de un evento ,4 se define como una función que cumple:


56 Capítulo 2. EI Concepto de Probabilidad
i

ii

Figura 2.1: Interpretación de los conjuntos como eventos: a) Ocurre eI evento A. b) Ocurre A u ocurre
B (A U B). c) Ocurre A y ocurre B (An B). d) Si A ocurre, también B (A e B). e) Eventos
incompatibles (A ) B :0). f) No ocurre A (ocurre A").

. A1. Para todo evento A: 0 < Pr(A) S 1.

. A2. Pr(Q) : r.
. A3. Si A y B son incompatibles: Pr(A U B) : Pr(,a) + Pr(B).

De aquí, no es difÍcil demostrar que en general se cumple la relación:

Pr(A u B) : Pr(A) + erla¡ - Pr(Á. B) (2.1)

conocida como fórmula de Ia probabilidad para Ia unión.

Ejemplos

1. Dados los eventos A, B y C del espacio muestral f). Expresar mediante las operaciones entre
conjuntos los eventos:

a) Tan solo ocurre A.


b) Si ocurre A, no ocurre B.
c) Por lo menos dos de los eventos ocurren.

Solución:

a) Puede ocurrir A, y simultáneamente no ocurre B y no ocurre C; es decir que el evento es


r E AA B" NC".
b) Si no ocurre B entonces ocurre B"; es decir que <<si ocurre A, también ocurre -8">>, el evento
esc€ AcB".
c) Ocurrirán (Ay B) o (Ay C) o @ V C) o (Ay B y C), pero el último evento está contenido
en los tres primeros. El resultado es: Í € (,4n B)U(AnC) U (BnC).

2. Demostrar que:

a) Pr(Á") - 1- Pr(A).
2.5. Cálculo de probabilidades :)t

b) Si A C B errtorices PL(A) < PL(ll).

Soht,ción,:

a) 0: A¿A' (conAyA"disjuntos), entoncesi)or A3.. PL(O) :Pl(A) +Pr(A") vpolA2.,


Pr(O) : 1; corr lo que se obtiene: 1 : Pr'(A) + Pr(Á") v el lesultaclo es inrnediato.
b) Si A C B entonces B: AO(A' tl.B) siendo Ay (A ttB) incompatibles; por lo tanto, por'
A3. Pr(B) : Pr(A) + Pr(4" n B).
Por ,A1., Pr(A n B) > 0, entonces Pr(B) > Pr(A).

.A. continuación damos varias definiciones de mucha utilidad:

1. Dos eventos son igualmente probables si Pr(,4) : Pr(B).

2. El evento A es mós probable que B si Pr(A) > Pr(B).

3. Euento c'ierto.- Es el que siempre aparece en la realización de un experimento, su probabilidad


es igual a 1.

4. Euento zmpos'ible.- Es aquel que jamás puede ocurrir, su probabilidad es igual a 0.

2.5. Cálculo de probabilidades


-\l realizar el cálculo de Ias probabilidades es necesario distinguir de qué tipo de espacio muestral
Cisponemos; ellos pueden ser: fi.nito, infinito numerable o continuo.

2.5.L. Espacios muestrales finitos


Si consideramos el evento A: {rtru)2¡...,o¿}, su probabilidad está completamente determinada si
conocemos sus valores en cada elemento Pr({r,,,1}), Pr({a.'2}), . . ., Pr({c,.'¡,}); entonces,

k
Pr(A) : DPr({a.'¿}). (2.2)
i:t

Un caso particularmente importante se presenta cuando todas las probabilidades Pr(c.r) son iguales.

Si convenimos en designar Card(A) el número k de elementos del conjunto ,4 y Card(O) el número l/


de elementos del espacio muestral; entonces,

Casos favorables de A
Pr(A) :
Casos posibles
Card(A) k
Carcl(A) ¡/

Es decir, la probabilidad de un evento aleatorio A es igual a Ia rel¿rción cntre el núrmero de everrtos


eiementales favorables (cuando A sucede) y el nirmero total de eventos elementales del espacio mues-
rral. Esta definición es satisfactoria en ploblemas referentes a jr,regos de azan',loterías o experimentos
sencillos.
58 Capítulo 2. EI Concepto de Probabilidad

En el ejemplo clel lanzamicrtto cle rrn dado cortsicleremos el evcnto A <<salc rtn nrimero ¡rar>>:

O : {1, 2,3,4,5,6}, Card(O) : 6,


A : {2,4,6}, Card(A) :3.

Pr(A) :ffi
Card(A)
:-:-31
62
En los siguientes ejemplos, consideraremos espacios mnestrales finitos y aplicaremos los conceptos de
análisis combinatorio al cálculo de probabilidades.

Ejemplos

1. En un estante hay 2 libros de historia y 3 de biología. ,Ll azar, se toma un libro y luego se toma
un segundo libro. Encontrar la probabilidad de que un libro de biología sea seleccionado: a) la
primera vez; b) ambas veces.
Soluci,ón:

a) Por defi.lición, O : {11r, Hz,Bt,Bz,Bs}.


Sea A el evento <<escoger un libro de biología>>; es decir, A: {Bt,Bz,Bs}. Por tanto,

Pr(A)
'-' :9'1!9 :I
Card(f^)) 5'
b) Que ambas veces se seleccione un libro de biología significa:
. que la primera elección es un libro de biologÍa, entonces se tiene 3 casos favorables; y
. que la segunda elección también sea un libro de biología, entonces hay 2 casos favorables.
Así, el número de casos favorables es igual a 3 x 2 : 6.
El número de casos posibles, de todas las parejas sin repetición, es 5 x 4 :20.
Entonces, la probabilidad buscada es
63
u- 20 10'

2. En la final de un concurso escolar de matemática participan 6 alumnos, de los cuales 3 pertenecen


al colegio A. Si se premia a los dos primeros con regalos diferentes, ¿cuál es la probabilidad de
que los alumnos del colegio A obtengan los 2 premios?
Soluciórt: El conjunto f) está constituido por las parejas que se pueden formar con los 6 parti-
cipantes. El número total de parejas es Vfr : fr : tO.

Sea el evento B: <<ganan los alumnos del colegio A>>.

El número de casos favorables en el cual 2 de los 3 alumnos del colegio A ganan los premios es:
V3 : o. Luego,
Pr(B) :*:0.,
3. Entre 100 fotografías de un sobre se encuentra la foto buscada. Del sobre se extraen aI azar 70
fotos. Hallar la probabilidad de que entre ellas resulte la foto necesaria.
Solución: Ei espacio muestral Q está formado por los conjuntos de 10 elementos que pueden
formarse a partir de 100: Card(A) : Cl8o.
2.5. CáIculo de probabilidades 59

El núrmero de resultados favorables que nos interesa es igual al total de formas como pueden
escogerse 9 fotos de las 99 restantes; es d'ecir, Card(A) : CBg'
La probabilidad buscada es
CP^
:eÉ';:10. 1
Pr(A)

4, En el Consejo Universitario cada una de las 10 facultades está representada por el decano y
el subdecano. Se nombra una comisión de 10 miembros elegidos aI azar. Determinar Ia pro-
babilidad de que:
de
a) una determinada facultad esté representada;
b) todas Ias facultades estén representadas.

Solución:
)ma
a) Considerando el evento complementario A': facultad dada no está representada>>, y
<<una
i) la
calculemos su probabilidad. Hay 20 representantes, 18 de ellos no son de la facultad
en

cuestión, por Io tanto existe" C18 casos favorables'


EI número de comisiones diferentes de 10 miembros que se pueden formar con los 20 miem-
bros es C|$, entonces
r_rlq g
Pr(a") :;ifr : s,
finalmente,
Pr(A) -1-*:# x0.7632.

b) EI número de maneras diferentes en que pueda estar un representante de cada facultad en la


s'Y
comisión es 210. La probabilidad del evento B: <<todas las facultades están representadas>>
bles.

Pr(B) : 0.00554.
#ry
Se arrojan dos dados. Hallar la probabilidad del evento ¡: {al menos en uno de los dos dados
salen más de dos puntos).
Solución: EI espacio muestral puede describirse como
reCen
rd de
cl: {(i, j)li, j: L,2,...,6},
j
donde el evento elemental (i,j) corresponde a los ¿ puntos aparecidos en un dado y los puntos
rarti-
aparecidos en el otro. Consecuentemente, Card(Q) : 36.
Designemos como 81 el evento consistente en que en el primer dado salen más de dos puntos y
con B2 el evento análogo para el segundo dado:

Bt : {U,j)l i-_ 3,4,5,6; i :1,2,-..,6},


Bz : {(i, j)l i -- L2,. . . ,6; i :3,,4, 5,6}

u10 por lo tanto, card(B1) : card(Bz) :21. Puesto qrue B1l\82: {(i, i)l i,i :3,4,5,6}, entonces
Card(B1 ¡ B) :42 :16. Ahora bien,

: :'! : ?, y ¡Bz):#:Í
Leden
Pr(81) Pr(Bz) Pr(81
36
60 Capítulo 2. El Concepto de Probabilidad

Dc la fór'rnula dc probtrbilidacl para la nrriórr se obtiene:


Pr(A) : Pr(l]1 ¿ Bz): Pr(Br) + PL(82) - Pr(81 ¡ Bz)
2248
: 5-5-9:b
Se recomienda que el lector resuelva este ejercicio rnediante el ernpleo del evento complernentario.

2.5.2. Espacios muestrales infinitos numerables


Sea f) : {cur, u)2¡...run,...} un espacio muestral infinito numerable; entonces, resulta que

ie,1i,,,)) :1,
i:l

luego, si A es un evento de Q, su probabilidad se calcula por

Pr(A) : t Pr({a.'¿}).
u¡,€A

Para el cálculo de las probabilidades, generalmente, se utilizan series numéricas infinitas.

Ejemplo. Juan y Andrés juegan tenis con la misma habilidad. Deciden jugar una secuencia de sets
hasta que uno de ellos gane 2 sets seguidos. Halle la probabilidad de que se necesite jugar número
par de sets para terminar el juego.

Solución: Sean los eventos: J: <<gana el set Juan>> y A: <<gana el set Andrés>>.

Segúrn el enunciado, el espacio muestral está conformado por los siguientes eventos elementales:

rL Empieza Juan ganando Empieza Andrés ganando


1. JJ * AA
2. JAA AJJ
3. JAJJ * AJAA
4. JAJAA AJAJJ
5. JAJAJJ * AJA.IAA

El evento B: jugará hasta que uno de ellos gane 2 sets consecutivos>> es la unión de los eventos
<<se
que están señalados con una estrella (*) en el espacio muestral.

Se tiene que

Pr(AA) :
1
Pr(JJ) +
i'
Pr(JAJJ)+ Pr(AJAA) : 1
=.
8

Las restantes probabilidades,on l,32', l12g'etc'


Entonces, la probabilidad de B está dada por la suma

Pr(B) : [Pr(JJ) + Pr(AA)] + [Pr(JAJJ) + er(e;eA)] +...


1111
_ _ _
_l_ _l_ _-!- -.
1
:
2'8'32'128 -
-.t-
')2tt-l
_.1_ _l_

-
2.5. Cálculo de probabilidades 61

La srrlrr¿ cle est¿ selie geornritrir;¿r es igual a ?, ,r,,r'Io clrrc Pr(B) : ?.


33

2,5.3. Espacios rnuestrales continuos


Sttpongamos c¡te sc tienc rtna" figura ¡rltrna f) v <lcntro de ella sc encucrrtr'¿1 otr¿r figura A (Figura 2.2).
Sobre Ia figura Q se h¿r rrr¿rlC¿rdo uu pttnto al azar'. Suponiendo <1ue la prolrabilidtrcl clc que el punto
':aiga en A es ¡rropolcional al ¿ilea de Ia figula y no de su forrna o posicid-rn, la prolrabiliclad de quc el
'¿r-ttlto caiga en la figu'a A cs:
Ár-ca de A
l'r'(-4) :
Area de f)

O -.

ItS Figura 2.2: Interpretación geométrica de Ia probabilidad.


)ro

En general, si A es un evento cle un espacio mnestral continuo O, tal que su rnedicla (longitud, ',rotrr*"r.,
,iempo, etc.) existe; entonccs, su probabilidad cs

\{edida cle ,4
Pr(A):
\tledida de O'

Ejemplos

1, Sobre un plano se trazaron circunferencias concéntricas de radios 5 cm y 10 cm, respectivamente.


Halle Ia probabilidad de que un punto marcado aI azar en ia circunferencia mayor caiga también
en el anillo forrnado por las dos circunferencias (Figura 2.3).

Figura 2.3:

Sol:uciór¿: El ár'ea del círculo lnayol es ,5: I02rcm2: 100ir<'rrr2.


El área del anillo comprendido entre las dos circunferencias es igual a la diferencia entre las dos
áreas: 7: (702n - 52n) cm2 : 75tr cnt2; entonces,

T
:s:loo;"-t:o'75'
75r cttt2
Pr(A)
62 Capítulo 2. El Concepto de Proba'bilidad

2. Sr:¡L l) :
{(:r;. !l) I () <:t; I 1; il í :l I ii (i,';grui.2"4) ci i:sirir.<:io irirrstliil ,i,:r rrrr fcririrrrcro akrirtoli¡r
v sitP<ttticrttlo c.irrr: io<lrl prulto <l<r (l'¡itrrr,'l;r ¡risrir¿r ¡rlolrrrlrilirltlrl ilc sLl 1r".r¡LtLo clL r;rrerL1a.

Jr

il 4 x
,,4n8 E
117

Figura 2.4:

Detclrninar' la probabilidacl de los evcntos:

.d) A: {(r,y)/0 I r < tl2; 0< y < t};


lr) B : {(",y)10 ( r { 1; 0 < y < lla);
c) An B;
d) A¿ B.
Solttctór¿:

a) Árca O: 1 x 1 : 1.
cle

Áre.r cle A:! * t: 1. eutr¡nces pr(.,{) - !12 :!.


22 1:
l,) Árcu de B - * j,,,,rto,,,", Pr(1J) :+ =
' 1: i
:; :
I " I: j,
.,) Ár'ea rt: A B pr.(A n B)
"r,tou.", *
cl) Por la fór'inula dc la uniórr,

Pr(A u a) : Fr(,a) + Pr(B) - Fr(Á n IJ)


111ir
2488

2.8" ;i!e::cir:ios

Análisis cornbinatorio

l" Culcuie lcis siguierri,cs (iocúcitintcs bilorrri¿lcs Cf,: n) Ci; b) C1]; r) Ci:
2. C.lc.le Vf eri l<,rs sigrricrrtcs c¿r:jos: ,r) Vl; lr) V!; ,r) V3; cl) \¡.].

3. Dctcrtrtirc r:1 tttirnclo tle lrr:ilruiar.:i'rn('s ( lr rilr,,,,l.iiurt' ¡lg 1¡ r)]r:rrrr:irr r

it) rt,:3 1r) n :4 c) rt:5: 'l)'t t


:(t
4. Dci,clttiilrt cL rrirrrcro <1r: ¡rarr:iils fllrtrarl,Ls i;r-,i los crlctrretrtos rlc los,
2.6. Ejercicios t-).)

a) Carrl(,'l) I Clar <l(13)-.) C:) CaLcl(,'l)- 8, CaLri(lJ) : lj;


b) CaLrt(A) f,
,). Car rl(ll) I ,t) Card(.,1) : 1ij. Clald(t:¡ - 5.
-
Cr-rántcls alrcglos se prrerlcu forrn¿u corr los eleurcntos de los cou.lrurtos cuv¿r cardin¿rlicl¿rd sc in<lica:

a) Card(A) : 4; Card(13) : 2 Crrrd(C) - 5.


b) Card(A) :5; Ctrrcl(B) :7; Carcl(C) :4; Card(D) : 5.

6. Cnántas palejas con rclposicrón pueden formar-se con conjuntos crtya c¿rlclina.lidad es:

a) n:3; b) rz:5; c)rt:T; d) rr,:8.

l. Ftxure todas las combinaciones y valiacioncs qlre se pnerlen obtener a parl,ir de los cortjuntos:

a) A: {a,,e,'i,o,z} cn grLlpos de tres elementos;


b) B : {I,2,3,4, 5,6} en grupos de tres elementos.

8. Para los conjuntos indicaclos forme todas las pa,r'ejas sin reposición y parejas con reposición:

A: {a,e,i,o,u}; b) B: {I,2,3,4,5,6).
^)
r;¡r cortrruc uv.r-iu!ar--- -, .--:. eiirr-'131. ql.- -.-:ii¡r::-,i', , $:rL)iici y [1 silllg:r'ente; debe elegi' un
presidente y r-rn vicepresiderr c. ¿De cuántas maneras se pueclerr elcgrr esr,e par dc fiutcrorr¡ilios
si el presidente debe ser nn ;:iente?

Ul hospital cuenta con 21 ci r.ijanos (ion ri)s, ,,'-¡.ies hay que folrnar ter-uas para re¿lizar guardias.
¿.Cuánttrs ternas sc pueclen f:rrnar?

Un amigo le quiere regalar a ¡tro 3 cliscos y los quiele clegir cntre los 10 que más Ie gustan. ¿.Dc
cuántas marreras pucde hace¡'lo?

') Al c,iirs, r'ccolclando quc éstas


marc:ar urr núrniero telcfónico lula persona olvidó las trcs írltimas
sorr difclentes, J.as malcó al azar-. Halle la probabilic.lad de que se haya marcado las cifras
correct¿ts.

De entre 9 empleados se deben selecciorrar a 3 para viajar a 3 Jrlar,'¿s A, B y C fuera dc la


ciuclad. Cacla empleado irá a una planta. ¿De cuántos modos se puede iracer la selección de los
ernpleaclos que via.jarán?

Eu cl ejcrcrcio ¿rntelior considéresc qrre los 3 enrpleirclos \¡an a ir ¿l l¿ misrna planta. ¿.D<: curintas
rnaneras se puede hacer la seleccicin?

Si cn el ejelcicio antcrior, cle los 9 ernplcaclos, 7 son homl>res. ¿Cuál es Ia probabilidacl de


entrc los tr<ls cscr-lgiclos'/
scle¿cciorra: cx¿rcta,rnentc r.rrrtr nrr-¡er

_)
¿.Cuárrtos nrirneros de 6 cifras pucderr haccrse con los dígitos {I,2,3.4, 5, 6}:

rr) sin rcstlicción algrrua'/; b) sin rcpctil ling;'.url cifra?; c) maStolcs c¡rc 500000?

Sicte pcrson¿rs h¿1n soiicitado empleo para lleuar dos r.acantcs. ¿De cuárrtos modos se puerclen
llcrrar l¿ts vat:¿rrrtcs si:

rr) la pr:irncr¿l i)crlsou¿l selcccionacl¿r tecibr,r nr¿:tyor salario que la s,)grul(ia?;


b) no hay clifer'<lrrci¿l cntre las r¡acan1 cs'/
64 Capítulo 2. EI Concepto de Probabilidad

18. i',Cttárrtos partidos sc .jucgatt cII ull cirruptxrrrato. crrr cl qrre prrlticipan 20 cqrripos y en el quc
.iuegan toclos contla to<[os. rul{) crr c¿rsa V otlo <lc visil ¿rlrte?

19. Etr tttr lestattrarttr: cie cotnicla rtipicla se inclir:a al clicrrtc (lrrc sri harnbrrlgr-resa. a rnás del pan 1,
la catne, puede ir cou todo lo siguiente r¡ sin ello: sals¡r clc tornatc, nrostaza, rnayollesa) lechuga,
cebolla, tomate o queso. ¿.Crt:intos tipos difercnt<,rs <1r: hirrnburguesas son posibles?

20. La producción de una rnáqnina cronsta de 4 f¿rses. Ilirl' 6 líneas cle montajc pala la primera fase,
3 para la segunda, 5 para l:t telcrerir, y 5 para la irltirrr¿r. Detelmine de cnántas forrnas distintas
se puede montar Ia máquina en este proceso de producciórr.

21. Eu un plano hay 15 puntos de los cuales rro hay tles que sean colineales. ¿Cr-riintas rectas
determinan?

22. ¿Cuántos triángulos determinan los vértices de un polígono regular de 9 lados?


23. Una heladería tiene 16 sabores disponibles. ¿De cuántas formas se pueden pedir 6 helados si:

a) no se elije el mismo sabor más de una vez?;


b) se puede pedir un mismo sabor hasta 6 veces?;
c) un sabor no se puede pedir más de 5 veces?;
d) la mitad debe ser de fresa?
24. Un entrenador de fúrtbol debe seleccionar a 11 jugadores de entre los que había conúocado
anteriormente para Ia concentración. Si puede hacer su selección de 72376 maneras, ¿.cuántos
jugadores estuvieron preserrtes en Ia concentración? (Se supone que ningirn .jugador tiene un
puesto fijo de juego.)

25 En un Ienguaje de computación, un identificador consta de una Ietra o de una letra seguida de


hasta siete símbolos, qrte ptteden ser letras o dígitos. (En este lenguaje son indistinguibles las
letras mayúsculas y minúrscrrlas, hay 26 letras y 10 dígitos.) ¿',Cuántos identificadores diferentes
se pueden utilizar en el lenguaje de computación?

26. En cualquier set de un partido de tenis, el oponente X puede vencer al oponente Y de siete
maneras. (Con el marcador 6 - 6, se juega uu desernpate: tie breaker) El primer tenista que
gane tres sets obtiene la victoria. ¿De cuántas maneras se pueden registrar los resultados si:

a) X gana en cinco sets?;


b) para ganar el partido se necesita jugar como mínimo tr.es sets?

27. ¿De cuántos modos se pucden poner 5 anillos diferentes en los dedos de una narlo. omitiendo el
pulgar?
Definición de probabilidad
28 Sean Q un espacio muestral y A, B y C eventos cualesquiela) exprese las siguientes afirmaciones
conro uniones e intersecciones de A, B y C y de sus conrplementos.

a) Ninguno de los eventos ocurre; c) No ocurre más que un e\-ento:


A, B, C
b) Por Io menos uno de los eventos A, B, C d) Ocurlert exactanlellte cios eveutos;
ocnrre; e) Ocrrrren no más de dos e\-entos.

29. Con el empleo de Ia definición de probabilidad, dernuestre:


2.6. Ejercicios

a) Pr(0) : o; c) Pr(A u B) < Pr(A) + Pr(B);


b) Pr(AuB) : Pr(A) +Pr(B) -Pr(Ana); cl) Pr(A) : Pr(-4nB) +Pr'(AnB').

aj 30. Se arrojan dos dados, sean A el evento <<la suma de las caras es impar>>, y B el evento <<sale por
Io menos un tres>>. Describa los eventos A a B, Atl B, A l\ 8". Encuentre sus probabilidades
si se supone que los 36 eventos elementales tienel igual probabilidad.
i€,
AS 31. Se consideran dos eventos A y B, tales que Pr(A) : 1 r PrlB) : 1. Determine el valor de
3" 2
Pr(A'O B) en los siguientes casos:

a) A y .B son incompatibles; b) A C B; c) Pr(A n B) : :1


8

:32. Se consideran dos eventos Ay B, con Pr(A) : 0.375, Pr(B) : 0.5 y er(AnB) :0.125. Calcule:

a) Pr(Á") y Pr(B"); c) Pr(Á" ) B");


b) Pr(A u B); d) Pr(Á" n B) y Pr(A. Bc).

'),). Sean A y B dos eventos tales que Pr(A) :0.9 y Pr(B) :0.8. Demuestre quePr(AnB) > 0.7.

34. Un experimento aleatorio consiste en arrojar una moneda y un dado a la vez y observar el
resultado. Escriba el espacio muestral del experimento.
rdo
tos ,JD Una empresa tiene dos tiendas distribuidoras, una en el norte y otra en el sur de la ciudad. De
utl Ios potenciales clientes, se sabe que el 30% solo compra en la tienda norte, el 50% solo compra
en la tienda sur, el 10 % compra indistintamente en las dos tiendas y el 10 % de los consumidores
no compra en ninguna de las dos. Sean los eventos A: <<el cliente compra en la tienda norte>> y
de B: <<el cliente compra en la tienda sur>>. Calcule las probabilidades (e interprételas):
las
tes a) Pr(A); d) Pr(A n B); g) Pr[(A n B)"];
b) Pr(,A u B); e) Pr(A \ B);
ete c) Pr(B"); f) Pr(Á" ñ B"); h) Pr(A u B').
lue
: 36. En la intersección de una autopista, los automóviles pueden girar a Ia derecha (D) o a la izquierda
(1) Desde un puesto de observación se registra el sentido de la maniobra de los tres primeros
vehículos.

a) ¿Cuál es el espacio muestral del experimento?;


rel b) Sea A el suceso <<a lo más uno de Ios coches gira a la derecha>>, B: <<todos los vehÍculos
giran en Ia misma dirección>> y C: <<exactamente uno de los coches gira a la derecha>>.
¿Qué relación existe entre Ios sucesos B y C?;
c) Enuncie y halle los elementos de los sucesos B', BUC, A)8, AcaB".

Cálculo de probabilidades
.)/. Un gerente de compras desea hacer pedidos a proveedores diferentes, a los que nombra corno A,
B y C. Todos los proveedores son iguales en lo que respecta a la calidad por lo que escribe cada
letra en un papel, rnezcla los papeles y selecciona a ciegas a uno de ellos. Se hará el pedido al
vendedor que salga seleccionado. Calcule las probabilidades de los eventos:
66 Capítulo 2. El Concepto de Probabilidad

a) SC scloc:r:iorr<i itl plovrtr:clor' /l; c) cl proverr:clor ,,1 rro sc sclc<:cion¿r


l,) s(l s<rlc<:r:ioLra ttl 1>r'ovccrlr.rt A c¡ ():

Sttpong:t quo cll ttn soLt(:o itr lrrolrirlrilicl¿tcl rlc galiar prirner prcrrric-r.,,
f v
38 c1 1a,1" girnzrr cl
3^Si 1a
:. 3
r.cgLttLc[,r ¡rt.'tnio,'s
¡i irrolrabilirl¿rr1 r[c B¿ur¿:r1 ¿rl nretrros rrrro clc los rlr¡s ltlcrnios es ;-l . ;.r:irlcrrlc
la probabilicl¿rcl clc garr¿rl solo rrrro dc los rlos plenrios'/

39 Sc enr'í¿rtt 3 oficios a 3 personas diferrentcs. Sin ernb¡rr'Élo, una secret¿ria distr'¿rícla levrir:lvc los
oficins v sc pttccle consitlelal clttc los lnalr(ló ¿rl ¿z¿1r. Si tur¿r coirrcidencria <rs el hcchri rle rlrrc rrna
persona recil-,a el oficio correcto. cak:ule la probabilidad de que haya:

a) ninguna coincidcricia;
b) exactarrrente rrna coincidencia.
40 La fábrica errsarnbladora ha dcterminado que Ia demanda clel arrto Honda Civic es igual para
cada uno de los colores azul, blanco, verde y rojo. Se haceu tres pedidos sucesivos de autos de
ese rnodelo. Deterrnine la probrrbilidad rle que:

a) se piclan uno azul, uno blanco y uno rojo;


b) se piclan dos azules;
c) se pida por lo menos rrno vcrde;
d) exactarnente cios rle los cluc se pidicron tengan el rnisnro color.

4I Lr-icgo dc las 1>ntel)¿ls tr)¿I a ocupar un puesto a los 6 aspir;r.rrtes se lcs clasifica de a<rrrerclo al 1>untaje
obtenido. Los rcsrtlt¿r<los uo le llegtrn al empleador pol lo quc él contlat¿r a clos aspirantes al
azar'. ¿,Cuál cs ia ltrobabili<lad tle quc haya contratado a los dos aspirantes me,jor c¿rlificados?
r)
,1
Un pacltrete cle 6 focos tienc 2 rrnidacles clefectuosas. Si se cscogen 3 focos para su uso, calcrrle
la probabilidad cle qr-re ninguno tenga clef'cctos.

43 En ttna caja hay 20 fotografías en la cual htry 6 mal tomadas. ¿,Cuál es la probabilid¿rd de
selecciorrar 2 fotografías clefectuosas'/

44. Entre 100 artículos de ttn lote hay 5 <iefectuosos. Halle Ia probabilidad de que entre 10 altículos
escogidos aI azar, no sc tenga más cle un artículo defectnoso.

45 Un distribuiclor de electrodomésticos recibe un euvío de 20 pianchas, cie las cu¿rles hay 3 defcc-
tuosas. Para conocer si el lote está buerro pmeba 6 aparatos. trl distribuidor aceptar¿i el lote
si cltcttetitra a lo rnás ltn aparato dcfec:tnoso cntrc los prolrados. ¿Cuál cs l¿t pl'ollabili<lad cle
rechazar el envío'/

46. De un áttft-rrir, quc contietre 100 boletos. se extr¿err tres bolctos ganadores. ;.Crrá1 cs la lrrob:r-
biliclad de que gane una persona que conrlrró:

a) 4 boletos?; lr) solo un bolcto?

47. Entt'e 1as 80 t:stacioncs de sen,ir:io qrrc hay ell nnA cindarl, 10 errtrcgan un¿r ca:i-i'la,l merrol clue
la que el cliente compr¿r. tlu inspect,or clc la Dirccción de Hiclrocarbrrros r-i..it:r aie¿rtori¿rmente
cinco de ellas para velificar si la cantidad'n'enrlid¿r cs correct¿t. ¿,CLrál es la p:'',rt,airrliclad rle que
descubra al nenos una fiaudulenta?

48. En el juego del <<cuarenta>> se reparten 5 cartas, al azar, a cada jugador. a palil' ,Le rrn mazo de
40 cartas. ¿,Cuál es la probabilidad de que un jugador tenga:
2.7. Independencia y condicionalidad 67

¿r) urr as) rur dos, un trr:s, un cuatLo y un c:irrro, clel rnisnio pnlo'/;
l,) 4 c¿u'tas <lel rnismo pirlo'/;
t:) rrua <<rorrcla>>; cs rlecir', 3 calt¿.rs rle ia rnisrna clelornil¿lci<in (as, clos, etc.)?

i9 En nrr closet hay 6 pales cle z¿rpatos. Se escogcn 4 zapatos al azar. Encuentre la probabilidad
rle de qnc haya pol io rnenos lrn par de zapatos errtre los 4 zapatos escogidos.

50 Err los países europeos existe una forma muy popular de lotería, llamada Lotto, que consiste en
OS seleccionar'6 números de una cartilla que contiene 44 núrmeros (del I aI 44). El día del sorteo
na se seleccionan 6 bolas al azar y sin reposición. Una persona gana el premio principal si los
6 números sorteados coinciden con los seleccionados; también se puede ganar prernios si 4 o 5
núrmeros sorteados coinciden. Determine la probabilidad de:

a) ganar el premio principal; b) ganar al menos un premio.

rra 51. Una persona presiona, aI azar, 8 cifras en una calculadora. ¿Cuál es la probabilidad de los
de eventos siguientes:

a) ,4.: <todas las cifras sean distintas>?;


b) B: <<el producto de las 8 cifras es un número par>>?;
c) C: <<las 8 cifras forman un conjunto creciente>?;
d) D: <<la suma de las cifras es igual a 3>>?
i2. En un círculo de 20 cm de radio se encuentra un círculo menor de radio 10 cm. Halle la
aje probabilidad de que un punto marcado aI azar en el círculo mayor caiga también en el círculo
,al menor.
,
=.)
.1.J. Dentro de un cancha de baloncesto, cuyas dimensiones son 20 m por 12 m, se encuentran dos
ule charcos que tienen forma de círculos, de 8 y 5 m de diámetro respectivamente. ¿Cuál es la
probabilidad de que una pelota lanzada a la cancha caiga dentro de uno de los charcos?
de .J+
=1 Dentro de un rectángulo de base 10 cm y altura 6 cm se encuentra un círculo que es tangente
a 3 de los lados. Si se marca un punto al azar dentro del rectángulo, calcule la probabilidad de
Llos
que el punto no se encuentre dentro del cÍrculo.

Dentro del rectángulo limitado por las rectas , : -L,, :;, A : -7, A : l, se tiene el
bc- gráfico de la función trigonométrica seno. Sobre el rectángulo cae una gota de tinta. ¿Cuál es
ote la probabilidad de que Ia gota de tinta haya caído dentro del área comprendida entre el eje r y
de la curva A: sel:x? (Observación: Suponga que el área, de Ia mancha de tinta es despreciable.)

2.7. Independencia y condicionalidad

Fn la teoría de probabilidad un concepto muy útil es el de independencia de eventos, que significa que
-a ocurrencia de uno de los eventos no da información sobre si otro evento ocurrirá o no; es decir, Ios
lue -r-entos no influyen uno sobre otro.
nte
lue
Definición (de independencia) Dos eventos A y B se llaman independientes si la probabilidad
de que ambos ocurran es igual al producto de las probabilidades de los dos eventos individuales.
Es decir,
,de Pr(A n B) :Pr(A) x Pr(B).
Capítulo 2. El Concepto de Prcbabilidad

Esta dcfinición se puede extender a cualquier núrmero de eventos.

Observación.- Si A y B son independientes, se puede dernostrar que sus respectivos complementos


son independientes; es decir, que se cumple:

Pr(An B'): Pr(A) x Pr(g").


Pr(A n B) : Pr(A') x Pr(B),
Pr(A" n B') : Pr(A') x Pr(g").

No se debe confundir los conceptos de eventos independientes y de mutuarnente incompatibles (dis-


juntos).

Ejemplos

1. Sea Q: [0,1]x [0,1] y dados los eventos: A: {(r,a)10 S r 5ll2; 0 < y < I}, B : {(",A)10 <
r 1I;0 <y <Il ). Probar si A y B son independientes.

Figura 2.5:

Soluc'ión: Según la Figura 2.5 se tiene que Pr(A) : 1


\/4 :
PrlB) l.
1
entonces
i,
Pr(A) x Pr(B) :+" 11
48'

Por otro lado, antes se calculó que Pr(A n B)


I
Como se cumple que Pr(A n B) : Pr(A) x Pr(B), entonces los eventos A y B son independientes.
2. En una máquina, para la señalización de emergencia se han instalado dos indicadores que fun-
cionan independientemente. La probabilidad de que el indicador funcione durante una avería es
de 0.95 para el primero y 0.9 para el segundo. Hallar la probabilidad de que durante una avería
solo funcione un indicador.
Soluctón: Sean A: {funciona el primer indicador} y B: {funciona el segr,rndo indicador}.
El evento f, : {funciona solo un indicador} puede expresarse como C : (-{ i B')U (A l\ B).
Calculemos cada una de ellas:

Pr(AnB") : Pr(A) xPr(B') :(0.95)(1 -0.9) :0095.


Pr(A'n B) : Pr(A') x Pr(B) : (1 - 0.95)(0.9) : 0.045.
2.7. Independencia y condicionalidad 69

Pcu lo trutto.
Pr(C) : Pr'(,4 a 13") * Pr(4" . 13) :0.095 + 0.045 : 0.14.

Tles bicllogos, irr<lepcnclierrtcrncutc uno clel otlo, nriclielon el c:<¡rrtcniclo <,1<'l suero c1t tlll¿l tttttestra.
La proba.bilidacl cle <¡-re cada uno comet¿r Lln el'ror eu I¿r lcctur:r dol apzrlato cs igutrl a 0.1, 0.15 y
0.2, r'r:s¡rectivarrrente. Hallal la probabilidad de que cll ttna s<,rla rnecliciótt pol lo meros ttno de:
Ios investig¿rclores coureta Lrrl erlor.
Soluc,ió,n,: Se¿r el evento ¿: {por lo menos uno de los investigaclolcs coniete urr crror}, el
complerrento es A" : {ninguno de los investigadores comete un error}.
Caicul¿rrernosPr(4"), considerando que las medicioltcs son evctttos inclcpendientcs.
(dis- Sean p¿ la probabilidad de que el i-ésimo investigador cometa un error (i: I,2,3), entonces

Pr(A') : (1 -pr)(t-pz)(I-pz)
: (1 - 0.1)(1 - 0.15)(1 - 0.2) :0.612.
/0< Resulta que Pr(A) - 1- 0.612 : 0.388.

r-n concepto estrechamente relacionado con la independencia es el de condicionalidad de eventos, que


.e lo puede enunciar de la siguiente manera: <<se tiene fijo un cierto evento B, se desea conocer cuál
- la probabilidad de que ocltrra un evento A, sabiendo que ocurrió B>>.
?or ejemplo, suponga que usted va a almorzar al mismo Iugar todos los viernes y que su almuerzo
- sirve en 15 rninutos (evento A) con probabilidad 0.9. Sin embargo, daclo que usted nota que e1
_rstaurante está excepcionalmente lleno (evento B, fijo), la probabiliciad de clue sirvan su almuerzo en
-5 minutos pnede reducirse a 0.7. Ésta es la probabilidad condicional de ser servído en 15 mirr.utos,
rado qne el restartrante está excepcionalmente lleno.

Definición (de probabilidad condicionada) Consicleremos un espacio tnttestral Q y un evento


3 e Q tal que Pr(B) 10. La probabilidad condicional de que un evento A octtrra, en el supuesto
:,-re B ha ocurlido) se representa por Pr(AlB) (que se lee <<probabilidad de A, dado B>>), se define

Pr(AlB):HF

Ejemplos

-. En nn estudio sociológico sobre Ia fidelidad en el matrimonio sc obtu'u,o el siguiente modelo


probabilístico, calificando al hombre y a Ia mujer como fiel (,F) o iufiel (/).
entes.
Mu.jer
e fun- Hombre F I
lrÍa es F 0.22 0.24
avería I 0.31 0.23

r). a) ¿.Cuál es Ia probabilidad condicional de qtte ttrr esposo seir fiel, clirclo qr-re sll esposa es fiel?
b) ¿'.Cuál es Ia probabilidad de ctrr-te ttl)a esposa sea fiel, claclo
(luc srr csposo es infiel'/
n B).
Sol'u,ción; Corrvengarnos en la siguiente not¿ciórr de los ercrrtos:
.f1F: Hornbre fi.el, 111: Hombre iuficl,
,41F: N{u.ler fiel, 11,/1: \4Lr.jer infiel.
70 Capítulo 2. El Concepto de Probabilidad

a) Dcseamos calcular
PI(II I-IAI F) : f'r(II F. n{F)
Pr(r1F)
De 1a tabla se obi:ierrcr cllle

trL(i1F . AI F) ¡),
Pr(n1F) 0.22 + 0.31 :0.53.
Con ésto,
0.22
Pr(111¡lrt{F) : : 0.415.
0.53
b) Calculcmos
n HI)
Pr(A,I FIH i) : Pr(MF
Pr(H/) )

con
Pr(MFnf{f) :0.31 y PI(III): 0.31 + 0.23 : 0"54.

Entonces,
g'31
pr.(,41 FIHI\:
' 0.54
:0.bT4.

2. En un taller trabajan 7 hornl)res y 3 mujcles. Se escogen al azar 3 personas. Hallar la proba-


bilidad de que todas las pcrsonas selcccionadas sean hombres.
Solución: Designemos los siguienfes eventos:
A: el primcr selcccionado es hombre,
B: el scgundo seleccionado es hombr-e,
C: el tercer selecciorraclo es honiirre.

* La probabiliclad cle que el primelo s<-.¿r


\/
hombre es Pr(A) - :10
u La probabiliciad de <+re el seguriclo sea hombre a cc¡ndición de qrre el primelo f.,e hornbre
ES:

Pr(BlA\:9:?
__\_r--l
9 3
u La pI'r¡babilidad de que el tercero sea hombre sabir:rrdo que los dos primeros t¿rnrbién lo son,
es la probabiiidacl dc C dado A y B:

:'r(C An : !.
ll),E
tr-ir pr"obabiiid¿rci buscacla tlc clrrc las i,lcs i)crson¿rs escc.rgiclirs sean holrlrres es

?, (,{ I B. C): PL(,,t) x P: (13lri) x Pr(Cl4 i', ::


B)'1(l,i: : I:

2.8. Frob¡abilidad coxmpleta y fénrutula de Bayes

La probabilid¿rd clc: A, que puccic ocrrriir sclo ¿rl ¿lll¿rlecel uno rl,:.'. . .1 ,,< r-trLrtuarnerLtr:
Lttt cvonto
f:xclltt¡'g¡¡iss B t, 82, .. , 8,, (Figura 2.6), talcs (llre sli uniórr es el espacio rri,r.:j r.- j ,'1 (lada por

Pr (A) : I'r(131)Pr(,,t1-ts1) * Iri(82)Fr(Al1l2) + .."+ I'r,!,, i - : (2 3)


lt
\- n,.r /? ' nr / 1'|¡r \
1r'.\L.tt_
2.8. Probabilidad cornpleta y fórtnula de Eayes 77

donde Pr(81) + Pr(82) + .. . + Pr(B,,) : 1.

La igualdad (2.3) se clenornirra la fór'rnttl,a dc la prolttt,bi,lidad com,pleta.

Figura 2.6: Partición del espacio muestral fl.

Supongamos que el evento A puede ocurrir a condición de que aparezca uno de los eventos Bt, Bz,
..., Bn. Si A ya ocurrió, la probabiiidad (condicional) del evento B¿ es igual a

Pr(B6lA) :ffi:g;ffi
Pr(AnB¡) Pr(B¡)Pr(AlB¡)

i:I

Fsta ieualdad se denomina fórmtil,a de Bayes.

?ara e1cálculo mediante la fórmula de Bayes puede resultar conveniente disponer las probabilidades
:t rn diaqrama de ó"'rbol como el siguiente'.
A
Pr(81)Pr(Al81)
A'
Pr(81)Pr(A'lB1)
A
Pr(82)Pr(AlB2)
Ac
Pr(82)Pr(A'lB2)
A
Pr(8,)Pr(AlB")
Pr(8")Pr(A'lB")
rsta dispctsiciórr de los datos facilita la rcaiización de los cálculos ya que
únicamente se debe realizar
-na slrma de los resultados en las ramas de interés

Ejer.:rIos

l. En una oficina hay 6 computador¿rs de marca y 4 ciones. La probabiliclad de que al utilizar una
mác1lrina, ósta encienda correctameirte es 0.95 para las de marca y 0"8 para las clones. Un em-
pleado utiliza aI azar una computadora, hallar la probabilidad dc que se encienda correctamente.
.4oluci,ón: Definamos los eventos:

.3)
A: el empleado ul,iliza una máquina de marca,
B: el crnpleado utiliza una máquina ción,
C: la máquina enciende correctarnente.
72 Capítulo 2. EI Concepto de Probabilidad

Sc ticrrc,
4
PL(A) :*:,,0, Pr(ll) :r0:,,.n.
Pr(ClA): 0.95, Pr(ClB): 0 8.

Si reprcsent¿rmos las probabilicladcs crr un ditrglama cle árbol se tiene:


C
PL(A) Pr(ClA) : (0 6)(0.e5)

Pr(B) Pr(ClB) : (0.4)(0.80)

Por la fórmula de la probabilidad completa,

Pr(C) : Pr(A)Pr(ClA) + Pr(B) Pr(ClB)


: 0.6 x 0.95 * 0.4 x 0.8 : 0.89.
2. Dos máquinas envasan gaseosa de manera automática, resultando que la primera envasa el doble
qrre la segunda. La primera máquina envasa el 60% de las botellas con Ia cantidad exacta y
la segunda el84%. Una botella tomada del transportador resultó llena con Ia cantidad exacta.
Hallar la probabilidad de que haya sido envasada por:
a) la primera máquina; b) Ia segunda máquina.
Sohtción: Designenos por eventos:
A: la botella está llena con la canticlad exacta;
81: Ia botella ha sido envasacla por Ia primera rnáqr-rina;
82: la botella ha sido envasada por la segunda rnáquina.

a) Se tiene
Pr(81) : j,2I Pr(82) : :.
La probabilidad condicional de que la botella contenga la cantidad exacta, si ha sido en-
vasada por Ia primera máquina es

Pr(AlB1) :0.6.

La probabilidad de clue la botella contenga la cantidad exacta, si ha sido envasada por la


segunda máquina, es
Pr(AlB2): 0.84.

Por tanto, la probabilidad de que la botell¿r tomada aI azar contenga la cantid¿d exacta es

PL(A) : Pr(81)PL(Al81) +Pr(82)Pt(AlBz)


: 21
5x0.6+j"0.84:0.68.
La probabilidad del evento <<se escogió nna botella con Ia canticlad e\acta llcna<ta por la
plimera máquina>> es igr-ral tr
2
Pr (81) Pr(Al81) _ =3 X 0.6 _ ri-,
rLl
Pr(.ts114):
Pr(A) 0.68 i;
2.8. Probabilidad cornpleta y fórmula de Bayes 73

1-,) Ltr prcibttbilidtrd del cr¡cnto <se escogió un¿r botcll¿r r:on la cantidad exacta llcuada poi' Iir
segurrcla má<¡rirrir>> es

Pr'(82) Pr(AlI]2)- o'84


Pr(BzlA): ''
'l i "
- " o.o, -
T

É 17.

Este resultado tarnbién se puede calcular eurpleando cl concepto dc evento cornl lerlentario.

Err trna ciudad, el 25% de los habitantes son ancianos, el 35 % adultos y ei 40 % sorr liños. Se
sabe que la glipe afecta al5% cle Ios ancianos, al4To de los adultos y al2% de los rriños.

a) Calcular la probabilidad de que un habitante, seleccionado aleatoriamente, tenga gripe.


b) Si un habitante tiene gripe, ¿cuál es Ia probabilidad de que éste sea anciano o niño?

Solución: Designemos los eventos:


A: el habitante es anciano. D: el habitante es adulto.
l/: el habitante es niño. G: la persona tiene gripe.

oble a) Si utilizamos el diagrama de árbol tenemos:


tay
G
cta. Pr(.4) Pr(GlA) : (0.25)(0.05)

Pr(D) Pr(clD) : (0.35)(0.04)

Pr(N) Pr(GlN) : (0.40)(0.02)

Ahora, basta sumar los resultados parciales en las ramas para obtener el resultado deseado:

Pr(G) : Pr(A)Pr(GlA) +Pr(D)Pr(clD) +Pr(r/)Pr(clr/)


: 0.25 x 0.05 + 0.35 x 0.04 + 0.4 x 0.02: 0.0345.

La probabilidad de que un habitante de la ciudad tenga gripe es del3.45r/o.


¡r Ia b) Por la fórmula de Bayes:

: Pr(A)Pr(GlA) _ 0.25 x 0.05 t25


Pr(,alc)
ta es
Pr(G) 0.0345 345'
Pr(r/lc) : Pr(.nü)Pr(Gl.nr) _ 0.40 x 0.02 80
Pr(G) 0.0345 345
Consecuentemente,

or l¿r
Pr(,4u¡/lG) : Pr(AlG) +Pr(.n/lc)
r25 80
345+3*:0'594'
La lrlobabilidad de que si urt habitante tiene gripe, éste sea anciano o rriiro, es clel 59.4%.
74 Capítulo 2. EI Concepto de Probabilidad

4 EI 35'/r, clc los ct'óclitos clttrt rtt<-ltger rtrr banc<l es par¿r vivicncla, eI 50%, ltara pr.ochrc:cióu y el r'esto
(r()llsittlllo. R,cstrlt¿rrr lltot()sos r:l 20(X, tk: krs cl'írtlit,cts
l)¿r1 ¿i ltrua vivic¡r,la, el l5%, rlc los clérlitgs
lrillrr ¡>r'orlrrcrción y t>l 70c,4, r[c Ios cr'éditos I)¿i,t'a c:orrsurr]o.

a) Dr:tcrrnine la probabilidad de quc uu crédito elegido al azar', sc pague a tieurpo.


1;) La plobabilidad de que urr crédito c¡-re ha resnlt¿rdo en rnora) haya siclo otorgaclo para Ia
ploducción.

Solución: Designemos los eventos:


1/: el crédito es para vivienda. P: cl crédito es para producción.
C: el crédito es para consumo. A,[: e] crédito está en mora.

a) Tengamos presente que el evento <<el crédito se paga a tiempo> es el complemento del
evento <el crédito está en mora>; entonces, buscamos Pr(M.).
Por la fórmula de la probabilidad total,

Pr(M) : Pr(MlV) Pr(y) +Pr(MlP)Pr(P) +Pr(MlC)Pr(C)


: 0.2 x 0.35 + 0.15 x 0.5 * 0.7 x 0.15 :0.25.

De manera que Pr(M") : t - Pr(M) - 1 - 0.25 : 0.75.


b) Por la fórmula de Bayes,
Pr(P)Pr(MlP)
Pr(PlM)

2.9. Ejercicios
1. Sean A y B dos eventos con Pr(A) # 0 V Pr(B) 10. Demuestre que

Pr(A n B) : Pr(B)Pr(,alr) : Pr(/) Pr(BlA).


2. DemuestrequesiAyBsoneventosindependientesysiAeBentonces,pr(B) :lopr(A) :0.
,
.). Se consideran los eventos Ay B tales que Pr(,4) : pr(a) : p.(A aB):i.catcule:
]; ];
a) Pr(AlB); c) Pr(A"lB); e) Pr(,4'lB"):
b) Pr(BlA); d) Pr(B"lA); f) Pr(8" --l').
4. Srrponga que un punto es elegido aleatoriamente en el cuadrado unitario. Si se conoce que el
pttntoestáenelrectángulolimitado porgl - 0,A:I,tr:0y r:]. autteslaprobabilidad
"
cle que el punto esté en el triángulo limitaclo por y:i,,*:IU,*.:
l,
5. Sea Q: {(r,a)/0 <r 1I;0<g < 1} el espacio rnuestral de un fenónrerro aleatorio. Calcule
Ia probabilidad de los eventos:

a) A:{(",ü101r <t; 0<a<Ll2};


b) B: El triángulo limitado por las rectas r:0;A:0; g:I - t:
2.9. Ejercicios 75

.StO c) ¿.Son indepcndicntes los cvenlos A v B?


tOS
En el crrach¿rdo uniclacl ser cr¡rrsi<leran los siguientcs cventos:
A: El triángulo lirnitado por z:0, A: L, A: x: +713.
B: E1 triángulo limitado por r :0, a :0, !,/ : 7 - r.
rla
a) Halle PL(B \ A), Pr(BlA) y Pr(A I B'');
b) Pruebe si A y B son independientes
Un inspector debe seleccionar a un trabajadol cle entre 4 aspirantes numerados del 1 al 4. La
selección Ia lleva a cabo mezclando los números y tomando uno aI azar. Sean: A el evento <<se
seleciona al trabajador 1o al 2>>; B, el evento <(se selecciona al trabajador 1o al 3>>; y C, el
del evento <<se selecciona el trabajador 1>. ¿Son independientes: Ay B?;b) Ay C?
")
Se lanzan dos dados, ¿cuál es la probabilidad de que en los dos dados salga el 3, si se sabe que
la suma es 6?

En una biblioteca hay B libros de literatura de ciencia fi.cción, 3 de los cuales son de Isaac Asimov.
La bibliotecaria toma al azar 2 libros. Determine la probabilidad de que ambos libros resulten
ser de Isaac Asimov.

10 La Empresa de Correos ha determinado que el 70% de los paquetes enviados al exterior no llegan
a su destino. Dos libros se pueden enviar separadamente o en un solo paquete. Para cada una
de las dos formas de envío postal, encuentre:

a) la probabilidad de que ambos libros lleguen a su destino;


b) la probabilidad de que al menos un libro llegue a su destino.
11. Suponga que el 5% de todos los hombres y el 0.25 % de todas las rnnjeres sufren daltonismo.
Una persona escogida al azar resulta ser daltónica. ¿Cuál es la probabilidad de que esta persona
sea un hombre? (se considera que la cantidad de hombres y mujeres es igual).

t2. El 35% de los créditos de un banco es para vivienda, el 50%o para industrias y el 15 % para
consumo. Resultan morosos eI 20To de los créditos para vivienda, el 15% de los créditos para
industrias y el 70 % de los créditos para consumo. Calcule Ia probabilidad de que se pague un
crédito elegido al azar.
1t
1J En una exhibición de arte hay 12 pinturas de las cuales 10 son originales. Un visitante selecciona
una pintura al azar y decide comprarla después de escuchar la opinión de un experto sobre la
autenticidad de la pintura. El experto está en lo correcto en 9 de cada 10 casos, en promedio.

a) Dado que el experto decide que la pintura es auténtica, icuál es la probabilidad de que él
no se equivoque?;
b) Si el experto decide que Ia pintura es una copia, entonces el visitante la devuelve y escoge
Le el
otra, ¿cuál es Ia probabilidad de que Ia segunda pintura escogida sea original?
dad
14. Hay una epidernia de cólera (C). Consideramos como uno de los sÍntomas la diarrea (D), pero
este síntoma se presenta también en personas con intoxicación (1) , e incluso en algunas que no
tengan nada serio (N). Las probabilidades son:
cule
Pr(DlC): 0.99; Pr(Dl1) : 0.5; Pr(Dl,n/) : 0.004

Se dan los siguientes porcentajes: el 27odela población tiene cólera y el 0.5% intoxicación. Si
una persona tiene diarrea calcule la probabilidad de que tenga cólera.
76 Capítulo 2. EI Concepto de Probabilidad

15. Urta pru<tlril cl vitrts del SIDA eu la sangle cl¿ el cliagnóstico correcto coll urra pro-
l)¿tl¿r rlctct:t¿rt
babilicl¿rcl rlcl 9ll %. Sogrin clatos módicos) lrrio clc carla 2 000 habitantes cl<ll país. en prornr:clio, es
poltaclol rlrtl virtts. Da<lo qrte la pnrebzr fire positivtr I)ar¿r una persorl¿1) 1',clr¿il es la proira.lriliclacl
cle que cll¿r, r'e¿lnrcrrte tcnga Ia enfermed¿rd?

16. Utra emplesa financiera opera en las tles regiones del país: Costa, Sierra y Arnazonía. El 50 %
de las opeLaciones se realizan en la Costa, el 40 To er Ia Sierra y el resto en la Amazonía. Se
ha estimaclo, derlrido a la larga experiencia, el porcentaje de clientes qne no pagan sus deudas en
cada una cle las regioues. Para Ia Costa es del I%o, para la Sierra deI 2To y para la Amazonía
del 8 %. Si la empresa tiene 1000 clientes, determine cuántos pagan sus deudas puntualmente.

17. Una encuesta revela que el 70% de la población tiene estudios secundarios, de los cuales eI 72%c
no tiene trabajo. Del 30 '70 q:ue no tiene estudios secundarios , eI 25 % no tiene traba.jo. Calcule:

a) El tanto por ciento de la población que no tiene trabajo;


b) La probabilidad de que una persona elegida al azar tenga estudios secundarios entre las que
no tienen trabajo.

18. De 200 aspirantes a un cargo se conoce Ia siguiente tabla respecto a experiencia en funciones
similares y la formación académica necesaria

Con formación Sin formación


Con experienc a 16 32
Sin experienc a 24 128

Halle las probabilidades de encontrar una persona:

a) con experiencia y con folmación; d) sin formación dado que no tiene experien-
b) con experrencra; cia.
c) con experiencia dado que tiene formación;

19. En una investigación sobre el crédito bancario a trabajadores agrícolas se obtu\¡o el siguiente
modelo, en el que se califica al campesitto como propietario o no propietario del terreno que
cultiva y si mantiene o no mantiene deudas con los bancos.

Propietario
Deudor SI NO
SI 12 28
NO 20 64

Calcule la probabilidad de quc:

a) un campesino mantenga deudas con Ia banca;


b) un campesino sea dueño dei terreno que cultiva;
c) un carnpesino sea propietario, dado que no es deudor;
d) un campesino sea deudor, dado que es propietario del terreno.

20 A 100 empleados se les hizo un examen para determinar su destreza mar,'.,:-- C''ralenta clc los
ernpleados er¿n hombles. Scsenta de los empleados pasaron el exameli 1., _: .. ¡ ¡.lcanzaron rur¿l
2.9. Ejercicios 77

ro- calific¿rcióu rriayot que cicrto rrivcL Pledetr:r'ruil¿rdo cle a¡rr'<x,'eclrarnictrtci. L¿r cl¿rsific¿-Lción entre
CS
hornll'ers y rnujer-cs fue Ia sigrrielrte:
[¿cl
Honrlrr.cs (11) N{u,lcres (,4'1)
Pasaron (P) '24 36
)% No pasarou (.Ay') r6 24
Se
ien Sr-rponga que se selecciona al azar un eurpleado dc los 100 que hicielon el examen.
lnía
Lte. a) Calcule la probabilidad de que el empleado Laya ptrsado y sea hornbre;

2%
b) Calcule la probabilidad de que el emplead., sea hombre dado ctrtrc pasó el examen;

ule: c) ¿Son independientes P y H?;


d) ¿Son independientes P y M?

q.ue
2I. Los empleados de la compañía Crrz del Sur se encuentran distribuidos en 3 divisiones: Admi-
nistración, Operación de Planta y Ventas. La siguiente tabla indica el núrmero de empleados en
cada división, clasificados por sexo.

ones Mujeres (M) Hombres (-F1)


Administración (A) 20 30
Operación (0) 60 r40
Ventas (V) 100 50

Si se elige un empleado al azar,

a) ¿cuál es la probabilidad de que sea mujer?, ¿y de que trabaje en ventas?;


b) ¿cuál es la probabilidad de que sea hombre y trabaje en la división de Administracíón?;
c) ¿cuál es la probabilidad de que trabaje en la Operación de Planta si es mujer?;
d) ¿,cuál es la probabilidad de que sea mujer si trabaja en Ia división de Ventas?;
e) ¿Son los sucesos V y H independientes? ¿y los sucesos Ay M?

úente 22. Dada la siguiente tabla que indica el comportamiento respecto del hábito de fumar en un grupo
) que de 100 estudiantes que fueron averiguados.

Hábito
Sexo No fuma Fuma Ex-fumador TOTA
Hombre 16 10 24 50
Mujer 30 16 4 50
TOTAL 46 26 28 100

a) Encuentre las distribuciones de las variables <<sexo>> y <hábito de fumar>>;


b) Encuentre las probabilidades de los eventos: <<la persona fuma>> y <<la persona fuma, dado
que es mujer>>;
c) ¿Son independientes los eventos <<ser rnujer>> y <<fumar>>? ¿Por qué?

23. Del total de socios de un b, son hornbre, u ? .on profesionales. Además,


"lt I *0" las mu.jeres
J
soll lro ¡rrofcsiorrtrlcs. S" a? azal' uu ,r'ri"rntrr'3 a"l .tut-,,
"lig"
de los a) calcule la probabilidacl de que sea hornbre y profesional;
lt Lul¿r b) calcule la probabilidad de qne sea hombre, dado que es profesional;
'"' r ii-- -I. - -. ar ¡

78 Cipítuto 2. El Concepto de Probabilidad

c) Deterrline si sott irrdcpendierttes los evcntos <sel mujcr>> y <<no ser'profesional>>.

24 Ertttt¿tfábric;a. el 707o clcloscmpleadossonlojanos. Decntrcloslo.jtrnos, cl 50%sonhombrcs,


mientras qr.re de los no lojanos, sólo son hombres el 207o.

a) ¿Qué porcentaje de empleados no lojanos son mujeres?;

b) Calcule la probabilidad de que un empleado de Ia oficina sea mujer;


c) Fernando trabaja en dicha oficina. ¿Cuál es la pfobabilidad de que sea lojano?

25. En un paÍs hay 4 partidos políticos que se dividen la opinión pública. Se sabe que:

El 35% de la población adhiere al partido I.


EI SI% adhiere al partido II.
El28% adhiere al partido III.
El6% adhiere al partido IV.

Entre los adherentes al partido I, un 36 % corresponde a personas con ingresos inferiores a dos
salarios mínimos. Entre los adherentes al partido II, esa proporción es del 52'/o. Para el partido
III es un 42V0, y para el partido IV es 11%. Si se elige una persona al azar y resulta tener un
ingreso mayor a dos salarios mínimos, calcule la probabilidad que sea adherente al partido I.

26. La señora Sonia se fue de viaje y encargó a su hijo, Pablo, que riegue el rosal. La probabilidad
El rosal está en un estado inseguro:
", ].
de que Pablo olvide regar el rosal durante su ausen"iu
3
si se riega tiene igual probabilidad de secarse que de no secarse) pero solamente tiene un 0.25 de
probabilidad de no secarse si no se riega. Después del viaje Sonia encuentra el rosal seco, ¿cuál
es Ia probabilidad de que Pablo no lo haya regado?

27. Se estima que sólo un20To de los que compran acciones en Bolsa tienen conocimientos bursátiles.
De ellos el 80 % obtienen beneficios. De los que compran acciones sin conocimientos bursátiles.
sólo un 10% obtienen beneficios. Se desea saber:

a) El tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios;
b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha obtenido
beneficios, ¿cuál es la probabilidad de que tenga conocimientos bursátiles?

28. En un supermercado el 70 % de las compras las realizan las mujeres; de las compras realizadas
por estas, el 80 % supera los 20 dólares, mientras que de las compras realizadas por hombres sólo
el 30% supera esa cantidad.

a) Elegido un comprobante de compra al azar, ¿cuál es la probabilidad de que supere los 2C


dólares?;
b) Si se sabe que el comprobante de compra no supera las 20 dólares, ¿cuál es la probabilidac
de que Ia compra haya sido hecha por una mu.jer?

29. En una universidad existen tres facultades: A, B y C. En A hay matriculadas 150 chicas y 5[
chicos; en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos.

a) Calcule la probabilidad de que un estudiante, elegido al azar, sea chico;


b) Si un estudiante elegido al azar resultara ser chico, ¿cuál es su facultad más probable?
)r-i;!:..r-rnr.- -;t j\--ii-r5v:--r- i_--: -:-=-rr-- l-
-.'

-i-
2.9. Ejercicíos

30. E¡tr.e los cinco rrs¡tirantes a un calgo cle geleute, a <los se ios considera excelentes y a los riernás
se les consicler'¿r bucnos. Para una entrevista se escoge al azal a dos de los cinco. Calcule l¿r,
probabiiidacl de que se esco.ia:

a) a los dos excelentes;

b) por lo menos a uno de los excelentes;


c) a los dos excelentes dado que se sabe que por lo menos uno de los seleccionados es excelente.

31 Se dispone de dos métodos A y B para enseñar una destreza manual. El índice de reprobados es
del 20 To para el método A y 10 To para el método B. Sin embargo, el método B es más caro por
Io que solo se le usa el 30 % del tiempo y el A el otro 70 %. A un trabajador se le adiestra con
uno de los d.os métodos, pero no puede aprender en forma correcta. ¿Cuál es Ia probabilidad de
que se le haya adiestrado con el método A?

32 En los exámenes de ingreso a una universidad cada candidato es admitido o rechazado de acuerdo
a si él ha aprobado o reprobado la prueba. De los candidatos que realmente son capaces' el 80 %
pasa la prueba; y de Ios que no son capaces, el 25To pasan Ia prueba. Dado que el40% de los
dos candidatos son realmente capaces, encuentre Ia proporción de estudiantes capaces que ingresan
ido a la universidad.
un
JJ Según datos de investigaciones genéticas se ha establecido que: los padres de ojos claros y los
hijos de ojos claros constituyen el 5To de las personas estudiadas; los padres de ojos claros y loB
dad hijos de ojos oscuros el 7.9 %o; los padres de ojos oscuros y los hijos de ojos claros el 8.9 %; los
padres de ojos oscuros y los hijos de ojos oscuros eI78.2Vo. Halle la probabilidad de que:
uro:
5de a) el hijo sea de ojos oscuros, si el padre es de ojos oscuros;
cuál
b) el hijo sea de ojos claros, dado que el padre es de ojos claros.

,iles. :l-1 Como un acto de buena vecindad Dios y Satanás acordaron un intercambio cultural entre el
:iles, Cielo y el Infierno. Demonios del Infierno van a vivir en el Cielo, mientras que ángeles del Cielo
van a vivir en el Infierno. Los demonios tienden a no decir la verdad más frecuentemente que los
ángeles. Los demonios mienten el 80 % de las veces y los ángeles mienten el20% de las veces (¡en
estos días es difícil encontrar ángeles buenos!). Después del intercambio, la proporción entre los
demonios y ángeles en el Cielo es 2:3. Mi amigo José murió y fue al Cielo. Él encuentra a una
rnido
persona en la calle y Ie pregunta donde encontrar un baño para hombres. Desafortunadamente,
Ios demonios y los ángeles no se pueden distinguir por su aspecto físico. Deseamos determinar:
:adas
; sólo
a) ¿Cuál es la probabilidad de que Ia respuesta haya sido una verdad a la pregunta de José?
b) Dado que la respuesta fue una mentira, ¿cuál es la probabilidad de que haya sido dada por
un demonio?
os 20
.)=
)'J Una compañía de tarjetas de crédito encuentra que cada mes el 50% de quienes poseen la tarjeta
ilidad cubren totalmente sus deudas.

a) Si se seleccionan dos usuarios al azar, ¿cuál es la probabilidad de que ambos paguen total-
;y50 mente su deuda ese mes?;
b) Si se selecciona un cliente al azar, ¿cuál es la probabilidad de que dicha persona pague
totalmente sus deudas en dos meses consecutivos?
c) ¿En qué hipótesis se apoyó para responder a los dos apartados anteriores? ¿Le parece que
ef alguna de ellas no es razonable?;
80 Capítulo 2. El Concepto de ProbabíIidad

<1) Urr cxarrrerr rn¿is <1et¿rllaclo der los rcgistlos cle la conipañía rnuestr'¿r quc el 90 % cle los clicutcs
que l)agau t<it¿.rllneut,e un¿r cLr<lrrt¿l nrensual tarnbién lo hacen al mes siguiente v <1uc sólcr
eI 70%, clc los cluc l)o l)ag¿]lr tot¿r.lrnente en llrl rnes cttl-¡ren totalmente srr dcrrcl¿ al mes
siguierrte. Calculc, cn este c¿so. la probabilidad pedida en b).
e) Con las hipótesis de d), calcule la probabilidad de que un cliente seleccionado al azar no
pague totalmente ningr-rna cle las dos cuentas rnensuales consecutivas;
f) Calcule Ia probabilidad de que sólo pague una de las dos cuentas.

36 Basándose en varios estlrdios, una compañía ha clasificado, de acuerdo con Ia posibilidad de


crrcorrtrar petróleo, las formaciones geológicas en 3 tipos. La compañía pletende perforar tr.n
pozo en un determinado lugar, al que le asignan las probabilidades de 0.35, 0.40 y 0.25 para
los tres tipos de formaciones, respectivamente. De acuerdo con la experiencia, se sabe que el
petróleo se encuentra en Lrn 40% de las formaciones de tipo I, en un 20% de las de tipo II y en
un 30 % de las de tipo III. Si tras perforar el pozo, la compañía descubre a su pesar que allí no
había petróleo, determinar Ia probabilidad de que ese lugar se corresponda con una formación
del tipo II.

37. El cardinal de un espacio muestral finito es rn. Los eventos A y B son independientes y cumplen
que:

Pr(A) +Pr(B):p y Pr(A n q :+


Halle la cardinalidad de A.

38. Demuestre que si se tienen Bt, Bzr..., B, eventos mutuamente excluyentes, tales que su unión
es el espacio muestral, ertonces se tiene que

fi,:r e'1an¡a) : t.
Capítulo 3

Variables Aleatorias, Esperanza y Varianza

(Jna uariable aleatoria es el alma de una obseruación


(Jna obseruación es el nacimiento de una uariable aleatoria
D. G. Watts, (1991)

:- este capítulo introduciremos el concepto de l'ariable aleatoria, que nos facilitará


Ia realización del
.-álisis de las principales características de los experimentos aleatorios y permitirá definir las Ieyes de
::,,babilidad que ellos siguen, de manera muy general'

3.1. Variables aleatorias


de una
- resultado de una prueba aleatoria no siempre es un número; por ejemplo, en el lanzamiento
de los eventos Ie podemos
-:,neda los resultados son <<cara>> y <<escudo>>. Sin embargo, a cada uno
que rigen Ia probabilidad.
-.rciar un número y sobre ellos aplicar las leyes
l.-,nsideremos la definición clásica de función real, donde la cantidad y se llama función
del número
: si a tod.o valor z de la variable independiente, le corresponde un valor 3r de la variable dependiente'
j- esta idea la extendemos, se define una función donde la variable independiente no sea un número
:=¿l sino que, en nuestro caso, sea un espacio muestral'

Definición (de variable aleatoria) Se llama variable aleatoria a cualquier función definida en
':: espacio muestral f) con recorrido en un subconiunto finito o infinito de R.

- decir, Ia función

X:Q --) R
u F-f X(r)

--,nd,e a es un evettto) es Ltna variable aleatoria' Figura (3'1)'

81
82 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

Figrira 3.1:

Ya hemos estado trabajando con variables aleatolias sin leferirnos cxplícitarncnte a ellas; por ejernplo,
al arrojar un dado son posibles seis casos. Designando por o¿ ei evento element¿l consistente en saiir
¿ puntos, tenemos:
CI : {cuf ,u)2,u)Srw4rrr'5rw6}.

Lavariable aleatoria X(rn): i identifica al núrmero z de puntos obtenidos al lanzar cl dado, se define
así:

X(rt) : 1, corresponde al evento elemental {aparece un punto},


X(rz) : 2, corresponde al evento elemental {aparecen dos puntos},
X(rs) : 3, corresponde al eveuto elemental {aparecen tres puntos},
X(rs) : 4, corresponde al evento elemental {aparecen cuatro puutos},
X(rs) : 5, corresponde al evento elemental {aparecen cinco puutos},
X(ra) : 6, corresponde al evento elemental {aparecen seis puntos}.

Al arro,jar una rnoneda tenerlos dos eventos: C: <<sale cara>> o -E: <<sale escudo>>; definimos la variable
aleatoria X, que cuenta el número de caras aparecidas en una serie de lanzamientos, de la siguiente
manera:

x(r) : 1, si <<sale cara>>;

x(r) : 0, si <<sale escudo>>.

La definición de la variable aleatoria depende del fenómeno a investigar.


Notación. Para evitar una escritura engorrosa, a los cu tales que X(cr-,) : ú se los notará como X : t.
La probabilidad Pr({o I X(r) : ¿}) se pondrá como Pr(X : ú). De manera análoga se escribirá
la Pr({c..'/ X(u) e (o,b]}) como Pr(n < X < b). Y así para cualquier intervalo convenierrtemente
defiuido.

Las variables aleatorias se clasificanten d'isc'retas y co'nti,rtuas, de acuerclo a los v¿lores qne ellas tomen.

3.1.1. Variables aleatorias discretas


Definición (de variable aleatoria discreta) La variable aleatoria en cLr\ro recorrido el conjrlrrto
de los pr-rntos que tieuen probabilidad estrictarnente positiva es finito o infinito nunrerable se llarna
valiable aleatoria discreta.

Si el recorrido de la variable aleatoria X es el conjunto de números {rr,rr,....x,....}, ." tiene que


Pr{X:z¿}>0.
3.7. Variables aleatorias 83

\rkrtniis, ti p,, : Pr'(X : x:¿). cs lir ytt'tillzrlrilirl¿rrl <lc tlrtc X tonrc <rl vtlol ru¡, sc ctuttplc <¡ue

'PI +'P)+ "' -1-


1),, l "' - 1.

rn ottas palablas, X os disc:r'cta si rrna unirlarl rkr ur¿ls¿r clc plobabilicl¿rd cst¿i <listribrricla sobre el e.ie
-=al, cc'rrLcerrtránclose rrri¿l rn¡rs¿r I)ositi\'¿1 err cacla prrut,o <le c:ielto c:on.jrrnto finito o infinito nrrrnerable y
.:- los restaltes purrtos uo l)¿ry lnas¿r.
-,-¿r'iables
aleatorias discretas sorr usualmente (pelo no rrecesariamente) conteos de ciertos elementos'
- -,r ejemplo, el nirmero de hi.jos de una familia, el rniulcro de ventas realizadas por Lrn almacén, etc.

- la vez qlre se ha determinado las probabilidades ¿isociadas a cada uno de los rralores de nna variable
-:atoria discreta, es ritil ponerlas en forma dc una distribu.ci,ón de probabilidad, que es una tabla con
:,,ios sus posibles valores y sus correspondientes probabilidades, como la siguiente:
f 1 2 n
Pr(X : r) Pt PZ P,,

Ejemplos

- Consideremos la prueba consistente en arrojar tres monedas. Tenemos qr.re

a : {{ccc}, {cc E}, {c E E}, {E E E}}.


Si X es la variable aleatoria que cuenta el nirmero de escudos resultantes, X puede tomar los
valores 0, 7, 2 y 3. De rnanera que

Po : :0) : PL({CCC}): 1
Pr(X
8'
t
J
Pt : Pr(X: 1) : PL({CCE}): g'
3
Pz : Pr(X : 2) : Pr({C EE}) :
8'
Ps : Pr(X : 3) : Pr(iE EEI) : 1
-:.
8

Se tiene que su ley de probabilidad es

T 0 1 2 3
Pr(X : r) 1/8 318 318 r18

y se cumple que
1331
Po*h-lPz+Pt : B + d + S + g : 1

Consideremos la sigrriettte plueba: se dispara corr nna pistola a un blanco situado a cierta dis-
tancia. Nos interesa analizal los eventos uJ¿: <<rlúmero de balas empleadas por un tirador hasta
(lne se da en el lrlarrco por prirnelavez>,.
Definimos la variable aleatoria X: <<núrnero de balas gastadas>>:

EI corrj nnto de posibles valores que puede tc¡mar Ia variable aleatoria es { 1, 2,3, . . .} .

Este es un conjunto infinito numerable, pues no se conoce un máximo para el número de balas
empleadas que pudiera ser extremadamente grande para una persona con muy mala puntería-;
es decir, X es una variable aleatoria discreta definida sobre un conjunto infinito numerable.

Más adelante se demostrará que también se cumple que i p¡: I col p¿: Pr{X : ¿}.
i:r
84 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

Definición (de función de distribución) Sea X una variable aleatoria discreta, la función leal
-F tal que
VÚ e R, F(t): Pr(X < ú)

se denomina función de distribución de Ia variable aleatoria X.

Propiedades

1. La función F es creciente, con : 0V : 1.


,fT.".F(¿) ,ffL,P(t)
2. F(¿) : Pr(x S t) :
Prp¡
3. Pr(a< X<b):F(b) -f.(o).
4. Pr(o ( X <b): F'(b) - F(") *Pr(X: a)'

Observación. La probabilidad Pr(X: a) se calcula mediante Pr(X: a): F(a) - F(o_), donde
F("-) es el límite, por la izquierda, de la función de distribución en el punto a. Este concepto tiene
importancia para el cálculo de las probabilidades en los puntos donde ,F tiene saltos.

Ejemplos

1. Continuando con el ejemplo del lanzamiento de tres monedas, se tiene que


1
F(0) : Po: ,-,
F(1) : po+pr:j*::;,
F(2) : potpttpz:*.:*: :;,
F(3) : po:-pt-rpz+o.::*3*3** :t
Con esto, Ia función de distribución es

0, si ú<0;
Il8, si 0(ú<1;
F(t) : Il2, si L<t<2;
718, si 2(ú<3;
1, si ú23.
Los gráficos de las funciones de probabilidad y de distribución se dan en la Figura 3.2:

F(t)
0.4 I F
H
0.3 0.75
0.2 0. H
0.1
o€

Figura 3.2:
3.1. Valial-¡ies aleatorias 8Ír

Elr rrrL¿r lltrr<:l-,ir rkt c:¿tli<l¿r<l rk. ttrr ltLorltt, l,r sl tillrr'(lllr'{'n tLrt [o1<: tlt¡ l') Piczas lr¿n'!i ].,1[tttttt.
t¡ .1 rlcf<r<:tlros¡rs. L)rr cl rkrP;uliunollt() rlc <:r¡rrtlol tlt' r:irlir[¿rrI st: lr¡rrr¿t tur¡t nrttcsl t¿l tlc ]] lriczits
Clorrstlrril l¿r lct'rkr l¿r r'¿rriirlrlc alc¿rtoLi¿r <<L¡rirrrr:Lo rl<r lrir:z;ts lrlrcLr,lsr,.
Sol,tLr:irin,: La r'¿ilialrlr: a,lc¡rtolia crL crLcstirilr prr<rrlc torrrar'krs r'¿rlolr.s 0. 1.2 \¡,J: rIctr:nnirolnos
srrs prol)¿rl )ilir [¿<ics.

El llrill<:r'<.1 r[c srrbc:onjrrrrtos cl<l 3 c]crnerrtos rilrtcrrilrlcs rlc rrrr c;ou,jrtrtto <[c 12 clrlurcrrtos cs C:fr.
que es Card(O).

r Si X:0, cutolrccs tocl¿rs las Piczas sou dcfcctuosas, lr¿iv C[ lorrnirs clc <:scogctlirs.
. Si ,Y : 1, crrtorrc:es 1 es lrucrr¿r y 2 sorr clefcctrros¿rs. c\istcu Cl f.rlrn,rs cle csc:ogt:t l:rs Piclzirs
buen¿ls v Cl de cscoger las clefectnosas) crrton(ies lr¿v C¡C; forur¿ts clc: cornlrilr¿rr l¿rs lrttett¿rs
y las defectuosas.
. Si X : 2,ltay C! conjuntos de las piezas buen¿rs y C] dc dcfcctuosas) p¿rr'¿-r, rrn total cle
Cl|6C| formas cle combinarlas.
. Si X: 3, hay C! cornbinaciones de piezas bueuas.

Entclnces,

Pr(X: O) : g: *, Pr(r : 1) : 9A9? ::.


ciz 55'
Pr(X: \:W:#, Pr(X:t):#:#
Lo qrre se lesune etr slr clistlibucirirt cle probabilicl;rcl:
A; loll l2l3

Para clefinir urr¿r variablc ale¿rtoriir no cs nccesario cxhil.¡il urr fcrtcirrrcrto ¿rleat<lrio pat'ticttltrr',
es suficiente clar ulla función cle probabilictad o cle clistlibucicln r¡re cr-rrnpla las plopic<l¿rclcs
enunciad¿rs.

3. La funcióu cle distribución de una


"'ariable
aleatori¿r Y se clefine rnocli¿rute:

si l,<-3;
si -3<ú<0;
si 0(t<2;
si ú>2,
Coustruil Ia tal-¡la de clistribución de probabilidacl clc )'.
Sol'ució¡t: De acuerdo a la definición de la ftrncióu cle clistribuciórr ¡roclenlos \'ol cluc l¿r r-¿rri¿rblc
aleatoria torn¿r los valoles -3,0 y 2.

/(-3) : Pr:(Y: -3) : F(-3) - F(-¡-) : + -,, :;,


,i(0) : Pr(Y:0) :r(0) -F.(0-):;- j:j,
.f (2) : Pr.()', : 2) : F(2) - F(2-) : 1 j: j
De rn¿tt¡cr¿r <¡te lrr t¿rbl¿-L clc clistlil¡trci<in cle ¡rt'olrtrl riliclacl cs

r l-rlo l2
Pr()':trlIl2 lll4lIl4
86 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

4. Un¿r variable ¿rleatoria X está dcfinida medi¿rnte lir siguierrte lcy de plobabilidacl

Jr l rlzl¡ | qI s

a) Determinar F(r).
b) Graficar f(r)y F(r).
c) Hallar: Pr(X:1), Pr(X < 1), Pr(X < 1), Pr(1 < X < 2), Pr(1 < X < 2), Pr(1 < X <2).

Soluci,ón:

a) Evidentemente, f'(r) :0pararlI,ahora


oSi11r12, F(r): pr : 0.3.
o Si2(r(3, F(r) : pt -f pz: 0.5.
¡ Si3{r14, F(r):pL+p2*ps:0.6.
¡ Si41r15, F(r) : h I p2* ps + p+ : 0.75.
o Sir)5, F(r) : h I p2 * ps + p+ I ps : I.
Es decir,
0, sir<1;
0.3, si 1( r 12;
F(r): 0.5, si2(r13;
0.6, si3<r14;
0.75, si4(r{5;
1, sir)5.
b) Los gráficos son:

Pr
F
0.
0. H
H
0.1 H
0.1 H

Figura 3.3:

c) Se tiene:

Pr(X: f) : F'(1) - F(1-) : 0.3 - 0: 0.3,


Pr(X < 1) : .P(1) : 6.3,
Pr(x < 1) : F(1) - Pr(X : 1) : 0.3 - 0.3 : 0,
Pr(l <X<2): F(2) - ¡'(1) : 0.5 - 0.3 :0.2,
Pr(1 < X<2) : F(2) -F(1) +Pr(X : 1) : - 0.3 + 0.3 :
0.¡ 0.5,
Pr(1 < X <2) : F(2) - F(1) - Pr(X : 2) :0.2 - 0.2 : 0.
3.7. Variables aleatonas 87

3,1.2. Variables aleatorias continuas

Definición (de variable aleatoria continua) La variable aleatoria ouyo recorrido es un intervalo
inito o infinito de R se llama variable aleatoria corrtinua.

También, se dice que Lrna variable aleatoria X es continua si para todo valor real r se tiene que

Pr(X: z) :0.
- sualmente, lasvariables continuas representan mediciones; por ejemplo, la estatura de una persona,
-l tiempo que se demora un programa en buscar un registro en una base de datos, la cantidad de
:¿ngre que tiene un animal.

Definición (de función de distribución) Sea X una variable aleatoria continua, Ia función real
F tal que
V¿ € R, F(t): Pr(X < ú)
=e denomina función de distribución de la variable aleatoria X.

Fropiedades

F es creciente, con .Iím F(ú) :


/+-oo
0y . lím
- l-*m F(t) : 1.

l. Pr(a< X <b):Pr(¿<X <b) :Pr(¿ < X < b) :Pt(a <X < b) :f'(b) - F(").

Definición (de función de densidad) La función de densidad de una variable aleatoria continua
-'t es una función real / que cumple:

)
") f (r) 0 Para cualquier valor z.

b) /A f@)dr:r.
c) Para cualquier intervalo A: lo,b], se tiene que

Pr(A) :Pr(¿<X<b) : f {') o'


.l.o

-,
-amos cómo estárr relacionadas las funciones de distribución y de densidad. (Ver Figura 3.4)

Teorema. Si F y son las funciones de distribución y de densidad de la variable aleatoria


/
:.spectivamente, ellas están ligadas mediante las igualdades

F(r):
l"*r@ot y f (*): F'(r).
88 Capít,tttra 3. Varían¡Jes Aleadorias, Espet'anza I \-ariattza

f {t}

Figura 3.4: Rel¿ición cntr-c las firncion<:s clc clclsidaci y c1e clistrilruc:iórr.

Tengamos presente qtte para el cálculo de plobabilid¿rdes se emplea la siguiente equivalencia:

¡b
Pr(a<X<q: I I(r)dr:F(b) -F(").

En las valiables aleatorias continuas es suficiente indicar la función de densidad o Ia función de dis-
tribución para que la variable aleatoria qr-rede completamente definida.

Ejemplos

1. Un¿r variable aleatoria X está defirricl¿r mediante Ia función de distribución

p¿lrir z < -1;


3 1
jt par¿r -1(r(;i
1t
uara .r: ) -.
' -3
/ 1\
Hall¿rr la probabilidaci cle clue la varial¡le aleatoria X torne un valor en el t'
interva ('' j/
Solr¿c'ión: La probabilidad de que X tome un valol en (a,b) es Pr(a < X <b): F(b) - F(").
Sia:0.b:1obt"r,"rnu,
ó

"'(0.".1)

2 L¿r fiurción de densidacl de una vali¿rble aleatoria está clada por /(z) : (\.e-s:L cn el intern,alc
(0,-) v f @): 0 fitera cle cste itttetvalo. Hallar' el v¿rlor de la constante cv para que /(z) as-
clefilricl¿r sc¿l unA función <le densid¡ld.

Sol.rt,ci,ón: Primero verifi<lrremr)s clue ./(r) > 0.


. En (-oo,0l no Lay ploblem¿l Pucs /(r) : 0.
3.7. Variables aleatorias

. En (0, oo) se debe tener f (") >- 0, es decir (\e-3* ) 0. Pero Vr € (0, rc), e t" > 0; entouces,
se dobe tener que a ) 0.

Ahora, verifiquemo. or,"


' /'* f (r)ctr:
.l-o."'
1, o
"". .lo/'- .,e-3*d.r: l.
La integral
/.ó f
o" -3"d, o
.lo "_J*d.r: lj"
: l'* .,
,lo* L3
-o.
3 [o-lJ
:T. a.

Consecuentemente, : tt entonces a : 3.
Í
Dada la función de densidad de la variable aleatoria continua X:
( o, sic(o;
f(*): { cosr, si0(r<rf2;
r dis-
I o, sir>rf2.
a) Hallar la función de distribución F'(r).
b) Determinar: pr (t = *. ;), e, (x ,;),"'(; <x <
#)
Solución:

a) Utilizando la fórmula F(z) : d,t:


.l:*JQ)
o Si r < 0, "f(r) :0, de manera que
rr
F(r): l_*Odt:0.
o Si 0 1r 1r12, f (x): cosrü, ento ces

F(r) : I¡o Oat+ |fE costdt:senr.


'(n). J-a Jo
o Si r > 7r/2, f (r) :0.,
n/2
F(r): 0dú: senr - 1.
l_*tü+ Io"/'costd,t* I_,, 0

La función de distribución es:

( o, sir(o;
F(r):l ';" ', si o < '<X,
I r, six>[.
b) Para calcular las probabilidades emplearemos Ia función de distribución.
r Pr(a < X <b) :F(b) - F("). Si ¿: I y U:[,
erval<¡ 6" 3
(r) así
: -"(á)
"'(á=".á) "(á)
: *" (á) : rfr1
2 -5
'"" (á) -
: 0.36603.
90 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

o Pr(X ) n) : 1- Pr(X . o) : 1- F(a).


,4Si o: 1'

"("'i) : '-'(;)
1-sen/1):
\ 4/
r-Jt2
_ 0.29289.
r 17tr
e Pr(a < X < b) : F'(b) - F(o), con ¿¿: vb-_.
3" t2

t.(;/ r s*<;) 112¡\


:'(#) -.(;)
:1-sen(;) :t-+
: 0.13397.

4. La función de densidad de una variable aleatoria ? está dada por f (t) : t-f, y /(¿) : O
"n(1,2)
fuera de este intervalo. Hallar las probabilidades:

a) Pr(0<?<1.8); c) Pr(? t 1.¡);


b) Pr(1.2<T<1.5); d) Pr(1.4<7<3).

Solución: Para el cálculo de las probabilidades utilizaremos la función de densidad.

a) Pr(0<?<1.8):

Pr(O<7<1.8) : l" Iudt:,loftüot*.1, f(t)


"I.8 rl 11 8
dt

: lo' * .1," (, - ;) dt: t iQ' -


oo, o ql,',"

: j lltt al' - 1.8) - o) : o.zz.


b) Pr(1.2<?<1.5):

Pr(1.2<?<1.5) : l' r 1.5


f{ua'
: l,',' (' -;) " : LQ'-',1,;
: ] lltr sl' - 1 b) - ((1.2)' - t.z)) : 0.255.

c) Pr(T > 1.5):

Pr(? > 1.5) : 1-Pr(?<1b) -1- ([:_odt+ ,,)


[," (t-;)
,-;U'-t) r-
] frrr ul'- r.s) - (1'- 1)]
l,':
t-f,O.rrl:o62b
3.2. Distribuciones de funciotres de variables aleatorias 91

,t) Pr(r.4<7<3):
r.1 r ¿

PL(1.4 <I < 3) : I fUl,tL: .lIt.¿ J()rt ),Lt


.l t.¿

_ t)',n+o
[,'^('-;)"* 1,'o
1.. ..

ilt'-2)-({r+)2- 72.

5. Hallar la función de densidad /(r) de una variable aleatoria cuya función de distribución es

'17

4'

Soluctón: Utilicemos la relación f (") : F'(").


):0
. Si r : 0, entonces /(r) : F'(r) : 0.
< 0, F(r)
. Si 0 1r 1I, ,@): sen 2r, entonces f (r): F'(r):2cos2r.
+
. Si r ,\,4' 16¡:1, entonces /(r) : F'(r):0.
Es decir,

f (r): { zcoszr' si 0 < 'lTn,


|. 0, caso contrario.

6. La vida útil de un elemento electrónico está dada por la función de densidad

( !"-,,r, si ú > o;
f (t): \ 0, '2

|. en Io demás;

donde ú es el tiempo (en horas). Calcular la probabilidad de que un elemento dure más de tres
horas, dado que ya ha estado en uso m¿is de dos horas.
Solución: Nos interesa Pr(? > 3lf > 2), que según Ia fórmula de la probabilidad condicional se
tiene:
Pr(?>3lT>rl :#fi;
porque Ia intersección de los eventos (7 > 3) y (T > 2) es el evento (" > 3). Entonces,

l'* | -rtz
Pr(? > s) _ ./r rt :- "-t1," _ e-rlz:
Pr(I > 2) -
0.606.
[* !"-* r'
.lz 2

3.2. Distribuciones de funciones de variables aleatorias

Sea g una función real cuyo dominio contiene el recorrido de la variable aleatoria X, podemos definir
-l-na nueva variable aleatoria Y mediante
y: g(X),
92 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

lo que quiere decir que, si la variable aleatoria X está definida según

X:O ---r ACR


u r-+ X(r)

y9por
gtB ------+ R conAe B
r r---' g(r)

la variable aleatoria Y se define por

Y : Q ------+ R
ul-----' Y(u): s6@)).

Si conocemos la ley de distribución F¡ de X, vamos a determinar la ley de distribución Fy de Y.

¡ Si X es variable aleatoria discreta,

Pr(I/: A):Pr(X : n¡),

donde A¡: g(r¿).

¡ Si X es una variable aleatoria continua. Supongamos que g es una función continua y estricta-
mente creciente en todo el eje real; entonces, existe la función inversa de g que la llamaremos l¿.
Ésta también es continua y estrictamente creciente, por lo que

A: g@) si, y solo si r: h(A).

Examinemos la definición de Fy:

Fv(t): Pr(Y < ú) : Pr(e(X) ! t).

Aplicando la función inversa a los dos miembros de la desigualdad del argumento de la última
expresión se obtiene
Pr(e(X) (ú) :Pr(X<h(¿)) : Fx(h(t)).
Luego, se tiene la siguiente equivalencia entre las funciones de distribución de X y de Y:
Fv(t): ¡k(h(¿)).

Si las funciones F¡ y h son derivables, se pueden derivar ambos miembros de la igualdad anterior,
empleando la regla de Ia cadena:

Fi@ : Fk(h(t)) .h'(t).


Ello nos conduce a la siguiente relación entre las funciones de densidad:

fv(t) : f x(h(t)) . h' (t).

Observación. Si la función g no es monótona en el intervalo de los posibles valores de X,


hay que dividir este intervalo en subintervalos tales que g sea monótona v aplicar el resultado
anterior.
3.2. Distribuciones de funciones dc valiables aleaúorias 9:]

Ejern¡rlos

1. Da<[a l¿l [rrrrc:iót¡ <lc <listlilrrr<:ión F¡ clc l¿r vari¿tll]cr ¿rlc¿rtoli¿t -\. hall¿rl l¿.rs ftttt<:i<.¡trcs rl<r rlisl tilrrrt iritr
<lc rkrusiclir<l d<l \" : u,X * b,
r' pala: a) rr, ) 0; lr) tr, < 0.
Soht.r:i.titt:

a) Sca \" : aX *b, o > 0. Tenenros:

Fv'(¿) : Pr(Ylú) :Pr(aX+b<¿)


: n'(" =+):r"(?)
Aclernás,
g(t) : at t b, h(L) : +, h'1t¡ : !,
También,
!t.(t):;r"(?)
b) Si y : aX *b, con a ( 0, resulta que g(ú) : at* b, que es continua, pero estrictamente
decreciente; sin embargo, podemos hallar Ia ftrnción de distribución de Y rnediante su
definición:

Fy(t) : Pr(Y<ú) :Pr(¿X+b<t)


: p,(x>¿-ü)-1-p,(x.4)
a) a)
\ \
a-
h.
: r - Fx"\ fL!)
a / +p, \ x: '-')
(
e' /
.

La función de densidad es

ft.o): Fí,(ü: -!,r* (")


Corrsidere la variable aleatoria Y : X2. Hallar su función de distribrrción.
Solu,ciór¿: Aquí, 9(r) : 12, función que no es stt'ictamente crecie¡te. Por clefinición tenemos:
Fv(t): Pr(Y ( ú) : Vr(Xz < t).
. Si ¿ < 0, el evento <<X2 ú>> es vacío; por tanto, Pr(X2 < ú) : 0, lo que implica que
Fl,(¿) :0.
r Siú20,

: -r/t).
Si F.v es coutiuua SC

<0;
>0.
Si lr.v <s rl<lrivable er rlcusiclad:

<0;
>0.
94 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

3. Detelntinar la ley de distribución de la variablc aleatoria Y : X2, si X está definid¿r ruerliarrte:

x I -s I -21 o | 2

Sol'ución: Como Ia variable aleatoria es discreta, basta aplicar la relación Pr(Y : A¿) : Pr(X :
ri), a cada uno de Ios valores que toma Y : X2. Entonces, tenemos que

v2 l(-¡)rl(-z)rlo, lz,

Es decir,
Y lglq lol+

Como el valor Y : 4 se repite 2 veces, unificamos sus probabilidades y la tabla queda así:

4. Hallar la función de distribución de la variable aleatoria Y : e-X, si X está definida mediante

( 0, si ú<-1;
¡k(ú):{ +,sisiú>1.
-1<ü<1;
( t,
Solución: Se tienen las siguientes igualdades:

Fv(t) : Pr(Y < ú) : Pr ("-* < t)


: Pr(X > -lnú) - 1- Pr(X < -lnú)
: 1-f¡(-lnú).
Por otro lado,

0, si -lnt<-I;
F¡(- lnü) :{ -lnú*1 si - 1< -lnú <
2' 1;

1, si -lnt>L.

:t 0,
-lnú*1
1,
2'
siú>e;
si e-l 1t 1 e:
si ú < e-1.

Por tanto,
1, siú>e:
+ lnú
- 1- Fx? lnú) :
1
Fv(t)
2
sie-'1t1e:
0, siú<e-1.
3.3. Ejercicios 95

3.3. Ejercicios
1. Irrclique si las siguierrtes variables aleatolias son discretas o corrtiuuas y su rarrgo cle <lefinición:

a) El núrrnero de bytes defectuosos en el disco duro de una computadora de 100 Gb;


b) La distancia de lanzamiento de Ia jabalina por un atleta;
c) EI nirmero de goles que anota un equipo de fiitbol en Lln partido;
d) La cantidad de dinero, en dólares, ganada (o perdida) por un apostador;
e) trl tiempo de nso diario de una computadora;
f) El tiempo de espera del autobús en una parada;
g) El núrmero de años que sobrevive una persona a la muerte de su cónyuge;
h) La variación en el tiempo de sueño de una persona sometida a un tratamiento.
2 Indique al menos tres variables aleatorias discretas y tres variables aleatorias continuas. Especi-
fique su rango de definición.

,l Se arroja un dado y se designan por ¿ : {el número de los puntos aparecidos es par} y por
6 : {el número de los puntos aparecidos se divide por 3}. Para los dos eventos, halle Ia Iey de
distribución y grafíquelas.

4. Determine Ia función de distribución de la variable aleatoria X que está definida por la ley que
se presenta en la tabla.
-2 rt
rl4 213 rlL2
¡. Un escritor ha lanzado al mercado una nueva novela. La probabilidad de que Ia novela sea muy
exitosa es 0.6, de que sea medianamente exitosa es 0.3 y de que sea un fracaso es 0.1. Los bene-
ficios esperados son: si la novela es muy exitosa, 100 mil dólares; si la novela es moderadamente
existosa, 50 mil dólares; y, si es un fracaso, 10 mil dólares. Forme la ley de distribución de los
beneficios esperados por el escritor.

6 Una agencia automotriz recibe un embarque de 20 automóviles nuevos; entre éstos, 2 tienen defec-
tos. La agencia debe seleccionar, aleatoriamente, 3 automóviles de entre los 20 para venderlos.
Forme la ley de distribución de la variable aleatoria <<número de carros defectuosos entre los
escogidos>>.

7 IJn apuesto príncipe visita a un rey que tiene cuatro hijas casaderas, con la intención de integrarse
en la familia. Las probabilidades que tiene el príncipe de ser aceptado por cada una de las
princesas son 0.6, 0.8, 0.2 y 0.4. El príncipe pide la mano de cada una de ellas de forma
consecutiva y se casa con la primera que acepte. Sea X la variable aleatoria definida como
X:i si se casa con Ia i-ésima hija (i - 1,.. .,4) y X:0 si todas le rechazan. Calcule la ley
de probabilidad de X y su función de distribución.

8 Una chapa para puertas consta de tres piezas mecánicas. Suponga que las probabilidades de que
Ia primera, la segunda y la tercera piezas cumplan con las especificaciones son 0.95, 0.98 y 0.99,
respectivamente. Determine la distribución de probabilidad del número de piezas que cumplen
las especificaciones en una chapa.

9. Sea X una variable aleatoria discreta cuya función de probabilidad es p(r) : :1,2,3,4,5.
#,r
a) Encuentre el valor de & para que la función p(r) sea la función de probabilidad de X;
b) CalculePr(l < X34).
C)a¡>ítulo 3. Vari¿tltl¡:s Aleatorias, Esperattza y Varianza

l(. l,¡r lr¡:¡.'i,irr ,lr'¡rrol,irlrilirl:r<1 ./'cl<: rulr r'¡uiirl¡lc ¿rl<r¿tloti¿r -f <:s rrttl¿t s¿rh'o cn lr.rs lrtttrtos /.:0. f .i'
'1. lirr cl[r,¡ l()nr¿r lr)s vitl()los:

.l'(0) : 4,":. /(l) :'k:- 1011. .[(2) : 4r:- I.


l)iu ir nlr cictlcl \'¿tlot' (lc r'.

;r) l)t,t<:rrrrire c.l valot ,lc c:


lr) (':rk'rrlo: PL(X < l). Pr(-X < 2). t'r'((l < .{ < 3).

il. t':r,r r''u'ialllc ¿r,leatoli:r -Y se dicc <¡ur: sigrr<: lrr lcy cle B<rnfot'cl si se cttrnple qtte

Pr'(x : ft) : ¡.,*,0 (t . i) , k: r,2,...,s.


a) \'irrifir¡ue que es rtrra firnciórr rle ¡rt'oba,bilidad;
b) Calcrrle la probalrilicl¿rd ctc obtcner utitnero impares;
c) Grati<¡rrc la funciórr de ¡rrobabilidad.
t'2. Urra r'¿rinble ¿leatoria )'se dcfine l)¿lra un errtero positivo fijo c (a > 1) cualquiera mediante

I'r(Y : A) : ;\- i, k : a*r,a*2,...


rt) \'i.r'ifit¡rre que cs utut funcióu de probabilidad;
lr) l)crrrucstl'e cluc Pr()' > tr) : !* pat'tr A; : e, (L* 1, ...i
r:) Fije u¡r valor ¡>ara <'l ¡rtrr-árnctrrr (¿ !'gl'aficlue la fuución de probabilidacl.

1:l Iirr,r r''rti,tlll<,akt¿rtori¿r cli¡t't'cta X cst¿i clefinida segittt la ley


Pr(.f : A;):p(l -p)r', A; :0. 1,2,.. .y p€ (0, 1).
rr )
\i,r ilir¡rre clue es ull¿l función clc probalrilidir<t:
lr) l)r:rcrrrrine la ftrnción de distribttciótr;
r') (';rk'ttlc: Pr(X > 2), Pr(X > ). Pr(.f, < 3).
11. l)rr<l¿s l¿s funciones de derrsidad /, errcuerrtre el valor de la constante c de tal manera que ellas
t:st r':rr l¡ien definidas.

a) /(c) : ;," - t,' ::::.ffii,,


{
b) ./(r) - 1- cll- rl. si 0 ( r( 2;

,:) /(t ) =
{iZ;:, :i ;: l]
15. Dncla la fttttcióu de distlillrrt:ititr rk: r¡¡¡:¡ r'¿tt'ia,lrlc ale¿rtori¿ .{:
0. si z(0;
L 14. si 0lr(1;
F(.r:) =
t l:J. si | 3r <2;
:r fr.t. si 2(1t14;
(t: -').)/3. si 4l:r. ( 5;
l. si ;u)5.
C)al<:r tlc lits ¡rt'o! r;.l,rriid¿ul<ts:
3.3. Ejercicios 97

lr a) Pr(l . X. S)' c) Pr(O.X.¡)'


b) Pr(2<X<+); d) Pr(a<x<6).

16. Se tiene la función de distribución de una variable aleatoria definida por

0, si r<-J2;
Il8, si -J2<r10;
215, si 0(r1I;
Il2, si t <, < J2;
314, si t/2<r<512;
1, si r>512.
Determine la función de probabilidad asociada y grafíquela.

77. La función de densidad de una variable aleatoria X está definida mediante


( o, si r<I;
te
(r):
fr\/ I sr"r,3", si + .0" =+t
[0, .iit;'
a) Halle la función de distribución .F;
b) Determine: Pr(X :0.2), Pr(X < rl4),Pr(X > n13),Pr(nlL2 < X < n).
5 Una variable aleatoria X tiene distribución continua F, siendo
( o. si ú(o:
FQ): I ct, si 0< t<I;
t 1, si ú>1.
a) Determine la constante c y halle la función de densidad /;
b) Calcule las probabilidades Pr(X: Il3),Pr(X < ll3), Pr(lxl <ll4).
9 Considere una variable aleatoria continua Z con densidad de probabilidad
( (t+b)zb, si z € [0, o];
: ellas /('):{ o, siz(lo,al.
a) Calcule los valores de los parámetros a y b sabiendo que p, (Z 1) : 1,
\ -2)
= 8',
b) Encuentre la función de distribución de Z.

Una variable aleatoria X tiene por función de distribución a

10, sir<-2;
F(r):l ar+b, si -2Sr<2;
I t, sir>2.
a) Determine los valores de a y b; c) Halle: Pr(X
b) Encuentre la densidad /; Pr(lxl > 1.2).

El tiempo en minutos que una persona espera un autobús es una variable aleatoria cuya función
de densidad viene dada por las fórmulas: /(¿) : j ouru 0 < ú < t, f(t) : o.ru I < t < 4,,
(t):0 I
para los demás valores de ú. Calcule Ia probabilidad de que el tiempo de espera sea:
f
98 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

a) rnayor qu<l nn minr.rto; c) rnayor que tres mirrutos.


b) rnenor que clos miuutos;

22 Los registros de ventas diarias de una empresa que comercializa computadoras muestran que
venderán 0, 1 o 2 computadoras de acuerdo a Ia siguiente tabla:
No. de ventas 0t1t2
Probabilidad

a) Determine la distribución de probabilidad de X, el número de ventas;


b) Calcule la probabilidad de que al menos se realice una venta en el día.
23. Un blanco circular de radio 1 se divide en 5 anillos,circulares por medio de 5 discos concéntricos
1234
-, -;,;, i t t. Un jugador lanza un dardo al blanco, si el dardo alcanza el anillo
de radios: -.

circular comprendido entre los círculos de radios : y tl]. '\'"-v'L)L\v'
(k:0.7.2.3.4), tiene k puntos y
o 5
gana 5 - ,k dólares. Determine las distribuciones de probabilidad:

a) del puntaje del jugador; b) de Ia ganancia del jugador.

24. Una empresa alquila el tiempo de cómputo de un tipo especial de computadora a una universidad.
La empresa debe planear su presupuesto, por lo que ha estudiado el tiempo de empleo de Ia
computadora. El tiempo semanal de alquiler (en horas) sigue la función de densidad dada por:

si o( t<4;
*U'n-U'
f(t):{ 0,
[ caso contrario.

a) Determine la función de distribución del tiempo de empleo de la computadora;


b) Calcule la probabilidad de que el tiempo de uso de la computadora, en una semana, sea
mayor que 2 horas;
c) EI presupuesto de la empresa solo cubre 3 horas de tiempo semanal de uso de la computa-
dora. ¿Con qué frecuencia se rebasará ese límite de presupuesto?;
d) ¿Cuánto tiempo de alquiler se debe presuponer por semana si esta cifra solo se puede rebasar
con una probabilidad de 0.1?

25. La cantidad de pan (en cientos de kilogramos) que vende una panaderÍa en un día es una variable
aleatoria con función de densidad
cÍ, si 0Sr13;'
c(6-r), si 3l r16;
0, caso contrario.

a) Encuentre el valor de c;
b) ¿Cuál es la probabilidad que el número de kilos de pan que se vende en un día sea: (i) más
de 300 kg?, (ii) entre 150 y 450 kg?;
c) Denote por A y B los eventos definidos en (i) e (ii), respectivamente. ¿Son independientes
Av B?

26. La cantidad (en gramos) de fertilizante químico que una planta puede recibir es una variable
aleatoria cuya función de densidad es

f srla z;
(r): { ff, - si r € [o' 8];
f
0,[ caso contrario.
Ejercicios 99

a) Halle la probabilidad de que Ia planta reciba merlos de 3 gramos;


b) Si la planta n)Ltere si recibe nl¿is dc 6 g, ¿,cuál es la ltlobabilida<l de qne la planta muela por
exceso de fertilizante?;
c) Si se trata de establecel para Ia cantid¿rd de fertilizante utilizada, ¿cuál es Ia
Lrna norrrla
c¿ntidad máxima recomendada utilizar para qne solo se sobrepase esta cantidad el 35 % de
las veces?

l;. Se extrae una bolita al azar de un bolillero que contiene 3 bolitas numeradas de 1 a 3. Llarnamos
X al número de la bolita extraída. Una vez conocido el valor de X, extraemos una nueva bolita
alazardeotrobolilleroquecontiene4-XbolitasnumeradasdeXa3(porejernplo: siX:2,
la segunda bolita se extrae de un bolillero que contiene dos bolitas con los números 2 y 3).
Llamamos Y al número de la bolita extraída en el segundo bolillero.

a) Calcule Pr(Y : 3lX : 1);


b) Calcule Pr(Y :3);
c) ¿Son X yY independientes? Justifique;
d) Halle la distribución de probabilidad de Y.

-1. Una variable aleatoria X tiene densidad

f(n\:Ir'siz€[o'1];
\"¿/-lo, sizl[0,t].
a) Si Y - X2, halle la función de distribución de Y;

b) catcule las probabilidades: < x2 <i) r . t . :)


"'(+ "' (á
-i. Una variable aleatoria Z tiene función de densidad
(L
si z e
f Q): i'
l 0, (
[-1' 1];

[ si z [-1,1].
Halle Ia ley de la variable T : -52.
i.'. IJna variable aleatoria X tiene función de densidad

rf") : (! sir€l-z,Z);
I o1 si n ( l-2,21.
Halle la probabilidad Pr(X2 < 1).

Una variable aleatoria Y está distribuida según Ia ley

5,
sig€l-t,Z];
0, caso contrario.

Halle Ia función de densidad de la variable U : Y2.


-') Una variable aleatoria X tiene densidad f x(") : s-t, si r ) 0. Encuentre las funciones de
distribución y de densidad de la variable aleatoria Z : e-x.

Una variable aleatoria X tiene función de distribución Fy(r) - 1 - e-o', si r ) 0. Halle las
funciones de densidad de:
100 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

{Y:f7; b) Z :1tnt.

En las secciones precedentes vimos que una variable aleatoria queda definida por su función de dis-
tribución, pero muchas veces solo se desea tener una idea del comportamiento general de las variables
aleatorias, sin dar detalles de su distribución de probabilidad; para tal propósito, examinaremos dos
características teóricas de las variabtes aleatorias: la esperanza y la varianza, que son dos parámetros
que miden la Iocalización y la dispersión de Ios valores que toma la variable.

3.4. La esperartza maternática

La esperanza matemática -o simplemente esperúnz&- de una variable aleatoria X, se simboliza por


E(X) y su definición es la siguiente:
Definición (de esperanza de una variable aleatoria discreta) Sea X una variable aleatoria
discreta, la esperanza es un número real que se calcula según:

1. Si X toma un número finito de valores rr¡ 12, ..., rn con probabilidades h:Pr(X : rt),
pz : Pr(X : r2), . . ., pn: Pr(X - ,n)t

E(x) : f,o*rr.
l^-1

2. SiX toma un número infinito de valores rr, 12, .. . con probabilidades p¡ : Pr(X : rk),
k:I,2,-..; oo
E(X) : ln*"r.
/c: f

Definición (de esperanza de una variable aleatoria continua) X


una variable aleatoria
Sea
continua, cuya función de densidad es /(r), la esperanza es un número real que se calcula según:

E@:
l: rf (r) dr.

A la esperanza también se la denomina media poblacional o ualor esperado de la variable aleatoria y


se la suele notar como p.

Observación. Si /(r) toma valores distintos de cero en un intervalo [a., b], Ia esperanza se calcula
como
Fj(x): rf (r)d,r.
L
La esperanza posee varias propiedades, independientes del tipo de la variable aleatoria. A continuación
vamos a enunciarlas y demostrar algunas de ellas, en el caso de una variable aleatoria continua, los
otros dos casos quedan como ejercicio para el lector.

Propiedades

1. La esperanza de una eonstante es el valor de la constante:


E(c) :6, cconstante.
3.4, La esperanza rnatertática 101

D en¿ostt'o,ciór¿:

E(c) : I t'.[ (r) rlr : ,t Ir@ .l'(t') tl,.r :


[@
(:' L : c.
.l _- ./ _m

dis-
2. Aditividad. La esperanza de la suma de dos variables aleatorias es igual a la suma de la^s
bles
esperarrzas de los dos surnandos:
dos
tIoS E(x+Y) :E(X) +E(Y).
3. Un factor constante c se puede sacar del símbolo de la esperanza matemática:

E(cX) : cE(X).

Demostración:
l'c. f@
E(cX) : (r) O, : (r) dx : cE(X).
.l_*crf " .l_*rf
4. Sea g una función real, la esperanza de la variable aleatoria Y : S(X) está definida por

E(Y) : E(g(x)) : [* s@)f (r)d,r.


J_a
En particutar si g(r) : 12 se tiene

E (x,) : l:,2¡q,¡d,.
5. Si X y Y son dos variables aleatorias independientes
E(xv) : E(x)E(r).
Observaciones:

1. Por las propiedades 2. y 3., si Y: aX t b, entonces

E(Y):aE(x) +b.
1 2. Si la función de densidad es simétrica respecto a Ia recta
3.5)
r: rr¿, entonces E(X) : rn. (Figura
rria y

ücula

aclon
a, los

Figura 3.5: Función de densidad simétrica respecto a la recta n : TrL.

Dos variables aleatorias con la misma esperanza pueden tener distribuciones diferentes. Para diferen-
-iarlas es lecesario introducir otra característica teórica que informe sobre la dispersión de su posibles
r-alores.
LO2 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

3.5. La varianza

L¿r iclea de <lspelanza no ittclica cótuo cst¿i clistlibuicl¿ Ia m¿ts¿r en torrro ¿ su <l<ntro; ósto sc explrcs¿)
rrrecli¿rnte la Ia valiable ale¿rtoria X, que se nota Var(X) o o2.
uari,an,zo, de

Definición (de varianza) La varianz¿t de nn¿t variable aleatoria X es rrn núrmero no negrrtivo que
se calcula por:
Var(X) : E(X -E(X))',
o, equivalentemente, por
Var(x) :E(x2) - (E(x))''

Segúrn el tipo de variable aleatoria, se calcula de la siguiente manera:

1. Para una variable aleatoria discreta que toma un número finito de valores rtt r2t .) trn con
probabilidades p1 : Pr(X : rt), pz:Pr(X : rz), ..., pn: Pr(X : r,-)i

var(x) :ilrr-E(x))2pn o var(x) :ir*r\- (E(x))2.


k:t k:L

2. Para una variable aleatoria discreta que toma un número infinito de valores rr, 12, .. . con
probabilidades p¡ : Pr(X : rk), k : L,2,. ..:

Var(X) : !["r - E(X))2pt o - (E(x))'.


lc=1

3. Para una variable aleatoria continua con función

var(x) : - E(x))'f (r) d.r o r) dr - (E(x))'z


|lO
Observación. Al igual que en la esperanza, si /(z) está definida en [a, b]:

var(x) : l'o@- E(x)12/ @)d,r.


.la

La varianza da la idea de cuán ampliamente dispersos se encuentran, en torno de la media, los valores
que toma Ia variable aleatoria:

1. Una mayor varianza indica que Ios valores tienden a estar más alejados de la media.

2. Una menor varianza indica que los valores tienden a estar más concentrados alrededor de la
media.

Defrnición (de desviación estándar) La desviación estándar de una variable aleatoria X es


igual a Ia raíz cuadrada de la varianza:

o:\@.
3.5. La varianza 103

Propiedades

]. L¿r variarLz¿r de un¿r, corrst¿rrrte es cero. Es decir, para tocla constante c:

Var(c) : g, c constante.

Den¿ostración:

var(c) : V - E(c)]2 f (r) dr : V - c]2 ¡@) ar


[* [*
: l'* o¡qr¡d"r:0.
_*
.l

2. Un factor constante c se puede sacar del símbolo de la varianza, elevándolo al cuadrado:


Var(cX) : c2Var(X).
Dernostración:

var(cx) : l* O" - E(cx))2 f (r) d,r :


17r", -
cnr.)12 f (r) d"r
/'oo
: I "'1" - e(x)l/(r) dr : c2yar(X).
J-* '

3. Aditividad. La varianza de la suma de dos variables aleatorias independientes es igual a la


suma de las varianzas de los dos sumandos. Es decir, si X y Y son independientes

Var(X +Y) : Var(X) + Var(Y).


D emostración: En efecto,

Var(X + Y) : E[(X + Y) - E(X +Y\2


: E[(x - E(x))+ (r - E(y))]2
: Var(X) + Var(Y) + 2Bl(x - E(x))(y - E(y))l
Como las variables X y Y son independientes, también lo son las cantidades X - E(X) y
Y - E(Y), por lo tanto,
E[(x - E(x))(y - E(y))] : EIX - E(x)l .Ely - E(r)l : s.

En consecuencia, Var(X + y) : Var(X) + Var(Y).

,lbservación. De las propiedades 1- y 2. se verifica que

Var(oX + b) : a2 Yar(X).

Fj,emplos

de la
-. La variable aleatoria discreta X está definida según Ia ley

x I -41 6 10
p10.2 10.3 0.5

Hallar la esperanza y la varianza de: a) la variable aleatoria X; b) Ia variable aleatoria Y :


0.5x +2.
Solución:
LO4 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

3
a) E(X) : D : -4 x0.2 +6 x 0,3 * 10 x 0.5 : 6.
A:1 "xp*,
Calculemos E(X2):

n62): I ,?,p*,: (-q2e.2) + (6)2(0.3) + (10)2(0.b) :64.


k:1

Entonces,
Var(X) : P(X2) - (E(x))2 :64 - (6)2 :2a.
b) Vamos a aplicar las propiedades de la esperanza y la varianza para calcularlas:

E(v) : E(0.5X +2) :0.5E(X) + E(2)


: 0.5x6*2:5.
Var(Y) : Var(O.5X + 2) : (0.5)2 Var(X)
: 0.25 x 28 -- 7.
2. En una rifa se venden 300 boletos, a un dólar cada uno. El primer premio es 100 dólares, el
segundo premio es 50 dólares y hay otros cinco premios de 10 dólares. ¿Cuál es la ganancia
esperada de una persona que compra un boleto?
Soluci,ón: Sea X la cantidad ganada por un boleto premiado; entonces, X sigue la siguiente ley

xl 1oo I so I ro I o
p | 1/Boo | 1/3oo I sTaoo I zoaTaoo
Así,

293
E(X) rooxfr*5ox #.rox.*I+ox 300
0.67.

Como la persona paga 1 dólar por el boleto, Ia ganancia (total) esperada es E(G) : 0.67 - 1-
-0.33 dólares; es decir, una pérdida.
3. Una persona quiere abrir una puerta y tiene 5 llaves, de las cuales solo una corresponde a la
cerradura. La persona va eligiendo al azar y probando abrir Ia puerta. Calcular la esperanza y
la varianza del número de intentos si separa las llaves que probó anteriormente.
Solu,ción: Como cadavez separa las llaves utilizadas, cada llave tiene la misma probabilidad de
abrir la cerradura; por lo que la variable aleatoriaX: <<número de llaves utilizadas>), sigue la
siguiente ley:
xl1 I 213 I 4l b

Entonces,

515
E(x): D*ou:;I/c:3,
l--1 t- r

515
E(x') : Dk'rr:;tk2:rr,
l': I [:1
Var(X) : lI - 32 :2.
3.5. La varianza 105

4. Una variable aleatori¿r X toma solarnente dos valores rt- y r2t tales que 12 > r1. La probabilidad
de que X tome el valor zl es 0.6. Hallar la ley c¡re sigr.re X, si la esperanza rnatemática y la
varianza son conocidas: E(X) :1.4 y Var(X) :0.24.
Sol'uci,ón: Esclibamos Ia ley de X:

Explesemos la esperanza y Ia varianza en función de 11 y 12:

E(X) : 0.6rr + 0.412 : 1.4.

La ley de X2 es

Entonces,
E(X') :0.6r? + g.arl
v
Var(X) : n(X2) - [E(X)]2 : 0.6r? + g.arl - r.42 : 0.24

De aquÍ, se obtiene el sistema de ecuaciones

I o.aq t olq:1.4
\ o.o"l -t o.4r| :2.2

Resolviendo eI sistema se obtienen dos pares de soluciones:

It : l, 12:2 y z1 : 1.8, rZ:0.8.


Puesto qLLe 12 ) 21, hallamos Ia ley de clistribución de X:

.6 t.4
(,1. z

a) Hallar Ia esperanza y Ia varianza de lealtoria


ble ale X que tiene función de distribución:

si Ít<, -1;
F(r) : si -1l<r 3;
si r,) ' .).

b) Se deflne la variable aleatoria Y : rrsJU CSIper anza y su varlalza.


Hal lar
Soluczón:

a) Hallamos 1a función de densidad

(r): si -1(r(3;
f
caso contrario.

De manera que

E(x) : (,)l_,
rf
1)
o":
e (x') :
[_,
r2r@ (i) r"
106 Capítttlo 3. Variables Aleatorias, Esperanza y Varianza

Pot lo t¿urto,
v.u(-K) : p (x') - (E(x))2 :: - r' :: .)
J

b) Tenerrros la vari¿rblc ¿le¿rtor-i¿r Y :5X *2, cuyzr. función de densiclad no la corrocerno$. pero
podenos enrplezrr' las propiedacLes cle Ia esperanza y de Ia varianza:
E(Y) : :5E(X)+E(2) :5 x It2:7,
E(5X +2)
Var(Y) : Var(5X + 2) :25 Var(X) :25 x * : +
.) .)

b. Una valiable aleatoria X está definicla por slr densidad J'@):r+l2 el intervalo (0, 1), fuela
"n
de este intervalo f (r):0. H¿llar la esperanza matemática de la variable aleatolia Y : X3.
Soluctón:

E(v) : rs f @) o, : ,t (, **) o,
.lo'
,)ar:1" *1 4l '

)"- ls 2 a)o
u--.40I3
7. Determinar la esperanza y lti ', ' a valiable aleatoria 7 cr.rya fnnción de distlibrrción
csF(ú) -1-e2t,t>0.
Soluczón: La función de deusidad es:,/(/) : F'(t):2"-2t, ú > 0; y 0, caso contr¿rrio.
Calculemos Ia esperarrzn:
fx
tr(x) : /.oo
2re-2''d,r.
.l_,"r.tb)nt: .lo
Irrtcgrando por partes, ponicriclo rL: :1. rl,u : e-2'cl,r; pol lo tanto: ilu,: dn, Lu : _
'r"-r',
: -rc2 l-*1 l'n
2'
l'*
.lo r".,,rh
ln'2.1u "-r."rl,
,"-" l* 1 __r,.1-
z io-4c l.

;'^'^
Entonces,
E(X): , lo*
,"-'2'rL*:r(i) - I
Necesitamos el cálculo cle E(X2):

E(x') : [:,2 ¡q,¡a, :, .lo* ,2. 2"


tlr

Integrando por partes, clos veces. se llega a

2 ln ,,', "r!, = ?:!


4 2
Io
La varialza buscada es

var(X) : E (X,)
1 tt/1\2 1
- (tr(.Y))2
o \ol
\o /
¡
"
S.S. La varianza
Etr ttlt slll)crlriercacro se r¡o,,.1,. ,,-.-
ro7
-.
crescrir,e ; ;;;;'.,". .:ff:fii:::;1ij,."":J1,*,:,i:"..T;"^,jj,f,:i,,ililTjc arcaroria quc

.f(r):[;*'sjo<'<5o;
I o, caso contrario.
a) ;.Crrál es Ia c¿nt jdact
de calnc quc se esr)
Ü¡l)el'a vender diariamente
llién, halle ia desviació" en el supermercaclo?
Tam_
"r*0""..oq
b) Si la ganancia en el producto
se expresa
-r"4vvu por
ganancia esperada. vvL la ecuación
r'L ccuaclÓn C:
).

fi¡X2 + 10. Calcrile Ia


Soltt,ción:

a) Calcularemos l¿
de la variable aleatoria
efectúra ,ro"r.lr,lifjlllza como er indicador
de las ventas que
",

E(x): ['o
to " Gil o*: # fo,o
,, o,

,hl#]; :3333
Así' el supernrercatro
espe.aría
-- vender
Calcrrlernos E (X2): 'v'uL 33.33 kg diarios cre car'e.

La r.ar.iarrza es

Val(X) : - (E(x))2:1250 _ (33.33)2


: ?(x'z)
138.89.
La desviación estándar
€s d:
b) Entonces, vC(D : i,/138.80 : 11.79 kg.

-\v'/ :
E(c) n(2.-, \
"rl*o" *'o):
.r

IEE (x2) +to


:
1E(1250) + I0 :24.29.
Por' la 'r'enta cre la cirrle, cr supermer-caclo
csr)era ganar 24.2g
crórares diarios.
-- uontinu¿ción, se cla
ulr ejernltlo de valiable
- r ál<.rrlo dc ia alcato
cs
valiatrza dc cs ro iltfinito cle valores.
e¡nl>
::tc¡1¡.¡l¿1¡¡ c1
dc análisis ma
-= s,rrn,inie*;';;;; artificios qrre
leatorias geont
ruatollas ]::? ¡l"empleado
rétodo
::ométricas,
métricas: geom ruLoclo em¡rle,rdo por
¡rttrlttetládes lrásicas .lu
las sci ics
satrr ar r icgo. F i I 992 ¡, -Et.f.l[]11".¡[.o,,.
of Georrre ric: Xloue¡ts, ,,
Tl¿e Atuerial¡t
Stattstician, 46, 10g-10g
r08 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

P,_1
Propiedad 1. Va € (0,1), , It,
41,-
l.;:0 | - (L

Plopieclad 2. Ya € (0,1), i lr - a,)ak : a'''.


k:r¿

9. Una variable aleatoria X toma valores I,2,3,. . .) con probabilidades

I (1 -P)A
po,:-ñ7, h:I,'2,..,;
L- 1.' P€ (0,1).

Determinar sll esperanza y su vattatza'


Soluc'ión:

: io-,k:i(-#) (r -P)k ¡
E(x)
A=1 A:1 '
: l-r) i,'- :- (*)
\ I'p)3' ir, -or*
\nP/7_o
p)k

Si p € (0, 1), entonces I - p e(0, f) y aplicando la propiedad 1:

E(x) : (#) r-i-r:-(#) (")


p¿rr-a el c¿ilculo d.e la varianza varrios a calculal E (X'), usando Ia notación Q: l- p; pol tanto

: ( *t) É*n-:(-#) ',i'ronr


Veamos a qué es igual la surnatoria:
oo oo oo oo

Dt rnr :\nar +lnuk + lrek + '

k:7 k:r k:2 lc:3

Por la propiedad 2, se tiene que

: L-p
Dttono
: ct + q2 + q3 +... - Dnr
k:1 k:r

Consecuenternente, E (X') queda como

E(x,) :-(#) (;)+: I-p


p2 in;r

: /. r,\\ ¿

'P)
3.6. Función generadora de rnornentos 109

3.6" F\rnción generadora de momentos

Los momentos de una variable aleatoria son númelos que representan algunas calacterísticas de la
jistribución de probabilidad asociada. Bajo ciertas condiciones el conjunto de momentos determinan
ie manera única a la ley de probabilidad.

Definición (Mornentos) Sea X una variable aleatoria y sea r¿ un número natural. Cuando existe,
el nútrnero pr:E (Xk) es el k-ésimo momento de X.

f ntonces, tenemos que Ia media p es el primer momento de la variable aleatoria; es decir, F: lJt.

-isociada a cada variable aleatoria podemos encontrar una función que permite calcular sus rnomentos.
fsta función tiene Ia propiedad de que, al igual que la función de distribución, caracteriza de manera
:rica a la ley de probabilidad de la que proviene

Definición (Función generadora de momentos) La función generadora de momentos (f.g.m)


ie la variable aleator"ia X es la función

M(t):E("t"),
iefinida para valores reales de ú tales que la esperanza existe.

- . función generadora de momentos se utiliza tanto para variables aleatorias discretas como continuas.
alrt o

Ejemplos

- Encontrar l¿ función generadora de momentos de la variable aleatoria cuya función probabilidad


CS

x I -4 I 6 I 10
p 102 | 0.3 | 0.5
Solución: Resulta que

I[(t) : E("t"):|pr"tr
k
: 0.2 e-at * 0,3 e6¿ f 0.5 e1o¿

Hallar la función generadora de momentos de una variable aleatoria cuya función de densidad es

rI si
r, ' I
f\L;): \ -.
4 -1<r(3;
[ 0. caso cont rario.

Solttciór¿: Tenernos que

M(t) : E ("'') : lt f @) o' :


l:, "t'!d,, : t:
^!)¿
-(
4t
^- L

,et' 4

r- siguiente resu.ltado nos indica córno se pueden obtener los momentos de cualquier orden con el
:-:rpleo de la f.g.m.
110 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

Teorema. Sea X con furrción generaclora de rnomentos,4f (rl), con derivadas continuas dc cualquier
orden; entonces,
.,_
I-Ik-L qlxu):
j-nt,,,l
tr,,,=o
\-'/- dj",

Es decir, el k-ésimo momento de una variable aleatoria se calcula como la derivacla de orden k de la
f.g.-., evaluada en cero.
Observación. Se tiene que E(X) : Ft y Var(X) : Fz - F?.

Ejemplos

1. Hallar la varianza de la variable aleatoria cuya función probabilidad es

x I -4 I 6 I r0
p10.2 10.3 10.5

Soluc'ión: Antes calculamos que il{(ú) : 0.2 e-4t * 0.3 e6¿ * 0.5 e10ú; por tanto,

.1
: _0.8e-at * 1.8e6¿ * belo¿
aual
t,)
o.-
AI ft) : 3.2e-at * 10.8e6¿ f 50e10Ú.
dt2

Entonces,

ltt :
ftnup¡: -0.8e-a(o) + 1.8"u(o) -¡ 5"10(0) : 6,

ltz : #* ro, : 3,2e-_4(o) + 10.8e6(0) f b0e10(0) : G4.

Por tanto, Var(X) : p2 - u?:64 - (6)2 :29.


2. Hallar la varianza de la variable aleatoria cuya función de densidad es

(l
I@):l q,'si -1<r(3;
[ 0,
conrrario. caso

Solución,: Ya calculamos que


eJL _ e-L
M(t):

Por tanto,

!u,rt (3t-1)e3¿*(1-t)e-r
dt ¡t2
+t,
(st' - 6t + 2) e3t - - l:
.-)
',:r
#,u,
3,7. Ejercicios 111

¿2
Puesto que 1,1(ú) no está definida para l, : 0. para hallar M (0) aplicaremos la
*r*r|, ,ljz
regla de L'Hospital; entonces,

¿2

trt : 4*g: Iím ñ ((st-1)e3¿+(t+t)e-¿) -1,


CN f+0
*Lurn*l
¿3

ttz : #*ror: ls w(Q* - 6t + ?r"" - (t2 + zt + 2) et) :- 56


24
@tó) ors

Por lo tanto,
Var(X) : pz- Lr?: 56.4
243

3.7. Ejercicios
l. Halle la esperanza y la varianza de las variables aleatorias discretas definidas por

xl-0.7t10.24 10.61 Yt 2 t 4 t 5 I 6
pl 0.2 10.5 10.3 p 10.3 10.1 10.2 10.4
Se escoge aleatoriamente un número de conjunto $ : {-1;0; 1}. Sea X el número escogido.
Encuentre su valor esperado, La varianza y la desviación estándar de X.

¿Existe una variable aleatoria X que cumple qLre E(X - 2) :8 y que E ((X + 1)2) : 120?

Si X es una variable aleatoria con E(X) : 50 y Var(X) : 15. Encuentre:

a) E (x2); c) Var(-X); e) E(3x + 10);


b) E(-x); d) o(-2x); f) Var(3x + 10).
Sean X, Y y Z tres variables aleatorias independientes, cada nna con media p, y varianza o2.

a) Encuentre la esperanzay la varianza de,S: X -lY 1- Z;


b) Encuentre Ia espera\za y la varianza de ? : 3X;
c) Calcule la esperanza y Ia varianza d.e A: \IjA,
3
d) Encuentre la esperanza de 52 y de A2.
SeaX una variable aleatoria definida en el intervalo l-1;11 y sea f x(") su función de densidad.
Encuentre P(X) V Var(X) si:

a) Jx\r): r;
I b) fy(r):lrl. c)fx@):t-lzl. d) f x@) :t '.
Encuentre la esperanza y desviación estándal de las variables aleatorias definidas mediante las
leyes:

f 0. si r ( l;
.) r(,) :{ +, si 1(.c14;
t,I sir>4.
t12 Capítulo 3, Variables Aleatorías, Esperattza y Varianza

(o sir!1;
l:lr): {L2-r'
,
t2 - si11.r.<2;
b)

I t. sir)2.
c) r,-..:l I Zr. si z e (0. l):
/(rt o. sir((0, 1).
d) ' ))' * Br - l2). si r € (-5. -3):
..\ <Í - *frt
f¡,(t:):
--
I O, caso contrario.

(t. si re [1,2]:
e) f(r):1 '
I o, si zl11.2l.
(Determine primero el valor de c.)

8 Una variable aleatoria X toma los valores 4, 6 y o con probabilidades Pr(X - 4) : 0.5, Pr(X :
6) : 0.3 y Pr(X : a) : p. Si se sabe que 1a esperanza de X es igual a 6, halle los valores de p
ya.
q Halle la varianza de una variable aleatoria Z q:ue solo puede tomar dos valores, el uno el doble
del otro, con la misma probabilidad, si se sabe que E(Z) :0.9.

10 I-a variable aleatoria discreta X tiene solamente dos posibles valores: rr y fr2, además 11 1 12.
La probabilidad de que X tome el valor 11 es igual a 0.2. Halle Ia ley de distribución de X.
conociendo la esperanza E(X) :2.6 y la desviación estándar o : 0.8.

11. Una variable aleatoria X puede tomar tres valorest r,1 : -I, 12:0 y 13:1. Si se conocen las
esperanzas matemáticas E(X) :0.1y E(X') :0.8, enci-r.entre las probabilidades Pt,Pz yp¡, de
los I'alores rt, 12 y 13) respectivamente.

12. La variable aleatolia X tiene ítnicamente tres posibles'u.alores rr:1,:x2 y x3 (rt < rz <'J4).
Las probabilidades de que X torne los valores rr y 12 son respectivamente iguales a 0.3 ¡,'
A.2. Determine la ley de distribución de X, conociendo Ia esperanza E(X) :2.2 y la varianza
Var(X) :0.76.
i3. La variable aleatoria X tiene función d e distribución

0, parar12l
F(r) : arlb, para21r14;
1, parar>4.
a) I{alle e1 valor de las constantes cr y b;

b) Determine su función de densidad;


c) Halle 1as probabilidades: Pr(1 < X < 3) y Pr(X ,2.5);
d) Encuentre su esperanza y sr-l varlanza.

74. Suponga que se escoge un núrmero real X en el intervato [2; 10] con urra función de densidad de
Ia forma f (r) : Cz, donde C es una constante.

a) Halle el valor de C;
b) Calcule Pr(D), donde ¡1 : 13;71;
c) Encuentre Pr(X > 5), Pr(X < 7) y Pr(X2 - 72X * 35 > 0):
d) Encuentre la espera\za y la varianza de X.
3.7. 4jercicios 113

15. Uu cstudiante rinde ttnil plr-reba consisterrte en 2 probleuras de elección múrltiple. La primcra ticrrc
3 posiblcs resprtest:rs y la scgurrda 5. El estrrcliante cscoge las 2 r'espuestas al ¿rz¿rr. Encuentl-e:

a) La ley qr,re ciescribe cl núrmero de respuestas cortcctas X del estucliantc;


b) El nírmero esperado, E(X), de respr-restas correctas;
c) La valianza. Vur (.Y).

6 tlna organizac:íón benéfica realiza una rifa para conseguir fondos. cn la que sc vendieron 10000
boletos, a 4 dólales cada uno. E1 prerrio es un antomóvil de 12 000 dólares. Si un ciudadarro
compra 2 boletos, ¿cuál es la ganancia esperada del comprador de los boletos?

IJna persona participa en un concurso de la televisión. Le hacen una pregunta con 5 respuestas
(solo una es verdadera) si acierta, gana 10 000. Si falla le vuelven hacer otra pregunta con tres
posibles respuestas de las cuales solo una es verdadera. Si acierta, gana 1000 y si falla se le
vuelve hacer otra pregunta con solo dos respuestas si acierta, entonces no gana nada y si falla
pierde 500. El juego termina cuando la persona acierta c después de fallar la tercera pregunta.

a) Indique cuái es el espacio muestral;


b) Calcule la probabilidad de que dé una respuesta correcta;
c) Halle la ganancia esperada;
d) Halle la esperanza y la varianza de Ia variable aleatoria que describe el número de preguntas
realizadas al concursante.

Se asegura un vehículo de 50 000 dólares por su valor total, pagando una plima de C. Si la
probabilidad de robo en un año es de 0.02, ¿cuál es el valor de la prima que debe cobrar la
compañía de seguros, si espera ganar 200 dólares?

9 Si Roberto termina sus estudios en Junio, podrá disfrutar de una beca para poder realizar un
curso de especialización con todos los gastos pagados. Si aprueba en Septiembre, la beca sólo le
cubrirá el 40% de los gastos. Si no consigue aprobar, también realizará el curso pero abonando
50000 dólares, que es 1o que cuesta. Roberto sabe que la probabilidad de aprobar en Junio es
sólo de un 10%, mientras que la de aprobar en Septiembre es de:un 4ATa.

a) Halle la distribución de probabilidad del costo del curso de especialización;


b) Determine el valor esperado de dicha variable.

:0, Una agencia que renta autos tiene disponibles 4 carros todo terreno, para alquilarlos. El precio
de alquiler de cada carro es 60 dólares diarios. En un estudio de mercado el propietario ha
determinado el siguiente modelo probabilÍstico sobre la demanda de estos autos:

Demanda Probabilidad
0 0.05
1 0.10
2 0.20
c
r) 0.25
4 0.20
5 0.15
() 0.05

Además, en el mismo estudio ha encontrado que sus gastos diarios son: 20 dólares por alquiler
del local y 15 por pago a ul empleado.
lL4 Capítulo 3. Variables Alcatarias, Esperanza y Vatiai;za

a) C¡rlcttltt r:l tLítrrtelo csp<:r'aclo dc carlc-'s tocl,r tellerro <¡re la agencia alqr-',il.rrri urr rlÍa (;Lralquiera;
l,) CalcrLl<-r ltr girrrnirciir cli¿rli¿ csperad a:
,') Caicule Ia <l¡:sviación cst¡inclal cle lii gzrrranr;iir

'21 Urr poltafolio r-lc invcrsi<irr sig-ue r:l .,iguicltc: (iselr€r1ir lrlolrabilístic:o:

Cornpañía Ganancia Probabilidad , Cornpañía Ganancia Probabilidad


0.0r02 F 250 0.2r23
0.0346 G 350 0.1542
0.0860 H 450 0.0860
0.rs42 I 55t) 0.0346
0.212:1 .I 650 0.0156

Calcule Ia esperanza y la dcsviación cstJrndar de la ganancia de una invcrsión en este portafolio.

22.Uncírculoderaclio1eszonificaclcen10"írculoscorcélrtricosd.eradios "' 10
10' 10"
lanza un dardo sobre el círculo, si éstc cac en la zona ccmprerdida ertre los cír'culos de radios
i^"lJellar:zad.organa10-idólalcs, i:0,l,...,g.SeaXlacantidaddedineroganaclo,
i0 10
a) Halle Ia ley de la variable aleatolia X;
b) Calcule su esperanza y su varianza.

23. EI espesor del recubrimiento de unos cables tiene funciórr de densidud ry, corr 100 l1rn <:r <
'r'¿
2ao ¡tm.
a) Determirre la media y la varianza del espesor del recublimiento;
b) Si el costo del recubrimiento es de 0.5 délares por micrómetro de espesor, ¿,cuál es el costo
medio por recubrir los cables?

24. Un supermercado tiene una dcmanda dialia variable X de la cantrdad de caile que vende, de
tal manera que X (medida en cientos de krlogramos) tiene una funcrón cie densidad
(
f@):1oq1r'. sio( r<4'
|. 0, caso contrario.

a) Calcule eI valor esperado de Ia cantidad de carne demandada y su desviación estárrdar;


b) Si la ganancia está dada por Y :2X - 0.5. Calcule Ia ganancia esperada y su varianza,
25. La longitud de ciertos gusanos se distribuye según la función dc densidad

¡z - 1)(3 - 'c)' si 1 ( '¿'( 3:


I@): I ¿@
L 0, c¿rso contrarirt.

a) Calcule la esperanza y la varianza dc la longitud clc los gnsanos:


b) Si para un estudio se considerarán aqrrellos eje:nplares clue ierrr¿r.n una longitud entre 1.7
cmy 2.4 cm, calcule el porcentaje cle gusanos que tienen es1-a calacter'ística.

26. El tiempo de uso diario de la red Internet en Lrna oficina tiene p,-r1 :r,;r-ción cie densidad (medida
en horas) a
( gr2(g - ,\
f("):{'-ñr-' sio(¡(s:
0, [ carco conira:- .
3.7. Ejercicios r-15

a) Calcrrle cl v¿rlot eslrclaclo y la virriarrza rlcl tieurpo <.lialio clc rlso de l¿r lecl Intelnel,.
lt) El tictlitct cle ttso ilc Irrtcrrrcl' crlcsta 2 clólares pol hora. C¿Llcule el v¿r,lor esperiiclo v lzl
clesviat:ióu estárrdat ck:l costr¡ scur¡-n¿ri (cn 5 clÍas laLorablcs) por el citilrio rrso.

La lcy cle 1tloltabiliclacl rlue rlesclibc la clistarrr'lia (cn inctros) a Ia. <¡-re un atlet¿r lanza la,jabirlina
CS

[. *t ,.,, (+) . si :¿ c [0, lon2];


,[(t'¡: { 20zr \10n/
I O. caqo corrtr.flrio.

a) Halle la probairilicl¿rd de qLre rula jal;alir'a lanz¡id¿r llcgue a nna dist¿rncia mayor quc 60 m;
b) Determinc el valor esperado dc Ia distancia a la que llr:ga la jabalina;
c) Halle Ia varianza y la desviación estándar de la distancia cubielta por la jabalina.
:3 Dcmuestre quc la ebperanza y la valianza de Ia variable aleatoria discreta definida por

Pr(X : k) :pqk, h : 0,1,2,...


con q: L -p,r.ieren claclas por E(X) :! y Var(X) : +.
pp'
I Sea X una variable aleatoria discrcta que pucde tomar valores enteros, definicla por

Pr(X: r¡-l a' Pata'r_-1;


I ft - a)2n', ?' :0.7,2,,..
para

para elgún a cn (0,1).

a) Pruebe que la función de probabilidad está bien definida.


b) Demuestre que E(X) : g
:'-. Sean X y Y dos variables aleatorias independientes. Si X toma los valores 3, 1y 2 con pro-
babilidacles que son los 3 términos de una progresión aritmética cuya diferencia es j; mientras
tanto, Y tonta los valores 2,7 y 0 con probabilidades que forman una progresión geométrica de
I
razón.r. Calcule la esperanzade XY +2Y - X.
:'- . Dadas las variables aleatorias independientes X y Y, cuyas funciones de densidad son:

: : { t^' ..-l]l ''


rx(,)
{3:' LJ"'"ik*," rv(v)
[ 0, caso contlario.

Calcule:

a) E(x t Y); b) E(2x - 3Y + 5); c) Yar( X -2Y -3).


Las variablcs aleatorias X1, X2, . . . , X,, son independientcs e igualmente distribuiclas, tales que

Pr(X¿- 1) : Pr(X¿: -f) : *,


Pr(Xn : O) : *, i: I,2,...,fr.
z

Halle la esperanza matemática y la varianzadela variable aleatoria Sn: Xrt Xz*... * Xr.
116 Capítulo 3. Variables Aleatorias, Esperanza y Varianza

33. Las variablcs aleatolias X1 , X2, . .. , Xrr,Y,Yz,. . . ,Y,, son independicntes. Pongamos

Sr,: Xt t Xz + "'I Xr,,,

7,, - X1Y1 I X2Y2+ -. . + X,,Y,,.

Halle E(,5,,,), E(7',), Var(.9,,) y Var(T,,) si

E(X¡,) : a, Var(X¡) : s2

Pr(Y¿ :1) :p, Pr(Y¿ -0) : q:l-It, k:I,2,'..,n.


:14. Para las variables aleatorias que tienen las siguientes Ieyes, encuentre Ia función generadora de
momentos v, mediante esta función, halle la esperanza y la v rtanza".
¡1
d) /(") : I ;. si z € 1-2,4):
I o. si r ( (-2,4).
Yl2l4l5 I 6 ( e-3'. siz)0
e) /(r) :
b)
p 1 0.3 1 0.1 1 0.2 10.4 I o, sir<o
si tt"tI'
c)
p 10.2 10,5 10.3
t) f(r):f[. tsen3r'
0, caso contrario.

35. Sean XyYdos variables aleatorias independientes e idénticamente distribuidas con f.g.-. M(t)
Demuestre qtte My¡y(t): Mx(t)llv(t) y qlue My-Y(t): Mx(t)M\'(-t)-

36. sea X con f.g.m. Mx(t), y sean a y b dos constantes. Demuestre que Moy¡6(t):"'btwx(ot).
Capítulo 4

Principales Distribuciones de Probab¡lidad

Hay que erplorar sistemáticamente el azar.


Facultad de Letras, París.

:r este capítulo se presentan, en detalle, algunos tipos de leyes que siguen las variables aleatorias, que
:f,arecen frecuentemente en problemas prácticos y cuyas propiedades deben ser conocidas.

-{ una variable aleatoria X que sigue una ley L de parámetros (pr,pz) Ia notaremos como X - L(pt,pz).

{.1. Distribución uniforme discreta


lla variable aleatoria X, que puede tomar un núrmero finito de valores, 7,2, ..., n, cada uno de
tiene la misma probabilidad de ocurrir, se dice que sigue una ley de distribución uniforme
-,,-. cuales
:':creta. Es decir,
Pr(X: k): -,1 k- L,2,''',n'
TL

E(X) : n*7
: :U Vaflanza
^2 -'t
VarlX)
t2
-
' equiprobabilidad es la forma m¿ís obvia de asignar probabilidades dentro de un fenómeno aleato-
:-,- cuyo comportarniento es desconocido. Esta ley aparece en los jr.regos de azar en los que todos
r,s jugadores tienen iguales posibilidades; además, esta ley es la básica en la simulación de eventos
u,=atorios mediante comput adora.

E¡emplos

-. octaedro, considerando la variable ale¿-Ltoria que describe el nrimero


Se lanza rrn dado en folm¿r de
de puntos que aparece. Detelnlirrar su esperanza y varlarlza.

717
118 Capítulo 4. Principales D istr ibttciones de P rob abilidad

Sol,tt,c'i,ón: Sc tir:rre que ?¿ - B )' sr: asigrtzr lir probabiliti¿rl Pt (X : i),8: 1; ,,trt,rt,""r,

(l
¡r-F1 8+1
E(,Y)
2
,2
,
Var(X) :
n,2 -I 64-r 27
12 1')

2. Una máquina registra, en rninutos conipletos, la di.felencia de tiernpo en e1 paso cic c¿rrrriones
por cierto lugar de la carretera. Se sabe clue ia diferencia máxima puede ser 9 rninutos. Si se
asrlme qne los arril-ros son aleatolios, calculal cl tiempo qlle se es1;eraría exista errtlc dos ¿rniJ¡os
consecutivos, su varianza y desviación estándar.
Soluci,ón: La variable aleatoria puede tomar los valores 7,2, ..., 9, que suponemos tiene dis-
tribución uniforme, por Io tanto,

E(x) : '+]:nrt:5min,
22
Var(X) : +: \/:6.62min2,
o : J6.6? : 2.58 min.

3. Un reloj está descompuesto y suena) aleatoriamente, a la hora en punto; es decir, puede sonar
a Ia una, a las dos, . .., a las doce; dando ese mismo número de campanadas. Determinar la
esperanza y varianza de la vari¿rble aleatoria que describe el núrmero de campanadas que se habrá
de esperar que dé el relo.j.
Solttción: Encontremos la esperanza y la varianza, considerando n: 12:

E(x) nll : 12+l


22 - 6.5 h,

n2 -r L44-I
Var(X) : 11.92 h2
72 72

4.2. Distribución hipergeométrica

Nos planteamos el siguiente problema: en una urna se tienen ly' bolas, n de las cuales son rojas y las
N -n restantes negras, de las cuales se extraen al azar r bolas; investigaremos la probabilidad de qne
el grupo eiegido contenga exactamente k bolas rojas. Aquí, k puecle ser cualquier entero entrc cclo l
TL A T.

l,a probabilidad es

Pr'(X : : Cf,C'f!,,
/,')
ci
Si consideramos l¿ proporción de irolas rojas en la composición inícial de bolas contenidas en la urna
n,
p : I y q : I- p, la fórmula de Ia probabilidad puede expresalse colno
' N"
Ck,,,Ch-"*
Pr(X: tt): ff, A:0. 1,...,mín{Np,r},

por Io que la probabilidad p de obtener una bola roja se puede introducir como un parárnetro que
define la ley.
4.2. Distribución hipergeornétrica 119

-\ ttrta variable ¿rlc¿toti¿r X c¡-rer sigue una ley hipelgeornétlica cle lralá,rnetlos (Iy',n,r) se la uota
.rrcr li;rItl c tl(A'. r¿.r').

Lir csp<rlauza cs

EIX) :'"' -,'n.


i\/

'.' la rrarianza

vartx\:rL(l_
,u¡\-, i,
/A/-r\ : rr(,
" ' (,^,, /l/-r\
¡/ \' 1,,) _ r) -ttt (¡v _ r/

Esta distribución de probabilidad surge en el análisis de muestras en control de la calidad de lotes


ie productos (en Ios cuales hay artículos útiles y defectuosos), en estudios censales de poblaciones
:nimales y al realizar muestreo sin reposición.
- a siguiente
fórmula de recurrencia facilita el cálculo iterativo de las probabilidades de la leyl:

(,nú-n)!(N-r)!
Po: ¡/!(¡/ -n-r)l
n'll-k r-17-k
Pk : Pn-r f ñ_n_r+k, k : I,2,.. .,T.

Ejemplos

-. En ttn grupo de 12 estudiantes 8 son sobresalientes. Por Iista se escogieron 9 al azar. a) ¿Cuál es
la probabilidad de que entre los estudiantes seleccionados hayan 5 sobresalientes?; b) ¿Cuántos
estudiantes sobresalientes se espera encontrar entre los seleccionados?
SoIución:

a) Si consideramos la variable aleatoria Z: <<Número de estudiantes sobresalientes entre los 9


escogidos>>, se tiene:
Total de estudiantes, N :72;
Total de estudiantes sobresalientes, n:8;
Total de estudiantes escogidos, r :9;
Número de estudiantes sobresalientes escogidos, k : 5.
Por Io tanto, Z - 11(72,8,9) y

8! 4l

Pr(Z :5) :
elqi : 5!3t4CI 14
c?, 12t - 55
9!3!

b) Calctrlemos la esperanza de Z:

E(Z): rn 9x8
¡'¡ 12
Se esperaría encontrar 6 sobresalientes.

Drane, J. W., Cao, S., lVang, L. y Postelnicu, T. (1993), "Limiting Forms of Probability \,Iass Functions via Recur-
-:- re Formulas," T he American Statist'icia'n, 47, 269-27 4.
L20 Capítulo 4. Púncipales Distribuciones de Probabilídad

En trn contlol de calidacl inch.rstli¿rl se ton¿r un lote dc 10 lriezas l)¿lra nna irrsirelción. ELr el lotc
Luy 8 piczas correct¿rs. Sr: tottiart al azat2 piezas. Form¿rr lil lcy clc clistlil.,rrcirin clel nírrnero clc
picz:rs corlcctas cntrc 1¿rs escogi<lir"s .y calcrrltrl su esl)eranz¿1.
Sc¡ht,c'ió'r¿: La variable l'(nirmcro
aleatori¿r. c-le piezas correctas entre las escogiclas) tiene los
siguientes r,¿lores: zt : 0, L2:7, :t:3 : ).
Ernplearerrios la ley hipergeométlica con A¡:10 (rrúrmero total cle piezas), ¡¿: B (núrrncro total
de piezas correcta^s) y r :2 (tarnairo de Ia muestra); es decir, Y - ft(10,8,2), obteniendo:

C3C3
Pr'()/ : 0) : 1
- 10x9 -
1

c?n 4,)
7x2
Pr(Y: 1) : c¿c¿ 8x2 16
c?o 45 45
Bx7
Pr()':2):W Ix2 28
45 45

Formemos la ley de distribución buscada:

w Yl o | 1 | 2

La esperanza es

E(Y) :6 ¡ 116 28
+'2x-:1.6.
45
-+1x- 45 45

4.3. Distribuciones de Bernoulli y binomial


Si al realizar un experimento una vez, solo hay dos resultados posibles, se tiene una prueba de Bernoulli.
Se acosttrmbra referirse a uno de los resultados corno <<ér'ito>>) qlle aparece con probabilidad p, y al
otro resultado como <<fracaso>>, que sucede con probabilidad g. Es evidente que p y q sol no negativos
y que Pl q: L.

Generalmente, se define la variable aleatoria que sigue una ley de Bernoulli asÍ:

La ley de probabilidad es

Pr(X:r):p, Pr(X:0) :t-p:q.

La esperanza y la varianza son iguales a:

E(X) :'p, Vat'(X): pq.

La ley de Belnoulli desempeña un papel fundamental en el análisis de fenómenos en los cuales solo se
tienen dos resultados mutuamente excluyentes, como es el caso de muchas preguntas en todo tipo de
encuestas o Ia cleterminación del sexo de los recién nacidos.
4.3. Distribuciones de Bernoulli y binomial L2L

Ejernplos

':. El m¿is ciolrocido es r:1 clel l¿trrzaruiicnto I


de una monecla hornogí:tr<tir, ac¡rí 2r 'I
,
Si Lay

desequiiiblio en Ia monecla p v .1 son clistintos cle I.2


Consi<lór'cse el experimento cousistente en Lanzar un dado y la variabie aleatori¿r X: <<el nírmero
de Jrnntos es nr.ayor que 4>>. Entorrces.

v : I t. si c*., € t5. tj):


^ 1 o, si c..r € {1,2,3,4}.

y las probabilidades son


Pr(X : o) : 3, Pr(X : t) : 1.
Según datos censales se ha establecido que en la población ecuatoriana el 52% lo constituyen
Ias mujeres y eJ. 48 % restante los hombres. Si se toma una persona al azar y se quiere conocer
su sexo, se tiene
t,
X- ! 0, si es mujer;
I si es hombre
v
Pr(X : 0) :0.48, Pr(X : 1) :0.S2.

: -pongamos que se reah.za una sucesión de n pruebas de Bernoulli e interesa conocer el número de
-ritos>> obtenidos, al margen del orden en que ellos se presenten. EI nirmero de éxitos puede ser 0,
'- 2'
"', n'
:- ilama binomial a la ley de distribución de una variable aleatoria discreta X
que describe el número
' ie éxitos en una sucesión de n pruebas de Bernoulli independientes, en cada una de las cuales la
-:.,babilidad de éxito es igual a p.

-'t-';ley de distribución binomial fue descubierta por James Bernoulli, quien Ia dejó escrita en su obra
Conjectandi,, ptblicada en 1713, después de su muerte ocurrida en 1705.

-' probabilidad se calcula mediante


Pr(X : k) : Ckpkq'"-k, k :0,I,...,fr.
tr-
-a variable aleatoria X que sigue una ley binomial de parámetros n y p se la notará como X-
3ir(.n,p).
:- -\ - Bin(n,p), se tiene que

E(X) : n'P, Var(X) - nPQ'

,iistribución
--'-:ra binomial tiene amplia aplicación en Ia teoría de mr.restreo cuando se puede contestar
r pregunta írnicamente con dos opciones (por ejemplo SI-NO).
; -álculo de ias probabilidades puede ser un proceso difícil porque los factoriales en los coeficientes
--- -,rriales crecen muy rápido, mientras que las potencias de p y q decrecen rápidamente. Por estas
:-r-)nes se utiliza la siguiente fórmula recursiva para su cálculo2:

Po : (l-p)"
pk :
n-._l-l;
pk,I--------;-
p
ff : I. Z)... jll.
K l--,
I-P
-)rane, J. U/. y otros (1994), op. cit
122 Capítulo 4. Principales Distribuciones de Probabilidad

Ejemplos

1. Su¡>ongamos que en r,rna población existen igual nirmero cle holnbres y de rnqjeres y consideremos
aquellas familias que tienen 4 hi.jos.

a) Formar Ia ley de Ia variable aleatoria que describe el núrmero de hijos varones en dichas
familias.
b) Calcular la probabilidad de que en una de estas familias haya miís de un hijo varón.
c) ¿Cuántos hijos varones se espera que haya en una familia que tiene 4 hijos?
1
Soluci,ón: )emos que p :
Sat y el número total de hijos es n : 4. Entonces, Ia variable
t
aleatoria X: <<Número de hijos varones>>, sigue una ley binomial de parámetros (4,|f 2); o sea,
X - Bin(4,t12).

a) Determinemos la probabilidades correspondientes.


o Si en la familia no hay ningún varón, k : 0:

Pr(x: o) : c3 (;)'(;)'-': *
o Si hay un varón, k: I:

Pr(x:1) : cl (;)'(;)^-': i
o Si hay dos varones, k:2:
n-'
Pr(X :2) : (;) :z
"1(;)'
o Si hay tres varones, /c : 3:

Pr(X:3) : cl (;)'(;)'-': i
o Si hay cuatro varones) le:4:

Pr(X : 4) : ct(;)' (;)*^: *


De manera que
xl o I r I z ls | ¿
e Llt6 I rl4 t¡to
l114l3lB I |
b) Debemos calcular Pr(X > 1) : Pr(X :2) -f Pr(X:3) +fr(X: a;. Esta probabilidad,
también se puede calcular mediante el evento complementario:

Pr(X>1) : 1-Pr(X<1) :1-[Pr(X:0) *Pr(X:1)]


/r 1\ 11
'\to't)-tc'
lfrl

c) EI número esperado de hijos varones se calcula mediante la esperanza de Ia variable aleato


ria:
/'2 nP:4'1:Z'
E(X):
De manera que se esperaría que en una familia que tiene cuatro hijos, dos sean varones.
4.3. Distribuciones de Bernoulli y binornial L23

Un dispositivo est¿i cornpuesto 1>or tres elementos que traba.jan independientemente. La pro-
l¡abiliclad cle f¿rlla de c¿rda elemento en Lrrr día es igual a 0.1. Formar la ley de distribución del
rrúmero de elementos qr-re fallan en r-ru día.
Soluciórt: La variable aieatoria X (<nirmero de elernentos que fallan>>) puede tomar los siguientes
valoles:
z1 : 0 (ningún elemento falló), 12: I (falló un solo elemento), 13 : 2 (fallaron dos elementos),
fr4:3 (fallaron tres elementos).
Las probabilidades de fallo de cada uno de los elementos son iguales entre si, entonces es aplicable
la ley binomial; por lo tanto, X - Bin(3,0.1):
pt : Pr(X : 0) : c3(o.t)o(0.9)' : 1. (0.1)0. (0.9)' :0.729,
pz : Pr(x : 1) : cl(o.t)t(0.9)' : 3.0.1. (0.9)2 :0.243,
ps : Pr(x : 2) : c3(o.t)'(0.9)t : 3. (0.1)2 .0.9 : 0.027,
p+ : Pr(X : 3) : c3(0.l)t(0.9)o : 1. (0.1)3. (0.9)0 :0.001.

Bn resumen,

3. Un examen consta de ocho preguntas de elección múltiple, cada una de ellas ofrece cinco al-
ternativas, de las cuales solo una es correcta. Para aprobar ei examen es necesario contestar
correctamente al menos tres preguntas. Si un estudiante se propone responder a las preguntas
al azar.

a) ¿Cuál es la probabilidad de que conteste correctamente todas las preguntas?;


b) ¿Cuál es la probabilidad de que el estudiante apruebe el examen?

Solución: La probabilidad de responder correctamente a cualquier pregunta es p: Ib : o.r.


Sea Z: <<número de pregurrtas correctamente contestadas>>, con Z -Bin(8,0.2).
a) Debemos determinar la probabilidad del evento Z :8:
Pr(Z :8) : C3(0.2)t(O.g)t-t : 1 . (0.2)8 . 1 : 0.00000256.

Lo que nos indica que es muy difícil que adivine todas las respuestas.
b) Para aprobar se debe contestar correctamente al menos tres preguntas, por lo tanto Z > 3-

Pr(Z>3): I-P¡(Z<3)
: r - lPr(Z : 0) * Pr(Z : I) +Pr(Z :2))
: 1 - c3(0.2)o(o.e)t - cA(0.2)1(0.8)' - c!10.2¡210.s¡6
: 0.20308.

Una agencia de turismo ofrece viajes a la amazonía. La utilidad mínima que le reporta uno
de estos viajes es 6 dólares por cliente. Ademiis, ofrece dos planes especiales, A y B. Por un
plan de tipo A, obtiene una ganancia adicional de B dólares y por un plan de tipo B, 13 dólares.
Además, se sabe que el 60% de los clientes que contratan planes especiales prefieren uno de
tipo A. Si una semana, la agencia vendió 25 viajes a la amazonía, 20 de los cuales no fueron
especiales, ¿cuál es la ganancia esperada?
Solución: La agencia vendió 25 planes: 20 normales y 5 especiales.
f24 Capítulo 4. Principales Distribuciones de Probabilidad

Sea X la irariable <<núrrnero de planes de tipo A venclidosrr, X - Bin(5,0.6).


L¿r utilidacl [/ c¡re le producen los via.jes vendiclos es:

U : ?5 z b.t .EX. + t3(5 - X).


,, Pi,, ,t *;*
',1,
Dado que E(X) : np : 5 x 0.6 : 3, la utilidad espe'acla es:

E(U) : 150+E(BX) +13E(5-X) :215-5E(X)

4.4. Distribuciones geométrica y binomial negativa

Consideremos una secuencia de pruebas de Bernoulli, con probabilidad de éxito p, pero en lugar de
contar el número de éxitos, nos interesa conocer el número de intentos hasta obtener el primer éxito.
Una sucesión de pruebas de este tipo se dice que forman un erperimento geométrico.

Una variable aleatoria discreta X que puede tomar un número infinito de valores I,2, . .., se dice que
sigue una ley de distribución geométrica de parámetro p (0 < p < 1), si la probabilidad de que X
tome el valor k es
Pr(X : k) : p(I - dk-t, k: I,2,. . .

A esta variable aleatoria se la nota como X- A(p). Su esperanza y su varíanza son iguales a

E(X) : p
1

Var(X) :
L-p
p2

La distribución geométrica se aplica en investigaciones de mercado y en muestreo, para conocer cuántas


compras se han de realizar en una promoción para obtener un premio.

Ejernplos

1. Si la probabilidad de que un estudiante pase una prueba de ingreso a una universidad es 0.25.
¿cuál es la probabilidad de que el estudiante pase la prueba en el cuarto intento?
Soluc'ión: En nuestro caso p : 0.25 y el número de intentos es k : 4, por lo que

Pr(X:4) : p(L-p)a-1
: 0.25(1 - 0.25)3 : 0.105.

2. En una promoción una marca de papas fritas incluye, en cada una de las fr"rndas, una de las
figuras de los tres chiflados. Si un comprador cree que hay igual número de figuras cle cada uno
de los personajes en Ia promoción, ¿cuántas fundas ha de esperar comprar para obtener las tres
figuras?
Solu"ci;ón: En Ia primera compra) siempre obtiene una figura que no se tenÍa, por Io tanto
E(X1) :1.
Para la segunda compra se tiene una probabiiidad de p2: Ió O" .orrr"*uir rrna figura nueva; así.

el nirrnero de compras que se debe realizar para obtenerla es E(-Y3; : 1: I


l)1
4.4. Distribuciones geontétrica y binotttial negativa 125

I
Un¿) r'cz (luo sc ticrrcrr rlos figruirs, la Prolrabilirlad <lc crLr:(¡rrtr'¿ll la figrrtzr clrc fallrr es p.l : -\¡cl
,)
r)

lrlirlrolo rlc <:on)l)ras (1uo sc osl)et¿t lcaliz¿rr'palir olrtc:rrcll¿r cs E(-Yr) : l:3.


,P:I

El rrtirrrclc-, tc.rt¿rl rlc courl)r¿ls qtle sc elsl)e1 ¿r r'€l¿rlizal cs

E(x) : E(xr) +E(X2) +E(x;r) : I -r- 1.5 +3 : 5.5.

Así,seeSI)erarea]izar.altncrios6cotriprasc1elproc1ttcto])araobte1leI'lacoIecciórrcclrtlpleta.<

-\hora, gclrcr'¿rlicernos la iclea de l¿r lev geométrica )/ nos intcresa cl núrrnero de pnrebtrs cle Bemoulli
:recesari¿ls hast¿ obtencl exactanlente r' éxitos.

-ua variable aleatoria cliscreta X que puede tomar nn núrmero infinito de valores r, r]_7,r'12,...,
=: dice que sigue una ley de distribución binomial ncgativa de parámetros (r, p) (r > 1,0<p<1),si
-r probabilidad de que X tome el valor k es
Pr(X : ¡x) : C'r--tpr'(t - r¡n-t, k : r','t" + l)r *2,...
:l parámetro r es el nirmero de éxitos que se desea obtener y ¡r es la probabilidad de obtener un éxito.

-\ esta variable aleatoria se la nota como X - BN(r,p). Su esperanza y su varianza son iguales a

E(X) : L
p
l-n
Var(X) : ,;

\ la ley cle distlibución l;inornial negativtr tamJrién se le llama distr"ibttczón d,e Pa,sco,l y tierre las nrisrnas
.:licaciones que la ley geornétlica.
Ejemplo. Una máquina. que está clañacla) ellvasa lat¿rs cle collserva de una en una y de rnauela
--,lependiente. Se considera que el 5% de lo envasado resulta defectuoso. Si Ia máquina se detiene
::lenas produce el tercer defectuoso:

a) ¿Cuál es el nirmero de Iatas producidas hasta qlle se detiene Ia máquina?


b) ¿Cuál es Ia probabilidad de que la máquina se detenga en la novena lata producida?
c) ¿Cuál es Ia probabilidad de que se detenga sin producir ninguna lata buena?

: 'l.ució'n: Definimos la variable aleatoria X: <<número <le latas producidas hasta que hayan 3 clefec-
--rsas>>; X BN(3,0.05).
-
a) Calculemos la esper¿rnza de X:
E(X) :l:,1
p 0.05 --Or-t.

Se espcrarítr ploclucir 60 lat¿rs htrsttr quc sr: detenga la máquirra.


b) Calcrrlemos Pr(X : 9):

Pr'(X : O; : CN I(0.05)3(1 - 0.Os;0-'r : 0.00257.

c) Quc ningunl lata ploducid¿r fuc bLrcna, significa qr.re las 3 plirueras l¿Lt¿s fueron defectuosas; es
decir, A; : 3.
Pr(X : 3) : C3_1(0.05)3(1 - 0.OS;:-;t : 0.000125.
t26 Capítulo 4. Principales Distribuciones de P robabilidad

4.5. Distribución de Poisson

Uria r'¿rriable ¿le¿rtoria <liscret¿ X quc puedc tonr¿rr rin núrrneLo infinito de valor.<ts 0, 1, 2, .,., sc dice
quc sigue una ley cle Poisson de pirrámetro ) () > 0), si la probabilid¿d cle qrre X tome el r,¿lor k es

)' sl':
Pr(X: :
k) "-
k! , k:0,r,2,...
A esta variable aleatoria se Ia nota como X - P(^).
Su esperanza y su varianza son, respectivamente, iguales a

E(x)
Var(X) ^,
^.

La distribución de Poisson se aplica a sucesos que se presentan en el tiempo o en el espacio, tales como
número de accidentes de tráfico, número de llamadas telefónicas a una central, número de goles que
marca un equipo en un partido, número de bacterias en una placa, entre otros.

El significado del parámetro ,\ es el promedio de aparecimiento del evento en n pruebas.


Esta ley de probabilidad es una bttena aproximación a la binomial cuando n es relativame¡te grande
(n > 30) y p pequeño (p < 0.05), poniendo ),:np
Puesto que muchas aplicaciones de esta ley dependen del tiempo, es conveniente ponerla en la siguiente
forma
^-).1r r¡rk
Pr(X : *) : : 0,I,2,...,
\-111|, A;

que se la interpreta como la probabilidad de que sucedan exactamente k eventos en un intervalo de


tiempo fijo de duración ú.

Para la ley de distribución de Poisson también existe una fórmula de recurrencia para el cálculo de
las probabilidades3, dada por

PO
:e -,\

Pt : P*-t x ^ k: L,2,. . .
k'

Ejemplos

1. En la construcción de ttn edificio el núnlero de accidentes es de tres por mes. Calcular l.


probabilidad de que en un mes: a) hayan dos accidentes; b) hayatr menos de 2 accidentes; c
hayan más de 3 accidentes.
Solución: si x es la variable <<número de accidentes en un mes>>) x -p(s).
a) La probabilidad solicitada es:

e-3:12
Pr(X:2):;:0.224.
3Drane,
J. W. y otros (1994), op. cit
D istribución de Poisson t27

b) La plobabilidad PL(X < 2) es:


Pr(X < 2) : Pr(X : 0) + Pr(X : 1)

: e-330 e-331
0! 1!

c) Esta probabilidad cs más córnodo calcularla mediante el evento complementario:

Pr(X > 3) :2) .' Pr(x : 3)l

:i t-(
'rii,i I--;;; f :li; "J'";f_:^'].: "''"
1r 2! * o " i:o'352'
"
El promedio de llamadas que pasan por una central telefónica en un minuto es igual a dos.
Hallar la probabilidad de que en tres minutos se hagan: a) 4 llamadas; b) menos de 4 llamadas;
c) al menos 4llamadas.
Solución: En este caso es necesario utilizar la segunda forma de la ley de Poisson con )- 2y
+
L
D.
¿.
--

Pr(X: a) ^ll"-
a) La probabilidad de que en 3 minutos se hagan 4 llamadas es

3)n _ .-66a
Pr(X:4) : "-z's(2.
41 24
:0.1339.

b) La probabilidad buscada es:

Pr(X < 4) : Pr(X : 3) +Pr(X :2) +Pr(X : L) +Pr(X :0)


63e-6 62e-6 6re-6
:J!-21-I!-u! 60e-6

Lr=
: 0.1512.
c) Los eventos <<se hicieron menos de 4 llamadas> y <<se hicieron al menos 4 llamadas>> son
complementarios; por eso, su probabilidad es:

Pr(X > 4) : t- Pr(X < 4) : 1 - 0.1512 : 0.8488.

Un libro se edita con un tiraje de 1000 ejemplares. La probabilidad de que un libro esté en-
cuadernado incorrectamente es igual a 0.01. Hallar la probabilidad de que el tiraje contenga
exactamente cinco libros defectuosos.
Solu,ción: Según los datos del probleman:1000, p:0.01 y k:5. El núrmero z¿ es grande yp
pequeño, por lo que utilizaremos la distribución de Poisson. Estimamos ),: np: 1000 x 0.01 :
10.

La probabilidad buscada es

0.000045 . 105
Pr(X:5) : "-10195
< : : 0.0375.

El gerente de una fábrica planea comprar una máquina r.ueva de entre dos tipos A y B. Por
cada día de funcionarniento, el núrmero de reparaciones X que necesita Ia máquina A es una
variable aleatoria de Poisson cuya media es 0.1ú, siendo ú el tiempo de funcionamiento diario
(en horas). El número de reparaciones diarias Y de la máquina B es una variable aleatoria de
Poisson con media 0.12t. El costo diario de operación de A es C¡(t): 10ü +30X2 y para B
128 Capitttlo 4. Principales Distribtrciones de Probabilidad

as Cp(¿) : + 301'2. ¿'Cuál cle las rni'rcluirra,s cl¿r cl rnerror (:osto esPclackr, si iur clí¿r clr: tralrtr.icr
S¿
corrsisl c crL: a) 10 lror'¿is'/ 1r) 20 Lolas'l
Sol,u,t:iri¡t,: El costo cspr:raclo pzrlrL;t os

E(C.1(¿)) E(10¿ + 30X2) - 10¿ + 30E (X2)


: 10¿ + 30 lvar(x) + (E(-x))'?]
: 10¿ + 30 [o u + (0.1¿)'?]
: 13/ - 0.3/r.

Igualrnente,

E(cB(t)) : E(sr + 3oY2): 8r * 3oE ()'2)


: 8ú + 30 [Var(Y) + (E(Y))'?]
: 8¿ + 30 lo.rzr + (0.12¿)21
: 11.6¿ + 0.432*.

a) Calculemos E(C¿(10)) y E(Cs(t0)):

E(CA(10)) : 13(10)+0.3(10)2: 160


E(CB(10)) : 11.6(10)+0.432(10)2 :159.2.

Si /, : 10, el menor costo tiene Ia máquina B.


b) Ctrlculemos E(C¿(20)) y E(C6(20)):

E(C.4(20)) : 13(20) +03(20)2:380


E(CB(20)) : 11.6(20) +0.432(20)2 :404.8.

Si ú : 20, la máquina A tiene una operaciórr rnás económic¿.

4.6. Ejercicios
Ley uniforme discreta

I IJn leloj automático registra la hora a la cual llegan los empleados de una oficinzr, err troras 1'
minutos completos. Una persona puede atrasarse irasta 59 minutos luego de la hora prefijada
para entrar, caso contrario se le corrsidera corno falta. Por cada minuto de ¿rtlaso se le col¡ra
trua multa de 50 centavos. Si los tiernpos de atraso se consideran aleatorios:

a) ¿Cuánto esperará una persona que se lc ciescuente por un día que se atrasó?;
b) Si en ia oficina hay 8 persoDas) que se atlasaron 2 r'eces al mes cada nna, ¿.cuánto ser'á el
descuento global esperado ¿r estos ernpleados de la oficina?

2. Pala el sen'icio de transporte entre dos ciudades hay 10 buses, cle los cuales 5 son de tiPo normai
(costo clel ptrsa.le 2 dólares) y 5 sou clc tipo r:spocial (costo clel pasa.je 3 dólales). Una pclsorra
tietre que r¡i¿r.iar etrtre las dos ciudades (ida y vuelta) durante los 5 dÍas la.borables clc I¿r senran¿r.
y p¿rr'¿r tLruts¡roltalse tonta el primcr lms c¡-re apalece en es¿r mt¿l) sin difelenci¿r' el tilto; ¡.cntinto
(:)Spelzllií gastar esta lrelsona en la sem¿rua?
li.

'

4.6. 4jercicios t29

Eu ttna escuela prirnaria se registró el nrimero de palabras por minuto que lcían los estucliantes,
cricontr'¿irrclose qtle leían r-rrr rnÍnirno de B0 palablasi y Lrrr máximo dc 139. Ba.jo la suposición cle <¡rc
la variable aleatoria clrte clcsclibe el núrrnero rlc palabrtrs leíc,l¿ls est¿i uuiformcmente clistribuicla.

a) Halle la probabilidad de qlle un estudiante, seleccionado al azar', 1ea ¿l menos 100 paltrbras;
b) Determine el nrinero de palabras qlre se esperar'ía lea nn estudiante selcccionaclo al az¿lr..
Sea X una varia,trle aleatoria que sigue una ley uniforne sobre {-1,0,1}. Calcule: a) E (Xa)
para k : I,2,... ; b) Var (X*)
Ley hipergeométrica
Una variable aleatoria X tiene distribución hipergeométrícaH(7,4,5). Calcule:

a) Pr(X:3);
b) la esperanzartllízando la definición y verifíquela empleando la fórmula de E(X);
c) la varianza de X.
En una línea de control de calidad se revisan 10 artículos, determinándose que hay 3 que no
cumplen con las especificaciones. Si se escogen al azar dos artÍculos, identifique los parámetros
de la ley y halle la esperanza de la variable aleatoria X, que describe el número de piezas correctas
entre las dos escogidas.

Para llenar 4 vacantes de contador se presentan 10 personas, 7 hombres y 3 mujeres. Salen


seleccionados 3 hombres y 1 mujer. Las mujeres aclrsan a1 empleador de discriminación sexual,
por lo que le llevan a juicio. Si el juez supone que la elección fue al azar, ¿puede decirse que
existió discriminación al hacer la elección?

El examen de graduación de los abogados consta de 50 temas. La forma de examinar es la


siguiente: por sorteo se eligen 6 temas de los que hay que contestar 3 para aprobar. Si el
estudiante ha estudiado solo 30 temas:

a) ¿Cuál es la probabilidad de los 6 temas sepa contestar correctamente a 3?;


b) ¿Cuál es J.a probabilidad de aprobar el examen?
Un auditor comprueba la contabilidad de una empresa y toma como muestra 3 cuentas de una
lista de B cuentas por cobrar. Calcule la probabilidad de que el auditor encuentre por Io menos
una cuenta vencida, si hay:

a) 2 cuentas vencidas entre las 8 seleccionadas;


b) 4 cuentas vencidas;
c) 7 cuentas vencidas.

Una empresa renta autos, a los que no les da el mantenimiento clebido, por lo que algunos
funcionan mal. IJn día tiene disponibles B autos para ser rentados, de los cuales 3 funcionan
mal. Ese día se rentaron 4 autos. Calcule la probabilidad de que:
a) ningún cliente haya recibido un auto que funcione mal;
b) por lo menos un cliente reciba un auto que funcione mal;
c) tres clientes reciban autos que funcionen mal.
Leyes de Bernoulli y binomial
Una variable aleatoria X tiene distribución binomial Bin(4,0.2). Calcule:
130 Capítulo 4. Principales Distribuciones de Probabilidad

a) Pr(X :2); c) Pr(X < 2); r.) Var(X).


b) PL(X > 2); d) E(x);

t2 Urra rnáquin¿r llena las ca.jas cle palillos de fósforo. En una Jrroporción del 10 % la rnáquina no
llena las cajas por completo. Se toman al azar 25 ca.jas de fósforos, calcule Ia probabilidad de
que no haya más de dos cajas incompletas.

13 IJna encuesta revela que el 20%o de la población es favorable a un polÍtico y el lesto es desfavo-
rable. Si se eligenseis personas al azar, se desea saber:

a) La probabilidad de que las seis personas sean desfavorables;


b) La probabilidad de que cuatro de las seis personas sean favorables.
t4 Una determinada raza de perros tiene cuatro cachorros en cada camada. Si la probabilidad de
que un cachorro sea macho es de 0.55, se pide calcular:

a) la probabilidad de que en una camada dos exactamente sean hembras;


b) la probabilidad de que en una camada al menos dos sean hembras.
15. En una investigación sobre el <<rating>> de los programas de televisión se detectó que se veía una
telenovela en el canal 6 en un 28% de los hogares. En una muestra aleatoria de diez hogares,
halle Ia probabilidad de que:

a) en cinco hogares se vea Ia telenovela del canal 6;


b) ningún hogar esté sintonizando la novela.
c) al menos en dos hogares se vea la novela.
16 En una instalación militar que dispone de 5 radares, Ia probabilidad de que un solo radar descubra
a un avión de combate es de 0.7.

a) ¿Cuál es la probabilidad de que sean exactamente 4 radares Ios que descubren al avión?;
b) ¿Cuál es la probabilidad de que por lo menos uno lo descubra?;
c) ¿De cuántos radares ha de constar la instalación para asegurarse en detectar aviones al
menos en un 98 % de las veces?

17 IJna aeronave dispone de 4 motores que funcionan independientemente, la probabilidad de que


falle un motor durante el vuelo es 0.01. ¿Cuál es la probabilidad de que en un vuelo dado:

a) no se observen fallas?;
b) no se observe más de una falla?
c) Si un avión puede seguir volando si al menos 2 motores continúran funcionando, ¿cuál es la
probabilidad de que el avión se accidente?

18 Supóngase que ia tasa de infección de una enfermedad contagiosa es del 25 %. En una oficina
hay 10 personas que se vacunaron contra la enfermedad y ninguna se contagió.

a) Determine la probabilidad de que ninguna pelsona se hubiera contagiado a pesar de que no


se hubiera vacunado;
b) De este resultado, ¿deduce usted que la vacuna es efectiva?

19. La probabilidad de que un estudiante obtenga el título de arquitecto es de 0.3. Calcule Ia


probabilidad de que de un grupo de siete estudiantes matriculados en primer curso:
4.6. Ejercicios 131

a) los siete finalicen la calrera;


1.,) ¿l rnenos dos ¿rcaben Ia carlr:r'a;
c) ¿.De cuárrtos ¿rh.rmnos ha de ccinst¿-ir nna pronloción para ¿rsegurarse de qtte al rnenos uno
culmine sll carrera) corr una probabilidact clel 99 %?

En un estudio rnedioarnbiental se deterniinó que la plesencia de mercurio en el agua enveneua al


207o de los peces en 24 holas. Para confirmar el resultado se colocaron 20 ¡reces en un tanque
con agua contaminada. Calcule ia probabilidad de que en 24 horas:

a) sobrevivan exactamente 14 peces;


b) sobrevivan por Io menos 10 peces
c) sobrevivan cuando mucho 16 peces;
d) Calcule el núrmero de peces que se espera que sobrevivan;
e) Calcule la varianza del número de sobrevivientes.

Una compañía petrolera va a perforar 29 pozos, cada uno de ellos tiene una probabilidad de 0.1
de producir petróleo de manera rentable. A la compañía Ie cuesta 100 mil dólares perforar cada
pozo. Un pozo comercial extrae petróleo por un valor de 5 millones de dólares. Calcule:

a) la ganancia que espera obtener Ia compañía por Ios 29 pozos;


b) la desviación estándar del valor de Ia ganancia.

Una línea aérea, habiendo observado que el 5% de las personas que hacen reservación no se
presentan para el vuelo, vende 100 boletos para un avión que tiene 95 asientos. ¿Cuál es Ia
probabilidad de que, el momento del vuelo, haya un asiento disponible para cada pasajero?
tl En un examen se plantean 10 preguntas a las que debe responderse verdadero o falso. Un alumno
-)
aprobará el examen si aI menos 7 respuestas son acertadas. ¿Qué probabilidad de aprobar tiene
un estudiante que responde todo al azar? ¿Y uno que sabe el 30 % de la asignatura?
Leyes geornétrica y binornial negativa
Cuando se graba un comercial de televisión, la probabilidad de que un actor recite correctamente
0.3. ¿Cuál es la probabilidad que el actor recite correctamente su diálogo
el diálogo de su toma es
en la sexta vez?

'l En un examen el profesor real\za varias preguntas a un estudiante. La probabilidad de que el


estudiante responda correctamente a cualquier pregunta es igual a 0.9. El profesor interrumpe
el examen apenas el estudiante manifi.esta el desconocimiento de la pregunta hecha. Se reqr-riere:

a) formar la Iey de distribución de la variable aleatoria que describe el número de preguntas


que realiza el profesor;
b) hallar el número esperado de preguntas que ha de realizar el profesor.

-'a. La probabilidad de que un tirador haga blanco en un solo disparo es igual a 0.2. Al tirador se
le entregan cartuchos hasta tanto no yerre el tiro.

a) Forme la ley de distribución que describe el número de cartuchos utilizados;


b) ¿Cuántos cartuchos se espera que utilice el tirador?

En un examen, en el que se realizan preguntas sucesivas, para aprobar hay que contestar correc-
tamente a 10 preguntas. Suponiendo que el alumno sepa el 80 % de las respuestas, ¿cuál es la
probabilidad de que apruebe en las 12 primeras preguntas?
t32 Capítulo 4- Principales Distribuciones de Probabilidad

28 Urra.jr,rgacloladctenisgarracl 33%delos¡rartidosqucrealiza. Ella.jrrgtrrtienLrntornr:omientlas


rro sea eliminacla por peldel r.rn partido.

a) Halle la probabilidad de quc sca elirninacla en cl segr-rndo particlo;


b) Si para ganar el torneo se deben ganar 5 paltidos consecritivos, ¿,cuál es la probabilidad de
que la.jugadola pierda en la final del tornco?;
c) ¿.Cuántos partidos se espela que 11egue a jugar durante cl torneo'?

29 {Jna marca de refrescos tiene impresas, en cada una de las tapas, una de las fi.guras de los 4
jinetes del apocalipsis, y quien retina la colección completa ganar'á un premio. Si nn comprador'
cree qlre hay igual nútnero de figulas de cada uno de los pelsona,jes en la promoción, ¿cuántos
refrescos ha de esperal comprar para ganar el premio?

30. Un pájaro de cierta especie come gusanos de una población muy grande. Estos glrsanos pueden
comer) a su vez) de una planta venenosa) de manera que si el pájaro come un gusano envenenado,
deja de comer gusanos ese día. Suponiendo que el 33% de la población de gusanos come de ia
planta venenosa) hallar el número medio de gusanos comidos por un pájaro en un día.

31. Un lepidopterista solo está interesado en los ejemplares de una clase de mariposas, que consti-
tuyen el75To de todas las mariposas de la zona. Hallelaprobabilidad de que estapersonatenga
que cazar 8 mariposas de las que no le interesan antes de encontrar:

a) un ejemplar de la clase deseada; b) tres ejemplares de la clase deseada.

32. En una fábrica, el departamento de contlol de calidad, revisa los lotes de piezas que entran, de
acuerdo con el siguiente criterio: se van extrayendo piezas sucesivamente y el lote es rechazado
si se encuentra Ia primer pieza defectuosa antes de la vigésima extracción. Si conocemos que el
2% de piezas son defectuosas, ¿cuál es la probabilidad de que un lote sea rechazado?
t.f En una fábrica, se examinan las piezas que salen de una determinada máquina. Supongamos que
si en una hora salen mas de 5 piezas defectuosas, la máquina debe ser recalibrada. Si suponemos
qrre la probabilidad de que una pieza sea defectuosa es 0.2, y es la misma para todas las piezas
fabricadas ; encontrar:

a) la probabilidad de que se tenga que recalibrar Ia máquina cuando se han inspeccionado 20


piezas;
b) la probabilidad de que se recalibre la máquina sin haber producido ninguna pieza buena;
c) El número esperado de piezas que se deben inspeccionar.
QA
Se sabe que) aproximadamente, el 20 % de los usuarios de Windows no cierran el programa
adecuadamente" Supongamos que el Windows está instalado en una computadora pública que
es utilizada aleatoriamente por personas que actúan independientemente nnas de otras.

a) ¿Cuál es ia probabilidad de que el terccr usuario sea el primero que cierra adecuadamente
el Windows?;
b) ¿Cuál es el número medio de personas que usan Ia computadora desde el momento en qlle
se enciende hasta que alguien no cierra el programa adecuadamente?

Ley de Poisson
35. Sea Y una variable aleatoria que sigue una distribución de Poisson de medía ),:2. Calcule:
4.6. Ejercicios 133

a) Pr-(Y :4): c) Pr()' > 4);


lr) Pr'(\/ 14): d) PL(l' > 4lY > 2),

16. El prornedio cle ll¿rnaclas clue recibe urra ccntlal telcfórrica cn Lur rninuto es cle 1.5. Halle la
plolrabilidad de que en cuatro rninntos se rec:il;¿rn:

a) 3 llamadas: c) rro mouos tle crratLo y no rnás rle sjclr'.


b) rnenos de 3 llarnadas;
J-
)1. Snponga quc el nir.rnelo de pilcientes que ingrcsan a I¿l sala de emergerrcia de trn hospital cn la
noche del viernes tiene una distribución de Poisson con media igual a 4. Evalúe las probabilidades
de que:

a) durante una noche haya exactamente 2 pacientes en la sala de emergencia;


b) durante la noche hayan más de 3 personas.
38 En un hotel, el promedio de pedidos de servicio a la habitación es igual a 2 cada media hora.
Halle la probabilidad de que en una hora se reciban:

a) 3 pedidos; b) menos de 3 pedidos; c) no menos de 3 pedidos.

19. Una fábrica de gaseosas recibió 100 botellas vacías. La probabilidad de que al transportarlas
resulte una botella rota es 0.03. Halle la probabilidad de que Ia fábrica reciba rotas:

a) exactamente dos botellas; b) más de dos; c) por lo menos una.

El lrromedio de automóviles que entran en un túrnel en una rnontaña es de un carro cada 2


minrrtos. Si un núrmero excesivo de autos entra al túrnel en un período corto de tiempo se genera
una situación peligrosa. Encuentre la probabilidad de que el núrmero de autos que entran al
tirnel en un período de 2 minutos exceda de tres.

Se supone que el núrmero de bacterias por mm3 de agua en un estanque es una variable aleatoria
X con distribución de Poisson de parámetro ) : 0.5.

a) ¿Cuál es la probabilidad de que en 1mm3 de agua del estanque no haya ninguna bacteria?;
b) En 40 tubos de ensayo se toman muestras de agua del estanque (1mm3 de agua en cada
tubo) . ¿,Qué distribtición sigue la variable Y: <<número de tubos de ensayo, entre los 40,
qlre no contienen bacterias>>? Calcule Pr(I' > 20);
c) Si sabemos qlre en un tubo hay bacterias, ¿cuál es la probabilidad de que haya menos de
tles?

Urra planta ernbotelladora de refrescos tiene una máquina vieja para llenar botellas. La máquina
produce una ganancia de 100 dóiares por dÍa de traba.jo; sin embargo, se descompone en promedio
2 r'eces cacla 10 días. Si )' replesent¿r el núrrnero de descompostur-as clurante el funcionamiento
de la rnáquina y ú es el núrmero de días que traba.jó lzr máquina, la ganancia generada por Ia
máqr.rina se expresa por G : 100ú -50Y2. Dctermine Ia ganancia esperada en 10 días de trabajo.

En un¿ población el I por ciento de la población sufi'e de daltonismo, ¿cuál es Ia probabilidad


de quc entre 100 personas:

a) ninguna padezca de daltonismo;


b) 2 o más Io padezcan;
134 Capitulo 4. Principales Disúrib¿¡ciorres de Probabilicl¿ul

<:) , CLtiirr grarrrlc <lel¡tt scl lttr¿l lrrtt<lstl¿r ale¿rtolia (c:orr lecrrrl,lrrzo) lr,rrir (iri,, i,r lrlrrlr;rlrili,l'1, I ,lr,
rlttc al ltren()s tur¡I l)oISorr¿r tcrrg¿l <l¿ll rtrrisrrro so¿r llrirl()r o igrral ¿t ().1.1i'

44 ]llt tttt lrosrltte rlc c;eclt'o t:l rrúru<:ro rk: ¿ir'l>olcs <;orr plirgrr pol lrcclár'c¿r )' tj(,rlr, rrrr;r <[istr ilrrr i,,rr
c-lr:Poissorr 2(10). Los ¿itl¡olcs c:ort 1.,lir¡1r'r. se tr¿rt¿rn con insccticicl¿t ¿r urL co:jt() (lo 3 rlcil¿rr(.: l)()r
át'l¡ol; ¿rrlcrnás. clr: urt costcl fijo. por rlso del r:quipo y tr'¿lir,jl)otte. igual ¿r 50 clril¿rr<ts. I{¿rllr,,'l
vaiol cspcr¿rclo y la dcsi'i¿tcióu estárLcl¡rr'<.lel cost,o total C de firrnigai'5 hect¿ilcirs rlc lrosrlrrr'.

45 Para cl control cle calidacl de discos para corrrplrtadora se errrl)le¿ un dispositivo clcctr'órrico <¡rrc
cltent¿r cl nirmelo de bytes defectuosos. Una marca de discos de computadora tierie rrrL plouLcr lio
<1e 0.1 bytes defectlLosos pol disco. Calculc el porcenta.je clc <liscos que:

a) rro tienen defectos;


b) tienen algúrn defecto;
c) Halle la probabilidad de que ninguno de dos discos inspeccionados, rringuno tcnga defcctos.

46 EI núrmero de automóviles que llegan a un estacionamiento, que tiene una capacidad de 12 ¿rLrtos.
es una variable aleatoria que sigue r-rna Iey de Poisson, con Lln promedio de 4 pol hora. Si al
inicio del día el estacionamiento está r'acío,

a) ¿cuál es la probabilidad de que se llene durante la primera hcra?;


b) Calcule la probabilidad de que lleguen menos de 30 vehículos en un turno de 8 hor-as.

47. Si hay en promedio, un 1 por ciento de zurdos, ¿cuál es la probabilidad de tener porlo menos 4
zrirclos entre 200 personas?

48. En una investigación de mercado se detelminó que el 2 por ciento de Ia pobiación torna regultrr-
rnente Llna marca de yogurt. Se escogió una muestra de 300 personas, determine Ia prolrabiii<ltrti
de que:

a) exactamente 5 personas tomen yogurt de esa marca;


b) a Io más tomen 3 personas;
c) al rnenos tomen 5 personas.
49. La tasa mensual de suicidios es de 4 por un millón de personas. En una ciudad cle 500 000
habitantes, halle probabilidad de que:

a) en un mes dado, hayan menos de 5 suicidios;


b) ¿Será sorprendente que durante nn año, al menos en dos meses ocurran más de 4 suicidios.'

50 En estudios demográficos sobre matrimonios que tienen algúrn tipo de planificaciórr farniliar. c,i
número X de hijos por matrimonio es igual a 2, salvo ciertas clesviaciones debidas al azar. St'
ha comprobado que, o bien
X:2-(Y+1),
donde Y es nna variable de Bernoulli de parám etro p - 0.3, y ésto ocurre con probalriiiclact 'p ::
(pues se cr.rmple en el 50% cie ios matlimonios), o bien es

X:2* Z,

dorrde Z sig:ue una distribuciórt de Poisson de parámetro ,\; v esto seguudo ocul'r'e <:ou tarnbi(ll-
con probabilidact p::. Halle:
2

a) el valor de ), sabiendo que E(X) : 2;


b) la probabilidad de clue tur matrimonio terrga Lrno o d.rs hijos.
4.7. Distribución unifornte 135

4.7. Distribución uniforme


-,r k)\' rlc <listiilnrc;irirr cle Plolralrilitiacl tLu¿t'"'aliablc aleatoliir (:olItllIlt¿t
cler X sc ll¿rrrr¿ rr,rtli.fornte si e.t
L irrtcrr''-rlo lr¿. bl la funciórr rle clensirlad es constaute e igual a

rl,
I b-" si z e 1".ü]
f(r): 4 =-1.
I o, sirf [o.ü]

-i esta r.¿rriable aleatoria se la nota como X -Ula,bl.


-
¿r función de distribución es
( 0, siz<a;
Í,-o,
F(r) : ) si¿(r <b;
b-o"'
1, siz>b.

Figura 4.1: Funciones de densidad y de distribución de una variable aleatoria uniforme.

a esperanza y la varianza son iguales a:

E(x) a* b
2'
Var(X)
(b - ")'
t2

Esta ley es ei análogo continuo de la distribución uniforme discreta, que asigna igual probabilidad a
-¿da resultado de un experimento. Tiene amplia aplicación en problemas de simulación estadística
-,-en fenómenos que presentan regularidad en su aparecimiento, pero qne no es posible usar variabies

-iscretas, como cuando dependen dei tiempo. También, el error originado por el redondeo de un
---imero se describe satisfactoriamente mediante una ley unifbrme en el interv.t" [-:,:l
L 2 2l

Ejemplos

i. Una variable aleatoria X sigue una distribución uniforme sobre [-2,3].


a) Calcular Pr(X : 1), Pr(X < 1.3), Pr(lXl < 1.5);

b) Hallar un valor de ú tal que Pr(X > ú) : 1.


3'
Solu,ción:
136 Capítulo 4. Principales Distribttciones de ProbabíIidacl

a) Estirnernos Ia función cle clensicla<I.


Salrcrnos <¡rer ./(r:) : 0 si t: ( l-2,31.

Se ticrren los línriters a,: -2, ü:3; por 1o c|re,/(z)


11 | .) .)l
l-:, 'l '
3-(-2) 5
La función cle densiclacl qr-recla así:

I
,f (r) : I t.sir€¡-2,31;
I 0, sir(l-2,3).
r pr(X - r) : f ,rrd.r:0. porque X es una variable aleatoria continua.
.[,'
o Pr(x < 1.g) : l'" f (r)d.r: dr :0.66.
-m .t L,'!,
o Pr(lxl < 1.5) : Pr(-1.5 < X < 1.5) : ['
rtr[(r)dt
: l'
r'rtr^,
:l : 0.6.
b) Calculemos Pr(X > ú):
/'oo ' ,'3 /m
Pr(X >L)
' I
.lt tf"ld.*:l)ar+l
,lt s .ls
o¿*
lrl3
t-l
3 -t
Lblr.

bntonces.
3-¿ :",corr 1
lo crr l r:
4
b 3.

2. Dos amigos, Roberto v Fernando, deben encontrarse en una parada de bus entre las 9:00 r
10:00 h. Cada uno esperará r-rn máximo de 10 minutos. ¿Cuál es la probabilidad cie que rro se
encuentren, si Fernando llegará a las 9:30 en punto?
Soluci.ón: La variable aleatoria X que describe el tiempo de llegada de Roberto puede tomar
cualqniervalorentrelas9:00y 10:00hoentre0y60minutos. DemaneraqueX -Ula,b] ysu
f'nción de densidad es
( :, si o ( ú < 6o;
/(f) :{ t'0
( 0. caso contrario.

Puesto que Fernando llegará a las 9:30 o a los 30 minutos después de las 9 y esperará a lo más
10 minutos, Roberto no se encontrará con Fernando si llega de g:00 a rnenos de 9:20 o si llega
después de las 9:40.
Entonces, la probabilidad de qne no se encrrentren es

Pr[(0 < x <20) o (40 < X < 60)]


r -,, fuo d'
: l,l''o 6sdt t
- .lno oo
: 11
5+5:o'667'
3. En una empresa falm¿céutica Lln proceso se detiene cnando deja de funciorrar un esterilizado:
hasta que llegue su repuesto. El tiempo de entrega f está uniformernente distribuido en nr-
inten'alo de uno a ciuco dí¿rs. El costo C de esa falla ¡' la parada complende un costo fijo d.
200 dólales de Ia refacción v uri costo valiable que arlr-nenta en ploporción a T?, de modo que

C :200 + l2T2
4.8. Distribución exponencial r37

a) Ctrlculirr la probabilid¿rcl de qrre el tiempo de espela sea cle: clos <lías o rrtás.
b) Calcrrlar el costc¡ esperirclo cle r-rna falla.
Soht,ci,<i'n:

a) trl tiempo de entrega está uniforme distribnido cle trno a ciuco clías, de rnodo que
o":lyb:5:
si1(ú<5;
f(t):
caso contrario.

Así,
Pr(r > ,):
l, f (L)dt: .[r'Lor:1,r - 2):X
b) Por las propiedades de la esperanza, E(C) : 200* I2F,(f\. Calculemos E("2) : Var(?)*
(E("))2:

E(r'): ry.(+)'
(5-1)2-/r+s\':I
: r2-r\, :T
)
Así,
E(c) : 2oo + t, (+) : 2oo + t24: r24.
EI costo esperado de una falla es de 324 dólares.

{.8. Distribución exponencial


Se dice que una variable aleatoria continua X sigue una ley de distribución erponencial de parárnetro
,, si su función de densidad es
sir(0;
f(r)-l lo,
)"-^', sir)o;
-rnde ) es una constante positiva. Notaremos como X - t(,\).
I a función de distribución correspondiente es

F(r): sir(0
{ ?'- -\r, si r ) 0
"

Figura 4.2: Frurciones de densidad y de distribución de urra r'¿rli¿rble ¿rlc¿rtolia expoueucitrl.


138 Capítulo 4. Principales Distribuciones de Frobabilídad

La esperanza y la'r'arianza son iguales a:

E(x) : +,
¡
Var(x) : I.\l'
Esta ley sLlrge en problemas de genética, duración de aparatos electrónicos o desintegración lacliactiva
También, es Ia principal en la teoría de los procesos ie Markov.

Relación entre las distribuciones cxponencial y de Poisson

Sea X la variable que cuenta el número de eventos que ocurren en el tiempo [0,ú] , con media )ú:
entonces,

Pr(X: k) :+. k_ 0,t,2,...

Sea ? eI tiempo que transcurre hasta que sucede el primer evento de Poisson. El rango de 7 es el
intervalo [0, -[ y su función de distribución es

F7(t) :Pr(? < t) : t- Pr(? > t) :1 - Pr(X - 0) : I-


"-^t,

donde el evento Q > t) indica que el primer evento de Poisson ocurre después de ú, o lo que es io
mismo, que no ocurre ningún evento en el intervalo [0,ú];es decir, (T > t): (X:0).

También, se tiene que


fr(t): F+(t): \.-Át, ¿ > 0.
Ejemplos

1. Una variable aleatoria continua Y está distribuida según una Iey exponencial t(3).

a) Hallar la probabilidad del resultado de la prueba: Y esté en el intervalo (0.13;0.7);


b) Determinar su esperanza y su desviación estándar.
Soluc,ión: Como Y - t(3),
: ( 0, siy<0;
/(v) Je-3a, si y )
{ 0.

a) Determinemos Pr(O.13 < Y < 0.7):


0'7
PL(0.13 <Y <U.7) : 3e-3'! ily
.13

.55

b) Se tiene que

E(v)
11
) 3'

"(Y)
: \Ñ;(n:
D ist r ibución exp onenc ial 139

El tiernpo dut'ante el cual las baterías para teléfono cehrlar trabajan en folma efectir,a hasta que
f¿rllan se distribuye sr:gúur un modelo expouencial, cr)n Lrn tiempo promcdio de falla cle 500 holas.

a) Calcular la probabilidad de que una bater'ía funcione por rnás de 600 horas;
b) Si una batería ha trabajado 350 horas, ¿cuál es la probabilidad de que trabaje más de 300
horas adicionaies?

Solución: Consideremos la variable aleatoria X: <<tiempo que dura Ia batería hasta que falla>>.

E(X) :500: ): X
# r -E(#). Sufuncióndedistribuciónes:
Como
], ".'to'ces
( o, sir<o;
F(r): siu )0,
{,_ "_rlsoo,
a) Calculemos Pr(X > 600):

Pr(x>600) : 1-Pr(X<600) :l-F(600)


: I - ( t- e-6oo/500'\ : 0.301.
\/
b) Si la batería ya trabajó 350 horas, queremos conocer la probabilidad de que trabaje más
de 650:

Pr(X > 350 + 3001x .---/


> 350)
Pr(X>650): 1-F(650)
: :J;-;+
Pr(X>350) 1-F'(350)
1-(1 '-650/500\
:
1-(116:o'54e'
El número de clientes que llega a una ventanilla de un banco sigue una distribución de Poisson
con media de 4 personas por minuto. ¿Cuál es Ia probabilidad de que el primer cliente llegue:

a) dentro de los 30 segundos después de haber abierto Ia ventanilla?


b) mrís de dos minutos después de abrir la ventanilla?

Soluc'ión: Tenemos las siguientes variables aleatorias:


X: <<número de clientes que llegan a la ventanilla>>, X - P(4).
T: <<tiempo que transcurre hasta que llega el primer cliente>>, T - €(4), con función de densidad

.fr(t):4"-nt, ¿>0.
a) La probabilidad de que eI primer cliente llegue en los primeros 30 segundos es

,.0.5
Pr(?<0.5)' : | +"-n'¿ú:0.86b.
.lo

Obsérvese que también se cumple que

Pr(? < 0.5) : 1 -Pr(T > 0.5) - 1 -Pr(?: 0) : t -e-4(0'5) :0.865.


b) Se tiene que

Pr(? > ,): I, 4e-atdt: o.ooo335.


I4O Capítulo 4. Principales Distribuciones de P robabilidad

4.9. Distribución normal

La ley de probabilidad de una variable aleatoria continua X se llama nortnal si s:.:t función de densiclad

f (') : -!'-''-u)212o2 r e (-oo, oo)


,/2tro '

donde É¿ es un valor real cualquiera yd es positivo. A tal variable aleatoria se notará como X
.M(p,o').
La función de distribución correspondiente es la integral

F(r): ¿t.
t/2"" "-(t-ü2lzo2

Figura 4.3: Funciones de densidad y de distribución de una variable aleatoria normal.

La esperanzay la varianza son iguales a

E(X): p, Yar(X) :62

Por esto, se dice que es una ley normal de media ¡t y varianza o2. Obviamente o es la desviaciól
estándar de X.

Observemos que la función de densidad de una variable aleatoria X - Jtí(p,o2) es simétrica respect,
a Ia recta r: IL.

Esta ley tiene amplia aplicación en física, economía, ingeniería y biología, pues como una primer,
aproximación- se asume que los fenómenos siguen una ley normal. También, juega un papel mr-l-.'
importante en toda Ia teoría estadística ya que, bajo amplias suposiciones, el comportamiento de l-
sumas de magnitudes aleatorias es aproximadamente normal, lo que constituye el Teorema del LÍmir-
Central.

El nombre de normal fue aplicado a esta ley de distribución por F. Galton en 1889, no sin reparos p-l
otros científicos, porque este nombre puede hacer pensar a las personas que las otras distribuciont:
son) en uno Ll otro sentido, anormales. En el plano anecdótico, remitámonos a lo que se dice en =-
libro de Mosteiler, Rourke y Thornas (1970, p. 226) respecto al nombre de esta ley: <Algunas vecr:
la distribución normal es llamada gaussiana, especialmente en la ingeniería y la física. En Francia =-.
llamada laplaciana. Estos nombres son usados, probablemente, porque la distlibución fue inventac"
por de Moivre.>>

Un caso importante de esta ley de probabilidad se tiene cuando F:0 y o2 :1, que se denomi-:
4.9. Distribución norrnal t4t
,t¡ttnol. cstti,¡tdot'(^/(0. 1)), sus funcic¡ues cle clcusid¿rci y distlibucicilr sorr

L
7\:'/
^t-.\
,ryi.
n-"'¡2. ., € (-co. rc)
.1. <

o(,) : t'/2
cu,
h [__"
:espcctir,aruente. Obsérvese qlre) en este caso particular, la función de densidad se nota mediante cp y
-a ftrnción clc clistribución por ó.

Si se ticnc urra variable aleatoria X - N(p,,o2), pr-redeu calcularse los valores de su función de dis-
:ril¡ución lncdiante el empleo de la ley normal estándar aplicando la trausfolmación

F(r\ :o l" - P\ .

\o /

distribución de la ley normal estándar no se puede dar como una función explícita, sino
li-a función de
=tlamente en forma de una integral, por lo que se emplean tablas, como la que se encuentra en la
Tabla 1 del Apéndice, para calcular los valores de O(z).

Si X - Jt[(p,o'), se puede dar la siguiente regla empírica que da el área bajo Ia curva limitada por
-na, dos y tres veces la desviación estándar (ver Figura 4.4).

Figura 4.4: Áreas bajo la curva de la distribución normal.

l. El área limitada por el intervalo lp - o, p+ ol contiene un área igual a 0.682.

2. El área limitada por el intervalo lp-2o,¡tj-2ol contiene un área igual a 0.954.

3. El ¿irea lirnitada por el intervalo lp-3o,p"*3ol contiene un área igual a 0.997.

Ejemplos

l. La esperanza cle una variable aleatoria X normal es igual a 6 y su varianza es 16. Escribir la
ley cle la variable aleatoria y calcular:
a) Pr(X < 3); b) Pr(X > a); c) Pr(4.5 . * .r)t
d) Encontrar el valor de ú de manera que se cumpla que Pr(X { ú) : 0.9264.
SoLu,c'ión: La espelanza es E(X) - lL:6 y la valianza .s 02 :16, por lo que o:4; etttottccs,

r@) :
#r""p ( g#) : #".' (-q#)
L42 Capitulo 4. Principales Distribuciones de Probabilidad

a) Calculenros Pr'(X < 3):

Pr(X < 3) : F(3) :. l+)


\4 )
: (D(-0,75) :0.2266.

b) Calculernos Pr(X > 4):

Pr(X>4) : 1-Pr(X <4):1-F(4)


1-o(4-6) :t-o(-o.b)
,-o.s\aJ:o6er5.
c) Calculemos Pr(4.5 < X <7):
Pr(4.5 < X < 7) : F(7) -F(4.5)

(.:,'*) :'{0 ") - o(-0 375)


: ;f/)#
d) Se tiene que

Pr(x < ú): é rl-j)


\4)
:0.e264.

Por otro lado, en la tabla de Ia ley normal, se encuentra que (D(1.45) :0.926q; es decir, se
cumple que
t : t'nu'
Entonces, t: 1.45 x 4 * 6: 11.8. ^u
2. El perÍmetro craneal de los hombres, en una ciudad, es una variable aleatoria de media 60 cm ¡'
desviación estándar 2 cm.

a) ¿Qué porcentaje de los hombres tienen un perímetro craneal entre 57 y 64 cm?;


b) ¿Qué perímetro craneal debe tener un hombre para que el 16.6 % de sus paisanos <<tengan
m¿is cabeza que él>>?;
c) ¿Y cuánto para que el 35.2 To tenga menos?

Solución: Se tiene la variable aleatoria X: <<perÍmetro craneal de un individuo>> , X - N(60,22).

a) Buscamos Pr(57 < X <64):


Pr(57<X<64) : F(64) -^F(57)
:'"'
:;,*-,);:fr) -o(-1 5)

El9L% de la población tiene un perfmetro craneal entre 57 y 64 cm.


b) Debemos hallar el valor de c de manera que Pr(X > n) - 0.166.
Pr(X >z) : 1-Pr(X (r) - l-f'(r) :0.166,
F(") : 1-0.166:0.834,
o l" .60\ = 0.8s4.
\2/
4.9. Distribución normal 143

Por otro lado, eu la tabla de la ley norm¿,rl est¿inclar se observa que Q(0.97) : 0.834.
Entonces,
r-60 : 0.97.

De donde, z:61.94cm.
c) Ahora, hallemos z tal que Pr(X < z) :0.352.

Pr(X < r) : F(r) :0.352,


o l" ,60\ : 0.352.
\2)
En la tabla leemos que O(-0.38) :0.352. Entonces,

z-60 :
-0.38.

Por tanto, r :59.24cm.

En una fábrica de autos un ingeniero está diseñando autobuses pequeños. Sabe que la esta[ura
de la población está normalmente distribuida con media 1.70 m y varianza 02, con o :5cm.
¿Qué altura mínima deberán tener los autobuses para que no más del l% de las personas golpee
su cabeza con la parte superior del autobús?
Solución: Sea X la variable aleatoria <<estatura de las personas>, X - N(t.70, (0.05)2). De-
nominemos h ala altura mínima para que la probabilidad de que una persona golpee su cabeza
con el techo del autobús sea del LTo; es decir,

Pr(X>h) : 0.01

Pr(X > h.) : 1- Pr(X < h) : 1- F(h) - 1-. (%*p) ,

donde .F es la función de distribución de la variable aleatoria X. Ahora bien,

1-oln;=t:to)
0.05
: o.or.
\ /
oft¿-1'70\
-\ o.o5
: v'v! :o.ee.
r1-0.01
)

Igualando los argumentos de la función é da:


h - r.70 : 2.33.
0.05
: 1.70 + (0.05)(2.33) : 1.817.

Es decir, el ingeniero deberá diseñar el autobús con una altura de 1.82 m.

En una ciudad habitan 150 mil familias, cuyo ingreso anual sigue distribución normal con media
de 8000 dólares y desviación estándar de 1200 dólares.

a) ¿Cuántas familias tendrán ingresos anuales menores a 6600 dólares?;


b) El SRI dice que pagarán sus impuestos aquellas familias que se encuentren en el último
quintil. ¿A partir de qué r¡alor una familia debe pagar impuestos?

Solución: Se tiene la variable /: <<ingreso familiar anual>>, X -.A/(8000,12002).


l+J Capítulo 4. Principales Distribuciones de Probabilidad

a) I)clrr:rlos h¿rll¿rl lrr prol-ral-riliclacl Pr'(1 < 6600).

pL(1 6600) : F(6600) :*(6otlg---!0t10¡


\ 1200 )
o(-1.17) :0.12t.

EI 12.1% clc las faltrili¿rs tictrc ingresos anuales menores a 6600 clólares. Eso quir,.r'c clccir
que sorr 0.121 x 150 000 : 18150 farnilias.
b) Si buscarnos el riltino quintil de ingreso, qniere decir aquellas farrrilias r,¡re tienen el 207,
dc los inglesos nrás altos; o sea) tenem s que encontral rrn valor :¿: de nlancla que Pr(I >
r) :0'2'
>r) : 1-Pr(/ 1r):0.2,
Pr(I
I r) : F(r) : 1- 0.2 : 0.8,
Pr(/
o l" -,99!o) : 0.8.
\ 1200 )
En la tabla de la ley normal, \¡emos que se velifica que iD(0.84) : 0.8. Por tanto,
z - 8000
: 0'84'
1200
Al resolver esta ecr.tación, nos da r : 9008. Consecuentemente, el 20 % de las familias tiene
un ingreso superior a 9008 dólares anuales

Se tomaron <Ios exámencs sobre 100 puntos, crr el ¡.rrimero se obtur,'o ¡r1 :80, ot:4 y en e-
segundo p2 : 65, 02 : 5. Un cstrrdiante sacó 84 en el primer exalnen y 75 en el segrrnclo
Cornparativamcnte, ¿en cuál de los exárncnes obtu.r'o rnejor resultado?
Sol'u,ciórt: Deterrnincrllos, p¿tl'a cada examen, el porcentaje cle corn¡rarleros (lue s¿rc¿]r'on rnclroi
nota que é1, sabiendo qr.re

¡r¡ : 80, ot, : 4, FZ:65, 02 :5.

Pr(X<8a) : F,(84) :t(91#) :.,t, :0.8413,

Pr(X < 75) - F2(75): O (7S - 0S) : .(r) :0.9772.


\b/
Conro en el primer exarnen el porcentaje de compañeros que obtuvo menor nota es 84.73%o y e:
el segundo 97.7270, tuvo, comparativamente mejor resultado en el segundo examcn.

Una empresa ernbotella t'efrescos rnediante una máquina que envasa el líquiclo, con un nredia ¡r -.

desviación estándar de 10crn3. Calcular el valor de Ia media p¿rra que solo se lebase la cantida-
de 310cm3 en elSTo cle Ias lrotellas, si se supone que la canliclad de líquido ernl-¡otellaclo tierr.
distribuciórr nonn¿1.
Sol'ución: Sea X: <<la c¿ntidad de lÍquido embotellado>>, corr X - N(F,(10)2). Se brrsca el,r,¿rlc,:
de ¡r tal que
Pr(X > 310) :9.65.
Ahola bien,

Pr(x > 310):


',(+, -#) :v,(z, Y) ,
4.70. Ejercicios L45

clorrde Z - N(O,I). Por la tabla de la ley normal, Pr'(Z > 1.645) : 0.05, debiéndose cumplir
que
310-p:1.645.
10

AsÍ,
¡¿ : 310 - 10(1.645) : 293.55.

ElmarcadorqueindicaIacantidadmediadelíquidodebeestarposicionadoen293.5cm3.<

En el Cuadro 4.7 se encuentra un resumen de las leyes de probabilidad analizadas en este capítulo.

Uniforme discreta, r¿

'lt(N,n,r) -r
Hipergeométrica
# #(t-#) N-1
Bernoulli Ber(p)
Binomial Bin(n,p) np

Geométrica
r-p
9(p)
p2

Binomial negativa BN(r,p) ,,,L-p


P(^)

l/(a,b) (b - o)'
Uniforme continua
+ L2
I I
Exponencial r(r) ;
^2
Normal N(t",o")
Normal estándar
^/(0,1)
Cuadro 4.1: Principales leyes de distribución de probabilidad

4.10. Ejercicios
Ley uniforme

1. Una variable aleatoria X tiene distribución uniforme sobre [-3,1]. Calcule:

a) Pr(X:0); d) Pr(lxl > 0.5)


b) Pr(X < 0); 1
c) Pr(lxl < 1); e) Halle un valor de ú tal que Pr(X )ú):-.

Realice el ejercicio anterior considerando que X - U[-3,2].


Un reloj de manecillas se detuvo en un punto que no sabemos. Determine la probabilidad de
que se haya detenido en los primeros 25 minutos luego de señalar Ia hora en punto.
t46 Capítulo 4. Principales Distribuciones de Probabilidad

4. Los ¿utobrrses de cierta líne¿r salcrr c:on holario estricto cada cinco minutos. I{alle la plolrabilicliLrl
ckr cluc 1ul l)asa.jero c1r-rc llcga n lzr pzrraclzr tenga que esperar el ¿rutobris nlclros cle tlcs rrtintrtos.

r
L,. Al cstrrcli¿u' las ofertas de contlatos cle ern'ío, un fablicante de coml>ut¿doras ve que los cxlrtr'¿rtr.,-
clc los intelesados tienen ofertas que se distribuyen ltniformemente entre 20 nril y 25 nlil dólarcs
Calcule lil plobabiliclad de que el siguiente contrato sea:

a) menor qre 22 mil dólares; c) Estime el costo medio de las ofertas cr

b) mayor qre 24 mil dólares; contratos de este tipo.

6. Sqróngase que Ia velocidad de los autos en un sector de una carretera sigue urta ley uniforntt
entre 60 y 120 kmlh. ¿Cuál es la probabilidad de que un auto:

a) tenga una velocidad de 80 kmlh?;


b) tenga una velocidad menor que g5 km/h?;
c) tenga una velocidad menor que 70 km/h o mayor que 100 kmlh?
7. El diámetro, z de un cÍrculo se mide aproximadamente 5 1 r ( 6 cm. Considerando el diámetrc
como una magnitud aleatoria X distribuida uniformemente en el intervalo (5, 6). Halle:

a) la probabilidad de que el diámetro sea mayor que 5.8 cm;


b) la esperanza matemática y la varianza del área del círculo.
8. Una llamada telefónica llegó a un conmutador en un tiempo, al azar, dentro de un periodo de
un minuto. El conmutador estuvo ocupado durante 15 segundos en ese minuto. Calcule la
probabilidad de que la llamada liaya llegado mientras el conmutador no estuvo ocupado.
9. A partir de las 12:00 de la noche un centro de cómputo trabaja dos horas y para una. Une
per-sona llama al centro Lrn momento aleatorio entre las 12:00 y las 05:00 horas. ¿Cuál es Ia
probabilidad de que el centro esté trabajando cuando llama la persona?
10. En una práctica de precisión aérea se deja caer una bomba a lo largo de una Iínea de un kilómetrc
de longitud. El blanco se encuentra en el punto medio de la línea. El blanco se destruirá si la
bomba cae a una distancia menor que setenta y cinco metros del centro. Calcule la probabilidad
de que el blanco se destruya si la bomba cae al azar a lo largo de la línea.
Ley exponencial
11. Escriba las funciones de densidad y distribución y los valores de la esperanzay la varianza para
Ias variables aleatorias que siguen una ley exponencial:

a) t(6); b) r(3); c) á(0.5); d) t(0.25).

12. Se prueban dos elementos que trabajan independienternente. El tiempo de trabajo del primer
elemento tiene distribución á(0.02) y el segundo elemento t(0.05). Halle la probabilidad de que
en el tiempo de duración t :6 horas:

a) ambos elementos fallen; c) solo falle un elemento;


b) ambos elementos no fallen; d) falle por lo menos un elemento.

13. La duración (en minutos) de las llamadas telefónicas de larga distancia desde Quito es una
variable aleatoria con densidad

r(t): {o;-,,,, :l ;:3f


Determine el valor de c y calcule la probabilidad de que una llamada dure:
4.70. Ejercicios t47

rr) rnenos clc 3 rrrirmtos;


b) rrrás dc 6 rrriuutos:
c) errtre3y6nlinutos.
d) Calcule lzr esperanza de la variable aleatoria e interprete su significado;
e) Si el cc¡sto clel minuto de las llarnadas telefónicas es de 40 centavos, ¿cuánto esperarÍa un
usuario pagar por una llamada?

14. La duración (en años) de la vida de los individuos de una población humana se puede modelar
mediante una'r,ariable aleatoria con función de densidad

si ú > o;
f (t) :{ {oe-.t/ao,
0, siú10.
a) Determine la vida media de la población;
b) ¿Cuál es la probabilidad de que un individuo no llegue alos 42 años?;
c) ¿Cuál es la probabilidad de que una persona que tiene más de 50 años, supere los 65?

-o Suponga que la duración, en minutos, de una conversación telefónica sigue una ley exponencial
eOlS). Encuentre la probabilidad de que Ia duración de una conversación telefónica:

a) exceda los 5 min;


b) dureentre3y6min;
c) dure menos de 3 min;
d) dure menos de 6 min, dado que ha durado más de 3 min.

6 Se prueban tres elementos que trabajan independientemente entre sí. La duración del tiempo
de trabajo sin fallo está distribuida según una ley exponencial: para el primer elemento h(t) :
0.1e-0'1¿, para el segundo elemento fz(t) :9.2"-o'2t, para el tercer elemento /s(¿) : g.3"-0'3t.
Halle la probabilidad de que en el intervalo de tiempo (0,10) horas, fallen:

a) por lo menos un elemento; b) no menos de dos elementos.

La escala Richter para medir la magnitud de los terremotos sigue una ley exponencial de media
2.4. Calcule la probabilidad de que un sismo sea:

a) mayor que 3 grados en la escala de Richter;


b) entre 2 y 3 grados en la escala de Richter;
c) El sismo producido en Ia India el 30 de septiembre de 1993 tuvo la intensidad de 6.4 grados,
¿cuál es la probabilidad de que un sismo supere esta intensidad?

-5. El tiempo de duración, en meses. de un tipo de resistencia eléctrica se expresa mediante una
variable aleatoria X que sigue una ley exponencial á(0.5).

a) ¿Cuál es la probabilidad de que una de tales resistencias eléctricas dure más de 4 meses?
b) Si se prueban 10 resistencias eléctricas, ¿cuál es la probabilidad de que ninguna dure más
de 4 meses?
c) ¿Cuántas resistencias se probarían para que con probabilidad igual a 0.9 se tenga al menos
una resistencia que dure m¿is de 4 meses?
148 Capítulo 4. Principales Distribuciones de Probabilidad

cl) Si el costo de producción cle una resistencia es C : 2 + (30 - X)' , ¿cuál es el costo espelaclo
de una resistencia?

19 El tiernpo 7 que se demora para completar una reparación eléctrica es una variable aleatoria
distribuida exponencialmente, con media 10 horas. El costo C de llevar a cabo este trabajo se
relaciona con el tiempo empleado mediante la fórmula

C:100 +40T' +3T'2.

a) Calcule el costo esperado de la reparación;


b) ¿Con qué frecuencia el tiempo será mayor que 20 horas?

20. La duración de los neumáticos de una marca determinada siguen una ley exponencial cuyo
promedio es 30 (en miles de kilómetros). Calcule la probabilidad de que un neumático dure:

a) más de 30 mil km;


b) más de 30 mil km, dado que ha durado 15 mil km.

Ley normal
21. Se tiene una variable aleatoria Y con media 5 y varianza 16.

a) Determine su función de densidad.


b) Halle las probabilidades: Pr(Y < 6), Pr(Y > 4) y Pr(lYl < 3).
22. Una variable aleatoria Z está distribuida normalmente, Z - Calcule:
^f(1,16).
a) Pr(Z < 0); b) Pr(Z > 3); c) Pr(lZl < 3); d) Pr(lzl > 2).

23. cigarrillos es, para los fumadores, de 5 dólares diarios por término medio.
Se sabe que el gasto en
y que la desviación estándar es de 0.8 dólares. Suponiendo que el gasto sigue una distribución
normal, ¿qué proporción de los fumadores gastan entre 4 y 6.2 dólares diarios?

24. Se experimenta con un medicamento que produce variación en el peso de las personas que lo
toman. Pruebas de laboratorio han demostrado que al cabo de un mes la rrariación del peso
sigue una distribución gaussiana de media 2 kg y desviación estándar 1.25 kg. Determine la
probabilidad de que una persona:

a) haya aumentado al menos 1 kg; c) haya aumentado menos de 3 kg.


b) haya rebajado de peso;

25. La compañía aérea Helios sabe que el tiempo de retraso de sus vuelos sigue una ley normal, con
un retraso medio de 10 minutos y desviación estándar 5 minutos. Calcule la probabilidad de
que:

a) un vuelo no tenga ietraso;


b) el próximo vuelo llegue con no más de 12 minutos de retraso;
c) el próximo vuelo llegue con más de 15 minutos de retraso.

26 La Cruz Roja ha determinado que tiempo necesario para que una de sus ambulancias llegue al
sitio donde hay una emergencia se distribuye según una variable normal de media 17 minutos y
desviación estándar 3 minutos.
4.70. Ejercicios t49

ir) (-i;rlr:rrlc lir


¡rrolral.,ilirlir,Irlc: <¡Lrr: cl tictttpo cle llcgrrcltr esté cornplCncliclo cntrc 12 y 21 rnirrntos;
lr) ¡.1:'iLLirr¡rrírvirloltIr:1 tir:rrr¡-rri/. Iiiplol-rabi]icl¿rcl clcrlucIaarnbrriancizrempleerlásclc/rrtitrlrtos
r:rr llr:girr r:t rlcl ir',2 /

Los r:r'r'olcs rlc clc pcso cle Ltna balanz¿l obeclccelr a una ley normal con desviaciórt
l¿r nrcclir:i<irr
y
cst ¿incl¿rr' 20 nrg csl)cr ¿irrza 0 rng. Hzrlle Ia probabiiidad cle clue cle tres niediciones iridcpendientcs,
el clrol tlc por lo rncnos una cle ellas no sea mayor) en valor absoluto, que 4 mg.

Se aplicó rrrrzr plueba clc fluiclez ver-bal a 500 alumnos de Educación Básica. Se supone que las
¡rtrrrtnaciones obtcnidas se clistlibr.ryen segúrn Lrna rrornlal de media 80 y desviación estándar 12.

a) ¿Qué puntuación separ¿r cl25% de los alumnos con menos fluidez verbal?;
b) ¿.A partir de qué puntuación se enclrentr a el 45 % de los alumnos con mayor fluidez verbal?;
c) ¿Cuántos alumrros tienen una fluidez menor que 76 puntos?

l9 El per'ímetro craneal de los hombres, en medido en cm, es una variable aleatoria normal ¡/(60, 4) .

a) ¿Qué perímetro craneal debe tener un hombre para que el 16.6% de sus paisanos <<tengan
más cabeza que él>>?

b) ¿Y cuánto para que el25.2Vo tenga menos?

rl. Se llama cociente intelectual(C.I.) al cociente entre la edad mental y la edad real. Se sabe que
Ia ley de distribución del C.I. es normal con media 0.95 y desviación estándar 0.22. En nna
población con 2600 personas se desea saber:

a) ¿.Cuántas tendrán un C.I. superior a 1.3'/; c) ¿Cuáltas tendrán un C.I. entre 0.8 y 1.15?
b) ¿.Crrántas tendrán un C.L inferior a0.77?;

l1
JI Se va ¿ construir nn n)arco para montar una puerta. ¿Qué altura mínima ha de tener el rrrarco
para que el 7%o de Ia población tenga riesgo de chocar su cabeza al atravezarla, si la estatura de
la lroblación estadistribuiclanormalmente, con media F:1.72m y varianzao2, con o:12cm?
i2 La cstattrra de la población masculina está normalmente distribuida con F : L67 cm yo : 3 cm.

a) ¿Cuál es la probabilidad de que un hombre tenga una estatura:

(i) mayor que 167 cm?; (ii) mayor que 170 cm?; (iii) entre 161 y 173 cm?

b) En una muestra aleatoria de cuatro hombres, ¿cuál es la probabilidad que:


(i) todos tengan estatura mayor que 170 cm?
(ii) dos tengan estatura menor que la media (y dos mayor que Ia nredia)?

El peso de las fundas de papas fritas producidas por una fábrica sigue una distribución rrolmal
con media 12.8 onzas y desviación estándar 0.6 onzas.

a) ¿.Qué proporción de las fundas pesan más de 12 onzas?;


b) ¿.Qué proporción de las fundas pesan entre 13 y T4onzas?;
c) Determine el peso tal que el 12.5 % de las fundas pesen más qr-re ese peso;
d) Si el fal¡ricante dcsea rnantener la media en 12.8 onzas) pero ajusta la desviacióu estándar
tal que solo el ITo de las fundas pese rnerros de 12 onzas, ¿.cuál debe ser el valor cle la
desviación estándar-?
150 Capitulo 4. Principales Dístribuciones de Probabilidad

34. La <:st¿rtr-rr'¿t ct: lzr pobla,ción rnascrrlina y femcnina siguen leyes de distlibución nclrrnal. La
rtascrtliu¿t tirtnc ¡t,1 - I.67 trl y 01 : 12crn v ]a fcnlr:nina" p2:1.55 In y 612 :10c1r. Se tic¡e
urra 1rarcjir ert l¿t c:ual cl varólr rnicle 1.70tn y Ia rtru.ler 1.60rn. Cornparil,tir/amente) ¿.cuál cle los
dos es rnás ¿rlto Li:spccto a los miembros cle su sexo?
OE
Ji, Los conductoles quc se fabric¿rn para utilizar en las computadoras deben tenel resistencias clue
varían entre 0.12 y 0.74 ohm. Las medidas de las resistcncias que produce Lrna compañía siguen
una ley de distribución normal de media 0.13 ohm y desviación estándar 0.005 ohm.

a) ¿Qué porcentaje de Ia producción de la compañÍa cumple con las especificaciones?;


b) Si se usau cuatro de esos conductores en una computadora, ¿cuál es la probabilidad de qne
los cuatro cumplan con las especificaciones?

36. Los tiempos de Ia primera avería de una máquina de cierta marca tienen distribución gaussiana
con un promedio de 1500 horas de uso y desviación estándar de 200 horas.

a) ¿Qué fracción de esas máquinas fallarán antes de 1000 horas?;


b) ¿Cuál debe ser el tiempo de garantía que deba dar el fabricante si desea que solo se presentr
el \Vo de las averías dentro del tiempo de garantía?

37. El promedio de las calificaciones de los estudiantes universitarios se distribuye normalmente co-
media 5.4 y desviación estándar igual a 0.5 puntos.

a) ¿Qué porcentaje de los estudiantes tiene un promedio de calificaciones superior a 6?;


b) Si los estudiantes que tienen un promedio inferior o igual a 4.9 abandonan la universidac
¿qué porcenta.je de alumnos desertará?;
c) Se seleccionanal azar tres estudiantes, ¿cuál es la probabilidad de que los tres tengan r-:
promedio de calificaciones superior a 6?

38. En el grupo étnico A, la estatura de las personas (en cm) sigue una distribución,Af(t6S;25): .,-
el grupo étnico B sigue una,A/(170;25) y en el grupo C una N(175;25). Los tres grupos étnio-¡
son muy numerosos.

a) Si elegimos una persona del grupo A, ¿cuál es la probabilidad de que mida más de 160 cn
b) Si elegimos 10 personas al azar del grupo étnico A, independientemente unas de otras, ¿ct-
es la probabilidad de que 5 de ellas midan más de 160 cm?;
c) En una ciudad, el 50 To de Ia población pertenece a la etnia A, el 20 % pertenece a la E '
el30% r'estante a la C. Si elegimos una persona al azar en esta ciudad y mide m¿ís de ---
cm, ¿cuál es la probabilidad de que pertenezca al grupo étnico C?;
d) Si elegimos 10 pelsonas al azar del grupo B, independientemente unas de otras, icuál a -"
probabilidad de que al menos 5 midan más de 172 cm?

39. Una máquina para llenar cajas de cereal tiene una desviación estándar de 25 gramos sobrt *r
peso de llenado de lascajas. ¿Qué medida debe indicar el marcador de llenado de las cajas p--.
que permita que ha5,a cajas de 450 gramos o más durante elI% del tiempo? Se supone qu€ iiüu
cantidad de cereal por caja sigue una ley normal.

40. La anclrura, en mm, de una población de coleópteros sigue una distribrción N(p,;o2). Se esti
que el 77% de la población mide menos de 12 mm y que el 84% mide más de 7 mm. Halle
parámetros de Ia ley.
4.77. EI teoretna del Límite Central 151

4.11. El teorema del Límite Central


Exantiucrrtos el sigtrierttc teorcrua. clue tielc rrna importaucia fuu<l¿rmcntal. ya c¡rc constitrrye el nexo
le cornunic¿lción entre las teorías dc Ia probabiliclad y la cstac-lística.

Teorema (del Límite Central) Sean Xt, X2, .. ., X,,, n r'¿rriables aleatorias independientes,
,listribuidas con media ¡t y varianzd 02, y que signen una ley de probabilidad cualquiera -no nece-
sariamente la misma-. Se forma Ia variable suma

Y:Xt]-Xz-+..-tX,,,
que tiene esperauza E(Y) varianza Var(Y) : no2. Entonces, la distribución de la variable
aleatoria
Y -E(Y) Y -np
Jv*@ o{n
riende hacia una ley de distribución normal estándar, cuando n tiende al infinito.

ii teorema implica que si n es grande, se puede aproximar las probabilidades de Y utilizando que

pr(y rú) : pr (t * (T#)


=';#) = ,

.: la que Z es una variable aleatoria normal estándar.


:" Ia práctica, se asume que la aproximación es buena si n ) 25.

-
= formulación de este teorema es, en su forma más elemental, debida a P. S. Laplace y fue demostrado
:--a-rlrosamente, en primer lugar, por Liapunov en 1901.

Ejemplos

-. Sean X1, Xz, ..., X1o, cincuenta variables aleatorias independientes que siguen la ley

r 0 1 2
Pr(X : r) rl8 3i8 t/2

Calcule la probabilidad Pr (Xr + Xz + .. . * Xso > 70).

Solución: La esperanza y la varianza de las variables aleatorias son

E(X¿):
+, Var(X,) : #
Entonces, si Y : Xt * Xz*.'. *X¡0,
E(v) : 50x+:T,
Var(Y) :
31 775
bux6a:E'
I irl l'tittt i¡t:ri,'.s fij.,l til¡ttt it;¡¡cs rlc l'¡t,!¡.¡ltilitl;t'l

I'ri) i{) i

l-,1'

l-l t'osto rli¿tti,r rlc o¡rcliu llll iullr¡l¡tis lir,tl,) rurt'rrsto li.irr r[t: ]J0,l,rlalcs v rrn \alol \'¿ui¿rl]le rlcl 30:.-
rlr: los ittgl'r's<ls. EI itrglt'so lier<'r t¡tr¿r,lisl Iilrrrr i,ilr unilr,r nrc t'r¡1r'r:5r0 l'250 dólales. a) Cirlt:rr1;r:
la ¡rr,rltr,lrili,la,l rle (luc ('l ('()sto ([r: <l¡ret.;rL rur :rr¡t()l)ris. rlruarrtr,S[ <lias. sllpele los 2500 clólares
lr) ;.C'rrÍrrtos rlÍ¿s rle o¡rt'ta<:irirr s<:r'átr no('('s;uios ¡r;tt;r (,lll(\ (()lr llrrir l)tol)¿l)ilidad cle 0.95. cl c()st,-
,li,,rlrct';u:ir'll sea .lo it,l Irrclr()s 2.li() d<'¡larcs.'

.j,,lut:itítt: l)r.filt¡ltu,'s l;ts sigrtir,ltlls \':lt'¡;rl,lcs;rlr':rlorr¿rs:

-\ : ltr¡;rt'so rli;rtir r ¡rol r )l)('t;r( irlrr .lt:l ¿rutol)rij: .\' - ¿/i;(). 2;01 .

('' f'..1,r ¡!i;rl i,,,lt',,)t 't ;t,'iritr,lr,l ;rr¡l,rlr¡is: C..' : .i0 : 0.:1.\.
Sr: t it'trt' r¡ttc

l-tti,,!tt,'..

E(C:, ¡ :,ll -- l).J :< 150 = iir.


Vrrr(Cl;) ((l .t)r ;< :'r:l:3:J.:J:J : .jlll l.

ii
;t) Slrr l' : I l',. r'l r'rtsl,r r[t,olrt'l:tci,ilr trr,.tisrr¿rl ilcl it¡tol)tis. l:,rttctrrccs,
r=l

Pr'()'>2j00) = i- 1500 - 31 x 75 - o (r.815)


\/300\,67
= l- 0.964S : 0.0352.

lr) Sctr U cl costo dt: o¡rt'r';t<'irirr eu rr rlí¿s: r:¡rtorr('es. l¿l vali¿rlrk: ¿rleatotia

z:ry_^/(o,t).
t/300{u,

.5r: rL,l,r'rlllr,r r¡rirr¡r,r'eI r,;rlot rlc lr. tal (llrc [)l(¿.i > 2350) :0.95:

|,t({'>.]:l..-l(l)=i,,(z'ffi):'_*(,l¡ooá#'',):o.n'.
I'¡l'I;tttlrl.
3i(l - i ¿l
yf.rt)t¡ttT = -1'645'
i, '¡r. rlsrrltil rlil(, ,r : .f:l ;:j. Ls rktcir'. sr: lrcfirsiti\Il 34 clÍ¿rs.
4.77. El teoretna del Lírnite Central 153

útil de uu componertte elcctr'óuico se clistribuye exporenci¿rlrnente con rnedia


StLportga qr.re la vicla
dc 100 iror'¿rs. Apenas falla un cornponcrite, sc Io rcemplzrza con otro par:a contiulral'cl trtrbajo.
a) Caicular' la plobabilicl¿rcl c]e c¡re clurarrrte 210 clías sc necesiterr más cle 36 cle esos cou]poncltes;
b) ¿CLrántos de estos cornponeutes se necesitan para (lue duren al menos 4600 holas, con Llna
probabilidad dei 99 %?
Soluci,ón: Definamos las siguientes variables aleatorias:
X¿: <<Duracióndeloscomponenteselectrónicos>>; X¿-t(llI00) yE(X) :o(X):100.
Y,r: <Tiempo total de duración de n componentes>>; Yr: i Xo.
,i:L

a) Se necesitan más de 36 componentes durante 210 días, si la vida útil es menor a 5040 horas
(210 días por 24 horas). De manera que

too) :
Pr(Y36 < bo4o) = r Itot,==tuj
\ 100y'36
a Q'4)
: 0.9918.

b) Se debe encontrar n tal que P.(% > 4600) :0.99, luego

Pr(Y-< 4600) = r (ffi) : o.ot.

Luego,
4600 - 100n
: -2.33

Lasolucióndelaecuaciórresn:64.5;esdecir,65componerrtes.<

-{proximación de la ley binomial por la normal

l.n caso particular del Teorema del


Límite Central -conocido como teorema de Moivre-Laplace-, se
::esenta cuando todas las variables X¿ son independientes, idénticamente distribuidas según una ley
:t Bernoulli con parámetro p. Como sabemos, la variable

,:j*, i=l

a.üe una distribución Bin(n,p), con media np y varianza npq) corr Q : I - p. Por el Teorema del
- -:cite
Central, la variable
Z_ Y-np
J"w
ii:re apl'oximadamente una ley normal estándar, cuando n es suficientemente grande; es decir,

pr()'<ú) :pr (ttffi) =r (ffi)


:r la Figura 4.5 se muestra los valores de Ia distribución binomial para n : 20 y p : 0.5. Para
:s:a distribución, p:np:20x 0.5: I0y o2: np(l-p):20 x 0.5 x 0.5:5. Sobrepuestaa
; listribtrción binomial se encueltra una distribución normal con media F : !0 y varianza o2 : 5.
l'-ramos qne la curva de la normal se aproxima mucho al histograrna de la binomial.
r54 Capítulo 4. Principales Distribuciones de Probabilidad

Figura 4.5: Aproximación de la ley binomial por la ley normal.

En la siguiente tabla se presenta una relación entre los parámetros n y p para que la aproximación
normal a la ley binomial sea válidaa.

p n requerido p n requerido
0+ 22t 0.25 74
0.01 214 0.30 51
0.05 188 0.35 32
0.10 757 0.40 16
0.15 728 0.45 13
0.20 100 0.50 13

pq
Otro criterio para escoger n es que el intervalo (o ,Pl2 T)
\ -
Z se encuentre completamentÉ
n
dentro del intervalo (0, 1).

Ejemplo. La Superitendencia de Bancos cree que el 32% de los créditos al sector agrícola están e-
mora. En un estudio se tomo una muestrade2T0 créditos a la agricultura. a) Hallar la probabilida-
de que más de 80 de ellos estén en mora; b) ¿Cuál es la probabilidad de que exactamente 95 cliente.
estén en mora?

Solución: Sea X el número de clientes con créditos en mora; X - Bin(270,0.32).

a) La probabilidad de que m¿ís de 80 clientes estén en mora es

270
pr(X > 80) : pr(x > 81) :
I
/r:81
clro(0.32¡k10.68¡270-k,

cuyo cálculo puede ser muy complicado. Aplicando la aproximación de la ley normal a la l.n
binomial, se tiene

p : np :270x 0.32 : 86.4, o : \MA :1mV 0Ñ68 : 7.665.

Luego,

pr(x>80): ,,(t' *q-#) =r-*(tt#3-)


: 1-0.2033:0.7967.
aUna amplia discusión del tema se encuentra en
Samuels, M. y Lu, T.-F.C. (1992), "sample Size Requirements f¡
the Back-of-the-Envelope Binomial Confidence Interval," The Americon Statistician, 46, 228-23L, de Ia cual se extre!il
la tabla.
4.72. Ejercicios 155

b) La probabilidad buscada es Pr(X : 95) : C8?0(0.32)e5(0.68)270-e5


Si emplearnos el teorelna de Moivre-Laplace, resulta:

pr(X :9b) : pr(94.b < x < 95.b) =o 195!:96a)


\ 7.665 )
: 0.8829 - 0.8554 :0.0275.
Como se observa, la diferencia entre el valor exacto y el aproximado es mínima.

1.L2. Ejercicios
1. En una caja se empacan 100 latas de conservas. Según los datos de la fábrica, cada lata tiene
un peso promedio de 1 oz con desviación estándar de 0.1 oz. ¿Cuál es la probabilidad de que
una caja pese más de I02 oz?

Un borracho camina de forma aleatoria de la siguiente forma: cada minuto da un paso hacia
adelante o hacia atrás con igual probabilidad y con independencia de los pasos anteriores. Cada
paso es de 50 cm. Calcule la probabilidad de que en una hora avance m¡ís de 5 metros.

.). Los clientes de cierto banco efectúan depósitos con media 157.92 dólares y desviación estándar
30.20 dólares. Aparte de ésto no se sabe nada más acerca de Ia distribución de estos depósitos.
Como parte de un estudio, se eligieron aI azar e independientemente 75 depósitos. ¿Cuál es la
probabilidad de que la suma de estos 75 depósitos sea 12 750 dólares o mayor?

Los vehÍculos que cruzan un puente tienen pesos cuya media es de 4675 kg y cuya desviación
estándar es de 345 kg. Si hay 40 vehículos sobre el puente en un instante dado, halla.r el número
o tal que la probabilidad (aproximada) de que su peso total no supere a o sea del 99 %.

La empresa Rapid Express envía paquetes de distintos pesos, con una media de 1.5 kg y una
Á desviación estándar de 1.0 kg. Teniendo en cuenta que los paquetes provienen de una gran
cantidad de clientes diferentes, es razonable modelizar sus pesos como variables aleatorias inde-
pendientes. Calcule la probabilidad de que el peso total de 100 paquetes exceda de 170 kg.

6. El propietario de una copiadora ha determinado que el número diario de copias que se realizan
en su local tiene una media de 1250 con una desviación estándar de 350. Halle Ia probabilidad
de que en un mes de trabajo (25 dfas) el total de copias:

a) sea menor a 30 000;


b) se encuentre entre 25000 y 32000.

7 Una radióloga que trabaja en el servicio de traumatologÍa de un hospital ha comprobado que el


tiempo, en minutos, que tarda en atender a cada paciente es una variable aleatoria con media
7 y desviación estándar 2. Durante su jornada laboral trabaja 6 horas atendiendo pacientes
sucesivamente y sin interrupción. Calcule, aproximadamente, la probabilidad de que durante un
dla pueda atender hasta 55 pacientes dentro del horario de su jornada laboral. Se supone que
todos los pacientes están en la consulta con suficiente antelación y que no hay <<tiempos vacíos>>
entre dos pacientes consecutivos.

8 La resistencia de un hilo metálico es una variable aleatoria cuya media es 3 kg y su desviación


estándar 1 kg. Suponiendo que la resistencia de un cable es igual a la suma de las resistencias
nr de los hilos que lo forman.

a) Calcule la probabilidad de que un cable de 100 hilos sostenga 280 kg;


156 Capítulo 4. Principales Distribuciones de Probabilidad

b) ¿Cuáltos hilos se rrecesital pala qr-re el cable sosterrga 300 kg corr urr gg% cle seguricl¿rci/

9. Utr jugador de baloncesto encesta urr lanz¿rrniento de 3 puntos con plobal,'ilidacl 0.3.

a) Aproxime la distribución del nirmero cle canastas corrseguidas ert 25 lanzamientos;


b) Calcule Ia probabilidad de encestar más de 10 canastas.

10 En promedio, de las personas que ingresan a una librerÍa solo el 25o/o realiza una compla. Si
en un dÍa entraron 80 clientes, calcule Ia probabilidad aproximada de que se hagan al menos 28
cornpras.

11. Se ha encontrado que el 70% de las personas que entran en un centro comercial lealizan cuando
menos una compra. Para una muestra de 50 personas,

a) ¿cuál es Ia probabilidad de que cuando menos 40 de ellas realicen una ó más compras?;
b) ¿cuál es la probabilidad de que menos de 30 de entre 50 personas muestreadas realicen
cuando menos una compra?

12 En una fabrica microcircuitos se ha comprobado que el 4% de estos son defectuosos. Un cliente


compra un paquete de 500 microcircuitos procedentes de la fábrica. Determine:

a) el número esperado de microcircuitos no defectuososl


b) la probabilidad de que se encuentre más de 25 microcircuitos defectuosos;
c) la probabilidad de que el número de microcircuitos defectuosos esté entre 16 y 30.

13. Se conoce, por estudios previos, que Ia proporción de vacas que enfer-marán después de su-
ministrarles la vacuna contra la fiebre aftosa es del 2To. Una granja tiene 600 vacas qtre sor
vacunadas. Determine:

a) el número esperado de animales que no enfermarán;


b) Ia probabilidad de que el nirmeio de reses que enferman sea) como máximo, 17;
c) la probabilidad de que el número de reses que no enferman seaT como mínimo, 590.
t4. Un zoólogo estudia cierta especie de ratones de campo. Para ello captura ejemplares de una
población grande en la que el porcentaje de dicha especie es 100p.

a) Si p :0.3, halle la probabilidad de que en 6 ejemplares capturados haya al menos 2 de lo.


que le interesan;
b) Si p : 0.05, calcule la probabilidad de que en 200 haya exactamente 6 de los que le interesan:
c) Si p :0.4, calcule la probabilidad de que en 200 haya entre 75 y 110 de Ios que le interesan

15. Sea ^9a5


el número de fracasos que preceden al 45" éxito en un proceso de Bernoulli con proba-
bilidad de éxito P : 0.36. Sea ,5a5 : Xr * ' ' '* Xu, donde X1 representa el número de fracaso.
que preceden al primer éxito, X2 es el número de fracasos entre el primer y el segundo éxito. r
así sucesivamente. Las X¡ son independientes.

a) Dé el nombre de la distribución de una úrnica X¡, obtenga también su media y su varianzar


b) ¿Cuál es el valor esperado y la varianza de ,9a5?;
c) Aproxime la probabilidad de que Sa5 esté a una distancia no superior a 20 de su uredia.
Capítulo 5

Distribuciones Multidimensionales de
Probab¡l¡dad

EI supuesto erróneo de que la correlación irnplica causalidad es probablemente


uno de los dos o tres errores mó,s serios g conlunes del pensam'iento humano
Stephen Jay Gould

;-, muchos casos) un fenómeno aleatorio no depende de una sola variable, sino de dos o miíÉ; por
- =:rplo, algo tan simple como el tiempo que empleamos en trasladarnos desde la casa a la universidad
l':!e¡61s, entre otras cosas, de Ia velocidad media del carro y del número de veces que nos detengamos
: -: los semáforos en luz roja. Es decir, el resultado en la prueba descrita depende de, al menos, dos
--=:l ables aleatorias.

;- .o que sigue, trataremos con conjuntos de varias variables aleatorias que se manifiestan simultánea-
- --te en un fenómeno y determinaremos si ellas están o no relacionadas. Para simplificar la exposición,
-jzaremos eI caso bivariante ya que Ia generalización a más variables es inmediata.

Variables aleatorias bidimensionales

fefinición (de variable aleatoria bidimensional) Sean X y Y dos variables aleatorias unidi-
-=:rsionales deflnidas sobre un mismo espacio muestral f,); entonces, la función

RxR
r_F
-+
LD r------ (X (r) ,y (r)),
-'--,de w es un evento elemental, es una variable aleatoria bidimensional.

\,-rtación. Parareferirnosaloso€Qtalesque X(u):ayY(w):b,simplernenteloharemoscomo


l: cL,Y :b y a Ia probabíiidad de este suceso corno Pr(X : a,Y :b).
-e -,rrma análogase definen y notan las probabilidades Pr(X < a,Y 1 b) y Pr(a < X < c,b <Y < d).
,LJ I
158 Capítulo 5. Distribuciones Multidimensionales

5.1.1. Variables bidirnensionales discretas


Definición (de variable aleatoria bidirrrensional discreta) Sean X y I/ clos rr¿rlialrlcs ¿rlc¿rtori¡rs
tlis<:r'et¿rs. La fur,ciól dc 1-nobrrbilidaci conjrrrrta de X y Y está clacla por

f @,a): Pr'(x : r,Y : Y)'

A Ia variable aleatoria (X,Y) se le denomina bidimensional discreta.

Sea? : {(r,ü eFr2l Í@,y) > 0}; es decir, el conjunto de puntos con probabilictad positiva, es finito
o infinito numerable y se cumple que

I
(x,v)eT
f (r,a) : L.

Supongamos quezl, 12¡...y At,Uzr... son los valores posibles deX y Y, respectivamente, ysea

Pt¡ :Pt(X : ri,Y : Ai)'

La probabilidad del evento (X,Y) € .E es igual a la suma de todos los p¿¡ para los cuales (r¿,y¡) € E:

Pr[(X,Y)eE): t Pr(X:ri,Y:yj): t p,¿j.


(t¡,v¡)eE (r4,y¡)eE

Definición (de función de distribución conjunta) La función de distribución conjunta de la


variable aleatoria bidimensional (X, Y) se define por

F(*,ü: Pr(X I r,Y < a) : | | nti


r¡1r y¡1y

La función de distribución conjunta cumple qrru


,IToo rfT."
F(r,a) : 0 y q"e
,lgg rlIg
¡(", u) : r.

A partir de las p,;¡ se pueden encontrar las funciones de distribución de X y de Y.

Definición (de función de probabilidad marginal) Las funciones de probabilidad marginal


deX y de Y están dadas por las fórmulas

fx(r¡) : i"r," :r¿,y:uj) :DPo¡'


j:r j:r
@ oo

fy@¡) : f erlX:r¡,y:aj) :DPn¡'


i:l i:L

Las fnnciones de distribución marginal Fx y Fv se calculan por

Fx(t): t Drnt y Fy(t) : llnt


x¡,4t j:l A¡<t i:I

Observación. Si los espacios muestrales son finitos, las series deben reemplazar,je por sumas finita-s
5.7. Variables aleatorias bidimensionales 159

,l'on rq,1161¿ cle r'¿rrial¡lcs ak:¿torias bicliurcnsiouales se ¡ruecle clal uu¿t defrrrición cle iuclependerrcitr e<1tti-
"¿rlerrtc ¿r l¿r autetiot'trlclttc cl¿rclir:

Definición (de iudependencia) L¿rs v¿rli¿rbles ¿rleatolias clis<:r'clt,¿rs X y Y son inclepenclientes si


Pr'(X : r.Y : y) :Pt'(X : z) x Pr(Y : 9;.

Ejemplos

1. Determine el valor de k para que la función

f @,A) - krA, para r : !,2,3; A :1,2,3,


pueda servir como una función conjunta de probabilidad.
Solución: Sustituyendo los valores de z y de y, encontramos que:

/(t, t¡ : ¡, f (I,2) :2¡t, /(1,3) : 3P,


f (2,t) :2¡t, Í(2,27 :4¡, f (2,3) :6¡t,
(3, t¡ : 3¿, f (3,2) :6¡, ,f (3, a) : 9¿.
"f

Para que / sea una función de probabilidad, la suma de todos los términos que acabamos de
calcular deben dar 1; es decir,

k +2k+ 3k + 2k + 4k + 6k + 3k + 6k* 94. : 1.

Resolviendo esta ecuación, resulta que /c : :


36
Pongamos en una tabla la función de probabilidad resultante:

X
Y I 2 3
1 r/36 2136 3136
2 2136 4136 6136
3 3136 6136 e136

2. Las probabilidades de la distribución conjunta de las variables aleatorias S y T se dan por

s
T -1 0 1

-1 r/8 r/t2 7124


1 5124 116 Llg

La intersección de las filas y Ias columnas da la probabilidaA p¿¡ : Pr(S : i,T : j) (i : -I,
0,l; j - -1, t). u) Calcular Pr(S I 0.5, ? a 0.9); b) Hallar las leyes de las variables aleatorias
svT.
Solución:

a) De acuerdo a la fórmula de la función de distribución conjunta de ^S


y ?:

F(s, ú) : Pr(^9 1 s,,T < t) :lln,i


i<s j<t
160 Capitulo 5. Distribuciones Multidirnensionales

Entonces,

F(0.b,0.3) : I tPr(^9:i,T:¡¡
j<0,3
¿<0.5
: Pr(S : -l,T - -1) + Pr(S :0,7 - -1)
: 115
8-12:i4'
b) Por la fórmula de la función de probabilidad marginal tenemos: f s(i) : ! Pr(S : 'i.,7 : j):
J
por lo que

/s(-t) : Pr(.9: -7,7- -1) +Pr(S- -1,7 :l)


151 I

B' 24 3'
/s(o) : Pr(,s: 0,7 :-1)+Pr(S:0,?: 1)
111 I

12' 6 4'
/s(t) : Pr(S : l,T :-1) +Pr(,$: I,T :I)
7r5
: %- E: 12'
De manera análoga, se obtiene la ley de ?:

/r(-t) : Pr(^9: -l,T: -1) +Pr(^9:0,7: -1) +Pr(^9:1,7: -1)


1171 ll

8-12-24-t
fr!) : Pr(.9 : -1,7 :1) + Pr(S :0,7: 1) f Pr(^9 : 7,7 :1)
: 24-
5 *1*1:1
6- 8- t'
Entonces, las variables aleatorias S y T siguen las leyes:

-1 01 T l-r 1

Pr(T: j) I rl2 rl2

5.L.2. Variables bidimensionales continuas


Definición (de variable aleatoria bidimensional continua) Sean X y Y dos variables aleato-
rias continuas, a la variable aleatoria (X,Y) se le denomina bidimensional continua si para cualquier
punto (r,a) < R2 se cumple
Pr(X : T,Y :9) :0.

A la variable aleatoria (X,Y) está asociada una función no negativa /, denominada fu,nción, de densida,:
conjunta, que cumple con Ias siguierrtes propiedades:

1. f (",ú es no negativa; es decir, V(z,g) e R', f @,ú >_ 0.

2. .J_-.l_*" ' " d,y d.r :


[* l'* I@,y) t.

3. La probabilidad del evento ,r(X,Y) € -B>> se calcula mediante

Pr[(X, Y) e E]: f @,a) d,y d,r


l.l
E
5.7. Variables aleatorias bidírnensionales 161

Definición (de función de distribución conjunta) La ftrnción de clistribuciótt corr.junt¿r de la


.-riable aleatoria l¡idinrerrsioral (X. Y) sc clefine por

F(r.y): Pr'(X 1.r.Y < s) : (tLd's'


l_*rr',t)
:1.
,IToorIT." F(r,y): ,ULJIL F(r,u)
-. función de clistribnción conjr,Lnta curnple q.l" 0 y que

-. función de densidad conjunta puede obtenerse a partir de la función de distribución mediante

tI4
.l \&r Y
,
'tl J --
o2 F(r,y)
- or oa

-.i E : [a, b] x lc,d),la probabilidad del evento (X,Y) € E es igual a

db
Pr(a<X<b,c<Y< o): @,y)d,rdy: J ,o,fid,rd,y
Il"f I

Definición (de función de densidad marginal) Las funciones de densidad marginal de las
-.-ariables aleatorias X y Y están dadas, respectivamente, por las relaciones

/'oo f
fx@):l .l
l@,a)da v fv(a):l,l f@,a)tu.
-a -*

-\ partir de éstas, se calculan las funciones de distribución marginal Fy y Fy:

too¿oo
Fx(t):
I f@,y)dyd.r y Fy(t):
I If@,s)d,rd,y
"[

lon este tipo de variables aleatorias también se puede reformular la definición de independencia.

Definición (de independencia) Las variables aleatorias continuas X y Y son independientes si


rara todo par de valores (",a) e R2 se cumple

F(r,ú : Fx(r) Fv(a),


r equivalentemente,
f (r,v) : f x(r) fv(v).

Ejemplos

1. Un círculo de radio o está inscrito dentro de un cuadrado cuyo lado tiene una longitud de 2a
(véase Ia Figura 5.1). Se supone que Ia probabilidad de que un daldo arrojado hacia el cuadrado
es idéntica para cualquier punto. a) Calcular la probabilidad de que el dardo impacte dentro
del círculo; b) Encontrar las leyes marginales de X y de Y.
L62 Capítulo 5. Distribuciones Multidirnensionales

Solución:

a) La probabilidad de impacto esta definida por la densidad

f xv(r,o) : { *"'' si (r'a) e l-o'o) x l-a'a);


[ 0, si (r,a) (,1-o,o] x l-a,a).
La probabilidad de impacto dentro del círculo *2 + y2 -- a2 se calcula como

Pr(x2 +Y2 < o2): f @,a)d,rdy:#:;


ll
,2¡y2-q2
b) Por simetría, las funciones de densidad de X y de Y son idénticas; calculemos la de X:

f x(d : l'" L *'¿r:


_o 4az
:,
2a'
r e l-a,a).
J

2. Dada la función de densidad conjunta de Ia variable aleatoria bidimensional (X, Y)


(t
si r ) L'Y'- li
fxv(r,ü : I r\2'
I O, caso contrario.

Determinar: a) las funciones de densidad marginal de cada una de las variables; b) la función de
distribución asociada.
Solución:

a) Las funciones de densidad marginal son

f x(r) : [*t f *r(r,y)


J
da : .lt[* + :
rU' ay 4.
fv(a) : lr* Í*rlr,e)
dr :
lr* h o, :
i.
Adicionalmente, podemos deducir que las variables aleatorias son independientes.
b) La función de distribución es

F(*,y) : .lr' Ir"


,*r(s, ú)ds or:
Ir' Ir" * oro,

: (#) (")
Consecuentemente, la función de distribución queda como

f (t-¿Xt-v).
Fxv(x,y)={ ra ' sir)1, y2L;
I O, caso contrario.
5.2. Dístribución condicionada 163

5.2. Distribución condicionada

Definición (de probabilidad condicionada) Sean a y b dos números reales cualesquier a y X


y Y dos variables aleatorias de manera que Pr(Y < b) + 0. La probabilidad condicionada de que
X 1 a, dado que Y < b, se representa mediante Pr(X < alY < b), y se defi.ne mediante la igualdad

: Pr(X < a,Y <b)


Pr(X < alY < b)
Pr(Y < b)

r Para variables aleatorias discretas, Ia probabilidad condicionada de r, para un valor fijo de la


variable y, está dada por

: : at : u)
Pr(X rlY
' ,, -P'(I:^!'Y
Pr(Y:Y¡
.

. Para variables aleatorias continuas, la función de densidad condicionada de r, para un valor fijo
de la variable g, se calcula por

f @la) : f
,@)',) .
TY\A )

Como fv(a) :
l*_rr",a)
d,r : l_ f (al")f x@) dr; entonces,
I
f (alr)f x(")
f(,(rga) f@1

J
I f (al")f x@) dr
-'x
que puede interpretarse como el teorema de Bayes para funciones de densidad.

Ejemplos

1. (Continuación) Un vector aleatorio bidimensional sigue la ley:


X
Y 1 2 3
1 1136 2/36 3/36
2 2136 4136 6136
3 3/36 6136 s/36
Hallar la distribución condicionada de X cuando Y :2"
Solución: Ladistribuciónmarginalde)- e
Y I t 2 3

La distribución condicionada de X cuando Y :2 será:


2

Pr(X : LIY :2) : - 36:1


1 - 6'
3
4
: :2¡ : Pr(X : 2,Y :2) 1
Pr(X 2lY -361
Pr(Y :2) 3'
3
6

Pr(X :3lY :2) : Pr(X :3,Y :2) : -AO.


1

Pr(Y: 2) 1 2'
5
164 Capítulo 5. Distübuciones Multidimensionales

2. La 1ey de densidad conjurrta de una variable aieatoria bidirnensional (X, Y) es

, f 2, si0(r1).,0<y<r,rly<r;
r'\r \ ¿/: I .0,
"fxr'(r,ll) L casoconl,r'ario.

Hallar la ley de distribución condicional de Y cuando : 20.

Soht,c'ión: Se tiene que

dr :2(I _ y).

La distribución condi

f@lao) , Para0(rlr-ao;
caso contrario.

5.3. Esperanza y co\¡arianza de una r¡ariable aleatoria bidimensional

Al igual que en el caso de las variables aleatorias unidimensionales, en las bidimensionales es posible
calcular la esperanza y la varianza, previa la realización de una transformación de variables.

Definición (de esperanza) Sean (X, Y) un vector aleatorio bidimensional y g(r,y) una función
real

g iPt2 --J R
@,a) g(r,a).
'-
1. Si (X,Y) es un vector aleatorio discreto, cuya función de probabilidad es /(z,g), entonces

E(g(X, Y)): ttri s(ri,yj) f (*¿,a): tD,s@,,a)p¡¡.


aj ri yj

2. Si (X,Y) es un vector aleatorio continuo, cuya función de densidad conjunta es /(r, A), en-
tonces
E(g(x,Y)) : r@,a)d,vd,r
l:l:s@,a)
Observemos que si XyY son independientes, se deduce que

als@)n( )l : E[g(x)]Eth(Y)1.

Para las variables aleatorias bidimensionales se tiene una medida estadística nueva, ia covarianza) que
permite evaluar la relación entre Ias variables aleatorias X y Y.

Definición (de covarianza) Sean X y Y dos variables aleatorias, Ia covarianza entre XyY se
calcula por
Cov(x, Y) : E[(x - E(x))(Y - E(Y))].

Equivalentemente, la covarianza se puede calcular como Cov( X,Y) : E(XY) - E(X)E(y).


Propiedades. (Solo se demostrará una de ellas, se recomienda al lector verificar las restantes)
5.3. Esperanza .y covarranza 165

1. Cor'(-X. )') - Cor-()', I).


2. Cor'(X,,{) : VaL(X).
jJ. Si r¿t v (¿2 sorr dos colrstaltcs Positiv:rs, cutouccs

Cor'(a1X1 : o,t Cov(X1,l') * a,2Cov(X2.\/),


I^:?,Yr,\')
1. Si 1¿rs r'¿rriables aleatori¿rs son independientes, Ia covaliarrza entre elias es igual a cero.
En cfc<;to,

Cov(x,Y) :E(xY) - E(X)E(Y) : E(x)E(v) - E(x)E(v) : 0.

lCov(X,}/)l < 1/Yar(X ) Var (Y)

-\ contirmación, se deduce una expresión para la varianza de la suma de dos variables aleatorias
'.ralesquiera.

Var(X +Y) : E(x+Y)' -[e(X+Y)]2


: E(X') + E(v2) + 2E(XY) - [E2(x) + E2(v) + 2E(x)E(v)]
: [E(x') - E'(x)] + [E(y2) - E'(v)l + 2[E(xv) - E(x)E(v)]
: Var(X) +Var(Y) *2Cov(X, Y).
.isí. partr dos variables aleatori¿rs cualescluiera se tiene que

Var(X + y) : Var(X) + VaL(Y) * 2Cor'(X, Y).

le ruarrcr¿r sinrilar', la 'n'arianza del producto de dos varial¡les ale¿rtori¿rs X y l' es

var'(Xl') : pf..Var(X) + pk|X)Var(Y) t2¡ty¡t.,..Cor,(X, Y) +2prD [," - /¿-x)(l'- tr.)']

[t" - rtt) (X - ui')+ 2E i(x - ttx)2 (\' - r,t-t2] - [co"{ x,Y))2


-t2¡r.,-E ,

--,trde ¡r_y: E(X) y Fv: E()').


-',.-,n la covarianzay Ia varianza se define el coeficiente de correlación, que es una medida
base en de
- dependencia entre las variables aleatorias X y Y.
Definición (de coeficiente de correlación) Sean X y Y clos variables el coeficiente
r: colrelación entre X y Y se calcula por

p(x,v¡ : Cov(X, Y)

Fropiedades. (Se lecoinienda que el lectol verifique algunzr cle cllirs)

-. p(x,\') : p(\" X).


l. El r,'¿rlol clel cocficieute cle con'el¿cióu varí¿r entre -1 .y 1; cs clecir', -l < p(X,y) < 1.

-r. Si )' st: cxprcsa linc¿rlnrenbe err función de X, pol Y : a,X f ü, donde cr, y b son dos constantes,
crltorICCS lf(X )-)l : f .
166 Capítulo 5. Distribuciones Multidirnensionales

4. si lp(X,Y)l :1, errtottces cxiste clePeudc:ncia lirreal entlc X y Y-.

5. si X ), \' sorr v¿r'iablcs ¿rlc¿rtoli¿r.s irrcleP<tnrlicntes, entou<;us p(X,l') :0.

Observación. Se debc tener en cucnta c¡re si clos rraliables aleatolias sorr independientes, cntoncc.
son no correlacrionadas; pero la afirmación rccÍ¡rroca no es correcta; es decir', si dos variables ale¿toriar.
no están <rorrelacionadas, uo son obligatoriamente inclependientes.

Ejemplos

1. Las variables aleatorias ,S y 7 tienen función de probabilidad conjunta dada por


s
T -1 0 1

-1 r/8 r/12 7 /24


1 5124 116 rl8
Calcular: a) las esperanzas y las varianzas de S y de T; b) el coeficiente de correlación.
Solución:

a) Anteriormente habíamos calculado las leyes marginales de ^9 y de ?, que son:

s l-r 0 1
-1 1

Sus correspondientes esperanzas son

E(s): ,-', (á) * ror (i) *


E(s2) : (-t)' (i) * (o)' (i)
E(") : (-') (;) * (') (;) :
E(r\ : (-')' (;) * (')'(;) _1 I.
-

En consecuencia,

Var(s) : E(^9') -E'(s) :#-(+)' :H,


Var(") : E(T') -E'g)- 1 -02 : 1.

b) Calculemos, en prirner lugar, la covarianza entre S y T, para ello determinemos E(^9?):

E(S") : ftiip(i,i) (i:-r,0,1; ,:-t,t)


?,J

: (-1)(-1)(*) . (-1)(,) (;u) . (o)(-') (#)


+(0)(,) (á) . (1)(-1) (h)* ('x') (*)

:
157t1
8 24 24'8 --I
4'
5.3. Esperanza y covarianza 1.67

Por Io tiurt,o,

Cov(S',7) : E(sr) - E(S)E( T) : _'i_ ( ;) (o) :-1


Con toCo esto.

Cov(.S,7)
p(s,ll) :

-+:
-?
-0.29.
(i#) .'
t/toz

2. La función de densidad conjunta de las variables aleatorias S y T está definida por

I
/ Y), : 12, si0(r.-I,0<y<!,r*a<L;
txv\r,
t o, caso contrario.
Hallar la correlación entre X y Y.
Soluci,ón: Anteriormente determinamos que

f x(") :2(I - r) y fv(y) :2(t - a).


Sus esperanzas y varianzas son

E(x) :E(Y) :* y Var(X) :vur(Y):*


También,

E(xY) : 2ry d"y d,r : n1

lo' .[ot-'
Entonces,
: 111
Cov(X, Y) E(XY) - E(X)E (n : + - 3"3- 36
De manera que

Cov(^9, T)
P(S,T) : 1

2'

Notemos que estas dos variables no son independientes.

Determine la correlación entre las variables aleatorias X y Y, cuya densidad conjunta es

Í x,y. (r, ü : L2"ffie


-L"-G'2 \-'o -2RLa) / QQ- ,
+u2 R2D .@<r<oo, m(g(m,

donde lRl < 1 (a esta ley se le denomina normal biuariante).


Solución: Calculemos Ias funciones de densidad de cada una de las variables aleatorias.

: l: ¿-u2/2 l'* dr.


2n 1ffi" J-*""-@-no)2/eG-R2D
168 Capítulo 5. Distribuciones MultidimensionaJes

IJ¿rr:irtrrrLo :-.¿ ll Lt
: t' r/,r' - ,/ t - ll.2dz. crtcotttrarLtr¡s:
,/ t tt: -
I .'tt..2t:., / - .: /, , 7 ,,.,.tz.
l-./,,\-
) tt t I Ct/-,la:-, t :t -)O<r< \.
't ' - )tT' .l -^ rf-'l-

AniiLogarrrente, se clcteluriti¿rqrrc./¡tt) : j:e 'tt12, -co < r < oe.


v !7t
A p;rltir <[e ésto, es f¿icil I'ctificar que E(X) : E(y) :0 y que Var(X) : Var(]') :1
Encorttlerrros la cor'¿rli¿rttz¿r:

Y) : E(Xi') - :
Cor'(X. E(X)E(Y)
l:l:rurxv (r,y) rlr d'y - 0

=
h'[- o"-o'''(l: J';I _H 1
- ¡r- Ry)2 I Q(1-R2)) ar\ ¿y.
/
La integral interior es igual a Ry; por lo tanto,

Cov(X, \: ]-Jr; d,a: R.


.[*_r'"-t"/2
Con todo esto,
p(x,Y): Cov(X, Y)
: R :R.
vry"rEtrcn 1.1

5.4. Variables aleatorias multidimensionales

Los corrceptos descritos, r'áliclos prrra variables aleatori¿rs biclirnensionales, se pneden generalizar r.
vcctorcs aleatorios de cnalc¡riel dimcnsiórl; por lo tanto, solo vamos a exponer las definicioles d.
m¿rner¿l r-esumida.

Definición (de variable aleatoria multidimensional) Sobre un mismo espacio muestral l)


están defrnidas lasl'ariables aleatorias Xt, Xz, ..., Xn, entonces, se dice q.ue Z :(Xt,Xz,...,Xn)
es un vector aleatorio o una variable aleatoria n-dimensional.

Si Xl , Xz, ..., X, son variables ¿rleatorias discretas, el vector aleatorio Z es discreto y su función ci¿

¡r'obabilidad es
.fz(r¡, "',r,'.) : Pr(Xt : t7¡.'.,X,, : r,,).

Si Xl. ... ,X, son r'¿rriablcs ¿rlc¿rlolias continttas, el vector aleatorio Z es cotttittuo y la probabilida.-
dcl cvento u(Xr, ...,X,,) e E C R">> se calcula por

PL[(X1,... , X,,) € E] : I l' .[z(rt,...,r,,) d.r1...dr,,.


'.1.1""'
E

La frurciórr ./ se derrotnirta ¿/crt,st]¿la,d, co'n,,jn,rtto, de X1 , Xz, .... X,.


La frrrrr:ióu cle distlibrrciórr <lc. l¿r r'¿rri¿rl¡le aleatotia rnttltivat'iar:te Z esti definidtr por

F7(r:¡,.,.,0,,) :Pr(Xr ( zt.. ...X,, ( r,,).


5. 5. AIguna.'^ distr-i b rrciones rnultidilne-nsior?ales inrportantes 169

L¿rs r.¿ili¿rlrlcs ¿rlc¿rtoli¿rs X1. X2, ..., X,, se llarl¿l"rr ilclel-lctrrclicrrtes si

l''7(,:t¡, , ,iLt,,) : Ff (:t1) " '4x,, (2,,),


'

-, eqtrivzrlentcntertte,
J'z@,,.. . ):t:¡t) : .frr(tr) . .' [x,,(L:,,.).

Sea g urra fitnción clefinicla de R" err R, la espcrtrnza nr¿rtemátic¿r cle tL(Xt,...,X,,), segrin l:r lc¡' ¡[s
Z. sc calcrrla por

E((g(Xr, X2,....X,,)) :t tÍn g(rt,...,r,,)fz(rt,...,r,,,);


J:7

:rlando Z es discleta, y por

E((g(Xr ,X2,.. .,X,)) : -- ,r)f z(rt,.. . ,r,,) dr1 "'dr,,,,


.l Rn
.f O@r,

:uando Z es continua.

La covarianza entre dos componentes cualesquiera X, y Xrn deZes


Cov(X,, X,n) : e [(¿ - E(&-))(X," - E(X"'))] : E(X,X, ) - E(X'.)E(X,,),

..i.rre también se la suele lotar colrro o,.?,r.

ii coeficiente de correlación entre ellas es

Cot,(X,,., X,,r)
P(X,,X,n):
Var(X,.) Var(X,")
:.-

asocia su matriz de varianza-covar-ianza (o siurplernente

:-
*=

la

de eda como

5.5. Algunas distribuciones multidimensionales importantes


l.iigr,rtrl que en el caso unidinrcnsional, lrlr:sent¿rrlros l¿rs clistlibucliorres rnnlticlirnensionales cle rnayor
-'-poltancitr; ellzrs son: la multirrorni¿rl, Itr uuifolrne y la nor-nt¿rl bir,¿rli¿rulc.
L70 Capítulo 5. Distribuciones Multiditnensionales

5.5.1. Distribución multinornial

Se dice que el vector aleatorio -k (Xt,...,X*)


k-dinensioual X sigue una distribución rnultinomia-

de parámetros (n; pt,...,p¡), (dond" 0 1pu < 1, D p¿ : 1), si


z:l

Pr(X : N) : Pr(X t : rlr¡. . ., Xt" : nk) : p'1",


ñ *!-r.pT''''
k
para N : (u,...,n*), donde D no : r.
i:l
A un vector aleatorio X que sigue una ley multinomial se lo nota X - M(n;Pt, ... ,Px).

La esperanza, varianza y covarianza son, respectivamente, iguales a:

E(X) : n(h, "' ,Pk),


Var(X') : nPi(L-Pi), i:1,...,k,
Cov(X¿,X¡) : -np¿ps, i,+ j.

La distribución multinomial es la generalización multivariante de la distribución binomial. La dis-


tribución marginal de cada una de las componentes X¿ es binomial de parámetros (n¿,p¿) y cualquier
distribución condicionada es también multinomial.

Esta Iey de distribución tiene aplicación en el análisis estadístico de datos cualitativos.

Ejemplo. En una empresa operadora de tarjetas de crédito se registró las causas para la renovaciórr
de las tarjetas. Se estableció que 60 % es por pérdida, el25'/o por vencimiento y el 15 To por deterioro
Un dÍa se recibieron 28 solicitudes de renovación de tarjetas. Evaluar la probabilidad de que 15 sean
por pérdida, 7 por vencimiento y 6 por deterioro.

Solución: Sean:

Xy : número de renovaciones por pérdida,


X2 : número de renovaciones por vencimiento,
X3 : número de renovaciones por deterioro.

Se desea evaluar la probabilidad para nr :15, n2:7,r:,'s:6, (rt+rz-ln3:29¡'

:15,Xz:7,Xs:6) 151o.zs; 710.


Pr(X1
ffi
0.021.
to.u¡ rs¡6

5.6.2. Distribución uniforme


Un vector aleatorio X: (Xr, ...,Xn) tiene distribución uniformeen S: [ot,br] x. ..xlan,b,r] C Rn
si la función de densidad de probabilidad "f("r,. .., r,,) es
5.6. Ejercicios 171.

Esta distribución es el análogo rnultiva,riante de la distribuciórr uniforme. Las distlibuciones marginales


de las valiables aleatolias X¡ (i:1,..,,ri) son uniformes con densidad
{1
si r € lo¡'b¡);
.f*,(r) : I bo -
I o. ^' si "r'I lo,,b,].

5.5.3. Distribución norrnal bivariante


Un vector aleatorio Z : (X, Y) tiene distribución normal bivariante no degenerada si su función
densidad conjunta es
p)
r@,ü ;cfu."r{-¿^l%t _2p(, - t4@ -
oto2
(y - !2)21
---A-)J' \

donde p es el coeficiente de correlación entre X y Y.

Figura 5.2: Función de densidad de la distribución normal bivariante.

as leyes marginales de X y de Y son: X - N(pr,o?) Vy - N(pz,oZ).


En un ejernplo de la sección anterior se calculó que el coefi.ciente de correlación entre X y Y es p.
trxiste un mayor número de variables aleatorias multidimensionales, pero su tratamiento sale fuera del
j,rminio de esta obra.

5.6. Ejercicios
1. Si la función conjunta de probabilidad de X y Y está dada por
r*u
J lr,a) : -30=, para Í : 0, I,2,3; A :0,I,2.
Construya una tabla que muestre los valores de la función conjunta de probabilidad de las dos
variables aleatorias.
2. Las variables aleatorias ,9 y 7 tienen Ia función de probabilidad conjunta que se resume en la
siguiente tabla:
s
T 0 1 2
0 rlr2 Llg rl24
1 114 rl4 tl40
2 rl8 rl2o
3 r/20
Encuentre:
t72 Capítulo 5. Distribttciones Multidimensionales

a) Pr(S' :1,7 :2); ci) 1'r(5 > ?);


lr) Pr(S:0. l<I<:J):
c) Pr(S *T <2): c) ias clistlilrucion<rs nralgirralcs cic ,9 ), <lc I

3. La función coljunta clc plobabiliclad cle X y Y está clacla por


l@,y) : c(:r2 + ?r2), p¿rra t: -- -7,0, 1,3; !,/ : -r,2,3,
Encuentrc:

a) el valor de c; d) Pr(X >2-Y);


b) Pr(X :0,Y < 2);
c) Pr(X íl,Y > 2); e) las distribuciones marginales de X y de l-.

4. La distribución conjunta de las variables aleatorias X1y X2 es

X1
Xz 012
0 p p12 pl4
1 2p p pl2
2 4p 2pp
a) Halle el valor de p;
b) Halle las leyes marginales de X1 y de X2. ¿Son independientes?;
c) Sean Y : Xt x X2, calcule la esperanza de Y.

5. Las variables aleatorias X y Y son independientes ent¡e sí y sns funciones de probabilidad son

z 0 1 2 .l 4 J
_VÓ 0 t/z
Pr(X : Z) 03 0.2 0.1 0.15 0.25 Pr(Y :.i¡ 0.25 0.67 0.08

Encuentre la función conjunta de probabilidad de (X,Y).

6. Dada la distribución de probabilidad de una variable aleatoria bivariante discreta

x
Y -3 4 10
2 0.15 0.13 0.27
4 0.10 0.30 0.05
a) Halle las leyes de distribución de X y de Y;
b) Calcule el coeficiente de correlación cntrc X r,' }, .

7. Dada la distlibución cle 1>robabilidacl clc uu¿r variable aleatoria bidimcnsional cliscreta

X
Y l0 20 30 40
0 0.05 0.1.2 0.08 0.04
1 0.09 0.30 0. r1 0.21

a) Detcrmine las le1,ss ¿. distribrrción cle X y l';


b) Calcule el coeficiente cle corlel¿rcióu r:ntre l¿rs r'¿rri¿rblcs ale¿rtori¿rs.
5.6. Ejercicios 173

3. Sc r:ousicl<trzr 1a sigtLictrtc f\urcióri de plolrabili<1acl corrjrLrrta. rlc la,s r'¿rli¿rbles ¡rlc¿rtoti¡Ls XyY
1. , ,
./.\)'(¡'lt: I ', Qr -,¡1. .i .r'É {0 I 1.3}. // c {1.?.3}:
\ tt. (.;r¡O r.(rull.al.iu.

a) Hallar A; pala qne ./11' sea función dc probabiliclacl puutual conjrutta;


b) Halle l¿rs funciones clc pr:obabiliclad malginal cle X v clc )';
c;) ¿ X y )' son inclepenclientes'/ Justificlue 1a resprtesta;
c1) CalculePr(1 <X<3;2<Y <3) vPr(X+y<3).
9. D¿rcl¿ la función de distribución de ia variable aleatolia bidimensiortal contitrua

nt , f senrser\y1 si 0( r'1
rw'lJ):l rf2, 0<y<rf2;
o, si r(0, y<0.
a) Halle la probabilidad de que el punto aleatorio (X,Y) caiga en el rectángulo limitado pol
las rectas r -- 0,, :;, y : :
[,, tt
b) Deterrnine las fr-rncioues de densidad marginal de cada una de las variables aleatorias.

,1. Dada la función de densidad coniunta

f (r, a) : ! *" Y+5a2) ' 12 _.'x) < r {N, -oo(lJ<(n.


1T "-\"
Encuentre las funciones de densidad de cada ttna de las conrponentes. ¿,Son independientcs'/

L¿r 'r'ariable aleatoria bidirnensional (X, Y) tiene función cle densidacl

[ ?,u') : (1 + r;2) (t6 + a2)'


:r.y €F'.

zr) Halle la constantc c; b) Detcrmine si X y Y son independientcs.

La clerrsiclad conjunta dc X y Y es /(r; U) : A3ne )(z+e) para r > 0 y ;¿/ > 0.


a) Halle las densidades marginales y demuestre que X y Y son independientes;
b) Haile Pr(X < a;Y 1b) para cualesquiera núrmeros positivos ct y b;
c) Halle Pr(X < o) para a > 0.
En una irrvestigación sobre la utilización clel créciito institucionai pol palte cle los canrpesiuos s('
registra e1 nr'rmero de cultivos que tiene ei campesirro en slr uniclacl proclr-rctiva (variable -X) v cl
nrimero de pr'éstamos que ha obtenido en los riltimos años (variablc I). En 1a siguiente labla
se pleserrt;ru ios resultac-los cle Ja irrvestigaciórt:

v
-,\
.l
Y L ) ,) 4 5
0 2150 r ls0
1 3/5n 7150 12150
') 5150 e l50 41 50 :t 150
3 3ltt) \ 150

a) Olrterrga l¿rs distlibucioucs nrarginales de ,Y y cle )'-;


b) Dctclrnine la cListtibLrcitin probabilísticir dc: créclitos olrtenicl<¡s, r-lado que cultir'¿r clos plo-
rIn<:ios:
174 Capítulo 5. Distribuciones l\[ulticlinterr.sjorr¿r/es

c) Olrtcrrgir l¿ distribrrr:i<irL plol-ralrilÍstica cle 1>r'och-rctos. \:¿:l (ln(' rlr ticrur próstirrrr<ls.

T4 Uu soc:icikrgo irrvr:stigrr cl c:<lrrr¡rortirnrietrto <lcliuttrcrr<:i¿rl <[c los irrtcr rros <lc trrr pr.rral. L¿r r'¿rrial
X relltcscut¿r c-.1 ruirrrcro rle voccs rlue ha cst¿ulo clctcrri<lo v l¿r r'¿rriabkr )'- cl uliurclro rlc rlcll-
c[istitrtcls llor los (¡rc] ha siclcl s<lrrtcuci¿r.clr. Srrs r1¿rtos sc reslrrl)clr crr Ia sigrriorrte talrla:

.Y
.)
Y i 2 .) 4 5
1 15/100 e/100 41r00 1/100 1/i00
2 5/100 1 1/ 100 51700 21r00 1/100
3 21r00 41t00 7 1100 3/100 1/100
4 rlrc} 3/100 5/100 21r00
I
tJ 21r00 41r00 211.00
6 21r00 3/100 1/100
7 21r00 21t00

a) Obtenga las distr-ibuciorres rnalginales de X y cle )":


b) Determine la distribución del núrmero de veces que h¿ estado detenido, si solo ha cometi,:-
un delito.

15. Sea X
una variable aleatoria que sigue una ley ul)ifolure sobre {1,2,...,n}. Sea Y la variab-.
aleatoria definida ¡ror Y : (X + l)2. Calcule la cor'¿rianza entre X y Y .

16 Sea X
una lariable aleatoria qne sigue una ley unifornre sobre {-1,0, 1}. Calcule el coeficiel,:.
de colrelación cntre Xtn y X'tL.

17, En nna urriversidad se toma, a los aspirantes, pmebas de ingleso en ciencias y en humanidades. S
X y Y sou, rcspectivamente, Ias ploporciones de rcspuestas correctas que un estudiante alcaui..
en las pruebas ¡r su función de densidad conjurta vie¡e dada por'

r 4r -l6u
,,^ ^.t
IV,A):- \ J
5
[ 0. caso corrtrario.

¿.Qué ¡rorcentaje cle estudiantes conseguirán:

a) nrenos del 40% de respuestas correctas en cada una de las pluebas?;

b) rrrás del 80% de respuestas correctas en ciencias r,. rnenos de 50% en hurnanidades?

18. La c'arrtidad en rniligramos de dos componentes con[enidos er] un producto es nrra valial.'--
aleat<¡ria hrir,ariantc. cuya fttnción de densidad viene dada pol Ia expresión

o<v < r;
r@,ú:
{ ;:r, ::j:":;:,;''
a) Errcucrrtre el valol cie la constante c;
lr) I{¿rlle Ia ley condicional /(zlys):
C:) C¡tlt:ule la ¡rrobabilidad de <¡ue la c¿ntidacl clcl primer componente sea menor que 0.3:
rrritigramos cuando la del segundo cs 0.8 nriligramos;
d) ;.S,ru irr,ül¡rendientes los dos <.:omponentes'?
5.6. Ejercicios L75

19. Si X cs l;r pr'oilorc:i<itt rlc pcrsonas que I'csl)ontlcrr ¿r ulra cnclrost¿r le¿rlizacla por correo y )'' t:s
la ¡rtopor< iritr <lcl l)0lsorras cllre resl)onclen a otla errr:rrest¿r rr:aliz¿<l¿ll)ol correo, y la ftLrrciirn r1<''
rlcnsirl¿rrl <:orr.jrurtit <lc X y )/ est¿i dada por

r| -*'-!,
2ri8t
.lb,v): I 5
para 0(r(1; 0<yl1;
[ 0, caso colrl r'¿trio.

Eucueutle:

a) la funciórr cle densidad marginal de X;


b) Ia probabilidad de que aI menos un 30 % de Ias personas responda a la primera encuesta;
c) Ia probabilidad de que menos de un 40% de las personas responda a la primera encuesta y
que más de 50 % de las personas responda a la segunda.

20. La vida de uso (en horas) de cierta clase de circuitos integrados es una variable aleatoria con
función de densidad
I 20000
st z ) u;
l@): { G+ looF'
I O, caso contrario.

Si tres de estos circuitos operan independientemente, encuentre:

a) la densidad conjunta de X1, Xz y Xs, que representan la duración de cada uno de los
circuitos;
b) la probabilidad Pr(X1 < 100,X2 < 100,X3 > 200).

2r Sean .9 y T dos variables aleatorias cuya función de densidad conjunta está dada por

f(",t):{ *' si o(sl8; o<t<7;


t 0, caso contrario.

a) Encuentre el valor de k;
b) Obtenga las densidades marginales de ^9 y de ?;
c) Determine la función de distribución F(s, ú).
22. Una función de densidad conjunta está dada por

¿' t/
f(r,a,-,, I l6ryzt' si 0( r1I; 0<y<1; 0<z1I; 0l¿11;
- I 0, caso contrario.

a) Calcule la probabilidad cle que X ,i, t .;y r >2s,


=X,,
b) Obtenga la densidad marginal de ?;
c) ¿Son las variables aleatorias X, Y , Z y T mutuamente independientes?

La densidad conjunta de (X, Y) es

- r - u)' <a< 4;

l.;}]
r(*,v):
{ i:t :'-: ;ffi?,I'
a) Halle el valor de k;
b) Obtenga l¿s densidades marginales de X y deY;
176 Capítulo 5. Distribuciones Multidimensionales

c) l)cterrniue 1a covarianza entre X y 7'.


24. Sr'¿r r ,2 .2.
c^ÍYe-\r'-+tt- )''r' ) 0;'Y > 0;
.f (r,ü : I
L 0. err otros casos.

a) Halle el valol de c;

b) Obtenga las densidacles marginales de X y de Y:


c) Calcuie las esperanzas dc X v de Y;
d) ¡,Son independientes X 1, )/'/

25. Sean X y Y dos variables aleatolias cuya densidad conjunta es

f
. ( !6rr+yr)y,
(r,a):1 5
sio( r1r; o1y< l;
|. 0. caso contrario.

a) Obtenga las distribuciones marginales de X y de Y;


b) Halle la covarianza entre X y Y;
c) Calcule las esperanzas de X +Y y de X2 +Y2.

26. Sea (X, Y) distribuido uniformemente sobre el sernicírculo del diagrama. Entonces, f (r,y):
si (r,y) está en cl semicírctilo.

a) Determine las distribuciones marginales de X y de Y


b) ¿Son independientes X y Y?
27 Para la distribución bivariante
c*rly
(r, v) : (1+Z)4(1 +y)4',
si r)Q; a>0;
.f
0, en otros casos.

a) c) ¿.Son independientes X v Y?
b) al de X;

28. Pala :

si z 0, y>0; conn),2,
+ YY
caso contlario.
5.6. Ejercicios L77

a) Determine la constirnte k; lr) Obtenga l¿r función de distribución.

29 ¿Son indepcn<lientes las valiables alcatoritrs X y Y, si la frurción de densid¿rd conjunta es

,)
h
a) l?,a) :3 a"",
at:-
0 ( r 1y 1 l?; b) "f(r,A): (r+r ta)4
r) 0; rr>0?

30. Dada La función de densidad dei vectol aleatorio (X.)')


( 6r, para 01r1Y<1;-.
(r.t):
rf \*'Y I
[ 0, caso contrario.
Encuentre las funciones de densidad marginal de X y de Y.
.1 l- Si(X,Y) es un vector aleatorio con función de densidad conjunta rf (r,y)
\ )¿
:!6'+y¡si 0 < r 1l
y0<y<L(y0enotrocaso).CalculelacovarianzayeIcoeficientedecorrelacióndeambas
variables.
r)
Dada la función de densidad de (X, Y):
.?

s I 1;
r@,a):
{3:r' :ff"h;,s
a) Encuentre el valor de k;
b) Calcule ias funciones de densidad marginal deXydeY;
c) Calcule las esperanzas de X y de Y;
d) Calcule Pr(X < 0.51Y : 0.6);
e) ¿,Son XyY independientes?

')t
'),) Sca (X, Y) una variablc aleatoria liidirnensional con función dc densidad conjunta
0<g<r<1.
Calcule:

a) el valor de la constante k;
b) Ias ftrnciones de densidad rnalgiual cle X y Y. ¿Son independientes?;
c) la corrarianza entre X y Y;
cl) la función clc clensicla<l <tc )''lX : 1;
2'
e) la csperanza de YIX ::.
'2
ji. Si (X, Y) está uniforrnemente distribuido en cl triángulo limitado por las rectas t :0, A :0 y
r + lJ :2, encuentre:
a) iafunción cie densida"d de (X,Y); c) lacovarianzaentre X yY.
b) las funciones de densicl¿rd clc X y de Y;

l;. La distribrrción coljnnta cle las r.ariables ale¿rtoli¿rs X :,Y es uniformc en el cnadrado con vértices
en (1, 0), (-1, 0), (0, 1) v (0, -1).
178 capítulo E. r)istribuciones Multidimensionales

tr) Escrilra
l¿,1 frrrrciórr clc clensicltcl conjrrnta cle X y y;

lr) calcule la firrrc:i<irr clc cle'sicl,rrl nargi'al ck: x y dibtrjela;


r;) Hallc E(X) V Var(X);
<l) Czrlcule E(XY);
e) Caicrrlc la crtr'¿r.ianza y la corrclación eutre X y y.
36. El clellzrrtanlento dc señalización clel municipio registró el por.centaje de focos c¡re tiene clpt
Ieent¡rlazar en los scmáforos, segt I] el colol que ellos ilnminan. Se detectó que
el 45 % so¡ de-
color verde,20To del color amarillo y 35% clel color rojo. En una muestra aleatori¿r
cle 1b focos.
¿,crrril es Ia probabiLiclad cle que:

a) hayan 10 r'erdes, 1 amarillo-r 4 ro.jos?; b) havan 5 focos de cada color?


DN
r) f . Entre las operaciones qlre se realizan en un banco se ha registraclo que a lo largo del
tiempo se
tienen los siguientes porcentajes <le retiros, depósitos y cambios de cheques,
3l%, 40% y 25;-:
respectivamente. Un ca.jero reali::ó 20 operaciones en una hora. Determine la probabilidad
de
que se hayan hecho: a) 5 retiros, 1(ldepósitos y 5 cambios de cheques;
b) 10 r.etiros y 10 depósitos
38 SegÚrrr el Registro Civil, la poblaciin ecuatoriana entre los 18 y
6b airos cle edacl tiene la siguicnt.
composición:30Vo son solteros,4ltTo son casados, I5%o son clivorcitrclos y 10%
son viudos. E:-
una oficina labotan 18 personas, ¡,cuár es Ia probabilidad d.e que haytrn:

a) 6 solteros, 6 casados, 3 divor:iados y 3 viudos;


b) 7 solteros, 8 casados, 2 divor:iados y 1 viuclos?
39 De ¿rctterdo a la teoría de la here tcia de \4enclel, si plantas con sernilla ¿rmar.ill¿i
lis¿ se cl.Llz¿-l
con plantas de sernill¿t t'erde rtl8os¿, se obtiene los siguientes resultados
con sus r.espectir.;..
prolrabilidades:
Prob¿rl-¡iiicl¿rcl
rarilla y iisa el16
rarilla y lllgosa 3l16
'de y lisa 3l16
'de y rlrgosa 1176

¿'Cuál es Ia probabilidad de que e rtre 9 plantas así obtenidas, 4 sea¡ cle semill¿r amarill¿ lisa. _
sean de semilla amarilla rugosa, 3 de semilla vercle lisa y ninguna
cle semilla vercle rugosa?
40' Las variallles aleatorias Xt, Xz y X3 siguen las siguientes leyes de probabilidad: X1 I
Xz - N(20, 1) y X¡ -.A/(30,4). le definen -
^f(10.
Zt: XtlX2- X3, Zz: XtlXzlXz, Zs: Xt_Xz- X¡.
Si X1 , Xz, Xs son independietrtes calcule la nlatriz cle covarianzas cle (21,22,2;).
4r' Las variabies aleatorias xt, X2, . ., Xr, yt, y2, - . ., y, son inclepenclientes. porrgamos
*

Halle la covar.ianza entre


,,t:'
"rlr'
: ;:;. Í i',",
$, y T, ;i
lt(Xk) : a, Yar(X¡,1 : 6,2,

Pr(Y¡:7) :p, Pr(Y¡-0) : e:l-p, k :I,2,...,T.


42. Sea X - N(I,1), halle la matriz ce covarianza de (X, X2, XB).
T

Capítulo 6

Distribuciones de Muestreo

En c'ierto sentido, Ia estadística y la probabilidad tratan con problernas inuersos:


si el objetiuo bó,sico de la probabi,lidad es calcular las probabi,lidades
de euentos compl'icados que siguen un modelo probabilístico,
Ia estadística trata de clarificar Ia estntctura de modelos probabilístico-estadíst'icos
rnediante la obseraación de uarios euentos complicados.
A. N. Shiryayev

La ley de distribución normal es el modelo probabilístico más empleado en Ia Estadística, debido a


ia aplicación del Teorema del Límite Central; sin embargo, este resultado no es aplicable en todos
-os casos. En el presente capítulo examinaremos las leyes de probabilidad que siguen ciertas medidas
,rtadísticas, obtenidas a partir de las muestras, que nos permitirán construir modelos inferenciales
.obre los datos.

n-as distribuciones de muestreo, constituyen el punto de transición desde la Probabilidad a Ia Estadís-


:ica.

6.1. Reseña histórica


La Estadística actual es el resultado de la unión de dos disciplinas que evolucionaron independien-
-emente hasta confluir en eI siglo XIX: la primera es el cálculo de las probabilidades, la segunda es
-¿ <Estadística>> (o ciencia del Estado, del latín status), que estudia la descripción de datos, y tiene
:arces más antiguas. La integración de ambas líneas de pensamiento dio lugar a una ciencia que estudia
-'imo obtener conclusiones de la investigación empírica mediante el uso de modelos matemáticos.
I os comienzos de la estadística se pueden hallar en el antiguo Egipto, cuyos faraones recopilaron,
:acia el año 3050 antes de Cristo, datos relativos a Ia población y la riqueza del país. De acuerdo a
leródoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de
-rs pirámides.

L,c chinos, también efectuaron censos hace más de cuarenta siglos. Los griegos realizaron censos
;eriódicamente con fines tributarios, sociales y militares. La investigación histórica revela que se
:o-alizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia
SUerrera.

Fero fueron los romanos quienes mejor supieron emplear los recursos de la estadlstica. Cada cinco
úm realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anota¡

179
1ECI Caytítulo 6. Distribucior:¡es de M¡-¡esúreo

defnnciolres 1- rna.1 r'iurorrios) sin olviclar los iecurr:ntos petióclictos clcl g;lnarlo
n¿r<:itnicni<¡-s, I' de lirs
licluezils contcnic,l¿rs crr l¿rs tict r¿rs colc¡tisladas. li
lp
Durante los rnil años sigrrientcs a. la caída del impclio Rornaro sc rc¿iliz¿rron rruy po.i¿rs irn'estigaciones
I
est¿rdísticas. E1 primel intento de aplicar un razonamicrrtu propiirmentc cstadístico, en el seul,ido actua. tt
del tér'mino, a datos clernoglzificos es clebido ¿r John Granrrt, err 1662, quien sc plarrteó el problem:r de
l',
I
estirnar Ja pol-rlaciórr inglcsir de la época.

Goclofredo Achenu'all, prof<:sor de la Universidad dc Gotinga, acuñé en 1760 la pzrlabra estadística. Er


qtre extrajo del término italiano sta,t'ista (estadista) . Creía, y oon sobrada razól, que los datos de la
nlre\/a ciencia serían el aliacio más eficaz de los gobernantes conscientes.

Durante el siglo XVIII y 1a mayor parte del siglo XIX, Ia Estadística evolucionó como ciencia separada
del Cálculo de Probabilidades. Una contribución importante al desarrollo de la Estadística es debid¿
a A. Quetelet (1846), quien sostuvo la importancia del cálculo de probabilidades para el estudio de
datos humanos. Quetelet demostró que la estatura de los reclutas de un regimiento seguía una le¡'
probabilística, e introdujo el concepto de <<hombre medio>>.

A finales del siglo XIX, Sir Francis Galton ideó el métoclo conocido por correlación, que tenía por
objeto medir ia influencia relativa de los factores. Sus irrvestigaciones se dirigieron a aplicar métodos
cuantitativos en el estudio de la herencia humana. La importancia de Galton radicó no solamente en
el nuevo enfoquc que introdujo en los problemas de estadística, sino también en su influencia direct¿-
sobre W. Weldon, K. Pearson y Edgcworth, entre otros. Además, fundó el primer departamento de
Estadística. E
'de
Pero, talvez qu.ien rnás ha influido en ei desarrollo de la Estadística moderna es R. A. Fisher (1890 - po
-En
1962). Fisher se interesó plimero por la eugenesia, Io que le condujo, siguiendo ios pasos de Galton, :.
la investigación estadística. Sus trabajos culminaron con la publicación del libro,9ú¿listi,cal Method:
Por
t'or Research Workers. En esta obra aparece el cuerpo mctodológico básico de la Estadística actual. Iup
A partir de 1950 se puede considclar que comienza ia época moderna de la Estadística. tln aspect,-
Ger
clifercncial respecto a ios periodos ¿rnterioles es La aparición cle las computadolas) que revolucionalor,
par¿
1a metodología estadÍstica y abren enormes posibilidades para 1a construcción de modelos complejos

En la actualidad, ia trstadÍstica es una discipiina que actira como pncnte entre los modelos matemático- Den
y los fenómenos reales. IJn modelo es una abstracción sirrrpliflcada de una realidad más compleja - nás
siempre existirá discrepancia entre lo observado y 1o previsto por el modelo. La Estadística proporcioni- por
una metodología para ev¿rluar y jr.rzgar estas discrepancias entre la realidad y la teoría.
Los

6.2. befiniciones básicas


A contiuuación damos varias ilefi,niciones de inter'és, qr-rc permitirán entendcr la terminología c1'r..
emplearemos. Algr-rnas definiciones ya se dio con anterioliclacl, pero las repetiinos para rrna rrra-\'.
claliclad cle los couceptos

Defi.nición (de población) Una población (o universo) es una colección completa de pelsonas.
anirnalcs, plantas o cosas de las crrales se desea recolectar datos. Es el glr-rpo cutero al que querernos
dr:scribir o del que deseanros sacar conciusiones.

La población debe tener características medibles o cántables, cle rraturaleza cuarrtitativa o cualitatir'
A la r:aracterística nredible sc denomina uar-iabl,e estadística t¡ a los r-¿rloles ciue tom¿r se los llal
ol¡ s cr-ur¡,cior¿cs.
6.2. Definiciones básicas 181

Definición (de muestra) Es un grupo de unidades seleccionadas de un grupo mayor (la


población) . Por el estudio de la muestra se espera obtener conclusiones sobre Ia población.

Definición (de parámetro) Un parámetro es un valor, usualmente desconocido (y que por lo


tanto tiene que ser estimado), usado para representar cierta característica de la población.

Entre otros, los parámetros poblacionales son:

. La media, /_¿;

r El total, r;

. La varianza, o21

. La desviación estándar, o;

. La proporción, 7T o p.

Definición (de estadístico) Un estadístico es una cantidad que se calcula a partir de una muestra
dedatos. Se los emplea para dar información sobre los valores desconocidos correspondientes a la
población.

Por ejemplo, el promedio de Ios datos de una muestra, se usa para dar información sobre Ia media de
-a población, de la cual se extrajo Ia muestra.

leneralmente, a los estadísticos se les asigna letras latinas (por ejemplo, m y s); en cambio, a ios
:arámetros poblacionales se les asigna letras griegas (por ejemplo, ¡,t,y o).

Jentro de una población, un parámetro es un valor fijo que no varÍa; mientras que es posible extraer
-'ás de una muestra de la misma población y eI valor de un estadístico variará de muestra a muestra.
lr ello, un estadístico es una variable aleatoria que sigue una ley de probabilidad.
-..rs
estadísticos más importantes y sus valores, calculados a partir de una muestra de tamaño ?¿) son:

i"n
. La media muest¡al o promedio , T : L;
m

. El total muestral, i: Nr, donde,Ay' es ei tamaño de la población;

'ln
La r.arianza mucstral, s'2 - ---:- T.@, - ¡)2;

'rL
1
. La desviación estándar muestral. s : D@, - r)";
n-I i-I

. La proporción rnuestral, f : Lt
, donde y es el número de éxitos entre n intentos.
n,
182 Capitulo 6. Distribuciones de Muestreo

6.3. Distribuciones de muestreo

Si decirnos que un estadÍstico es Lrna v¿rlialrlc aleatoria, entonces tendr'á una Icv de lrrobabilidad
asociada.

Definición (de distribución de muestreo) A la ley de probabilidad que sigue un estadÍstico se


Ie denomina distribución de muestreo.

La derivación de la distribución de muestreo es el primer paso en la realización de inferencias sobre el


valor del parámetro asociado al estadístico quc se estudia.

6.3.1. Distribución de muestreo de la media


Supongamos que se obtiene una muestra X1, X2, . . ., Xn de una población que tiene media p,y varianza
o2. A partir de la muestra calculamos el promedio, X. Entonces, se cumple que:

1. E(x) : l-L;

o2
2. Var(X) -
-1TL

X-u,
3. '+
ol\/n
sigue aproximadamente urla ley normal estánclar (por el Teorema clel Lírnite Central).
Es decir,

Pr(x < L) =v, (zs +) :o ( ++\


\ -ol'/")
.

\"11")'
donde Z es tna variable aleatoria normal estándar.

Téngase en cuenta qlre) para la mayoría de aplicaciones, ya se obtiene una buena aproximación cor-
un tamaño de muestra de n:25.

Observación. La desviación estándar de la media muestral se denomina er"ror estó,ndar y se le not;-


oTi
o
OV
\/n

Ejemplos

1. Supongamos que se selecciona una muestr a de n : 36 observaciones de una población con pt - -


yo:0.9.
a) Hallar Ia probabilidad aproximada de que la media muestral sea menor que 6.9.
b) Obtener la probabilidad aproximada de que el promedio X sea mayor que 6.82.
c) Hallar la probabilidad para que X esté en el intervalo (6.8;7.29).

Solución: La distribución de la media muestral X sigue una ley normal con media p: 7:
. o2: (0.9)2es declr' 0 0.9
:
varlanza u'rc'
; 36 ; ,fr: ,,/g6
6.3. Distribuciones de ntuestreo 183

a) Así,

Pr(X < 6.9) x ,r(t 6.9 - 7\


0.15 )
: 0.2515
b) Tenemos que

Pr(X > 6.82) : 1-Pr(X 1- v, ( z= u?''lt)


<6.82) =
\- 0.15)
a- : 1-O(-1.2) :l-0,1151
: 0.8849.

c) La probabilidad de que la media muestral esté entre 6.8y 7.29 es

Pr(6.8 '^\(8:J
<X <z.zs¡ : e, o.lb <\z\z <7'2e-7)
o,lb )
- o(-1 33) :0 e732 - 0 0e18
: i:iffl
El número de clientes que ocupan un cajero automático) en un lapso de 5 minutos, es una variable
aleatoria distribuida según la siguiente ley de probabilidad:
k 0 1 2 3 4 5
PI, r/tz 2/72 3l12 3lt2 2lt2 r/72

a) Halle la media y la varianza de la variable aleatoria; b) Se escogieron 46 muestras, de 5 minutos


de duración, y se contó el número clientes que utilizaron el cajero. ¿Cuál es Ia probabilidad de
que el promedio de clientes esté entre 2.2 y 3?
Soluc'ión:

a) La media y la varianza son:

tt : D,,r*:ox i*r"3*r"i*3x i*n"l*r"i


5
2'
o2: Dt'or- :o " # * 1 x l*n"
tr2
l*n " i*16 x ,?r*r, " +- (;)'
23
t2'
b) Sea X la media de clientes que ocupan el cajero en muestras de tamaño 46. Se tiene que
23
5oo2111
lt.z:l-t:5 y oi:i:ñ:ú.
. /5 1 \
Entonces, X-N por lo tanto,
\;,
^);

: aQ.45) - o(-1.47)
: 0.922L.
184 Capítulo 6. Distribuciones de Muestreo

3. En una plania pasteurizadora se ha observado que la máquina que llena las fundas de leche.
envasa el líquido con una media p y una desviación estándar de o:20cnr3. Si un día se llevarL
a cabo 25 mediciones de la cantidad de leche en cada funda. a) Caicular Ia probabilidad de que
el promedio medido difiera a lo mucho en 8 cm3 de la media teórica que debe tener el volumen
de leche envasado; b) ¿cuántas mediciones deben realizarse para que 7 difiera dc ¡r, en menos de
Bcm3, con una probabilidad de 0.99?
Solucíón: Como n : 25, se puede asumir que la distribución de X es aprc:,i-:ladamente normal.

a) Entonces,
Pr(lX-/rl <B) : Pr(-8<X-p<8)
: /88\
"'|.-r¡E<zsn/6)
: Pr(-2.2.2),
donde Z : X -# sigue una distribución normal estándar. La probabilidad buscada es
olt/n
Pr(-2 < Z <2) : o(2) - o(-2)
0.9772 - 0.0228 : 0.9544.

b) Se tiene que
Pr(lX - pl l8) : P'(-s <X -p S 8) : 0.99.
Como o:20,

\ -Y Y)
,, (
20 ,X ,-1,_
-olr/n-
:pr(-0.4Jñ
--\ --v < z < 0.4Jn): o.ee.
= 20)
Mediante la tabla de la ley normal se encuentra que
Pr(-2.57 < Z < 2.57) : 9.99,
por lo que se deduce qne 0.4Jn:2.57, o sea

":(#):40e6'
Se necesitan al menos 41 mediciones para que el promedio de la ¡nuestra esté a 8 cm3 de ,

rnedia poblacional con probabilidad deI99%.

6.S.2. Distribucidn tle rmlestreo de la proporción


Supóngase que tenemos una muestra alcatoria Xy, X2, ..., Xn, proveniente de una población qne s-:
una ley dc Beriroulli, Ber(p). Definimos

n:irn
i-r
donde X¿:7 con probabilid^'r p y X¿:0 con probabilidad Q: I - p, i : I, 2, ..., n. Entonce.
cuenta el número de éxitos en . intentos. La proporción de <<éxitos>> en la muestra es

f:Y: li",
TL 7I4;- 1

La variable aleatoria Y tiene distribución binomial de parámetros (n,p). Por lo eu€, py:
o2" : npe, y se cumple que:
6.3. Distribuciones de muestreo 185

r E(i) : 1
: p;
n-E(Y)

l. 1

Var(f) = I Var()')
rL'
:?3:
n

l. + sigrre aproximadarnente Lrna ley normal cstánclar' (por el Teorema del Lírnite Central)
\/ pq ln
Es decir.
./ \ / \
P,(Fsl) =Pr(z1l!) :of '-1 )
\ - t/pql" ) \r/pql" )
dorrde Z es tna variable aleatoria normal estándar.

Ejemplos

-. En un proceso de producción el 20% de los productos tienen algún defecto. Se selecciona


una muestra de 100 unidades y se cuenta el número de artículos defectuosos. Determinar la
probabilidad de que la proporción de defectuosos se encuentre entre el IS%a y el29%.
2-\^=0 B
Solución: Tenemos que p : 0.2 y on :0 : 9 rtu.
n 100 100'
Se desea evaluar la probabilidad Pr(0.15 <0 < 0.29); ésto es,

Pr(0.15 <0 < 0.29) : P.(0< 0.29) -Pr(p'l 0.15)

o(!zg::2.\-rlors-oz\
\v/0.16/loo/ \v/0.16/1oo/
aQ.25) - O(-1.25) : 0.9878 - 0.1057
0. BB2 1.

Eu lrna investigación por muestreo interesaba saber el nivel de sintonía, en los hogares, de un
partido de fúrtbol. Se realizó nna encllcsta en Qr-rito a 213 hogares y se encontr'ó qr-re el 53% de
los hogares habían visto el nencionaclo partido. Srrpongamos clue la proporción 7r de hogares
en los que se vio cl partido fue realmente igual a 0.5. ¿,Cuál es la probabilidad de observar una
proporción muestral f igual o mayor qr.re la observada 0.53?

solución: Tenemos n:2r3 v p:0.J; por lo tarrLo,


T - +#
: 0.001174.

Por 1o que,

pr(f )0.s3) - t-pr(f<0.53)' =1-pr (¡=.9)


\ t/Pql" '/o'oottz+ 1
= 1-0(0.88) -1-0.8105
: 0.1895.
Es decir, con una muestr'¿ de 213 hogares Ia iirobabilicl¿d de que la proporción ol¡selvad¿ sea
mayol'o igual a 0.53 es del l8.95o/a.

Hzq qrre totnar Lrr.¿i nltcstla. alc¿rt,or'ía para estimar Ia proporciórr de artículos defcctnosos p de lur
ploceso de prochrcción. a) Establecer el tanraño mínirnc¡ de ia rnr-restla de modo que la proporción
observ¿rda difiera de la propolción velda,clcrr'¿ on irrerios cle 0.1, oon riua 1>robabi iclad c,le al rnenos
eI 957o; b) Realizar el inciso antelior si se conoce qr.re la ploporci<in dc artÍculos defectuosos es
mcnor clue c1 12 %.
Soht"ci,rin,;
186 Capítulo 6. Distribuciones de Muestreo

zr) Deseanros cletermirtar el ta,rnaño nríuirno cle 1a mrrestr¿r clc tal moclo quc Pr(lp tl < 0.1)
0.95:

P'(lp-tl <01) : P'( 0.1 <p-t<01)


: P,f+ <z< o' \
- \r/pql,,- r/nul,,1
olq$)
\/psl
<,(_otJ¡) -on,
\ '/ps/-
Igualando con los valores de la distribución normal y haciendo uso de su propiedad
simetría,

0.I{"
,/w
n

En esta última expresión, el valor de n depende de p, que a su vez es desconocido. Pa:.


asegurarnos de tener un tamaño de muestra confiable, se maximiza el producto pq. T;
producto es máximo cuando p: q:0.5; entonces,

n > (1e.6)2(0.5)(0.5) : e6.

La muestra tiene que ser de al menos 96 artículos.


b) Antes habíamos determinado que ?¿ > (I9.6)2pq.
Como p <0.L2, se tiene quepq > 0.I2 x 0.BB:0.10b6; entonces,

n > (r9.6)2(0.1056) : 40.57.

EI tamaño de la muestra es de al menos 41 artículos.

6.3.3. Distribución de muestreo de la varianza


En el Teorema del Límite Central la convergencia de la ley de 7 está asegurada y es independie--"
de la ley que siguen las observaciones. Para otros estadísticos, se necesitan hipótesis adicionales p,:r
asegurar su convergencia hacia una ley de distribución, este es el caso de Ia varianza muestral.

La ley de distrit¡ución y2

Sean X1 , X2, .. ., Xrr., fr variables aleatorias,independientes que siguen una distribución normal e. . .¡,.
dar, la variable aleatoria definida por T : D X? tiene una distribución X2 (jl-cuadrado) con n gr1-ul
,i-I
de libertad (g.1.), denotada y2(n).

Su función de densidad es
,(n-2) lz lz
"-r , siz)Q;
f(r):
i; 2"trt (;)
sir(0.

La ley de distribución y2 fue dada en pprl


rime r lugar, aparentemente, por Abbe (1863) y redescu,
por Helmert (1875) y K. Pearson (1900l).
6.3. Distribuciones de ntuestreo 187

2.
z@)

Figura 6.1: Funciones de densidad de la ley X2.

:sta distribución está definida para valores mayores que cero y viene tabulada. La Tabla 3 del Apéndice
--,ntiene los valores X?qrre cortan un área a en el extremo derecho de la distribución (Figura 6.1).
- a lectura de la tabla se realiza de la siguiente manera:

i. Escoja el número n de grados de libertad (margen vertical).


'1. Considere Ia probabilidad a en el extremo derecho de la distribución (margen horizontal).
3. Proceda a localizar el valor X?@) en el cuerpo de la tabla, donde se cruzan las líneas vertical y
horizontal antes encontradas.

Ejemplo. Se desea conocer el valor de la ley X2 a 4 g.l. para el cual el área en el extremo superior es
-.ral a 0.025.
-' .lución: Se busca Xl.ozs(a) : ll.l4. Esto quiere decir que el área a la derecha del valor t : II.I4
-= Ia ley y2 cor. 4 g.l. es igual a 0.025: Yr (X2 > 11.14) :0.025.

XLa ley de distribución de s2

:;pongamos que se obtiene una muestra Xy, X2, ..., Xn de una población que sigue una ley normal
-'i ri,¡.t,o2). A partir de la muestra calculamos la varianza muestral, s2 : ' n-rl-tÉ
-i (X, -X)2; entonces,
- cumple que:

-. E(s2):oz'
)n4
l. '*'\"Ls2),,
Var
n_1,
(n
J # - 1\.s2
sigue una ley ¡2(n - t;.
=jemplo. Un jugador profesional de dardos decide tratar de mejorar su técnica de lanzamiento y va
. -stndial la varianza de Ias distarrcias al centro del blanco a las que cae el dardo. Para una cierta
-rrnica de lauzamiento se sabe que esas distancias tienen una distribución normal cuya desviación
+ ándar es 4 cm. Realiza 30 lanzamientos y calcula la varianza de Ias distancias entre el sitio de
--pacto del dardo y el centro del blanco. a) Calcular Ia probabilidad de que Ia desviación estándar
-. los lanzamientos sea m¿yor a 3 cm.; b) Hallar Pr(10 < s2 < 27), aploximadamente; c) Calcular Ia
:--dia y la varianza de s2.

l.lución: Sea u : +I, IJ - x2Qq para n : 30.


188 Capítulo 6- Distribuciones de Muestreo

a) Se quiere buscar Pr(s > 3); cs clecir, Pr(s2 > 9):

pr(s2 > 9) : p, (" r' r 3r) : pr.(t/ > 16.312)


\o' -rt Iro)
En la tabla de la ley X2 para 29 g.1., se ticne que Pr(t/ > 16.05) : 0.975 y Pr(U > 17.7f): 0.95
Por lo tanto, Pr(s2 > 9) es algo menor- que 0.975.

b) Calculemos Pr(10 < s2 < 27),

pr(10 < ,2 < 2T¡ : v, (!rc <n _ut ,' t}rr\: pr(18.13 < u< 48.s4)
\16 o¿ -16 /
: Pr(U < 48.94) - Pr(U < 18.13)
: [1 - Pr(U > 48.e4)] - [1 - Pr(U > 18.13)]
: Pr(U > 18.13) -Pr(U > 48.94).

De acuerdo a Ia tabla y2, para 29 g.l. se tiene:

c Pr(i/ > 17.77):0.95 y Pr(U > 18.85) :0.925.


c Pr(t/ > 45.72): 0.025 y Pr(t/ > 49.59) : 0.01.
Entonces, Pr(10 < s2 < 27) x 0.95 - 0.01 : 0.94.
Observemos que, por la forma de lectura de Ia tabla, tnvimos clue realizar Lrrla transformació:-
para encontrar Pr(18.13 < U < 48.94) y su valor se determina de forma aproximada.

c) Sal-,emos que E(s2) :62 :1ti y quc Var(s2) : : tT.G6.


#:'#

6.4. Otras distribuciones de muestreo

En csta sección presentaremos distirrtas distribuciones cle muestrcoT qlre se presentan cuando tratantc,.
con transformaciones adecttadas cle los estadísticos. Estas transformaciones son rlecesarias para oJ¡tene:
leyes clc probabilidad que permitan traba,jar adecuadamente.

6.4.1. Distribución de muestreo de Ia media, cuando la varianza es desconocida


Se pr-rcde srtponer qrre -ciebido al Teolema del Límite Central , siempre sc tienc la convergcncia haci .
1a lcy rrolmal; pelo ésto no siempre srrcedc; cjomo) por ejemplo, crrando la vari¿rnza poblacional e.
desconocida.

La ley de distribución t de Student

trn 1908, \ /. S. Gosset, esclibieldo c:on cl nornbre de Studcnt, publicó en la rcvista Biont,ett"i,ka s'
dcclucción cle la distribución ú e inclrryó tlrblas cle probtrbilicl¿rd acurnr-rlacla de la ley.

trl gráfico de la función de densidad de la Ie5, / 1i"t n rrna forrna parecida al de la ley rrormal, simétric
rcspecto a 0 y se extiende a Io largo clel eje leal.

Los valores de probabiliclad clue tona vienen tabul¿clos. La Tabla 2 del Apénclice contienc los v¿rlole:
dc úo qrte colt¡lrr nn área igrral a o err cl extlemo clelecho clc la distribución (FigLrrrr 6.2).
6.4. Otras distribucíones de ntuestreo 189

Figura 6.2: Funcion de densidad de la ley ú.

Los valores tabulados dependen de los grados de libertad, porque la ley de probabilidad ú cambia si n
;aría. Cuando n aumenta, la distribución ú se aproxima a la normal estándar.
La lectura de la tabla se realiza de la siguiente manera:

1. Escoja el número n de grados de libertad (margen vertical).


2. Considere Ia probabilidad o en el extremo derecho de la distribución (margen horizontal).
3. Proceda a localizar el valor to(n) en el cuerpo de la tabla, donde se cruzan las líneas vertical y
horizontal antes encontradas.

Ejemplo. Encontrar el valor de Ia ley ú a 6 g.l. para el cual el área en el extremo superior es igual a
_.t125.

jolución: Se busca fo.ozs(6) :2.447.Esto quiere decir que el área a la derecha del valor t:2.447 de
--,Iey t es igual a 0.025: Pr (? > 2.447) : 0.025.

La ley de distribución de X

Srpongamos que se obtiene una muestra X1, X2, . . ., Xn de una población que sigue una ley normal
-l'(p,,o2), donde o2 es desconocida. Entonces, se cumple que la variable aleatoria 7: j
s/\/n "igu"
.ra ley ú de Student con (n - 1) grados de libertad. Es decir,
/ t- \
Pr(X < ú):
' Pr (r.- Z- 41
sl'/n)
\
Ejemplo. IJn fabricante de cigarrillos asegura que el contenido medio de nicotina, en una de sus
-arcas) es de 0.6 mg por cigarrillo. Una organización independiente mide el contenido de nicotina
-e 16 cigarrillos de esta marca y enclrentra que el promedio y la desviación est¿índar son de 0-744 y
-.i75 mg de nicotina, respectivamente. Si se supone que la cantidad de nicotina de estos cigarrillos
= una variable aleatoria normal, ¿qué tan probable es el resultado obtenido por la organización
- Cependiente?

i'.,iución: Se tiene que p:0.6, s:0.175, n: L6. Encontremos la probabilidad de hallar un valor
::omedio igual o superior a 0.744.

pr(x > 0.744) : y, ( r ro^'-!j, Y) : e, (r > B.2s)


\ - 0.175 l,/to 1
.

) Ia lectura de la tabla de la ley ú con 15 g.1., resulta que Pr (" > 3.29) : 0.0025. De manera que el
-'Lto proporcionado es muy poco probable.
190 Capítulo 6. Distribuciones de Muestreo

6.4.2. Distribución de muestreo de la diferencia de dos medias, con varianzas


conocidas

SLrl>orrgtrrnos qLlc se clispone de dos pol-rlaciones que tienen rriedias Ft y lrz y varianza, ol v o)r.
respcctivarnente. Sean X1 y X2 ias lreclia muestrales de dos muestras ¿leatorias indepenclientes de
tarrr¿rños TLr y rL2l seleccionadas les¡rcctivarnelte de las poblaciones 1 y 2. trntonces, X1 - X2 cunlple
qr.le:

1. lLrl-,2: E(Xr - Xz): l-tt - llz,

2. o7r-¡r: Var(Xr
o?-l- oZ
-¡2): TL1
-
¡I

-ln2

3. Para n1 y n2 suficientemente grandes, Ia variable aleatoria

7-
(Ft -x2) - (pr- t'z)

sigr"re aproximadamente una ley normal estándar. Es decir,

Pr(xr -xz < a =e, (z t-(tq-pz) t-(tq-pz)


<
):.(

Para la mayoría de aplicaciones, ya se obtiene una buena aproximación si n1 >_ 25 y n2 2 25.


Ejemplo. Una marca de automóviles tiene dos plantas que ensamblan el mismo modelo de autos
El rendimiento medio de estos automóviles debe ser de 40 km por galón, con una desviación estándar
de 5 km por galón. La empresa tiene la política de regularmente comparar los rendimientos de ios
carros ensamblados, escogiendo muestras aleatorias en las dos plantas. Se tomaron sendas muestras de
tamaño 30 y se controló el consumo promedio de cada una. Hallar la probabilidad de que la diferencia
entre los promedios sea menor a 2 km por galón.

Solt¿ción: Se tiene eue É¿r


: lL2: 40, o1 - 02 : 5, ny : nz : 30. Por tanto,

<z< 2-(40-40
r:d------'=t
t5'
tl-L-
Vro go
o(1.55) - o(-1.55) : 0.9394 - 0.0606
0.8788.

6.4.3. Distribución de muestreo de la diferencia de dos medias, con varianzas


desconocidas

Supongamos que se dispone de dos poblaciones que siguen una ley normal: la población 1 sigue una le¡-
.M (lrr, ol) y la población 2 sigue una ley ,A/(¡ 12, 03) . Sean X 1 y X2 las media muestrales de dos rnuestras
aleatorias independientes de tamaños Uy n2, seleccionadas respectivamente de las poblaciones 1y 2.
6.4. Otras disúribuciones de ntuestreo 191

Caso 1. Las varianzas poblacionales son igualesz ol : o'3,: o2.

L¿r r'¿r'i¿rbkr alcat<llia

sigue una ley ú corr

Caso 2. Las varianzas poblacionales son diferentes: ol I o|.


La variable aleatoria

sigue una ley ú con g 9.1., donde

(*.*)'
9-

Cuando g no es un nirmero natural, se redondea al entero más cercano.

6.4.4. Distribución de muestreo de la diferencia de dos proporciones


Supongamos que se dispone de dos poblaciones independientes, que siguen distribuciones de Bernoulli
de parámetros p1 y p2, respectivamente. De Ia primera población escogemos una muestra de tamaño
n1:Xy,Xzr...rXrrrydelasegundapoblaciónescogemosunamuestradetamañorl2iY1,Y2r-..rYnr-
Construimos las proporciones muestrales de <<éxitos>>:

1ntlft2
Ft:Lfx,
fl,'t a
y Fz:!fy,.
nt- u
- i:l i:t

Entonces, F, - Fz cumple que:

p¡,-Or: E(i'r - fz) : pr - p2;

, 1r ,^ ^\ pt(J-pt).pz1-pz)
2 -Pt-P2
va - '*-\rr
vaLtul
- r''/
tt)t T )
- - TL1 n2
3 Para n1 y n2 suficientemente grandes, la variable aleatoria
- -
.
t-.-
-rr

\- -.
L92 Capítulo 6. Distúbuciones de Muestreo

sigue aproximadamente una Iey normal estándar (por el del Límite Central). Es decir,

t-(pt-pz) t-(pt-pz)
Pr(Fr - lt) =rr( , t
Fz

\
ffi
U"r-rr" Un2

Ejemplo. Una-6rma especializada en sondeos polÍticos afirma que el 30 % de las mujeres y el20%
de los hombres están a favor de la reelección del actual alcalde. Si se hace un sondeo aleatorio a 150
personas de cada sexo, ¿con qué probabilidad la diferencia entre las proporciones muestrales de las
mujeres y de los hombres es, en valor absoluto, menor a 0.19?

Solución: Tenemos eue Pa : 0.3 y P^:0.2, rlh: rlm: 150. Ademrís,

n1o
-pt-rn
0.3(1 - 0.3) , 0.2(1 - 0.2):0'00247' A

150 '* ff
Buscamos la probabilidad Pr (lfn - f^l < 0.19):
pt(10¿
-0^l < 0.19) : Pr(-0.19 <Fn-A' < 0.19)

: (0.3-0.2)) _* l_0.le- (0.3-0.2)\


o r0.le-
\ \/0.00247 / \ r/0.00247 )
: o(1.81) - o(-1.81) : 0'9648 - 0.0352
: 0.9296.

6.4.5. Distribución de muestreo de la razón de dos varianzas

La ley de distribución F

Sean X1 y X2 dos variables aleatorias independientes que tienen distribución y2 con nL y n2 grados
de Iibertad, respectivamente; entonces la variable aleatoria

,, xrlnt
' - Vrln,
sigue una distribución F (de Snedecor) con (n 1, n2) grados de libertad, que se Ia notará como F(n1,n2)
(Véase la Figura 6.3)

Figura 6.3: Funcion de densidad de la distribución F


6.4. Otras distribuciones de ntuestreo 193

Su función de densid

-??2\ n,/2
I (-)n'i"'n,
-/rt n2f2

rl-\ _ / ,'nt/2-1(n2 I n1r)-('nrtnz)lz, si z > 0;


J\.1 )-
.(?) ,G)
0, sir(0.
La esperanza y la varianza son:

: 2n|(n1+ n2 - 2)
E(Y) "^,sin2>2
TL2- ¿
y Ya{V1: nt(nz-2)z(n2-4)' sín2>.4.

Nótese que esta ley depende de dos parámetros (nt,nz) que corresponden a sus grados de libertad del
numerador y del denominador, respectivamente.

Los valores de las probabilidades vienen tabulados. En la tabla 4 del Apéndice se presenta el valor r
para el cual la variable aleatoria V - F(n1,n2) es igual a una probabilidad a: Pr(V ) r) : q.

Para la lectura de los valores porcentuales del extremo inferior de la tabla de la ley -F se emplea la
siguiente relación:
F1r-,"¡(u,nil p,()r,nr)

Ejemplos

1. Determinar el valor de r ) r):0.05, donde V - F(6,9). En la tabla de la ley F


tal que Pr(V
correspondiente a a : 0.05, se localiza los valores de n1 - 6 y ,z: 9, para los grados de libertad.
Donde se cruzan la columna y la fila correspondientes se lee el valor z : Fo.os(6,9) : 3.37.

2. Hallar el valor de r tal que Pr(V { r):0.05, donde V - F(6,9). Aquí, n1 :6, TL2:9 y si
Pr(V < z) : 0.05, entonces Pr(V > r) : 0.95. Por la relación anterior,

Fo.gs(6,9) : 1L :
,. ou.g,
^:0.244.
^2
La ley de distribución d" 1
si

S rpongamos que se dispone de dos poblaciones que siguen una ley normal: la población 1 sigue una
ol) y Ia población 2 sigue una ley J!'(pr,"}). Sean sl y s2rlas varianzas de dos muestras
-.r-,A/(¡21,
ieatorias independientes de tamaños n).y n2t seleccionadas respectivamente de las poblaciones 1y 2.
trntonces, Ia variable aleatoria

'n- '?1"?
'31"3
:-3-ue una distribución -F' con (rt - I,n2 - 7) g.I.
t
fengamos presente que si o?: o3: 02, entonces f' : 3 - F(n, - !,n2 - I).
D2

Ejemplo. Una marca de automóviles tiene dos plantas que ensamblan el mismo modelo de autos.
=l rendimiento de estos automóviles debe tener la misma media y desviación estándar. La empresa
--ene Ia política de regularmente comparar los rendimientos de los carros ensamblados, escogiendo
t94 Capítulo 6. Distríbuciones de Muestreo

rnrr<lstlas aie¿rtori¿rs en las clos plarrta.s. Se tonl¿uorr serx.l¿s mrrestr'lrs cLc tarri¿rño 30 y se controlrj l¿r
clcsvi¿rcicin est¿irrclar clc:l corrsumo clc c:acla urr¿r. Hallar' 1zr probabilicL¿rd clc quc l¿r clesvi¿rcicin cstárrc1¿-rr
cle una rnucstr¿] se¿r al rnenos 1.5 r't:<;es nravor qrtc lir clt: l:r seguncla.

SoLttción: Se tiette c¡-rc:

- :.,( p,.r^)
", (; ")
Como F : t: - F(29,29); entonces.

/.?
001<r.(ü > 2.25) < o.o2b,

La probabilidad exacta cs Pr (#a2.25) :0.01632t

6.5. Ejercicios
Distribución de la media

1. Para una prueba de aritmética se sabe, con base en Ia experiencia, que la puntuación media es 7[t
puntos con una desviación estándar de 12.5. Si se aplica la prueba a 90 personas seleccionadas
al azar, aproxime las siguientes probabilidades:

a) Pr(68.5 < X <71..5); c) Pr(X > 72);


b) Pr(66 < X <74); d) Pr(X < 67.5).

2. En una ciudad, el peso de los recién nacidos se distribuye segÍrn una ley de media ¡¿ : 3100 g :
desviación estándar o : 150 g, Halle los parámetros de la distribución que siguen las medias de
las muestras de tamaño 100.
o
!). Un actuario estableció el siguiente modelo probabilístico sobre los sueldos que reciben los traba-
jadores en el sector de la agroindustria:

Sueldo 200 300 400 500 600


Pr 01 0.2 0.4 0.2 0.1

Si de este sector, se toman 30 sueldos, aI azan,

a) Halle la esperanza y Ia varianza de Ia media muestral;


b) Calcule la probabilidad cle que la rncdia mnestral se ubique entre 360 y 430 dólares.

4. Las normas internacionales de calidad indican que los neumáticos deben durar al menos 33 m:l
km. Un fabricante de neumáticos señala qlre su producto tiene una dulación promedio de 34 nr-
km y desviación estándar de 4 mil km. En un iaboratorio que controla la calidad de fabricación s=
probaron 36 llantas de esta marca. ¿.Cuál es la probabilidad de que, en promedio, los neumáticc'.
probados no cumplan con las normas internacionales?
IEste valor se obtuvo mediante el empleo de r.rn proglama conputacional.
Nosotros) por la lirnitaciór-r cle las tabla-.
solo podemos acotar el valor de la probabilidad.
6.5. Ejercicios 195

5. El tierripo qne los usu¿rios dc nna emplcs¿l intcrlplovirrcial de transpolte esperan l)ar'¿r cpre stl
brrs salga clel telrnin¿r1 es rrn¿ r'ariabk: alcatolia con mcclia. rle 8.2 rnin y clesr.'iación estáncl¿rr cle
5.5 rnin. Sr-rporrga qnc err uri l¡us se ernl;arc:¿trorr 49 p:rstr.jeros. Halle l¿r probabiliclacl cle clue el
tienipo plorneclio quc ellos turrielori cllre esl)elal se¿l:

a) rnenor a 10 mirr. b) entre 7 y 10 rnirr; c) mayor a 7.5 rnirr.

[1. La gente que freclrenta cierto bar tiene una probabilidad de 0.001 de salir y cantar con el grupo
que está actuando. En una noche de fin de semana hay 150 personas en el bar. ¿Cr-rál es la
probarbilidad de que al rnenos una pelsol1a salga y cante con el grr-rpo? (Suponga que cad¿r
persona en el bar toma la decisión independienternente del resto. Halle el verdadero valor y erl
aproximado)

7 El tiempo de permanencia de los automóviles en un gran parqueadero es una variable aleatoria de


media 176 minutos y desviación estándar 40 minutos. Calcule, aproximadamente, la probabilidad
de que el tiempo medio de permanencia en el parqueadero de 100 automóviles, elegidos al azar)
sea superior a 180 minutos.

8. La estatura de los varones de 18 años de Quito sigue una distribución normal de media 162 cm
y desviación estándar 13 cm. Se toma una muestraalazar de 85 de estos chicos encuestados y
se calcula el promedio. ¿Cuál es Ia probabilidad de que este promedio se encuentre entre 159 y
164 cm?

9. EI centro de cómputo de su universidad dispone de un servidor para gestionar las páginas web
personales de profesores y alumnos. Supongamos que la cantidad de memoria ocupada por una
de estas páginas puede considerarse como una variable aleatoria con una media de 1.3 Mb y
una desviación estándar de 0.3. Si el servidor va a gestionar un total de 500 páginas, calcnle,
aproximadamente, la probabilidad de que la cantidad promedio de memoria necesaria supere los
1.32 Mb.

10 Se efectuó un análisis sobre Ia duración de las máquinas impresoras, de una cierta marca) que
tienen las empresas púrblicas. Se eligió una rnuestra de 179 máquinas utilizadas en una empresa
elegida al azar. La vida media de las impresoras resultó ser de 3.33 airos y una desviación
estándar de 2.05 años. Con una probabilidad del 99.7%o, ¿en qué intervalo de tiempo puede
considerarse que se encnentra la vida media de las impresoras de tal marca?

Con una muestra de 160 entrevistas realizadas a mujeres que trabajan, resultó que el gasto
promedio mensual en arreglo del cabello fue de 39 dólares y desviación estándar de 5.2 dólares.
Con una probabilidad del 99.7To, ¿entre qué lÍmites variará el gasto medio en arreglo del cabello
para las mujeres que trabajan?

Un proceso automático llena fundas de chifles cuyo peso medio es de 450 g y una desviación
estándar de 3 g. Pala controlar el proceso, cacla hora se pesan 36 fundas escogidas al azar'; si
el peso neto está entre 449 g y 451 g se continlra con el proceso, en caso contrario se detiene el
proceso para recalibra,r la máquina.

a) ¿Cuál es la probabiliclad de detener el proceso cuando el peso neto medio realmente es 450
b')

b) ¿Cuál es la probabilidad de aceptar que el peso neto promedio es 450 g, cuando realmerite
es de 448 g?

_.f
-'f . La vida útil de cierta ürarca de llantas sigr-re unt-r distribución normal X con media 38 mil km y
desviación estándar 3 mil km.
196 Capítulo 6. Disúribuciones de Muestreo

a) Si Ia utilidad Y (en dólares) que produce cada llanta está dada por Ia relación Y :0.2X -f
100, ¿cuál es la probabilidad de que la utilidad sea mayor que 8900 dólares?;
b) Determine el número de tales llantas que debe adquirir una empresa de transporte para
conseguir una utilidad media de al menos 7547 dólares, con una probabilidad de 0.996.

14. En Manabí, el peso de los esDosos y de las esposas se distribuye según las leyes
y N(64,69), respectivamente, y son independientes. Si se eligen 25 matrimonios, ^/(80,100)
al azar, de
Manabí, calcule la probabilidad de que el promedio de los pesos sea a lo más 137 kg.
Distribución de la proporción
1
15. Se extrae una muestra aleatoria de 150 elementos de una población binomial corr pt :
4' ¿cuál
es la probabilidad de que Ia proporción muestral satisfaga
*=U= *t
16. El suceso A tiene una probabilidad de 0.4. Esto significa que esperamos que la frecuencia relativa
de A esté cercana a 0.4 en una larga serie de repeticiones del experimento que se está modelando.
¿Cuál es la probabilidad de que en 1000 experimentos, la frecuencia relativa esté entre 0.38 y
0.42 (inclusive)?

17. La FIFA está interesada en conocer si las selecciones nacionales ganan más de la mitad de
los partidos que juegan en casa. Suponga que se escogen aleatoriamente los resultados de 80
partidos, efectuados en las más recientes eliminatorias para el Mundial de Fútbol, y se encuentra
que 65% de ellos fueron ganados por el equipo local.

a) ¿Es el 65% un parámetro o un estadístico? Explique;


b) Asumiendo que no hay ventaja de campo, y por lo tanto que los equipos locales ganan el
50 % de sus juegos, determine la probabilidad de que los equipos locales hubieran ganado
el 65% o más de sus partidos en una muestra de 80 resultados;
c) ¿La información muestral (que el 65%de los juegos fueron ganados por el equipo de casai
provee fuerte evidencia que Ios equipos locales ganan más de la mitad sus partidos? Ex-
plique.

18. Supongamos que el 80 % de todos los residentes en Guayaquil celebran la fiesta de Navidad (el 25
de diciembre.) Se planea seleccionar una muestra aleatoria de 300 guayaquileños y determinar
la proporción de ellos que celebran la Navidad.

a) ¿Es el 80% un parámetro o un estadístico? ¿Qué símbolo usa para representarlo?;


b) De acuerdo al Teorema del Límite Central, ¿cómo variará la proporción de quienes celebrarr
la Navidad, de muestra a muestra?;
c) Determine la probabilidad que menos de las tres cuartas partes de la muestra celebre la
fiesta;
d) ¿La probabilidad calculada en c) sería mayor, menor o igual si el tamaño de la muestra
fuera de 800 personas? (Usted no necesita realizar cálculos.) Explique,

19. En un canal de transmisión de datos Ia probabilidad de que un bits se reciba con un error es
1 x 10-5. Si en una transmisión se envían 16 millones de bits, ¿cuál es la probabilidad de que
no ocurran m¿ís de 150 errores?

20. Según las estadÍsticas de tránsito, se ha establecido que en una noche de viernes, en promedio.
1 de cada 10 conductores está ebrio. Si un fin de semana la policía realiza 400 pruebas de
alcolemia, ¿cuál es la probabilidad de que el número de conductores ebrios detectados:
6.5. Ejercicios L97

a) menos de B %?; c) al menos 10 %, pero menos de 73%?


b) más de 12.5Vo?;

21. Supongamos que el 40% de los votantes está a favor de Ia reelección del actual alcalde.

ü
a) Si se selecciona una muestra de 600 electores de la ciudad, ¿cuál es la probabilidad de que
la proporción muestral de votos a favor del alcalde esté entre eI37To y el4570?;
ie
b) ¿Cuál debe ser el tamairo rruestral para terrer una probabilidad det 97 % de que la proporciórr
de votos a favor del alcalde en la muestra no se diferencie de la proporción supuesta en más
deI2%?
a_
22. La mediana de la edad de los habitantes del Ecuador es de 26 años. Si se seleccionan 100
residentesenEcuador aIazar, calculelaprobabilidaddequeporIomenos el 60% deellostenga
menos de 26 años.
.tD
1.,-, ,
Lt) Se ha estimado que eI 437a de los estudiantes de leyes considera que es
muy importante que se
imparta un curso de ética en la abogacía. De una población de 800 estudiantes se tomó una
muestra de 80. Calcule la probabilidad de que más de la mitad de ellos opinen de ese modo.

24. En la segunda vuelta electoral los resultados clan que el candidato ganador obtuvo el 55 % de
los votos. ¿Cuál es la probabilidad de que en una encuesta realizada a 169 personas el resultado
no muestre una mayoría a favor dei candidato?

En una encuesta realizada con una muestra de 3000 personas adultas escogidas al azar, ha
resultado que el 35 % toma café al menos una vez al día. Con una probabilidad del 95.5 %,
¿entre qué lÍmites variará esta proporción para Ia población completa?

26 El tiempo que esperan los peatones para crllzar una vía muy transitada se distribuye en forma
exponencial con media de 1 minuto. Si en una hora llegan 95 peatones, calcule la probabilidad
<i de que por lo menos la tercera parte de ellos tenga que esperar más de un minuto.
-.-
Lr--

27 IJnajedrecistaexperimentadohaganado eI70% delaspartidasquehajugado. Sienelpróximo


mes va a participar en un torneo en el que va a jugar 25 partidas,

a) calcule la probabilidad aproximada de que gane por lo menos el 80 % de ellas;


b) calcule la probabilidad binomial exacrta de que gane por lo menos 20 partidas;
c) ¿qué hipótesis son necesarias para que sean válidas Ias respuestas a) v b)?

Distribución de la varianza
28 Con el empleo de Ia tabla de la ley X2 Iocalice Ios siguientes valores y represéntelos, aproximacla-
mente:

u) rBss(e); ¡) xSgg(12); c) xfrorr(20); a) xfrou(to).

rr 29 Si X1 , X2,...,X9 son nueve variables aleatorias independientes y distribuidas según una ley
l.- !-
It[(t2,32), calcule la probabilidad de que la varianza muestral sea menor o igual que 56.28.

30 Calcule Ia probabilidad de que una muestra de tamaño 13 seleccionada de una población normal
con varianza 4 tenga una varianza muestral:

a) menor que 7.01; b) entre 1.I9 v 2.7.


198 Capítulo 6. Distribuciones de Muestreo

31. Encuentre la probabilidad de que una muestra aleatoria de 20 observaciones, de una población
normal con varianza o2 :5, tenga nna varianza nuestral s2: a) rrayor a 8.1; b) entre 2.66 y
9.52.
ta
¿L, En los últimos 5 años, las califlcaciones del exarrren de aptitud para el ingreso a la universidad,
siguen urra distribución nolmal con variarrza o2 :8. ¿Consideraría usted o2 :8 como un valor
válido de la varianza de las notas de los exámenes que se rindieron este año, si una muestra
aleatoria de 20 calificaciones arrojó un valor de s2 : 16?

J.t. En una oficina de seiección de aspiral.tes para optar por una beca se estudia Ia varianza de las
calificaciones para identificar fácilmente a los mejores aspirantes. Para una prueba de matemáti
cas se supone que las calificaciones se distril)uyen normalmente con desviación estándar de 10.
Hay 15 aspirantes a optar por una beca. Calcule Ia probabilidad de que la desviación estándar
de las calificaciones de clichos aspirantes sea mayor clue 7.
q/
t)1. En una granja piscícola se mide la varialrilidad en el peso de los peces capturados. Las normas
internacionales indican que el peso está distrilruiclo según la ley normal con varianza o2 : 225 82 .

Se pesan 27 peces y se calcula su vatiarrza s2.

a) Estime aproximadamente Pr(s2 > 150); c) Calcule E("') y Var(s2).


b) HaIIe Yr(s2 > 362);
o<
JU. El sueldo anual de los ernpleados cle urra iristitución se supone que sigue una distribución norrnal
con desviación estándar de 100 dólares. Si en una inspección Ia oficina de irnpuestos toma una
muestra de los sueldos de 17 empleados, determine un intervalo en el que quedarálavarianza,
de los sueldos anuales, con una probabilidad de 0.9.
Otras distribuciones de muestreo
36 Con el empleo de la tabla de Ia ley ú localice los siguientes valores y represéntelos, aproximada-
mente:

a) ús 1(9); b) ú¡ ¡1(12); c) üo.ozs (20) ;


d) ¿o05(16).

.)/ Si X1, Xz, ..., X9 son nueve variables aleatorias independientes y distribuidas según una Iey
¡/(8, 4), calcule la probabilidad Pr (f ST < 9; 1.09 < t2 < 10.045) . (X v s2 son independientes)
38 En la ciudad capital. el precio rredio de venta de las casas nlrevas es 115mil dólares. Se toma
una rnuestra aleatoria de 10 casas nuevasr resultando una desviación estándar de 25 rril dólares.
¿Cuál es la probabilidad de que la media muestral de los precios de venta sea:

a) menor de 104mil dólares?; b) mayor de 110500 dóIares?

39 Se tomó una muestra de 16 directores de oficinas de una ciudad con el fin de estimar el tiempo
medio diario que emplean en desplazarse hasta su trabajo. Si Ia media cle los tiempos es de 87
minutos y Ia desviación estándar de 20 minutos, calcule la probabilidad de clue la media muestral
sea menor de 100 minutos.

40 Con el empleo de la tabla de la ley F localice los siguientes valores y represéntelos, aproximada-
mente:

a) ,Fo r(9,5); b) ro o1(t2,t2) c) 'P¡ 025(20,7)r d) ¡b05(15,4).

47. Dos muestras aleatorias inclependientes de tamaños 27 y g, respectivamente, se toman de una


misma población normalnente distribuida. ¿Cuál es la probabiiidad de que la varianza de la
primera muestra sea ¿r,l menos el cuádruplo de la varianza de la segunda?
6.5. Ejercicios 199

72 Dos nruestras ale¿rtotias irrclependicntcs cie tanraños 7 y 13, r'cspcc:tivarnente, se toüt¿u] dt: ula
rnisrna población rronrr¿lrnente clistribrricl¿r. ¿.Cuál cs lir probabilicl¿id cle que la variarrz¿ cle l¡r
¡llirnela rnrestla sc¿l rr)¿r-\/or igrral zrl tliplc clc l¿r r'¿rlianza cle lrr strgrrnd¿r mucstra?

- \2(20) ), l': Halle los valores <lc r¿ y b tales


1.f
f'J Sean X1 - X2(9) , X2
#fr
qr.re

Pr(o(Y<b):0.925 y Pr(Ylg) :0.05.


14 Sean X1 y X2 Ltna mlrestr¿r cscogida cle una población normal cstán<lar.
/ \, -. r 2
a) Determine la ley cle distribución de p : (*f# )
\Xr - Xz/ '
b) Calcule la probabilidad Pr(F < 16).

Una muestra aleatolia de tarnaño 16 sc seleccionó a partir de una población normal de media 75
y desviación estándar B. Una segunda muestra alcatoria de tamaño 9 se tomó a partir de una
pobiación normal de media 70 y desviación estándar 12. Sean X1 y X2 dos medias mrrestrales.
Halle:

a) la probabilidad de que Xt - Xz sea mayor que 4;


b) Ia probabilidad que 3.5 1 Xt - X2 < 5.5.

6 Una firma comercializaclora afi.rma que el peso medio (en gramos) tq y pz de dos marcas de
atúrr enlatado, A1 y Az, es el mismo. Para verificar la afirm¿rción se escogen dos muestras
independientes de tarnaños 36 de cada marca. Si la rnedia mlrestlal de A1 es mayor que la
media muestral de y'.2, sc rechaza gue Fr : 11,2, e\ caso contrario, se accpta gue Fr : 1tr. ¿Cl'ál
es la probabilidad de aceptar eue ¡lr : lt2, cuando realmeute p¡ : ll2 l2? Suponga que las
poblacionales son o?:9 y o2n : 4.

Para comparar la duración media (en rneses) Ltt y ltz de dos marcas de baterías , A y B, se
tomaron dos muestlas aleatorias independicrrtes de tamarlos 32 y 36, respectivamcnte. Si Ia
duración promedio (mrrestral) de ,4 es mayor que la de B en más de dos rneses, se acepta que
ltt ) l-tz; caso contrario, se acepta qlre /¿t : 1t,r. Calcule la probabilidad de aceptar q:ue ¡17 ) ¡r"2,
cuando realmente Ft: ltz. Suponga que las varianzas de las duraciones son o2¡: 16 y o2B: g.
,i
EI administrador dc r-tn edificio quiere decidir la compra de lámparas fluorescentes de m¿rca 7
o [/. Pala ayudarle a lealizar su decisión) se escogen dos muestras de tamaños 10 y 9 lámparas,
respectivamente, rcsultando las desviaciones estándar de s1 : 200 y sz : 150. Si la diferencia
entre los promedios es rllayor que 173 horas, se acepta eue pt I pz; de 1o contrario se acepta que
l-Lt: llt. ¿Cuál es la ltrobabilidad cle aceptar c¡re /¿t f ¡-t"2, ctando realmente pr: p2? (Asuma
que Ia vida irtil dc ambas narcas tiene distribución normal con valianzas iguales.)

Para cornparar los salarios que pagan a sr.rs empleados dos fáblicas cle cobijas, San Lucas y
Cebra, se escogen dos muestras aleatorias cle tamaños 16 y 13, respectivamente, de las dos
fáblicas. Resultó que la^s desviaciones est¿indar filerori sr: I20 dólales y sc : 55 dólares. Si
la difer-encia entre las rnedias rnnestrales no es tr]¿yor a 65 dólares, sc acepta que ¡,r,1 - /-¿2; caso
contrario, se accpta eue /r,1 I Itz. ¿Cuál es la probabilidad de aceptar que /¿1 I p,z, cuando
lealrtretrte Ft : I,tz7 Suporrga que los salarios, cn ambas empresas, siguerr una distlibución
nornral con valianzas difeleutes.

;c Dos plogramas de televisión tienen como latings 40% y 20Vo, t'espectivamente. Se tomó una
muestra de 300 hogales qne poseen televisor, durante Ia transmisión del programa A y otra
muestra de 100 hogar"es durante Ia transmisión de B. ¿Cuál es la probabilidad de que los
resultados muestren qr:e el programa A tiene un rating mayor al de B, en un 70%?
Capítulo 6. Distribuciones de Muestreo

51. Un f¿rbricarrte cl 30% de mrrjcrcs y ei 20% de hornbres prcficren su jabón dc tocador.


¿-ifirul¿r que
a 200 pelson¿r^s d<: c¿rda sexo) ¿.colr qrré pr<,rbabilidad ia proporcióu
Si se realiza lrna crrclresta
muestrai de mujercs rrelros la propolciórr nrrrestral de valoncs est¿in en el interrralo (-19 %.
Is%)?

52. Se escoge una mnestra de 600 electores c¡rrc acaban de votar, entre la,s 9:00 h y las 15:00 h, pare,
estimar la propolción cle votantes a favor de los canclidatos H y M. En una encuesta re¿rlizada l¿.
víspera, se estimó en 30% y 35% los polccntajes cle apoyo de los dos candid¿rtos, respectivanielte.
¿.Cr"rál es la probabilidad cle clue la proporciórr rnuestral de B excecla a la proporción rnuestral de
A en al menos I0%?

53. La música romántica es preferida por el 30% de mujeres y eL25 % de hombres. En una encuesta
realizada a 300 personas de cada-sexo, ¿cuál es la probabilidad de qne la proporción muestral de
mujeres que prefieren la música romántica, sea mayor a la de los hombres?
Crpítulo 7

Estlmación de Paránnetros

Todos ltentos estado l¿o,cie'r¿d,r¡ esto,díst'ica, todo, La ui,elo,.


er¿ el sentido que cada u"no ha estado octrpado sacando conclt¿siones
a parti,r de obserua,ciones empír'icas, casi desde el nac'im'icr¿to
W. Kruskal

:n el Capítuio 1 se expusieron varios métodos qr-re permiten descrilrir un conjurrto de datos de rna-
,-era r'ápida, generai y efi.caz; estos métodos son grtíficos y su intelpretación es fácil, pero tienerr el
:-cortverrieute c¡te la dcscripci<in cle los datos no es úrnica y no sc plcstan para realizar Jrreclicciorres.
:l rtso clc la ittforrnación que se obtiene a partir dc un¿r muestra pa.la sacar corrcinsiones soblc l¿r

rl¡lación de la quc ella 1>roviene, se cleuomira itt.ferenci,a esto,d,,ística.


- la inferettcia est¿Ldística que se clescribilán cn éste y los sigrrientes capÍtnlos sc leficlerr
¡s rnétoclos de
. ia r:stitn¿rción de ltarárrtetros, ltr formulaciól y verificaciiin c1e hipcitesis soblr: estos ptrlzintctlos 1; ¡l
-antearrrierlto cle rnodelos aclecuaclos pzrra krs d¿rtos.

;.1. Estirnación

-. teoría de 1¿r estirnación de parámetros fue clesarrollacla en las primeras décadas clel siglo XX,
Ilo rur¿t parte de otra teoría (las pruebas de hipótcsis) y sistematizaclir por J. Neyrnarr cu 1934.
-- tualmente, esta teoría es la basc de cr-ralquier estudio estadístico.

-"tartclo sr¡ toma ttna nutestra de una poblaciórr, e1 olljetivo es tenel un indicio cle los valoles cle los
.-rárnetros descorrocidos de ésta. Tal proceso se dc:nomirta est'imarción y a los valoles c¿rlcul¿rclos
'. inladores.
Definición (de estimador) IJu cstimador es rlua nieclida est¿rdístic¿r qrre permite conocer o
-:,a idea del valol de ttn paliimetro dcsconocido, basándose en la información de la mr-rcstra.

- :' ejcrnplo, si disponerrtos cle una poblaciórr cr-rya rneclia ¡.r, es desconocida, es natulal cscogcl el
:. rrnedio r conro estirnador clr-. ¡r,.
,:,,selvemos que un estirnar,lol es nna variable aleatolia; rnientras que Llua estirnaciórr es nn núrrnct'o.

:--lr.ttr¿s veces)
los estirnadorcs dc los parzímetros poblacionales se distingr"ren clel verdadero r'¿rlol
:'--diante el empleo del símbolol Por ejenplo,

20r
202 Capítulo 7. Estimación de Parárutetros

p : vercl¿rclcro rralol clc la propotcióri ltoblaciottal.

f : proltorción poblzrciorral cstirrracla, ir partir cle una rnnestr¿-r.

Las siguientcs secciones l¿rs declicalenros ¿r cono(icll las plopiecl:rclcs cle los cstinr¿rdores clc los pnr'ámetr,,-
poblacionales, a evaluar su r.aliclez \' ¿r cxporlcr s'.is aplicaciones.

7.2. Clases de estimadores

Cuando sc obticrre una rnuestra de nua población, el objetivo es tomar una decisióti cu b¿rse de I

estadísticos calculaclos a partir de los datos rnuestlales; luego ellos se resumen en frascs como I..
siguientes:

1. trn 2930 de los 10 000 hogares de Ia ciudad se sintonizaba cierto prograrna de televrsrón.

2. EI nivel dc desocupación en el país es ei 14 % de la población en edad de trabajar.


t
.). La mtrestra usando el Material A tiene, en promedio, una fortaleza a la tensión 3.2 unidade.
mayor que aquella empleando el \4aterial B.

Los estimadores anteriores dan una idea concisa de los resultados de la muestra, pero no inform¿.:
de su precisión. Así, pudiera haber gran diferencia entre tales estimaciones, calculadas a partir C=
una muestra, y Io que uno podría obtener si dispusiera de una cantidad ilimitada de datos. Pr::
ejemplo, 74Vo sería una estimación razonable (o predicción) de la desocupación el próxirno mes; per'(,,
¿',cuán <<buen>> estimador es? Teniendo en cuenta Ia variación en el mercado laboral, sabemos que e:
improbable que el próximo mes haya un nivel de desocupación de eractamente el 74%. Sin embargc
podemos esperar que su valor sea <<cercano>> alI4To, y ¿qué tan cercano? ¿Podemos esperar que se:-
dentro del 10.1% ¿el estimador?, o ¿dentro del tl Vo?, o ¿dentro del +I0%?

A partir de la discusión anterior podemos deducir que existen dos tipos de estimadores: uno que ci:-
un valor numérico qlre resume lo observado en la muestra; y otro que, además, expresa la incertidunr-
bre debida a Ia variabilidad en los (generalmente limitados) datos. A continuación definimos má-.
formalmcnte estos tipos.

Definición (de estirnador puntual) Sea X1, Xz, ..., X,"Ltrra muestra aleatoria seleccionada de
población con distribución de parámetro 9. Se denomina estimador puntual del parámefto 0 a
r.rna
cualquier estadístico que proporciona una estimaciórr del verdadero valor de 0.

Al estimador puntual cle d se le nota d,,.

Por ejemplo, si la media poblacional es p : 6, obtenemos ttna muestra 5r determinamos Lrn promedi,-
z : 5.85. Ésta es una estimación puntual de ¡1.
Tambión, mencionamos que la estim¿ción puede realizarse mediante Lrn r-ango de valolcs entre lo.
cuales se encontrará cl verdadero','alor á con alta pr-obabilidad.

Definición (de estimador por intervalo) Un estimador por intervalo de un parámetro descono-
cido á está dado por clos puntos, qne pretenden abarcar el valor leal del parámetro.

Por ejemplo, si la media poblacional es p : 6, obtenemos Lrna muestra y determinamos el intervalc'


¡ : (5.4;6.2), este intervalo es una estimación de ¡-r,. Posteriormente, indicaremos cómo construir tales
intervalos y evaluaremos su exactitud.
7.3. Estimación puntual 203

7 "3. Estimación puntual


No tocio estirn¿rclor're¿liza rrrra Lrnen¿ estirir¿-ciórr clel par'árnr:t,ro Un buerr estimaclor e-q ¿rquel clue está
cerc¿ clcl parámetlo estirnado; para lo crial clebr: cr.rmplil cieltas propiccladcs) clLle \¡anios a examinarl¿s
a continuación.

7.3.1. Propiedades de los estirnadores puntuales


Lo irnportante de urr estimaclor es qrie é1 pueda ernplealse de manera confiablc; por cjcrnplo. que no
difiera de manela aprcciable del verdadero valol dcl parámetro poblacional.

Definición(de estimador insesgado) IJn estirnarlor I es insesgado para cstimar d

E(6):e
De otra manera ? se llama sesgado.

La Figura 7.1 muestra un estimador insesgado y un estimador sesgado

D--
L -_

:-'
i::

Figura 7.1: Estirnadores insesgado y sesgado.

\otemos que la rlistribución muestral para el estimador sesgado está desplazada hacia la derecha de
4. Este estimador sesgado, probablemente, sobrestima 0.

E1 sesgo de un estimador se mide corno

sesgo(?) :E(A) - a

Ejemplos
Él
1. La media muestral X es r,rn estimador insesgado de ¡;, ya que E (X) : p
,n

>a x?
,i-t
\/ -X2 :
'
El estaclísti c<¡ no es un estimador insesgado de ¡r, ya quc E (t/F) + u
17

.'l- disponemos de dos estimadores insesgados de á, interesa tener nn criterio para elegir uno de ellos

Definición(de estirnador eficielte) SeaL?1 y ?2 dos estimadores insesgados de d; ?2 se


que es más efi.ciente que d1 si Var(d2) < Var(d1). (Ver Ia Figura 7.2.)
204 L)ttpítrtlo 7. Estitnación de Parátnetros

E(0:) = 0

l-igrrla 7.2: Estirn¿rcloles insesga<,los corr clistirrt¿i valiarrza: Var(d2) < Val(91)

lDados dos estimaclores iusesgados de un misnro par'árnetro, es irrcferibl€ escoger_'el nrás eflciente. I

A vcces se prcsenfa el problema de elcgir entre dos est.irnaclorcs corr propiedades contrapr-restas: Llno
de cllrs es iusesgado y el otro es sesgado, per-o con nrcnor valianza. En estos ca,sos cs necesario dcfinir
una mcdida qrle Dos pcrmita lcaiizar tal conrl>aración.

Definición (de error cuadrático medio) El error cu¿rdrático medio debido a la estimación de
d nrediante D cs ECM(D) - P lf e -hV].
L' l

Pol las propiedades de la esperanza se tiele quc

trCM(a) - val(D) + (.".s-oi0;)'


\/
AsÍ, paia los estirn.dores insesgaclos, ECM(?; - Varl?;.

-1r*it*rt-tcr,"rpr'"f erilrt."r....lg",=1.1,r.'t"rrgn ei rnenor ECM.I


Ejemplo. Seir X1 , X2,. .. . X5 Lllta rtmestla alc¡rtoti¿r cle rrna ltoblar.ión par.il la cr-ral E(X¿) : Lr t
: 02, i,: 1, ?, . . . .5. Se tienen los siguieul,cs cstinr¿rclores clc ¡-r:
Var(X¿)

Áv
u]
-
14 1, ir: ,r(Xr +,Y.r + xr;,
^t
0t: )(xr
'2- * 2_Y¡), 0q:-Y:
I
F-Y2-r- Xtr-Xq-X¡).
r("t
a) Segúrn el criterio de la eficiencia, ¿cuál es el rnejor?; b) Cornparar los estimaclores0zy ?3 rnecliantc
el ECM.

Sol,ttc'ión,: Calcnlemos lzrs esperanzas y las variarrzas de <:acl¿r r.uro de los esl.imadores:

E(01) : ¡.r, n(6r¡: ,,, B(?r) : *r,,


)' EqBn¡ : ,.

Var'(?1) Vzrr(X1) :62.


')
VaL(02)
1
Var(X3) - Var1X5)¡ :- o'.1
n(Var(.Yr)- D
1

I )
t¡ar'(0¡) ;(Var (X¡) + 4 Var'(Xs)) : a,
DO-
44
,2
Var(?a) VallX,) : --.
r-
7.3, Estitnaciótt ¡tuttLual
205
¿r) Elcstinta'<[,r03css.sgirclo,rttictrtt¿1s.1,,,r?,.i.t:,/,usr.rrrirscsg¿rtles;
estinl¿ldor
aclenrás,04:Xcsel rrc.loI
<[e ¡1, ¡lol'r¡rte ticnr¡ l¿l nrcrror r'¿rr'i¿rrLz¿t (r,s cl rrriis <rfir:i.rrtc).
l,) C¿rlctrlcrtr<-¡s los scsg<_ls clc los dos cstiru;r, lorcs

sesgo(á2) : E(0!)-g-. ¡r, - ¡t :0.


te.gu(?,r) 31 :ttr.
=: ll(),) - 0 : ,lt-lt
Entonces, el ECM es

ECM(ar) : Var(?2) +(r"r_,u102¡)2 :=-*0


o2 o2
.t 3'

l¡') :
ECM(as) : Var(?3) +(."rgu1D3¡)2 :-Tii:¡o' /7 \2

El mejor estimador ?2 porq,re tienct <ll nrcuor. er.roL cu;rrh-¿iti< :o nredio.


".

7.3.2. Estimación de la media poblacional

que el p|orncclio cs rLlI cstiuraclol iuscsg¿cto


de la media poblacionzü y
ffiffj::ffii1,1;Tl:::T]emos
Supongamos qr-le se obtiene una muestr a X1,
.... x,, de una población que tiene media y varia.za
,x2. É¿

o2. La merlia nluestral se clefine pol X - ¡:--t


I ,\,"
'tL

. La esperanza de X es

E(X) : --E
I
_1 ttt'' : !@r')
lt ?t
f
De manera que T es un estimaclor insesgtrcl r.t <I<: ¡t.

La varianza de X es

Vrrr(,{) : Var -;t.'I var (É') :* : \qro,¡


? !
:-
var(x¿)
Tt.

o-,
77

;.3.3. Estimación de la varianza poblacional

) _lpongamos (lnc sc ol¡tieue rur¿r nlrrestl,a


-\-1. .\-2.. . . . .{,, (l() lur¿r
.1. El estimador. ¡r<;,lrlerci,iu gut: bit:ue rtredia ¡l y variatLzir

5"*l --,,,
206 Capítulo 7. Estinación de Parántetros

os rlll cstirlrrclor'lrrrrrlrral ci<r o2. ¡rerro lirtuc cl irLc:orrvclricrrl.c clc s<:r scsgado. pol Jo (¡rc sc rkrfinc

s,2 - --1-f r-ru _ x)r,


,, - 1/-t--'
t.-1

clr.re e,s ulr estim¿r<.lor irrscsgirclc, par',t rr2

. L¿t esJrer'¿lnza de .92 es

D(xu -x)'
,i.:t
rt-7

: -1=e (>.r-,"') : ,_-l-rlir(x,,) -


\t:1 / li=I

Corno E(Xi) - tL2 E(-') : t,' - *,sc t icne


+ o2 y

', f "
E(s2) : fr' + o") -, ,lI (r'- #)l
" - L¿=l ' )
I.).)r.)1,)
: -i-(npt
11
+ no2 - ,, ¡r2 - o2) : n-l (n - l)o:
-t
: o2.

2oo
L¿ r'arianza de ,S2 es Vzrr'(52) : (este resultaclo no se clernostr-ar'á ya qLle su complejida,J
TL- a
|
sale del alcarrce dc esta obrz-r) .

7.4. Métodos de estimación puntual

Para detelrniual la cstimación cle rLn pirrámetro poblacional existen varios niétodos, los dos más im-
¡roltantcs son el de los rnomentos y el de máxinra verosimilitud.

7.4.I. Método de los rnonr.entos

EI rnétoclo de estiniación de los tnornentos fire dcsarrollado pol K. Pealson en 1880. Es r.rn método
gcller'¿rl t1c estiul¿rciórr de uuo o más pirlzinreltos y se b¿rsa cn l¿r idea de torn¿rr conro estimadol cle la
media a la rnecli¿r rnuestlal. colrro estirn¿tclol de I¿t rtaliarrza ¿r I¿r valianza rnnestlal, y así succsiv¿mente.

Err genelirl, si derrot¿rrnos fr,¡: E(X¿'), denomin¿rdo el A-ósimo nn'ntento teóri,co clr¡ larrariable X. EI
/i;-ésir¡o nt,c¡n¿ett,to nnt,e,stra,L es 1¿r vali¿rble

rrl
i^ : L, rL
A, : 1.2.3.. . .

Entonces, igualamos los correspondientes momentos teórico 1'muestrali pk: p¡. y resolvemos Ia
ecuación resultante para d.
7.4. Métodos de estitnación puntual 207

El itcorrvcuicnte cl<,r cste rrrétoclo es (lrre los estirrr¿r,:loles olrtclri<[os, rnnc:hzrs \¡eces sou sesg¿t(los.

Ejerrrplo. Disp<trrcrrros <le rrtr¿t lnllestr'¿r Xt, X2,.. ., I,,. ixovtrtriculr: clc tttt¿t irrtblacióu t:orr rlistlilrrr<:iótr
Ul-9,ál , rlorr<lc d > 0 cs clcsc:ouociclo. H¿li¿rr'l¿i cstirn¿rciórr clc á.

Soluc'ió'n: Teuemos que/¿:tr(X) -0y I,b:E(X') :Var'(X) +(E(X))2 :+ Pot r,,tr'olaclo.


3
n
D X;,
¿:1
t0') - n,

Si igtralarno s ltz y p2, obtenem.. :


+
Entonces, el estimador de I es d :

7.4.2. Método de m:ixirna verosinilitud


El método de estimación pol máxima velosirnilitud fuc desarrollado por R. A. Fishel en 1920. La
rentaja de este método es que utiliza Ia información sobre la Iey de distiibución de Ia que proviene la
muestra.

Sea X1, Xz, ..., X,, una mnestLa proveniente de una distribr-rción con par'árnetro 0 y ley ,f (r;0). El
procedimiento a seguir es el sigttiente:

1. Determinar Ia fn:nc'ión de uet-osi'milittt,d de la muestra en sLrs valores lespectivos: Esta fuución


del parámetro d está dada por

L(0): f (Xt;0) x,f (X2;0) *...x.f (X,,d) : lI'i,:t f l].¿;e).


2. Encontrar la .función de log-uerosi,mi,litud tomando el logaritmo de la función de r.erosimilitud.

L(0) :log(l,(d)) :i ros.f (x¡;0).


'i:7

3. Hallal el valor cle d que maximiza Ia log-r'erosiniilitud. En este casoT es el valor'?, q.," cs solución
de Ia ecuaciórr
dt
-:n
d0

Observación. Si l¿r distribución de probabiiiclad contierre k lrarámetros, 01. 02, . . ., d¡., la estinración
ie rnáxirna verosiniilitucl de c¿rda uno será I¿r solución dc las ecuaciones lespcctivas:
ar, ¡¡ _at, _ t) at _ /l
00t 002 0o*

Ejemplo. X2, ..., Xr, Llna muestla provenierite de tirra población con distribuciórt
Sea X1 , N(p,o2).
Hallar los estimadoles de p. y de o2.
(X=
SoLuctón: La función cle densidad de la ley es /(X; p,o2) : +"*O-'v (- f)'\
2o2 )
/2tro \
208 Capítulo 7. Estimación de Paráutetros

Dc ttr¿urcr¿r clrtc la fruiciciu ck: r'clr-¡silrrilil rr<l cs

r,(¡r.o2) : (1*, t,,o2))" : ( r-g)


ü h"*
: á)""*n(-Dry)
La función de log-verosimilitud es

1'r
t(p,o'): Iog(.1(¡r, o2)): -|bgQno2) - *f(xo-¡,)'
¿O' i_1
-

Derivando I esta función respecto á 11, e igualando a cero da

p):0,
#:-o* # lrx,-

de doncle p : - x.
Por c¡tlo laclo.
nI 1
-t7 +;VDtx' - p)2 :o
0t, 'L

o(ot) i:l

IL

Drxn-X)'
cuya solución es o2 : l-1
: S*2.

l.D. Ejercicios

1. <El pr-incipio subyacente etr todas las técuicas de inferencia estadística es que nllo Llsa estadís-
ticos rnuestrales para aprendel algo (es decir, para inferil algo) acerca de los partirnetros pobla-
cionales>>. Si usted entendió Io qr.re quiere decir esta afir'mación, escriba uu 1>iillafo en el que
describa una situación en la que se pueda emplear un estadístico muestlal para irrfelir algo sobre
uu palrimetro poblacional. En su ejemplo, identifique claramente Ia rnuestrtr, Ia población, el
estadÍstico y el patárnetro. Sea t¿rn específico como sea posible y no use cjelnplos clad<ls en el
Iibro.

2. Se tom¿r Lrrta muestla cle tamairo 4 de una lroblación de rnedia ¡t" y varianza o2. Sc lrroptnre los
siguientes estimadores de I¿ media:

Xt -l Xz + 3X4 -f
0,: , 02: Xr Xz + 2XJ
4'
03: Xt'l Xz * Xs * Xq Xt*Xz*X¡+X+-J
, 6n:

lndique su orden de prefelettc;ia (clel me.jor al peor) 1, explic$re los motivos dc su <rl¿rsific¿rli,irr.
7.5. Ejercicios

3. Dos muestras alcatorias independientes se extraen de una población con media p, y varíanza o2.
Los tamaños nruestraleS Sor ??,1 y rL2 : ? v tu. meclias muestrales son X1 y X2, respectivamente.
2'
Para estimar a lL se proponen tres estimadores,

\'t : Xt. Tz:X'¿, Tr: Xt ! Xz


2

a) Diga si 1os estimadores son insesgados;


b) Encrrentre su varianza;
c) ¡,Cuál de los tres estimadores es mejor?

4. Si se dispone de una muestra Xt , Xz, X3 de observaciones que siguen una ley exponencial e Q' 1 0) .

Considere los siguientes estimadores

0,
*t .
: .yr, 0., : ', :2"2 a, : IJ:3!2, :x an .

a) ¿Cuáles estimadores son insesgados para d?;


b) trntre los estimadores insesgados de 0, ¿crál estimador escogería usted y por qué?

5. Si se dispone de una muestra Xt , Xz, X3, Xs, Xs de observaciones que siguen una ley de Poisson
P(^). Considere los siguientes estimadores:

Xt -f2Xz * X: * 2Xq -f Xs
a,

0n :xl+xl.
a) ¿Cuáles estimadores son insesgados para )?;
b) trscoja el mejor estimador insesgado de ).
A partil de una población que tiene media p, y varianza o2 se tomalon tles muestras de tamaño
rtr : 7, n2 : 74 y nz : 9. Sean sl, tS V t:3 las varianzas muestrales calculadas a partir de las
muestras. Compruebe que
t tsl+usi?r+osl
30

es un estimador insesgado de o2.

El número de clientes que ingresan a una librería en una hora es una variable aleatoria X que
sigue una distribución de Poisson con media ). Se dispone de una muestra aleatoria Xt, . .., Xn
del número de clientes por hora.

a) Determine un estimador inscsgado dc );


b) Las ventas en Lrna hora se da por V : 4X + X2. Demuestre que E(V) : 5) + tr2;
c) Determine un estimador insesgado de E(lz) empleando toda la muestra Xt,. . . , Xr,.

SiXl y X2 son dos variables aleatorias independientes tales que E(Xr) : E(Xz) : p y
Var(X1) : Var(Xz) : 02 j determine si el estimador.

es un estimaclor insesgado para o2


2LO Capitulo 7. Estirnación de Parárnetros

a estirnaclores insesgados cl<: d y (lue Var(Dr; - o1 y V.Lr(á2) :


0r y 0, ,uu
Su¡ronga q,r,r Se
form¿r rrn rrLlcvo estirladol cle á mecli¿rntc d3 - a?t + (1 - a)02, (0 ( a ( 1). Si ?r v 0'2 Sott
"i
indepenclicntcs,

a) velifique .1.," 03 es insesgado;


b) ¿Cómo seleccionará cl pal'a reclucir Var(?3) al mínimo?

10 Suponga qr-re X1 y X2 son dos medias muestrales caLculadas a ptrrtir de dos nurestras dc tarnaño
n,r y n2, respectivamente, obtenidas dc una población normal de media ¡r, y varianza o2.

a) Se define un estimador de p: Xs : aX t+(1- a)X,¿, (0 < rl ( 1). Pruebe que es inscsgado


b) Halle el valor de cy que minimiza Ia varianza.

11. Considere una sucesión de variables aleatorias Xr, Xz, ..., X", independientes e idénticamente
distribuidas que siguen Lrna ley uniforme en el intervalo l0 -7;0 +tl, donde I es un parámetro
desconocido. Denotamos por X," el promedio de estas variables.

a) Calcule E(X") y Var(X,,);


b) Construya un estimador 7,, del parámetro d qrre sea consistente e insesgaclo y calcule su
error cuadrático medio.

12. Sea X1, .. ., X,, una muestra aleatoria de una población con la siguiente distribución discreta

Pr(x: t):2#, Pr(X - 2): 2e' á e (0,1)

¿r) Halle el estiniadol de d por el método de los momentos;


b) Halle el estimador de d por máxima verosimilitrrd;
c) Dernuestle que los clos estimadolcs encontrados coinciden.

_1. ) Sca X1, .. ., X2s una mnestra aleatoria de tamaño 25 una población binomial de
¡r e (0, 1).
Pr(X: r): Cíp'"(1 - r¡2-z
Determine estimador de máxinia el valor 0 ocurre 5 veces, el valor 1 ocurre
11 veces y valor2ocnrre9veces.

14. Sea X,, una mr-icstra aleatolia de

(,): sir)0, (0e


f caso cr¡ntrario.
{"n-,'*'
a) Calculc E(X) V obtenga un esl,inr¿rdor de g mecli¿rnte el rnétodo cle los
b) Determine si el estirn¿rclor cs insesgzrdo;
c) Obtenga el estimaclor de 0 por el método de nráxima verosimilit,.rd:
d) ¿Cuái cle los dos estirladores es m¿ís eficiente?
e) Calcule cl ECM d,eiz.

15. EI tiempo, eu ltoras, que dura un elemento electlcinjco es Llna vtrriable aleatoria ? que tienc.
distribución exponencial de 1:irrámetro ). Pala estim¿rr ) se pruebzrn 30 elemerrtos y sc enclrentLa
que 18 fallan antes de Ias 600 horas de uso.
7.6. Estintaciót) pof interv¿tlo 217

rL) \lr'<li;tLrl,: r'l Lrri'rtr.rr-[<l <l.c ru¡lxiLrlt vctosiurililrr<1. <rstirnar I;r lrLo1>or'{:irjn <l<r t<t<los ]os clcrrrclrtos
r¡rtt' Irll;ur ;r]l1r'¡ <lc l;ts 0()() lrrlr'¿rs
lr) tltilir r: r'I tt'ru]t¿trlo rlt¡ ii) I)¿u ¿r ol rltrrrt'l lul osl irrr¿r,-lor rlr: ).
10. A lr.' l;trgo rlc rttL ¿tio, l¡r ltcnrl rr¿r rlc tigrillo prrctlc tcrrcr rur¿r o rLos r:r'íits. o lr() t<:rrct rrttrgrtrr;r.
I)
Scg-rirr tllr ('sl ttrIio ttr¿t]iz¿tclr-' pot lllr grrrl)o tl<r zorilogos. lir plopolr:ii¡rr rle lrcnrllr¿ls slll (:ll¿ts os -..)
.)

l¿t cl<: Irts c()II turii t:rírt t-'s l..)


rlicr,tr.rs (lrrc la l)l(rl)olci()rr il<t I¿rs lLcrnlrr'¿s c:orr clos (:rí¿rsoijl-1,,
r)
rlorrclc cl palrinrctro ?) torl¿l un \'¿llol'ctrtlr:0 v 1.

t) IJrillc <,'l urirnr:Lo mc<iio csl)cllirclo clr: cr'Ías pol lrcrnlrrir ¿r lo lalgo clc un ¿rrio:
lr) AI lc¿llizar un cstrldio de 200 henrlrr'¿s chrlantc nu ¿ño, cl cc¡ripo cle científir:os nlcliciorr¿i(lo
cncontr'ó 55 hembras quc rlo h¿ur tenido crít.rs, 106 quc h.¿u) telido urra cría y 39 clue han
tcnido <1os. Eshirrrc el par'árnctro p l)or el rnétodo cle lr¡s lnomentos.

L7. EI control tle r.rna paltidzr de loclillos se rcaliz¿r clasificardo las piezas en ¡leqneñas, rrormales y
glatrdes. Ltrs propolciones teót'ic¿rs sc stlporel) pr : 0.05; pz : 0.90; ps : 0.05. Pero sc sospeclta
clLte h¿'r. aumentado la dispersión y, por tanto, las piczas siguen las ploporciones: pr : 0.05 f ¿;
pz : 0.90 - 3n; ps : 0.05 + 2r¿. Se an¿rlizal 5000 ¡riezas obteniénclose n1 : 7278; n2 : 2928;
?B : 794 cle cacla clase. Obtenga una estimacióu cle n¿txirna verosimilitud cle ¿.

7.6. Estimación por intervalo


?ccorclerrros lo c¡ue se indicó elr Llna sccción ¿ntelior': Ios intervalos estadísticos ex¡rres¿ru la incer-
irlLunlrrr: clcbicla ¿r la variabiliclad cle los datos mrrestr¿rles. Adernás. l)ara c{ue ellos tengarr validez eu
.,r ¿rltlic:aciótt Pr'ácticrr, ticnett cltte crtrnJllil con alguntrs hipótesis l;risicras, como que la rnuestra se clebr:
irteuct de l¡r¿rncta alcatoria, irrdepeudientc y debe est¿r'icléntic¡rmerrt<l clistliltuida, lo qne llo siempl'c
.= logla. increnrentanclo ia rncnciorrada incertiduml¡re.

-isí. por ejcrnplo, con base eu ula rl)uestr'¿r cle hogirres crr los quo se está r'icndo televisión, podemos
Itrstruir urt inten alo qlre coltenga, corl un glado cspecÍfico de coufi¿rbilidad, la rnedia o la desviacióu
,-.tánclal clel tierrrpo clue ia ¡roirlaciór'r consrrltacla vc tclcvisiólr .

-rtltes cle au¿lliz¿1r los r-lifclctrtes c¿rsos) cx¿nrincrnos zrlgrrntrs icletrs irrclirnin¿rlos.

Dcfinición (de intervalo de coufiatrza) Uu interr'¿rlo cle r;onfianz¿l cs nn rango cle valores,
llcttl¿rclo zr par [it de ios clatos rnuestrarles, el clral 1-rrobablcrnento incluye cl verdadero v¿rlor cle nn
-,
¿r ¿irrret,r'o r lescorrocido.

.-, cad¿r intcrr,'alo cle confiattz¿r se Ie ¿rsoci¿t rrna 1l'obtrbiliclacl (l - o) clc clue corrtenga el veld¿rrlero \/alor
-'llratiirnctlo á. A tal ptolrabilidarl se lt: clcli¡rnitn tñ,t¡c,l d,e cort,fia,ttzn, y a los cxtrernos clt¡l irLtelvalcr
tiÍe i.n,.feri,t¡t v Litn'ittt srtltel"ior'<l<t c:<trrfi¿urza: (LIC:.LSC). Esto s<: r'esLunc cll

r\(LIC<0<LSC',):l ri.

-',- irrtt:tr'¿rkr <1ur: c:rttnllle cst¿rs c:ottdicioues se <ierLorlinit'i,tttet'uo,l,o d,e co'n,tiarr¿ cle rrivcl (1-or) xI00(/r¡.
- :¡t t<:ucr tr,'sultitclos fi¿rlrl<s. ci rrivc] clc r;orrli¿rnz¿r <lcbr: ser'¿rlto, lo rn¿is cercir.lro a ruro: gc:trt-.rtrlnrerrtc
., f ornr 0.9. 0.95 o 0.99.
:- ¿rtrcho de tLl iltten'alo clc cr¡ttfi¿rrtz¿r nos da l¿r icie¿r clc cu¿rnta inc;cltidumble existe, alredcdor del
,:¿iurctlo rlesc:onociclo. Uu inbelvalo muy ¿rncho prrede inclic¿rr qtre deber'íarnos recolectar más datos
-"-tes clc dt:cil algo tlefinitivo sol¡re el partinretro.
212 Capítulo 7. Estitnación de Parántetros

7 "7 " Estimación de ia rnedia cuando la varianza es conocida


Supongir (llre se dese¿r estinrar 1¿r nrcclia ¡r c1e rina irolrltic:irirr crlr.a r.¿lli¿rrLzr-i o2 c-.s c,o,rcrc:iclrr y <¡rc pala
tal efecto se dispone cie una rrLueslla clc r¿, rnecliciones: z1, :L2., ...1 :L:,t1.

Ulr intervaio cle conlianza para lir mcclia poblacional vcl clel 100(1 a) %, cstá cla,:,lo por
o
(t- ttt/,2 r1r
.; L (7 1)
vn
Dondc:

a n es el tamaÍio de la rnuestla"

E o Ia, desviación estándar de la pobiación.

zo¡2 eI valor z que colresponde al á.",- I en el extlerno superior de tra distribuciórt norrnai
2
estárrdar; es decir, 7 - ú (z*¡2)
\ttl.,/2,
: : (Figura 7.3).

Figula Intervaio de estim¿r.ción

Aclní se aplicir el Teorerra del Límite Central y es aconsejable tencr un tam¿rño rnucstlal n) 25.

Iln Xrr siguiente tabla se preserrta ios intervalos de confi¿rnza más corrLrrrtnente usaclos:

Nivel de
cor:fiarlza
0.90 0.10 1.6.15 I.6a5 oI ¡/n ;) 1.645 o l1/n,
0.95 0"05 1.96 T. 1.96 o I yE 4), t.s6 oI lñ
0.99 0.01 2.58 '-u 2.58 o I yñ, ;I 2.58 o I yñ.

Observaciones

1 Si cl tam¿rño de l¿ rnucstr¿t cs suficic¡ttcmentc gltrrrcLc (rt / 25) ¡'se <lescorioce 1¿r r'¿rri¿-Lrrza. -.
i)uecle rrtilizar el intervalo 7.1. r'eeuLplazar.Lclo {r }lol'su i:stirn¿rclor',s) siri póiclicla cle cx¿rctitlLcl

2. Prresto (llre Para urr valol de znr2:3 sc tierie un rtir.cl cle r:ou{ianza clcl 99.7%- crr las zrPlicacionc..
prácticas sc supone que nrl intelvalo <le conlianz¿ al 99.7% conticne el r'¿rlol cle lir rnediir, co
I rttltt ttO'"'''O o O '
Estirnación de la rnedia cuando Ia varianza es conocida 2L3

Ejernplos

Deterrninar un intervakt cle confianza cle nivel 95 % pala I¿r rnecli¿r poblacional p" sí n: 36,r : 15
y o2 :3.24.
Sol'uci,ón: Sabemos c¡uie :3.24, o sea o:
o2 1.8,

La corrfiabilidad es 7 - a :0.95; entonces) o : 0.05 y ol2: 0.025. De la tabla de Ia distribucicirr


norm¿l Za/2: zO.OZS: 1.96.
De rnanera que el intervalo es

/ o=) : /
(r- - .. o .o,' 'atz
'o/2
^ o\ ''rw
I.B
ltt-1.96{;1b+t ''' go 1.8\
| ''"" ^=-=
)
\- lE1" ¡n) \'" ¡76t J36)
(L4.4t2;15.588).

En un estudio a trabajadores informales se seleccionó una muestra aleatoria de 50 individuos


en una semana dada. Para cada uno, se determinó el número de horas semanales de trabajo
efectivo y se obtuvo un promedio de 46 horas. Si se asume que la desviación estándar es 3.64
horas, estimar la media del número de horas trabajadas por todos los informales, con un nivel
de confianza del 98 %.

Solución: Se tiene que n : 50, r : 46 y o :3.64.


Además, 1- c:0.98, a:0.02, (lf2:0.01 y zoot:2.33.
EI intervalo resulta:

/- o o\ : ( qA 3.6+ / 3.64\
In- z,¡2J-;T
*," + z*¡2:71 - - 2$:=;46+
- "- 2.33"'";
""
\ r/r,, ",. t/n ) \ ,/ñ JrT )
I

@6-1.2;46+t.2)
(aa.8; a7.2).

Ello significa que, con una probabilidad del gB %, la media del número de horas trabajadas
aquella semana se encuentra entre 44.8 y 47.2.

Según los consumidores, las empresas pasteurizadoras de leche no entregan la cantidad exacta
de producto. Para verificar esta denuncia, se tomó una muestra de 45 fundas, cuyo contenido
teórico era de 1 litro de leche. Se encontró un promedio de g72cm3 y una desviación estándar
de 51cm3. Sobre la base de un intervalo de confianza al 99.7 Vo, ¿se puede clecir que Ia denuncia
de los consumidores tiene fundamento?

Solución: Tenemos que :45, r:972 y s :


z?. 51.

Si 1 - a : 0.997, entonces zo/2 : 3.


Aunque el valor de Ia varianza es desconocida, podemos emplear el intervalo de confianza, yai
que el tarnaño de la nluestra es suficientemente alto. De manera que el intervalo es

(- s - s\ : (n',t _3-a, sT2 +39\


¡r -
zolz
¡¡;r
+ zUz
g) \ ' r/¿s ,/+s 1
(eae.2; ee4.8).

Como el nivel de confiabilidad es del 99.7%, podemos decir qlre con toda seguridad,),a denuncia
de los consumidores es verdadera.
2t4 Capítulo 7. Estimación de Paráutetros

Deterrniuación del tamaño do la muestra

errrtlc str r,¿rlor vttrclaclclc> v 1.r cstiuracitirr: 17 t-Ll. Sus v¿rlorr:s rr¿rr'íarr en1 rc 0 y zr, 12!-.
Pc-,clerrnos planl<:iunos erl ploblcnra r1e enc:outlal erl t¿rrn¿rño cLe 1¿r rtLr<rstla rle rrr¿ur()I ¿r clrLe el error rlr-
r:stirrr¡r:i<in DO sc¿1 rnayor' <¡re E.

El irrterr,¿rlo de confianz¿l para ia rneclia pol)lacion¿rl tierre I¿i forrn¿r @ - n;r + E), cloncle p: lt - ¡L
<rs el cu or err l¿i estim¿ciórr dc 1¿r rneclia pala el uivci cle confi¿rbilirlad dado. Si el irrtcn'alo tierrr: 1¡r
- / o o\ o
Irrnrfa {:r'- 3. /.) -;Ll zo¡2 f , elt1.e¡1¡p5 f'::,r.¡2--7.
\ Vn -
\/n / \/?l
Si de esta igualdad despejamos n, obteucmos

za/2o\2
n,: |/ ------
\E/ |

que es el tamairo de L¿r muestra, necesario para tener un error de estimación -E a nn nivel de confianza
7-c..
Ejernplo. Se desea conocer la distancia media que cor-ren scmanalmente un grlipo de atletas de fonclo.
Por estrrclios anterioles se conoce qr.re la desviación estándal de esas distancias es cle 3 knr. ¿;A cuánto¡
atletas habrá quc muestrear si la estimación debe quedar a rnenos de 0.5 km de la media verdadela.
con rur rrivel cle confi.anza deI g5a/a?

Sohtczón: El irrtervalo de confianza es cle Ia forrna (Z - 0.S;r + 0.5), entonces E : 0.5 y za/2: 1.96

Aplicanclo 1ir fór'nruJ.a,

,r: ('n/'o¡'?- (1'90 x 3) :,ru.r.


\E/ \ 0.5 )
Consecrteutemente, se debe tene un tamaño de muestra mínirno de 139 atletas. Si la mnestra c.
demasiado alta, se deberá aumentar el error admisible E o disminuir el nivel de confianza 1 - cv.

Se sr-rgiele que el Iectol a,juste los parárnetlos, para tenel nna rnnestra aproxirnada cle 50 ¿rtletas, y lo.
llrteIi)rete.

7.8. Ejercicios
1. Deternine los intervalos de corrfi¿nza al 95 To para t¿:I media pciblacional desconocid¿
l
si

n:45, r:5,
tt) o : 6.8; c) l : 13(). 7 - 1d.5. o2 : 4.2:
b) n, : 100, r:37, .,2
D
-
-L<)
q<.
d) n : 169, 7: -22, o2 : 14.

2. Dctermiue la iongitud del iutervalo dc confiarrza pala la rrreclia poblaciorral si:

rr)1- cv:0.96, n:25, o:0.86; c) 1- o:0.955, n:7I, () _ t tr-

b) 1 - a:0.99, n:152, o : L2B; cl) o : 0.03,


'n: I20, o'2 : 49.

3. Obtenga un intervalo de confi.anza de 100(1 - a)Tc para la media poblacional si


7.8. Ejercicios 2t5

a) cv : 0.01. 7L: 26, i:120, o:4; c) rr : 0.1, r¿ : 90, t : 66, s2 :2.5;


b) cr : 0.05, TL: 65, r :222, o2 :57; rl) cr:0,04, n:55, :r= - 37. o2 : lE.

Dctcrminc rtri interv¿tlo en el que se pueda dccir que se encuentla el valor de la rncdia con casi
toda seguridad si

a) n:36. 7:100, o:4.2; 7:86. s2 :22.5'.


c) rr, - 81.
b) n: 44, 7 -- 53, o2 :7I; cI) n:\2I, T:-37, o2:84.I.
5. La cantidad mínirna requerida par¿ que un arrestésico surta efecto en una intcrvención qr.rirúrgica
fue, por término medio, de 50 mg, con Lrna desviación estándar de 10.2 ntg, en una muestra de
60 pacientes. Obtenga un intervalo de confianza para la media, aI g7 Vo, suponiendo que la
muestra se extrajo mediante rnriestreo aleatorio simple sobre una población normal. Interprete
el resultado.

6. En cierto barrio se seleccionó, al azar, una muestra de 100 personas cuyo promedio de ingresos
mensuales es z:460 dólares y una desviación estándar de o : 200 dólares.

a) Si se toma un nivel de conflanza del 97To, Lcuál es el intervalo de confianza para la media
de los ingresos rnensuales de toda la población?;
b) Si se toma un nivel de confianza del g9 %o, el tamaño muestral necesario para
¿cuáI es
estimar la media de ingresos mensuales con un error menor a 30 dólares?

7 Se tomó tlna muestra aleatoria de BB individuos a Ios que se midió el nivel de glucosa en la
sangre, obteniendo una media rnuestral de 110mg/cm3. Se sabe que Ia desviación estándar de
la población es 20 mg/ cm3.

a) Obtenga un intervalo de confianza para el nivel de glucosa en sangre cie Ia población, al


90% de confianza;
b) ¿Qué error máximo se comete con la estimación anterior?

8 La media de edad de los alumnos qne se presentan a las pruebas de acceso a la universidad es
de 18.1 años y la desviación estándar 0.6 años. De los alumnos se elige, aI azar, una muestra de
720"

a) ¿Cuál es lir probabilidad de que la media de edad de la muestra esté comprendida entre
17.95 y 18.25 airos?;
b) ¿Qué tamaño debe tener rrna muestra de dicha población para que su media esté compren-
dida entre 77.9 y 18.3 ahos, con uua conflanza del99.5%'l

9. Una fábrica produce varillas de hierro con Lrüa desr¡iación estándar de 25 cm. La empresa recibe
tin pedido de rrarillas que inclica que la longitud promcdio debe tener Lrna des\/iación máxima de
10 cm de la longitud requerida. ¿Cuántas varillas se tendrán que prodncir para cumplir con la,
especificación, con c¿rsi toda seguridad?

10 Se realizaron 169 mcdiciorres del voltaje de ia recl de alurnbrado púrblico y se registró un promedio
de 108 voltios y desviación estánclar de 5 voitios.

a) ¿Cuáles son los lírnites de confianza, a un nivei del 987o, para el voltaje medio de red dc
alumbrado público?;
b) ¿A qué nivel de confianza puede decirse que la estimación de la media incluye el valor 109
voltios?
2L6 Capítulo 7. Estimación de Parántetros

11. En una región geográfica, la estatura de los individuos varores (en cm) sigue r-rna N (U;7.52).

a) Halle el intervalo de confianza al nivel 92To para estimar ¡.r,, a partir de una mnestra aleatoria
de tamaño 36, cuya estatura promedio es 167.2 crn;
b) Para la rnisma población, determire el tamaño mínimo de la muestra para estimar LL con
un error inferior a !2 cm con un nivel de confianza de| g4%.

r2 A partir de la información suministrada por una muestra aleatoria de 90 locales comerciales de la


citrdad se determinó el intervalo de confianza aI96%: I :(42,58), para el gasto medio mensual
por familia (en dólares) en electricidad. Determine (justificando las respuestas):

a) La estimación puntual que daríamos para el gasto mensual por familia en electricidad en
esa ciudad;
b) ¿Qué número de familias tendríamos que seleccionar aI azar como mínimo para garanti-
zaÍÍros) con una confianza del 96 To, wa estimación de dicho gasto medio con un error
máximo no superior a 3 dólares?

13. La vida activa (en días) de cierto fármaco sigue una distribución A/ (tZOO;402). Se desea enviar
un lote de medicamentos de modo que Ia vida media del lote no sea inferior a 1190 días, con
probabilidad 0.95. Halle el tamaño mínimo del lote.

l4 Se desea conocer el nivel de consumo medio con una determinada tarjeta de crédito con un error
máximo de 15 dólares y un nivel de confranza de 0.97. ¿Cuál debe ser el tamaño mínimo de la
muestra que se debe tomar, si se ha estimado una desviación estándar de 45 dólares?

15 Se sabe que el contenido de fructosa de una variedad de manzana sigue una distribución normal
cuya varianza es conocida teniendo un valor de 0.25. Se desea estimar el valor de la media
poblacional mediante el valor de la media de una muestra, admitiendo un error máximo de 0.18.
con Llna confianza del 95.5 %. ¿Cuál es el tamaño de la muestra?

16 Suponga que se midió la longitud del pie dereciro a 41 estudiantes de su universidad. EI promedio
de todas las mediciones fue de28.4 cm y la desviación estándar fue 5.1 cm.

a) Encuentre un intervalo de confianza al96% para la longitud media del pie derecho de todos
los estudiantes de su universidad;
b) ¿Esperaría usted que alrededor del 96% de todos los estudiantes tengan longitudes de pies
en este intervalo? Explique;
c) Si usted hubiera encontrado un intervalo de confranza al 907o, ¿cómo habrÍa diferido del
intervalo antes obtenido?;
d) Si Ia muestra hubiera constado de 141 estudiantes (los restantes datos se mantienen iguales),
¿cómo habría variado el intervalo de confianza?;
e) Si Ia desviación estándar hubiera sido de 3.7 cm (sin variar los demás datos), ¿cómo se
hubiera visto afectado el intervaio de confi.anza?;
f) Si la media mLrestral hubiera resultado ser de 25.4 cm (sin variar los demás datos), ¿qué
habría sucedido con el intervalo de confianza?

7.9. Estimación de la media cuando la varianza es desconocida

Srrpóngase qLrc se desea estimar la media p para r.rna población cuya varianza o2 es desconocida y que
se dispone de una muestra de n mediciones que siguen una ley normal: rt¡ t2¡ ..., rr..
7.9. Estirnación de Ia tnedia cuando Ia varianza es desconocida 217

Un irrtetvalo cle confianza para la media poblacional ¿r, a un nivel del 100(1 - a)Ta, está. daclo por

(z - t.¡r1n - r)ft, r-t to12(n- t,#)


Donde:

s es la desviación estándar muestlal.

tr,/z(n - 1) es el valor, de Ia distribución ú de Student a (rz - 1) grados de libertad, para e1 cual


ct
el área en el extremo superior es igual a
2

Ejemplos

1. La cotización diaria de una moneda frente al dólar sigue una distribución normal de media y
varianza desconocidas. Se eligieron 9 días aI azar, Ia cotización fue:

65.3 66.2 65.8 66.0 66.1 64.5 65.2 67 .r 64.2.

a) Determine tln intervalo de confianza, al g9 7o, para la cotización media de la citada moneda'
b) ¿Con qué confiabilidad se estima la media en un intervalo cuya longitud es 1.116?

Solu"c'íón: De acuerdo a los datos, n : 9,T : 65.6y s : 0.9.

Aclemás, 1- a:0.99; de modo que *z :0.005 y úooos(B) :3.355.

a) trl intelvalo es

(z - t'¡'1' - 16:T-t to/z(n - I )+)


'r/"/ : ( ur.u -3 ¡bbT: 65 6 + 3 3biry)
\ /9 ,/9/
(64.59;66.61).

1.116
b) Si la longitud del intervalo es 1.116, entonces el en.or.m¿íximo es -E : : 0.558 y como
E : t,"¡2(n - f)*; entonces, sustituyend.o valores:
\/n

0.558 : t,n6)9.
\/9

De donde, t^pg): *#44 : 1.86.

Si examinamos en la tabla de la ley ú a 8 g.1., verros clue /sos(8) :1.36. De maner.a qnc
a
; : (-).05; por lo tanto, ci:0.1 y I - d:0.9. El nivel de confianza es del 90%.
El tiempo qlle un aparato de televisión perrnanece encendido sigue una ley nolmal. Por meclio
de rtn audímetro se registró este dato en 10 hogares dulante Llna senrana y se calculó el promedio
dialio (en rninutos). Los resultados son los siguientes:

248 r77 110 200 135 i85 224 155 180 166.

a) Deterrnilrar un intet'valo de confialza para el tiempo promedio diario que los hogares rlilarr
. televisión, a un nivel del g5 %;
218 Capítulo 7. Estitnación de Paránreúros

(lll(,'ol t,:ILol clu la csl irLlacitil s(r¿r lr)clror'¿L 2[) rrirr

,9ol,ttt:irit¡:

tr) El lrlr>ine<lio v 1¿r rlcsvi¡rc:ión crsl¿ilrcl¿rl son igrrakrs ¿ti - I77.(i v s - 39.92. r'r:spr:irtiviurrorrtci
y si I - ci: : 0.95. /o.o:¡(9) :2.262.
lll irrterr.alo r cclueri<[o (lllcda cc)nro

(trr.a_ ) )()2'-143:)77 t¿ - . "u2t)[) :,,4e.0Li;206.14).


\ /10 ,/10 /

b) Aquí no se puede aplicar dircct¿rmente la fór'mr-rla del cálculo del tamaño muestral, ya cluÉ
Ios v¿rlores de la lev / r¡arían scgrin el nirmcrr¡ cle grados cl<¡ libertad) pcro el plincipio cs e-
nusnlo.
Se¿ -B : to¡t(n - l+ y como éste debe sel nrcrtol que 20, se tiene to/z(n - yJ¡ < ztt
\/lt Vn
Entonces.

t'o¡2@ - 1)

to¡2(n - I)
Folmemos una tal:>l¿r en la que se tenga los dos miernblos de la desigualdad. El tam¿rñ
míriirno cle la rnuestra es el corlespondiente al nenol valor cle ?¿ para el cr.ral se cunple I
desigrraldrrd.
n 0.51n 1,,12(n - L)
10 1.581 2.262
16 2.000 2.\37
17 2.061 2.r20
18 2.r2L 2.1 10

Se observa qne ¡rala el valor de n : 18 se empieza a cr.rrnplir la desigr-raldad; es decrr'.


t¿rnaño rníninro <le la mnestla es 1B liogares.

7.LO. Ejercicios
I. Encuentle ul interv¿rlcr ctc confianza cle nivel (1 - cr) pala la rncclia si

a) n : 12. i: 3.1bj, S'


,)
:0.21, a:0.05; c) r¿:1S, T:2.5, s2 : 31.5, cr : 0.Lr
lr) rr : 26, : s : 58. cr : 0.05
.)
46. ,5'- : 4.8. ¿i1 : 11) rt : 9, -I:32,

Se d<,.sc¿r estucliar cl girsto scrnan¿rl rlc fotocopiirs, crr clólarcs, clc L.ls eslucli¿:urtcs ulrivelsit¿li
Se eligiti una rnnestr'¿i <lc 9 cstur,litlrrtcs, elegidos ¿l ¿rz¿rr'. r'csrLlt,¿r.rrclo los gastos:

2.0'2.5 1.9 0.7 1.I 2.1 :j.0 0.8 0.7.

Se srrpouc que la r,¿tliable rrleatoli¿r oll.jeto clc cstuclio siguc rurir clistlibrrciór). rrorlral <tc nrc.,.
dcsc;onocicL¿r,. Detolrnine el interr'¿k¡ clc confi.¿urza clcl 95 % par',r l¿r rneclia clel grusto semauirl
fotocopiirs pol estuclizrnte.
7.70. Ejercicios 2l-9

Err los crrllcrr¿trrriorLtos rlc lrn rrar[¿Lclor sc rrrirk: cl tierLrlr<t <¡re crrrplr:a elr |ecoller los 10() lrrctr os
lilrl<ts tIirr'¿rrrtc sttis <lí¿Ls r:onst)<]1rfl\.()s. S<r ltarr olrtcrriclo los siglrirtrrt,'s ticrrrl>os pr orrcclio rlc cacl¿r
Luro clc los clí¿rs rlt: l¿t sclr;ilr¿r c)lr (fllo rrrrll<)rrri:

Tiernpo I 51.2 49.8 51.6 50.4 50.8 50.5

¿) Si scr <:rtnsi<icLir clrrt' los 1;icrrrpos sr: clistrilrrLyclr liol'rn¿1lrnrlrrte. etr<rncntre rur interlvalo cle
corrfi¿)nz¿I. <lc ttivcl 91.-) %,. 1>irlrr el ti<:nrpo pt'onrr:clio irlvcltickr:
l,) ¿,Puccle csl)cr'¿r'sc c¡re cl la<l¿rclol leba.jc srr ticrnpo dc 50 s<-.gunclos? ¿,Por qrró?

4 L¿rs tensiotrr:s dc totur'¿r (cu Iip) clc 5 cables cle acelo fuctolt

660 460 540 580 550.

Suponicndo normalidad para las tcnsioncs, estinre la tcnsión mcdia de lotura rnediante lrn in-
telvaio c1e confianza al nivel 99 %.

5. Se desea estimar ei tiernpo medio de e.jccr-rción de un programa. Para ello sc ejecutó dicho
programa B veces utilizando conjuntos clc datos elegidos aleatoriamentc, obteniéndose que Ia
media mlrcstral y la desviación estándar- rnriestr-al son, r'espectivamente, 230 ms y 14 ms. Obtcnga
un intervalo de confianza aI90% para la rncdia. (Suponga normalidad.)

6 En una entidad de crédito para la rnicroempresa se desea conocer la dcuda media de los clientes
que tienen préstarnos. Los siguientes datos corresponden a la dcuda, en dólares, de 16 clientes
que se seleccionaron de manera aleatoria.

306 508 299 537 404 2r0 347 529


514 255 343 476 536 521 659 438
Si el rnonto de cacla pr'óstirrno es nna r.'aliabie aleatoria normal. obtenga los intervalos de confianza
dcl 90 %o, g5% y 997o, para la deuda medi¿r.

I Al fumigal los ¡rrodr-rctos agr'ícolas existe cl riesgo de qr-re se coloque demasiada canticl¿rcl dc
irgroquínricosi cou cl consignieute riesgo pala el consurniclor. De nl lote se extra.jo una muestra
de 10 tomates y se midió la concentración (cn É¿g/ kg de producto) cle fosfatos qr-re ellos contenían,
resultanclo:

24.9 23.5 26.7 28.2 26.4 23.8 25.r 25.3 27.7 26.6.
a) Determine Lrn intelvalo de confiarrz¿r del 95 To pata la concentlación;
b) Si la concentlación máxiur¿r permiticla es cle 24 LLgl kg, ¿puede esperarse que el lote sea
aceptaclo pirla cl corlslrmo hr,rrrrano'/

8. Elr una f¿ilrrica cle corrselr¡as se micie ias irrrPulczas cn rrn lotc ck:stinado a la exPortaci<in. En
ur1¿l nlnestr¿r do 12 fr¿scos de mernielacl¿r sc obtr-rvo los siguientes polcelta.jes de inrpr-uezrrs:

2.:3 1.9 2.7 2.8 2.3 3.6 1.4 1.8 2.\ 3.2 2.0 1 L
a) Asurnier.rclo c1r.Le las medicioncs están normalrneDte clistlil¡uidas. ertcuerrtle el interr,¿rlo de
confj¿urz¿r ¿tI 95%,:
b) Si cl polceuttr.je rrr¿ixinro c1e inrpulczirs peruriticlo pzt,r'zi la r:xpor-taciórr es c.le 1.5%, ¿.sc,rccp-
tar¿i cl lote par a scl (lxpolt¿rclo/

9. El r,ic'rnpo cLe virl¿r cn c;¿rrtivelio de B cspecímenc.s cle urr tipo clc insec;to fue cle 228 hot'zrs, con
uu¿ des\¡i¿l(:ión est¿ir.cl¿l cle 7 holas.
220 Capítulo 7. Estimación de Parántetros

zr) Estimc ol tiernpo cle vicl¿r promedio l)ara un nivel clel g9 %;


lr) Resporr<ltr Ia pregunia srrponiendo <¡re l¿s muestr'¿rs frreron de 72 v 100 especínicncs.

10 IJrra máqr-rirra ploduce artír:ulos cuya dirnensión se corrtrclla rnediante Ia torna de unrr rruestr¿.1
aieatori¿r. Un clía se obtuvieron las sigrrientcs rnediciou<:s:

:3.7 3.4 3.5 3.5 3.4 3.7 3.9 3.7 3.5 3.7 3.8.

a) Halle el intervalo de corrfianza para ia niedia a un nivcl de confiabilidad de nivel 90 %;


b) Si la meclia teórica del proceso es de 3.5 y sin cambiar los otros d¿rtos. ¿Cuál es el tamarlo
mínimo de la muestra, para que a un nivel del g0 %, se pueda asegurar que Ia máquina
produce artículos con dimensión igual a la media teórica?

11 Los siguientes son los tiempos, rnedidos en días laborables, que demoraron 16 trámites de jubi-
lación en cl IESS, elegidos al azar:
DÍas
159 280 362 222 264 224 101 2t2
t70 485 250 379 779 168 260 149
a) Bajo Ia suposición de que los tiempos se distribuyen nolmalmente, detelmine urr intervalo
de confianza ai 9970 para el tiempo medio de nn trámite de jubilación;
b) El director del Instituto ha indicado que ios trámites no se demoran más de 180 días. ¿Es
razonable suponer que e1 tiempo meclio verdadero es mayol que lo indicado por cl director'/

12 La siguiente lista contiene la longitud (rrúrmero de letras en las pala)rras) para rrna muestra clc
26 palabras del libro Rayuela cle Julio Cortáz¿r

102 3 7 2E 4821752
54 '¿12294252347
a) Calcule el promedio y la clesviación cstándar cle l¿r longitud de las palabras;
b) Constmya un interr'¿lo cle confianza al 99 % para Ia longitud rnedia de las palabras el
Rayueltr;
c) Si el tamairo muestral fuera mayor' (v el prorneclio y Ia desviación estándar fueran los
mismos), ¿,cómo cambi¿r,rí¿r el interv¿rlo cle confianza?;
d) Si el prornedio fuera mayor (rnanteniéndose el tam¿rño muestral y la desviación estándar).
¿cómo cambiar'ía el intervalo de confianza?;
e) Un intcrv¿rlo de confianz¿ al g5 % cs (3.655; 6.037). ¿Qué proporción de las 26 palabras de la
muestra están dentro clcl intelvalo? ¿,Su lesPuesta scrá siempre ccrc¿ln¿l aI 95%il Explique.

T.IL Estimación de Ia varianza (distribución normal)


Supótrgase que se rlesea estim¿rr la v¿r'ianza polrla.ciontrl ;' r|rc 1-rzrrir el efecto sr: clispone de urr¿r ri-ruestra
de n ntccliciones c¡rc siguen unzr ley rtolnral: :¿1, lL2) ..., r.n.

Un intctvalo de confianz¿ par:¿r i¿r valianza polrlirciorrirl 02, ,r ,1lr rrivcl del 100(1 - cl) %, cstri dado
por
( (rr - I ).'2 (rr - 1)s2 \
\ñ,(,,-Df"d-D)
7.77. Estimación de Ia varianza (distribución norrnal) 22t

T s2 es la varianza muestlal.

¡ f)¡r(n- 1) es el valor, de la clistribución ¡2 a (n- 1) graclos de libertacl? para el cuai el ár'ea en


,'2 u
el extremo srrperior cs ig'ral f .

\?
\j,o/z^,"(n - 1) es el valor, de la clistribución X2 a (, - 1) grados cle libertacl) para el cual el área
en el cxrlemo inlerior os igual a
].

X,-o,,
z,_o,, Latz

Figtrra 7.4:Localización de los valores de la ley X.2 en el intervalo de confi.anzaparao2

Ejemplos

1. Hallar un intervalo de confianza para la varianza poblacional, al 90 Yo, para una muestra de
tamaño n : 10, si s2 : 196.
si 1-cv:0.9, a:0.1,
]:o.osy 1- |-o.os. Los valoles d" x8o¡ y
Sol,ución: entonces
Xfr n, correspondientes a n - 1.: 9 g.1. son

x?.¡z@'- t) : xB os(9) : 16.919,

\?-,,¡z(n - r) : x|.gs(9) : 3.325'

El intervalo de confianza es
( (n_ t)s2 (n_ r)s2 \ /9x196 9x196\
:
\q,¡" - tl';-ql" 1) ) \ reoro' n% )
: Q0a.26; b30.b3).

2. IJn hombre de negocios está interesado en invertir en un instrumento que piensa le puede dar
altos rendimientos. lrlo obstante, sabe que, en general, a mayor rendimiento se tiene mayor riesgo.
Al considerar instrumentos sirnilares se observaron los siguientes rendimientos porcentuales, que
suponemos siguen una ley normal:

8.7 15.5 21.0 18.9 17.3 22.r 18.6.

El inversionista considera que si se tiene un riesgo mayor-a 10 (desviación estándar'), no 1e


conviene invertir. Construir el intervalo de confianza del 95 t/a y decir si este hombre hará Ia
inversión o no.
Soluci,ón: A partir de los datos, se obtiene que s2 :19.67, n:7 y 7 - a: 0.95.
En la tabla de la ley X2 a 6 g.1. se lee:

x?.¡z@- r) : x3 oz¡(6) :74.45,


x?-.¡z(n - t) : x|3zs$) :1.24.
222 Capítulo 7. Estimación de Parántetros

El iLttclr'¿r.lo <-lc corLfianz¿t cs:

(t,t tliJ. (r-1)s2 \


: /ürlJ.6;6., 19.67\
[C,¡,, - t, ü-,-,, -r )/
(' LrL; ' n4 )
: (8.17;95.18).

ls rlecir. o2 e (8.17; 95.18); por lo que o e (Vo.1Z, vOSlS) : (2.86;9.76).


Corrro el lírnite srr¡rcrior clcl interv¿rlo de confianza es rnenol a 10, posiblernentc si le corrvicne
inr<l tir.

7.t2. Ejercicicrs

1. Halle un intervalo cle confi.anza al 90 To si s'2 :225 para los siguientes tamaños de muestra:

a) n,: 4; b) n, : 8; c) n: 13; cI) n:20.

2. La valianza de la presióri sanguínea es impor-tante porqr-re ella permite conocet la res¡ruesta


ante el esfuerzo. Se llevaron a cabo 12 rnediciones de la presión de urr iudir.icluo, clue
car'<li¿rca
dieron los siguientes result¿rdos:

116 105 t2r 119 110 105 108 t02 107 t02 104 116.
Detclminc los intcrvalos clc confi.abilidad dcl 90 "/c y cleI95%: para o2.

3. En los rn¿rrrualcs de fábric¿r cle un ¿lpar'¿rto pala cleterrninar- el rrivel de alcohol cn la strugle.
sc irrdica que las niediciones tienen una clcsviaciórr estándal de 5 ulidacles. Pala p-t-obar est¿L
afilruación, cn la oficina de normas se reaiizarol mediciones clcl contenido de alcoiroi en Ia szrn¡¡rc I
LL

cle 10 r'oluntarios, con los siguientes result¿rdos:

83 75 92 79 60 85 92 77 76. i

Basándosc crt LlD ilrtervalo cle confi¿rrrza dc 95 %, cleterminc si Ia afirrnación <lel fabricarrte
cs cortecta.

4. Sc ¿rnlizó Llr)¿t nlalca c1e rnirrgarin¿r rlietótic¿r pzrlir dcterminar el nivei cle acic,los gl'¿l,sos ltolisatr-r-
raclos (en lrorcenta.jc). Un¿,r ntuestr'¿t de scis paquel;cs ltrovcyó ltr siguientc informa<rirln.

16.E 17.). t7.4 16.9 1t'.5 17.1.

Asrrutiendo <lrre los rlirtos sigrren uu¿'r lev rrr¡r'nral. h¿rlle:

a) el intcrr'¿rlo clc confianza para cl contenido medio de glasa. con rln nirrcl del g9 %;
b) r:l irrtelr'¿rlo clc <;onfianz¿r par'¿r I¿r vaLi¿rrrza del conteniclo dc g1 ¿lsa, corr Lrn nivr:l del 95%.

5. En nrra mncstra alc¿rtoria cle 15 cuentas bancarias que realizaron depósitos la úrltirna serrralta sc
encontró que la desviación estándar era de 73.6 dólares. Se supone que los depósitos siguen una
ley normal. Estime Ia varianza y la desviación estándar de los depósitos mediante un intervalo
de confianza al g5To.
7.72. Ejercicios 223

Ir Urr httrribre clc nr:gor:ios está, intercs¿rdo crr ilrutil err bcnos cle un pirís lrrtinorrrnclicauo, qrrc
lticttszr lc ¡rueclcu <l¿u altos t'euclinientos. No obstiurte, s¿1be ouo. en gcuerzrl, a nr¿yor rcnclirnicnto
se tietrcr IIl¿1yot lictsgo. AI cotrsiclctal ptrpcles similarr:s sc obsel'r'alorr los sigrricrit,cs lcndirnicntos
( ')/,t):
9.7 21,5 17.0 16.9 13.4 20.7 24.6 15.8.

El invelsionista corrsiclela que si sc tierre un licsgo ruayol a 10 (desrriación estárrdar'), no le


com¡ierre invertir. Coustnryir el intclv¿rlo clc corifianza dei 95 % v cliga si esta persona har'á la
inversión o no, .justificariclo su respuesta.

7. El conteniclo cn nicotin¿i de los cigarlillos de un¿l nralc¿) dcterrnirrada sigue uua distriliuciórr
N (U;"2). Sc tornó urta mucstr:a cle 5 cigarrillos, obteniéndose en cst¿r muestra un cc¡ntenir-lo
medio de 27.2 rng y varianza rmestral 4.2025. Obtenga:

a) el intcrvalo de confi¡rnza para con Lln nivel del 90 %;


É/,)

b) el intervalo de confiarrza para o2, con un nivel del g5%.

8. Se desea ptobar ttn nnevo método de embalaje de rnercaderÍas, para Io cual se registra el tiempo
(en segtindos) quc un misrno tlaba.jador emplea err realizar la tarea:

Procedimiento Procedimiento
tradicional alternativo
31 36
36 32
34 30
27 26
40 ÓO

4,f 4I
AA
28
30 33
,t
Jt)

Si el tiempo empleado es similal en los dos casos, entonces se decidirá emplear aquel método
qtre presente la menol r'¿rliación. Mediante un intervalo de confianza a). 9570, ¡,cu.ál de los dos
métoclos escogcrÍa, el traclicional o el alternativo?

9. Se micie el tiempo (en segundos) de duración de un proceso químico realizado 20 veces en


condiciones sirnilarcs, obteniéndose Ios siguientes resultados:

93 90 97 90 93 91 96 94 91 88
93 95 91 89 92 87 88 90 86 91

Strponiendo que la dnlación sigue una distribución noLmal, hallar los intervalos de confianza aI
90 % para la rnecii¿r y Ia r.arianza.

Etr el enib¿rlajc dc fi'rtta pala ltr cxporttrción es importante conocer Ia variabilidaci del caliJ¡re
cle la fruta (que es el cliárnetro máxirno de Ia fmta). Una fruta con Lrn calibre bajo se cotiza
a l:a.jo prercio y una con calible alto da ploblemas en el embalaje. Las siguientes mediciones
corlesponderr ¿rl calibr-c plorncclio (en cm) de los rnclones contenidos en 113 ca,jas:

20.8 19.3 19.5 22.4 27.3 19.6 20.5


2r.2 2r.4 19.0 19.8 22.2 20.6

a) Determine los intervalos de confianza, al g0To, para la media y la varianza del calibre;
224 Capítulo 7. Estirnación de Parárnetros

b) Si el calibre promedio es nlenor que 20 crn o mayor que 21.5 cm, o si Iavatianza es mayor o
igual a 3, se recomienda el cambio de Ia variedad de melón. ¿Cree tisted que será necesario
hacer tal cambio? ¿Por qué'/

l1 Una ernpresa de venta de cosméticos está interesada en introducir una nueva línea de artículos.
para ello se examina Ia ganancia (en dólares) que le dejarían cada uno de los productos:

23 38 15 7 t2 10 10 11 18 13 9 10

a) Calcule un intervalo de confi.ar'zapara la ganancia media, a un nivel deIgS%;


b) Calcule un intervalo de confiatzapara la varianza de la ganancia, a un nivel del 90%;
c) La empresa introducirá la nueva línea de productos si la ganancia media es mayor que 20.5 o
si la varianza es menor que 40. En base a los intervalos antes encontrados, ¿se introducirán
al mercado los nuevos productos? Explique por qué.

7.L3. Estimación de la proporción (distribución binomial)


Históricamente, este intervalo de confianza es, con seguridad, el primero propuesto para un parámetro:
en los escritos de Laplace (Théorie Analytique de Probabzlztés, 1872, pp. 283) ya se lo encuentra
analizado.

Strponga que se dispone de una muestra rt¡ 12, ..., rrr., de n observaciones que siguen una ley de
Bernoulli, cuyo parámetro p (la proporciórr poblacional) deseamos estimar.

Un intervalo de confianza aproximado para la proporción7t, a un nivel de 100(1 - a)% viene dado
por

Donde:

,n
. p:- 9 , siendo y : D r¿ el núrmero de éxitos en las n pruebas.
TL i.:1

' za/2 el valor z que corresponde a,l área 9 en el extremo superior de la distribución normal
2
estándar.

Determinación del tarnaño de la muestra

Si notamos como.E :ll0- pl al erlol en Ia cstimación de Ia proporción, para el nivel de confiabilidad


dado; entonces, ,E : Za12
0G-0)

EI tamaño de la muestra necesaria para tener Lrn error -8, a un nivel de confianza (1 - a) es

n: Qo/)'0Q - A)
E2

Observación. Si no se conoce de antemano una estirnación de p como sucede cuando se realiza una
investigación por primeravez , se toma fr:0.5, porque este valol permite obtener el tamaño máximo
de rnuestra.
7.73. Estimación de Ia proporción (distribución binomial) 225

Ejemplos

1. Cott cl ob.jcto rle estirrra,t'la Jrroporción clc televiderrtes qr-re han visto el anuncio de un proclucto,
se enl,rcvistó ¿ 400 tek:spectacloles y result,ri que 344 de ellos lo habíarr visto.

a) Ertcuentrc un intcrvalo de c:onfianza clc g7'% para la proporción de todos los espectadores
que harr visto la ltublicidacl r.[el producto;
b) Obtenga el tanraño cle rrnrestra indispensable para que cl intervalo del inciso a) terr.ga una
Iongitud máxima cle 67a corr la misrna confianza.

lJ:344, n:400, 1- a:0.91 y zoo45:1.695.


Solu,ción,: Por el enrtnciado se tiene:

' !lt :t"11:0.86.


La ¡rroporción de espectadores en la mlrestra es t-
400

a) El intervalo de confi.anza es
/
- z"rz
\n
(0.86)(0.14)
(o ;0.86 * : (0.8306; 0.8894).
400
'u
b) Si la longitr rd del intervalo es 6 %, quiere esdecir,E:0.03.
El ta mari.o le la rrmestra
< es

'F2
("n/.¿)'2 fr(t - i) (r.695)2(0.86)(0.r4) .){, ?(
_ roa'rJU'
- (ob¡z- -
Habr'á qr-rer consuJ.t¿r a 385 tcle','id<tutes.

2. En un¿r encuesta piloto, plevitr 1>ara la lcaliz¿rción cle la encnesta clcfinitiva) se encontró que el
630ñ, de lir población (ircle que el plirrcipal problerna clel país cs la colrupción. La ficha técnica
de la cncuesta definitiva indica c¡re ci sonclco tendrá un 97 % de confi¿rlrilidad y el error estimado
clel 4(%. A cuántos cirrcladanos se debelá cousultar si:

a) se usa el valor estinr¿rdo de p mediante Ia encnesta piloto;


b) no se enrplea una estimación previa de p.
Sr¡htción:

a) Segírn los datos: 1 - a: 0.97, E: 0.04 y 0: 0.63. Entonces,

r¿: @¿#f:@*áffi@
(2.i7)2(0 63) (0.37)
: 686.
0.0016
La eucnesta deberá ser realiz¿da a Lrrr mínirno de 686 personas.
b) Como no se tiene iriforrnaci<irt previa soble p, se toma 0: 0.5 y el cálculo del tarnaño queda:

r: @ü#r:e%l&i#e
: 7:35.77 .

Sin urr conocirnieuto previo de Ia proporción, se deberá muestrear al menos a 736 pelsonas.

::i el Cu¿rdto 7.7 se encnentra un resLrilren de los intervalos de confianza de una muestra analizados
-- este capítulo.
226 Capítulo 7. Estimación de Parántetros

Hipótesis Parámetro Intervalo


Distribuciórr o
o conocido media ¡r, t L -¡/2--=
general \/n
Distribución s
o desconocido media ¡r r t Lo ¡2.1n-y¡
'\/rL
normal -
Distribución (n-l).s2 (n 1)t2
vatiat,.-¿ o2 ,2 1
normal -.2
\n /'2:(n-1) \ | o¡2,1n t)

Distribución
proporcron p f! rulz F0-Í)
binomiai

Cuadro 7.1: Intervalos de confianza comunmente empleados

7 "L4" Ejencicios
1. Determine Ios intervalos de confianza para la proporción, de una muestra de tamaño 200 en la
cual se han obtenido 150 éxitos, según los siguientes niveles:

a) a:5To; b) a:12To; c) a:7To; d) a:20To.

2. En esta pregunta no realice cálculos, responda mediante una frase que explique su razonamiento

a) Tres investigadores, Luis, Juan y Edgar, seleccionaron independientemente muestras de una


misma población. Los tamaños de las muestras fueron de 4000 para Luis, 1000 para Juan
y 250 pu.u Édgat. Cada uno construyó un intervalo de confianza para p a paltir cle sus
datos. Los errores E para los tres intervalos son 0.015, 0.031 y 0.062. Asigne cada uno de
los errores a los investigadores;
b) Dos investigadoras, Diana y Oliva, seleccionaron dos muestras de tamaño 1000 a partir de
diferentes poblaciones y constmyeron los intelvalos de confianza al 95 7o para p. El errol
para el intervalo de Diana fue de 0.030 y el error para el de Oliva fue de 0.025. Dado que las
proporciones muestrales fueron def : 0 2 y F:0.4, asigne a cada una de las investigadoras
su proporción;
c) Un investigador seleccionó aleatoriamente 100 sujetos de una población, observó 50 éxitos
y calculó tres intervalos de confianza. Los niveles de confiabilidad son 907a, 95% V 99%.
y los intervalos son A: (0.402; 0.598), B: (0.371; 0.629) y C: (0.418; 0.582). Asigne a cada
intervalo su nivel de confianza;
d) Dos investigadores) un hombre y una mujer, trabajan .juntos para estudiar una muestra
aleatoria de individuos de una población. Ellos encuentran que la proporción muestral e,.
de p: 9.6. Cuando ellos construyen el intervalo de confiarrza basado en Ia proporción, el
varón obtiene (0.532; 0"668), mientras que Ia mujel obtiene (0.552; 0.688). Indique quién
se equivocó.

J. llna muestra realizada a los clientes de un supermercado dio que 120 de 300 clientes usan
regularmente tarjeta de crédito o cheques para sus compras. Encuentre un intervalo de confi.anza
aI 98% para el porcentaje de personas qlre usan efectivo en sus cornpras.

4 Un partido político que concurre a las elecciones mr-rnicipales en la ciudad quiere encargar una
encuesta para estimar su porcentaje de votación mediante un intervalo de la forma P +1.5%.
cuyo nivel de confianza sea 95 %. ¿Qué tamaño muestral debe utilizarse en la encuesta para
alcanzar aproximadamente este objetivo, sabiendo que en una muestra piloto el porcentaje de
votación estimado fue del 75%?
7.74. Ejercicios 227

5. La efectividad cle tut trtcclic¿tnrcrrto oorrlla cl dolor dc cabez¿ se examirra deterrninando si éste
elirnin¿ o tro r:l síntonra. St: arlrrriuistr'<i <r1 mcclic¿rurerito a 225 pacientes voluntarios, de los ctLaies
en 170 c¿rnsó el efr:cto rlr-'sc¿rclo. El rrrcclic¿Lr¡ento se trr:epta l)ara, su u,<jo general si ticnc uu¿r
efectividad en al menos cl 80 % clc los c¿rsori.

a) Basándose en Ltn intervalo de confianza c-lel 98 %, ¡.puede recomendarse el uso dei meclica-
mento'/;
b) Sin variar la propolción estimacla, ¿.qr-ré tan grande deberá ser Llna muestra si se clesea tener
una confianza del 96(% de que el error máximo de estimación es 0.05?

6. Segúrrrrtn estudio sobre los niños que padecen clolor de pecho, realizado por Selbst, Ruddy y
Clark (Cli,nical Ped'iatrics,1990), se encontló que de 137 niños que tenían dolor de pecho, 100
daban radiografías de tórax normales.

a) Obtenga un intervalo de confianza del 957a pata la proporción p de niños con dolor de
pecho que dieron radiografías normales;
b) Halle el mínimo tamaño muestral para que el error cometido en la estimación de p sea
inferior a 0.07, al nivel de g5%.

7. En una población, nadie es indiferente respecto a la iniciativa propuesta por el alcalde de construir
un nuevo parque en el norte de la ciudad. Cada habitante adulto o bien está a favor, o bien en
contra de la iniciativa. Se desea conocer el porcentaj" (P) de las personas que están en contra.
Entre 250 habitantes adultos elegidos al azar,75 afi.rmaron que estaban en contra (v los 175
restantes a favor).

a) Halle el intervalo de confi.anza al 93 7o para P;


b) ¿Cuál es el número mínimo de encuestados necesario para que el error cometido en Ia
estimación sea) como mucho, de 0.05?

S. En una línea de control de calidad en un día se examinan 250 piezas de un lote, de las cuales 25
tienen algún tipo de defecto.

a) Construya un intervalo de confi.anza aI g37o para la proporción de piezas buenas y de piezas


defectuosas;
b) I-ln lote se acepta si Ia proporción de piezas defectuosas es menor o igual al 5a/a. ¿Será
aceptado el lote en cuestión?;
c) ¿Qué tamaño deberá tener una rnuestra si se desea tener una confianza del g7% de que Ia
estimación estará dentro del1% del porcentaje real?

9. Para la introducción al mercado de una nue\¡a variedad de semilla de naíz la empresa productora
estima que deben germinar al menos eI 73u/o de1 total de semillas sembradas. En una prueba de
laboratorio se sembraron 745 semillas, de 1as cuales germinaron 518. Con base en un intervalo
de confianza de nivel igual a1 97T0, [,poclrá la empresa introducir al melcado la nueva variedad?

-0. Err un sondeo sobre la preferencia deportiva de la población masculina ecuatoriana, realizada a
1000 personas, se determinó que eI 72% de 1os encuestados gustaba ver regularmente partidos
de fútbol por televisión. Con una seguridad del g5 a/o, ¿se puede decir que los resultados son
iguales, con Lrn margen de más o menos 3 puntos porcentuales, a los que se habrían obtenido si
se hubiera consultado la opinión de la población masculina completa?

:1. Una noticia de prensa dice que, de 1200 persorras encnestadas sobre la conveniencia de hacer
reformas a la ley de tránsito, 756 se muestr¿u a favor y 444en contra, y concluye afirmando que
eI 63% de la población se mltestra a favor, con un rnargen de error de t3 %. ¿Cuál es el nivel
de confianza de esta afirrnación?
228 Capítulo 7. Estirnación de Parámetros

72. En ttna errtlevista realiz¿rc.la a 130 rnujercs casadas, 113 de ellas indicaron qlle habÍan sido r.íctirnas
clc zrlgrin tilto de agresi<in ltor parte de su cónyuge.

a) Asumieudo qtle estas nnrjeles form¿:ur una nnrestra aleatoria, calcule r,rn intelvalo r-le con-
fi.anza de nivel 95% para la proporción de las mujeres casadas que han sicio agrediclas;
r) Si se hubiera consultado a 520 mujercs, ¿.cree usted qrre el intervalo hubiera sido rn¿is ancho,
más estrecho o de igual ancho? Explique y no realice cálculos;
c) ¿El intervalo hubiera sido más ancho) más estrecho o de igual ancho si 73 de las 130 mujeres
hubieran respondido afir'mativamente? Explique;
d) Realice una interprctación del intervaio.

13. Se desea estimar la proporción de estudiantes universitarios a favor de sustituir el actual himno
nacional por otra canción.

a) Para estimar esta proporción con una precisión de 0.10 a un nivel de confianza del 92Vo,
¿a cuántos estudiantes se necesitará preguntar? (Para determinar el tamaño de mnestra
necesario, fije su propia proporciórr rnuestral, identificándola claramente.)
Para responder las siguientes preguntas, usted no necesita realizar cálculos. Explique sus
respuestas.
b) Si se deseara estimar la proporción con nna precisión del 0.05, a un nivel del 92 To, ¿es
necesario muestrear a más o menos estudiantes que en a)?;
c) Si se cleseala estirnar Ia proporción con una precisión del 0.02, a un nivel del 95 To, ¿,es
necesalio muestrcar ¿r m¿is o trtenos cstudiantes que en a)?

7.15. Intervalos de coyrfranza para dos muestras


Los intervalos de confianza qr.re se presentan a continuación involucran a clos rnuestlas y, en gcneral,
son utilizados para compalar errtre Ios valores que tierien los parámetros de dos poblaciones o para
determinar si las muestras provienen de la misma población.

7.Lí.L, Interl'alo de confiarrzapara la diferencia entre dos medias

nr y rL2¡ seleccionadas cle dos


Suporrga clue disponemos cle dos mnestras independientes dc tamaños
poblaciones con medias h y ttz. Nnestro interés es encontrar un intervalo de confianza para la
diferencia de las medias y para ello considerarenlos 3 casos:

Caso 1. Las varianzas poblacionales son conocidas

Supondlernos que las varianzas de las poblaciorres 1 y 2 son conocidas: V


"? "3.
Unintelvalodeconfianzapat'¿. ladiferenciadernediaspoblacionalcs¡11 -1,12,aunniveldel 100(1-
rv)%, cstá dado por

(,t, - r¿) - .,,/2ffi,r,(;, - zz) r za/2rF¿-)


7.75. Intervalos de confianza para dos rnuestras 229

Caso 2. Las varianzas poblacionales son iguales; o'l: oZ: o2

Un intervalo de conhan za par a la diferencia de medias poblacionales ¡r, - F2, d un nivel del 100(1-
a)To, está dado por

I
| (zr - rz) - t../z(nt -t nz - 2) @t - rz) + /z(nt t nz - r
lE=-;
t

\
*
rE=-)
^r_(ra-t)"?+(n2-r)sl
U+n2-2

Caso 3. Las varianzas poblacionales son diferentes: ol I ol


Un intervalo de confianza para la diferencia de medias poblacionales p1 - p2, a un nivel del 100(1 -
a)To, está dado por

(,t' - ¡,) -t.tz(s)rm *; @t -rz) +t,/z(s)r{-.t)

Donde g : + slln2)2
('?1",
("?1",)' , G3/"r)'
u-L - nr-r

Ejemplos

1. Se pretende comparar la duración de dos marcas de pilas alcalinas. Para ello se escogieron dos
muestras de cinco piias cada una. Los datos se presentan a continuación.
Marca A 100 96 92 96 92
Marca B 76 80 75 84 82

Si suponemos que las varianzas poblacionales son o2A: II y q2B :15, determine, basándose en
un intervalo de confianza de nivel g5 %, si las dos marcas de pilas tienen igual duración.
Soluctón: Se tiene que
nl :5, r1 :95.2; o?: l!,
TL2: 5, rZ :79.4; 03: 15.
Entonces,

(,r,-,
- - zat2U
la* o" \r,'- - rz) - ,"/r\,1@:¿
\,,,
"'2) ; ó, ;' _ ):
: (11.33; 20.27).

Si las dos medias fueran estadÍsticamente iguales, su diferencia sería igual a cero. Como cero no
se encuentra en el intervalo de confianza, podemos afirmal que las dos marcas no tienen igual
durabilidad.
230 Capítulo 7. Estimación de Parántetros

2. Lhr irgr:nir:r'o desea cletelrnin¿rl si los automrj.¡lles a,nrcric¿rrros ), los japorreses tienen igual consrrmcr
rl<¡cor¡irrstible. Par'¿relloescogíoliir¿trnrrest,r¿rcle10c¿r.r'rosarnclicarros), 12,jaPc¡rresesrlesinril¿rlr.:s
c¿rr'¿,rcterísticas y rnidió cl cc¡risurrro por 100 hrn cle recolrickr, con los siguicirtcs r-csult¿rclos:

4rnenicanos 60 58 74 7{j 85 a)o


JL 7.6 ()/ 100 9s I

Japoneses 48 51 5iJ {i2 i"r"7


t-/
6.7 7.2 8 r') 5ú (;.'.j | 5.!l

Estinrar, mediante un intelvalo de confianza a,l 95'%,).a cliferencia eirtle las clos rnedias de con-
sllrllo. ¿,Se puede decir el conslrilro de cornbustible no depende del oligen clel ¿ruto?
SoLucióu. Supondremos que las poblaciores son norrnales con varianzas desconocidas, supuestas
iguales. Además, se tienen los siguientes resultados:

nt: 10, rI : 7.86; s?:2'2t6


n2: 12, rZ :6.C4; s3:0.879

El estimador de la vananza es

2
5:
(n1 -1)sl +(n2-I)s2; (10 - r)2.216 + (t2 - 1)0.87e : 1.481.
n1 +n2-2 10+12-2

Entonces, el intervalo es

rz) tn/z(nt + nz -
(,', - - 2)

1.4811.481
(,t.uu - 6.04) - ts s25(20) *
,o i, (7.86 - 6.04) + úo.ozs(20)

Como el valor cero no se encuentra en el intervalo de la diferencia de medias, deducimos que Ia


media de los consumos no es igual. Entonces, el consumo de combustible si depende del país de
origen del carro.

7.L5.2. Interr¡alo de confianza para larazón entr€ dos varianzas

Suponga que disponemos de dos muestras independientes de tamaños TLt y n2. seleccionadas de dos
poblaciones que siguen leyes normales con varianzas o? y o3, respectivarnente. Deseamos construir
un intervalo de confia\zapata la razén de las dos varianzas.

o?
Un intervalo de confianza para la razón de las varianzas poblacionales i,oi aun nivel del 100(1-c)%,
está dado por

(#r',-",^u - r,nz - r); #'-,r(n, - L,n2 _,))


7.75. Intervalos de confi.anza para dos muestras 231r

4,,, 4-otz

Figura 7.5:Localización de los valores de la ley F en el intervalo de confianza para larazón entre dos
rrarianzas.

Ejemplo. LIn inversionista quiere comparar, en términos de las varianzas, los rendimientos de las
acciones de dos compañías del sector servicios. Calculó los rendimientos mensuales del último semestre
de las dos compañías, como se muestra a continuación.

Compañía A 1.8 0.3 2.4 0.1 1.5 1.9


D7
Compañía B 2.6 3.8 ó-l 4.7 3.2 d. tJ

Con el empleo de un intervalo de confi.anza de nivel 95To para las varianzas, determine si los rendimien-
tos tienen igual variabilidad.

Solución: Tenemos que


U:6, s? : 0'859,
172: $, sZ:0.278.

EI intervalo queda:
/^2 \
(?rFr-*p(n¡ "?
- r,nz - r); 3F-tr@, - t,n2- 1) ) :
\si si /
(3#"-' ozs(5, 5);
.iz8q!ryFo
oru(5, 5)) : (0'433; 22'082)'

Si las varianzas son iguales, su cociente es igual a uno. En este caso, el valor 1 se encuentra dentro
iel intervalo; por tanto, las varianzas de los rendimientos de las dos compañías son iguales.

7.15.3. Intervalo de confianza para la diferencia entre dos proporciones

Sean f1 y f2 Ias proporciones de éxitos de dos muestras aleatorias independientes, de tamaños rLr y n2,
:rovenientes de dos poblaciones de Bernoulli, Ber(p1) y Ber(p2), respectivamente. Ahora, deseamos
-timar, mediante un intervalo, la diferencia de esas proporciones poblacionales.
:--n intervalo de confi,anza aproximadc-r para la diferencia de proporciones pr a \rr
l-r:
- p21
-00(1 - a)To viene dado por

l,,rnde 0r : 1 -ñ y lz : I _ fz.
Ejemplo. Un fabricante cree que su marca de yogurt es más preferida en la Sierra que en la Costa.
?ara probar su sospecha escogío dos muestras aleatorias de 500 consumidores en la Costa y 300 en
232 Capítulo 7. Estirnación de Parárnetros

la Sierra. Las muestras revelaron que 210 consurnidores en la Sierra y 320 en la Costa consumen su
producto. De acuerdo a un intervalo de confianza al 98T0, ¿se puede inferir que el fabricante tiene
razón?

Solución: Se tiene que


320
Costa: n1 :500, pt : :0.64,
500
2t0
Sierra: nz:300, Fz: : 0.7.
300

Por tanto, el intervalo es

_ or)-2rJ 0.64 x 0.36 0.7 x 0.3


(,o.un

ComoceroestádentrodeIintervalo'noSepuedeafirmarquelasospechadelfabricanteseacierta.<

En el Cuadrc 7.2 se encuentra un resumen de los intervalos de confianza de dos muestras analizados
en este capítulo.

Parámetro Intervalo
Distribución oi o3
general
o7 y o2 conocidas (rt - rz) t 2,,
/2 r\ n2

Distribución or y o2 desconocidas sZ
normal supuestas iguales
(t t - iz) tt o/2,(ntrn2-2)l * 'lL2

I'O
Distribución ot y 02 desconocidas (¡t-r)It,,/2,nrl! .9Í
normal distintas Ft- Pz '" nt r2
V t¿2

Distribución ^\, lPtQt PzQz


- P2l L'a/2\l-
'
binomial V TL¡ n2

Cuadro 7.2: Intervalos de confi.anza sobre dos muestras comunmente empleados

A lo largo de este capítulo la idea de que los intervalos estaclísticos reflejan la in-
se ha enfatizado
cer-tidumbre debida a la variabilidad de los datos, pero en la mayoría de casos prácticos, a más de
que las hipótesis básicas sobre la muestra (como aleatoriedad, independcncia y normalidad) son vio-
1adas, influyen otros factoles cuya magrritud es incuantifi.cable, por ejemplo, el comportamiento de las
personas y los equipos, el medio ambiente, etc.

Entonces, en la correcta interpretación de los intervalos estadísticos habrá qlle tomar en cuenta que
ellos no leflejan la incertidumbre total presente en las rnediciones y solo proveer wa cota'inferior de
la verdadera incertidumbre; por lo tanto, son una cruda aproximación a Ia realidad.
t
7.76. Ejercicios 233

7.16. Ejercicios
1. El gercrrte de una empresa quc tiene dos locales de ferretería cree c¡re las venlas en el local del
norte son mayores que en el Iocal del sur. Para verificarlo, tomó una muestra de 200 factur¿rs
en el local del sur v 250 facturas del local del norte, resultando un promedio de 13 y 15 ciólares
y desviaciones estándar de 3 y 4 dólares, r'espectivamente. Mediante un intervalo de confianza
de rrivel 95To, ¿,se puede concluir que e1 gerente tiene razón?

2 Una organización de defensa de los derechos civiles afirma que en la industria de Ia construcción
el salario r4edio semanal de los hombres supera en 13 dólares al de las mu.jeres. Una muestra
aleatoria de 20 hombres y otra de 25 mujeres reveló promedios de 110 y 100 dólares, respecti-
vamente. Si Ias dos poblaciones de salarios son normales con varianzas de 100 y 64, mediante
un intervalo de confiarrza para la diferencia de medias, de nivel 98 %, ¿se puede decir que la
afi.rmación es cierta?

Se cree que el precio de arriendo de las casas es mayor en Cuenca que en Ambato. Estudios
anteriores revelan que las dos poblaciones de arriendos tienen distribución normal con varianza
homogénea. Dos muestras aleatorias de tamaño 16 revelaron lo siguiente: z1 : 138, sr : 6 y
Tz:135, s2:4. Con el empleo de un intervalo de confianza al 957o, ¿se puede concluir que Ia
suposición es correcta?

4 Un inversionista hizo un estudio para determinar en qué ciudad, Manta o Loja, podría abrir un
supermercado. En una muestr a de 2I hogares de la ciudad de Manta halló un ingreso promedio
de 500 dólares y una desviacióri estándar de 120 dólares. En otra muestra de 16 hogares de Ia
ciudad de Loja halló un ingreso promedio de 480 dólares y desviación estándar de 60 dólares.
Suponiendo poblaciones normales con varianzas diferentes y con el empleo de un intervalo clc
nivel 957o, ¿en cuál de Ias ciudades le conviene abrir el supermercado?

El dueño de dos restaurantes que verrde pollo a la brasa quiere dcterminar si sus dos locales
venden Ia misma cantidad de pollos diarios. Dos muestras de las ventas de 12 días dieron los
siguientes números de pollos vendidos:

Local A 12 17 I4 1B I 10 20 l5 72 1ti B 74
Local B 72 L4 13 11 12 15 21 l4 13 14 22 15

Además, Ias muestras revelaron que las dos poblaciones de muestras son normales con valianzas
diferentes.¿Se puede inferir que en los dos locales las ventas diarias de pollos son Ias misrnas?

Una manera de comparar el riesgo de dos inversiones es a través de sus varianzas. Para una
itrversión en Ia industria electrónica se tomó una muestra de 10 datos y resultó una desvi¿ción
estándar de 52. Para una inversión en la industria siderúrgica se tomó una muestra de 15 datos
y resultó ttna desviación estándar de 31. Si se asume que cada una de las invcrsiones sigucn
leyes normales, ¿cuál es su conclusión si utiliza un intervalo de confianza al 90% para la razón
de varianzas?

IJn investigador sospecha que los hombres y las mujeres difieren significativamente en ticmpcr
diario de utilización del teléfono. Entrevista a 25 sujetos de cada sexo obteniendo ios siguientes
resrrlt ados:
Mujeres: :38; or:6,
Ffornbres: : 31; 02:5.
Utilice un nivel de confianza del g5 7o para:

a) construir un intervalo para larazón entre las varianzas. ¿Se puede decir que son
234 Capítulo 7. Dstimación de Parámtetros

lr) cortstruil utt irttetvalcl pi-Lla la difi:r'cncia cle nrccli¿rs ¿rclccrr¿rclo.

El ctrtrclaclol clc rtu cqrLipo cle fiitbol quietc (jor]'lp¿rar l¡i r:fcctir,'icl¿rri cle srrs.jrrgaciolcs al c<tlrlar'
trn tiro pena1. En los cntrenarnicntos, Ios jr-rgaclores n:rcrionalcs, clc 120 tilos intcnta<ftrs, accrta,r'on
91, tnientras que krs extlaqjelos rle 90 tiros lea,lizados, accltaiolt 78. N,Icdiant.: rrn iutelvakr de
corrfiauza de nivel 90 %, ¿se puede infcrir que rro hay diferencia cntle los jrrga<lores ritrciorrirlcs 1'
extran jeros a,l col¡rar un tiro penal'?

I En lur estudio epidemiológico, se tonró una rnuestra alcatoria de 300 hombres y 27 de ellos
padecicron o padecen Llna determinada varied¿rd de gripe. Tambión, se tornó una rnlrestr:a de
400 rnujeres y a 32 les oculría lo misrno. A la vista dc cstos datos, ¿se pucde consideral que estc
tipo de gripe afecta a hornbres y mujeles por igual? (Usc 1 - cl : 0.96)
10. Se quiere comprobal la efectividad de una vacuna contra una enfermedad y para ello, tras
contagiar a 200 animales, se Ia suministra a 100 y se compara con otros 100, a los cuales no se les
suministró. De entre los vacunados, mueren 8 a causa de la enfermedad y de los no vacurrados
20. A un nivel de confiabilidad del 93%o, ¿podemos decir que la vacuna es eficaz pala reducir la
tasa de mortalidad?

I
4
a
C*pstulo I
Pruebas de Hipótesis

Dudar sobre todo o creer en todo: estas son dos


estrategias'iqual,m,ente conue'ni,entes. Con ambas nos
eui,tamos la neces'idad de refl.erionar
flenry Poncairé

En el capítulo anterior se vio que se puede realizar inferencias acerca de un parámetro poblacional
estimando su valor, ya sea de manera puntual o como un intervalo de confianza. Pero en muchas
ocasiones no interesa conocer o tener una idea dcl valor del parámetro, sino comprobar (o rechazar)
una afirrnación sobre el valor que tiene el parámetro, sin ímportar la longitud o la localización del
intervalo.

Suporrgamos que un investigador desea probar que actualmente, el ingreso mensual de los ecuatorianos
es mayor que el ingreso que tenían 5 años atrás. Par-a verificarlo, recolecta los datos mediante una
muestra tomada al azar. El investigador podría desear cornprobar la hipótesis de que el aumento del
ingreso es rnayor que un cierto valor prefijado. Un intervalo de confianza de la variación media del
ingreso proporcionará menor información que una prueba de hipótesis sobre la variación del ingreso.

Las hipótesis son, en general, afirmaciones sobre los parámetros poblacionales, como 1a media y la
tarianza; así, se pudiera desear probar que el ingreso medio actual no es diferente de aquel que los
ecuatorianos tenían hace 5 años. Una hipótesis también puede ser una afirmación sobre la distribución
de una característica de interés; por ejemplo, que el ingreso mensual sigue una distribución normal.

La teoría de las pruebas de hipótesis sobre parámetros poblaciont.:.les fue desarrollada en los primeros
años del siglo XX y sistematizada por R. A. Fisher, E. S. Pearson y J. Ncyman. Éstos últimos la
formalizaron e introdujeron el vocabulario actua,lmentc en uso) en una publicación realizada en 1933.
-\quí se expondrán los casos de mayor uso e importancia.

8.1. Elementos de una prueba de hipótesis

Para probar una hipótesis estadística es necesario tcner en cuenta cicrtos elementos que conducirán
a aceptar o rechazar la hipótesis planteada, de manera correcta. Ello 1o ilustraremos con el e.jemplo
anterior.

El investigador cree qLle) en condiciones normales, el aumento dcl ingreso medio d debe ser menor que
un nivel prefijado do :60 dólares. y decide probar esta afirmación; pero en el curso de Ja investigación

235
236 Capítulo 8. Pruebas de Hipótesis

se podríaconclllir que Ia variación del ingreso es mayor que 60 dólares. Para tornal cnalquier dr¡cisión
es necesario que el investigador compare cori Lrn valor que le informe de la validez o irn'alidez de su
liipótesis.

En la terminología de las pruebas de hipótesis, aquelLa que especifica un valor particuJ.ar del par'ámetlo
que se estudia se llama hzpóteszs nula, que se representa por 11g. trsta hipótesis, usualmente, corres-
ponde al procedimiento de operación normal de un sistema de especificaciones corrocidas. En el
ejemplo, d < 60 es la hipótesis nula, pues representa Io que debería suceder cuando ha habido un
incremento del ingreso, en condiciones normales; o sea) Hg: 0 < 60.

La hipótesis que especifica aquellos valores de1 parámetro que representan un cambio importante del
procedimiento normal o de las especificaciones conocidas, se llama hipótesis alternatiua y se repre-
senta por 111 . En el ejemplo los valores mayores que 60 indicarían un comportamiento anómalo o
extraordinario; así, la hipótesis aiternativa es -111: e > 60.

La cantidad, calculada a partir de la muestra, que permite decidir si la hipótesis nula será o no
será rechazada se denomina estadíst'ico de p'rueba. La distribución de probabilidad del mencionado
estadístico debe ser conocida para poder realizar Ia prueba.

EI conjunto de valores del estadÍstico de prueba que conduce al rechazo de la hipótesis nula, en favor de
la hipótesis alternativa, se llama regi,ón de recl¿azo o región crítica de la prueba. La dec,istón consiste
en rechazar la hipótesis nula en favor de la alternativa si el valor del estadístico de prueba cae en la
región de rechazo; caso contrario no se descarta fIs.

En las pruebas de hipótesis, el resultado se da en términos de la hipótesis nula. Nosotros o <<rechazamos


Ilo en favor de ÉIr>> o <(no rechazamos f/s>>; nuncaconcluimos <<rechazamos É[t>> o <<aceptamos fI1 >>.
Luego, y en base del análisis del valor del estadístico de prueba, se podría sacar otras conclusiones
sobre fI1, pero ésto dependerá de cada caso particular.

A continuación se resumen los elementos de una prueba de hipótesis:

1. Hipótesis nula, .FI6.

Hipótesis alternativa, I11

EstadÍstico de prueba.

4 Región de rechazo.

5. Decisión.

Errores de tipo I y de tipo II

Al tomar una decisión sc puede cometel dos tipos de errores: rechazar Ia hipótesis nula cuanclo es
verdadela, lo que se llama error de tipo I; o bien, no rechazar la hipótesis nula cuando en realidad es
falsa, lo que se denomina error de tipo II. Ello se resllme en el siguiente cuadro:

Hipótesis Nula
Decisión Verdadera Falsa
Rechazar É1¡ I
Error tipo Decisióu col-recta
No rechazar 116 Decisión correcta Error tipo II

Entonces, tenemos Ias siguiente defini:iones:


8.7- Elernentos de una prueba de hipótesis 237

1. La probabilidad de cometer Lln error de tipo I se denota poÍ a y se fija al escoger la región de
rech¿lzo. Este valor se denomina niueL de s'iqnzficación de la prueba estaclística:

Pr(error de tipo I) : nivel de significación : a.

2. El niuel de signifi.ca,ci,ón obseruado o p-valor', es el mínimo valor del nivel cle significación para
el cual los datos observados irrdican que Ia hipótesis nula debe ser rechazada.
Este valor se utiliza cuando se trabaja con paquctes computacionales para detelrninar si se
rechaza Hs. La regla es la siguiente:
Si el valor de p ( a, entonces se rechaza 116. Caso contrario, no se rechaza (se acepta).

3. La probabilidad de cometer un error de tipo II se denota por B y depende de la hipótesis


alternativa que se escoja:
Pr(error de tipo II) : B.

1. La potenc'io de una prueba es la probabilidad de tomar la decisión acertada, de rechazar Il¡


cuando ésta es falsa, y es igual a 7 - P.

Figura 8.1: Probabilidad de cada tipo de error al realizar una prueba.

probabilidades a y B tienen las siguientes propiedades:

Para un tamaño de muestra frjo, al aumentar la región de rechazo (y por lo tanto a), B disminuye.

Al atrmentar el tamaño muestral n, las probabilidades a y 13 dccrecen a la vez.

--- error de tipo I es considerado más serio, por lo tanto


v más importante dc evitar, que un error
-. lipo II. Consecuentcmente, el proccdimiento de probar una hipótesis se ajusta de manera que se
: -antice una <<baja>> probabilidad de rechazar erroneamente la hipótesis nula.

l:.:ttentemente, se determina el nivel cv de manera arbitlaria, pero si no se lo especifica, habrá que


- :ular el p-valor del cotrtraste. Esto permite rechazar 116 para valores pequeños de a. Nosotros
- r:raremos, de preferencia, valores para o de 0.1, 0.05 o 0.01.

¡s de pruebas de hipótesis

pruebas de hipótesis se clasifican en unilatelales y bilaterales.


238 Capítulo 8. Pruebas de Hipótesis

Definición (de prueba estadística unilateral) Una prueba estadística urrilateral es aquella en
Ia que la región de rechazo se localiza solamerrte en un extrerno cle la distribución de probabilidad
del estadístico de prueba.

Para detectar si 0 I 0o la región de rechazo se sitúra err el extrerno superior de la distribución del
estimador d (Figura 8_.2). Para detectar si d ) d6 la región de rechazo se sitúa en el extremo inferior
de la distribución de d.

eo 0o+C
Acentar Hn I Rechazar Hn

Figura 8.2: Distribución de ? cuando se cumple Hs: 0 { 0s.

Definición (de prueba estadística bilateral) Una prueba estadística bilateral es aquella que
sitúa la región de rechazo en ambos extremos de la distribución de probabilidad del estadístico de
prueba.

Las pruebas bilaterales se utilizan para detectar 0 < d6 o bien 0 > 0ol es decir, 0l0o (Figura 8.3).

Horla Aceptar Ho Ho,


aRechazar ,laRechazar

Figura 8.3: Distribución de ? cuando se cumple Hs:0 : gs.

8.2. Pruebas de hipótesis sobre la media, cuando la varianzaes cono-


cida

Uno de los casos más comunes en la realización de pruebas de hipótesis es hacerla sobre el valor de
la media poblacional, cuando se dispone de una muestra de dicha población. El parámetro 0 que se
desea probar es LL y el estimador d es la media muestral 7.

A continuación se exponen -de manera sucinta-, las pruebas estadísticas, bilateral y unilaterales,
cuando deseamos probar que el valor de la media poblacional ¡l es igual a un valor prefijado ¡-r,s.

Prueba bilateral para la media.

1. Hipótesis Nula. Ho: p: po.


8.2. Pruebas de hipótesis sobre Ia ntedia, cuando la varianza es conocida

2. Hi,pótt:si,s Al,terrtotduu Hl ¡-L I ¡ro.

3. Estadísti,co de P'rureba. Zobs : x:- lro


" IJñ
4. Re.gión de Rechazo. zobs I -zol2 o Zo¡r, ) z,r¡2.

Ejemplo. IJna empresa farrnacéutic¿ ha estat¡lecido qlre un compriniido dcbc tcncr Ltn peso
nredio igual a lo:0.5g y una desviación estándar de o:0.11g. Se tomó una muestradeT44
comprimidos de un lote de fármacos, cuyo peso promedio fue de Z:0.53g.

a) Para un nivel de significación de 0.01, ¿,el peso de los comprimidos en e1 lote se diferencia
del admisible por Ia empresa'/;
b) Determinar el p-valor de la prueba.

Solucdón:

a) La prueba de hipótesis es bilateral:

1. Hipótesi,s Nula. Ho: F: 0.5 g.


2" Hipótesis Alternat'íua. HI tt l_0.5 e.

3. Estad,ísti,co d,e Prueba. zobs : ?:+ - 0'53 - 0'5 :3.273.


o I \/n
0.11 I \/ 144
4. Regi,ón de Rech,azu Para a:0.01,
Ia región de rechazo es zobs < -2.57 o zo6") 2.57.
5. Deci,s'ión. Como el valor zobs cae en la región de rechazo, se descarta la hipótesis de que
/¿ : 0.5. La probabilidad de rechazar -É16, suponiendo que sea cierta es solo 0.01; por lo
tanto, en al menos el 99 % de las veces la decisión es la correcta.

b) Determinemos el nivel de significación mínimo de la prueba.


Como Zobs:3.273, el valor de probabilidad correspondiente es (D(3.273) :0.9995. Por ser
una prueba bilateral, se cumple que 0.9995** : t, por Io tanto, a:2(l-0.9995) : 0.001;
2 ','
que significa que llegaremos a una conclusión errónea en menos de I de cada 1000 veces, lo
que verifica la conclusión anterior.

b) Prueba unilateral para la media.


1. Hipótesis Nula. Ho: F: lto.
2. Hipótesis Alternat'íua. HI F] l-ro (o bien Ht F < po).
3. Estad,ístico d.e Prueba. zobs :
r - tlo

4.
"l\ñ,' zo6"
Regi,ón de Rechazo. Zobs > zo (obien { -zat cuando HI F < ttd.
Ejemplo. Si en el ejemplo anterior, el peso máximo admisible para que el medicamento no sea
tóxico es igual'd LLo:0.52g.

a) Se desea saber si los comprimidos del lote son aptos para el consumo humano, a un nivel
de significación del 5 %;
b) Determinar el nivel de significación de la prueba.

Solución:

a) Los datos son los mismos que antes se usaron, solo debiéndose cambiar las hipótesis.
24O Capítulo 8. Pruebas de Hipótesis

1. Hipótesis Nula. Ho: F :0.52 g.


2. Htpótesis Alternatiua. HI F > 0.52 g.

3. Estadístico d,e zor¡s:' , F - 0'53-0'52:1.0909.


Prueba.
" I rt
o.ÍlJt44
4. Región :
de Rechazo. Para cl 0.05 la región de rechazo es zob.s > 1.65.
5. Dec'isi,ón. Como el valor zobs Lo cae en la región crítica, no existe razón para descartar
la hipótesis nula, de manera que se podría asegurar que el medicamento es apto para el
consumo humano.

b) El nivel de significación de la prueba es 1- 0(1.0909) - 1- 0.8621 : 0.1379. Como


p :0.1379 > 0.05, no se rechaza Hs.

Observación. Si el tamaño de la muestra es suficientemente grande (n > 25) y se desconoce la


vatianza, es posible utilizar estas pruebas, reemplazando o por su estimador s, sin pérdida de exactitud.

Cálculo de Ia potencia de la prueba

La probabilidad de cometer un error de tipo II se nota como B y se define por

É : Pr(error de tipo II) : ptl""eptar flsl¡r, ),

donde suponemos verdadera la hipótesis Hl F: l-rt.

Errtonces, por el Teorema del Límite Central, la variable 7 : !-4 sigue una Iey normal estándar.
ol\/n
Ejemplo. En el ejemplo anterior, calcular Ia potencia de Ia prueba si el verdadero valor de la media
es 0.54 mg.

Solución: Veamos qué signiflca <<aceptar -É16>> en términos de los valores que puede tomar el promedio,
r.
Aceptamos Hs si+ < 1.6b; es decir, ,01.?,, < 1.65, o seaz < 0.53b13.
o I \/n - 0.rll\/144
=u-- -
Por tanto, la probabilidad B la podemos poner de la siguiente manera:

Pr(aceptar Holp) : Pr(z < 0.535131p1 : 0.b4)


("- p, - 0.53513-0.54\
"\"lr/i' o.lrl\n44 )
: Pr(Z < -0.53127) :0.2976.

La correspondiente potencia de la prueba es Pot - 1- 13


:0.7024.

8.3. Pruebas de hipótesis sobre la media, cuarido la varianza es des-


conocida

Cuando la varianza es desconocida, no es posible aplicar el Teorema del Límite Central; en este caso,
para que sea posible aplicar esta prueba es necesario que la muestra provenga de una población que
sigue una ley normal, de manera que el estadístico de prr"reba sigue una ley de distribución ú. Entonces
la prueba estadística es la siguiente:
8.3. Pruebas de hipótesis sobre la rnedia, cuando Ia varianza es desconocida 24L

a) Prueba bilateral para la media.

1. Hipóteszs Nula. Ho: Lt: l-to.


2. Hipótesís Alternatiua. Hr p I p,o.

3. Estadístrco d,e Prueba. trrbs :


r- Po

4. 'l'F,
{ -to/z(n -
Regi,ón de Rechazo. tob" 1) o tob" ) t^¡2(n - I).

Ejemplo. Según un estudio del Ministerio de Educación, el costo medio de la lista de útiles
de los escolares de educación básica es 87 dólares. Para verifi.carlo, un investigador tomó una
muestra con los siguientes resultados:

Cesto (ri) | 68 7b 93 101 r23

Para un nivel de significación de 0.05, verificar la hipótesis de que la máquina cumple con la
especificación.
Solución: Previamente hallamos eL promedio y la desviación estándar: Í :97.7 y s : 18.728
(los cálculos se dejan como ejercicio para el lector).
Con ésto planteamos el contraste:

1. Hipótesis Nula. Hs: p : $1.


2. Hapótesis Alte,rnatiua. H; p,l87.

3. Estad,ístico de Prueba. tobs: !;+ - 87 -


97'7 o
slfr, --
<,=<
L'¿¿')'
t|tn@-
4. Regi'ón de Rechazo. Para el nivel de significación a :
0.05 y por el número de grados ile
libertad ("- 1) : 19 se encuentra el valor de ús.625(19) : 2.093. La región de rechazo es
tobs 1-2.093 o to6" ) 2.093.

5. Dectsión. Como el valor úo6" s€ encuentra en Ia región crítica, ya que 2.555 > 2.093, se
rechaza la hipótesis nula; es decir, el precio medio de las listas de útiles es distinto al que
afirma el Ministerio.

b) Prueba unilateral de la media.

1. Hipótesis NuIa. Ho: Lt.: l.to.


2. Hipótesi,s Alterno,tiua. Ht F > po (o bien I11: F < tli.
3. Estadístico d,e Prueba. tobs : " , 4.
"1rfr"
4- Regió'n de Rechazo. tob,) t.(n.- 1) (o bien tob, 1-to(n - 1), cuando H¡ ¡t < tto).

Ejernplo. Según las previsiones del gobierno, la inflación para este año será de 3.g %. Un
economista, desconfiado de Ia cifra, realizó una investigación por su cuenta y registró la variación
de los precios en los 22 artículos que a su juicio tienen la mayor incidencia en Ia economía popular.
Obtu'r'o una variación de 4.5 7o y una desviación estándar de 1.3 %. Pruebe si la cifra de inflaciórr
del investigadol será mayor que la del gobierno.
Solución: Se tienen los siguientes datos del problemai rL:22, r:4.5 y s: 1.3. La prueba es:

1. Hipótesis N'ula. Ho: p: 3.9.


2. Hipóteszs Alternat,iua. HI H > 3.9.
242 üapíúu,Ia 8. -Fruef¡as de -ÉfipóCesis

3 E,lnLlis!i¡'o d, pr,,"5,,. 1,,t,. +


O' ''t:: 2.lLii.
'lJ't t.:j/ \/2')
flegt,óri, tle Si tornarllos Lv : [J 01 y l,o or(21) - 2.518, la legión cr'ítica es
trlec:l¿a,zo. 1.,,,¿,,, )>

2.518; pcto si sc tonta r-v:0.1-J5 y l¡s5(21) - I"721,1:r reg,ión ur'ítir-'¡ es ú..¿,,, > 1.72]1.
Dec:i,si,ón, P¿rla cr - 0.01 no se rechaza H¡; cs dccir, no existe evidencia quc indiqu,,rl¡{'ia
cifl¿r clacla, pol cl gobierno está subestirrrada. Srn embargo, si sc torna r-v - 0.05, resulta que
Lob., ) ú... se rechaza Ho; es decir, 1a infla',ón cs inayor que la estimada por el gobici"no.

ltpaltirdelosclosrcsultadossedednce qr-ielaaceptación orec:hazode¡-r,:3.9noesconchryente.


puesto qlle con o : 0.05 se rechaza y con ú! : 0.01 se acepta. En este caso se debería arrmentar
el número de observaciones.

8.4" Pruebas de hipétesis sobre la varia.nza

Para realizar una prueba de hipótesis sobre la varianza, supondremos que las observaciones provienen
de una distribución normal) para que el estadísti * @# siga una distribución y2 con (n - t)
grados de libertad. Bajo este supuesto, las pruebas de hipótesis son las siguientes.

a) Prueba bilateral para la varianza.

1. Hipótesis NuIa. Hs: o2 : of;.


2. Hzpótesr,s Alternat'iua. H¡ o2 I o2r.
(n
3. Estad,ístico d,e Prueba. X3,,": -])s2 .

4. Regi,ón de Rechazo. X?"u" > X?.p(n - 1) o XZt < Xl .,r(n - t¡.
"
h) Prueba unilateral para la varianza.

1. Hipótesi,s Nula. Hs: o2 : of,.


2. Hipótesr,s Alternatiua. H¡ o2 > @ bien 111: o' < oZ).
"3
(n - !)s2
3. Estad,ísti,co d,e Prueba. XZu": .
o2o

4. Región de Rechazo. XZu"> x?,(n- 1) (o bienyf;o"<x?_,(n- 1), cuando H¡o2 <"2i.

Ejemplo. Un fabricante de cables de cobre afirmó que su producto tenía una resistencia a la ruptura
relativamente estable y que se ubicaría en un rango de 40 kilogramos-fuerza (kgf) . IJna muestra de
16 mediciones arrojó una varianza igual a s2 : 195.

a) ¿Hay evidencia suficiente para rechazar Ia afirmación del fabricante?;

b) Encontrar el p-valor de la prueba.

Soluci,ón: Como el fabricante da el rango de variación de la resistencia, podemos estimar la desviación


estándar mediante la relación aproximada
" - ry99 (dada en el Capítulo 1), por lo qne se puede
asumir que o : 10 kgf.
8.5. Pruebas de hipótesis sobre Ia proporción 243

a) Lrr prlreba t:s:


1. Hiqtólr:s'is Nrr,lo. H¡'. 62 : 102 :10C).
2. H'i1tótt:srs Altentat,i,ua. Ht'. o2 > 100.

3. Estadíst'ic:o tle Prtrcbo,. X?,., : (n, - t)s'2 (16 - 1) x 195


:29.25
100

4. R.egiór'r de Recl¿azct. P¿rra nn rrivel cle significación o:0.05 y 15 g.1., fSoo(15) :25.00. La
región crítica es Xlo" > 25.
5. Decisión. Como 29.25 > 25, se conch.r.yc qrre la hipótesis es falsa y qtle la variación de la,s
mediciones excede ias especificacioues del fablicante.

b) Para encontrar el nivel de significación aproximado de la prueba examinamos) en ia tabla de la


distribución X2,elrenglóncorrespondientea15g.l. Sevequeelvalor d.XZt":29.25 esmayor
eue XZ.ozs :27.49 y menor eue X3.or:30.58. Así, el nivel de significación observado es menor
que 0.025, Io que quiere decir que se rechazará la hipótesis nula para cualquier cr mayor o igual
al2.5%.
El valor exacto, obtenido mediante un programa informático) es 7.45%.

8.5. Pruebas de hipótesis sobre la proporción

Supongamos que se dispone de n observaciones


provenientes de una población con distribución de
Bernoulli y deseamos probar que el parámetro p es igual a un valor prefijado ps. Recordemos, también,
:1ue si entre las n observaciones hay y éxitos, Ia proporción se estim a por f; : !.
n
Para la realización de estas pruebas, utilizaremos la aproximación de la ley binomial mediante la ley
:rormal.

a) Prueba bilateral para la proporción.


1. Hi,pótests Nula. Hoi p : po.
2. Hipótesi,s Alternatiua. Ht p I po.
p-po
J. Estad,ístico d.e Pr-ueba. zobs --F o0
-po - --Ft OonCte p- -a
lPoqo n
tl-
un
4. Regi,ón de Rechazo. zobs I -2.¡2 o 2o6" / zt/2'

b) Prueba unilateral para la proporción.


1. Hipótesis NuIa. Ho: p: po.
2. Hipótesis Alternatiua. Hr p > p0 (o bien I11: p < po).
3. Estadístico de Pru,eba. Zobs : f-po
po qo
n
4. Región de Rechazo. zobs ) zo (o bien zo¡r, I - Zat cuando Ht p < po).

:jemplo. Una empresa realizó una investigación de mercado para determinar el nivel de consumo de
- refi'esco, para lo que consultó a200 consumidores, de los cuales 28 expresaron sll preferencia por
.-:roducto. El fabricante, de acuerdo a sus ventas, cree que tiene el 10% del mercado de refrescos.
244 Capítulo 8. Pruebas de Hipótesis

a) ¿Son los resultados de Ia investigación consistentes con los datos del fabricante?;

b) Determinar el nivel de significación del contraste.

28
Soluczón: Se tiene Po : 0.1 Y el estimador de Ia proporclon es p - :0.14.
200

a) La prueba queda así:

1. Hi.pótesis Nula. H0: p: Q.1.


2. Hi,pótesis Alternatiua. Hr.p + 0.1.

.J. Estad,ístico d,e a' Zobs:P - Po


Prueb 0.14 - 0.1
:1.886.
lposo: 0.1 x 0.9
t¡l n
4. Región de Rechazo. AI escoget (r:0.05, 26.s25:1.96, la región es zobs > 1.96.
5. Dec'isión. Como zobs Lo cae en la región de rechazo, no se puede descartar Ilg; entonces,
no hay evidencia de que la proporción de consumidores sea distinta del 10 %.

b) Como zobs :1.886, el valor de probabilidad correspondiente es A(1.886) : 0.9706. Por ser una
prueba bilateral, se cumple que 0.9706 +;:1; por lo tanto, a:0.0588.

Cálculo de la potencia de la prueba

La probabilidad de cometer un error de tipo II se nota como B y se define por

,6 : Pr(error de tipo II) : prlu"eptar I1slp1),

donde suponemos verdadera la hipótesis Ht: p: pt. Entonces, Iavariabl.e Z: srgue

una ley normal estándar.

Ejemplo. En el ejemplo anterior, calcular la potencia de Ia prueba si el verdadero valor de la


proporción es 0.12. '

Solución: Veamós qué significa <<aceptar f/s>> en función de p.

< 1.96, o sea 0.05842 < A< 0.14159.

Por tanto, la probabilidad B la podemos poner de la siguiente manera:

Pr(aceptar f¡o br) : Pr(0.05842 < 0 < 0.I47591p1: 0.12)

0(0.93958) - O(-2.6799) : 0.8226.

La correspondiente potencia de la prueba es Pot - 1- 0 :0.1774. <


En el Cuadro 8.1 se presenta un resurnen de las pruebas de hipótesis col muestra única.
8.6. Ejercicios 245

Hipótesis Hipótesis Estadístic<-r Región de


nula (I{¡) alternativa (,F11 ) cle prueba rechazcr

3,i,"Ti3:.fi;TH' i
grarrcle) =
i;i r,lli , t!
-ro/\/n
,
t4,"'),,,'
(rrruestra Lt,2 tt,o lt { I,t,o z4 -zo
Distribución riorrnal ¡¿: l1,o F I H, ,'- i - l"o lt > t^/,
va'iarrza lt1. po Fllro slJn- tltu
clescolocida y,) l.ro lt 1 fto (n - 1) g.l. t { -to

Distribución p: po Plpo l-l r


l¿l 2 zo/2
-

binornial P<Po P>Po z-


(rnuestra grande) P> Po P 1Po L\-40

Cuadro 8.1: Pruebas de hipótesis con una sola muestra.

8.6. Ejercicios

Pruebas sobre la media poblacional (varianza conocida)

Se sospecha que los varones de las nuevas generaciones tienen, en promedio) mayor estatura que
las antiguas. En un estudio realizado hace clos décadas se determinó que la población adulta
masculina tcnía una cstatura media de 167 cm, con desviación estándar de 10 cm.

a) Si se <lesea verificar Ia suposición anterior, formule, en símbolos y en palabras) la-s hipótesis


nula v alternal iva;
b) Recientemente se tomó una rnuestra de 35 reclutas del servicio militar y se observó una
estatula promedio de 171 cm. ¿Qr.ré conclusión se puede sacar con a : 0.01?

Un fabricarrte de fertilizantes afirma que el uso de su producto dará por resultado una cosecha
de por lo rnenos 3.5 toneladas de trigo por hectárea, como media, con una desviación estándar
de 0.5 toneladas. La aplicación del fertilizante a un álea de 37 hectáreas dio una cosecha de
3.35 toneladas por hectárea.

a) Al nivel de significación del 5Vo, ¿,serecltaza la afirmación del fabricante?;


b) ¿Se rcchaza la afirmación al nivel del TVo?
Una balanza sc encltcntra descalibracla y no siempre registra el peso r¡xacto. Cuando se pesan
454 g la desviación estándar es de 10 g. Para averiguar si es necesario recalibrar 1a balanza se
realizó una scrie de 50 pesajes de cantidades iguales de <<una libra>>, resultanclo un peso promedio
de 451 g.

a) A urr nivel del 10 %, ¿es necesario lecalibrar la balanza?.


b) Calcule el nivel de significación cle la prticba.

Una emplesa qlle elabora plarrchas plásl,icas puso en práctica un nlrevo rnétodo de fabricación
tal que el costo medio por rnetro cuadrado sc distribuye rrormalmente con va,rianza poblaciorral
4. Se obtuvo una muestra aleatoria simple de tamaño 100, resultando un costo promedio de 2.4
dólares. Verifique la hipótesis de que el costo medio es dc 3 dólares, con rrn nivel de significación
del4.5%.
246 Capítulo 8. Prttebas de Hipótests

5. Pol cstudios ¿rrrt<:Liorcs, scr srrbc c¡rer lir" rrc¡rli¿r dr: I¿ ecl¿rd rle los tlclirrcrrcrrt<:s crr cl pzrís cs rlc 23
años: sirr cnrl.,argo. crr un estrrclio rer:icnt<r (ioll Lln¿t unrcstL¡r rlc: 80 clr:tcrriclos. sc obtrrvo r-rrr 1>rorrrc<1io
clc 21.5 arlos y urr¿t <lesviar:irirr est¿irlrl¿rr' <lc i-J. Cr¡l rrn nivcl rle sigrriÉic:ir<:irirr cl<:1 '2 %, r:r.,ur1.,nLelrc
ia, hipritcsis clc quo l¿r rnecli¿r cie ecla,cl cle los clelirrcrrcntes sc h¿r lc<hrciclo sigrrific:rtivirrle:lr(,c.

(i LLr l¿rbor'¿rtorio f¿rlrrr¿rcéuti<:o asegura qllc rrn nrcdic¿rriertto c¡rc fal rric¿r ti<rrre nrr <rolrtenirlo rrreclio
dc 10 000 unidadcs cln ca(la dosis. Para corrl"rol.r¿rr si c1 l¿rl-ior'¿itolio cs de fial se torn<i uua
mur:stla cle 40 dosis, obterricnclo una rucclia <le 9940 uuiri¿rrles )¡ ulla desvi¿rción ost¿inclar clc 120
unida<les.

a) ¡.Poclcrnos aceptal la iuclicación clel I¿rboratori<.r cou ulr rrivcl cle significacitit r.IeI I%il:
b) Calculc ei nivel de significación de la prueba.

7 En un restaurante se hai¡ía tenido una media de 160 consumiclores diarios y nlla dcsviaciórt
estárrclar clc 17.5. Se aumerrrtó los precios cle la cornida y el propietalio notó que 1os 30 riltimos
días había un prornedio de 151 clientes diarios. ¿trI propietario pnede pensar que efectivament<:
ha descendido el número de clientes o que la variación es debida aI azatrl

B IJna emprcsa exportadora de camarón el año pasado embarcó una media de 10500 c:rjas por'
sernana) corr una desviación estándar de 1500. Eu los primeros seis rneses (26 sernanas) dc estc
año exportó un plornedio cle 11200 cajas cada semana.

a) ¿Puecle asegurarse que ha habido un cambio en la demanda de camarón?;


b) Halle el nivel de significación de la pmeba
I En una fábrica, la producción por hora dc botones de tagua sigue nrra distribrrciórl nornl¿ll
con desviación estándar de 16. Se extrae de dicha población Lrna mnestra de t¿¡mairo 81, para
contrastar la hipótesis de clue la producción medi¿r por hora del citado producto es 100, a1 nivel
de significación del 5 %. Si la hip<itesis alternativ¿r es 105, calcule la prolrabilidacl de ccrrneter urr
error de tipo II.

10 Una socióloga afirma que cl tiempo que los niños cle tres ¿r cinco ¿riros dedican a ver la televisiórr
cada semana se distribuye normalmente con media 22 horas y desviación estándar 6 horas. Frentc
a este estr-rclio, una ernpresa de investigación de mercados cree que la media es mayor y pala
probar su hipótesis tomó una mucstra de 64 observaciones procedentes de la misrna poblaciórr.
obtcniendo como resultaclo una meclia dc 25. Si se utiliza un nivel de significaciórr del 5 %:

a) Verifique si la afirmación del investigador es realmente cierta;


b) Determine la potencia de ese contraste, si 1a verdadera media poblacional fuera 24.

11. Urr rnicroernpresario está considerando la posibilidad de administrar cl bar clc uu colcgio. trl
adrrrinistradol actual del b¿rr afilma quc r:l inglescr diario sigue una distrilrución nolrnal rle rnedia
87.5 dólares y una desviaciórr estánd¿rr di: 7.5 dólares. Para comprobar si decí¿r la vercl¿ld) torn(i
Lur¿r rnlrestra de treinta días y í:sta revel<i r-ru ingreso dialio promedio dt: 82.5 dól¿rres. Utilizarrck¡
o: 0.1,

a) ¡,hay evidenci¿r de quc cl iirgreso diario promcdio se¿l nenor clcl que ¿rfir'ma el clueño actrral'/;
b) Calcule la potcncia clcl contraste si l¿r verdaclera rncdia fucra pr,:85.

Pruebas sobre la media poblacional (varianza desconocida)


12. Una muestla de n : 11 observaciones de una población distribuida rlolmalmente dio corno
resultado un promedío T : 19.5 y una desviación estándar s : 2.4. ¿,Proporcionan los datos
suficiente evidencia para probar que É¿ > 18?
t
t
fi
i.
8.6. Ejerci.cios 247

a) Enuncie las hipótcsis nula v altelnativ¿r clc l¿r pmcl)¿r;


b) C)lrtcuga la legión clc reclLazo ltrrra la prtrr:lrir si a:0.05;
c) Llcvc ¿r cabo la 1;rneba e interprí:tela.

Se dcsca saber si la cdad promedio a la cual sc clesposan las rlujeres en la ciudacl cle Cuenca es
diferente cle los 26 años de edad. Sc tornó rrna muestraclc24 registros dc rn¿rtrimoriio, resultandcr
las sigr-ricntcs edades de las novias:

18 28 46 21 29 23 47 43 23 32 20 56
26 40 19 35 20 18 16 65 22 19 24 32

La edad promedio de estas edades es 29.83 años y ia desviación estándar es 12.86.

a) ¿Son ios 29.83 y 12.86 parámetros o estadísticos?;


b) Plantee las hipótesis nula y aiternativa para verificar el argumento arriba indicado;
c) Calcule el estadístico de prueba y la región de rechazo para esta prueba de hipótesis;
d) Explique su conclusión sobre si la edad promedio de Ias desposadas en la ciudad de Cuenca
difiere de los 26 años.

14. Una compañÍa de televisión por cable anuncia que el periodo medio de espera desde la solicitud
hasta la conexión a la red de sus nuevos clientes es de ocho días. Una asociación de consumidores
desea verificar dicha hipótesis, para lo cual tomó urra rnuestra del periodo de espera (en dÍas) de
15 clientes con los siguientes resultados:

11 r0138 10 721281011 l07B


Verifique si el periodo medio de espera es igual o diferente a ocho días. (Use a : 0.05.)

\5. La resistencia, en kgf crn2, de Ia fibra de carbono se distribuye normalmente. Se tomó una
mnestra de 10 elementos fabricados con este material, obteniendo:

203 229 275 220 223 233 233 208 228 209

Contraste la hipótesis de que la muestra proviene de una población de media 275 kgf cm2.

6 Segúrn los datos de una universidad, sus estudiantes obtienían en el examen de evaluación clel
inglés como segunda lengua una media de 50 puntos. Un profesor de inglés quiso comprobirr
si sus alumnos tenían un promeclio rnás alto, para ello seleccionó una muestra aleatoria de 20
alumnos y les envió a examinarse. Los resultados dieron una nota promedio de 54 y desviación
estándar dc 7 puntos. ¿A qué conclusión llegará el profesor, con un nivel de significación del
f,(Yn
¿ /a:

En una ciudad se quiele hacer un cstr-rdio rápido para'r,'alorar el consunlo de agua en los domicilios
palticulares dulantc los meses de mayor seqnÍtr. Para ello sc seleccionalon, al azar, 15 domicilios y
se midieron slrs consumos (r¿) en metros cúrbicos durante el mes de agosto. Los resultados fueron
Dr :280.5, Dr? :5308.35. En vista cle estos clatos, ¿hay suficiente evidencia estadística, al
nivel 0.05, ¿r favor cle la hipótesis de que el conslrmo medio de los particulares durante el mes de
agosto es llayor clue 18m3 (q,-,e es el consnmc¡ considerado como <sostenible>>)?

El consumo de gasolina (en litros por 100 km) de los automóviles de 3 puertas sigue una distribu-
ción normal con rnedia 8. Se introdujo una modificación en el motor con objeto de disminuir el
248 Capítulo B. Pruebas de Hipótesis

corrslrnlo y se probaron 10 ¿rutos corr el motclr modificaclo, obtcrriérrclose los siguierrtes esta,rlísticos
por' 100 krrr:
10 10

f
,¡.-r ",:77'5, T,r;i -
i.- I
(i01.33

Srrponiendo qr-re la modificación ur¿rntienr: 1a nor-nalidirrl, ¡,hay suficiente evidr:lrcia cst¿iclístic¿r


(al nivel clc significación 0.05) ptrra porlel afirm¿ll c¡re la rnodifir:¿rcirin ha reduciclo el colrsllrno
meclio?

19 El ticrripo al disco drrro cn un c;icrto mocielo dc computarloras es una variable ¿rleatori¿r


<le acceso
con rnedia 15 milisegundos. Se propuso una modificación técnica con objeto de dismirruir cste
ticrnpo de acceso. Se prueba el nuevo sistema crr 10 cornputarloras obteniéndose una medi¿r
muestral de 14 ms y una desviación estándar de 2.286.

a) ¿Hay suficiente evidencia estadística, al nivel 0.05, a favor de ia hipótesis de que el rruevo
modelo disminuye el tiempo dc acceso'/;
b) Calcule el p-valor.
c) Indique un par de valores de 7 y de s que hubiesen llevado a un p-valor de 0.005. ¿Qué
decisión se dcberÍa tomar eri este caso respecto al nucvo rnoclelo?

20 Una muestra de 25 traba.jadores informales, que sc dedican a vender golosinas en los buses.
ganan un promedio de 17.5 dólarcs diarios con una desviar:ión estándar de 2.5 dólares.

a) Estime la ganancia pr:ornedio diaria r-le es1,c tipo cle trabtrj:rdores informales, usa,ndo nn
intervalo de confianza aI g57a;
b) ¿trs Ia ganarrcia promedio de 17.5 cl<ilares significativ¿mente inferior a los 18.5 dólares qrrc
ganan los vencledores qne tienen un prresto fijo en los cines? (Utilice nn nivel del 5%.)

Pruebas sobre la varianza poblacional


2r. Un¿r muestra de r¿ : 25 observaciones cle una Población distril¡uida rrormalmente clio corno
rcsrrltaCo una variatrza lullestr¿Il dc.s2:23.4. ¿Proporcionan los clatos srrficiente eviclencia que
indir¡rre q',r o2 > i5?
22 Urr¿ muestra aleatoria de 14 est,ucliantes de enfcrrnería participan en Lrna plLreba ptrra meclir
su destreza mannal. una vez obtenidas las purrtutrciones, la varianza de l¿r muestr¿ es cle 7221¡.
Contrastc con cv : 0.05 que la varianza poblacionirl es de 2500"
t'l I a lrrecisión del tr¿"bajo dc una niáquíntr ¿urtom¿í.tica se nlide por: la r..aLi¡rnza clc-. la cliuiensiórr
coutrolacl¿r clc los productos, que llo debr: ser rrli\yor,¡,c ofr :0.18. Se torrr<i nna rLruestr;r
ak:lLtclia cl<r ¿rrtículos quc hrr daCo la,s sigriicnte-s rledici<tri<ts:

Verilique si la nráqrrinir gartrrrtiza lir prer:isión neer:salia p;rlzr el uivel cle significirr:irin ck: (-).05.

24. estándar-de un proceso ir.ciustLi¿rl (irrc plo(hlce valillas, <:l concliciones nolrnirles,
L¿r c{esvia,cicin
es clc 3 crn. Se dispone de una nnestra ck: tarnairo 15, con los sigr-rientes valores:

12; I i7 115 130 l1; 112 11it 1


I
0')
:, I 121 177 116 122 r20 126 115.
Su1-ronierclo clue las longitudcs sigr-rcrr tllt¿l lc_1, r, illr)r'rl . contrastc Ia hipótcsis dc c¡re erl ploccso
furrciona correct alnente.
8.6. Ejercicios 249

25. Una máquina de crnpaquetado automático deposita en cada paquete una ciclta cantidad de papas
fritas. Se scleccionan 20 paquetes, se pesa su contcnido y se obtienen los sigr.rientes resultados:
49 50 49 t10 50 50 49 50 50 50
49 50 50 51 52 48 50 51 51 51

A partir de esta información y suponiendo que la variable se distribuye normalrnente:

a) Verifique si la media de esa variable es 51, con un nivel de significación del 1%;
b) Verifique si la varianza es la unidad, con un nivel de significación clel 5 %.

Prueba sobre la proporción poblacional


26. Una muestra de n : 1000 observaciones de una población binomial produjo A :280 éxitos. Si
la hipótesis de la investigación es que la proporción es menor que 0.3.

a) ¿Es una prueba bilateral o unilateral? ¿Por qué?;


b) Fbrmule las hipótesis nula y alternativa de la prueba;
c) Realice la prueba e interprétela. Utilice a : 0.05.

27. Una marca de aceite comestible cubre actualmente el 20 % de los ¡rotencialcs clientes. Para
incrementar las ventas se estructura una campaña pubiicitaria intensiva. AI final de la misma se
realizará una investigación a 400 consumidores potenciales para determinar si tra tenido éxito.

a) Enuncie Ho y Ht en términos de p, Ia probabilidacl qrre el consumidor prefiera la marca cle


aceite;
b) La empresa concluirá que la campaña tuvo éxito si al menos 94 de los 400 entrevistados
prcfieren su prochrcto. Encuentre a;
c) Realice la plueba e interprétela.

r8 En una encuesta a 300 taxistas, 132 contestaron que utilizan el cinturón de segulidad. {Jtilizanclo
un nivel de significación del 5 %, ¿podemos concluir que la mitacl de los conductores utilizan el
cinturón?
')9 De acuerdo con sns registros, una clínica ha establecido que la probabilidad de curación completa
de un enfermo que ha tomado el medicamento A es 0.8. La clínica experimentó con un nuevo
medicamento B en 700 pacientes, de los cuales 575 se cllraroll totalmente. ¿Se puede considelar
que el nuevo medicanrento es más eficaz que el tradicional, al nivel dc significación de 5To?

Una agencia dedicada a1 cobro de cheques encontró <¡re el 5 % de toclos los cheques remitidos
a la agencia eran cle cuentas sin fondos. Después de implantar nn sistema de verificación, pa,r'a
disminuir sr"rs pérdidas, se hallalon solarnente 50 cheques sin fonclos erl Lrna mncstra aleatoria cle
1124 cheques. ¿Existe suficientc evidenci¿r, estadística para concluil quc el sistema de verificación
ha reducido la proporción de cheques sin fondos?

Un proveedor ascgura que los artículos que é1 snnrinistra sorr defectu.osos en un 1% cle los casos.
Se realizó r-rna pmeba ¿r 200 de sus artícnlos y resr-rltaron 3 r-lefectllosos.

a) A un nivel cle significación del 1 '%, ¡;t:s falsa o cierta la afir'mación del ploveedor?;
b) Halle el nivel de significación observado de la plueba.
En una encuesta en Quito se entrevistó a 850 adlrltos. A la pregunta de que si ellos estaban a
favor del endurecimiento de las penas por ciertos delitos, eI 52% respondió afi.rmativamente.
250 Capítulo 8. Pruebas de Hipótesis

¿r) ¡.Sc Pucclc cc¡ttr:lttil c¡tct lir rti¿t\rorí¿r clet los ¿rdultos están ¿r favol del enchrrc<tirrLierrto rle l¿rs

l) oll¿rs ?i

l,) l}lcrrcrrl.r'i: cl nivr:l clc sigrrific:ación cle la y>nrcbzr.

33. Utt ecortornista clcl Battco Cerrtral está intcres¿lclo err conrl)ar'¿rr cl íuilice cle arrsentisrno labolal
crr (.)rrito con el dcl rcsto del país, doncle se sitria <n eI 77(%. Corr estc plopósito se:ieccionci, al
azar') urra rnuestra cle 200 tlaba.jaclores de dicha, ciuclad, la cual proporcionó rur porcenta.je de
ausentisnro del \6(Vo.

a) ¿Se pr-rede sacar la conclusi,ón de que el arrsentisrno es rnayor en Qr-rito qlle cn el lesto de1
país, al nivel de significación a : 0.025?;

b) Calcule [3, p: 0.17;


"i

34. Una agencia de publicidad trató de convencel a un industrial para que hiciera propaganda
televisada de uno de sus productos, asegurándole que el programa en el que se incluiría su
aruncio era visto por el 2A% de las familias. trl industrial quiso hacer un experimento por su
cuenta. Llamó por teléfono, durante Ia hora del programa, a 220 familias y halló que en 33 de
ellas se veÍa el programa.

a) ¿La diferencia entre la proporción de la agencia y la obtenida por el industrial es significa-


tiva? Es decir, ¿se debe únicamente al azar o es sustancial? Use a:7'7a;
b) Calcule la potencia del contraste, si p : 0.15.

35. En un programa periodístico de opinión se pidió que los televidentes Ilamaran al canal y respon-
dan a la pregunta << ¿,cree usted que es necesario que se hagan reformas en el sistema educativo
del país?>> De 812 llamadas recibidas, 790 se expresaron afi.rmativamente.

a) Use esta información para realizar Lura prueba de que más del 95% de los ecnatorianos
adultos cree que se deben hacer reformas en el sistema educativo;
b) ¿trs el resultado de la prueba estadísticamente significativa al nivel 0.01?;

c) Liste las hipótesis requeridas para que Ios resultados de Ia prueba sean válidos en esta
situación. En este caso, ¿,se satisfacen tales hipótesis?

Al igual que en el caso de observaciones realizadas sc\bre una misma población, cuanclo se dispone
de varias muestras provenientes de poblaciones distintas, se podría desear conocer si ellas compalten
irlgurra característica o si son totalmente diferentes. En Io que siguc nos ocuparemos de las pmebas
de hipótesis que involucran dos mllestras.

8.7. Pruebas de hipótesis para Ia diferencia entre dos medias

Igual a lo que se hizo en la sección cledicada a las pruebas de hipótesis sobre la rnediir, se deben
considerar los casos en qne es posible aplicar el Teorema del Límite Central y aquellos erl que no es
posible. Adicionalmente, se deberá terrer en cuenta un tercer caso, cuando las muestr-irs provienen de
una misma unidad muestral, mediante mediciones repetidas.
8.7. Pruebas para Ia diferencia entre dos rnedias 25t

8.7.1. Caso 1: Varianzas supuestas conocidas

Sr-rporrgarnos !1[te sc) clispone r[c clos poblaciorres, rlrri: liLs rrr)rnl-,r'¿rlcn]os conlo I -y 2, y se clesc¿r 1rrt.r]rzrl si
la difcreucia entre l¿rs clos rnccUas polrl:rcionales es igual ¿l nrra c¿rnticlad 1)¡; cs clecir, H1¡: ¡1 - lLt - Do,
o se clese¿i lrlobal el caso lrirlticular cLe ltr igualcl¿ic.l dc talcs rnedi¿rs, o scA) H¡'. ¡t1 - ¡,t,.r.

De la pobltrción 1 se extrae irn¿t rnrtestta de tarnaño r¿L y de la pobl:rciót 2 sc extr¿rc un¿l mlrestl¿r (le
tarlaño n2. Si l¿rs colrcsporrdientes r,'arianzas poblaciontrles son corrociclas. las 1>nrebas de hipótcsis
son las signientes:

a) Prueba bilateral para la diferencia de dos rnedias.

1. Htpótests Nula. Ho: (g - p,z) _n


- uu.
2. Hipótesis Alte'rnatiua. Ht (pt -P)lDo.

3. Estadístico de Prueb&. Zobs:


(t1- :r2) - Ds
I '' 't
loi
,i/-t-
o.1

Y n'' n2
4. Región de Rechazo. zobs 1 -zryl2 o zobs > za/2.

b) Prueba unilateral para la diferencia de dos rnedias.


1. Hipóte.sis Nula. Ho: (h - F) : Do.
2. Húpótesis Alte'rnat'iua. Ht (pt - t ) > Do (o bien I11: (pr - p) < Do).

2 F"r-,rí"!i¡n ,lo
3. Estadístico p,"",.t,^ z.t¡s: (rt -¡z) - Do
de P'rueba. - l,
loi o;"
U^--q
4. Región de Rechazo. zobs> zo (oltierr zo¿," -zat cuarrdo H¡ (¡t1 - pz) < Do).

Ejernplo. Una inversionista tiene dos hoteles en la ciudad, uno en el norte y otro en el sur. El
sospecha que el conslrmo medio en el restaurante del norte es menor que en el del sur. Del primer'
-ocal se obtuvo una muestra de 30 facturas, r'esultando un consumo medio de 59 dólares. Del segunclo
-ocal se tomó una muestra de 50 facturas, con Lln consunlo medio de 63 dólares. Las varianzas de los
: onsumos en los clos locales son conocidas e iguales a 60 y 80, respectivamente.

a) Para un nivel de signiflcación de 0.05, r'erifíque si es cierta la sospech.a del duer-ro cle los hoteles;

b) Determine la signifrcación de la pmeba.

Soluctón: Por el enunciado del problema:


¡ Local norte: Tt : 59, o2I:60, nt : 30.
¡ Local sur: 72 :63, o'i: 80, nz : 50.

a) Es urra prueba unilatclal con D6 : Q;

1. Hiqiótesis Nula. Hs; 14: 11,2.

2. Hipótesis Al,tt'tt;,o,ti,ua. H7: [t1 1 [t2.


252 Capítulo 8. Pruebas de HiPótesis

E,stad'íst'ico de, Prueba.


(r1 -22) - Do (59 - 63) - 0
: -2.I1-.
"?
-j+i
'tLI
"3
n2

4. Ile.qió,n de Rechq,zo. Para el nivel clc significaciórt o : 0.05, 1a regirlrr cle rechazo es z,'¡," {
-7.645.
cl loca1 del nortc
Dccisi,ó,n. Corno zobsl (:aceu la rcgión cle rechazo; se concluye qlle cn
e1
5.
conslrmo es menor.

b) Puesto qtLe zobs: -2.17, entonces o(-2.11) :0.0174; es decir', el p-valor <:s 7'74o/c''

de las muestras es suficientemente grande (n¿ > 25) y se desconocen


las
observación. si el tamaño
varianzas, se puede utilizar estas pruebas, sustituyendo o! y o?rpot sus
estimadot"s, sl y
"!'

8.7.2.Caso2:Varianzasd'esconocidas'Supuestasiguales

Se dispone de dos poblaciones y se desea probar si la diferencia


entre stls correspondientes mcdias
poblacionales es igual a D0; es decir' 'FIs: ut- Fz- Ds'
poblacionales son desconocidas'
Disponemos de dos muestras de tamaños nt y n2. Si las varianzas
pero supuestas iguaies; entonces, calcuiamos ei estimad.or ponclerado de o2 mediante

- 7t 'i-,"1'-2'
, (nr- r)r? - - ls|: it'
s-:-
qn2
¡
"
ntln'¿-2
n¡¡,.¿-2

cloncle t? V tZ son las varianz¿rs rnuestrales de las rnuestras 1 y 2.

Corr toclo esto, las pmebas dc hipótesis son las siguientes:

a) Prueba bilateral para la diferencia de dos rnedias'

1. Itipótesis Nula. Hot (ttt- Fz) : Da'


2. Hipótesis Alternati,ua. Ht (pt - tq) I Do'
(i.'-rt\-D¡
3. Estadístico de Pr"u,r:btt" tobs :

4. lieqión, tJe Rechazo. Lnb"


",1 ^* - 2) ol'r,¡r) tu¡2(n1+rLz-2)'
{ -tolz(n. +.n2-

b) Prueba unilateral para la diferencia de dos r1ledias.

1. Hípóteszs Nrila. H¡1: (P1- Fz) : Do'


2" Hipótests Alterrto'tzua- Htt (Pt - t't) > Do (o bicrr f/1: (pt - tt) a Do)'
(i. -Tt\ - Do
3. Estad'ísti'co de Pr"ueba' tobs :
^lr-
"V
tt n2

4. Regió,n d.e Rechazo. tob, ) t,,(rr1 + n'2 - 2) (o bicn tot," { -to(U I nz - 2), cuando
Hr (h - P) < Do)'
8.7. Pruebas para Ia diferencia entre dos medias 253

Observación. EI supuesto que realizamos de igualdad entre las varianzas poblaciones--, debe ser
comprobado mecli¿rnte la prueba cle hipótesis cor'r'espondiente, qr.re Ia explica cn la Sección 8.8.

Ejemplo. Un irrversionista no sabe si invertir en bonos ernitidos por un país A o por un país B.
Para realizar Lrna decisión, seleccionó dos muestras correspondientes a los rendimientos de los bonos
emitidos por los dos paÍses, obteniendo los siguientes resultados:

País A
Rendimiento (%) 12.3 t2.5 r2.B 13.0 13.5
Frecuencia

País B
Rendimiento (7o) U¿ 12.2 72.3 13.0
Flecuencia rn;

A un nivel de significación del 0.01, verificar si el rendimiento de los bonos de los dos países es el
mismo. (Asumir que los rendimientos siguen una distribución normal y tienen igual varianza.)
Solución: Se tiene que
.1, 12.80, s7:0.71, n" : 70,
a-
-
12.35, s? : 0.07, nv : 16.

(n,-l)s2,*(na-t)t? 9 x 0.11+ 15 x 0.07 1


EI estimador de la varianza es s2 :
nt*nu-2 L0+16-2 l2
EI contraste es bilateral:

1. Hzpótests Nttla. Ho: F": Fa.

2. Hipótesis Alternatiua. Ht p,l lla.

3. Estadístico de Prueba. tob" : @-v) 12.80 - 12.35


: 3.87.
0.2887

4. Región de Rechazo. Como to oos(24) : 2.797 , la región crítica es úo¿" > 2.797 o to6" 1 -2.797 .

5. Decis'ión. Como to6" cáe en la región de rechazo) se puede asegurar que los bonos de los dos
países tienen rendimientos diferentes.

Queda como ejercicio para el lector determinar en cuáles bonos se recomienda invertir.

8.7.3. Caso 3: Varianzas desconocidas, supuestas distintas

Sr-rpongamos que se dispone de dos poblaciones y se desea probar si la diferencia entre sus correspon-
lientcs medias pobltr,cionales es igr,ral a r0; es decir, 11¡: h - lrz - Ds. Para ello. admitiremos que
.as poblaciones sorl normales, cuyas varianzas poblacionales sorr desconocidas y distintas.

a) Prueba bilateral para la diferencia de dos medias.

1. Hipótesis Nula. Ho, (tq - Fz) : Do.


254 Capítulo 8. Pruebas de Hipótesis

2. H ip óte si s A It ernat'iu a.

3. Estadístico de Prueba.

4. Región de RecL¿o,zo. tob, 1-trtzG) oto¿,, ) t.lz(g), donde cl nirmero de grados de libcrtad
, ,) ¡,2
/"í,"i\
'
\tt n.r)
se calcula pot g -

Cuando g no es un número natural, se redondea al entero más cercano.

b) Frueba unilateral para la diferencia de dos rnedias.


1. Hipótesi,s NuIa. Ho: (pt - : Do. pz)
2. H'i,pótesi,s Alternatiua. Ht (h- t-r) > lo (o bien f11: (tt, - td a Do)"
Estad,ístico d,e Pr.ueba. tobs : @r -
12) - D0
3. .

l'? , s]

4. Región de Rechazo. tob.,) t"(il


Y^-- < -1.(g), Hr (pt- t") < Da).
@ bien úo6" cuando

Ejemplo. Se desea conocer el efecto delfrío extremo sobre la realización de operacioncs manuales.
Fara ello se eligieron al azar 20 voluntarios, clivididos en dos grupos de 10. Al primer grupo se le
expuso a una temperatura de 4oC, rnientras que al otro se le mantuvo a temperatura ambiente. Se
contabilizó el número de veces que los voluntarios podían abrir y cerrar Ia mano en un lapso de 15
segundos, con los siguientes resultados:
No expuestos al frío 54 tr1
¿, a 40 45 48 46 45
(o 49 50
Expuestos al f,río 32 29 3B 33 34 tt
r)rJ 36 óo 29 o.)
Lt)

Probar Ia hipótesis que el estar expuesto al frío reduce la capacidad de abrir y cerrar la mano en más
de 12 veces.

Soluc'ión: Este es un contraste unilateral donde Do: \2 y


rr : 48.0, s? : 16.89, n,t:70,
rz :32.4, s3: 19.16, nz:10.

1. I{i,pótesis NuLa. H0: [t1 - Fz : 12.

2. Hipótests Alternat'iua. Ht: ttt - Fz> 12.

(rt - "z) - Ds _ (48 - 32.4) - 12


:
3. Estadístico dc Prueba. tobs : 1.8961.
16.89 19.16
10 ' 10
-I_
4. Reqión de Rechazo. El número de grados de libertad es

/ L6.Bg 19.16 \ 2

9:
(ro**) : 17,9 ¡v 18.
8.7. Pruebas para Ia diferencia entre dos rnedias 255

Etrtonces, ¿0.0b(18) :1.734 y la región crítica es úr¡" > I.734.


5. Dec'isió'n. Como Lo6" C'd.e en ia región de rech¿zo del contraste se ¡ruede admitir que el frío reduce
la capacidad dc realizar operaciones manuales.

8.7.4. Caso 4: IJna varianrza conocida y otra varianza desconocida

Supongamos que se dispone de dos poblaciones y la diferencia entre sus medias


se desea probar si
poblacionales es igual a Ds; es decir, f16: L\ - p,z - Ds. Admitiremos que las pobiaciones son
normales y, sin pérdida de generalidad, supondremos que la varianza ol es conocida y que la varianza
o! es desconocida.

a) Prueba bilateral para la diferencia de dos medias.

1. Hipóteszs - t z) : Do.
Nula. Ho: (h
2. H'ipótesis Alternat'iua. Hr (fq - LL) I Do.
(lt - ¡ü - no
3. Estad,ísti,co d,e Prueba. tob, :
l"? , sl
U^--
4. Región de Rechazo. tob" 1-t^tzj) oto6") t,/z(g), donde el número de grados de libertad

nz-l
Cuando g no es un número natural, se redondea al entero más cercano.

b) Prueba unilateral para la diferencia de dos rnedias.

1. Hi.pótesis - Fz) : Do.


Nula. Ho, (l"t
2. Hi,pótesis Alternat'iaa. Ht (h- p) > Do (o bien f11: (t"r- ttz) a Do).
3. Estad,ísti,co d,e Prueba. Lot s :

4. Región de Rech,azo. tob" )


l;*;
¿,(g) (o bien úo¿," < -t"(g),cuando Hr (h - p) < Do).

8.7.5. Caso 5: Diferencia por parejas

Las pruebas para las diferericias de las medias, realizadas anteriormente, se aplican cuando las dos
muestras son independientes, pero existen casos en los que Ia información recogida no es independiente
(como cuando se Ia toma de un mismo individuo de manera repetida) .

Sea (r1,y1), (rz,Az),..., (rn,an) una muestra aleatoria de pares de observaciones; donde (r¿,y¿)
representa dos mediciones tomadas de la misma unidad muestral, antes y después de un tratamiento
o fenómeno que Ia afectó. Se desea conocer si Ia población cambió de manera apreciable después
del fenómeno indicado; para ello se emplea la prueba de diferencias por parejas de la manera que a
continuación se describe.
256 Capítulo 8. Pruebas de Hipótesis

Se construye una muestra aleatoria de las diferencias dt, d2, .. ., dn, donde d¿: r¿-Ai (i :1,2,. .. ,n),
que las supondremos siguen una ley normal de media p,,1 y varianza o2(1. Para estos parámetros
poblacionales se calculan sus estimadores:

lft1lL
,I: ! r¿, y s7.: -- . r(¿n - ¿)r.
i.:1 i.:1

Prueba bilateral para la diferencia por parejas.

1. Hipótesis NuIa. Ho: Fa - Ds.

2. Hipótesis Alternatiua. HI F¿* Do.

3. Estad.ístico d,e Pru,eba. Lob, : !-,D:


sd/ \/n
4. Región de Rechazo. tob" I -to/z(n - 1) o tob" ) t-¡2(n - L).

Observación. También, se pueden realizar los contrastes unilaterales considerando las hipótesis alter-
nativas F¿ 1 Do o F¿ ) Dg; para cada caso se escogerá, de Ia manera antes indicada, la correspondiente
región de rechazo. Se recomienda que el lector formule tales pruebas.

Ejemplo. En una investigación clínica se realizaron mediciones de la frecuencia cardiaca a 9 indivi-


duos antes y después de que ellos se hubieran sometido a un programa de entrenamiento físico. Los
resultados son los siguientes:

Antes (r¿) 81 85 82 82 90 83 It) 93 92


Después (g¿) 76 77 87 79 90 89 t6 75 89

Para un nivel de significación de 0.05, establecer si el acondicionamiento físico varió de manera signi-
ficativa la frecuencia cardiaca, suponiendo una distribución normal de las diferencias.

Solución: El promedio y Ia desviación estándar de las diferencias son:

A:2: :3.22,
r_l
sa,:8.2r.

Ademiís, Do : 0 y la prueba bilateral queda como sigue:

1 Hipótesis Nula. Hs: p,¿: Q.

2. Hipótesi,s Alternatiua. H¡ p,¿10.

3 Estad.ísttco de PnL,eba. tobs:


-4-= : ^!=',2 :1.177.
sdl{n 8.2I1\/9
= =
4. Región d,e Rechazo. Como ¿o.ozs(B) : 2.306, entonces Ia región es úo¿," > 2.306 o to¡r" 1-2.306.

5. Deci,sión. Como to6" r1o está en la región crÍtica, no se rechaza Hg; es decir, no hay por qué
considerar que hubo una variación apreciable en la frecuencia cardiaca.
8.8. Pruebas de hipótesis para la razón entre dos varianzas 257

8.8. Pruebas de hipótesis para Ia razón entre dos varianzas

Supongamos cllre se desea probar la igualclad de las varianzas dc dos poblaciones normalmente dis-
tlibuidas, de las que se han extraído dos muestras independientes; es decir, se desea probar Hg: ol : 6/.
Las pruebas de hipótesis son las siguientes:

a) Prueba bilateral para la razón entre dos varianzas.


1. Hipótesi,s NuIo,. Hs: ol: 6f.
2. Hlpótesi,s Alternatiua. H¡ ol I of.
o2
3. Estadístico de Prueba. Fobs: l,si donde sf es Ia mayor varianza muestral.

4. Región de Recltazo. Fob" ) Fo¡2(n1- I,n2 - L).

b) Prueba unilateral para la razón entre dos varianzas.


1. Hipótesis Nula. Hs: ol: 61.
2. Hipótesis Alternatiua. H¡ ol > o?r.
a?
3. Estadístico de Prueba. Fobs : ], donde sf es la mayor varianza muestral.
si
4. Regi,ón de Rechazo. Fobs ) Fu(rt - l,n2 - I)
Ejemplo (Continuación). IJn inversionista no sabe si invertir en bonos emitidos por un país A o
por un país B. Para realizar una decisión, seleccionó dos mLrestras, correspondientes a los rendimientos
de los bonos emitidos por ios dos países, obtenierrdo nnas varianzas rnuestrales iguales a sl:9.11
y sí:0.07. A un nivel de significaciórr del 0.05, verificar si las varianzas poblacionales cle los
lendimientos de los bonos de los dos países son iguales.

Solución: La prueba es bilaterai:

1. Hi,pótesis Nula. Hs: o'2, : 62.

2. Hipótesis Altentatzua. H¡ ol I ol.

3. Estad,ístico d,e Prueba. Fobs:g : : I.57I.


Sí H
4. Regi,ón de Recl¿azc¡. Según el nivel de significaciól 0.05, y los grados dc libertad TLy-I : 10- 1 : 9
y nz- 1:16 - 1- 15, cl punto crítico es F¡625(9, 15) :3.12 y define Ia región Fo¡r")3.I2.

5. Deciszón. Prtesto que 1.571 < 3.12, no se debe rcchazar la hipótesis de la igualdad cle las
variarrzas. Entonces, fite correcto ¿rsumir que las varianzas elan igrrales, cuando realizamos la
prueba sobre la igualdad de las me<lias.

3.9. . Pruebas de hipótesis para la diferencia entre dos proporciones

:--ipongamos qnc se han scleccionado dos muestras, de rnanera aleatolia e irrdependiente, de dos pobla-
.-rnes binorniales, cr.tyos tantarios, llr y'r¿2 sorr sufi.cierrtemente altos palir que las distribuciones rnucs-
-:ales de Ft y fz sealt aproxirnadanrente norrnales. Se desea probal si I¿r difclencia de las proporciones
:'nestrales es igual a un valor D6. Se deben tomar en cuenta dos casos: cr-r¿ndo Do : 0 (igualdad de
-is proporciones) y cuando Do 10.
258 Capítulo 8. Pruebas de llipótesis

8.9.1. Prueba para pr - pz cuando Do : 0

Etr pt'irner l.ga'se estirnan las proporciones p1 y p2,'a,partir


de ras rn.estras, por p1 v f2, re:spectir,,a-
mente, luego sc calcula el estimad,or ponde,ado de ta proporctón
p por
:: --nt/t
l):
-f nzfz
n1tn2

Prueba bilateral para la diferencia entre dos proporciones.

1. Hipótesis NuIa. Hot (pt


- pz) :0, es clecir Ho, pt: p2: p.
2. Hipótesis Alternatiua. Ht (pt - pü 10.
3. Estadístico de Pr-ueba. : pL-p2
zo6"

io(!
\nr
.;)
4. Reqión de Rechazo. Zobs { -zo/z o 2o6" } zo¡2.

Observación' Tarnbién, se pueden realizar las pruebas unilaterales para probar


que 'Fl1: pr <p2, camlliando las regiones de rechazo según
que 11r: pt ) pz o
cacla caso partic.,lar.
Ejemplo' El dueño de un supermercaclo cree que el porcentaje de cheques
pr.otestados, con que
los clientes han pagado stts cueutas, ha aumentad.o con respecto
ar año anterior. En una rn'estra
corlesporrdiente al primer trimestre del año pasado, encontró
b cheques protestados de B0 cheques
admitidos; con otra muestra cle 68 cheques, correspondientes
al primer trimestre del presente año, el
nútmero dc cheques prote'stados fue de 6. Con estos c-latos,
¿hay evidencia suficiente que indique urr
rnclemento en el porcenta.je de cheques protestados?

SoLuci'ór¿: Sean p1 y p2 las proporciones de cheqlres protestados


en el pr.imer trimestre del año anter.ior
y del presente. Estimemos las proporciones muestrales:

Pt:go :
5
0.0625, Fz:
6
: 0.0882,
6B

5+6
0: 80+68 :0.0743.

Ya que se desea determinar si existe un aumento en Ia proporción,


la hipótesis alternativa es H¡ p2 _
pr) 0, y la prueba es la siguiente:

l. Hipótesis Nula. Hs:'p1 - pr.


2. Hipótesr,s Al,tern,at,iua. Ht p1 1p2.
3. Estadístico de Pr-ueba. : Pt-Pz 0.0625 - 0.0882
Zobs
: -0.594.
a(! +1)
0 '\rrt
71..> J
(00743)(0 s25T\(!*a\
'\80 C'8)
4. Regió,n de Recltazo. Tomemos a : 0.0b; erltonces, ia región es zobs < _1.64b.
5' Decisión' Como -0'594 >
-1.645' no se puede rechazar la hipótesis nula; o sea) no hay evidencia
que indique un aumento en el tú'mero cle cheques protestacios,
con respecto al año anterior..
U

8.9. Pruebas para la diferencia entre dos proporciones 259

8.9.2. Prueba para pr - pz cuando Do l0


En el caso en qlle se desec probar que las dos ploporciorres sorr distintas y qlre su cliferencia es igual a
un valor dado, D6, se tiene la siguiente prueba:

Prueba bilateral para la diferencia entre dos proporciones.

1. Hipótesrs Nula. Hot (pt - pz) : Do.


2 Hi,pótesis Alternatiua. Ht (pt - pz) I Do.

3. Estadísti,co de Prueba. zobs : (Fr-Fz)-Do

4. Regi,ón de Rechazo. Zobs 1 -zolz o zobs > zol2.

Observación. También, se pueden realizar las pruebas unilaterales para probar que I11 : (pt-pz) > Do
f11 : (pt - pz) < Do, cambiando las regiones de rechazo según cada caso particular.
o qtre

Ejemplo. En el deporte del balonmano) en un partido está permitido sustituir al portero solo
para que detenega los tiros penalties. El entrenador de un equipo, al definir su estrategia para un
partido, examina las estadÍsticas individuales de los porteros titular y suplente. En una muestra de
los registros cle los entrenamientos del último mes, el titular ha detenido 128 de 510 penalties y el
suplente ha detenido 183 cle 480 tiros. El cntrenador decidirá sustituir al portero titular, el momento
de parar un penalti, si el suplente ha detenido al menos un 10 Va :más de tiros que el titular. A un
nivel de significación del 5 7o, ¿qré decisión tomará el entrenador?

Solu,ción: Calculemos las proporciones correspondientes a cada uno de los porteros:

128 183
'Pl : =-:=:0.2ó1, T)t:- :0.381.
510 480

Se realizará la prueba unilateral con D6 : 0.1.

Hipótesis Nula. Ho, pz - pr : 0.1.

Hipótesis Alternat'iua. Ht: pz - pr > 0.1.

3. Estadístico de Pruteba. Zctbs : (fz-fr)-D,, (0.381 -0.251) -0.1 :1.023.


0.25I x 0.749 0.381 x 0.619

1. Regi,ón de Recha,zo. AI nivel de significación 0 05, la región de rechazo es zobs > 1.645.

5. Decisiór¿. Conio zobs:1.023, no cae en 1a legión de lechazo, no hay razón para pensa. que la
diferencia es mayor qr-re 0.1; entonces, e1 cntrcnador no debelía decidirse a sustituir al portero
titular.

in el Cuadro 8.2 se presenta Lrn resumen de las pruebas de hipótesis con dos muestras.
260 Capítttlo 8. Pruebas de Hipótesis

Hip<itcsis FI ipótr:s is Estaclístic<r Rcgión cle


Polrlar:ión
nrLla (/^I¡) altcnratir.a (,lr/r ) clc pnielra rec:h ir.zo

lrr thz: Do ¡t,.,-¡t,rfDct .- ¿ -¡/2


C c¡er'¿l.l cc¡l
r'¿Lr i¿tr zas igLrales
¡t,r- ¡t,,, l Dct ¡t., - ¡r,r) Do
l1t ltz ) D¡t lrt tt,¿ I Do z< 2,,

(t:r -rz) - Do
Normal lrt : Do
[L'¿ ¡r'r- Prf Do Itl > t.i't
anzas desconocidas
v¿rri trtt -¡ttIDo ¡t, - ¡t,2 ) D¡¡ t) t.,,

srrpuestas iguales llt - F'¿) Do Irt Fz { Do "ffi!n"


n7+fr2 2 sl t< ¿^

\it-rz)-Do
Norrnal Ft Fz: Do ut-t-LtlDo Itl > t,,¡z
varianzas desconocidas 11't-Fz{Do t1,,,-Fz)Do tlto
supuestas clistintas LIt - Fz) Do ¡r.r-¡t"{D6
Normal Fn: F,o,, H o I trtn,, D-u^ Itl > t.t"
observaciones llo I Ho,, l-Lo) 11n,, sdlJn t>t-
empareiadas ILn ) Fo,, lto { 11o,, n-1g1, t<-t^
o I :o 2 oíloó
2, F:5st F ) F,/z
No¡ma1 o 21 1o 2
2 01)02 2
F>T-.
o 1 )o 2
2 < ur:nr-I,u2-n2-I F I Ft-o
"? "',

P7:P2 pt I p'z ^^/ r 1


pql-+-
t,\- 2 ¿o/2
l¿
Binomial PtlPz Pr>P2 \nr n2 Z}Za
PtlPz Pt 1Pz uit I n¿iz
u*nz
Binomial Pt-Pz:Do Pt-PzlDo ¿ 2 .^/2

(Do + o) Pr PzlDo Pt-Pz>. Do


Pr-Pz:- Ds Pt-Pz{Do Prqr 'P2q2

Cuadro 8.2: Pmelras cle hipótesis con dos muestras

8.10. Ejercicios
Pruebas sobre la diferencia de dos medias (varianzas conocidas)

1. Dos máquinas envasan cereal en ca.ias. De la prirnera rnáquina se obtu\¡o una muestra dc 30
cajas) resrlltando un peso promedio de 130 g y de la segunda máquina se tomó Lrna muestla
de 50 cajas) con un peso promedio cle 125 g. Las varianz¿rs de los pcsos envasados por las dos
rláqlrinas son conoci(las e igr-raIes a 60 y 80, respectivamentc. Para un nivel clc significaciórr rle
0.C5, velifiqlle si laij clos máquinas er]\¡asan iguales canticl¿irlcs de ccreal.

2 En del Minist,erio de S¿rhLcl se rniclié el conterriclo clc nicotirra c-le clc¡s rnarc¿rs
un¿r iuv<:s1,igaciórr
de cigallillo. Err un experinlentocorr 50 cigarrilkrs de la priruer'¿ nralc¿r se elrr:ontrci que tielre
un corrtenido promeclio de 2.47 nlg corr clesviación estárrclar de 0.12 rng; mierf,ras quc p¿1ra 40
cigarrillos de lzr segurrda m¿rrca el crorrterriclo 1)rorncdio fuc <le 2.39 mg colr clesvii.rción est¿inclar rle
0.14 mg. Prr.rcbe la hipótesis rlula //,1 - I,L2 - 0.12 contr¿1 la ¿tlte¡ttatiya /¿r - l,¿ 10.12, tisa¡rlo
cv : 0.05.

En un¿t ciuclarl operan 2 elrpresas dc telerfoní¿r cclular: Flirius y Qualli. Por los registros ltrs
c[]ples¿rs sal)cn que cl gasto inenslr¿11 de slrs ¿borr¿rdos ticrren clcsrriaciorrcs cst¿ilrclar'<lc 6.5 y 5
clólares, iespectivamerlte. Parrr conrpalal ol gasto nreclio dc los c:lientes cle las <los enrplesas, se
tomó una rnuestra) aI azar, de 34 clierrtes dc Sirius y otra ullrestr¿r de 41 clientes de Quark. Los
corresl)ondientes conslrmos mensuales fueron 35 v 38.5 dólares.
8.70. Ejercicios 26r

a) ¿Proporcionan estos datos evidencia estadística, al nivel 0.04, a favor de la hipótesis de que
el gasto de los clientes de Sirir-rs es menor que es gasto dc los clicntes de Quark?;
b) Halle el p-valor de la prueba.

4 Los ingresos del primer ernpleo de los ingenieros informáticos, egresados de cualquier universidad,
siguen una distribuciól normal con desviación estándar de 3800 dólares. Se tomó una muestra
aleatoria de 15 ingenieros procedentes de la Universidad Nacional, resu.ltando que en su plimer
empleo los ingresos medios anuales fueron de 12000 dólares. Otra muestra independiente de
12 ingenieros de Ia Universidad Técnica dio como resultado unos ingresos medios en el primcr
empleo de 13 200 dólares. Se pide, con un nivel de significación dei 2'/o, probar Ia hipótesis dc
que las medias son iguales frente a la alternativa de que la media de la Universidad Nacional es
menor que Ia de la Universidad Técnica.

5. Una cooperativa agrícola produce cierto atroz con fertilizante natural y con abono químico. En
las parcelas donde se emplea fertilizante natural se obtienen plantas cuya altura tiene varianza
de 47 cm2. En los terrenos donde se usa abono químico la altura de las plantas tiene un varianza
igual a 39cm2. Para comprobar las medias se toma aleatoriamente una muestra de 65 plantas,
31 correspondientes al primer tipo de tierras y 34 al segundo; obteniéndose en las muestras 92
cm y 86 cm de alturas medias, respectivamente. Para un nivel de significación del 6 %, contraste
Ia hipótesis de que los fertilizantes son igualmente eficaces, frente a Ia hipótesis alternativa de
que es más eficaz el natural.

Se quiere comparar el rendimiento académico en matemática de los alumnos de último año de


dos colegios; A y B. Elegidas dos muestras aleatorias de cada una de estos colegios (30 alumnos
de A y 36 de B), se obtuvieron los siguientes resultados en cuanto a la calificación obtenida en
dicha asignatura:
Prornedio Varianza
Colegio A 138 , 1.1
Colegio B t4.3 16

Basándose en estos resultados, verifique la hipótesis de igualdad de rendimientos académicos de


ambos colegios, con un nivel de significación del 3 %.

En un proceso químico para producir oxígeno (O2) se emplea un catalizador. Durante treinta
días se midió Ia cantidad promedio de oxígeno producido luego de haber colocado el catalizador
y cuatro horas después, resultando que, en el primer caso se producÍan 1000 litros de 02 en una
hora, con una desviación estándar de 90 litros y en el segundo caso se producían 880 litros de Oz
con una desviación estándar de 140 litros. ¿Existe evidencia que indique que el catalizador se
degrada, produciendo una merma de al menos 100 litros de 02, cuando han transcurrido cuatro
horas?

Se efectuó un análisis sobre la duración de las máquinas computadoras que se utilizan en las
empresas púrblicas. Se eligieron dos muestras de computadoras, de marca y de clones, cada una
constituida por 80 máquinas. Para las de marca, resultó una vida promedio de 4.8 años y una
desviación estándar de 1.7 años. Para las clones, dio una vida promedio de 3.3 años y desviación
estándar de 1.2 airos. ¿Puede considerarse que la vida media de las computadoras de marca es
superior en al menos un año a las que son clones?

La FIFA realizó un cambio en la forma de puntuación en los partidos de fútbol ganados: se otorgá
tres puntos al equipo ganador, en lugar de los dos puntos usuales. Para examinar la efectividad
de la nueva norma) se examinó los resultados de los partidos jugados en 1995 y 1996 (año en
el que entró en vigencia la nueva norma) . En 45 partidos examinados, jugados el año 1995, se
encontró un promedio de 2.87 goles por partido y una desviación estándar de 0.21; en los 38
partidos examinados de 1996, se halló que se habÍan ploducido un promedio de 3.05 goles con
Capítula E. .Fruebas de Í{ipótesis

dcsviacirjn estáridal cle 0.18. ¿Fuede decirse c¡-re irr rrlreva rrolrrra pelrniti<i ¿unlr:n1,ar t:l prornoclic-r
cl: goles por partido'/
10 Una persona desea comprar un automór'il nr-revo y toma conro factor de decisión el consumo meclio
de cornbustible que tienen dos nlodelos de calacterísticas similarcs, uno fabricraclo en Europa v
otro en Corea. Consulta una rerrista especiahzada y encuentra qr.rc e1 auto eulopeo tiene nn
recorrido prornedio de 28.3 krn por gaión de cornbustible. con nna desr¡iación estándar de 6.2
km; para el auto coreano encucntra qr-re el rccorrido es dc 26.7 krn por ga1óll una desviacicirr
"v
estándar de 5.1 km; además, la revista indica que los datos estadísticos fuerorr tomados a partir
de las mediciones realizadas en 50 autos de cada oligen. ¿Cuátr de los dos aritos cieber'¿i cornl-iral?
o ¿deberá tornar en consideración otras calacterísticas, distintas clel renclirniento del combustible.
para tomar su decisión'/
Fruebas sobre la diferencia de dos rnedias (varianzas desconocidas)
11. Se realizaron pruebas para conocer la cantidad de plomo en la sangre de personas expucstas a
la contaminación en ia ciudad. Se tomaron muestras aleatorias de 24 niños y 18 adultos que
dieron los siguientes resultados (en ppm):
Adultos Niños
rt : 0.043, rz:0.028,
sr : 0.018, sz : 0.007.

Asumiendo que las varianzas poblacionales son iguales, pruebe la hipótesis de que no hay dife-
rencia entre el contenido medio de plomo en la sangre de los niños y de Ios adultos, contra ia
hipótesis de que los adultos tienen mayor cantidad que los niños.

12. En un estudio sobre un nuevo programa piloto para el aprendizaje a distancia mediante com-
putadora, se eligieron al azar,21 estudiantes de una clase para seguir el nuevo prograna (grupo
piloto) mientras que los 23 restantes seguían el método tradicional (grupo control). Finalizado
el curso, se realizó un examen obteniéndose los siguientes resultados:
Grupo piloto Grupo control
Nota promedio 51.48 47.52
Desv. estándar 11.01 14.15

Suponiendo igualdad de varianzas, contraste si hay evidencia (a nivel del 5 %) de que el nuevo
método piloto da mejores resultados que el método tradicional.

13. En el Departamento de Genética de una universidad se realizó un estudio donde se contó el


número de surcos en las huellas dactilares de dos grupos de voluntarios: uno de aborígenes
amazónicos y otro de estudiantes mestizos de Ia universidad. Los promedios y la desviación
estándar del total de surcos contados se dan a continuación:
aborígenes: : 17, r :
TL" 125.9, s2, : (SO.ZO)2,
mestizos: ny L7, A :
: 754.3, sl : QS.OI)2 .

Pruebe la hipótesis de que no existe diferencia entre el total de surcos) contra una tripótesis
adecuada a los datos, asumiendo igualdad en las varianzas.

74. Se probaron 2 medicamentos A y B para la eliminación de los hongos en la piel. En pruebas de


laboratorio se tomaron muestras de Ia cantidad de medicamento requerido para la eliminación
de un mismo tipo de hongo, obteniendo los siguientes resultados:
Medicamento A Medicamento B
Tamaño 13 15
Promedio (g) 4.5 3.1
Desv. estándar (g) 1.8 I.7
8.70. Ejercicios 263

tr) Pruebe Ia hipótesis de que los dos medicarnentos tienen igual efecto, contla la hipótesis de
que el mec.licamento B es rnás efectivo. ¿Qué conclusión saca?;
b) Encuentre el nivel de significación a¡rroximado de la prueba.
15 Dos empresas competidoras (S y T) que venden implementos deportivos han puesto en marcha)
casi simultárreamente, páginas de internet para la venta electrónica. Se eligieron, al azar) ocho
clientes que visitaron la página S y, de manera independiente, otros ocho que visitaron la T y sc
midió el tiempo (en minutos) de la duración de ia visita de cada cliente. Los resnitados fueron
los siguientes:
Pág naS oa c).tr tJ 42 3.2 44 21 16 d"t) É .)

Páe naT 1t
IJ z-,1 44 2B ri.5 3.6 /t

¿Proporcionan estos datos suficiente evidencia (al nivel 0.05) para afirmar que los tiempos medios
de duración de las visitas en ambas páginas son diferentes?

16. Para los tres primeros meses del año, 15 vendedores de la Costa tuvieron ventas semanales
promedio de 300 dólares con una desviación estándar de 50 dólares; en tanto, 10 vendedores de
ia Sierra tuvieron ventas semanales promedio de 260 dólares, con una desviación estándar de 16
dólares. Si consideramos que las desviaciones estándar de las ventas son diferentes, determine
si los vendedores de la Costa tienen mayores ventas semanales.

t7. Se compararon los tiempos (en segundos) que realizan atletas escolares, masculinos y femeninos,
al recorrer una distancia de 500 metros. Para el efecto, se registraron las marcas de 9 niños y 7
niñas, obteniendo lo siguiente:
Niños 187 223 235 r92 259 775 206 t94 247
Niñas 248 366 223 326 274 369 301

Determine si la diferencia en el tiempo medio entre hombres y mujeres es mayor que un minuto.
Use rr : I0'7a.

18. Se sospecha que Ia concentración media de dióxido de carbono es mayor en la capa de aire más
próxima a la superficie. Para contrastar esta hipótesis se analizó el aire en 20 puntos elegidos
aleatoriamente a un metro de altura del suelo, resultando una media muestral de 580 p.p.m.v.
(partes por millón en volumen) y una desviación estándar de 60. También, se realizaron 16
mediciones de la concentración, a una altura de 18 metros, resultando una concentración de 365
p.p.m.v. y una desviación estándar de 110. Suponiendo norrnalidad para las mediciones y que
Ias varianzas son diferentes, ¿proporcionan estos datos sufi,ciente evidencia, al nivel 0.01, a favor
de la hipótesis de que la concentración es mayor cerca del suelo?
Pruebas sobre Ia diferencia por parejas
19 Se hizo un estudio para comparar los tiempos de acceso, en diferentes momentos del día, a
internet desde computadoras domésticas con módem. Para ello, se cargaron 8 páginas web por
la tarde en el periodo de 14 a 15 h. y, con Ia misma máquina, Ias mismas 8 páginas por Ia noche
en el periodo de 22 a 23 h. Los respectivos tiempos de acceso en minutos fueron:

De14a15h 2.3 1.5 1.0 2.7 T4 1.9 0.8 1.1


De22a23h 2.9 r.4 t.2 3.4 1.3 2.5 1.6 1.8

¿Se puede concluir, al nivel 0.01, que el acceso es más lento en el horario nocturno?
20. Para poner a prueba un nuevo método de estudio, se seleccionó a 10 sujetos que fueron sometidos
a una prueba antes y después de entrenarse con el nuevo método. Las calificaciones fueron:

Antes 19 T4 23 25 18 24 17 19 20 11
Después 20 15 26 24 t7 26 18 22 26 11
264 Capítulo 8. Pruebas de Hipótesis

A un nivel clc significación dei 5'%, ¿,se prrecle decir <¡re el nrtevo método es efcctivo'?

2L Urr glnpo dc invcstigaclores afirma haber dcscrrbiclto un ti1.ro clc alirncnt,ación pzua las gallinas,
ba.jo la cual éstas prodricen hnervos que rlo aumcnl,¿rrr cl c;olcsterol en L¿i,s personas que los q)n-
slrrten. Parzr cornprobal dicha teoría, sc seleccionaron al azar 36 personas a las <,¡rte se les rniclié
su nivel de colesterol habitual (z¿ ) . Desprrós sometcr' ¿r estas rnismas pcrsolas a ulla dieta ¿r base
de los huevos en estudio, se miclió cn ellas cle nu.cvo dicho nivcl (y¿). Los resultaclos fiterort:

l Ji -., :
I =2a3. s -200, ;t1\ 4) . (d,-d)- ls6
r.- 1

Suponiendo normalidad en la variable, contraste la hipótesis de que los huevos modifican el


colesterol, a un nivel de significación del 1%

22. Se quiere comparar dos métodos rápidos para estimar la carga eléctrica en Ltn circuito. En
un laboratorio se midieron B circuitos, mediante los dos métodos, obteniendo los siguientes
resr-rltados:

Circuito 1 2 3 4 r
d 6 7 B

Método A 10.7 t7.2 i5.3 14.9 13.9 15.0 15.6 L5.7


Método B 11.1 TI.4 15.0 1 l-r. 1 t4.3 15.4 r5.4 16.0

Contraste si los dos métodos proporcionan, en media, las mismas estimaciones.


OD
L¿ En el artÍculo <p-trndorphin: A Factor in'Fun Ruu'Collapse>> (British Medical Journal (1987),
294, 1002), se reportan las siguicutes mediciones de Ia concentración en la sangre <le p-enclorfina,
err picornoles por litro, realizadas a 11 corredores antes y clcspués de haber participado en una
media maratón:
Corredor 1 t r)
J 4 5 6 7 8 I 10 11
Antes de
la carrera
,4D
+rJ 46 ¿:
É r_) tro
¿L n6 72 B4 90 r0.4 14.0 17.8
Después de
29.6 25.r 15.5 29.6 24.1 37.8 20.2 2r.9 14.2 34.6 46.2
la carrera

Si se sospccha que luego de realizar un esfuerzo prolongaclo, la concentr.ación de la horrlona se


eleva en 25 picomoles. Veriflque) a Lrn nivel de significación del 5 %, si se curnpie ia hipótcsis.
Pruebas sobre la razón de dos varianzas
24. Sc selecciorLar"on dos muestras ¿rle¿itoi'ias 1r-ovenieritcs cle poblaciones normales:

Población Tamaño de la mucstra Varianza muestral


X 16 56.7
Y 20 30.5

- a) ¿Ha¡, suficiente evic,lcncia l)¿r.ra pertri¿)r q,re al. : o?.?, ¿-r q¡ nirrcl cle significaciórr cle 0 05;
lr) Encucntre el rtivcl dc siguificación dc la plr,rebtr, c inter'lrrete el lcsultaclo.

25. Un¿r fábrica cle refrcsctos tiene clos máquirrirs enrbotcll¿rclor¿rs qrre eDvasan el líqr-rid<; err las botcllas.
Los expencledores h¿rtt irrfor-ni¿rdo ¿rl fabtic¡rrrte quc lrr.s botell¿rs ltrcsentirl clemasi¿rcl¿r yali¿-Lltiliclad
eu la cantidacl de líquido que cortlienert. llala exanrinar la que.ja se nidiri la var.i¿r¡za clel vr¡l¡meir
clc 1íquido crnbotellado ltol cacla ttna de las maic¡.rirras, resrrltanclo qrre con rrn¿r r¡qcstra c1e 18
botellas cle la máquirta 1, se obtrtvo una varianza clc 700 y ciou una mucstla de 15 botellas clc l¿r
rrtáquirra 2, se obtuvo ttna vali¿nza de 210. ¿L¿1 v¿uial)ilidad err los volirmenes crrvasaclos
ser atribuida a una o a las dos r,ráquinas? Utilice a : 0.05. 'r-rcclc
8.70. Ejercicios 265

26. Dos estaciones rneteorológicas predicen Ia temperatura a medio día en la ciudad con seis horas de
anticipación. Se tornaron dos muestras independientes de los datos de cacla estación, resultando:

Estación 1 n1 : $, rt :21.2, sl : 1.68,


Estación 2 n2:19, Tz:19.2, sl :0.81.

a) Verifique si las varianzas de las temperaturas pronosticadas son distintas. (Tome c:0.1);
b) Empleando el resultado anterior, pruebe si las dos estaciones pronostican iguales tempera-
turas, a un nivel de significación de 0.1.

27. Se van a probar dos medicamentos A y B contra una enfermedad. Para ésto se trataron 21
ratones enfermos con A y otros 21 con B. EI número medio de horas que sobreviven con A es
1200 y el número medio con B es L225. Suponiendo normalidad en ambos casos:

a) Se puede aceptar igualdad de varianzas si se sabe que D@o - ,)" :9800 y D(An - y)' :
3500? (Tomeo:0.05);
b) ¿Es más efectivo el medicamento B? Plantee el contraste adecuado para estudiar esto con
un nivel de significación del 5 %.

18. Una compañía petrolera está considerando Ia posibilidad de introducir un aditivo en su gasolina,
esperando incrementar el kilometraje medio por litro. Los ingenieros del gupo de investigación
probaron 10 autos con la gasolina habitual y otros 10 autos con la gasolina con el aditivo. trl
resumen de los resultados es:

Kilometraje sin aditivo: tr: 14.2, s" :3.24,


Kilornetraje con aditivo: a: 15.4, ss : 5.56.

a) ¿Es razonable suponer que las varianzas son iguales? Use a : 0.1;
b) ¿La introducción del aditivo incrementa el kilometraje medio por litro?

Pruebas sobre la diferencia de dos proporciones


En una investigación en Guayaqull,264 de 1140 mujeres y 274 de 1200 hombres respondieron
que ellos no ingieren alcohol. Realice la prueba de hipótesis apropiada para asegurar si los datos
muestrales proveen evidencia para afirmar que las mujeres guayaquileñas se abstienen de tomar
alcohol en una proporción mayor que los hombres guayaquileños. En Ia resolución:

a) Especifique las hipótesis nula y alternativa, a la vez err símbolos y en palabras;


b) Calcule el estadístico de prueba;
c) Compare con el valor de 1a tabla y saque su conclusión.

ll. IJn economista del Instituto Nacional de Censos desea conocer si las tasas de desocupación
urbanas son iguales en las dos principales ciudades del país. Con base en sendas muestras de
500 personas en cada ttna de las ciudades, el economista encontró 46 personas desocupadas en
una ciudad y 35 en la otra. A un nivel de significación del 3 %, ¿puede snponerse que las tasas
de desempleo en las dos ciudades son diferentes?

,1. De una muestra de 300 televidentes escogidos al azar, que tenían sus televisores encendidos en la
hora del noticiero, 50 indicaron que tenían sintonizado el canal 4y 70 que sintonizatotr el canal
8.

a) ¿Puede afirmarse que los dos canales tienen igual nivel de sintonía a Ia hora del noticiero?
(Utilice un a:2To);
266 Capítulo 8. Pruebas de Hipótesis

b) Halle el nivcl de significación de la prueba.

.Jo
¿L Dos ernpresas encrrestadoras realizan investigaciones para determinar el porcenta.je dc pcrsonas
que votarán a favor de una pregunta en Lrn plebiscito. La primera cnrplesa etrtrevistó a 1000
pelsonas de las cuales 367 contestaron afirrnativamente. La segunda empresa entrevistó a 300
personas y obtuvo 121 r'espuestas afirmativas.

a) Puede considerarse que las dos empresas entregan resultados similares respecto del núrmero
de electores que votarán SI a la pregunta. Utilice a : 0.05;
b) Encuentre el nivel de significación de Ia prueba.

.).) Se seleccionó,al azar,500 usuarios de correo electrónico que trabajan en empresas públicas ¡-
resultó que 32 de ellos habían recibido virus informáticos a través del correo en eI último año.
Se realizóotro muestreo independiente eligiendo, al azar, 300 usuarios que trabajan en empresas
privadas, resultando que 9 de ellos habÍan tenido este mismo problema.

a) ¿Proporcionan estos datos sufi.ciente evidencia estadÍstica, al nivel 0.04, a favor de la hipóte-
sis de que la incidencia de los virus es mayor en las empresas públicas?;
b) El p-valor del contraste, ¿es mayor o menor que 0.01?

34. Un estudio indicaba que las hijas de madres fumadoras durante el embarazo tienen mayor proba-
bilidad de ser ellas mismas fumadoras. El estudio se Ilevó a cabo con niñas, preguntándo si ellas
habían fumado el último año y a la vez se consultó a las madres si ellas había fumado cuando
estaban embarazadas. Solo el 4% de las hijas, de 200 madres que no fumaron cuando estaban
embarazadas, habían fumado el último año, comparado con el26% de las hijas, de 500 madres
que habían fumado, también lo habían hecho. En la investigación se propone que el hecho que
una madre haya fumado en estado de embarazo, aumenta Ia proporción de hijas fumadoras en
w 20To.

a) ¿Qué hipótesis necesita usted para determinar si Ia diferencia indicada es estadísticamente


significativa?;
b) Realice una prueba de hipótesis para establecer si la propuesta de la investigación sobre el
incremento en Ia proporción es plausible;
c) ¿Establece el estudio que si una madre embarazada fuma, hay una mayor tendencia a fumar
por parte de las hijas? Explique.

35. Se desea comparar Ia proporción de viviendas con servicio de alcantarillado en las áreas urbana
y rural de Pastaza. Se hizo un muestreo en las dos áreas con los siguientes resultados:

Zona rural: De 500 viviendas elegidas al azar,230 disponÍan de alcantarillado.


Zona urbana: De 1000 viviendas elegidas al azar,680 disponían de alcantarillado.

¿Hay suficiente evidencia para concluir, con un nivel de significación del 3 %, que en Pastaza,
la proporción de viviendas con alcantarillado en la zona urbana excede en más del 15 %o a la
proporción de viviendas con alcantarillado en la zona rural?

36. Para estudiar el efecto de una nueva terapia sobre el cáncer de seno se tomaron dos muestras,
una de 300 pacientes que no recibieron Ia terapia y otra de 200 que si lo hicieron. De Ias que
no recibieron, L7L pacientes murieron y de las que si recibieron, 66 murieron. Un tratamiento
se considera efectivo si rebaja en más del 18 % el porcentaje de los pacientes fallecidos. A un
nivel de significación de 0.05, ¿es efectivo el nuevo tratamiento?
Capítulo I
Pruebas de Hipótesis No Paramétricas

KISS Keep It Simple, but Scientific


Emanuel Parzen

En las pruebas de hipótesis que utilizan Ias distribuciones normal, t o F, se supone que la ley de
probabilidad de la población de la cual se extrae la muestra tiene determinada forma y que sus
parámetros verifican ciertas condiciones de manera que el estadístico muestral correspondiente tiene
una distribución de probabilidad conocida, por lo que se llaman pruebas paramétricas. Por ejemplo,
para la aplicación de Ia prueba ú, se debe suponer que Ia población es normal. Además, para la
aplicación de las pruebas paramétricas se requiere que el nivel de las mediciones sea al menos de escala
de intervalos.

Sin embargo, existen muchas aplicaciones en las ciencias y Ia ingeniería donde no es posible conocer las
distribuciones de las poblaciones de las que se extraen las muestras o los datos se reportan como valores
en escala ordinal. En estos casos, se utilizan métodos alternativos equivalentes a los paramétricos,
denominados métodos no paramétricos o de distribución li,bre.

Con frecuencia se utilizan las pruebas no paramétricas cuando se tratan de inferencias con muestras
pequeñas y distribución desconocida de la población, ya que en estos casos no se puede utilizar el
Teorema del Límite Central. La aplicación de los métodos no paramétricos no requiere conocimientos
matemáticos avanzados, debido a que la tarea matemática consiste en ordenar por rangos Ios datos
observados.

Si se verifican Ias condiciones exigidas para el uso de una prueba par-amétrica, entonces, es siempre
preferible utilizar ésta y no su equivalente no paramétrico. EIlo se debe a que si se utiliza el misrno
nivel de significación en ambas pruebas, Ia potencia de una prr.reba no paramétrica es siempre menor
a la de su equivalente pararnétrico. Por otro lado, con los métodos no paramétricos se pierde gran
7)
cantidad de información al no operar explícitamente con los valores sino con sus rangos.

Ventajas y desventajas de los métodos no paramétricos

Las pruebas no palamétricas tienen varias ventajas sobre las pruebas paramétricas:

1. Por lo general, son de usar y entender.

2. la necesidad de suposiciones restrictivas de las pruebas paramétricas.

267
268 Capítulo 9. Pruebas de Hipótesis lVo Paramétricas

3. Se pueden usar con muestras pequeñas.

4. Sc plreden usar con datos cualitativos.

También, las pruebas no paramétlicas tienen desventajas:

1. A veces, ignoran, desperdician o pierden información.

2 No son tan eficientes como las paramétricas.

3. Llevan a una mayor probabilidad de no rechazal una hipótesis nula falsa (error de tipo II).

Las pruebas no paramétricas se dividen en dos grupos: sobre una sola muestra y sobre varias muestras.
También, hay un grupo de pruebas que se basarr en la ley de distribución ji cuadrado.

En este capítulo examinaremos un conjunto básico de pruebas no paramétricas, que permiten con-
trastar hipótesis sobre la independencia de variables, el ajuste a una ley de distribución dada, la
aleatoriedad de las observaciones, entre otras. En la prirnera parte examinaremos aquellas pruebas
que emplean la ley ji-cuadrado, mientras que la segunda parte dedicaremos a otro tipo de pruebas.

9.1. Pruebas X2 de bondad de ajuste a una ley

En esta sección analizaremos procedimientos cuyo objetivo es determinar si un conjunto de observa-


ciones sigue cierto esquema probabilístico. Estos constrastes comparan las frecuencias observadas con
las fi'ecuencias teóricas de1 modelo probabilístico corr que se cotcja a trar,és de un estadístico cle prueba
qrre sigrre rrna ley 12.

9.1.1. Pruet¡a sobre los parámetros en un experirnento rnultinornial


Srrpongzrmos que en urra investigación se establecen ciertas categorías en las cuales se dividc la
población; por ejernplo, el nivel socioeconómico, el nivel dc instrucción, etc. Cacla observación puede
perterrecer solo a una de las k categorías prefijaclas.

Si eu Ia investigación se realizarr n observaciones: zl1 de cllas est¿in en la primcra, n2 están en 1a segunda,


..., n'k están en la k-í:sima cateploría; y se cumple que z¿t |-n2-1 ..-ln¡- n. Una inr¡estigación que
prescnttr esta car¿rcterística se dcnornina erperinten,to mttltinom,ial, cuyas particularidades son:

t. EI experimento consta de n cnsayos idérrticos e indepenclientes unos dc c¡tros.


2 E1 resrrltado clc cada ensayo se locaiiza en lrna y solo una de las catcgorÍas.
')
(). La probabilid¿rcl de que tin ens¿ry'o se localicc en la i-ésirna categorÍa es p¿, (i : 1,2, ,k);yse
cirnrple eue p1 -l pz + ---* pn: L.

Esto sc rcsLlnte etr Lut¡] talila como la siguiente:


Categoría C1 Cz C*, Total
Frecuencia 'rL1 112 TLl 'n
trrobabilidad Pt P2 'pk 1

Itrteresa. conocer si el número cle c¡bservaciones clue se ubican en cada categor'ía se ajusta a un esqlle-
rna cle probabilidnd <lado; es clccir', si las probabilidadcs dc ¡rertenencia a cada gr,r-rpo tiencn valores
especÍficos: pr : pro¡ p2: p20, . . ., pk : pk¡. Entonces la pruebzr queda así:
9.7. Pruebas X'2 de bondad de ajuste a una ley 269

1. Hi,ytótes'is l{ula. Ho'. 1,t1


: Plot P2: P2o, . . . , 'Pk: Pko.

2. Htpóteszs Alte'r'no,t'rua,. I11 : Al rnenos uncl cle los ¡r, es <listirrto c.Ic., p,¡g,'i - I,2,...,k.
, (rr¡-ttp¡¡)2
3. Estad'íst'ico de Prtt,ebo^ '\r/r'\ -
7-t nP¿o
4. Regi,órr de Recl¿azo. Se rechaza 11¡ cuando X?"1,, > XZ@ - l).

Ejemplo. En un periodo de un año, se registraron 100 nacimientos de gemelos en la Maternidad


lsidro Ayora de Quito. La distribución de los recién nacidos, de acuerdo al sexo, es la siguiente:

2 varones 2 mu.jeres 1 varón, 1 mujer

Se supone que los datos esLán distribuidos según una ley trinomial de parámetros (100;p1,Pz,Ps)
: P2: I
4Y Pt: I2
Pt Probar Ia hipótesis a un nivel de significación del 5 %.

Soluczón: Se tiene nt : 29, n2 : 38, ns : 33 yn : 100, con esos valores Ia prueba es

1. Hrpótesis Nula. Ho: pI : n, Pz: n, Pz: ,'


2. Hi,pótesis Alte'r'natiua. f11 : Al menos uno de los p¿ es distinto del enunciado

3. Estadístic:o d,e Prueba.


r2
(rn - 11
* ,oo)'
+
("-i x 1oo)
+
("-]"'oo)'
1 I lxtoo
-4 x l(X) -4 x 100 2

4. Región de Rechazo. Tenemos que XSos(2) :5.99 y la región crÍtica es XZt" > 5.99.

5. Deciszón. Como 13.18 > 5.99, se rechaza 116, o sea, los nacimientos de los gemelos no siguen Ia
Ley indicada.

Se recomierrda que el lector cambie las probabilidades de pertenencia a cada grupo) de manera que se
acepte la hipótesis nula.

9.L.2. Prueba de bondad de ajuste a una ley dada


Este caso es una generalización del anterior. Ahora, supondremos que no podemos asignar de antemano
1as probabilidades de pertenencia a cada grnpo, silo que se las debe calcular a partir de una ley de
distribución teórica (uniforme, normal, Poisson, etc.), cuyos parámetros son conocidos o deben ser
estimados a partir de las observaciones de la muestra.

Disponemos de un conjunto de n observaciones, que se supone siguen una ley de probabilidad dada y
que están agrupadas en k clases o categorías.

Por otro lado, sea X una variable aleatoría que sigue Ia indicada ley probabilidad, que toma valores
.r:r) tr2). . .; entonces. Pr(Y : r¡.) : p¿.
270 Capítulo 9. Pruebas de Hipótesis lVo Paramétricas

Por e-.jemplo, X podr'ía seguir una lcy de Poissou,

Pr(X:r¡):P¡ ="-tr)'"
,l
donde el par'ámetro ) puede estar previamente especificado o debe ser estimado.

A partir de las probabilidades teóricas se calculan las frecuencias esperadas de cada clase como ei : np,i.

Cuando alguna clase tiene una frecuencia observada menor que 5 se Ia puede unir con alguna clase
adyacente y sumar las probabilidades correspondientes. Luego de agrupar las observaciones que lo
ameriten, se dispondrá de una tabla de frecuencias con k clases, como Ia siguiente:

Grupo o FYecuencia FYecuencia


Observación
clase observada (n¿) esperada (e¿
1 Í1 nl et: npr
2 r2 n2 e2: nP2

k ;r ;* ek: nplr
Total n

El estadístico de prueba, para comprobar si los datos siguen una ley especÍfica, es

k .o
,"0
xZu":
I
L=I "n",,"
,

que sigue aproximadamente una distribución y2 con [(k - I)-(número de parámetros esti,mados)]
grados de libertad. Así, si se supone una ley de Poisson, de parámetro ,\ conocido, entonces Xlr" sigue
unaley X2(k-1);perosiseestimaelparámetro),elestadísticoXl6"sigueunadistribuciOny2(k-2).
La prueba de hipótesis queda como sigue:

1. Hi,pótesi,s NuIa. fls: Los datos siguen una \ey L(p) dada.
2. Hipótesi,s Alternatiua. I11: Los datos no siguen la ley 4(p) dada.
('¿ -
.). Estad,ístico d,e Prueba. XZn. : ! "¿)2 ,
i:t ei
donde &: es el número de clases que se forman luego de agrupar los datos.

4. Regi,ón de Rechazo, Se rechaza Hs si XZt" > X?"@ - 1- l), donde I : número de parámetros
estimados a partir de la muestra.

Ejemplos

1. En una agencia bancaria hay cinco cajas para atender a los clientes. Un día, el encargado de la
agencia contabilizó el número de clientes que escogía cada una de las cajas, obteniendo:
o
Caja 1 2 4 5 Total
FYecuencia 34 54 39 48 45 220

De acuerdo a estos resultados, ¿se puede concluir que ha¡'preferencia por alguna de las cajas?
9.7. Pruebas X2 de bondad de ajuste a una ley 27L

Sohtc'ión,: La hipótesis nnla es sriponel que no hay ¡l'eferrencia por una caja palticular o, lo que
es 1o rnismo, que los datos siglren Lrna ley uniforrne con

p.¡:Pr(Y: i) :;, i__ r,...,5.

Entonces, las frecueucias esperadas son:

ei : npi :220 , !: nn, i: I,. . . ,5.


Notemos que aquÍ no es necesario estimar parámetro algrrno; de manera qr.re la prueba es:

1. Hi,pótesis NuIa. 116: Los datos siguen una ley uniforme.


2. Hipótesi,s Alternat'íua. Ht: Los clatos no siguen una Iey uniforme.
t). Estadístico de Prueba.

xza" : f@t-"t)2
ei
i.:r
: (34-4q2 _64-4q2 _Q9-44)2 _gB-4q2
44=44.44=44-44 -(+S-+q2
4. Regi,ón rl,e Rechazo. Como X3.os(5 - 1) : 9.49,\aregión es XZt"> 9.49.
5. Deci.szón Aquí, XZa"no está en la región de rechazo; de manera que se puede decir que no
hay preferencia por ninguna caja.

2 En una ensambladora de carros se registró el número de defectos por unidad en una muestra de
100 unidades que se inspeccionaron durante una semana dada, dando la siguiente distribución
de frecuencias:
Número de defectos 0 1 2 .) 4
Número de carros 63 20 8 5 4

Contrastar Ia hipótesis de que los datos se ajustan a una distribución de Poisson.


Soluci,ón: El estimador del parámetro .\ de la ley de Poisson es el promedio:
.A-.t/
\ _=_ 0 x 63 t- 1x 20f 2 x 8*3 x 5 -14x4 _tt(n
- 100 -u.ur.

Calculemos las probabilidades de peltenencia a cada grupoT según la ley 2(0.67):

€_0.67(0.67)o
Po : Pr(X:Q) : : 0.512,
0!
€-0.67(0.67)1
Pt, : Pr(X: 1) : : 0.343,
1!
67
e_o (0.6n2
Pz : Pr(X :2) :
2t'
:0.115,
6T
e-o (0.67)3
P3 : Pr(X:3) : ol
JI
:0.026,
e-0.67 (0.6n4
P+ - Pr'(X:4) : : 0.004.
4

Las frecuencias esperadas son

eo : 100 x 0.512
-- 51.2, et: 100 x 0.343 :34.3,
ez:100x0.115-11.5, e3: 100x0.026-2.6,
et : 100 x 0.004 :0.4.
272 Capítulo 9. Pruebas de Hipótesis lVo Paratnétricas

C¿rk:rllcrrros cl cst¿rclístico r.l.e pruebir:


4,
.,
-z s- @¡-e¡)2
\ r¡t¡.s /_
,i_'_.o ei
: (63-51.2)2
+ (t0-34.3)2 + (8- 11.5)2
_6-2.q2 0.4)2 _
+g- ,J4 !1 7'
5r2 - 34i - lli - 2.6 - -+"L'
La prueba estadística es:

1. Hipótesis NuIa. 11¡: Los datos siguen una ley de Poisson P(0.67).
2. Hi,pótesis Alternatzua. 11r: Los datos no siguen una ley de Poisson P(0.67).
3. Estadísti,co de Prueba. X?ot":4I.72.
4. Regi,ón de Rechazo. Como x3.os(5 - 1- 1) :7.81 y la región es XZu" > 7.81.
5. Deci,si,ón Se cumple que 4I.72 > 7.81; entonces, se rechaza Ia hipótesis nula. El número
de defectos no siguen la ley de Poisson P(0.67).

Se midió la duración de trabajo de 200 elementos electrónicos, según se resume en Ia tabla. La


primera columna muestra los intervalos de tiernpo (en horas) y la segunda está la cantidad
"tr
de elementos que han trabajado el tiempo entre Ios Iímites del correspondiente intervalo.

Tiempo de FYecuencia Tiernpo de FYecuencia


duración (hr) (rn) duración (hr) (rt¿)
0-5 133 15-20 4
5-10 45 20-25 2
10 15 15 25-30 1

Para el nivel cle sigrrificación 0.01, 'i'erificar la hipótesis de que el tiempo rnedio de trabajo de Ios
elementos está distlibuido según una Iey exponencial.

Solu,czón: El parámetro .\, que sigue la ley exponencial, se estima po, 1 : ! : O.r.
T
Calculemos las probabilidades de que la variable aleatoria tome valores en cada inten'alo:

pr : Pr(O < X < 5) :.-o2xo - e-o2x5 : 0.6321.

Análogamente, se obtienen

pz : 0.2326, pJ :0.0855, p¿ : 0.0315 , p5 :0.0116, po : 0.0043.

Con ésto, se encuentran Ias frecuencias esperadas, ei: npii

et : I26.42t e2 : 46.52, es : 17.I0, e+ : 6.30, es : 2.32, eo : 0.86.

Como las tres úrltimas frecuencias son pequeiras, se las puede agrlrpar en una sola clase, obtenién-
dose k : 4 clases. De esta manera, se dispone de Ia siguiente tabla que muestra el grupo, la
frecuencia observada y la frecuencia teórica.

1 133 t26.42
2 45 46.52
D 15 17.10
4 7 9.48
Total 200

Por lo tanto, la prueba es:


9.7. Pruebas X2 de bondad de a.juste a una ley 273

1 fI'ipótcs'is Nrtla. 11¡: Las obserr,¿ciorres sigucrr rrrrrr lcy <rxporrcuciul t(0.2).
2 Htpótes'is Altr:tr¿a,ti,tstt,. H1: Los cl¿rtos u<l sigucrr rrrrir Icy r:xponencial €,(0.2).
3 Estct,díst'i,co de Prt¿ebu.

f
,
rlr., : rl
)
(rt,
.-:
- c,)'2 (133 - 126.4D2 (45 - 46.5\2
+
(15 - 17.10)2
e i 126.42 46.s2 17.70
-,:,
: 1.299.

4. Región de Rechazo. Como previamente se estimó \, I :1 y se debcrá examinar la Iey 12


con (4 - 1- I):2 grtrdos de libertad) cuyo valol es Xl.otQ):9.2I, se define la región de
rechazo XZt" > 9.27.
5. Decisión Puesto que 1.299 < 9.21,, no hay razón para rechazar la hipótesis de una ley
exponencial €(0.2) para los datos.

4. Se midió la estatura de un grupo de niños de 12 años de edad, con los resultados:

Estatura Número de niños


135 - 140 6
740 - 745 l8
oo
145 - 150 t)!

150 - 155 61
155 160 22
160 165

Velificar si los datos de esta mnestr¿ provienen de una distrilrución nornral.


Soh',ci,ón: Err primer lugar se cleben estimar Ios parárnc'tlos de Ia ley nolmai:

fr: r: 150.625, ? :31.425.


probabilidades de pertenencia a cada intervalo, segrin una ley son:
^/(150.625;31.425)
i pt : 0.026, p2 : 0.129, ps : 0.298, p¿ : 0.327, ps : 0.170, pe : 0.042.
ilL

i Y Ias frecuencias esperadas son:

et : 4.I8, ez : 18.55, et : 42.88, e+ : 47.06, es : 24.77, ea : 6.48.

Entonces, la pmeba es:

l. NuIo. ,F16: Las observaciones sigueu r-ura ley normai


H'i'pótes'is
^/(150.625;31.a25).
2. Hipótesis Altentatiua. É11: Los datos no siguen una ley normal^/(150.625;31.425).
3. Estadístico de Pr"ueba. X|,r":8.349.
4. Región de Rechazo. Como se estimaron dos parárnetlos, entonces I : 2, el estadÍstico de
prueba se debe comparar con Xfr.or(6 - 1- 2):7.81. La región crítica es X?ou, > 7.81.
5. Deci,sión Corno 8.349 > 7.81, se rech¿rza I1o; por tanto, las estaturas de los niños de la
muestra no siguen la ley normal enunciada.

-\ cotrtintiaciótt se ¡rresenta ttn resurnen de los estirn¿rdoles cle los prrr'árnetros de las Ieyes más comLlrl-
rlentc enipleaclas.
274 Capítulo 9. Pruebas de Hipótesis -lVo Paratnétricas

Ley Estimador
Binomial Bin(n,p) p- -u
TL

Hipergeométrica 11(N, p, r) p- -rT


a
Poisson 2()) A:T
1
Geométrica Q(p) D:_
&

Uniforme U(a,b) a:r-VJs/;


i:r+/3s
1
Exponencial t()) A_-
T
Normal J{(p,o2) F:r
o-:s'
^t,

9.2. Pruebas sobre tablas de contingencia

Cuando tenemos la información de 2 variables de tipo cualitativo, se la resume en Lrna tabla de cont'in-
gencia, que es una tabla de frecuencias de doble entrada, donde en las filas se ponen las modalidades
de una variable, y en las columnas las modalidades de la otra; en las celdas resultantes del cruce de
las filas y las columnas se coloca el número de elementos que presentan ambas modalidades.

Si se tiene información de.lü elementos acerca de las variables Ay B, de tal forma que prescntarl r y
c modalidades respectivamente, Ia tabla de contingencia r x c (r filas y c columnas) es de la forrna:
Variable B
Variable -4 B1 B, B. lbtal
At ??"TI nli n C nL

A, nil Ttrzt ÍLi.c TLx

A, frr'l TL'r ó TLra TLr

Total n.7 n1 nc ¡ú

donde,

rL¿. : D"o, (total de Ia frecuencia de la fila'i),


j:r
T

n¡ : D"n, (total de la frecuencia d.e la columna 7).


i:r
Por ejemplo, los jefes de familia que viven en una ciudad pueden clasificarse en dueños o arrendatarios
de la casa donde residen y según su nivel de instrucción en primario, secundario y superior; es decir,
se los podría clasificar en una tabla de contingencia 2 x 3.

9.2.L. Prueba de independencia


Considérese las probabilidades p,¡., de encontralse en Ia fila i; p.¡, de encontrarse en Ia collrmna j; y
p;r Ia probabilidad de encontrarse en Ia celda (i, j).
9.2. Pruebas sobre tablas de contingencia 275

Debe ctrrrtplirse que iO, :f


i:r
V i p.j : l,y
j:r
pueden ser estimada,s por

ni.
f¿: N' 7r. . . ,T,

f¡ : n.i J

¡y'' r
;-
lr''' ,c'

Bajo la hipótesis de independencia entre filas y columnas, se tiene que la frecuencia esperada en la
celda ubicada en la i-ésima fila y j-ésima columna es

e¡j: NF¿.0t:U#

El estadístico que permite probar la hipótesis de independencia es

xZa":iiry,
i:l j:L "Ll

que sigue aproximadamente una distribtción y2 con [(r - 1)(" - 1)] grados de libertad.

Entonces, la prueba para la independencia es la siguiente:

1. Hipótesis Nula. Hoipij:pi.p.j (la variable A es independiente de la variable B).

2. Hipótesi.s Alternatiua. Ht: p¿t * p¿.p.¡, para al menos una celda de la tabla (la variatlles A y B
no son independientes).

@¿¡ e'¿¡)2
3 Estad,ísti,co d,e Prueba. XZu,: i É - .

i:t j:r eii

4. Regi,ón de Rechazo. La hipótesis de independencia se rechaza si X?"t"> X?"1(, - t)(c- t)].

Ejernplo. En una investigación se desea revelar si existe relación entre el consumo de combustible y
el origen de los carros que circulan por la ciudad.

Origen
Consumo EE.UU. Europa Japón Total
Bajo 76 56 70 202
Alto 160 t4 9 183
Total 236 70 79 385

Al rrivel 5%0, verífrcar si las dos variables están asociadas.


Solución: Calculemos las frecuencias esperadas) eiji

en
nt.n.r 202 x 236 : !23.82,
nL.n.2 202 x 70
:36.72,
N 385 ¡/ 385

etg :
nt.n.s 202 x 79
:4I.45, e2l:
n2.n.l
-----;=-
183 x 236
: 112.18,
N 385 /v 385
n2.n.2 183 x 70
:33.27, (,.r.!
n2.n.3 183 x 79
: 37.55.
¡ú 385 - A,/ 385

-
276 Capítulo 9. Pruebas de Hipótesis lVo Pararnétricas

Clou cll¿rs forrrrclros l¿r t,¿rbl¿r clc frecuerrcirrs csperaclas:

Origen
Constlmo EE.UU. Europa Japón
Bajo 723.82 36.72 4\.45
Alto 112.18 33.27 37.55

Entonces, la plueba queda como

1. H,i;pótesis N,ula. /16: El origen del c¿rlro y el consurno de combustible sou iudependientcs.

2. Hi,pótesis Alternat'iua. .F1r: EI origen del carro y el consumo de combustible están relacionados.

3. Estadístico de Prueba.
(76 - t23.s\2
xZt
" r23.82
(160 - 112.18)2
112.18
: 101.51.

4. Regió'n de Rech,azo. El núrmerode grados delibertades u: (2- 1)(3- 1) :2 ysi a:0'05, se


tiene que x|,sQ): 5.99. La región de rechazo es XZu, > 5.99.

5. Deci,si,rin. Como 101.51 > 5.99, se rechaz¿r ltr hipótesis nula. Coucluinros qtte ltal'relacióIt entre
el consurno de combttstible y eI origen de los carros.

Tablas de contingencia de 2 x 2

Para el caso especial de la tabla de contingencia de 2 x 2, se ha desarrollado una fórmula de cálculo


d" X'.|u" que no requiere l¿-r determinación de las frecuencias esperadas. Supongamos que se dispone
cle ula tabla de contingencia de dos variables, cada una de las cuales solo pueden tomar dos valores,
como la siguiente:

Variable ll
Variable A 81 132 Total
A1 ab a*b
A2 cd ctd
Total aic b+d n,

El estadístico de prueba se calcula como

t{ad - bc)2
xZt* = (a b)(c d)(a c)(b d)'
+ + + +

clue sigue una ley X2 a 7 glado de libertad.

El resto de Ia prueba de hipótesis queda igual a lo enunciado anteriormente.


Ejemplo. El siguiente cuadlo muestra la reacción de los espectadores ante un comercial de televisión
clasificaclos por sexo.
-v

9.2. Pt'uel¡as sobl'e tablas cle cotttittg,etrcia. 277

Sexo
R.c¡rcción HorrrlrLr-'s \Irrjcles Tolal
Dcsfavorable 1t) ,] 15
Favolablc 3 7 10
Total 13 72 o-
:¿

¿,Depencle la aceplacitin clcl corrcrcial clcl sexo rlcl tclcvirlcnt,c'?


Sol,ttción: La prueba de ILipótcsis clrrccla clc la siguicrrlc rrr¡rrela:

1 ÍIipótesis AluLa. fI6: La lc¿rccióri ¿rntc el corr,:rrtri¿rl crs inclcpcrrclicntc clel sero.
') Hi,pótcs'is tlltent,otiuo. 111 : l,a rc¡cr:icirr ¿rltr¡ cl c:orrrcr'<:i¿rl y cl ,5cxo cst¿itr rclacionacios.

Esto,dísl"ico tle Pt"ucl,ta,. .¡lt,, ,, n(o,rl,-1.'r:')2,


_ 25(10 x y 3)2
7-5 :3.2i].
J. - (rr+ü)(c:1 r|,)(atr:)(1.,*d) 15 x 10 x 13 x 12

Rngzón de Recl¿o.zo. Si escogcrrlos rr:0.05, \'crrros,1,,e ¡lo¡,(l) :3.34. La legión cle lecliazo cs
\;i,, > 3.84.

5. Decis'iótl Como 3.23 < 3.81, no sc lech¿rza la hipótcsis lula. Se concluye clue hay inclepenclencia
entre el sexo del espectacLol y la accptaciórr clel comcrci¿rl.

Sc srLgiele c¡re cl leciot re¿rlicc cl c.jeLcicio niecliante el r:¿ilc:rLlo cle las ficcLrcricias cspeladas

9.2.2. Prueba de homogeneidad


Sr-'clice qLrc lura ntttestL¿r es lt,ortt.o.t¡t3,r¿r:r¿ si lr)rl¿rs srrs t)bsrrlr'¿rc:iorrr:s lr¿.rrr sirlo gcrrelrrclrrs pol cl rnisnrr.r
rtrodrtlo cle ciisl,ribución dc lrlobr'rl.riliclzrtl o pcltorrtrc(rrrr ¿r, rrLr¿r rrrisrrrrr poltlzrcitin. La metodologÍa cle l¿rs
pLttclt:rs <le iticlependelrcia tarnbiórr ¡n.reclc aplicalsc lralii trr.cLigrL¿u si exisl,c honrogeneid¿rd eutrc clos o
rr r¿is unrcsh as inclepenclicntes.

i\sí. la prueba estaclÍstic¿r cs ltr sigrrieutc:

i. Hi,pótesi,s Nrtla. ÍIs: L¿ts tltLLcstlzts ptttvir-'rrcrL rlc rrrra rLrisrr:r ¡toltlurciórr (lers llLlest,t¿irs sttrr lro-
nrogénears).

') Alternatiua.
H t'pótes i,s 11¡ : Las nttlcstras no ptovicncrr clcl rur¿r nrisrua ltoblarción (lars rnucstlz-rs
son hetelogéneas),

(tt'j
Estn,díst'ico dc PrtteLto, \I\, r/,.r -.-
- r-1- 1-
r- ' ',t)
it¡t ('j

4 R, qión ,le Rcc'l,azo. l.¡t hipcitesis cie inclepcrrrlcnc:i¿,r sc lcc:hrrz¿r .i 13,,., > X3l(?'- t)(c- i)].

trjemplo. En uua Facultacl sc clasificó ¿i las rrolas obfr:nicl¿is L)or sus alumnos, luego cle lenclil cl
luisllo exalren Física. conro )ra.jas. rlccli¿rs v all¿rs. 'fanbión. sc rcgislr'ó cl plofcsol clue clictirba la
cle
rlater-ia. obtenienclo:
C¿ililic¿rcic'rrr
Plofcsoi lia.¡a i\lc<liir,,\ll¡ lLbral
tl 1,2 23 l .12

1) 2¡ r7 r! .16
,)
lirl rl ,l 0 ll ,!8
278 Capítulo 9. Pruebas de Hipótesis No Parantétricas

¿Se puede decir que la diferencia en las notas es debida al profesor?

Sohrción: La tabla de frecuencias esperaclas es:

Calificación
Profesor Baja \'Iedia AIta
A .7 19.1
t7 5.3
t)
l) 19.3 20.9 5.8

La plueba estadística es:

1. Hipótests Nula. 11¡: Las difer-elcias eu las not¿rs no son debidas rrl plofesor de la materia.

2. II'ipótesis Alternatiuu,. ,F11 : Lrs cliferencias crr las notas se debelr al profesor.

.) Estadísrico d.e prueba. r?.-:


\ oó¡
(12_ rT'7)2
-._
(23
--I9'l)2 *...-r- (a -5'B)' :6.12.
fi .7 lg,I b.B

4. Región d,e Recho,zo. Se tiene.1.,e xfror(2) :5 99 v la región es,\3¡" > 5.99.


5. Deci.si,ón. Como 6.12 > 5.99. sc rcchazrr 110: es rlecir, ei profesor de la materia si influye en las
notas obtenidas en su materi¿r.

9.3. Ejercicios

Pruebas de bondad de ajuste a una ley

1. En un cluce de carretelas los aulos pueden gir-al a 1a izquierclrr, l Ia derecha o seguir de frentc.
Se supone que la rnitad de los autos scgr-rir'¿irr de fi-ente, la nna cu¿trta parte irá a Ia izquielda 1-
Ia cuarta parte restante a la clclecha. Sc re¿rlizó urr colteo cle los autos según la dirección quc
ellos siguen:
De fi'ente A la izqr-rierda A la derecha
Frecuencia 29 149
Pruebe Ia hipótesis indicada a un nir.cl clc significirciórr de 0.1.

Cuando el naturalista francés del siglo XVIII Georgcs Louis llrLflbn realizó 4040 lanzamientos
cle una rnoneda observó 2048 calas. ¿Cclncuerrlarrr estos datos coL la hipótesis de que la rloned¿r
cs simétrica?

Una zona de \4indo es cl hábitat natur'¿rl <le tles cspccics dc colibríes. Se cree (hipótesis nula)
qlle ulla quinta parte de los colibr'íes pcltcrrecc tr la prirrrera cspccie, dos quintas partes a l;r
segunda especie y otlas dos quintas part<rs ¿r la tercera. En una nnestr"a aleatolia de 34 colibr'ícs
de la zona, se observalol 12 cle Ia priirrcr-er especle. 15 clc la scgrLnda" y 7 de la telcera. ¿IIav
suficiente evidencia estadística (al nrvcl 0.05) pala acepterr Ia hipótesis propuesta?

4 Segirn los datos de un estudio c-rhaustivo rle rrrercado qlle se lc;ilizó en la ciudad, las ventas clc
irnpresoras para comptltadoras lrersonalcs der uso cloméstico sc ciividen entre cuatro marcas (4,
B, C y D) cuyos porcenta,jes dcl total de las vcntas son 18 c/o,22Vu.35% y 25To, respectivamentc.
Un ario después, se quiere analizal de urrcro l¿r situación pcro sc cree qrle no se debe repetir ur
estudio de mercado a gran escal¿r. Se clccicte obserr.ar Ia narc¿r adquil-ida por 200 compradores
cle inrpresoras elegidos al azar. obtcnienclo cpre c1e cllos 28 habíalr clegido la marca 4,48 LaR,77
Itr C y 47 LaD. ¿Hay suficientc cvidenci¿r. ¿..1 rrivcl 0.05, para tl[iL'r,-rzrr clue el reparto del mercacio
y¿r no es el mismo quc el arlo ¿rnl-eriol'/
9.3. Ejercicios 279

5. Dos empresas S y T especializadas en lealizar sondeos polÍticos condujeron dos investigaciones


sobre la intención de voto a un partido polÍtico. También. se disponen de Ios resultados de 1a
elección lievada a cabo días después

Partido Emplcsa S Ernprcsa T Elcccrón


A 416 1EE 32.9
B 62 :: 5.1
C 193 83 15.9
F 139 76 12.4
\,{ 95 36 10.6
V 151 77 14.0
Z 76 ?o 9.1
1 1.)n
Total I1,J- 508 100.0

a) Compare los resultados de la elección con cada Llna de las investigaciones de las empresas;
b) ¿Se puede determinar cuál de las ernpresas dio el resultado más certero? Explique.

6. Cuando Gregor N4endel realizó sus experinrcrrtos clc cnlzarniento de guisantes, obserr,ó las fre-
cuencias de varias semillas producidas por híbriclos dc guisantes amarillos Lisos y guisantes verdes
mgosos. Estos datos y sr-rs respectivas probabilida,cles, segirn las predicciones de la teoría de la
herencia de Nlendel, se dan en la siguientc tab1a.

Sernillas Frecuencia Probabilidad


.) 1 a
Amarilla v lisa r),Lr) s 116
Amarilla y rugosa 101 3116
Verde y lisa 108 3116
Verde y lugosa 31 1l16
Total r¡, - 555

Para un nivel de significación del 1%, erarline si las frecuencias rle los datos son consistentes
con las probabilidades teóricas.

7. En el desarrollo decimal de z- entle los 10 03E primeros dígitos aparecen 968 ceros, 1062 unos,
1021 dos, 974 tres, 1014 cuatros, 1046 cincos. 1021 seis, 970 sietes. 948 ochos y 1014 nueves.

a) ¿Se puede considerar clue los dÍgitos apa,recen nniformementc distribuidos, a un nivel de
significación a : 0.05?;
b) A qué nivel de significación rechazarii ln hipótesis'/

8. Entre 2000 familias que tienen 2 hijos. 522 f¿rnulias lienen dos r.alones, 471 dos mujeres y 1007
de los dos sexos. A un nivel de significaciórr de 0.05. ¿,se puecle consiclerar que el núrmero de hijos
\rarones en las familias es rlna variable alcatoria binomial?

9. En nn estudio a 107 familias qr-re tienen 5 hi.jos. sc coutal¡ilizó el núrmcro de hijas que tienen tales
fanilias, con el siguiente resultado:

Número de )
t) I .) 4 5
hijas
Frecuencia 5 17 28 to
¿L 19 6

¿Puede afi.rmarse que) para las fanilias estucliaclas. el rrúrrler-o cle hijas sigue una ley binonial?
(Use a : 0.05.)
280 Capítu.Io 9. Plueb¿rs de Hipótesis No Pararnétricas

10. Para estudiar la delilcueuci¿r ol] Llrr¿1 r:irrrlacl se ¿rrrot¡r'on l¿r-s clcuulcias ¡lol lobo rle automór.iles
recibidas en los riltinros 575 r1ías. obtt¡niírrrrlose krs siguicritcs losrrltaclos:

No. denuncias 0 L 2 3 4 5
Frecuencia 23t) 210 90 JiJ 8 2

Contraste la liii.rótcsis clc c¡rc los cl¿¡tos plocorlcrr cic rrna <listribucióu rle Poisson con ) : 1.
(a : 0.05)
i1 Se registró la cantiriacl cle goles colsegrrirli.rs uu 1,19 p;rr'1 iclos <lisprrbados por r-rn ecluip o profesiottzrl
de fiitbol
No. cler golc.s
en Lur p¿riti(lo
01234
Frectterttc,i¿t 50 64 23 84
Verifique la hipótesis dc que ol uiruero rlcr golcs Pt.,r llarticlcl cst¿i distribuido segúrr una ley dc
Poisson. para el nivcl clc sig-nificirción 0.l)5.

12 En el transcurso de dos holits, cl nrirlcto dc llaul¿rrlas pol rrrinuto, solicitadas ¿r una cetittal
telefónica ftre:
No. llarnadas/min 0 i ') J tl 5 t)
Frecuencia 6 18
.)
,)-)
,)
JJ
- I7 10 2

¿,Se puede aceptar que e1 núrnrelo clc ll¿rrrr¿rrl¿rs pol rrrirnrto signc una distlibución clc Poisson'J

13. En cierta región sc registró la temperirtur'¿r ck:l ¿rilc chrrantc 300 clías. L¿rs medicioncs se rcsruneu
cn Ia siguiente tabla (en la plinrcla cohurLn¿r se inrlic:¿l el intclvalo de tr,.nperatnr¿r en grados 1'
en la segunda el nÍrmero de clí¿is cuv¿r fclrrL)clratLrLa rrrecli¿,r collcsponclc ¿l cse intervalo). Ver-ifi<¡.re
clue la tenperatura rrrecli¿r est¿i clistribuicl¿r rLrrifolnonrcnte ¿r un livel cle significzrción dc 0.05.

Rango cle R iurgo clc


tetlpelatnlil Fr'c<;rrerrcia lerrrpcltt t nrit Flecrrenc;ia
(-t0) a (-5) :¿ 10a15 40
(5) a0 40 15 a 2i) 46
0a5 30 20a25 48
5a10 ,15 25a30 26

14. Un estudio realizado iuclica c¡re el ticnrpo clc cspera cri l¿r crola rlc la, ca,ja de un banco se pucclc
rnodelizar con Ltlla distribución cxporrcrrci¿rl clc r¡reclia 3 rninr,rtos. Para cornprobar si este noclclo
sigue siendo r'áliclo, sc tomó la sigrricrrtcr ntrrcstLa:

3 2 6 ,,t 1 3 2 1 1. 4.
\¡erifiquc si los d¿rtos Jloccclcn clcl rrroclckr ospecrifir::rrlo cn cl cstrrclio (cr:0.05).

15. Se probaron 450 focos, t-egistlrindose e1 ticrtrpo c¡rc <lulitlon enccncliclos hasta que ftrilaron:

Nrirnclo Niunelo
Tiernpo Ticrnpo
clc firr:os clc focos
0a40u 131 L6(X) a 20t10 ói)
400 a 800 95 2000 a 24U0 3ij
800 a 1200 76 2'100 a 2E00 )1
1200 a 160i) 5(i

Pala un nivel de significación de 0.01. r-clifÍc1ue la hipótesis clc clue el ticrlpo de dulación clc los
focos está distlibuicla segúrn rrrrrr ic). exlrrIttcuci¿rl.
9.3" Ejercicios 287

16. En la Facultad de Ciencias se quiere averiguar los conociurientos sobre Física que tienen los
alurnnos matriculados por primera \¡ez en dicha Facultad, para lo cual se realizó el primer día
de clase una prueba genera,l. Los resultados correspondientes a rlna nnestra de 211 alumnos se
recogerl en la siguiente tabla:

Puntuaciones Frecuencia
50.5 55.5 4
55.5 60.5 77
b(J.b bli.l) 45
65.5 70.5 67
70.5 75.5 It
dL)

75.5 - 80.5 15
80.5 85.5 10

Determine la normalidad de la variable qlre representa la puntuación obtenida. (Use o : 0.05)

Pruebas sobre tablas de contingencia

17. En una investigación sobre el hábito de fumar por lur grupo de estudiantes universitarios se
obtuvo Ia siguiente tabla, en la cuaL se relaciona el sexo del entrevistado y si él o elia es un
funador.
¿Fuma?
Sexo SI NO
Masculino 26 10
Femenino 11 15

Pruebe si existe asociación entre el hábito de fumar y el sexo del investigado.

18. En un estudio médico a 300 pacicntes que fueron opcradas por cáncer de ovario, se clasificaron
en quienes han sobrevivido 10 años después tl.: la operación y quienes no lo hicir:i.rn, y el estado
del tumor al momento de la operación.

Estado del ¿Sobrevivió?


cáncer No Si
Terlprano 32 r27
Avarrzaclo r18 23

¿La sobrevivencia de Ia paciente es independientc del estado del tumor el momento de Ia ope-
ración?

l9 A firr de probar el supuesto de que una persona desernpleada rcpresenta un alto riesgo crediticio,
en nn banco se realizó un estudio de 100 c:nentas escogidas aleatoriamente con los siguientes
resultados:
Situación laboral
Situación actual del cliente
del préstamo Ernpleado Desempleado
En mora 16 10
No en mora 55 19

a) Calcule el vaLor d. XZa" para estos datos, usando Ia fórnula usual;


b) Calcule el valor d" XZt" para esta tabla mediante la fónnula alternativa;
c) ¿Cuál es el resultado de esta prueba al uivel de significación de 5 por ciento?
282 Capítulo 9. Pruebas de Hipótesis lüo Pararnétricas

20. Se realizó un análisis de sangre de un grupo de 1000 habitantes (elegidos al azar) cie una ciudad
con la siguiente distribución, según el grupo sanguíneo y el factor Rh:

C A B AB
t7-
Rh+ 3r7 81 39
Rh 96 82 29 10

Según estos datos. ¿puede aceptarse la liipótesis de inclependencia, del factor Rh de1 grupo san-
guíneo? (Use cr : 0.05)

2I Se ejecutó un estudio sobre la utilizacióu de ciertas fuentes de financiamiento externas para 1as
pequeñas y medianas empresas (PYN'ItrS), Fara e1lo, se seleccionó aleatoriamente 500 PYMES a
nivel nacional. Las empresas se clasifi.caron segr1n su tarlaño en tres categorías (micros, pequeñas
y medianas) I' según hayan utilizado o rLo a).gr.rna fi.relte de financiación. Los datos obtenidos
fueron:
Con financiamiento Sin financiamiento
Nlicros 115 ó¿o
Pequeñas 20 20
Medianas 15 5

a) ¿Existe alguna relación entre el tamaño de la empresa y el hecho de recurrir o no a fuentes


de financiación? Utilice un nivel de significación del 10%;
b) ¿,Puede aceptarse. a un nivel. de significación del 5 %, clue ttn20To de las empresas <<micros>>
utilizan fuentes de financiación frente a que J.a proporción sea mayor?

22 Se realizó un sondeo en ia ciudad paradetenlinal 1as posibles relaciones entre el nivel educativo
(superior, medio o primario) de las persolras y el consumo (bajo, medio o alto) de productos
electrónicos. Los resultados, para 400 personas seleccionadas al azar, ftteron:
Nivel Consurno
Educativo Bajo \'Iedio Alto
t)1 4.4
Superior .)-L 47 ++
\4edio 2B 79 125
Primario 16 17 19

Contraste Ia inclependencia entre el nivcl educatir.o v el consumo de productos electrónicos.

23. En una investigación sociológica a un grupo de pcrsonas casadas, se desea saber si el nivel so-
cioeconómico de los encuestados incide sobre el éxito o fracaso de su matrimonio. Los resultados
se dan en la siguiente tabla:

NSE
¿FYacasó? I II III IV V
Si 28 62 79 181 724
No t27 230 443 850 582

¿,Se puede concluir que la diferencia en el índice de fracaso se debe al nivel socioeconómico de
los matrinonios?'

24. trl Consejo Directivo cle una universidad cluer'Ía determinar la opinión de cl.iversos grupos en
relación con el calendario docente propuesto. LIna muestra aleatoria selecciolada entre 100
estudiantes, 50 empleados y 50 profesores dio 1os siguientcs resultados:
Estudiantes Ernpleados Profesores
Favorak¡le 63 27 30
Desfavorable JI z,\ tn
9.4. Pruebas sobre ¿rna soJa ntuestra 283

Si se desea saber si hay prucbas dc una difcrr:ucia, rrrr la ¿rctitucl hacia el calendario entre los
diversos grrpos:

a) Indique cuál es Ia prueba adecuada para la realización de este contraste, y especifique las
hipótesis a contrastar
b) Realice el contraste corrcspondiente, con un livcl de significación del 1 %.

25. Un estudio sobre tabaquismo cn tres ciuciadcs, rnediante tres muestras aleatorias de tamaño 100,
proporcionó los siguientes resultados:

Ciudad 1 Ciudad 2 Ciudad 3


Án
Fumadores 13 18
No furnadores 87 7'
t),) 82

¿Se pueden considerar homogéneas las tres poblaciones respecto a sus hábitos fumadores, al nivel
0.05?

Esta parte del capítulo la dedicaremos al análisis de la,s prucbas no paramétricas que involucran una o
dos muestras y cuyo objetivo es probar si los parámetros de los que provienen las muestras adquieren
ciertos valores particulares. EI lector notará la sinilitud con las pruebas desarrolladas en el capÍtulo
anterior.

9.4. Pruebas sobre una sola muestra

En las pruebas no paramétricas sobre Lrna nuestLa se distinguel dos clases: aquellas que contrastan
el valor de una rnedida estadÍstica (de localización, de clisper-sión, etc.) y las que contrastan una
caracterÍstica general de los datos (ajuste a una lcy, aleatoriedacl, etc.).

Existe una amplia variedad de estas prnebas, nosotlos solo exarninarenos los contrastes más comlrn-
mente utilizados y que generalmente se presentan en los plograrlas estadísticos.

9.4.1. Prueba de los signos


El contraste de los signos es la prueba no pararllétrica más antigua y en ella se basan muchas otras.
Se utiliza para contrastar hipótesis sobre ei pariirnetro de localización y en el análisis de comparación
de datos pareados. Consideremos Lrrra mnestra aleatoria dc tamaño n tal que sus observaciones estén
o puedan estar clasifi.cadas en dos categorías: 0 v 1, * y -, etc.

Podemos establecer hipótesis acerca de la mediana: sabemos cluc la mediana deja por encima de sÍ el
nrisrno núrmero de valores que por derbajo. Considcrando c¡.re r¿- A'Ied > 0, darán signos positivos
(+) y - Med { 0 signos negativos (-), en la poblaciórr original tendremos tantos (+) como (-). S"
tratará"ode ver hasta que punto el núrrlero de sigrios (+) esta dentro de Io que cabe esperar que ocurra
por azar si el valor propuesto cono mediana es verdaclerol .

Teniendo en cuenta que se trabaja con dos clases de valores, Ios que están por encima y los que están
por debajo de la mediana, los estadísticos de contraste sigucn ura distribución binomial Bin(n,0.5),
si se supone independencia y constancia c.e la plobabilidad el el lnuestreo, ya que la probabilidad de
qne Lur valor se encuentre por encirna (o por deba.jo) rle la urediarra es p : 0.5.
ILo misr-no se puede decil lespecto a los cualtiles, qrrintrles o clecilcs
284 Capítulo 9. Pruebas cle Hipótesis lVo Pararnétricas

Si X es la variable aleatoria que cuenta el nÍrmelo de ocur-rencias del signo menos frecuente; entonces.
su probabilidad se calcula por

Pr(X : k) : Cf,pk(I -p)"-k, e :;, k :0,I,...,h.

Como nos interesa la ocurrencia de valores tan extrernos o más extremos que el observado, la proba-
bilidad deseada es Pr(X < k).

Observaciones

1. Si al determinar los signos de las diferencias, obtenemos un valor cero, a éste no se lo considerará
el momento de contabilizar el número de signos.

2. Si n < 30, se utiliza la ley binomial; en carnbio, si n ) 30, se utiliza la aproximación mediante
x-n
la ley norm al Z : --J - ,A/(0, 1).
\/n
2

3. Si se desea realizar un contraste para un percentil de orden 100qVo, distinto de la mediana, se

carnbiará el valor d" p -] Ou el valor q correspondiente.

A continuación se exponen las pruebas bilateral y unilateral sobre la mediana.

a) Prueba bilateral para la mediana.

1. Hipótesis NuIa. Ho: Qz: po.


2. Hipótesis Alternatiua. Ht Qz I po.
k
3. Estadístico de Praeba. pobs : Pr(X < k) : Dc;o'G-p)n-'dondek< TL

r:0 ,'
4. Cri,teri,o d,e Rechazo. 2po6, 1 a.

Ejemplo. En una prueba de aptitud tomada a 12 aspirantes a un puesto en Lrna empresa se


obtuvieron los siguientes puntajes:

6.6 6.8 4,4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.

Determine si la mediana de las notas es 5.


Soluc'ión: Tenemos que p¿0 : 5; entonces, si restanos a cada dato el valor de prueba, tenemos

1.6 1.8 - 0.6 2.3 3.5 - 0.5 r.7 1.0 - 1.6 4.7 0.3 _ 0.2.
Lasecuenciadesignos queseobtiene es + + - + +- + + -+ + -. Elsignomenos frecuente
es ( ), que aparece 4 veces; de manera que la prueba es

1. Hi.pótesis Nula. Hs: Q2:5.


2. Hi,pótesis Alternat'iua. H¡ Q215.

3. Estadístico de Prueba. po6, : Pr(X <4):*"r,(;)'(;)"-' : 0.194.


9.4. Pruebas sobre una sola muestra 285

4. Crzterto de Rechazo. 2pob" < 0.05.


5. Decisión. Como 2 x 0.194: 0.388 > 0.05, no se rechaza la hipótesis nula; por Io que se
puede asumir que la mediana de las calificaciones es igual a 5.

b) Prueba unilateral para Ia mediana.

1. Hi,pótesis l{u,la. Ho: Qz: tto.


2. Hi,pótesi.s Alternatiua. Ht Qz ) ¡,lo o bien fl1: Qz { lto.
k
n
3. Estad,ísti,co d,e Prueba. pobs : Pr(X < k) : t C!,,p'(I - p)'"-' donde k < =,2
t:0
4. Cri,teri,o de Rechazo. pobs I a.

Ejernplo. En un campeonato de fútbol, en que participan muchos equipos se escogió una


muestra de 11 equipos. EI número de puntos que acumularon estos equipos es el siguiente:

248912147721222426.

AI nivel de significación del 10 %, probar que Ia mediana de los puntos acumulados por los
equipos en el campeonato es menor a 22.
Soluczón: Tenemos eue ío : 22; entonces hay B signos negativos, 2 positivos y un cero. Por
tanto, n: l0 y k :2; de manera que la prueba queda asÍ:

1. Nula. Hs: Q2:22.


Hi,pótesi,s

2. Hipótesis Alternatiua. H¡ Q2 < 22.


2

3. Estad,ísttco d,e Prueba. pobs: Pr(X < 2) : tClop'(l -o¡10-r :0.0547.


r':0
4. Criterio de Rechazo. pobs < 0,1.

5. Deci,sión. Como 0,0547 < 0.1, se rechaza -FIs. La mediana es menor a 22.

9.4.2. Prueba de los rangos con signos de Wilcoxon

Esta prueba, también conocida como contraste T de Wi,lcoron, se utiliza para comprobar que la
mediana es igual a un valor dado y para su aplicación es necesario que los datos vengan dados en
escala ordinal o de intervalo. EI procedimielto es el siguiente:

Se determinan las diferencias entre cada uno de los valores observados y el valor hipotético de
la medianai d"¡: r¿ - po.

Si alguna de las diferencias es igual a cero, se elimina la observación correspondiente. De esta


lrranera se reduce el tamaño efectivo de la muestra a ?¿J el núrmero de diferencias no nulas.

Se ordenan los valores absolutos de las diferencias, de menor a mayor, asignando el rango 1 a la
rnenor diferencia absoluta, 2 a la siguiente diferencia rnenor, y así sucesivamente. Cuando las
diferencias son iguales, se asigna el rango promedio a los valores que son iguales.

Se obtienen, por separado, la suma de los rangos para las diferencias negativas (T-) y positivas
(7+).
286 Capítulo 9. Pruebas de Hipótesis lVo Pararnétricas

5. Si n ( 20 se utiliza la tabla de puntos porcentuales de la prueba de Wilcoxon (Tabla 6); si n > 20

se aprovecha q:ue Z: - .A/(0, 1).


n(n -r 1)(2n +

Entonces, el contraste queda así:

a) Prueba bilateral para la rnediana.

1. Hipótesis Nula. Hs: Q2: ur.


2. I{ipótesis Alternat,iua. Ht Qz I po.
3. Estadístico de Prueba. Tobs : mín{T-,7+}.
4. Región d,e Rechazo. Tob" < T"/z(n).

Ejemplo. En una prueba de aptitud tomada a 12 aspirantes a un puesto en una empresa se


obtuvieron los siguientes puntajes:

6.6 6.8 4.4 7.3 E.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.

Determine si la mediana de las notas es 5, para a:5To.


Solución: Para ¡,r¡ : 5, la asignación de rangos se resurne en la siguiente tabla:

Valores d¿: :x¡ - Ho Rango f Rango -


6.6 +1.6 6.5
6.8 +1.8 I
4.4 -0.6 4
n,
f .L) +2.3 10
6.b DI
-f o. L, 11
4.5 -0.5 a

6.7 +r.7 8
6.0 +1.0 5
3.4 - 1.6 65
9.1 +4.r 1,2
ID
U.J +0.3 2
4.8 -0.2 1
Total 63.5 I4,5

La prueba es

1. IIzpótesis Nula. Hs: Q2:5.


2. Hipóteszs Alternatzua. H1: Q215.
3. Estad,ístico de Prueba. Tobs: mín{14.5,63.5} : 14.5.
4' Regi'ón d'e Rechazo. En Ia tabla de los puntos porcentuales de este contraste se observa que
Ts.s25(I2) : l!.La región de rechazo es [¿" < 14.
5. Dect'sió'n. Se cumple que 14 ¡ 14.5; por lo tanto, no se rechaza Ho. La mediana de las
calificaciones es igual a 5.

b) Prueba unilateral para la mediana.


9.4. Pruebas sobre rura sola ntttestra 287

1. Hrpótests Nula. Ho: Qz: l-ro.


2. Hipótesis Alternatiua. H¡ Qz ) plo o bien -[11 : Q2 I ¡ls.
3. Estadístico de Pruebo,. Tob" : mfu{T-, T+ }.
4. Región de Rechazo. Tobs <7"(n).
Ejemplo. En un campeonato de firtbol los 11 ecluipos participantes acurnularon el siguiente
nirmero de puntos:

2, 4, 8, g, 12, 14, 77, 2r, 22, 24, 26.

Al nivel de significación del 10 %, probar qne la nediana de los pu.ntos acumulados es menor a
22.

Sohtci,ón: Pongamos Fo:22 y calculenos los valores de T- y de 7+:


Valores d¿:iu¿-l-Lo Rango - Rango f
2
-20 10
4 q
-18
B
-14 B
I -13 7
72 -10 6
74 -B 5
77 -5 4
2t -1 1
22 0
24 2 2
26 4 J
Total 50 5

Con esto elementos, la prueba es:

1. Hipótesis Nu,la. Hs: Q2: 22.


2. Alternatiua. H7: Q2 <22.
Hi,pótesi,s
3. Estadístzco de Prueba. Tobs: mín{50,5} : S.

4. Región de Rechazo. Aquí, 7or(10) :15,


la región es [¿," ( 15.
5. Deczs'¿ón. Se rechaza É1g y deducirlos qr-re la uedia'a es menor a 22.

9.4.3. Prueba de Kolmogorov-Smirnov de ajuste a una ley de probabilidad


El rnétodo de Kolmogorov-Suriruov es un proceclinriento utilizado para comprobar la hipótesis nula de
qr-re la nruestra procede de una población que está distribuida segúrn una ley de probabilidad específica.

trl estadístico de prueba, que se denota por Do¡rr, se define por

Dob": náx lF6(z) - S,,(")l ,

donde Fo@) y,S,.(r) son las probabilidades acumuladas esperadas y observadas, respectivarnente.

La prueba estadística es la siguiente:

l. Htpótesr,s NuIa. 116: La población sigr.re tura 4(p) dada.


288 Capitulo 9. Pruebas cle Hipótesis -AIo Parantétricas

2. Hipótesis Alterno,tiutt. H¡La población rio siguc urra Ie!'4(p) clada.

3. Estadísti,co d,e Prrteba, Dub": uiáx lF¡(:r) - ,5,,(r)1.

4. Región de R,ech,azo. Dob, > D"(n).

Los valores de Dr(n) se encuentran tabnlados p¿ua cliver-sos valor-es cle ay n. (Tabla 7)

Ejemplos

1. Tras jugar a los dados, nn apostador conrcnzci a sospechar qlle el casino hacía trampa. Decidió.
por tanto, anotar las tiradas del dado corl c¡re.jugaba,, obteniendo la siguiente tabla:

Número 1 2 .) 4 5 6
Frecuencia 16 10 l6 11 32 15

¿,Se puede afirmar que el dado es incorrecto'/


Solución: Formemos la tabla de fiecuencias lelati'r.as acumulaclas, adjuntando las colunnas de
Ia probabilidad teórica v de la difelencia:

FYecuencia FYecuencia Fl-ec. relativa


rx Fo(ri) lFo("r) -,9,.(zr)
absoluta (n¡) relativa (./;) acurnulada (,9,,("i))
1 16 0. l6 016 0.1667 0.0067
2 10 010 026 0.3333 0.0733
L) l6 016 0.42 0.5000 0.0800
4 1i 011 053 0.6667 0.1367
5 32 0.32 0.85 0.8333 0.0167
6 15 015 100 1.000 0

La prueba de ajuste clueda de Ia siguiente nanera:

I. Hipótesis NuIa. -I1¡: Los datos siguerr Llna Iey uniforme discleta coD p: If 6.
2. Hipótesi,s Alternat'iua. 111 : Los datos no sigucn una lcy nniforrne discreta con pt: !f g.
3. Estadístico de Prtteba. D¿s : máx lF6(r) - S,,(r)l : 0.1362.
4. Región de Rechazo. En Ia tabla del contrastc K-S encontramos que D6.65(100) :0.136. Se
define la región de rechazo Dor,,, ) 0.136.
5. Dectsiót¿. Como Dob,) D,r(n), se rcchaza 11¡ v concluimos clue el dado está cargado.

) En uua ellrpresa) el salario rnerisnal cle los t,raba.ja<lotcs se distribuye según Ia siguiente tabla:

Desde flasta No. ernpleados


150 190 6
190 230 l6
230 270 47
270 310 55
310 3510 3B
350 390 19
390 430 L4
430 470 5

Comprobar si se puedc asegurar c¡-re el s¿rl¿r,r'ic,r ureusu¿l.l err clicha clnpresa puede considerarse Lul¿I,
valiable ¡/(306,58).
9,4, Pruebas sobr"e u¡ra soJa rnuestra 289

Sohtción: Completemos la tabl¿-L de frccucnci¿rs rel¿rtir'¿rs acurnuladas, calculando ias dos dis-
tribuciones (la muestral v Ia teórica) , tcnicnclo en crreuta que para calcular F6(r) deberelros
utilizar la tabla de la lev nornal.

Desde FIasta No. empleados 5,, (., ¡) ¡¡(ri) lFo(r¿) - S("¿)l


150 190 3 ,l 0.0205 0.0241 0.0036
r90 230 13 Iri 0.1096 0.1089 0.0007
,J1
230 270 Jl- 47 0.3219 0.2976 0.0243
270 310 44 91 0.6233 0.5636 0.0597
310 350 30 121 0.E288 0.8001 0.0287
350 390 I4 1 ') É
IJU 0.9247 0.9348 0.0101
390 430 o 144 0.9863 0.9826 0.0037
430 470 2 14ti 1.00t) 0.9935 0.0065

De manera que la prtteba es:

1. Hipótesis Nula. I{¡: Los sueldos sigucu rlua 1ey ¡/(306,58).


2. Hipótesis Alternatiua. f11: Los sttelclos uo siguen ttna ley ¡/(306,58).
J. Estadístico de Prueba. Dob": máx f 6(r) - ,5,,(r)l - 0.0592.

4. Región d,e Rechazo. En la tabla encorrtrarnos clue D¡¡5(1 46): +:0.1126; etltonces,
,/ua
la región es Do6,u > 0.1126.
5. Dec,is,ión. No se rechaza 11¡; consectrelte[rente. los sa]arios siguen 1a ley,A/(306,58).

9"4.4. Prueba de la aleatoriedad de la muestra


En mrchos estudios experimentales es necesalio corroccl si la.s mnestras obtenidas son aleatorias o.
por el contrario, si ellas mantienen algirn tipo de collelación o si han sido alteradas. La prueba que
nos permite realizar esta identificación también se colloce corno cot¿sf raste de rachas. Por extensióu.
ester prr-reba es indicada para probal la indepcndencia entre obserrraciones.

Definición (de racha). Una racha es nna sucesión c1e v¿rloles por cncima o por deba.jo de ia
mediana.

La longitud de una racha es el número de observaciones consecutivas que tienen esta propiedad.

Fol ejemplo, si las observaciones son

6.6 6.8 4.4 7.3 E.5 4.5 6"7 6.0 3.4 9.1 5.3 4.8.

ia rnediana es Q2 :6.3, luego de representar por ( ) Ios valolcs infcriorcs a la rnediana y por (+) a los
snperiores, obtenemos la secuencia: +, +. -, *, *, , +. , , *, . Existen 8 rachas de longitudes
2,7,2, r, r,2, 1,,2.

Scetn rn6" el núrmero de rachas enuna sucesicin or-dcrracl¿l <-le observaciones; nr v n eI número de obser-
r.aciones que están por debajo v por encima cle l¿r nrecliana cle los datos, r'espectivamente. Con estos
elernentos e1 contraste queda de la siguiente irtattcta:

l. Hipótes'is Nula. //¡: Las observaciones ap¿rtcccrl do tnartt:ra aleatolia.


2. H,ipótesi.s Alternatiua. 111 : Las obselrracioucs no al)are(ie)n cle rnartera aleatoria.
290 Capítulo 9. Pruebas de Hipótesis lüo Parantétricas

3. Estaclíst'ico d,e Prttebo,. 't'ob,s.

1. Reqiór¿ tle Rech,o,zo. 't'ol¡.s 1 1,, (rrr, rr) {) ?',,¿," ) r,,, (lrr. tr ).

Los'r,¿rlorcs cle compa,ración para, esta pmeba se errcrrentr'¿ur tat¡rrlados (Tablzr 5).

Ejemplo. En nna prueba de aptitr-rd tomacla a 12 aspirautes a un puesto en una elnpresa sc oblnvielor
Ios siguientes punta.jes:

6.6 6.8 4.4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.

Determine si los datos aparecen de manera aleatoria, para cy : 5To.

Solución: La mediana de estos datos es 6.3. Si a cada nno de los datos Ie restamos la mediana, queclr
Ia siguiente secuencia de signos: f , *, , +, +, -. +, , , *, ) .

Entonces, el número de rachas es robs : B y rL : n: 6.

1. Hipótesis NuIa. ,116: Las observaciones aparecen de rnanera aleatoria.

2. Hr,pótesis Alternatiua. 111 : Las obselr'¿rciones ro aparecen de rranera aleatoria.

3. Estadístico de Prueba. roü,s : 8.

4. Región de Recho,zo. En la tabla, verfros los valores críticos con cy :\Tt 3 ( ro¿," ( 10.

5. Dectsión. Como robs :8 cae en la región de aceptación, podemos afirmar que los valores ¿lpare(ier-
aleatoriamente.

9.4,5. Prueba para identificar valores atípicos

Esta prueba permite identificar la presencia de r'¿rkrres extr-emos cn Lll conjunto de d¿rtos. Par'¿'
la detección de valores atípicos, en gelelal, se manejarr cliterios empír'icos; por ejempio, cllre Lu1r,
observación esté alejada una distancia dc nrás de 3 desviacioles estándar de ia media) pero esto:
criterios no tienen fundamento técnico y descuidan la influcrcia del tamaño de la muestra.

Este contraste detecta un valor atípico a la vcz y cada nno clebe letirarse de la rnuestra iterativ¿rrnentc-
hasta que no se dctecten más valores atípicos. La prr.reba fue desarrollada por Gnrbbs2 y se basa en
ia suposiciór qrle los datos sigrten de una lcy normai o qlre prreden ser aproximados razorrablcrncntc
pol ésta;i.

La prueba de hipótcsis es la siguiente:

1. Hípótesis Nula. É19: No hay valores zrtÍpicos en el conjr.rnto de clatos.

2. Hipótesis Alterno,tiua. ,É1t: Hay al menos un valor-a,típico en el conjurto de datos.

:
rnáx{lz¡ - rl}
3. Est,odísti,co de Pruel¡a. gobs

1. Reqión de Recha,zo. gobs > G..(t).


I
Crrrlrbs, F E (1969), "Ploceclules for Deterctirrg Orrtlyirrg Obscrvatiorrs in Samples," Ter:h.r¿otnetrics, 11, 1-2i
'-{,.rnc¡.re éste es uu contraste pulamétlico, se lo inclu¡,'e en estc capítulo polque no se le¿rliza soblc cl valor cle ul
naránLetr-o sino sobre una car-acter'ística gencral cle los clatos
9.5. Pruebas sobre dos muestras 291

La tabla de puntos porcentuales para la prueba dc Grubbs se encuentra en el Apéndice (Tabla 8).

Ejemplo. En una prueba de aptitud tomada a 12 aspirantes a un puesto en Lrna empresa se obtuvieron
los sigrrientes puntajes:

6.6 6.8 4.4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.

Determine si existe algún dato atípico. Use a :504.


Solztc'ión: El promedio y Ia desviación estándar son r: 6,717 y .s : 1.716 y el dato que está más
alejado del promedio es 9.1.

Con estos elementos, Ia prueba queda así:

1. Hipótesi,s Nula. -EIs: No hay valores atípicos en el conjunto de datos.

2. H'tpótests Alternatzua. I11 : Hay al menos urr valor atípico en el conjunto de datos.

máx{lz¡ - 7}
? Estadístico de Prueba. gobs: l-
19.1 - ''
- 6.1171 1.74.
s 1.776
4. Regi,óndeRechazo. EnlatabladelapuntosporcentualesseleequeG6.65(12):2.¿tylaregión
de rechazo€S gobs > 2.4I.

5. Decis'ión. Como 7.74 < 2.29, entonces r : 9.1 no es un valor atípico; es decir, la muestra no
contiene valores atípicos.

9.5. Pruebas sobre dos muestras

Las pruebas no paramétricas sobre dos muestras que examilaremos son análogas a las paramétricas
para comparar dos medias; es decir, para datos emparejados y para muestras independientes. También
se presentará una versión no paramétrica del coefi.ciente de correlación.

9.5.1. Prueba de los signos para datos emparejados


Esta prueba se aplica cuando se tienen dos muestras relacionadas y se quiere probar la hipótesis de
que las dos poblaciones tienen medianas iguales, pero no se quieren realizar suposiciones acerca de Ia
normalidad de los datos. Los datos deben presentarse en al rnenos escala ordinal.

Sea (r1,y1), (rz,Az), ..., (rrr,gr,,) una muestra aleatoria de pares de observaciones; donde (r¡,A¡)
representa dos mediciones tomadas de la misma ulidad nuestral. antes y después de un tratamiento o
fenónrenoquelaafecté. Seconstruyeunamllestradelasdiferenciasdl , c12,..., dr,,,donde d¡:r¿-A¿
(z : 1, 2,. . . ,n) y se aplica la prueba del signo para Lrna muestra; es decir, contamos el número de
observaciones negativas y positivas y determinanos cuál es el signo que menos aparece y cuántas
veces Io hace (k). Además, llamaremos Q, ala mediana de la población X y Qy a la rnediana de la
población Y. Con ésto, las pruebas son las siguicntes:

a) Prueba bilateral para la diferencia de rnedianas.

1. H'rpóteszs Nula. Ho, Q": Qu.


2. Hi,pótesis Alternatiuo,. Ht Q,
292 Capítulo 9. Pruebas de Hipótesis No Paramétricas

li;
n
Pr(X < A) :
3. Estorlístzco d,e Pru"eba. pt¡bs:
t
l':0
C'|,p'(7 - p)tl-l j clonde k <
t
4. Crzterio de Rechazo. 2po6" I a.

b) Prueba unilateral para Ia diferencia de medianas.


1. Hi,pótesi,s l{tr,la. Ho, Qr: Qa.
2. Hi,pótesi,s Alternatiua. HI Q, > Qu o bieu Hr Q, < Qa.
k
3. Estadístico rl,e Prueba,. pobs: Pr(X < k) : t C',,p'(l - p)'tL-r ) donde k <:.2
r':0
4, Cri,terio de Rechazo. pobs 1 a.
Ejemplo. En un estudio para determinar la aceptación de un tipo de yogurt, se pidió a 8
voluntarios que calificaran a dos versioues (antigua y nueva) del producto. Las calificaciones v
sus diferencias se resumen en la tabla.
Versión Versión Signo de
Individuo Diferencia
antigua nueva la diferencia
6 o
1 B
2 4 I -5
D
r) 5 4 +1 +
4 8 7 +1 +
ct
5 3 -tr
6 6 I t
-.)
7 7 7 0 0
8 5 I -4
Verificar si hubo incremento en Ia calificación al presentar la nueva versión.
Solución: Tenernos qlre r¿ - 7 y k -- 2. Entonces, la prueba queda así:

1. Hi,pótesi,s Nula. Hot Qr: Qa.


2. Hi,pótesi,s Alternati,ua. Ht Q, < Qy.
k
3. Estadísti,co d"e Prueba. pobs: Pr(X < 2) -- >,Cip'0 - p)7-" :0.2266.
r':0
4. Criteri,o de Rechazo. pobs < 0.05.
5. Deciszón. Se tiene gue Pobs :
0.0226 > 0.05 y se acepta 11s. No hubo cambio significativo
en la apreciación de las dos versiones del producto.

Observación. También la prueba de Wilcoxon a datos emparejados, mediante la


se puede aplicar
aplicación de este contraste a la diferencia entle ios valores de las dos muestras. Se recomienda que
el lector formule esta prueba.

9.5.2. Prueba de Mann-Whitney para dos muestras independientes


La prueba U de Mann-Whitney se emplea para probar que dos rnuestras independientes provienen de
Ia misma población o de poblaciones que siguen Ia nisrla ley de probabilidad.

Supongamos que se dispone de dos muestras inclependientes, X y Y, cuyas funciones de distribución


sori F¡(r) y Fv(r), respectivamente. Diremos, también, que el tarnaño de la muestra X es rn y que
e1 tarnaño de la muestra Y es n. Entonces, pala realizar el contraste se realizan los siguientes pasos:
Pruebas sobre dos nruesúras 293

1. Sc corlbinarr las dos nruestlas en una sola.

2. Se asignan rangos a la mucstra conbin¿rd¿r clc l¿rs dos mncstras. Si se prodr,rccn empates,
asignará el promedio de los rarlgos a las obselvaciolr:s cntpataclas.

J Se snman los rangos de las dos rnlrestr¿is y se c¿rlcnlan los estadÍsticos

(Jt - nlrl- - !norrsos(.y) . (J2:t¡11t. 4+! - !n"r'gos(y).


+{
Con estos elernentos, se realiza la siguiente ptueba

1. Hipótesi,s Nttl,a. Hs: F¡(r) : Fl,(")


2. Hipóteszs Alternatiua. H¡ Fy(r) I Fy@)
3. Estctd,ístico de Prueba. (Jobs: ruín{t/1, U2}.

4. Región d,e Rechazo. Uot," 1Un(nt.rt).

Los valores de comparación pala esta prueba se encnentlan tabulados (Tabla 10).
Ejemplo. EI dueño de nn ahlacén registr'ó l¿rs r.errtas scnranalcs de sus dos erlpleados y quier-e sabet'
si ellos pueden considerarse iguales como verrclcclores. En la siguiente tabla se numeran las'u,cntas cle
cada dependiente.
Empleado A t97 191 188 185 180 1-rt
1/J 169 169
Ernpleado B 190 166 175 172 1b/ 180 160

Solttc'ión: Los rangos asigrrados ¿r l¿rs lmestr'¿ls solr:


Empleado A Ernpleado B Rangos A Rangos B
rg7 190 15 13
194 166 74 2
188 t75 72 8
185 t72 11 ti
180 t6T 9.5 J
r73 180 7 9.5
169 160 4.5 1

169 4.5
n¿:E 7 ! RLrngos : 77.5 Rangos : 42.5

Los cstadísticos U1 )' Ur son

(Jt :,,,,,*d!f4 -fnu,,s-os(;r) :s x z+Lf T7 b :r4.5,

Lrz : ntt¿t4+! -IRo,,s-'s(B) :8 x -*+ -42,b:41.5.


Dc ruanela qrre ia pmeba c¡reclir zrsí:

1. Hipótesis Nula. Ho'. lLr: lL)


2. Hipóte..sis Al,ter"no,tiuu. H¡ ¡q f ¡t,,2

3. Estr¡.d'ístico de Pruebo^ UoL,s: mín{t/1 , ti2} : 14.5.

1. R.egiórL d,e Recl¿o.zo. Par'¿r cL:0.01, [/ooL(8,7) :8; crtorrccs, la, región cs [/o6" ) 8.

5. Deciszón. Corno 14.5> 8. se lcchaza 110: cs rlccir. los clos cnr¡rleaclos venclen iguales canticl¿-rclcs
Capítulo 9. Pruebas de Hipótesis No Parantétricas

9.5.3. Prueba de correlación de rangos de Spearman


El coefi,ci,ente de correlaci,ón de rangos ordenados de S'pearntan ftre el primer estadístico basado en
rangos que se desarrolló. Se lo emplea para determinar la existencia de asociación entre dos vari¿lbles
de tipo ordinal.

Si disponernos de n parejas de obscrvaciones (r1, At), @2,y2), ,.., (",r,A") de dos variables X y Y
y asignamos rangos a la primeru (Rr.) y a la segunda courponent" (Ru) de las parejas, se define el
coeficiente de correlación de Spearman como

cS¿r
-1- L

' t:l
r":1
ttltP 1)'

donde di: Rro - R.0,, es la diferencia entre los raugos asiguados a.T,¿ y yi.
El procedimiento para su cálculo es el siguiente:

1. Se asignan rangos a las observac:iones clc las rrariables X y Y.


2. Si hubiera empates, se asigna el promedio de los rangos a los individuos empatados.

3. Se determina el valor de d¿ para cada indir.iduo y aplique la fórrnula de rr.

El coeficiente de correlación de Spearman tiene una interpretación similar al de Pearson:

¡ Toma valores entre -1 y *1.


¡ Cuando el valor absoluto de este coeficiente e,! cclc¿uro a 1 inclica que hay asociación entle las
dos variables.

" Cttando el valor del coeficiente cs cercarro ¿-r ciero, inclica qrre hay poca o ninguna asociación entre
las variables.

La ventaja de este coeficiente es que no rec¡,rir:re rca,liz¿rr srrposicioues clc nolrnalidad.


E1 contraste correspondientc ¿rl cocficicntc clc Spcar'n)¿ur cs:

1. Hipótesis Nu"Ia. Hs: p: Q

2. Hipótesis Alternatiua. H¡ p l0
3. Estadístico de Prttebn. t'.s

4. R.egi,ón d,e Rechazo. r, > r'.r(n)

La tabla para realizar este contraste se errcnentr¿r en la Tabla I dcl Apéndice.


Ejemplo. Se examinó el regisblo de not¿rs de 10alulrnos en las materias de Álgebra y Cálculo. Las
calificaciones correspondientcs a cada uri(i se r1¿r en la, siguicntc tabla.

Alumno 1 2 4
I
i) 6 7 8 I 10
Algebra I7 18 l9 72 OD
it)
.)2 o( 26 31 aa
.)< DO ,D
Cálculo 2T I4 27 18 20 34 .)L 39 JJ
9.6. Ejercicios 295

Verificar si existe asociación entre las notas en las dos materias.

Soht"ción: Formemos Ia tabla de rangos y su difelencia:

Alurnno Algebra Cálculo Rangos A (R,, ) Rangos C (Rr,) Diferencia d¿


r)
1 17 2I 2 4
2 1B L4 3 1 2
.) ñ
J 19 27 4 6 -L
4 12 IB 1 2 -1
5 23 20 5.5 c
J

L¿

t) o,
L¿ 25 55 5 05
7 25
t^
,)+ 7 I -z
o

8 26 32 8 7 1

I 31 39 9 r0 -1
10
DD
r)r) tt 10 8 2

Do? :2e.5
rl:l

Entonces, el coeficiente de correlación es

1A

c\-¿2
",/-*t
6 x 29.5
r-:7-
' ,i,l :l : 0.821.
tlQt¿-l) 1o(100 - 1)

La prueba de hipótesis de nulidad de Ia correlación CS:

1. Htpótesis Nula. Hs: p: Q

2. H¡ p l0
Hipótesis Alternatiua.

3. Estadístzco de Prueba. rs : 0.821.


4. Región de Rechazo. En Ia tabla del corltraste tenemos que r'6.65(10) : 0.648. La región de
rechazo es rs > 0.648.
5. Decisión. Se tiene que 0.821 > 0.648 y se rechaza 11s. Entonces, hay asociación entre las notas
de las dos materias.

9.6. Ejercicios

Pruebas sobre una sola muestra

1. En una cornisaría se registraron el lúrmero de denuncias diarias por robos:

17 15 20 20 25 32 28 25 35 12 26 24

Utilice un nivel de significación del 570 para pr-obal clue la nediana del núrmero de denuncias no
es nayor a 20 por día:

a) mediante la prueba de los signos;


296 Capítulo 9. Pruebas cle Ilipótesis -AIo Pan-antétricas

b) mcdianbe la prucbtr clo Wicoxou.

2. En un estudio sobre las relDesas enviadas por los parientcs emigrantes a varias fanilias dio los
siguientes resultados (eu miles de dólares):

2.4 2.3 1..7 r.2 2.5 3.6 4.2 2.2 2.3 3.1

Con el empleo de o : 0.05, pruebe si la trediana de estas lemesas es diferente de 2700 dólares:

a) rnediante la prueba cle los signos;


b) mediante la pruebir cle Wicoxon.

3. Para ingresar a Lula agencia balcaria se formó una cola folmada por H (hornbres) y lVI (mu.jer:es),
que está formada así:

H \4 H N4 II H H N{ H H H N,f N4 H M

Determine la aleatoriecl¿rcl en la colfomraciórr cie la cola.

4. Un profesor registró el nirmero de estudiarrtes ausentes a sus clases durante 24días corrsecutivos.

38 31 32 27 28 30 26 33 36 30 28 35
32 29 35 3i 33 31 28 30 28 25 29 33

a) Estudie la aleatoliedad de la muestra con un nivel de significación de 0.05;


b) Se puede asegurar clue la mediana es igual a 27.

5. Un corredor de bolsa obscrr'ó Ia siguiente venta de bonos a lo largo de un año:

Enero 19 Julio 22
Febrero 23 Agosto 24
N4arzo 20 Septiembre 25
Abril 17 Octubre 28
Mayo 18 Noviemble 30
Junio 20 Diciembre 27

a) Aplique una prueba de rachas para decidir si los datos pueden considerarse aleatorios;
b) ¿Es posible afirmar que la mediana es igual a 23?
6. Se desea ajustar la clistr-ibución cle la canticlad cle corr-eos clectrónicos que recibe el serviclor cle
uDa empresa durante ltu ilterr¡alo de cinco ninntos. Pala 400 intervalos de cinco minutos se
contaron la cantidad dc mensajes recibidos y se obtr-rvierou las siguientes frecuencias:

No. correos 0 1 2 ,) 4
I
O 6 7 8 I 10
Frecuencia I 11 47 76 68 74 46 39 15 o 8

¿Los datos pueden considelalse distribuidos con la distribución de Poisson con ): 4.6?

7 Los siguientes datos collcspondcr a los tienipos clc clulación (medidos en meses) de lámparas
malca Lucky:

3.33 6.71 2.53 7:5 16.82 3.56 0.17 2.r5 3.51 7.24.

a) Estudie si es razottablc suponer c¡Lc los clalos colresponclen a Lrn¿r distlibución exponencia.l;
il
9.6. Ejercicios 297

b) ¿Se puede suponer que la mediana de la muestra es igual a cuatro?

8. Los siguientes datos corresponden a los tiempos de vida (en semanas) de colonias de bacterias
criadas en un laboratorio bajo condiciones estables de temperatura y humedad:

3.31 5.48 7.37 7.44 2.73 4.r9 3.18 2.23.

En todas las pruebas use el nivel de significación del 10 %:

a) Estudie Ia aleatoriedad de la muestra;


b) ¿Es razonable suponer que los datos corresponden a una distribución exponencial?;
c) ¿Existe algún valor atípico en la muestra?

9. Se registró el caudal promedio (en m3/s) que ingresó a una central hidroeléctrica durante 12
días consecutivos:

99.0 79,8 77.4 87.8 59.0 7r.0 5r.4 92.7 69"4 68.9 70.r 90.2.

a) ¿Es razonable suponer que los datos son aleatorios?;


b) ¿Es razonable suponer que los datos tienen distribución normal?;
c) N{ediante la prueba de Wilcoxon, determine si la media de la distribución es 75m3/s;
d) Determine si existe algúl valor atípico.
t - l"l' si - 1 (r(
f(r) :{
1;
10. Se tiene la función densidad dada por r'\-/
L 0, casocontrario.
Se dispone de una muestra de mediciones de esta variable aleatoria:

0.03 0.01 0.32 0.88 -0.4t -0.18.

Utilizando las herramientas estadísticas adecuadas responda a las siguientes preguntas:

a) ¿Es razonable suponer que la muestra es aleatoria?;


b) ¿Es razonable suponer que Ia distribución de la muestra corresponde a la densidad dada
anteriormente?;
c) Independientemente del resultado de !a parte anterior, ¿se puede suponer que los datos
¡roviener C_e ,rrr Cistribr:clón rentrada en 0?

11. Se dispone de una máquina para llenar latas con 10cm3 de aceite (las latas llenadas al borde
tienen una capacidad de 11cm3). Un operario afirma haberla ajustado de modo que la cantidad
de aceite Uue envla el pico ae la¡alrina e.nvasadora es de (10+e)cm3, donde € es una variable
aleatoria con la distribución U I -+,+1. Para verificar la afirmación anterior se estudió el
contenido de 12 ratas out",.'i",'¿) r"t*;-tl/"."::1J::':" ,,
0.098 0.068 -0.004 -0.026 -0.012 0.096 0.050 0.062 0.036 0.04 0 0.054.

a) Determine si la muestra es aleatoria;


b) ¿Es razonable suponer que la distribución de la muest ra es l,l (-*
,01)?'
c) Si la distribución d.el error fuese l,l
(-+,r1) " error medio sería 0cm3. ¿Los datos
experimentales confirman la afirmación anterior?
298 Capítulo 9. Pruebas de Hipótesis -Aüo Parantétricas

\2. llrr fal¡ric:¿urtc ilc frrsiblcs asegura que) colr una sobrecarga del 207a,los tiernpos dc r.ida dc sri.
fusibles (descle (lue se conectan con sobrccarga hasta que se funden) se clistribuyen unifornenerrtL
cntrc 10 minntos y
15 minutos. Para probar esta afirmación Lrna mlrestra de B fusiblcs fue
sometida a Llna sobrecarga del 20%. Los tiempos en quc tarclaron en fundirse dichos fusibles
firerorr los siguientes:

13,34 10.69 13.37 77.r4 13.87 13.75 10.76 12.63.

a) Analice 1a aleatoriedad de la muestra;


b) la distribución de la muestra es U[10,15]?;
¿,Es razonable suponer que
c) Si la distribución de los tiempos de vida fr.rese U[10,15], el tiempo medio de vida sería cl¡'
12.5 min. ¿Los clatos experimentales confirman Ia afirmación anterior'/

13. En una empresa operadora de tarjetas de crédito se está analizando el historial del último an,,
de1 consumo mensual de un cliente. Se conoce que el promedio de sus conslrrrros es 645 dólares
y desviación estándar de 148 dólares. Si se encontr'ó que este mes tuvo un consumo de 320t,
dólares, ¿debe considerarse que el cliente tuvo un comportamiento atípico?

L4 La población ecuatoriana adulta tiene una estatura promedio de 162 cm y desviación estándal
de 7.5 cm. En una muestra de 25 personas) ¿a partir de qué valores de la estatura podeno.
colsiderar que hay presencia de valores atÍpicos? (Use cr : 0.05).
Pruebas sobre dos muestras
15 En dos laboratorios se realizaron rnediciones del punto de ebullición de nn compuesto de silicr,-
(en "C) de 8 muestras diferentes.
Muestra 1 2 3 4 5 6 7 8
Medic ón1 99.78 99.17 100.06 100.14 99.43 100.60 100.59 99.98
Medic ón2 100.16 100.09 99.91 100.36 99.77 101.09 99.93 100.06

Determine si los dos laboratorios entregan igr-rales resultados, usando a : 0.05.

1b Se presume que un tratamiento reduce el peso de las personas. Mediante una muestra aleatoli.
se seleccionan 10 personas que siguieron dicho tratarniento durante todo el tiernpo exigido. E:
la siguiente tabla se presenta el peso de cada paciente, antes y después del tratamiento (rnedid
en kg).
o
Persona 1 2 r) 4 5 6 7 B o 10
Antes 108 72 B1 r04 69 /d n, tl4 86 92 98
Después 95 76 69 B1 56 81 92 B1 77 97

Verifique si el tratamiento es efectivo. (Use o :5%)


I7 Se tienen dos muestras, X y Y, independientes entre sí, qne corresponden a mediciones de nivele-
de contaminación sonora en las ciudades de Quito y Guayaquil. Se desea saber si arlbas ciudade=
tienen similares niveles de contaminación o si alguna de ellas presenta niveles significatir.'anert.
rnayores.
X 70.1 70.4 75.8 67.5 68.4 7 76.9 I 75.7 77.4 7U.J 72.7 69.E
Y 74.3 74.1 75.4 67.4 69.3 70.5 I 70.1 69.9 68.7 70.3 70.7 7t.7 74.4 7^1

l8 Para caLcular la velocidad de cálculo de dos computadoras A y B, se realizaron en arlbas


operaciones. Los tiempos invertidos, en milisegundos, fueron:
A 110 125 74r 113 IB2
B r02 120 135 7r4 775

Analice si hay diferencias entre las localizaciones de las dos muestras. Use a:570.
9.6. Ejercicios 299

19. Los siguientes datos son los tiempos de duración (mcdidos en meses) de 10 lámparas marca
Luckv:
3.33 6"T1 2.bz r.rb 16.82 3.b6 0.r7 2.r5 3.b1 7.24.
Se dispone ahora de una nueva muestra, independiente de Ia anterior, de los tiempos de duración
de Iámparas de marca Wizard:

5.60 3.03 7.46 r.6.52 0.37 0.58 3.38 9.15 0.90 4.44.
Implernente una prueba de cornparación de rluestras para concluir si es razonable suponer que
las nuevas iámparas tienen la misma duración que las anteriores.

20. Los siguientes datos corresponden a los tiernpos de vida (medidos en nanosegundos) de partÍculas
radioactivas emitidas por cierto material:
20.05 1.30 2.54 1.95 9.20 4.20 1.84 7.02 5.60 1.80.

Para un nivel de significación del 10%, estudie:

a)la aleatoriedad de Ia muestra;


b) si es razonable suponer que los datos corresponden a nna ley de Pareto, caracterizada por
la siguiente función de distribución:

rr,--\
\:L): Ilt-! r
si r>l;
|. 0. caso conl rario

c) Se dispone ahora de una nueva muestra independiente de la anterior correspondiente a los


tiempos de vida de partículas radioactivas emitidas por otro material:

2.60 4.81 12.79 3.82 7.2r 1.68 15.50 12.03 r.70 9.40.

Realice una prueba de comparación de rnuestras para concluir si es razonable o no suponer


que los nuevos datos tienen la misma distribución que los anteriores.

2I. Se tienen dos muestras independientes entre sí, correspondientes a los tiempos de duración (en
años) de sistemas electrónicos de marcas distintas. Se desea saber si los equipos de arlbas marcas
tienen niveles similares de Curación o si alg.,rna de ellas presenta una duración significativamcntc
lnaYor.

Ir'Iuestra X 2.00 0.67 0.58 r.46 0"28 0.43 r.02 0.96


Muestra Y 0.20 r.73 0.30 0.02 0.05 7.57 1.46 0.14 0.32 0.60

Utiiizando un nivel de significación del 10 %:

a) Aplique La prueba cie rachas a ias muestras para decidir si se pueden suponel aieatolias;
b) Aplique a ambas muestras las pruebas de siglros y de rangos signados de Wilcoxon para
decidir si los valores X^:0.69 y Yrn:A35 son vaLores aceptables para las medianas;
c) Pruebe si la mediana de la muestra X es mayor que Ia de la muestra Y.
22 En una investigación de mercado se pidió a dos niños que calificaran a 10 juguetes en orden de
preferencia (de 1 a 10), obteniéndose la siguiente tabla:

Juguete A B C D tr F G }I I J
Niño 1 B I 6 2 1 4
I
J 7 O
rJ r0
Niño 2 7 10 8 5 a 2 4 6 1 9

Determine si las calificaciones están correlacionadas.


300 Capitulo 9. Pruebas de Hipótesis -h[o Parantétricas

at
¿¿ En un estudio sobre cor¡.ercio internacion¿.r1. sc orrlcn¿rron dc rnaner¿r decreciente a los principai,,-
socios comerciales sudanericanos de Ecu¿rdor v Algcntina.

Socio Col. Per. Bra. Ven chi. Bo1. Par.


Ecuador 1 2 3 4 r
(J 6 7
Argentina J ,1 1 o 2 7 6

Calculc ei coeficiente de corleiaci<in rle Speannan v verifiqr-rc si hav asociación entre Ias ordeu¿.-
crones.

24. Las siguientes son las calificaciones obtcuidtrs por 11 jtir.erres cluc se soneticlon a evalllacionÉ.
en destreza rnanual v memoria rrislr¿rl.

D. manual 1 3 4 5 6 8 l0 11 13 I4 16
M. visual l8 j,J an
11 15 16 31 39 5ti 45 43 t) I

R.ealice una prueba para determinar si existe correlación errtre las calificaciones en las dos er'.--
luaciones.

25. Un grupo de irn,estigadores desea er.alrlar si un nuevo equipo dc tratamiento aguas residual¿.
es efectivo para reducir Ios niveles de contaniración de las agllas vertidas a rrn río por 1.
curtiembres. A tales efectos se midió el nivel de contaminantes antcs v despnés del tratarnient,-
Ios resultados fnelon los siguientes:

Planta I 2 3 4 5 t) 7 B I 10
Antes 1.52 2.92 4.44 4.24 t.72 3.70 3.64 4.82 2.72 2.08
Después 2.08 303 0.80 096 2.7r 2.39 3.07 2.87 0.33 r.76

a) Detenliue si efcctivamcnte se lta proclnciclo rrna reclucción en los rrivcles cle contaminacic,:
b) ¿Las dos muestras están cor-relacionadas?
Ca pítu lo 1ü

Regnesión Linea N 5¡mple

Tod,os los 'modelos estárt, eryr:tuocodns, pe'ro o,lqun"os so¡t, títiles


G. E. P. Box

¡Iuchas de las aplicaciones estadísticas requieren la estimación de las relaciones existentes entre dos
' más r'¿rriables; por ejcmplo, puede ser necesario responder a las preguntas ¿cómo varía el prccio
:-,lomedio anual del maí2, según la producción a nivel nacional? o ¿cómo varÍa el consunio de gasolina
le nn ¿rulo. según su peso y ia potencia del motor? trl interés se centra, entonces, en determinar una
.cnación clue relacione Llna variable dada con nna o más variables que contienen información sobre
.,i primera. A estos problemas dedicaremos los dos sigtr,ientes capítulos; antes reviscmos algo de Ia
--istoria de esta parte dc la estadística.
lio exactitud, quién y cuándo empezó a tratar de expresar algebraicamente las rclaciones
se conoce) con
.ltre dos o más vanables, de las cuales solo se dispone de un conjunto de observaciones; pero eu los
-scritos de Leonardo da Vinci, cuando él trata de las proporciones del cuerpo humano, se encuentt'an
.:lpresiones aritméticas que relacionan las medidas de diversas partes del cuerpo.
-,-n
intento, que está bien documentado, data de 1755, cuando Boscovich y Christopher Maire estaban
-lcargados de medir la longitud del arco de meridiano qne pasa por Roma. Boscovich concibió nn
,étodo para encontrar nn modelo que relacione los datos correspondientes a dos variablcs, mediante
., empleo de las llarnadas <<regresiones elementales>>. Esta técnica fue mejorada por su autolen 1760
'' I.L-.esii.:l Lir.a ícrl,a iriás csi,rticl.ti¿r,j.e por Laplace) Linos alos más tarCe.
rn 1805, Legendre publicó una obra de astronomía, en la que describió el método de los mÍnirnos
- radrados y 1o aplicó ai ajuste de datos observacionales. Tarnbién, hay una serie de artículos pre-
.-ntados por C. F. Gauss a Ia Sociedad Real de Gotinga en los que describe el método de mínimos
Ladrados. Luego, en 1885, Sir F. Galton presentó en la rer.'ista IYature el desarrollo complcto de esta
-=cnica. aplicada a lo que él denominó modelos de regresiótz. A partir de esta fecha se mejoró y se
-,mpietó la técnica, haciendo que ella sea la de nayor erlpleo en el ajuste de coniuntos clc datos"

-,ctualilente, la construcción de modelos lineales es Ia base de todas las técnicas estadÍsticas de


rtriraleza predictiva y su aplicación se ha extendido a prácticamente todas las ciencias.

10.1-" Vlodelos deterr¡linistas y probabilísticos


I,tisten aplicaciones en las que se dispone de un modelo que presenta nna relación exacta entre las
.riables cie interés; por ejemplo, 1a ley que desclibe el tieilpo que tarda en caer un objeto dcsde nn¿r,

301
Capítulo 70. Regresión Lineal Simple

altura dada, o la fórurula que nos indica el interés ganado por un capital, dados la tasa de interés y e1

periodo de la inversión. Tales modeios se denominan determ'intstas.

Sin embargo, en la vida diaria, tara vez se presentan fenórnenos que reproducen con exactitud una Ie¡'.
ya sea porque existen errores en la medición o porque hay otras variables que no son consideradas.
por stl escasa influencia, pero que son sufi.cientes para que el modelo propuesto no sea exacto.

Un modelo en el que una o más variables es de naturaleza aleatoria se denomina probabi,lísti,co y a


Ia determinación y examen de la calidad del modelo encontrado se llama anáIis'ís de regresr,óru

Figura 10.1: Modelos determinista y probabilístico.

Destaquemos algunas de las más importantes aplicaciones del análisis de regresión:

1. Descripción cuantitativa de las relaciones entre una variable dada y un conjunto de variables.

2. Interpolación entre valores de una función.

3. Predicción v pronóstico de datos.

En lo que sigue, nuestro interés será determinar una ecuación clue relacione una variabie dada con otra
variable de respuesta, bajo el supuesto que ellas se vinculan mediante una ecuación lineal de primer
grado, caso particular conocido como regres'ión lineal si,mple.

LO.2. Modelo lineal simple


R,ecordemos que ia ecuación de Ia recta es

lJ: l3ol7fl,
donde B¡ es la intercepción de Ia recta con el eje y y Ér es la pendiente de la recta. (Véase Figura
10.2)

Intercepción
- Pendiente:p,
-{
! = fro

Figtrra 10.2: Recta de ecuación ?J


: 0o-l /tn.
70.2. Modelo lineal sirnple 303

Este rnodelo es determinista porque no considera el error y los valores de g se obtienen, de manera
exacta, al sustituir los valores de r en la ecuación de Ia recta.

Cuando se desea incorporar al modelo determinista ei efecto aleatorio de las variables se le añade una
componente que corresponde al error y el modelo queda como

a: 0ot Ap I e, (10.1)

donde

g es la variable a ser modelada o uariable dependiente.

r es la variable que se Llsa como predictor de g o uariable independiente.

e el componente aleatorio del error.

Bg ia ordenada del punto donde la recta interseca al eje y.

B1 la pendiente de la recta.

A Ia variable indepenciiente, tarnbién, se Ie denomina pred'ictoru y a Ia variable dependiente se llarna


respuesta.

Para recoger el efecto aleatorio del error, harenos las siguientes hipótesis sobre e:

1. Se distribuye normalmente con media cero y varianza o2'. € - A[(0,o21 .

2. Los errores, correspondientes a dos observaciones distintas, son independientes entre sí: E(e ¿e¡) :
0.

Ejernplos de modelos de regresión que se presentan en la vida cotidiana son los siguientes:

,
u €
Efecto del nivel socioeconómico,
Presupuesto de gastos Número de miembros
tenencia de la vivienda, servicios
de un hogar del hogar
que dispone, etc.
Efecto de la zona de ubicación,
Precio de nn
Area de construcción trpo cie acabados, piso en el que
departamento
se encuentra, etc.
Efecto de las variaciones climáticas,
Crecirniento anual
trdad del árbol variedad del árbol, fertilización de
de un é.r1-.ol
Ia tierra, etc.
Número de páginas Efecto del tipo de papel, la encua-
Precio de un libro
del libro dernación, número de ilustraciones, etc.

rn el análisis de regresiónes necesario tener en cuenta los siguientes pasos que llevan a estimar un
'len modelo) que se ajuste a los datos:

Tener una visión clara de los objetivos del estudio, para determinar cuál ha de ser Ia variable
respuesta y qué variables pueden incluirse como variables independientes.

Recopilar los datos correspondientes a las variables identificadas como dependiente e indepen-
dientes.
304 Capítulo 70. Regresión Lineal Sirnple

3. Postular un modelo, al que se supone se a,justan los datos (en nuestro caso se presume que es €-
Iineal simple).

4. Determinar la ecuación de regresión; es decir, estimar los coeficientes del modelo propuesto.
I
L,. Comprobar estadísticamente la adecuación del modelo. Esto incluye la realización de prueba..
estadísticas sobre los parárnetros, la ejecución de transformaciones de las variables para obtene:
un mejor ajuste o retirar variables de nna ecuación si su aporte no es signiflcativo en ia ecuació-
de predicción.

6, Cuando la ecuación sea satisfactoria, usar el nodelo para efectuar estim.aciones o predicciones.

Una vez que se han curnplido los tres primcros pasos) nuestro objetivo será estimar los coeficientes de
modelo y comprobar la adecuación del modelo.

1-0.3. Método de los mínimos cuadrados


Para estimar los coeficientes de la ecuación de regresión se empleará el método de los mín'imos cnadro-
dos, consistente en minimizar la suma de los cuadrados de los errores; esto es, que si se nota a l¡.
ecuación de predicción por
i : bo I btr, (10.2

donde bo y h son los estimadores de B¡ y B1, respecti-u'amerrte; ellos deben ser tales que la surla d¡
los cuadrados de las diferencias entre los valores observados de la variable respuesta y su estimaciór-
por la ecuación de regresión sea mÍnima.

Figura 10.3: Interpretación del método de los mínimos cuadrados.

Si se dispone de n pares de observaciones de las variables independiente y dependiente (r1;yt), @z;yzl.


..., (rn;A"") y si fr son los valores de las predicciones de y:
0¡: bo * bp¿.

Entonces, los residuos de la predicción (errores) se calculan por e¿: U¿ - i¿.

Nosotros buscaremos los valores de ó¡ y b1 eue minimicen la snma de los cuadrados cle los errores.
tarnbién llamada suma d,e los cuadrados de los res'idu,os:

scE : >,"::f,fun-\)2
: Llr, - (bo + lrr¿)12
i:7
305
70.3. Método de los rnínitnos cuadrados

ecuaciones:
Dcrivando SCE con resPecto a b6 Y b1 , e igualando el resultado a cero se obtienen las
11

a6c E) : -z\(ur - bo - b1r¿) :0,


0bo i:r
TL

a6c E) : -2|u.(s. - bs - b1r¿) : Q,


0bt .i,-1

clya solución es
1a

D@¿ -',)(tt'¡
i-l
- Y) gCru
(10.3)
h: TL
r) SCr"'
Llr¡ - -rt )-
i:I
(10.4)
b6 : U-bti,

i",
TL

;,1
Dv
i:7
,iurrclcn-:-j--t'g: sonlospromecliosclclos\¡aloresdelasvariablesinclependientey
?.1 17
,-Lr:penclietite.
queda establecid¿r
u na vcz obtenidos los valores de bs y b1 se
los sttstituye en Ia ecuación; de esta manera
ia recta cle predicción pol m'ínimos cuadrados:
i:bo*b1r'
se clebe tener presente la incorporación de elroles
Observación. En Ia estimación cle los parámetlos de
ie lecloncleo en el cálculo de sc", t- d'e scrr; se recotrriettcla el empleo de un nírrnero suficiente
-ifrassigrrificativasalrealizarloscálculosdeforrrrarnanllai.
de los automóviles v stl con'sulllo
Ejemplo. En un estudio pala determinar la relación entre el peso
con los sigttientes resultados:
ie combustible se escogió .,r,,a rl].,estra de 10 caIlos,

Co"s.,mo (l/100 krn)

leterminar Ia ecuación de regresión lineai simpie'


jolu,ción: prirlero, establezcamos que la variable independiente es el peso y la dependiente
es el

, )l I ilLl ]llf)

rrlra tabla:
?ara simplificar los cálculos, Iestl]nalnos los componentes eu
z: 996.1; ?l :11.4.

.Lí '9¿ Íi-r


739 B -257.1 -3.4 66100.41 874.14
1187 16 190.9 4.6 36 442.8r 878.14
655 6 -341.1 -5.4 1t6349.2t 1841.94
729 rt75.24
7 -267.r -4.4 71342.4r 475.64
8BB 7 - 108.1 -4.4 11 685.61
797 I - 199.1 2.4 39 640.81 477.84
1.3.24
963 11 -33.1 -0.4 1095.61
802 12 - 194.1 0.6 37 674.87 - 116.46
1551 18 554.9 6.6 307 914.01 3662.34
1650 20 653.9 8.6 427 585.21 5623.54
1 115 830.9 14 905.6
Suma
Capítulo 70. Regresión Lineal Simple

Sustituyendo los valores de las slrrrras en las fórmulas (10.3) y (10.4):

,- :
b-
sC,,
--*v 14 905.6
:f-).r-1131.
sc,.,- I 115 830.9
bo : A -bt7 :11.4-0.0134 x 996.1 : -I.9477.

Entonces, la recta de ajr.rste por el método de los mínimos cuadrados es

0:-7.9477+0'0734r.

Ahora se puede, por ejemplo, predecir el consurno de un auto que pesa 1000 kg; esto es, z : 1000:

i: -7.9477 +0.0134 x 1000 : Lt.45.

LO.4. Comprobación de Ia adecuación del rnodelo

Una vez que se halla una estimación de la recta de regresión) es necesario determinar si 1¿ ss11¿gir-:-
obtenida es un buen rnodelo para los datos y cuantificar el elror que se cornete cuando se emplea t:.-
ecuación. Ésto se logra mediante el empleo de los coeficientes d.e correlación y de d.eterminación, ¡- .,
través de la realización de pruebas estadísticas sobre los parámetros.

10.4.1. El coeficiente de correlación

Recordemos que si se tienen dos variables aleatorias) una medida de Ia relación que existe entre ell¿-.
es el coeficiente de correlación p. Análogamente, para determinar si existe una reLación lineal entre le-¡
variables predictora y de respuesta se utiliza el coeficiente de correlaczón I'ineal de Pearson, denotad
por r, que se define por
11

L,r¡A¡- nrA

El coeficiente de correlación tiene las siguientes propiedadcs:

1 El rango de variación de r está entre -1 y 1, siendo su signo el mismo que el de br.


2 Un valor de r cercano a cero indica que no existe o hay poca relación (lineal) entre r y y.

3 Valores de r cercanos a 1 o a -1 indican que existe una fuerte relación entre Ias dos variables.

4. Si r : I o r - -1, todos Ios valores caen exactarnente en la recta y se tiene un model,-


deterninístico.

En la Figura 10.4 se rnuestran diversos diagramas de la rclación entre r y A, segúrn los valores de r.
70.4. Cornprobación de Ia adecttación del rnodelo 307

f*e t
. * \
ü*
A%\
*aa ó
*&-ó úg

Be **s
'd"s
I r r.;.ru1 7*

r = [1.ó7

: tgura 10.4: Diagratnas de dispersión de los datos y valores aproximados del coeficiente de correlación.

:-empre debemos tener en cuenta que el coeficiente r solo aporta información cuando existe tura
-.-ación lineal entre las variables. Pudiera suceder que se tenga un valor de r cercano a 0 v, sin
.:.rbargo, haya una relación no-lineal entre las variables.
308 Capítulo 70. Regresión Lineal Sirnple

Como el coeficiente r es un estimador de p, se pueden efectuar pruebas sobre la significación de


coeficiente de correlación muestral.

Prueba de hipótesis sobre p

1. Hipóteszs Nula. Hs: p: Q.

2. Hipótesi,s Alternatiua. H1: p 10.

3. Estadístico de Prueba. tobs :


rJn=2
JT -7
4. Regi,ón de Rechazo. Se rechaza I1s si tob" 1 -tolz(n - 2) o tob" ) t.¡2(n - 2) .

Tarnbién, se pueden conducir pruebas unilaterales sobre p, pero ellas solo tienen un valor estadístic-
y su valor práctico es restringido.
Ejemplo (Continuación). Para los datos del consumo de gasolina de los automóviles: a) caicr-rla--
el coeficiente de correlación de Pearson; b) realizar una prueba para probar si p : 0 al nivel o=
significación de 0.05.

Soluc'ión: Los componentes de r son: ,SC"" : 1115 830.9, SCaa :224.4, $Cxu :14905.6.

a) trl coeficiente de correlación es

$cw 14 905.6
:0.94197.

Como r es muy cercano a 1, existe una fuerte relación lineal entre las variables.
b) Para la prueba bilateral consideremos un nivel de significación del 5 %,

1. Htpótesis Nula. Hs: p: Q.


2. Hi,pótesi,s Alternatiua. HI p + 0.

3. Estadísti,co d,e prueba. tobs :'F= -


Q'9419n\n0 -?: 7.g4.
JT -F v/T -@.s'reú
4. Regr,ón de Rechazo. Tenemos que ús.¡25(8) :2.306 y Ia región es lúr¿"1 > 2.306.
5. Decisión. Corno 7.94> 2.306, se rechaza llo; es decir, hay evidencia que indica que exist-
correlación entre el consumo de combustible y el peso del carro.

LO.4.2. El coeficiente de deterrninación

Otra medida de la relación entre las variables es eI coeficiente de deterrn'inación, 12. Su empleo st
debe a que da mayor frterza de interpretación a la relación entre las variables. Tenemos que
n n
er1
DUay :D@o - y)2 :Dr? - ne2,
i:). i:7

que se le conoce como surna de los cuadrados alrededor de la media de y o suma de cuadrados corregzd -
de y.

Si denotamos por:
70.4. Contprobación de la adecuación del rnodelo 309

SCE -- D(ao - fr)2, que se denomina como sttma, de uro,drados de los erT'ores. Este término
i:I
también se puede calcular mediante la relación

SCE : SCr, - b1SC,y : SCo,


W
" SCR: i:r
i@o - ü2,se designa como suma tle los c'uo,dlrod,os d,ebid,o a la reqres'iór¿.

Se puede demostrar que

SCro SCE + SCR,


l7 1L 17

l,(uo
i:1
-il' fi:I tvo -0¡)2 +L(9, -il2
i:1

Entonces, tenemos que

^2 (5C,,,)2 scua - scE


sc,, sclu SC,,
: r- SCE
sc,
También, se puede expresar como
scr, - scg _ scR
' _-
^,
sciu -sc*
Interpretación. El coeficiente 12 tor.ra valores entr-e 0 ;, 1 y se puede interpretal de v¿rrias maneras:

1. Como medida de reducción el error total. Cuando SC E : 0, 12 : 1 y cutrndo SClt : 0,


12 : 0 Luego, 12 r"pte.er.ta la reducción lclativa en la suma de ,SC, cuando se lia ajustaclcr
nna recta de regresión.
Por ejemplo, un valor de 12 -- 0.7 significa que el 70% de la variación total es explicada por Ia
recra qrle ajrrsta los datos y el 30% restantc es atribnible al error de a.juste.

2. Como rnedida de bondad de a.iuste. Clrando el ajuste es perfecto, t-2 :I y cuanclo no hery
ajuste, 12 : 0.

Cuanto rnayor sea el valor de 12, mejor será el a.juste y mayor utilidad tendrá corno instrumento
de predicción.

3. Como rnedida de la linealidad de los puntos. Cualdo 12 se aproxima a 1, el gr:ifico de los


datos se acerca a una línea recta. Si la relación entre dos variables no es lineal, 12 : 0.

Ejernplo (Continuación). Para los datos dei consllmo de gasolina de los automóviles, calcttlal el
:oeficiente de determinación.

Solu,c'iótt,: Se tiene que

SCE scau-W _ r-ta4 A


-
t, 14 905.6)2
1115830.9
25.287.
310 Capítulo 70. Regresiór Lineal Simple

De rnodo que
25.287
t'2:l- : 0.8873.
224.4

Es decir. el 88.73 % de ia variabilidad de ios datos es recogida por la recta cle regresión

10.4.3. Estimación de la variayrza de la regresión

Al ploponer el modelo probabilístico


a:00-lp.rlt
se estableció que elerror aleatorio está distribuido segirn una ley normal de media cero y varianza o2.
Entonces, cada valor obseru'ado de g está influido por tal error. Adernás, a los errores asociados con
distintas observaciones se los considerará mutuamcnte inclepcndientes.

La varianza o2 del error es desconocida y su estimador insesgado es

SCE
r¿-2'

A s. que es la desviación estándar de Ia regresión muestr-al, tarnbién se la denonina error estó"nd,ar dt


estim.o,ción.

Ejemplo (Continuación). Calcular Ia estimación de o2 para los datos del conslrrno de combustible
de los carros.

Soluciór¿: Anteriormente se obtuvo que ,SCE :25.287. De rnodo qr,re

,,: SC E 25.287
:3
's' 161'
"
1: 10 J

Auuque s2 se puede considerar una medida de 1a calidad cle ajr.rste, su principal utilidad se encuentL¿.
en la determinación de la bondad de ajr-rste, ya sea mecliante un intervalo de conflar^za o con Lrn¿-
prueba dc hipótesis.

LO.4.4, Inferencias acerca de Ia pendiente de Ia recta, Pr

En primer lugar se desea estudiar si existe o no existe relación entre las variables r y A. Se dese¿-
coutestar a la preguuta ¿aporta r información pala predccir 17? Esta pregr-rnta se refiere a Br, pues
afirmar que y no se lelaciona linealmente con z equivale a decir que B, : 6.

Eutonces, se desea probar la hipótesis nula <<r no contribuye con ilformación para predecir y>>; contr:^
la hipótesis altelnativa, <<las valiables están rclacionadas de forrna lineal con una pendiente distint¡
de ccro>>; es decir,
Ho, 0t:0,
Hr 0tlo.
Para efectuar Ia prueba habrá que encontrar l¿r distribuciól de lnuestreo de 1,1 .
Y

,i
70.4. Cornprobación de la adecuación del rnodelo 311
[,

i
Distribución de muestreo de b1
1{,

Si los componentes del error son variables aleatorias independientes normalmente distribuidas con
nredia cero y varianza o2, la distribución de muestreo del estimador b1 es norrnal con media B1 y
desviación estándar
o
ubt
JSe;
Ésto quiere decir que b1 es un estimador insesgado para p1, pucs E(b1) : 0t y que la desviación
estándar de b1 puede estimarse pol
5
q,
"ut
\/ /.d7'-,
JV, ,.

donde s es el error estándar de la estimación.

Entonces. la variable aleatoria ¿:b'- Sbr A' sigue una ley ú a (n-2) grados de libertacl.

Prueba de hipótesis acerca de Ft

a) Prueba unilateral.
1. Hi,pótesis Nula. H6: B, : g.
2. Hi,pótesi,s Alternati,ua. Hr 0t < 0 (o bien .Í11: É, > 0).
3. Estad,íst'ico d,e Prtteba. tobs: --L
slt/Se -,'
4. Región de Rechazo. Se rechaza 116 si tob" 1-to(n-2) (o bien úo6" ) Lo,(n-2) cuando 111:
Ér > o')
b) Plueba bilateral.
1. Hzpótesis Nula. Hs: Br: g.
2. Hipótesr,s Alternat'iua. HI 0t * 0.

3. Estad,ístico d.e Prueba. tobs:


--L
sl\/Se;,'
4. Regi,ón de Rechazo. Se rechaza ,116 si 'tob, I -t,,lz(n - 2) tobs ) t.¡2(n - 2).
"
Intervalo de confianza de 100(1 - o)% para p1

Lin intervalo de confianzapar'¿" Ia pendierite 0t, a nivel 100(1 - ct)7o es

'\tl'\ - 2)-+; u/L\ - 2)-:-)


t L.¡2(n
(0,
y - r^n(n 'JSC, b1
',r/sc,; ) .

Ejernplo (Continuación). Para los datos del consumo de cornbustible de varios carros: a) probar
.i Br :0, a ttn nivel de significación de 0.05; b) obtener el intervalo de confianza algSTo.
Solu,ción,: Antes se había determinado los valores de s y de SCrr:
: r/3J61 : r.TTTS, sc",", :1 11b 830.g.
"
a) Realizaremos una prueba bilateral:
3I2 Capítulo 70. Regresión Lineal Sirnple

1. Hipótr:sis Nu,la. Hs: i3, : g.


2. Hzpóte.sis Altuno,ti.t,a.. Ht: Br l0.
0'0134
3. Estodístico d,r; - -:=1/se"., l.TTT\-1,rtr1r5i.y¡ag : -7 9615'
P,uel¡u,. 1,,b" ^j
I s

4. Región, tle Rechozo. Como tob" ) ioot¡(E) : 2.306 v la r-egión es lúo¿,"1 > 2.306
5. Dectsi,ón, Se lcchaza la hipótesis nnla.: es dccir, el consurno de combustible aument¿-
meclicla qlle se inclcrnrent¿-L el pcso de los carros.

b) trl intervalo cle confiarrz¿r es:

/rs\
(Lr - r" "rr, :t ,r-: t't i i,, .{tt 2)É)
(.,.,,,,-r.30b-]j.I1::{l'(}13.lr.30Ü+):(0.0095l0.0l73,).
\ vr11iE30.9 /rlr5ó30.9/

L0.4.5. Inferencias acerca de la intercepción de Ia recía, p,

Sr.rpongarnos c¡.lc se clese¿i ¿rr-crigrral si Ú¡ {)s r$ ual. 1or cspecífico: ello se logra efectuando
prucba rle hipótesis o colr un intervalo cie r:olfi A\Z ncra sirnilar a la rlescrita para p1 .

Se pttcrlc clentosl rar qlre la cLr-.svi¿r<:iórr est ¿i.rtcl¿rl cle

O[.¡o: o\

(l,o iloilñ Se;


El cstaclísti c,o l, - sigrro rrrra clist'ribución / con (n, 2) grados de libertad.

Prueba de hipótesis acerca de €o

1. f{i.pótesis lfu"l.o,. Hs: Bs : lJoo.

2. Hi,pótesis Alterno,ti,t:o,. H¡ P¡ I 0ou.


3. Ptuclt,t.
b¡ iJao rt 5C,,,
Este,d,í.stir:o tle lo[,., - IL

\),,i
4. Regi,ón r|,e Rech,azo. S¡.. rcclL¿r,za H¡¡ si t,,¡1," { -Lr, 12(n. - 2) o tub, )> to¡2(rt - 2).

lntervalo de confianza de 100(1 a)% para Bs

t.,,
i2(rt, 2') :lt¡¡!f ,,/:(n -

[,-
70.5. Análisis de la vartanza 313

Ejemplo (Continuación). Para los datos del consurno de combustible de varios carros: a) probar
si Bo:0, a un nivel de significación de 0.05; b) obtener el intervalo de confi.anza al957a.

Soluc't,ón:

a) Realizamos una prueba bilateral.

1. Hi,pótesr,s Nula. Ho: B.: g.


2. Hi,pótesi.s Alternat'iua. HI Bs 10.
3. Estadístico de Prueba.

n SC,, _ -L9477 - 0 10 x 1115830.9


:
11
1.7779 11 037 983
-1.101.

4. Región de Rechazo. La región crítica es lúo6"1 > úo.oz¡(B) :2.306.


5. Decisión. Como |- 1.1011 < 2.306, no se rechaza Hs; es decir, B6 pudieraser igual a cero.

b) El intervalo de confianza es

(
-, .rrr',- r.rouL]Zg./ffi : t roul3l@) : (-6.025; 2.130).
\ x 1115830 9 -r.()J77-
/10 v I 115830.9 J10 /

10.5. Análisis de la varianza


El procedimiento del anáIzsis de Ia ua,rianzc, (ANOVA) es una metodología estadística que permite
1a comparación de dos o más rnedias poblacionales midiendo la variación dentro de las muestras.
En nuestro caso emplearemos el análisis de la rraria\za para efectuar pruebas sobre los parámetros
estimados del modelo y asÍ conocer su exactitud.

Anteriormente establecimos que se cumple Ia siguiente igualdad:

l(ao -ü' : Ljr, -0)' +\(0' - ü2 (10.5)


i:t i:\ i:I
SC,o : SCE+SCR,

Significa que la suma de los cuadrados corregida es igual a la suma de cuadrados de los errores más la
snrna de cuadrados debida a la regresión.

La suma de los cuadrados corregida tiene (n - 1) grados de libertad, Ia suma de cuadrados de los
errores tiene (n - 2) grados de libertad y Ia surna de cuadrados debida a la regresión tiene 1 grado de
libertad. Es decir, la igualdad correspondiente a los grados de libertad de la ecuación (10.5) es

n-t:(n-2)+I (10.6)
314 Capítulo 70. Regresión Lineal Sirnple

De las ecnaciones (10.5) v (10.6) se tiene la tabla de análisis de Ia varianza) como la que se presen:
a continuación.

Tabla de Análisis de la Varianza


Fuente de Grados de Suma de Cuadrado
F
variación litrertad (9.1.) cuadrados (.9C) medio (I[C)
R.egresión 1 SCR AnCR.: SCRII p,
Lobs- ,
D
Elror o residi-r¿rl r¿-2 SCE s2: SCEI("-2)
Totirl corregido n-I SC uu

La colnmna dcl <<cuadrado rnedio> (htC) se obtiene al dividir cada una de las suma de ios cuadrad,,
entre sus correspondientes grados de libertad.

El valor de 4a" r-esu.lta de la división del cnadrado medio de la regresión para el cuadrado med-
AIC R
resld.rtal: tobo: a .
5'
Una vez elaborada la tabla de análisis de varianza, el valor de Fo¿" se emplea para conducir una pruet
de hipótesis sobre la razón de dos varianzas) qrre sirve para probar si Ér : 0. La prueba es Ia siguientt

1. Hipótesis l{tila. Ho: p, : g.

2. Hipótesi,s Alternat'iuo,. Ht 0t 10.


ATCR
3. Estadísttco de Prueba. Fobs : ,
4. Región de Rechazo. Se rechaza H6 si f ,¿,- > 4,(1, rr - 2).
Ejernplo (Continuación). Para los datos del consumo de combustible de varios calros: a) realiza:
la tabla de análisis de la varianza: b) probar si p, : 0, a nn nivel de significación de 0.05.
Solt¿ci,ón,: Las sumas de los cuadrados colrespondientes son

SC,oo - 224,4, SC E : 25.287. SC R : 199.113.

a) La tabla de análisis de Ia varianza queda como sigue:

Tabla de Análisis de la Varianza


t-uente de Grados de Suma de Cuadrado
variación libertad (g.1.) cuadrados (,5C) medio (I[C) F
Regresiór'r 1 199.113 199.113 62.99
Error 8 25.287 3.1609
'lotal corregido 0 224.4

b) Realizamos la prueba de hipótesis:

1. Htpótes"tsNula. H6: Br: g.


2. Hipótesis Alternetiua. H¡ p110.
3. Estadístico de Prueba. Fobs :62.99.
4. Región de Rechazo. Corro Fo¿" ) Foos(1,8) :5.32, Ia región es Foa" > 5.32.
5. Deczsi,ón,. Se rechaza 1a hipótesis nula. Es nrás, por la magnitud del estadÍstico de prr-reba.
se declttce que el nivel de significación del contraste es sumamente bajo.
70.6. Uso del ntodelo para estintación y predicción 315

10.6. IJso del modelo para estimación y predicción

LIna vez que el modelo es satisfactorio habrá que emplearlo para reafizar estimaciones y predicciones
que servirán para analizar el comportamiento de la variable respuesta ante condiciones que no fueron
probadas empíricamente.

Previarnente establezcamos Ias diferencia entre intervalos de estimación y de predicción:

1. Un intervalo de estimación se utiliza para estimar la media de Y, dado un valor de z; es decir,


estimar el valor lr¡ro mediante un intervalo, cuando :[ : :x0. Un investigador puede desear
conocer el consumo medio, para un peso dado del auto.

2. Un intervalo de predicción se utiiiza para estimar ur valor particular de Y, cuando n : ro;


es decir, estimar el valor Y0 mediante un intervalo de confianza. El investigador puede desear
conocer el consumo de un auto que tiene un peso dado.

Nótese que Ios valores de estimación y de predicción de Y son idénticos en los dos casos, la diferencia
radica en la precisión relativa de cada unar que se ven refleiadas en sus varianzas e intervalos de
confianza.

10.6.1. Intervalo de confianza para la estirnación, E(Y), cuando X: Xp

En el caso de la estimación se trata de calcular

E(Yr): Bst Bp,p,

donde r, es el valor particular de r para el cual se está haciendo Ia estimación. El estimador es

0p: bo I b1rp,

por tanto, las fuentes de error para estimar E(f) son b6 y b1 .

La varianza es

ol: o'(; - -ffi)


-2 -r(I,
("rr-;r2\

La varianza estimada correspondiente a f emplea s2 en lugar de o2 en la expresión anterior.

Lin intervalo de confianza aL100(1 - a)7o para la estimación, E(Yr), en el punto x, es

| (rp-r)2.-
(t t.;2, - 2)s
;-E::!r+t^¡2(n-2)s

10.6.2. Intervalo de confianza para Ia predicción, y, cuando X : Xp

ln el caso de la predicción el objetivo es calcular

Ap: l3ol l31ry,l €p,


31-6 Capítulo 70. Regresión Lineal Simple

el valor pronosticado cuando ro es el valor particular de r. EI estimador es

0p:bo!b:rp,

pero las fuentes del error de predicción son bo, b1 y €t).

La varianza es

oL-st:o'(t+1+Q--u)'\
\' "' sc,, )
y en su estimación se emplea s2 en lugar de o2 en la expresión anterior.

EI intervalo de confianza de nivel 100(1 - a)Tc para Ia predicción) Ap) es:

Ejemplo (Continuación). Para los datos del consumo de combustible de los carros, obtener Ic=
intervalos de estimación y de predicción para un carro cuyo peso es 1000 kg.

Solución: Como se indicó los valores estimado v pronosticado son los mismos:

ip : bo * b1r, : -7.9477 + 0.0134 x 1000 : 71.45.

La varianza o?v es

)
: 3161(++ (1000 -
1 115 830.9
996.1)2
: 0.316.

"v la varianza o?
\u-a^.
es
)

o'(t+;.ffi)
"/ r (r^-T)2\

(t+ (1ooo - ee6'l )2\


z.rct
\ 1o-
-1
1r1b830.e ):t'n"'
EI intervalo de estimación correspondiente es

-\/ : (tt.+s- 2.306v6]16;r1.45+ 2.306/0i16)


te
: (10.lb;12.75).

El intervalo de predicción es

Ie (rr.+s - 2s06\E.4TT ; 11.45 + z.zoe/z.+n)


(7.15; 15.75).

Comoseve,elintervalodepredicciónesmásanchoqtreeldeestinración.<
70.7. Formulación rnatricial de Ia regresión lineal 3t7

Se deberá tener Ia precaución de no usar el modelo obtenido para estimar el valor medio de g o
predecir un valor particular de g, con valores de r que se encuentren fuera del rango de la variable
independiente que sirvió para su elaboración.

E1 modelo podrÍa ajustarse perfectamentea los datos recogidos para hallar la ecuación, pero nada
garantiza que el mismo comportamiento se consiga fuera de tales límites, pudiendo darse un ajuste
bastante malo. (Figura 10.5.)

-v Recta de t')Error de
minimos -
- \-
',-Jnredicción
\
Relación verdadera
entre y y x
x
Límites de¡

Figura 10.5: Uso errado de un modelo para realizar predicciones fuera del rango de definición de r.

7O.7. Formulación matricial de la regresión lineal


Si se tiene n observaciones de las variables independiente y dependiente: (r1;at), (rz;Uz), ..., (*n;yn)
.' la ecuación lineal que las relaciona es

a:0olPple.

=ntonces, se tienen las siguientes igualdades:

at : B0 + Bp1+ e1,
az : BslBP2*e2, (10.7)

:-:
An : 0o-1 0p,, le,.

x- p: (i: )

Y es un vector n x I de las observaciones.

X es Lrna rnatrizn x 2 de los valores de Ia variable independiente, cuya primera columna tiene la
particularidad que todos sus componentes son iguales a 1.

es un vector 2 xI de los parámetros de Ia ecuación.


318 Capítulo 70. Regresión Lineal Simple

e es un vector n x 1 de los errores aleatorios.

EI sistema de ecuaciones (10.7) es equivalente a la igualdad

Y:XÉte.

Y si se nota como b al vector de los estimadores de Ios parámetros de regresión


/L
0o \

u:f ),
\01 /

se tiene el sistema de estimación de los parámetros 9: Xb.


EI vector de errores es igual a e : Y- Xb.
Con ello se tienel

ete : (y-Xb)¿(y-Xb)
Y¿Y-2bx¿Y+b¿x¿xb.

Derivando esta última igualdad respecto a b, e igualando el resultado a cero

\et e
:-2xtY+2xÚxb:o'
ab
cuyo resultado es el sistema de ecuaciones

x¿xb: X¿Y. (10.:

Las matrices X¿X y X¿Y son:


/n/tt\

XrX:l
l"D,,ll)ao\ y y:l I
n n h-
t'n D"?
I\ t:l i:t t\ ¡:lt,,a,
Si la matriz X¿X es inversible, se llega a la ecuación de estimación de los parámetros

b: (xúx)-1x¿Y,

La matriz (XÚX)-1 es

(X¿X;_l :
n / n \2
"l)*?-(D",)
i:r \¿=l /

Con ésto, Ios valores ajustados Y se obtienen evaluando

9: Xb.
tEn 1o que sigue se empleará la notación A¿ para indicar 1a matriz o vector transpuesto de A
70.7. Forrnulación tnatricial de la regresión lineal 319

;. la ecuación de predicción de un valor gp correspondiente a un rralor zo dado es

Up -- xlrb,

Con los consnnro de combustible de varios carros) plantear la


gresión contrar Ia ecuación de regresión.

entes m

p-(;:) ,:(1)
)
, : / 1
x/x I t\ / to 9961
(tin 1187 1650 ) -\ I

ooor 11037983 )

I / l
rxlxl-I : 11 15830e (
1 037 983
-9961

--,--
x'Y: / t I 1\ ( ttt
(táo 1187 rc50 ) \ 128 461 )

Así,

b: qxtx¡-1xty
: _t
1 / 11037983 -9961 714 -1.906 \
11 158 309 \ -9961 10 )( L2B 467 ):( o.o34 )
Por ianto, ia ecuación de regresión' ." g - -1 906+0 0134 r.

LO.7.l. Matriz de covarianza entre bo y br

Recordemos que
TL

n2 \- -2
o2 'i-1
Var(b1) : TL , Var(b¡) : ,)L

D@, - nl(n¿ - r)2


i.-1 ")2 rl

2La diferencia en el valor del término independiente entle 1as formuiaciones algebraica y matricial, se debe al núr¡ero
.le decimalesutilizados en el cálculo de la formulación algebrarca,
32O Capítulo 70. Regresión Lineal Sirnple

Además, la covarianza entre b6 y b1 es

: lr'r), br] - -ro'


-D
Cov(bs, br) Covl(! - IL

D@¿
l.:l
- ")2

Entonces. Ia matriz de varianza-covarianza del vector b es

l¿

"2Dr? L- T
-o
-no"
TL

: ( .J,1,1,j..1,, .i.",,0ü,1', :
't t,

L\r¿ - r)'
n
r?
\ 14 e\2
-'O
var(b, i:1
-
,i-7
) _o
-ro'
t
o-
t7 rL

D@¿
i.-1.
-r)2 D@¿
i:I
-r)2

Si sacamos fuera de la matriz el factor o2, resulta que

Var(b) : o'(X'X)-t

La varianza a2 se estima rnediante


2 }¡¿\-_btX¿\.
¡i:
¿-2

tO.7.2. Forrnulación matricial del análisis de la varianza

Con el empleo de la formulación rnatricial dc los componentes de la regresión se puede poner las sumas
de los cuadrados como

SCE: Y¿Y-brx¿Y,
/ n \2
lrv,)
t" /
scR b1x/Y - n
,

/ ,,\2
(Iu')
\r -l
SCoo : YtY - '/
'rL

Así. el coeficicnte de determinación, en formulación matricial, es igual a

,
T-
sCro

Tarrrbién, se puede reconstruir Ia tabla de análisis de la va,rianza en su forma matricial:


7O.8. a)ansforrnación de modelos no-Iineales a lineales 32t

Análisis de la Varianza

libertad (g.1.) medio (ll[C


scR:bf x¿Y -
1
; (É r,)
n-2 SCE:YfY-b¿X¿Y
IL
Total corregido SCao :"'t - * La
Ejemplo Con los da truir la tabla de análisis
de la vari

Soluc'¿ón: no de los t

: ((t -l I,

YÚY : (s

Drn :
;_1
r14.

Entonces,

SCR : b¿x¿ l4gg.n - !10 Q1q2: 199.11,


SCE : Y¿Y 4ggjr:2529,
SCro : YrY z+ - fi@al 2 :224.4.

Ccrr tc.lo lo anterior, se tiene la. t

Tabla de análisis de la varianza


Fuente de Grados de Suma de Cuadrado
variación libertad (g.i.) F
cuadrados (SC) nedio (I4C)
Regresión 1 199.11 199.11 62.99
Error 8 25.29 3.16
Total corregido I 224.40

Obviamente, la tabla coincide con Ia elaborada rnediante la formulación algebraica.

10.8. Transformación de modelos no-lineales a lineales

En rnuchas ocasiones los modelos no lineales pueden ser tratados corno lineales si se efectúan algunas
trattsformaciones a las variables, ya sea a la predictora, a la respuesta o a ambas.
322 Capítulo 70. Regresión Lineal Sirnple

A.1 ernplear tales transformaciones se deberá tener la precaución de verificar que el modelo modificad
cr"rnple con la hipótesis sobre Ia distribución que siguen los errores.

1. Modelo exponencial (Figura 10.6.)

Figtrra 10.6: \'Iocielo erponerrcial g :


"i3g+0'tr+e

EI m.odelo es
'g - gSoI0tt:+e '

Tomarido logaritmos cn ambos rrrielrbros,

Ini/:3oilttIe.
Si poncmos z : In;r7 qucda z : Aoi 0fl * e. c¡re es utt rnodelo lineal simple, que se estirna
?: bo * hr,
2. Modelo recíproco o inverso (Figur-a 10.7.)

Figr.rra 10.7: \'Iodclo recíproco 17 :


Ac) -l pp -l e

El modelo recíproco o iriverso es


1
U D)-.
Jg-f l)1:t f t

Tonando los inversos en ambos micmbros.


1
l)
JO -ft uQ I.r... t t c-
v

1
Poniendo Ia última igualdad qr-rcda corno
a
-.)'1..-r-
':90iLll.¿t¿.

qlre es un modelo lineal usual.


70.8. hansforrnación de rnodelos no-Iineales a lineales 323

3, Modelo multiplicativo o potencial (Figura 10.8.)

Figura 10.8: Modelo multiplicativo y : er,\€.

El rrodelo multiplicativo, también conocido como potencial, es

Y : o,r\€'

Tomando logaritmos en ambos miembros de la igualdad:

InY:lna*)lnr*lns'
Haciendo z :lna, ú : ln r, 0o :lno y 0t : \, el modelo se escribe como

z:Jo_3rt+t.
que se estima por ei modelo lineal 2: bo I bú.
Otros modelos no iineales comunmente utilizados son Ios siguientes:

4. Logarítmico. a: a* 01nr, en el que se utiliza Ia transformación ú: lnr.


D. Compuesto. A: aB", qre se linealiza mediante Ing: lna*lnBr.

o. Curva S. y - ¿a-lg/t, que se transforma en lng : a, I pt, con t: !.


T

Se recomienda que el lector realice las operaciones necesarias para linealizar estos modelos.
Ejemplo. En el desarrollo de un algoritmo de computación, para ser usado con una gran cantidad de
-rformación, se desea conocer Ia relación que existe entre el número de datos y el tiempo que emplea
',na computadora en entregar resultados. Para cada una de las distintas cantidades de datos, se
;icieron 10 mediciones del tiempo empleado y Iuego se calculó el tiempo promedio, según se resumen
-l Ia tabla:

No. de datos (millones) 1.0 1.5 20 25 3.0 3.5 4.0 5.0 t¿ 10


Tiempo promedio (""S.) 0.8 2.r 3.0 4.4 6.8 9.7 i3.6 22.3 40.3 72.4

ijustar los datos a un modelo multiplicativo.

icl,-tc'ión: El modelo propuesto es de la forma A : c,r\€.. Para transformarlo en uno lineal se deberá
-- mar logarit mos:

InY: lna * )lnr * lne'

i- suponemos que se cumplen las hipótesis básicas, que permiten tener un modelo de regresión lineal
.-.rple, entonces se tiene la siguiente ecuación de predicción lnf : lna * blnr.
324 Capítulo 70. Regresión LineaI Simple

Por tanto, se deberá reaTízar una regresión lineal de 1ny respecto a lnr.
Tomando logaritmos en las dos variables:

lnr 0.0000 0.4055 0.6931 0.9163 1.0986 1.2528 1.3863 1.6094 2.0749 2.3026
lna 0.223r 0.4719 1.0986 r.48 16 1.9169 2.2727 2.6101 3.1046 3.6964 4.2822

Efectuando la regresión lineal propuesta resulta la ecuación

Ini : -i'866 * 1'956 in r'

A continuación, si tomamos antilogaritmos en la igualdad obtenida, da como resultado:


-1"0 e 1,866+1 956ln z
¡: e I 866e1 956In¿
'u: 0.829 21
e56.

Además, se obtiene un coeficiente de determinación muy alto, del 99 Y,t, para la ecuación transformada.

A partir de la ecuación se podría proponer que e1 tiempo de ejecución de1 algoritmo es proporcional
al cuadrado del número de datos: A:0.8312. Para verificarlo es necesario realizar las pruebas de
hipótesis sobre los parámetros. Esta tarea se deja a1 lector.

10.9. Ejercicios
Modelos lineales

1. Se desea estudiar la relación entre la intensidad de regadío (r) y 1a productividud (y) de un


cierto cultivo. Se obtuvieron los siguientes resultados:
trL I 10 13 l5 18 13
At 36 44 4B 63 70 45

Ajuste un modelo lineal simple y calcule el coeficiente de correlación lineal entre las variables.
2. Se realizóun experimento pa,ra medir la velocidad del sonido en el aire a diferentes temperaturas.
Los resultados obtenidos se indican en la siguiente tabla:

Tcmperatura cn 'C (r) 1.)


1L) 0 I 20 .).f 50
Velocidad en m/s (y) 2qo tDt tr-
.)J 346 tro
r)r)tJ / ¿¿L 365

a) Estime la función de regresión lineal de g sobre r. Interprételos;


b) Calcule e1 coeficiente de correLación lineal entre las variables;
c) Pruebe si fr : 6'
d) Encuentre los intervalos de estimación y de predicción cuando J.a temperatura es 15'C.
a
Para detelminar Ia relaciórr entre el nírmero cle vendedores y 1as ventas anuaies (en rniles de
dólares) que tiene una empresa, se obtuvieron los siguientes datos:

Ventas 20 27 33 47

Se postuló que los datos se ajustan a un modelo 1inea1 simple.


70.9. Ejercicios 325

a) Determine las estimaciones de los parámetros 0oy 0t y escriba el modelo de regresión;


b) Grafique los puntos y la recta de ajuste;
c) Construya la tabla de análisis de la varianza y pruebe si Bt : g'

d) ¿Se ajustan bien los datos a la recta?

En un estudio para describir la relación entre la exposición al ruido y la hipertensión se realizaron


ias siguientes mediciones:

a) Realice r"rn gráfico de los datos y diga si es recorrrendable ajustarlos a un modelo lineal
simple;
b) Halle la ecuación de regresión simple que ajusta los datos;
c) Realice un análisis de varianza y pruebe la significación del ajuste;
d) Halle el coeficiente de determinación del modelo. Interprete su valor.
e) ¿Hay alguna manera de simplificar el modelo?
En una investigación de las propiedades de un pegamento de secado rápido se midió el tiernpo
que se demora en cristalizarse en función de la cantidad de pega depositada sobre uria superficie
de material cerámico de prueba.
Cantidad (g)
Tiempo (seg) 26.2 27.9 29.4 30.5 31.0 34.3

a) Ajuste los datos a un modelo lineal simple;


b) Realice un análisis de varianza y pruebe la significación del ajuste;
c) Construya los intervalos de confianza para los parámetros de regresión.
En una agencia bancaria se registró el núrmero de depósitos realizados y el monto total de estas
transacciones. en una hora de trabajo, con 1os siguientes resultados.

Monto total (en cientos de dólares) 10 5 7 l9 11 8


Número de depósitos 1t) I ,-) 25 7 AD
l,)

a) Realice Ia formulación matricial del problema y ajr-rste los datos a un modelo lineal. Inter-
prete ios coeficrentes;
b) Calcule s y obtenga un intervalo de confianza, al 95 %, para los coeficientes de regresión;
c) Evalúe 12 e interprete su valor. Pruebe si p : g'
d) Realice una predicción para cuando el núrmero de depósitos es 12;
e) Obtenga la tabla ANOVA y realice la prueba F' correspondiente.
En el mercado inmobiliario se realíza el. avalúo de una propiedad para luego efectuar su venta,
la diferencia constituye la ganancia del vendedor. En la tabla se dan los valores (en rniles de
dólares) de avalúo y precio de venta de doce propiedades en Quito.

Avalúo Venta Avalúo Venta


46.5 59.0 67.4 108.0
43.5 56.5 70.7 95.0
52.2 65.2 74.0 84.0
62.5 74.0 57.4 106.0
85.7 109.0 103.8 154.0
326 Capítulo 70. Regresión Lineal Sirnp.le

a) Grafique las variabics en un diagrania de dispersión;


b) Realice Ia formulación rnatricial del problerna y encuentre los estimadores de los parárnetros
del modelo;
c) ¿Aporta el valor de avalúo ¡ información para conocer el precio de venta y?;
d) Calcule 12. ¿Amerit:r realizar una prueba de hipótesis para probar si p: [?'
e) Obterrga tur interr.alo dc confianza de 95 % par:a el precio rnedio de una propiedad con un
avalúo de 72 mil clcilares. Interprete el intervalo;
f) Encuentre un intervalo de confi.anza al 95 % para el precio de venta de una propiedad
arraluada en 65 mil dólares. Interprete el intervalo.

8. El nna entidad finarrciera se desea tenel nn método que permita realizar pronósticos de las
ganancias obtenidas en base a inforrrración c¡re pueda estar disponible de ulanera rápicla. trl
gerente de crédito plantea uu modelo qr-re relaciorra el lúrrnero de préstamos realizados en Lln lres
v la ganancia obtcnida en el misrno períocio. P¡r¡r t¿rl efecto recoge la siguiente información de
los 8 Írltimos meses:

No. préstanos L25 131 r42 127 140 121 136 133
Ganancia 44 54 77 35 BO 47 66 ti5

Los valores de las ganancias están en cientos de dólares.

a) Encuentle la ecnacicln de reglesióu line¿rl sirnplc que relaciona'el núrmero de préstamos y la


ganancia;
b) ¿Es saiisfactorio el urodelo obteniclo'l ¿Por c¡ró'/;
c) Realice un análisis de la varianza;
d) Haga una predicción para un nles en el clue se otorgaron 123 préstamos y constrrlya un
intervalo aI95% para tal predicción;
e) ¿Cree que podría mejorarse el ntoclcio propuesto? 7,Cómo?

9. La siguiente tabla muestra la captr-rra de anchoas (captnra, en millones cle toneladas métricas)
v el precio de la harina de pescado (precio, en dólares por tonelada) para los úrltimos 10 años:

Año 1 2 ,) 4 i_) ú 7 8 9 10
Precic¡ 190 160 134 129 172 239 542 245 454 410
Captura (.¿,1 E,53 982 10.26 8.96 4.45 1.78 D'
t).r) 08 05

Construlra ios rnodelos lineales que lelacionen las variables (" - y) e interprete los coeficientes:
a) Precio 1' año;
b) Captura y ario;
c) Precio y captura;
Con el modelo que tenga 1a máxima correlación:
d) Realice la tabla ANfOVA e interprétcla;
e) Construya los interr.aios de confiallza para los coeficientes de regresión;
f) Realice la estim¿rción de y cn¿rndo r: 5.5.
70.9. Ejercicios 327

_1. Los siguientes datos corresponden al ritmo cardiaco en reposo (Y) v el peso (X, en kg) de 6
personas.

90 62
86 45
67 40
89 55
81 64
75 53
Dr¿: 488, Dg¿:319'
Dr? : 40092, Drnan : 26784, Dy? :17 399.

a) Grafique los datos y examine si parece que hay una relación lineal entre las dos variables;
b) Calcule los estimadores de los parámetros de regresión;
c) Obtenga la estimación por intervalo de Ia media cuando r : 88, al nivel 95 %;
d) Obtenga el intervalo de predicción de Ia media cuando z : 88, al nivel g5 %;
e) Calcule los coeficientes de determinación y de correlación entre las dos variables.

En un laboratorio de prueba de automóviles se mide la distancia de frenado en relación ctrn la


velocidad que lleva el auto, dando los siguientes resultados de 20 observa,ciones.
n
:
rL

7: 50, D@n -z)2 : 1600, D@n -r)(y¿ - e) 800,


i:7
a :30, rL

D(ao - ü2 :832.
i:7

a) Calcule Ia ecuación de ajuste para el modelo de regresión lineal simple;


b) Realice una tabla de análisis de la varianza;
c) Determine los intervalos de confianza de la estirnación y de la predicción al 95%o, para el
valor de Ia distancia de frenado, cuando la velocidad es ro : 69.

Se realizó un estudio para determinar el efectc que tiene la temperatura (r) sobre la c¿rntitlad
de gas residual generado (y) un proceso químico. Se analizaron 12 unidades nrnt:stlales y se
"r.
midieron las siguientes cantidades.

n:12, r:7.5, y:55.7,


72 72 12
Dr? : 42s0, Da? :279360, Droao: -23707.5.
i:l i:r i:7
a) Encuentre la ecuación de regresión lineal que explica la cantidad de gas por Ia ternperatura
del proceso;
b) Calcule el coefi,ciente de determinación;
c) Realice un análisis de varianza. Interprételo.

Uua teorÍa financiera sostiene que hay uua relación directa entre el riesgo de una inversiól y el
rendimiento que promete. El riesgo de una acción se mide por su valor, Ilamado p. En Ia tabla
se muestran los rendimientos y valores de 12 acciones:

Rendimiento 89 ¿.í) 15 ,) / 82 53 05 13 59 68 72
Valor Beta 1.5 1.9 1.0 05 15 18 13 -0.5 05 IB 19 19
328 Capítulo 70. Regresión Litteal Simple

Al a.justar un modelo de regr-esión a cstos cl¿rtos. se obtuvo las siguientes salidas:

Predictor Coef. Error Est. toh"


Intercepciiru 0.44 0.r22 3.62
Pendientc 0 L9 0.022 8.56

Fuente de variación g.l. SC MC F


R cgrcsiórt
Residrr¿rl 0.439
Total 11 3.649

a) Pruebe si los coefi.cientes del ruocleio son siguificativos. Escriba las pruebas .r, liru¡l¿s c :

sus valores y las regiones de rechazo;


b) Complete la tabla ANOVA e intcrpr'étela;
c) Calcule cl coeficielte de deterniin¿rcióri e irrterprételo.

14. Suponga qlre se ha ajustado trna línea r(x'ta a uu conjunto de 9 pare.jas de observaciones, dand,

a- x |l-
lJ - -¿ -r '.L'

Además, se obtnrrieron las siguientcs clcsr.iaciorres: (r;, - r): -4, -3, -2, -1, 0, I,2,3, 4 5"-
tabla de análisis de la valianza:

Fuente de variación g.l. SC IIC F


Rcgtt'sititt
R cs it lrr¿tl
Tot¿rl 3il0

a) Complete ia tabla AI{OVA;


b) R.ealicc rlna prueba cle adccuación del modelo.

Modelos no lineales
15 A continuación sc presentan 7 mediciories dc clos variables

:L 05 10 15 20 25 3.0 3.5
a 06 27 12.2 54.6 244.7 1096.6 4914.8

Encuentre 1a ecuaciórr de regresión cluc a.justa los datos, según un modelo exponencial y calcul.
el coeficiente de determinación.

16. En la siguiente tabla se encuerrtra el núrnrero de años para el vencimiento y el rendimiento d=


unos bonos.

Años para el vencimiento 1 2 5 l0 15 1B 23 25


Rendimiento 0.067 0.072 0.076 0.079 0.081 0.077 0.082 0.07E

a) Ajustc un modelo rnultiplicativo a los datos;

b) Ajrrsle un tnoclelo j :_uu


l,n r
-\t t.
c) ¿,Cuál de los dos modelos cree cs mcjor? ¿Por qué?
70.9. Ejercicios 329

17. Un ingeniero está investigando la relación eritrc l¿r veloc:irl¿'rd clcl r.iento y la cantidad de electridad
generada. Luego de 10 nediciones obtttr.o:

.)
Velocidad del viento ti0 60 /1
61 10.0 97 96 3.1 B2 6.2
Corriente generada l.58 t82 1.06 1.93 2.24 2.39 2.29 0.56 2.17 1.87

a) Ajuste los datos a un modclo de tipo lt -¡lr: +';r (.


/r t-t

b) Calcule e interprete el coeficiente de deter-miuación del modelo transformado.

18. El gerente de una ernpresa desea lelacional la evoluci<iu de Ias ventas y el gasto publicitario,
segúrn los datos que aparecen en el cuadro:

o.)
Ventas (9) L(l 15 18 .a¿ 25
Gasto (z) i9 22 4), 72 9B

a) Realice un ajuste de tipo rlultiplicativo y encuentre la calidad del ajuste;


b) Ajuste los datos mediante urra funciórr lirreal sin¡rle y compare con el ajuste anterior;
c) ¿Cuál de los dos modelos es mejor? Expliquc.

19 Considérese los datos que se presentan a corrtiuu¿rc:iól

f I T4 77 i1 8 10 5 7

v 0.34 0.26 0.18 0.30 0.40 0.27 0.48 0.42

a) Grafique los datos;

b) Suponga que las variables r, yy se vinculan mediante la relación y : En-


Ps 1- {3rr + e
cuentre los coeficientes de regresión.
c) ¿El modelo es adecuado para los datos'/ ¿Por: c1ué'/

20 A continuación se presenta la evolucióri anual clcl s¿rlario mÍnirno vital en nn país con alto índice
de inflación.

Año 1 2 J 4 5 6 7 B I l0 11 I2
S.M.V. 66 95 720 r20 I45 190 220 320 320 400 600 600

a) Grafique los datos;


b) Ajuste los datos mediante un modelo cxponencial;
c) ¿Qué se puede ciecir de la calidad de a.jrrstc de 1os datos a la cnrva de regresión?;
d) Realice una estimación del valor del S.N'f .V. en julio de 1994;
e) Si el S.M.V. en el año 13 ascendió a 900, ¿.es bueua la prediccióu r-ealizada'? Explique.

21. En astronomÍa se denomina año sideral al niulero de arios tcrrestrcs qlre un plancta se demora
en completar nna revolución alrededor del Sol y rlepencle de la distancia entre Ios dos astros.
En ia tabia se muestra la distancia promeclio ;' el arlo sideral para los planetas del Sistema
Solar. Emplear los datos para detelninal nrr modelo de legr-esión que relacione las dos variables,
330 Capítulo 70. Regresión Lineal Sirnple

tomando com.o variable dependiente al ¿rrio sideral. (Pala lealizar la transformación adecuad¿r
refiérase a la tercera ley de Kepler).

Duración del año sideral


Praneta
r,.t*fililli"Tl", (7: años terrestres)
Mercurio 58 0.24r
Venus 108 0.615
Tierra 150 1.000
Marte 228 1.880
Júpiter 778 11.862
Saturno 7428 29.458
Urano 2877 84.018
Neptuno 4500 764.780
Plutón 5913 248.400

22. Los siguientes datos corresponden al precio de venta (en cientos de dólares) de un modelo de
automóvil, según los años de uso

Años de uso 0 1 2 J 4 5 6
Precio r0.2 B3 69 5.5 4.0 3.5 3.3

Ajuste a los datos un modelo recíproco y calcule el coeficiente de deterrninación.

23 IJna empresa de telefonÍa celular ha registrado la siguiente evolución en el número de abonados


a su servicio en sus primeros 8 años de operación:

Año Abonados
1 32 000
2 37 500
3 41 000
4 58 000
5 107 000
6 138 000
7 175 000
8 321 500

a) Grafique los datos;


b) Se planteó que el modelo lineal simple. Realice Ia estimación de los coeficientes;
c) ¿Qué se puede decir de la calidad de ajuste de los datos?,
d) Efectue las pruebas de hipótesis sobre los coeficientes del rnodelo. Si es posible excluir
alguno de ellos, ¿cómo quedaría el nodelo finai?;
e) Los datos sugieren una relación del tipo exponencial, Realice un ajuste de los datos al
modelo propuesto;
f) Encuentre el coeficiente de determinación y compárelo con el del rnodelo anterior. ¿Cuál
es mejor? ¿Por qué?
Capítulo 11

Regresión Múltiple

The Ballade of Multiple Regression


lf you want to deal best with your questions,
Use rnulti-regression technic¡res;
A computer can do in a minute
What, otherwise done, would take weeks.
For'predictor selection' procedures
Will pick just ones best for you
And provide the best-fitting equation
For the data you've fitted it to.
Tom Corlett, 1963

En el capítulo anterior estudiamos el caso en el cual la variable de respuesta g depende de una sola
i-ariable predictora z, estableciendo el modelo de regresión lineal simple. Pero, podría suceder que
este modelo sea insuficiente y que sea necesario incorporar nlle\¡as variables explicativas del fenómeno
rnvestigado.

-\nalicemos el siguiente caso: el gerente de una empresa desea incrementar las ventas, para lo cual
lecide realizar gastos en publicidad y medir la variación ell slrs ventas, Inicialmente, decide poner
rublicidad en televisión, pero posteriormente decidc también ponerla en la radio y los periódicos.

En la primera etapa la variable de respuesta, qlle es el incremento en las ventas, depende de una
.ola variable predictora (los gastos en televisión) y para realizar un análisis es suficiente ernplear un
:lodelo de regresión lineal simple. Mas en la segunda etapa, la variable de respuesta depende de
--arias variables predictoras (los gastos en televisión, radio y prensa), consecuentemente para realizar
'rn análisis ya no es suficiente la regresión lineal simpl.e.

Fu general, aunque hay rnuchos problemas prácticos clue atañen a variables predictoras Írnicas, es
--tucho más frecuente que la variable respuesta dependa de un conjunto de variables predictoras o de
:ausfolrnaciones de las mismas. De la estimación de tales modelos y de su calidad de ajuste nos
cnparemos en el presente capítulo.

331
332 Capítulo 77. Regr"esión Múltiple

11.1. Modelo de regresión múItiple


Definición (de modelo de regresión lineal rnúItiple) El urodelo dc regresión c¡re liga a una
valiable dependiente y con k variablcs indeperrrlientes urecliante la ecuación

g:[Jo*,1111 li'Jttt +"'+i'i¡r¡'*e (11.i)

se llama modelo de regresión lineal nírltiple corr A; variables reglesoras.

Los parámetros ¡3¡, j :0,1,..., k se denominau ctleficit:trtcs de regr-esiól'

Al igual qlre en cl caso de una sola vari¿rblc. se cor.sidera qr-le cl crror s tiene esperanza igual a cero v
rrarianza a2 y qne los errores ei) col-respondientcrs a cacl¿i obserr'¿tción. son no correlacionados.

Un modelo plausible para el ejentplo exatlinaclo cs

lJ : do -F,6111 -l /zt:z | $3t:;11 e.

clonde y denota el incremento en las ventas. u1 los gastos en tclevisión) 12 los gastos crr radio y z¡
Ios gastos en prensa. Los coefi,cientes p6, 0t, A'¿ 1'.83 son paránctros que defineu cL moclelo, eLlos son
desconocidos y el problema inicial es detcrminat estos croeficicntcs'

La ccuación (11.1), geométricanrente lepresenta un hipcrplano cn un cspacio de k dirnensiortes. El


c:oeficicnte lj ¡ 0 : 0, 1, . . . , k) evidencia la r.ari¿rcirin rrnitaria dc la respttesta y cuando v¿¡i¿ ¿, v las
restantes variables permanecen constantes.

Nlediante la técnica de regresión Lineal mÍrltiple sc puccle ¿rnalizar uua serie de modelos particulares
como el polinonial de ttna'r'ariable

o de dos o más variables: por cjcrnplo. cl dc scgrrnclo grnclo con clos r.ariables

1t : 0o t \pt I \zt,¿ + lSzrll + i+r3* B5rp2 I e.

Otros nodelos niás complejos pr-reden rcclucilse a rrn rrroclelo clc regresión line¿rl múrltiple necliaute
cambios de variable adecuados.

1L.2. Estimación de los parárnetros


Al igr-ral que en el método de regresión lincal simple, para ler estinración de los parámetros se aplica el
método de mínimos cuadrados.

Snponga que disponemos de n ) k obscr'\'aciones. 1' si se cletrota como r¿¡ al valor de la i-ésima
obser-r'ación de la variable rj, como se obsclva cll la siguiente tabla:

9 t:t :ü2 2rA

'!jt r rr :L 12 u 1A

A2 r2t- :t:22 r2k

;,, 't'n t 't t,2


77.2. Estimación de los parántetros 333

Si f es la predicción de y, la ecuación de regrcsiórr <¡rcclrr c:orncr

i: bo * b1r7 I b2:rl2 i' " * b¡t:¡.. (11.2)

donde bo , br , , . . , b* son tales que la sttrna cle los cuach-¿rclos cle l¿rs difcrerrcias entre los valores observados
cle la r,ariable respuesta y su estirlaciól por la ecuacióu cle r-cgresiórr sea mínima.

Esclibarnos la igualdad (11.2) para cada urra de las clbsen'ac:iorrcs:

ñ : bsIblrÍ !1ry:t:121... lb¡r¡.


0z : bo i btt:zt I b'2:r22 l "' *lL¡.:t:2¡-

¡,,,: bo+br",,r Ib2r',,.2+' '+ bk'r,,,k',

o en forma abreviada
¡c

i¿: bo +\brti,, i,:l.).....n.


j:t

Se minimizará la surna de los cuadrados de los errores

scE :irr, - i)2


i:I
:i 1,,
- (-. É,,',,)]'
Derivarrdo SCE con respecto a cada b¿, e igual.auclo el resultado a cjero se obtienen las ecuaciones
tt k:
a(scE) :
0bo -z\(ui- bo -I brr;;r) o,
i-t i-l
r¿A
o(scE)
0bt -2Dr¡s(y¡- bo - lbiri) : 0,
i:l t-I

li
a6c E) \-i..-.\-n
0b* -2D:ü,ik,(u,i. -00-
-A^ ) ojxij):v.
i-l j-1

Ltrego de simplificar las igualdades, se obtiene \as ecu,a,ci,oncs norma,l,es de rnínimos cuadrados:

nbo*órÉ r¿ttbzi,r,rr+"'+ ooir,r : ir,


i:l ri:1 'i-).
17 tL TL

boDr,, - f
bt-.¿J rl,¿r + b2f
'/-J
t,rr',, - . .' * bu I ).ir:xik : D',rro
i:1 i- 1

TL 1'¿ 1L TL

uoi,nr a ot f r¡kL¡ta ar I rit t-i2+ "' + b*D,r?r D*orro'


i:I i-I i:\ i-1

Entonces, se dispone de uu sistema de k * 1 ecuaciones normales quc invoh-rcran a los coeficientes des-
conocidos. Su solución permite conocel los estimaclorcs cle los parárnetlos del modelo lineal múrltiple.
alrnque debe observarse que tal tarea. en general, suele sel rrruy laboliosa.
334 Capítulo 77. Regresión Múltiple

Formulación matricial

De manera similar a Ia realizada cn el moclelo lineal sinrple, el linea,l múrltiple es factible ponerlo en
forma matricial. Por la cantidad de variables irn'olucradas csta formulación es más fácil de manipulal
que la forma algebraica. El proceso es idérttico a1 explicado en el capÍtulo anterior; sin embargo, lo
repetiremos de manera simplificada.

Si se ponen las matrices


1 rtr rI2
,' ,':,
Y-
I rnt Tn2

se obtiene Ia ecuación rnatricial del modelo

Y:X0+e.
Los miembros de esta ecuación se forman de 1a, siguiente lranera:

Y es un vector n, x 1 de las observaciones.

X es una matriz rtx (k+1) de los rralores cle la vari¿rble inclcpendientc, cuya primera colunna tiene
la particularidad de que todos sus componerrtes son igr-r:rles a 1.
p es un vector (k + 1) x 1 de los parámetros cle la ecuación.

e es un vector n x I de los errores aleatorios.

b es el vector de los estimadores de los parár

el sistema de estimación de los parámetros cs Y : Xb.


El'r,ector d,e errores es igual a 6 : Y -?: Y- Xb.
Por lo tanto,

SCE €t€ : (y - Xb)¿ (y - Xb)


Y¿Y - 2b¿x¿Y+b'x'xb.

Derivando ,9CE respecto a b, e igualando el resultado a ccro da

x¿xb -X¿Y ( 1 1.3)


77,2. Estintación de Jos parántetros 335

Esta explesión es la forrna rnatricial cle las ccurtcioncs lolrlalcs clc regresión antcs deducidas.

Si la rnatriz X¿X es invcrsiblc se obticne cl estirn¿idor b c:omo Ia solrrción del sistcrna (11.3):

b: (x¿x) lxrY (11.4)

Desan olleuros la ecuaciórr (11.3):


rL tt 1L 17

tt D Drn T -..
1' ''tk \- u'
i:1. "¿t i-l i1
i-I
r¿ r¿ rL 11 rL

D r¿, \- -2
/r *iI D,or,o, )- J;r.1.;¿. D r¿run
¿:1 i-I i-I i:1 i:T

rL r¿ rL 1I TL
')
D rn^ D rnnro, D r¿nr¿z 5- z;r.u,
i.:1 _1 ; i-1 i.:1 i:r
Observemos la estructura especial de ta natrices X'Y y X¿X; ésta riitima es simétrica de orden k * 1.

Ejernplo. Una compañÍa, con objeto de progranrar la producción para e1 resto del año, necesita un
plonóstico de las ventas totales. En sus registros ticne las r.crrtas realizadas (en miles de dólares) v
los gastos en publicidad e insumos para sus productos en los irltirnos 10 meses como se muestra en la
sigr-riente tabla.

Ventas Publicidad Insumos Ventas Publicidad Insurnos


333 55 96 348 67 üb
310 59 84 )qn /t) 78
311 69 74 _alo 59 bt)
290 65 66 t11
r)-11 77 67
342 71 91 298 64 nt
I t)

Encontrar la ecuación de regresión que relacione las vcntas con los gastos en publicidad y en insunos.

Soluc'ión: Nombremos la variable ventas cono y) los ga^stos en publicidad como ,r1 y los gastos en
insumos como 12. El modelo de regresión es
I,.
y,,-A tJO- u1r r J,.- .
- I -r u).t 2 c.

La matriz X y el vector Y son

15596 tt.)
J J.)

15984 310
16974 311
16566 290

X- I7191 Y- 342
I67E6 348
77678 .)
¿-a
¡-I

15966 275
77767 311
I 64 7l,t 298

l.X¿es
111 11 1 111
59 69 65 71 67 76 59 77 64,
84 74 66 91 86 78 66 67 75 )
336 Capítulo 77. Regresión MúItipIe

La matriz X¿X resulta:


662 783
X¿X: 44304 51 636
51 636 62 335 )
Su inversa (X¿X¡-t
".
27.07764 -0.18441 -0.11200
(x'x)-' :( -0 18441 0.002266 0.000438
-0.11200 0.000438 0.001059

Y el cálculo de X¿Y da
/ zr4s \
XiY : f zog oog I
\ zas 055 )
Finalmente, multiplicando los dos últimos resultados llegamos aquebes

1x''':(i:,\ :( 37.30 \
1.717 I
Yu, I 2.088 )
Con todo ésto, la ecuación de regresión es

0 : 37.30 + 7.717 rt * 2.088r2.

Propiedades de b

El estimador de mÍnimos cuadrados b tiene las siguientes propiedades:

1. Es insesgado para p.
Puesto que E(e) - 0 y (X'X)-1 X,X : I se tiene:

E(b) : El(x'x)-1 x'y] :n[{x'x) 'x'txÉ+e)]


: L\ / x,xp'- + (xi
n [¡x'x¡-' x;
\-- --l
-t
x,rl
-- -l : p.
r'

2. La matriz de covarianza de b viene dada por

Cov(b) : o'(X'X)-t.
La matúz Cov(b) es simétrica; además, el valor de o2 suele ser clesconocido, debiendo ser esti-
mado.

Estimación de o2

Consideremos ahora Ia suma de los cuadrados de los errores

scE :irr, - io)2 : et€,


i:l
77.2. Estintación clc los palrínreúr'os oon
JJ T

que después de sustituir el valol cle e se llega a

SC E -- Y¿Y_b¿X¿Y.

quc tieue 'n - k - 1 grados de libertad.

Así, el cllol cuadr'ático meclio! cllre cs nn estimaclor- irrsesgaclo cIc o2, sc caicula pol
SCE
ItCE:.s2 : n-k'-I'

Ejernplo. (Continuación) Estin'Lal la r'¿rrianz¿r clel errol o2 \, la nratriz de r.aritrtza-


",r.o,'{,r¿rl
covaliauz¿r de b.

Sohtción: Utilizando el vectol cle estitlación clc los btiene

b¿x¿Y : ( 37.30 r.7t7 2.08E : 093 566.63

l0
Y¿Y : D, r? : 993 957.
'i:l

Pol lo t:tnto, SC E es

SC D : Y¿Y-I)/XIY : 993 fI57 - 993 566.63 : ili)0.37.

CorrLo n. - A; - 1 : 10 - 2- 7: 7, cl clrol crrrclr'¿rrlo lreclio cs

39()'37
.5
2
: llCE - - 55.7666.
I

L¿r matriz cle covarianza

-0.18441 -0.11200
cólGr : 0 002266 0 000438
0.000438 0.001059

IL.2.L, Coeficientes de regresión estandarizados

Crrando se realiza un mocielo de le-qrcsiórr rtrúrlti¡rlc, gerrclirlrrrt:utc. las clc urecliciórr u.o sol
rLr¡icli-Lrles
las ruislnas pala la vali¡rblc cleperrclicrrlo l¡ I)ar'¿1, las i'irri;ilrlr:s irr<lcpurrclit:¡rics. cle ltr¿rLrcL¿t qrrc los coe-
lir:icntcs dc regresión no se prrcclcn colnl)¿lr'¿\r dilcc:tun'rcutc. Pi'Lla srr¡rultl cst¿r clificultad. sc cn¡lk:an
Ios coc.fici,cntc,s de reqrcsi.ón cstrnt,d,a't i,zr¿do.s bet¿r.

il,as rruicl¿rdes clc lnedic:ión clc l"o<l¿rs 1;ts i'¿iliablcs sc lL¿irtsfrrrtnatt cst ¿irrcl¿rr'.
:rlividicnclo cada variablc 1rcl str dcsvi.,tción cst¿ittdar'.

Pol clcrrrplo, cn la ccrra<:ión ck: r'cglcsirirr

i:bo*br¿l *b.¿:-.¡.
338 Capítulo 71. R.egresión Atltiltiple

se tiene
r-
5tt
:le,\1 - (u,-),,
,q.'¡ -
('r-=),,
t,/,/
5,7
1 / \ 'sr.z

Los coeficientcs
.{ ..

beta¡ - Itt:'-!
sll

sou los coeficientes de regrcsión parcral est¿inclar v srr intcr'prc¡t¿rci<in es liL siguieutc: si hay un¿i r,¿ui¿rciórr
de ltna desviación est¿inclat en ui) habrá una clesr.i¿rción cle beta; dcsviaciones estándar en y.

Ejemplo. (Continuación) Encontrar los cocficientes clc reglesión cstandarizaclos de los clatos clel
ejerlplo.

Sol'ución: Se tiene que


Üo :37.30, b1 :1.717. ¿r2 :2.088.

Las desrriaciorres estánc1ar clc las variables son

s, : 23.22. sr, : 7.30, s,"z : 10.68,

Los c:ocficierrtes bel¿r sor.l:

. s,.
i,r- 7.30
betal l.7l;-_^
')¡J
_.
;¿.::
;);)
0.53C3,

beta2
. s,,
b,-:-' - uSs-
^^ - 10.68
5t1 -'l '3.22 0.9604.

11.3. Intervalos de confianza


En la t'egresión núrltiple se pr-teclen folmul¿rl cstimacioncs pol inlclr¡alo par'¿\ los valoles de los coefi-
cientes cle leglesióu, para los rtaloles estimaclos y para nLre\¡as 1r'eclicciones.

11.3.1. Intervalos de confiaraza para {3

Iruesto c|re el vector de coeficientes B es clesconociclo. lo consiclcramos colro nna valiable aleator-ia
rrtrltiv¿rriante, nornalmente clistlibnicla cou mecli¿r b )'nratliz cle covarial"a o2(XtX) 1, por 1o clue
c¿rda uno cle los estaclísticos
tt¡-j.t
,:0.1.....A;
t r/C.,t

sigrtc ttntr ley ú con (r1- l; - 1) graclos dc libeltacl r-clonclc C.i, cs cl j-ósirno clcrnento clc la cliagonal
cle la uratriz (X¿X)-1.

Utr inter-r'alo de confianza al 100(1 - a)% para cl cocficientc clc regrcsíón B¡ (.i : 0,1,. . ., k), cs

(U, -t^,.(rr - l.; - 1)",/Qr;l,t,I t,,,¡2Qt- A- I)t,/e;)


Ejemplo. (Continuación) Elaborar un irrtel'alo cle confi¿rriza ¿rl 95% para los parámetlos B¡, p1 r'
62, estiruados anteriolrlente.

Solu.c:i,ón: El cstimador cle o2 cs s2 : 55.7666 l' /o ou¡(7) : 2.365; crttotLc:es, sc tieneu los siguierrtcs
intervalos:
77.3. Intervalos de confranza 339

1. Pala p¡:
(bs - tt(tt - k - 1) s r/Coo-; b¡1 I t,, ¡,2Qt, - k - 1) s /C0-;)

(ez.ro - 2.36b x T.4T x JlrtTT ,37.30 + 2.36b x 7.47 x ,f2tnn)
(-43.80: 118.40)

Par-a 6i:
(U, - t^¡r(n, - k- 1) srldrr; b1 I tn12(n - li - l) s\/e¡)
Q.rv - 2.365 xT,4T x,/0.0022:r,Tr7 + 2.36b x T.4T x /lrtrnl)
(0 888r2.546) .

3. Para P2:
(b2 - t
^
¡ 2(rt - k- \
Je 22: b2 + t,, t(r t, - k - t) s t/en)
s
1

(z.oss-2.36b xT.47 x y6l0r;2.088+2.365 x T.,IT x r/otot;


(1.515: 2.647).

71-,3.2. Intervalo de confianza para E(Y)

Si se dcsea conocer el intelvaLo cle colfi,anza meclia cle un punto en palticulal uT1t
iI)
¡t2t . , ., Lpkt definitnos el I'ectol

xp

La rcspuesta en este punto es

ip: xlpb'

IJstc cstiruaclor es insesgaclo (cs ,i..i', o (%) : x|r1) )' stt rr¿tt'i¿tttz¿t cs

u^. (t,) : o2xl,(xLx)-t*r.

Ulr intelrralo cle confianz¿r cstirrración, E(\1,), eu el 1;ulto x, es

/^
lir-to¡'2(tt-A' i,, * tn¡,('tt - fu - 1) 5\ x,¿,(X¿X)-1x,,
\ )

11.3.3. Intervalo de confianza para Ia predicción, y,,

IJn tnoclelo de reglesión se aplica eu la r-eaiización cle ploncisticos collcsponclientes a rr¿rlor-es particulares
clc las vali¿rb1es incleperrdientes, xn. Lzr respncsl¿r en cste ltuut,o es jr: yt¡¡.

te rrr¿rlo clc con fianza cle ni \¡e.I 100(1 - a)'7n P¿u¿ r la plccli cctot)1 ?/2

( j, - t,,,¡2(n' -l;-1)s I
xf (XrX t, !l¡t - l; - l) 'V 1+ xj,(X¿X)-Ix,,
340 Capítulo 77. Regresiótt Múltiple

Ejemplo. (Continuación) Elabolar los inten alos clc confi¿rnz¿r al 95 % para la r-espuesta rncdia y
para la predicción, cuando los gastos en publiciclacl son de 72 mil y en insumos 90 l.r- il dólares.

Soluci,ón: El punto sobre el cnal deseamos realizar Ia preclicción es

-,: (*
)
La respuesta en el punto considerado es frr, : xf,b : 348.844.

El intervalo de confi.anza para la estimación lesnlta:


tt-
li, - to¡2(t- A - t) s/x!(xrX)-'xp,ip - tn¡,(rt - A - 1,¡ s
(sas.s - 2.865 x T.4T x i/0i81;348.8 + 2.36b x T,4T x r/o.ggt
(337 9r 359 7). -LL

EI intervalo de confianza para la pledicción es

(0, - to¡2Qt. - k - 1)"\Á+ *ilx¿X)-1xp; 0¡, t to¡2Qr- l" - 1)s I + xf (X¿X)-t*o


)
(aaa.s - 2.36b x 7.47 x yT381; 348.8 + 2.365 x T.4T x \,fim)
(32s 0;369.6)

LL.A. Pruebas de hipótesis


Las pruebas de hipótesis en la regresión lineal nrúrltiple se emplean de dos ltlaneras: pala detelminar
la significación de Ia regresión, es decir', si globalmente las variabies aportan información al modelo; y,
para realizar pruebas sobre los valores de los coeficientes individuales para exarninar si una variable
particular es significativa cn el modelo y merccc sel incluid¿r cn l¿r ecnacióu.

1-L .L. Prueba de hipótesis para la significación del modelo

La plueba global del modelo se enplea para corrocer si existe rclación lineal entre Ia variable dcpen-
diente y y eI conjunto de las variables indcpendientes e-1 , L2, ..., lxk.

Pre'u'ianeute, desconpolgamos la suma total de los cuaclrados SCou en dos sllnras, una debicla a I¿L

regresión, SCR, y otra debida al eLror, SCE:

SCao: SCE + SCR,

donde

SCE: Y¿Y-b¿X¿Y,
,
/11
,)
(D'')
SCR : b,x,Y_'t-L
\i r
/I .
n
_
/ t) \-
¡)

/S \
I ),Y¡l
SCoo : Y¡Y - \':t ,tL
'/
77.4. Pruebas de lúpótesis 34L

qtle llos siLrten para realizar de manera or-denada toclos los p¿isos involllcrados en la prueba de hipótesis,
con el ernpleo de una tabla de arrálisis de la va,lianza.

En el siguietrte cuadro se resunre los elenentos dc rur análisis cle varianza para nna regresión miritiple:

Tabla de Análisis de la Varianza


Fuente de Suma de Graclos de Cr,radrado
F
variación cuadrados libertacl medio
1\IO'H
Regresión SCR t^
LIC R LH. o,s
- AICE
Error o residual SCE 'n-l¡-I s'2 : LICE
Total 5C,,, n,-)

Entonces, se plantea la siguiente prueba de hipótesis:

1. Hrpótes'rs Nula. Ho, l3t :...: l3n:0.


2. Hzpóteszs Alternati,ua. Hr l3r, f 0 para al rnenos una A;.

ATCR
3. Estadíst'tco de Prt¿eba. LH, obs
- A,ICE.
4. Región de Rechazo. Se rechaza Hs si Fo¡r, > ¡L(k,n, - k - I)

El rechazo de Ilo significa qr,Le al meuos una de las variables independientes r, contribuye signiflcati-
vamente al modelo lineal propuesto.

Ejemplo. (Continuación) Realizar un análisis de adecuación del moclelo, a un nivel cr : 0.05.

Sol,u,ci,ó'n,: Anteriormente habíamos calculado dos componentes de las slrmas de cuadrados:

Y¿Y : gg3 gbz, b¿x¿y : gg3 566.63.

Calculemos el tercero:
/,, \2
(I'')
\ j-1 ,3145)2
' : -l¡l- : 989102'5'
''
Tanrbién. se calculó que SCE:390.36. Las restantes sllmas de cuadrados so¡
qr q93 :
""!J!J 957
¿¿¿JQt - JoJ 102.5
989 fW_,U _
4854.5.
SCR : 993 566.63 - 989102.5 : 4464.73.

La tabla de análisis de la varianza queda asÍ:

Tabla de análisis de la varianza


Fuente de Suma de Grados de Cuadraclo
F
variación cuadlados Iibertad nredio
Regresión 4464.73 2 2232.07 40.02
Error o residual 390.37 7 55.76
Total 4E54.50 I
342 Capítulo 77. Regresión Mtiltiple

La prueba de hipótcsis de adecuación del modelo es:

1. IIi,pótesi,s Nula. Ho: {3t : 0z : 0.

2. Hipótesi,s Alternati,ua. Ht: 0t * 0 o 0z # 0.

3. Estadístico de Pru,eba. Fobs: 40.02.

4. ReqióndeRechazo. EIvalorFo.os(2,7):4.7+definela,regióncrítica Fu¡,"),4.74.

5. Decistón. Conio 40.02 > 4.74, resulta que se rcchaz¿\ la liipótesis nula y se conclnye que las
t'elttaSestánrelacionadasconlosgastosenprrblicidaclyerrinstttrros.<

Con esta prueba estadística únicamente se concluye la validez del rnodelo, en forma global; clla no
indica Ia importancia relativa de cada una de las variables predictoras sobre la variable respuesta.

LL.4.2. Pruebas acerca de los pa-rámetros B individuales


En el modelo pueden estar incluidas variables que son redundantes o que no aportan significativarnente
a la respuesta, eso se puede comprobar realizando una prueba sobre los parámetros individuales de
regresión. Entonces, se tiene la siguiente prueba de hipótesis para un parámetro 13¿fr,jo.

1 Hipótesis Nula. Hs: Br: g.


2 Hi,pótesi,s Alte'rnatiua. H¡ B¿ I 0.

b¿
3. Estadístico de Prueba. tobs :
s\/e;'
1. Regiónde Rechazo. Serechazalls si tob"1-t,,¡2(n-A-1) oúo6, )tu¡2Qt -4, -1)

Ejemplo. (Continuación) Eu el modelo piantc:ido, realizar la pnreba para los parámetlos ¡6,.
I : 0. 1,2, al nivel deI95%.

Soh¿c'i,ón: Se tienen las siguientes pruebas:

a) Para el coeficiente B6:

1. Hipótesis NuIa. Ho: Br:Q.


2. Hipótesis Alternati,ua. HI t3o 10.
3, tnb":
37 30 :
Prueba. -uuó -L
s\rcoo-
Estad"ístico d,e 1.088.
7 .47 OL077
4. Regi.ón de Rechazo, Cotno to.ozs(7):2.365, la región es lú,,¡"1 > 2.365.
5. Deczsión. No se techaza Éfo; por tanto. la constantc podría excluirsc de Ia regresión.

b) Pzrra p1:

1. Hipótesis NuIa. Ho: pr: g.


2. Hi,pótesi,s Altert¿ati,uu HI 0t 10,

3. Pnreba. tobs:
7'717 :
Estadístico d.e
-+
.5vL il
- 7'47\/0n0'n
4.9.
77.5. Coefrcientes de deterntinación y de correlación parcial 343

4 Rerttón Rech,azo. lln,,rl > 2.365.


d,e

Ir Deci,si,ór¿. Como 4.9 > 2.365, se lcchaza -I1¡: entonc:cs, la variable <<gastos en publicidad>>
:rporta información al moclclo

c) Para p2:

1. Hipótesr,s !,lLtkt,. Hs: lJr: Q.


2. fIrpóte,sis Altc'rr¿ati,ua. H¡ p210.
b.,
:1. EstoiÍstino de Pru,eba. t,¡(,s = E.593.
ffir:
4. Rcq'ión d,e R.ecl¿azo. Lob.sl > 2.365.
5. Deci.siótt, Dado quc 8,593 > 2.365, sc rechaza Ho; por tanto, la variable <gastos en it.L-

sllnlos>> aporta información al nodelo.

El rnodelo final podría scr uno en el que no se considere cl término independiente: y - |flt I 0zrz.
Se recrouienda al iector que recalcule tal modclo.

11.5. Coeficientes de deterrninación y de correlación parcial

EI cocficiente cle detcrninación se emplea conro rlra meclicl¿r clc la ¿rdecuación clel rnodelo, c¡re infortua
sobre Ia fu.erza de la relación cxistcnte entre 1as valiablcs indepenclientes y la dependiente.

11.5.1. Coeficientes de deterrninación múltiple


E1 cocficricnte de detenriiri¿rción múltiple se define como

n2 scR
' Se uo .
scE
b'C rr'

El larrgo de variacicjl cle 1?2 es 0 (


R2 < I. Un rr¿rlor'¿LIto de R2, cercano a 1, signifi.ca que el ntodelo
rLclegrcsióu es Jneno y si 112 cs cercano a 0. el a.jr-rste es malo. Si 112:0 clttiere clecir que falta por
crolrpleto el al.jrrstc del moclelo a los datos y si Il2 - 1 se tienc rur a.jr.rste pelfecto.

Puesto c¡re 112 tiencle a soblcstimar cl valor de la corlelación entre las variables involucradas, se etlplea
,:l cocficicntc dc determinación ajustado, -R1., c¡re cstá cliserl¿rclo pala conpensar el sesgo optimista cle
R2.

E1 coeficiente de detclminación a.justaclo, se

ot
I1,t:
t>2 ,('t1 /lrl
lt
- -
t¡,-A; -l
,

EclrLir,'aleuterrrentc, Rl sc c¿rlcula nrecliarrte

SCEI(n A'- 1)
-
n.?,:t- SC,,rf(rt,-l'¡

-1 rango de variación de 1l"2 es 0 < ,Rl < 1y su intcr'pret¿rci<irr cs ia misnt¿r c¡tc h clcl coeficicutc clc
ietcrnirración nniltiplc Ii2.
344 Capítulo 77. Regresión Múltiple

Ejemplo. (Continuación) Calcular R2 V RZ para el rnodelo planteado.

Solución: Se tiene que


n2 scR
It
4464.r3
: 0.9196.
JUua 4854.5

Como el valor de R2 es alto) se concluye que el modelo se adecua a los datos y que el 9I.96% de
la variabilidad en las ventas se explica mediante las variables <<gastos en publicidad>> v <<gastos en
lnsunos>>.

R?": n'-JJJ4;
2(1 - 0.e1e6)
: 0.9196 - r0-2-r : 0.8966.

En canrbio, si interpretarnos ,Rl, podemos decir que la calidad del ajuste es de un 90Vo. Paru mejorar
el rnodelo se podría incluir una tercera variable explicativa y comprobar si ella es o no significativa.

1-t.5.2. Correlación parcial


El coeficiente de correlación parcial rnide Ia correlación entre dos variables, manteniendo las dernás
con valores constantes; es decir, dado un conjunto rtt T2t . . ., rk, el coeficiente de correlación parcial
entredoscualesquieradeellas, riy:xjtesunamedida(adimensional) desurelaciónlineal,cuandose
elimina de ambas los efectos debidos al resto de las variables.

Por ejemplo, con k regresores, el coeficiente de correlación parcial entre rt V 12t que se denota 112,24...k;
se define como el coeficiente de correlación Iineal entre ;r1 1r rr2 cuando se elirnina de ambas variables el
efecto de los otros k - 2 regresores, Se calcula obteniendo el coefi.ciente de correlación en la regresión

eti4..k:pe2,sa...¡, + u; (rn3+ x),

donde er¡ ...t y e2,g4...k son los residuos de la regresión rnúrltiple de 11 y ,r2 respecto a las variables de
control rB¡ , . .¡ rk.

Si tuviéramos el modelo A - l3o* gpt* Azrz *e, el coeficiente de correlación parcial de y con 11,
cuando z2 permanece constante, se define por

Tyt - Ta2Tt2
Tvr,2:
(1- r?2)0 - r?z)

donde rsrt rs2 y r12 son los coeficientes de correlación de Pearson de y con 11, de y corr 12 y de 11
con 12) respectivamente. De rnanera análoga, se tiene

Tt2 - I'utTa2
T12,a:
(r - rl)0 -,7r)
el coeficiente de correlación parcial entre rt y 12.

Por Io complicado que puede resultar el cálculo de las correlaciones parciales, sus valores se obtienen
rnediante programas est adÍsticos.

Ejemplo. (Continuación) Caicular los coeficiertes de correlación parcial para el modelo planteado.
77.6. Regresiól politrcnúal 345

SoLttción: Terrernos los coefrcientes de corrclacióri rle Pc¿rlsou ctrtlc l¿rs v¿uiables:

I'rU : -0.283, rrt : 0.268, t'!J2: 0.807.

Entonccs.

0,268-0807x(-0.283) :
TuL,2 : 0.876.
/(t - (0 807)2) (1 (-0.283)2)
(t - rl2)Q -,'?z) -
I'A2 - I'aI?-72 0.807-0.268x(-0.283) :
Ta2,l : 0.955.
(r - rf 1)(r -,'?) Jtt - (0.268)2) (1 - (-0.283)2)

T72,a
-0.283-0.268x0.807 : -0.878.
(t - rfl)(r -,lr)

11.6. Regresión polinomial

El pr-imer paso para escoger un rlodeio que describa los clatos, es la realización de un gráfico de
,lispcrsióu de las observacioucs. La rclaciól srrgelicla por los cl¿rtos cs la que permite escoger un
nodelo que los describa adecuadarnente.
G
ülr, Cuando Ios datos presentau un csqlrema de comportaniento curvilíneo puede ser rlecesario proponer'
# ,ur modclo de tipo polinonial para los datos. AsÍ lo obsen'arros cn la Figura 11.1.

¡
&
.il1

Figula 11.1: N4odelo de segturdo glado pala los datos.

Veatlos, con Lul ejemplo, cómo se puede trausfolnrar un modelo polinomial en uno de regresión mÍrlti-
ple.

Sr-rpongarlos que escogernos Lln modelo de scgundo grado en nna variablc:

,U: 0o* gfl + B2r2 + e,

si hacemos las sustituciones de variables rt : r V 12 : 12 , la ecnación de regresión queda corno

1l:00-l 7fitl0zrz*e,
c¡-rc esrtti tnodclo de reglcsiótr rnúrltiple en dos variables. Err cslc urornelto cstanr<-¡s err posibiliclacl cle
¿rplicar la teoría anteriorrnentc desclita.

Ett gcnctal. si se tiene un moclelo polinomial con Lrna r.ariablc explicativa

lJ :0o-t/flt[32t:2 +...+ B¡t:k*s,


Capítulo 77. Regresión MúItiple

se lo convierte en uno de regresión múrltiple mediante la transformac\ót r¿: z', quedando:

U : 0o* 0{t I 132t2+ .'. + p¡¿¡, * e.

Otros modelos polinomiales que incluyen más de una variable, que pueden transformarse a uno lineai
múltiple, son los polinomios en varias variables. como el de segundo grado en dos variables:

u : 0o * 7fit I 0zrz + 7nr? + 0zzrZ I Bprp2 I e.

Cuando se ajusta un modelo polinornial es preciso escoger el polinomio Ce menor grado posible.
consecuentemente se deberán realizar reiteradas pruebas de hipótesis, en las que se fijarán aquellas
variables que se han de incluir y excluir en el modelo final.

Ejemplo. Consideremos los datos que relacionan el nirmero de páginas de un folleto y el costo de los
insumos utilizados en la impresión de 100 e.jenplares.

No. de págs. Costo No. de págs. Costo


90 204 50 130
80 770 40 726
75 165 35 724
70 155 30 72r
bi) 148 25 100
60 r40 20 98

a) Ajustar un polinomio de segundo orden a los datos;

b) Probar la significación de Ia regresión;

c) Probar Ia hipótesis de que 0t:0.

S oluct ón:

a) Como se observa en el gráfico de los datos, éstos podrían ajustarse a un rnodelo de segundo
grado de la variable independiente, entonces planteanos el nrodelo A : go -l pfl * l3zn2 I e.

2
1.8
1.6
a.t'
1
j <-J'J'a --ltt'
1.2 a
1
10 20 30 40 s0 60 70 80 90

Figura 11.2: Relación entre el lúrmero de páginas y el costo de una publicación.


77.7. Regresión con var iables cualit ativas 347

Lantatriz X, el vector Y y el vector B son:

1 90 8100 204
1 80 6400 170
7 75 5625 165
7 70 4900 155
1 65 4225 148

X- 1 60 3600 Y- 140
p:
1
r
50 2500
40 1600
130
726 G)
1 35 t225 t24
1 30 900 12l
r 25 625 100
r 20 400 98

Resolviendo las ecuaciones normales XÚXb : X¿Y se obtiene el modelo estimado

i: L37 4.4 - 12,373t; * 0.2IBr2 .

b) Los resultados se resumen en la siguiente tabla:

Tabla de análisis de la varianza


Fuelte de Grados de Surna de Cuadrado
F
variación Iibertad cnadrados medio
Regresión 2 6622.24 3311.12 6.91
Residual I 4314.68 479.41,
Total 11 10 936.92

Puesto eue Foa" : 6.91, que si se cornpara con el rralor de la tabla correspondiente a Foos(2,9) :
4.26, resulta que Fob" ) Fo.os(2,0). El resultado es significativo al nivel del 5%; es decir, al
meros uno de los parámetros pr o B2 es distinto de cero. Además, -R2 :0.605? qne en este caso
indica que la calidad del ajuste es buena, pero no lo suficiente.

c) Veamos si es posible la eliminación del término de primer grado de la ecuación.


Se tiene la prueba de hipótesis:

L. Hipótesis Nula. Hs: pr:9.


2. Hipótesi,s Alternatiua. H¡ p¡ 10.
3. Estadíst'ico de Prueba. tobs : -2.318.
4. Regi,ón de Rechazo. Tomemos a : 0.05. Conro ¿oozs(9) :2.262, se tiene la región de
rechazo lúo¿,"1 > 2.262.
5. Decisión Cotno l- 2.3181 > 2.262, no se puede climinar el término de primer grado.

Sc sugiete que el lector reaiice los análisis con el empleo de un paquete estadÍstico.

IL.7. Regresión con variables cualitativas

trtt los noclelos tratados se empleó variables independientes cle latur¿rleza cuantitativa; es decir, que se
:\pt€sall uuméricamente y son el resultado de mecliciones iustnunentales. Pero si se desea incorporar
348 Capítulo 77. Regresión Múltiple

en el modelo una variable cualitativa, es necesario intloducir uariables indicadoras (o ficticias), q:ue
permiten diferenciar los distintos niveles que toma tal variable; por ejemplo, una variable X que
indique Ia estación del año puede ser defi,nida conro

": { ?, :l :: ;il:T:
En general, una variable cualitativa con ú niveles se representa mediante t-I variables indicadoras, a
Ia^s cuales se les asignan valores de 0 y 1.

Ejemplo. En un estudio para determinar Ia relación entre el peso y el origen de ios automóviles y su
consumo de combustible se escogió una muestra de 10 carros, con los siguientes resultados:

Consumo (l/100 km) 8 16 6 7 7 I 11 12 18 20


Peso (kg) 739 1187 655 729 888 797 963 802 1551 1650
Origen Japón USA Japón Japón Japón Japón USA USA USA USA

Determinar la ecuación de regresión que ajusta los datos y probar su significación.

Soluc'ión:

a) Se va a ajustar el modelo
a:0ol7fitl0zrzle,
donde la variable peso es cuantitativa (rt) y la."'ariable origen es cualitativa (r2), con dos riveles:
USA y Japón, que Ia codifrcaremos de Ia siguiente manera:

'I'ñ: f 0.
<
si el origerr es Japón;
[ 1. si cl oligen es USA.

Con ésto la matriz X y el vector Y quedan:

r 739 8
1 1187 16
1 655 6
7 729 7

X- 1 B8B
Y_ 7
7 797 9
1 963 11
1 802 t2
1 1551 18
1 1650 20

Y el modelo estim.ado es

0: -0.036 * 0.0111 -13.42Ir2.

El significado clel téI'tlino correspondiente al origen del auloniór,il es el sigr,riente: para dos antos,
de igual peso, Lulo clc oligen amelicano y otro clc oligen .japonés, cl arncricano cousluuc, cu
promedio, 3.42 litlos más que cl japonés, al rccor-r'er 100 krn.
77.8. Probletnas en la regresión múItiple 349

b) Veamos la tabla de análisis de Ia varianza y las estirnaciones de los parámetros:


Tabla de análisis de la varianza
Fuente de Grados dc Snrrr¿r de Cuadrado
F
variación Iibertad cuadraclos medio
Regresión 2 213.95 106.975 77.66
Error 7 10.45 1.493
Total I 22.40

Pol el alto valor de 4A, : 77.66, se deduce que al nlenos una de las dos variables consideradas
sirve para explicar el consumo de combustible de los carros.

Término Valor tobs


Constante l.16
-0.036 -0.027
Peso b1 0.01 6.012
Origen ü,2 3.242 3.153

Si comparamos los valores de úo¿," con 1s.625(7) - 2.365. deducimos que los términos correspon-
dientes al peso y origen son distintos de cero, mieltras que el término constante se puede conside-
rar nulo.
Para terminar, exarninerrios los valores a.justados, conparándolos con los datos originales y el
error respectivo:
A¿ U¡ ei
8 7.18 0.82
16 14.97 1.03
6 6.36 -0.36
7 7.08 -0.08
7 8.63 -1.63
9 7.75 t.25
11 12.79 -r.79
12 Lt.22 0.78
1B 18.53 -0.53
20 19.49 0.51

11.8. Problemas en la regresión múltiple


En la estimación de los parámetros etl un modelo lineal nÍrltiple se plesentan varios problemas que se
deben teuer en cuenta al realizar un ajuste de los datos; ellos son la multicolinealidad, la presencia de
valoles extrernos, la autocorrelación y Ia no normalidad de los errores.

11.8.1. Análisis de los errores


Utta vez construido el modelo de regresión se rleberá conrprobar si l¿rs hipótesis de iinealidad. de
norrnalidad y de independencia se curnplen.

La matriz de covarianzas de Ios errores es

Cor'(e) :o2(I-V)'

:loude v: X(XÍX)-lX¿; así,


Var(e¿) : o2 (l - 1t¡.,¿),
350 Capítulo 77. Regresión Múltiple

donde el término u¿¿ mide la distancia entre el punto x¿ y 1a media x.

Para comparar los residuos suele ser más córnodo cambiarlos de escala, estandarizándolos o estuden-
tizándolos.

Los residuos estandarizados se definen por

y los residuos estudentizados mediante

s(¿)

que siguen una ley t con n grados de Iibertad; donde s(¿) son los residuos de la regresióu cuando
- k -2
se excluye la i-ésima observación.

Análisis gráfico

IJnavez que se han construido los residuos ("¡,r¿ o ú¿) es cómodo real\zar gráficos como los siguientes:

1. Histograrnas o gráficos de probabilidad normal.

2. Gráficos de los residuos respecto a los valores estitlados, e¿: f (i¡)'


3. Gráficos de los lesiduos respecto a las variables expliczitivas. e¿ : f (rn¿).

Error de especificación

Se comete error de especifi.cación cuando establecemos ura depeldencia errónea de la respuesta en fun-
ciól cle las variables explicativas: omitimos variables irnportantes, introducimos variables innecesarias
o snponemos una relación lineal cuando la dependencia es no lineal.

La especificación incorrecta del modelo conduce a que los lesicluos tengan esperanza no nula y que los
estimadores obtenidos sean sesgados.

11.8.2. No-normalidad de los residuos


La srrposición que los residuos e están normahlente distriburdos no es necesaria para Ia estimaciórr de
los parámetros de regresión ni para la particiór'r de la variabilidad total. La normalidad es necesaria
para Ia constlncción de las pruebas de hipótesis e intervalos de confianza sobre los parámetros.

El irnpacto de la no normalidad en los mínimos cuadrados depelde del grado de desviación de la


norrnalidad y de la aplicación específi.ca.

Los estirladores de los parárnetros serán insesgados, pero sus intervalos de confiattza y las pruebas
de hipótesis serán incorrectas. Sin embargo, la prueba .F- es razonablemente robusta contla Ia no
normaiidad.

Para cletectar Ia normalidad de los errores es conveniente fi.iarse en los coeficientes de asimetr'ía y de
cu.rtosis. Adernás, se pueden realizar gráficos Q-Q o P-P de boudad de a.juste a Ia ley nornral.
77.8. Probtretnas en la regresión múItiple 351

-. .ansformación de la variable dependientc a lLna forrna que sca más cercana a la norrrral es un
' --so tluy empleado. Estas transformaciones sneler ser sugelidas por los gr'áficos de los residuos.
l=- :,iéu, se puede utilizar el método de Box-Cox de transformación potencial,

: -- ichos casos) la desviacióu de la normalidad se debe a la presencia de valores atípicos, en cuyo


ur- :: conv€niente examinar Ia influencia de los rnismos.

-::-i€m€nte se han desarrollado modelos que consideran clue los errores están distribuidos según
-f,,¡,-
üH*i -:.'l. de un nirmero de grados de libertad desconociclo) corno una generalización de la hipótesis
-.r - ::rralidad.

Presencia de puntos inusuales

:.-,:rrente, se espera, que los datos correspondientes a las observaciones se encuentren distribuidos
lr. -:gión más o nrenos cercana? pero puede sucecler- qne una o varias observaciones estén alejadas
.:-- - ,Le los datos. Esta-s observaciones pueden influir mucho en el modelo final.

-::cto es rnuy importante: podemos disponer de 100 obselrraciones y, sin embargo, construir
-- : ',rn modelo cuyas propiedades son debidas irrricamente a dos puntos. Conocer si este tipo cle
- -:-lLrve perjudicialmente en el rnodelo permite mc,iorarlo.

forma para determinar si un valor es atípico es mediante los residuos estudentizados. Se


n los valores de ü, cou los valores crÍticos de una ley I con n - k - 2 grados de libertad.

I r---:. d€ conocer cuáles son los <<purr.tos distantes> es a tr¿rvés de Ia distancia:

/)?:+ (b¡(r¡¡-r¡)\2 t:1.!.....n.


; _1,
",: h\-ffi-/
-trriento consiste en ajustar el modelo. calcular los Dl , 'i : 7,2, . . . ,n, y después ordenarlos
ascenclente de ¿rcuerclo con eI D!. Los pr,rntos con alto D.f son inusnales.

- ,,tt'os tipos de distancias que permiten la detecciórr de valores atípicos y puntos influyentes,
--, 1 con distintas propiedacles) pero todas siguen el nismo priucipio para la identificar tales
-¡J11eS.

iento

-:- -,tcalizado un pnnto iuttsual, se estudiará su inflnencia eliminándolo del modelo, repitiendo el
-----ento para todos estos puntos. Aquí es necesario realiz¿rl un análisis de la estabilidad de los
;--es de regresión tlediante pruebas estadísticas o sus iltelvalos de confianza.

L.-- se han desarrollado métod,os d,e regresiórt robttsto, clue ateniran Ia influencia de las obsen'a-
---',-.uales en el modelo o que toman como nrcdicla cstadística sobre la cual se basa la regresióu
ur - ana en lugar de tomal la media, couro 1o ltcrnos irecho chrlarrte este tratado.
77.8, Probtrenl.as en la regresión múItiple 351

La transformación de la variable dependiente ¿r rrn¿r forrla qr"re sea más cercana a la normal es url
recrlrso mu.y empleado. Estas transformaciones suelen ser sugeridas por los gráficos de los residuos.
Tambiél, se puede utilizar e1 método de Box-Cox de transfolmación potencial.

En la desviación de la nolmalidad se debe a la presencia de valores atípicos, en crlyo


mr-rch.os casos)
caso es conveniente examinar la influencia de los mlsmos.

Recientemente se han desarrollado modelos qlre consideran que los errores están distribuidos según
una 1ey ú, de un núrmero de grados de libertad desconocido, colrro una generalización de la hipótesis
de normalidad.

11.8.3. Presencia de puntos inu.suales

Generalmente, se espera que los datos correspondientcs a 1as observaciones se encuentren distribuidos
en Llna región más o nenos cercanar pero pu.ede snceder cpre Llna o varias observaciones estén alejadas
del resto de los datos. Estas observaciones pueden iufluir rlucho en el modelo final.

Este aspecto es muv importante: podemos disponer dc 100 observaciones y, sin embargo, construir
con ellos un modelo cuyas propiedades son debidas irrricamente a dos puntos. Conocer si este tipo de
puntos influye perjudicialmente en el modelo permite mejorarlo.

Identificación

La primera forma para determinar si un valor es atípico es rnediante los residuos estudentizados. Se
colnpara con los valores de ú¿ con los valores críticos de una lev I con n - k - 2 grados de libertad.

Otra folma de conocer cuáles son los <<puntos distantes>> es a trar'és de la distancia:

,h

/)? : \-
t /J
i: I,2,.. . ,fr.
.l-L

El procecliliiento consiste en ajustar el modelo, calcnlal los Df , ¿ : 1, 2,....n, y después ordenarlos


en forrn¿r ascenclentc cle acuerdo con el Dn2. Los puutos con alto D| son inusuales.

Existen otros tipos de distancias qne perniten la detección de valores atípicos y puntos influyentes,
cada uua con distintas propiedades, pero todas siguen el mismo principio para la identificar tales
observaciones.

Tratamiento

Una localizado r-rn printo inusual, se estudiará su influencia elininándolo de1 modelo, repitiendo el
.u'ez

procedimiento para todos estos pr-rntos. Ac¡rí es lecesalio realiz¿rr un análisis de la estabilidad de los
coeficientes de regresión mediante pruebas estadísticas o sus intervalos de confianza.

Tanrbiérr, se ]ran desarrollaclo métodos de reqresi,ór¿ r'obttsta que atenÍran la ilfluencia de las observa-
ciones inusuales en e1 modelo o que toman como mcclida, cstaciística sobre la cnal se basa la regresión
a la rnediana en lugar de tomar la media, como 1o hemos hecho chllalte estc tratado.
352 Capítulo 77. Regresiótt MúItipIe

11.8.4. Varianza heterogénea

La heterocedasticidad en los errores irnplica que la hipótcsis

Var(e¿) :o2: co¡sta.tc

no es aplicablc.

L¿rs consecuencias de la heterocedasticidad en el modelo lineal son las siguientes: los estimadores serán
iusesgaclos, pero dejan de ser eficientes. Las fórnul¿rs para las varianzas ro son correctas y las pruebas
de hipótesis dejan de ser aplicables.

Identificación

La lreterocedasticidad se identifica mediarrte la graficación de los residuos. El gráfico €¿: /(fr)


".
Írti1 para detectaria y los gráficos €¿ : f @n¡) para identificar si la variabilidad es causada por alguna
de las valiables independientes en particular.

También es posible realizar una prueba de hipótesis del tipo

Hs: ei - (0. 02) ,

H1: e¿ - ^i (0, 07) ,

^i
una prueba de a.juste a una lev. Pala el efecto se puede realizar el contraste de razól de
clLle es
verosinilitudes, que se basa en el estaclÍstico

2log )- rz log G' - r.rt,¡IogGl,

qlle se distribuye según una ley X2 con k - 1 gr":rdos de libertad.

Tratamiento

1. Si la heterocedasticidad está asociada cori la valiable respr-resta y crece con e1 increrrento cle
los valorcs de y. una posible forma de tratarla es rcalizar la regresión de log g en lugar de y.
Este caso suele aparecer cuando hay una forrnulación errónea del modelo; por ejcrnplo cuando
el moclelo real. es r-nultiplicativo y se a,justzr rncdiante rrno lincal.

2. Si Ia lieterocedasticidacl está asociada corr rru¿r variable inclependiente particular y la desviacióri


estándar está ligada linealmente con el crecin-riento de z¡.. ur procedimiento de evitarla es estimar
cl moclelo
a r J'l r ^* '
J'k -Bo
'J; k
-
-'''u-T" -P¡'rL

s-
dorrde, al cliviclir todos los télminos pol' z/r, los lesicluos e* - tendrán valianza constantc.
Este procediniento es equivalcnte ¿r utiliz¿rr rlíninos
",,u,lr,rdnrfencraliz¿rclos.
77.8. Problernas en la regresiótt rnúItiple 353

11.8.5. Multicolinealidad
El los ploblemas de regresión múrltiple, algunas veces. dos o más r,ariables independientes contribuyen
con iriforrnación redundante, porque se encucntr¿rn bastante correlacionadas ertre sí. En los casos
en que tal correlación sea alta, se dice que existe rmt,lticol,ineo,Iidad. Por ejemplo, se desea formar
r.rn modelo para predecir el precio del metro cua<hado de tielra en Lln sector de la ciudad (g), como
función del índice de irrflación ("r) y del precio clel clólar en el mercado libre (r2). Aunque las dos
va,riables aportan información, es conocido qne las dos -"ariables independientes están fuertemente
colrcl¿rcionadas; por 1o tanto, ia información pol ellas aportada es redundante o se traslapa.

En este caso, J.a matriz XrX es casi singular. originando clue sea difícil encontrar su inversa.

Crrando hav rnulticolineahdad se tiene dos efectos:

I Los estirnadores b,; tienen varianzas rnuv alt¿rs.


) Las cstimaciones b¿ son muy dependientes crrtrc sÍ

Por e.jenrplo. n un modelo con dos variables independientes,


n2
Var(b¡) : -o;;l
silL-r')n'' )

clondc r
cs el coeficientc de colrelación entle las dos variables. Así, si aumenta (en valor absolu-
to) lzr correla ión entre las variables explicativas. aumentarán las varianzas de las estimaciones y su
dcpeldencia.

Identificación

L¿r iclentificación de variables colineales se efectira examinando:

1. La natriz de correlación entre Ias variabies explicativas, R, y su matriz inversa, R-1


2. L¿rs raÍces y vectores propios de las matrices X¿X. o de su matriz de correlación.

Si un¿-L variable es combinación lineal de las restantes variables. se debe analizar Ia matriz R-l. AsÍ.
sr: define el <<factor de inflación de la varianza>> corro cl z-ésimo término de la diagonal de Ia matriz
Rt:
FIV¡: diagr (R-1) .

Por tanto, eiernentos diagonales glandes (mayores a 10) en la rnatriz R-1 indican alta colinealidad.

T¿unbién. se puede calcr.rlar el Índice de condicionarnierrto (IC) de X¿X o R:

rnáx{)¿i
nín {)¿}

ilonde )¡ son los valores propios de las nencionadas matrices.

Err La pr'áctica se adrnite clue existe alta multicolinealidad cuando el IC es rnayor que 30; una colinea-
iiclad modclada si el IC está entre 10 y 30; y, cnando el IC es merlor que 10 se considera que la rlatriz
está bicrr clefinida.
354 Capítulo 77. Regresión MúItipIe

Tbatamiento

Las tres soluciones a la multicolinealidad son:

1. Eliminar regresores) reduciendo el núrlero de parárnetros a estimar.


2. Transformar las variables mediante componentes principales y elimirnar los menos importantes,
3. Incluir información externa a los datos, mediante nn enfoque bayesiano.
4. Utilizar regresión a través de componentes principales, que es similar al método de eliminar
regresores, con la diferencia de que se eliminan combinaciones lineales de éstos, manteniendo
aquellos cuya contribución en términos de información es significativa.

11.8.6. Autocorrelación
Una de las hipótesis iniciales para desarollar el modelo de regresión es que los errores, €i) son variables
aleatorias no correlacionadas. Si esta hipótesis es violada, se dice que existe autocorrelación.
Los efectos de esta dependencia son los siguientes:

1. Los estimadores de los parámetros sol insesgados, pero no son eficientes.


2. Los contrastes sobre los parámetros no son váiidos y están sesgados hacia Ia detección de reia-
ciones inexistentes.

.) Las predicciones son ineficientes.

Eu el caso de un modelo lineal simple, la varianza del estimador de la pendiente resulta ser
')/
var(b) :- !' -l,1_,rDit':-t)
'^/
D,? \' D"? )
'
.

donde p es el coeficiente de correlación entre 1as observaciones.

Í2
Si p > 0, la varianza puede resultar sustancialmente mayor que $5,ri cle rnanera que el estimador es

ineficiente. L

Identificación

Para ia detección de la autocorrelación se emplea el estadístico de Durbin-Watson:


D"t"r-n
D"?
Para la realización de las pruebas estadÍsticas sobre la autocorrelación existen tablas, pero podemos
dar la siguiente regla empírica para detectar la antocorrelación de orden 1.
Construimos el estadístico
d:2(l - rt)
y si stt valor es próxino a2, no existirá autocorrelación; si d tiene un valor entre 0 y 2, habrá correlación
positiva; ¡ si el valor de d está entre 2 y 4, la correlación selá negativa. En los programas informáticos
se sttele calcular el valor de este estadÍstico y el nivel de significación de Ia prueba.

Alternativamente, se puede aplicar el estadístico de Box-Ljung pala detectar la autocorrelación.


77.9. Ejercicios 355

Tbatamiento

Para explicar Ia evolución de variables que tienen r.rn comportamiento en el que aparece autocorrelación,
es conr.eniente utilizar métodos del análisis de series de tiempo, que permiten abordar de rnanera rnás
global el problema de construcción de modelos para estas r.ariables. También, se pueden utilizar
métodos especiales de regresión) colrro los míninos cuadrados generalizados o los modelos lineales
generalizados.

Por Ia dificultad que entraña la realización mannal de los cálcr-rlos, especialmente en la determinación
de los potenciales problemas que el modelo pudiera prescltar, ésto se hace mediante el empleo de pro-
Élramas estadísticos especializados) que facilitan su cálculo, correspondiendo al usuario la interpretación
correcta de los resultados.

EI lector deberá notar que los temas tratados aquí solo cubren la parte central del análisis de regresión.
Existen textos especializados que lo tratan de manera detallada y en extenso. (Véase Rawlings y otros,
200 1. )

11.9. Ejercicios
Modelos de regresión múltiple

Snponga que un inrrestigador está usando el modelo estadÍstico Y : X,6 f e, donde n : 73 y


k :2. Resultó el siguiente sistema de ecuaciones, que permiten estillar el vector p:

13bo*2b1-2b2 : 4
2bo*2bt-bz : 2

-2bo-bt*4bz : -1
a) Resuelva el sistema de ecuaciones y encuentre el estimador b de coeficientes. Escliba
explícitamente la ecuación de regresión;
b) trscriba la forrnulación nratricial del problema;
c) Si Y¿Y:6, encuentre s2;
d) Calcule los coeficientes de determinaciórr múrltipl" R2 y arjustado Rl e interprételos.

llna empresa de transporte ha tomado una m,uestra de los pesos de seis ernbarques, ia distancia
transportada y el gasto que erl ellos se ha incurriclo:

Peso (Tm) 40 30 16 t.2 3.4 4.8


Distancia ot
(miles de km)
L r) 22 10 2.0 0.8 Iti
Gastos
320 224 138 180 246 372
(dólares)

a) Estime los coeficientes B6, 0ty Fz del modelo de regresiól lineal núltiple:
b) Use el nodelo para predecir el gasto cuando el embarque pesa 2.4Tm y se lo transporta a
1200 krn;
c) Calcule e interprete el coeficiente de deterninación urirltiple y el coeficiente dc determi-
nación ajustado. Conente los resultados.
Capítulo 71. Regresión MúItiple

ó Un economista está interesado en Ia relación quc cxiste cntre Ia demanda de viviend¿rs, su precicr
y el ingreso rnedio anual de los hogares. Si denoniin¿rrlos por y Ia denanda de vivienda, medidtr
en unidades adecuadasi z1 al precio pronedio de las vivicndas; y, 12 el ingreso familiar promedio.
Los valores de estas variables se recogieror] para 6 periodos y se muestran en Ia siguiente tabla:

Periodo ?l :x7 r2
1 8 72 6.8
2 I IL) 7.2
ó 12 1ó 74
4 I T4 77
a
r) 12 l4 7.0
6 15 l5 7.4

Si el economista supone que el modelo apropiado es uno de regresión lineal múltiple:

a) estirne los coeficientes de regresión del modelo;


b) calcule el coeficiente de determinación;
c) realice la tabla de análisis de la varianza e intelprete su resultado;
d) efectúe las pruebas para determinar la significación de los parámetros individuales.
4 En la tabla se dan los datos soble las ventas senranales promedio (en cientos de dólares) de cada
turo de los restaur-antes que tiene una caclena cle coruicla rápida, su capacidad cle asientos y cl
núrmero de clientcs (en cieutos) que ingresan a ca<la loc¿rl.

Número de Número Ventas


asientos declientes semanales
120 19 13.8
200 8 14.2
150 t2 14.0
180 l5 r8.2
240 t6 oc f
¿¿.t)

a) Asumiendo que el modelo de regresión es lineal rnúltiple, estime los coeficientes Bs, 0t y 0z
y sus intervalos de confianza corresporrclientes (rrse g5 %);
b) Calcnle R2 y RZ. Intelprete los valores obteniclos;
c) Construya la tabla ANOVA y realice ltr prueba de adecuación del modelo;
d) Use el modelo para realizar la estimación y la predicción de la venta semanal de un restau-
rante que será instalado con una capacidad de 150 asientos y se espera que ingresen 1400
clientes.

5. De una encuesta de presupuestos familiares se han obtenido los siguientes datos rnensuales:

Gasto en energía eléctrica ($) 30 40 50 /Ll 70 130


Ingreso familiar ($) 300 800 1500 2400 1200 3000
Tarnaño familiar 2 4 Jo t) 4 8

a) Construya interprete un modelo par-a explical el gasto en energía eléctrica en función del
e
ingreso familiar y el tamaño de Ia familia:
b) Caicule los coeficientes de deterrnin¿rción (mirltipie y ajustado) v la varianza residual;
c) Constluya un intelvalo de corfiauza corr nivcl 95 % par-a el efecto de Ia variable ilgleso
farniliar;
17.9. Ejercicios 367

d) Indique qué coeficientes son significativos:


e) Si el tamaño de Ia familia permanece constante, calcule la variación del gasto esperado para
un incremento de renta de 350 dólares.
f) trfectúe la prueba sobre Ia significación de la reglesión.

6. Sear las variables: .L : latitud en grados, A : altura en metros sobre el nivel del mar y 7:
ternperatura media anuai.

a) Explique ? en función de tr y A con base err la información obtenida en varias ciudades:

L tt ,4
J(J.9 JJ.Z 31.3 29.5 26.8 26.5
A 722 145 195 124 t07 r30
T 139 14.9 16.4 77.2 18.0 18.0

b) Prevea Ia temperatura media para Lrra ciudad cuya latitud es 30.5 y la altitud es 150 m;
c) Calcule los coefi.cientes de deterninación mriltiple y a.justado;
d) Realice la tabla de análisis de la r.arianza e interprétela;
e) Contraste la nulidad de cada uno de los parárnetros de Ia regresión e indique si es posible
encontrar un modelo mejor que el plariteado.

Se estimó un modelo de regresión rnúrltiple a, partir de 25 observaciones y se obtuvo:

Coeficiente Estimación Error estándar


0o 10.6 2I
bt 2E.4 L1 2
it,t 40 15
12.7 14.7
[]n 0.E4 0.76

a) En el rrroclelo propuest,o: 11 : 0o I 0f¡ * p2t2 I 111:r:s t Asr+ * e, ¿,qué regresores son


estadÍsticamente significativos? (Use r.ur nir.el dcl 5 %);
l,) Usando los resultados de a) , prediga el valor de la respnesta para rp : (1,2,7, -7)t mediante
un intervalo.

En un estudio sobre la relación entre tres varia,bles se cibtuvieron 11 mediciones con los siguientes
resultados
11 11 11

fi:1 11¿ : 66, D


i:7
r?o : 506, )--
i.-I
r1¿9¿ : 85,

11 11 11

\-
Zr r"'
: -22, Dr3o: 484,
Drr,rn: r42,
,i:l t-1 i-I
1t 11 11

IY¿:33, D,r?: 2Be, \-.,


/J
;t,>; : _ 346
i:1 'i:r i,-I

a) Halle la ecuación de regresión lileal clue ajusta los datos;


b) Realice la tabla de análisis de la varianza e inter¡rrétela;
c) Encuentre los intervalos de confianza de los par'árnetros del rnodelo e interprételos. (Use
1-a:0.9);
d) Halle el coeficiente de determinación errtre las va.riables.
358 Capítulo 77. Regresión MúItiple

Regresión polinomial

9. En el laboratorio de una empresa automotriz se rnidió la distancia que tarda un automórril en


frenar, de acuerdo a la velocidad que lleva el n-iomento qrie aparece Llna señal. Los datos se
muestran en la siguiente tabla:

Velocidad (krn/h) 30 40 60 80 90 100 110 r20


Distancia (m) l0 20 30 50 90 150 250
^l

a) Ajuste una ecnación polinomial de segr-rndo grado a los datos;


b) Determine la calidad del ajuste:
c) Realice una prueba global de la bondad de a.juste mediante la tabla ANOVA.

10. En una entidad bancaria las tasas efectir.as de interés varÍan de acnerdo al monto del préstarno
que se concede) ya que se incluyen gastos administrativos e impuestos que cobra el estado. Para
encontrar un modelo, se recogieron los siguientes datos, de varios préstamos concedidos:

Monto (miles de $) 05 10 1.5 oÉ


3 t) 40 6.0 90 12.0
Tasa ( %) o.)
i,) -J 21 17 15 l6 19 27

a) Grafique los datos ;' postule un rloclelo de regresión para los datos;
b) Ajuste los datos mediante el modelo de regrcsión de a);
c) Realice una prueba global de adecuación del modclo;
d) Pruebe si los términos individuales del rlodelo pueclen eliminarse.
11
t.t. Los datos que se presentan a continnación corresponden a1 tiernpo de secado de un balniz y la
cantidad de cierto aditivo quínico anadido:

Cantidad de aditivo ( g) 1 2 ,) 4 5 b 7 B
Horas de secado B5 80 60 50 6.0 tt
(J r, n.5 7.0

a) Use el método de ajuste a un modelo polinomial de segundo orden para modelizar los datos;
b) Realice una predicción para e1 tienpo de sccado, cuando se han añadido 6.5 gramos de
aditivo químico;
c) Calcnle los coeficientes de determinación R2 y RZ e ilterprételos.

12. En ttn estudio de la contaminación por gases despcclidos por ios vehículos en las calles de Quito.
se midió la concentración de plomo (en ppm) en cl aire y se registró la temperatura ambiente
(en "C) el momento de la medición.

Temperatura 80 10.1 12.6 1,1.3 15.6 76.2 17.r lB.7


Concentración nt ii8 74 88 (\7
l!) 107 115 118

a) Encuentre una ecuación de segunclo orden qr,re a.juste las observaciones;


b) Realice un análisis de varianza de la regresión y pn.rebe la significación del ajuste;
c) ¿Es posible simplificar el modelo elinilando una c1e las conponentes? ¡,Por qué?

Regresión con variables ficticias


77.9. Ejercicios 359

1D
t,) Sc cree que en ciertas enlprcsas cxiste discrirninaci<il scxual cn el trabajo y quc se paga más a los
hombres clue a las mr-rjeres cuando re¿rlizan el misrno trabajo. Los datos de la tabla corr-esponden
a los años de expeliencia, el sexo y 1u..11¡klrrs arrttales (err miles de dólares), de empleados que
tienen las misrnas funciones en 9 empresas dc consultor'ía.

Exoeriencia Sueldo anual


(anos) (miles)
.) lrlllJ er' 12.9
4 nruJer' 13.0
5 nrlrJ er 13.8
6 nIll.Jer 74.4
8 mrrler 15.7
4 hombrr: 73.4
5 fiorribrc 14.7
hombr-e 1.7
a ¡ .1A
7
B homble 2r.\

a) Ajuste un modelo de regresión a los clatos;


b) Pruebe la significación de la regresión;
c) Pruebe las hipótesis Hs: p¿:0 para los coeficientcs clcl nodeloi
c-l) Utilizando el resultado anterior, ¿se pucde colchrir clrrc existe discliminación? ¿Por cgó'?

l.l Err lrna erl]presa que se dedica a la transpoltación cle triristas, se sospecha que el constuno clc
c-:ornbnstible de los autos dcpende dc la aritigiicda<l clc óstos y clel scxo cle c¡rieu los c<¡l<lucre.
Para probal esta sospecha se r-ecogió la siguientc infonr¿rciriri:

Consumo Sexo del Antigüedad


(gal/100 krn) conductor del auto
4.7H3
5.0 \I 4
4.6 \I 3
4.0H2
5.2 \I 1
4.7 XI 4
3.5H4
4.7H1
a) Cion Ia ayuda cle variables indicadoras ar.jrrste rrrr rrroclelo de reglesión a los datos;
b) Elabore una tabla de análisis de la r'¿u'ialz¿r y c:alcnlc el coeficiente de deterninación múrlti-
ple;
c) Realice pruebas sobre los parámetlos de ler lcgresión v cletermine crrál de ellos debe ser
excluido del modelo;
cl) Interprete los resulbados obtcnidos.

Los siguientes datos corr-espon<lcu al tierrrpo d<¡ sobrevirrerrci¿r, en horas. rle uuas ratas luego c¡rt:
se les suministra cierta closis de veneno. En ci expcrinrernto se consicleró 2 tipos de r.eneno (A I'
B) y la edad de la rata.

Edad (rneses) t 2
._)
J 4 1 2 3 4 2
D
()

Veneno A A A A B B B B A B
Sobrevivencia 45 8.2 63 7I 36 49 4.4 5.6 67 5.0
360 Capítulo 77. Regresión MúItipIe

a) Realice un ajuste de los datos con la ayuda de variables indicadoras;


b) Pruebe la significación de Ia regresión y calcule el coeficiente de determinación múltiple;
c) Calcule los estadísticos ú para los coeficientes del modelo y examine si alguna de las variables
puede excluirse;
d) De acuerdo a lo obtenido en c) , encuentre el modelo definitivo.
Capítulo L2

lntroducción a las Series de Tiempo

El protñstico es el, arte d,e establecer Io que hu,bzero, suced'irlo


s'i, Lo clue suced,ió t¿o hubi,era su,cedlid,o.
David Myddleton

P¿rr¿r cl análisis cle las serics de ticrnpo existen varios cnfoc¡res, ninguno de los cuales se puede decir
cllle es mejor clue los restatttes. Nosotros nos lefe-,-iremos al urás simple) qlre cs el de identificar los
pr-irrcipales factores qllc pal'ecen influil en los valoles inclividuaies de la misma y examilarcmos los
métodos de predicción que se agmpan bajo el nolrbrc genérico dc métodos de suavizamiento o cle
aterruat:ión.

L2.L. Introducción
Pala cl análisis de ttua valied¿rd de fcnórlenos físicos, económicos o fi.nancieros disponcmos de una
cierta cantidad de observaciotres de una lrism¿r variable aleatoria numérica, tomadas en norncntos
ecluiclistantes; entonces, los datos analizados tienen plopiedades interesantes aigunas de las cuales las
vanlos a presentar.

Prinrero, definamos lo quc se ctrtiende por serie de tienrpo (c1uc también se denomina como serie
ltistórito. r¡ serie cronolóq ico,).

Defirrición (de serie de tiernpo) Una scrie dc ticmpo cs un conjunto de datos que están
orcleu¿'rclos en el tietlpo y cllre lian sido tomados a interv¿rlos ecluiclistantes en el tiempo.

Como cjemplos de series cronológicas podernos rnelcional los sigrricntes:

1. La tempcratura dialia proruedio tomada cn Iugal cspecÍfico, dulantc un

2. Ei fudice mensual de precios al consnnricloL (IPC).

3. Los precios de venta de cieltos at-tículos, clc tenporacla.

4. El caudal diario promeclio de rlo) cn sitio clcterrninarlo.

5. El nirrlero de empleados en ramas relacion¿rdas co]r el tnlisrrro.

361
362 Capítulo 12. Introdttcción a las Series de Tientpo

Si Ias observaciones de un fenórneno se han realizaclo a trar¡és del tiernpo, es posible qrle preser]-
ten escluemas qr-le se repiten periódicaruente v que las obscrvaciones contiguas sean) probablernente.
dependientes.

A las series cronológicas se las representa mediante diagramas de dispersión (gráficos X -Y) donde las
observaciones se representan en e1 eje de las ordenadas y lar variable tcm.poral en el eje de las abscisas.
La r'¿rriable tiempo (ú) es la variable indeperrdiente.

Nosotlos llcvaremos la siguiente notación:

1. La variable tiempo (ú), que tomará \ralores en los entelos positivos: t:0, I,2, ..., n.

_a- La variable de las observaciones (Y), que 1a supondremos dependiente del tiempo: Yo, Yr, ...,
v

Para realizar el análisis, en primera instancia, se aplicarán los rnétodos tradicionales de la inferencia
estadística para modelizar los datos y corocer la bondad del ajuste realizado.

L2.2. Componentes de una serie de tiempo

Desde el punto de vista tradicional, los componentes de nna serie de tiempo son: la tendencia secular'.
y los conponentes estacional, cíclico e irregr.rlar.

L2.2,L. La tendencia secular

De los conponentes que afectan a los valores individuales en una serie clolológica, el más inportante
es, getreraltnente, Ia tendenc'ia secttlar (o llamada sinplemente tendencia), que se define corlo el
mor.imiento característico de crecimiento (o de declecimiento) a largo plazo de la serie. Por eso, Ia
tendencia solo se pu.ede determinar si se dispone de datos de la serie en Lrn periodo largo de años.

La tendencia es la dirección subyacente (hacia arriba o hacia abajo) en la serie de datos, a largo
plazo.

A la tendencia se la identifica mediante el símbolo 7.

Las ftterzas básicas que producen o afectan la tendencia son: los cambios en la población, la inflación.
el ca,mbio tecnológico, el incremento de Ia productividad y los ciclos de vida de los productos.

Para la modelización de este componente se ritilizan modelos lineales, polinomiales y otros. EI método
más simple, y más ampliarnente usado pala describir- la tenclencia es la regresión lineal sirnple y las
transformaciones que pueden hacerse hacia este modelo. Así, la tendencia puede ser lineal creciendo
a una cantidad absoluta constante a lo largo del tiempo- o puede ser exponencial, creciendo a una
tasa const¿rnte a lo largo del tiempo. Alternativamcnte, la tendencia puede ajustarse a un polinonio
o otlo modelo más cornplejo.

Pol sr-r natnraleza e1 análisis de la tendencia tiene implicaciones en la planificación administrativa a


lalgo plazo.
72.2. Contponentes de una ser-ie de tientpo 363

L2,2.2, La variación estacional

El coupouente estacional de la serie es un patrón de carnlrio qlre se repite legularmente err el tienrpo.

Este movimiento debe courpletarse dentro del pcriodo de un año y rcpetirsc, de rranera semejante año
tras ario, a fin de consicleralsc un cambio estacional. Así. ptrla identificar el conponente estaciolal cn
una scric histórica, es necesario recopilar los cl¿tos para rrrils cle rrrr pelio<lo de un ar-ro.

Por eiemplo, si considerarros Ios registlos dc clem¿rncla clc liabitacioncs er los hoteles de los sitios
turísticos más visitados, dnr-ante el ario. En los r]rcses rlc vac¿rciorres clc los regímer).es escolares de
la Costa ), de Ia Sicrra se procluce rlrayor derlanda cllle cn el lcsto cle mescs del ario. Así, los datos
presentarán rrariacioncs estacionales) con Lula rllarcAd¿r tendeucia a aurtrent¿rr, durarrtc los pcriodos
señalados.

\{ientlas que ia tendencia se rttiliza pala la plalificaciórr a largo plazo, el análisis del componente
estacional dc una seric histórica tienc implicaciones a cor-to plazo, más inniecli¿rtas.

Las fluctuaciolles estaciolales sc preseltan típictrniente err los clatos clasificados por rneses o trimestres;
Io clue conduce a qlre se deba c¿rlcular Lln valol estacioual por sepalacio para cacla rnes (o trimestre)
clel aiio, por Io general en la folma de un núuler'c1 írrclicc.

Etr la Fignra 12.1 se gráfica tura seric con collportalrierrto cstar:ional. La variación estacional se
reprcsenta nrcdiaute .D.

Figura 12.1: Serie cle tiernpo con fluctn¿rcioncs cstaciolales.

12.2.3. La variación cíclica

El coutponente cÍclico cs la flnctuación en for-tr. a, de on<l¿Ls cl ciclos, de urás cle un año dc duración,
proclr.rciclo por cambios en las concliciones ccouónricas.

Los coupouentes cíclicos sc asctrejan a los estacionalcs erl que t¿rmbiél son movimientos ondulato-
rios lepetitivos, pero difieren erl que 1os rr.ovimielrtos son de duración más prolongada y sotl menos
predecibies en cluración y en amplitud.

El análisis del compouente cíclico es de impolt¿rncia en la planificación a Iargo y mediano plazos ya


cluc petruite prcveer los periodos en los que estas variacioncs afectarán las actividades.

Un ejernplo dc variaciórr cíclica se presenta en el plecio clcl petróleo, que cll las úrltirnas décadas ha
tenido periodos largos de crecimiento sosteuido, segr.riclos cle perioclos cle fuelte caída.

La valiación cíclica se la identifica por C.


364 Capítulo 72. Introducción a las Series de Tiernpo

12.2.4, La fluctuación irregular

El componente irregular corresponde a fluctuaciones causadas por sncesos irnpredecibles o no pe-


riódicos.

El componente irreguiar puede deberse a fenórlerros como un clima poco usual, huelgas, guerras,
elecciones y cambios el las leyes, o por los errorcs qne se corneten al realizar Ias mediciones.

EI conrponente irregular de la serie histórica se identific¿r con el sÍmbolo 1.

El principal uso de las series de tiempo es la realizacióu de pronósticos. En este capítulo nos con-
centrarenros en Lrn conjunto de técnicas de pronósticos conocidas como m,étodos de atenuo,cidn de las
series, qne son fáciles de implernentar y no requieren cle técnicas matemáticas sofisticadas.

L2.3. Atenuación de series de tiempo

Las técnicas de atennación o su"auizamtento se enplcan para reducir las irregularidades; es decir, las
fluctnaciones aleatorias) en una serie de tiempo, proveyendo una visión más clara del comportamiento
subyacente en la serie de datos.

En algulas series cronológicas la variación estacional es tan pronunciada que no permite apreciar la
tendenci¿r o los ciclos, que soL muy irnportantes para entender el proceso observado. El suavizamiento
pu.ede rerrover Ia estacionalidad y hace que las fluctuaciories a largo plazo aparezcan más claras.

Adeurás, con frecuencia, el analista quiere actualizar los pronósticos diaria, semanal o mensualnente
de manera rápida, barata y sencilla, eso se puede lograr mediante los métodos de suavizamiento de
los datos.

Las técnicas más cornunes son el suavizamiento por prom,ed,i,os m,óui:les y eI suaui,zami,ento erponencial.
Cono el tipo de estacionalidad varía de serie a serie, así debe variar el tipo de suavizamiento empleado.

Estas técnicas se basan en promedios ponderados cle rnediciones anteriores. La explicación consiste en
que los vaLores pasados contienen información de 1o que ocurrirá en el futuro. Debido a que los valores
anteriores incluyen fluctuaciones aleatorias, así como información relativa al patrón subyacente de la
variable en estudio, se hace un intento de suavizar estos valores.

Estos métodos son apropiados cuando:

Hay que realizar pronósticos de muchas series.

2 Solanente se requieren pronósticos a corto plazo (hasta Lrnos cuantos meses)"


.)
Es aceptable una precisión razonable, rrras no exacta.

4. Desde el punto de vista costo/beneficio. no se justifican procedimientos más complicados.

Teniendo en cuenta lo anterior, se pueden enumerar brevemente las ventajas y desventajas de


nétodos de pronóstico por suavizamiento:

Ventajas

1. Simplicidad, facilidad de comprensión.


72.3. Atanuación de series de tiernpo

Precisión aceptable (pcro de ninguna lrlauera cxactitud total) en una amplia variedad de apli-
ca(:10tles.

Fácil inplementación infonnática.

Desventajas

1. Por k¡ general, requicreri de un sistema horrrbre/r.nh<¡rirra, cclu vigilarrcia mannal y posibilidades


de invalidación.

2. No pronostican los pr,rntos cr-ucialcs, cu.ariclo ha1' ¡'¿1m1,ius bluscos en cl patrón de los datos.

3. Sc aplican solo cn 1os pronósticos a corto plazo.

4. Puedcn reaccionar cxcesivanente al azar-. calrsando oscilaciones destructivas.

5. Pucclerr presentar problcmas técnicos en 1¿-¡ sclccción del moclclo corlecto y en la selección de Ias
coustantes de snarrizamienlo.

12.3.1. Suavizamiento por promedios rnóviles


Los datos históricos se pucden aterrlrar en rnuch¿rs forrnils, pero siempre con el objetivo de usar los
cltrtos disponibles para desarloli¿rr un modelo dc plonóstico para pcriodos ftttulos.

El método más simple e intuitivo es usar el pronredio sirnple, consistentc cl cncontrar la media arit-
n'rética cle todas las observaciones y tisarlo para pronostic¿rr el siguiente peliodo; es decir,

Vr.
1)''
rt+I : t:l
<>
?1,

Este nétodo, en gcneral, tiene una validez muy lirnitacla ya qr-lc es aplicable cuando 1os datos no
I)r'esentan tendencia, estacionalidad u otros patrones sisternátic<ts.

Ejemplo. En el Cuadro 12.1sc presentan las observacriorres qne corrcsponden alas ventas trimestrales
de una errpl'esa en el periodo 2003 a 2006.

Pronosticar las ventas par-a el ¿rño 2007.

Soluctón: El promedio de l<¡s 16 datos es igual a 556.6. Es clecir'. ?rr:556.6.

El valol del pronóstico puede parecer bzrjo ya clue cr1 los plimeros trimestres de los irltinos arios las
t¡entas fucron nayores que el valor pronosticaclo. Adcn¿is. si deseamos un pronóstico para cada uno
clc ios trimestres dcl arlo 2007, no podcmos hacello. Vclrros que el método propuesto es insuficiente
pma nucstros propósitos.

En tnuchos análisis, 1os clatos clue prcsentan nl¿t\or intcrés sorr 1os nrás recicntes ya que ellos darán
lnayor información del actual estado del proceso que aclut:llos d¿rtos que fucron tornados al inicio del
tnismo. P¿'Lra realizar ésto sc puedc cralcular el pronreclio para l¿rs observaciones más recientes. AI
cstar disponible una nlle\¡a observación, se puecle calcul¿u' r-lna nlieva media eliminando el valor rlás
arrtiguo e incluyendo el rlás recientc.

P¿rra describir este cnfoquc sc emplea el tórrliuo ¡rrorucrlio (o rur:dia) rnóvil. Entonces, se usa est,e
1-rlon-iedio mór.il p¿rra pronosticr¿u el siguiente pclioclo.
366 Capíttrlo 72. Introducción a Jas Series de Tientpo

Año Tbimestre Ventas


I 1 598
2 2 390
.l
3 267
4 +1 ra,
J/()
2004 1 5 588
2 6 425
3 7 371
1 8 609
2005 1 I 777
2 10 ó32
J 1l 433
4 \2 689
2006 1 13 855
2 t4 618
L) 15 460
4 16 720
Cuadro 12.1: Datos correspondientes a las ventas tlimestrales de nna elnplesa.

La expresión matemática de la rnedia móvil es

A,[t: y+t Y + Yt-t iYL z + "' + Yt ¡¿+r


1L

doncle

A,,It promedio móvil en el periodo ú;

?,*, valor del pronóstico pala el siguiente pr:r'ioclo;

Y \¡alor real en el periodo tl y,


nirmero de tónninos err el promedio mór'il.

AsÍ, el promedio uróvil para cl periodo ú es i¿r rnedi¿r aritnrírl ic:¿r <lc las r¿ obser\raciones más recientes.

Obserrrcmos que el nittnero de perioclos que iuter\:ienerr clr cl c¿ilculo dc nna media móvil palticuiar
no c¿iurbia al correr del tiernpo. Porésto, es inrportzrltr: cscoger ci nÍrrnero de periodos ??r qlre scl
clenoruina su orden. Para datos trimestrales es frecucnte clue se utilice rrn plomedio móvil de ordeu
4 y para clatos nensuales un promedio mórril <le orclen 12: cs clecir. se ernplea el misrno orden de la
estacionalidad dc la serie.

Ejemplo. (Continuación) Realizar cl pronristico. urercli¿ruttr nrccli¿rs mciviles. cle los clatos del Cuach'cl
72.7.

Solu,ción: Como los datos están clados en forra tlirlestr'¿rl tonralemos una media móvil de or-clcl 11.

En el Cuadro 1,2.2 se encuentran los pronósticos pala la sr:r'ie completa.


Examinemos los cálculos del plonóstico del periodo 17:

A':rc : ?r, : hn -F Y15 I Y1a * Yi3

720+460+618+855
: 663.3.

Entonccs. para el primer trimestre del año 2006 se espcr'¿r tener urr nivel de ventas igual a it :
663.3. Si comparanlos con las obsenaciones clc los riltimos airos, cl valor del pronóstico es mucho más
lazonable que el anteriormente obtenido, per-o persiste el problema de Ia realización de pronósticos a
mayor plazo.
72.3. Atenuación de series de l,ienrpo 367

Pronostico de
Ventas Plomedio
Año Trimestre t Y, rnovil, ?,
11ó98
22390
33267
44573
2003 15588 457.r
26425 454.5
ñt1
ó I Jf I 463.2
48609 489.3
2004 19777 198.2
2 r0 532 545.5
3 11 433 572.4
4 t2 689 587.7
2005 1 13 855 607.8
2 14 618 U¿T.J
3 15 460 648.8
4 16 720 655.6
2006 117 663.3
Cuadr-o 12.2: Pronóstico mecliante pr:omeclio móvil.

L2.3.2. Suavizamiento por la rnedia móvil doble


Es una vari.ante del método expuesto) que tiene rrayor efectividad cuando se dispone de una serie de
tiempo cuya tendencia es lineal. EI método consiste en, primero, calcular un conjunto de promedios
uróviles; y luego, se calcula un segundo conjunto colno plorrledio móvil del primero. La técnica de
atenuación por promedio móvil doble se realiza de la forma siguieute:

1. Se calcula el pronedio móvil (simple) de los clatos:

A,It : Y+Y:-fY z+"'+Y-r¿+t (12.1)


n

Daclo que NIr:?r+t, se Lrsa esta nueva serie para calcular un segunclo conjunto d.e promedios
móviles:
: AI¿ I A[¡-1 + A'[t 2+ "' + A'I;,,+t (t2.2)
^rl
3. Se calcula Ia diferencia entre los dos promedios rnóviles:

at:2AIt AIí (12.3)

y ttu factor de ajuste adicional, similar a la medición de una pendiente que cambia a través de
la selie:
,
b,: ;t_ tQt, - tt',) . (r2.4)

4. Se forma Ia ecuación que servirá para realizar el prouóstico en p periodos en el futuro

Y+y,:cr"¡lb1P, (12.5)

Ejernplo. (Continuación) Realizar el pronóstico, con la tócnica de la prornedio móvil doble, de los
:latos del Cuadro 12.1.

Solttción; Los resultados se presentan en el Cua,dro 12.3.

-\ continuación se exponen los cálculos para compr-ender el pronóstico del trimestle 17.
368 Capítulo 72. Introducción a las Series de Tiempo

Promedio Pronóstico
Periodo Verrtas Promedio móvil Valor Valor a+ W
t YL móvil doble de o de b (p: t)
598
390
267
tr¿73
457,1
588 454.5
42ó 463.2
37t 489.3 466.0 5t2.5 15.5
609 498.2 476.3 520.1 14.6 528.0
9 777 545.5 499.1 592.0 31.0 534.7
10 532 572,4 526.3 618.4 30.7 623.0
11 433 587.7 550.9 624.4 24.5 649.1
72 689 607.8 578.3 637.3 19.6 648.9
13 855 627.3 598.8 655.8 19.0 656.9
1.4 618 648.8 617.9 679.8 20.6 674.8
15 460 655.6 634.9 676.3 13.8 700.4
16 720 663.3 648.8 677.8 9.7 690.1
17 687.5
Cuadro 12.3: Pronóstico por promedio móvil doble.

1. Se calculan los promedios móviles de cuatro trirnestres mediante la ecuación 12.1:


Yrc*Ytr.lYtslY:n
A/[rc
4
855+618+ 460+720 : 663.3

2. Una vez que se ha realizado el suavizaniento por promedios móviles simples de toda la serie se
emplea Ia ecuación 12.2para calcular el segundo promedio móvil de cuatro trimestres:

Míu : lV[rc * N[rc + N[t+ -f N[n


4
663.3 + 655.6 + 648.8 + 627.3
: 648.8.

3. Se usa Ia igualdad 12.3 para calcular la diferencia de los dos promedios rnóviles:

&16 : 2L'1rc- A'I!6


: 2 x 663.3-648.8 :677.8.

La ecuación 12.4 ajusta Ia pendiente:

bro : :- (¡16 - ¡/í6)


n- I
: 2
_, (6Of.f - 648.8) :9.7.
4

4. Realizarnos el pronóstico de un periodo a futuro (ecuación 12.5 con p: l):


ñu*r : a16l b16p
: 677.8+ 9.7 x 1:687.5.

El pronóstico para el primer trimestre del año 2007 es d,e?17: 687.5, que puede parecer más razonable
que los dos resultados presentados anteriormente.
72.3. Atenuación de series de tiempo 369

t2.3.3, Suavizamiento exponencial


El suavizamiento o atenuación exponencial es un método que se utiliza para revisar cr-rnstantemente
la estimación de los coeficientes de un modelo de pronósticos con base en cada observación sucesiva
real.

El rnétodo plomediar los rralorcs anteriores de una serie, haciendo esto de forma decreciente,
se basa en
zrsigrrtruclo nlayor peso a las más recientes. Las ponderaciones empleadas se designan cotllo a (0 <
rl < 1) para la observación rnás reciente, a(l - a) para la siguiente más reciente, a(1 - q2 para la
signierrtc, y asÍ sucesiva[rente.

El rnéboc1o de cálculo de los pronósticos es el siguiente:

nlrevo pronóstico: cv x (nueva observación) + (t - cv) x (pronóstico anterior),

de rnanera qr.re la ec;uaciól de la atenuación exponencial cs

?r*r:aY+(1 -.)?,,

clon<1e

i,*r : rme\¡o valol atenuado o valor del pronóstico para el siguiente periodo;
¿v: colstante de atenuación (0 < a < 1);

Yl : ¡qs1'¿ obsenación o valor real en ei periodo ú;

?, : .rulo. atenuado anterior o experiencia promedio de la serie atenuada al periodo ú - 1.

Uua mejor interpretación de Ia ecuación que define el suavizamiento exponencial se puede ver en la
siguiente dcscomposición:

?,*, aYt + (1 - a)Y, : a)'¿ iY¿ - aY¡


?,+ *(v,-?,\.
\ '/

error (n - ?r\
r- antelior lfr)
\-'/ '"*" "'"..'^ \-ü -')'
L¿r ¿ttcrrtración exponencial es sirnplemente
"- el
.-^ pronóstico a veces el
"r¿r
ert el prortóstico auterior'.
La coustante de suavizatlieuto a sirve como el factor para ponderar, El valor de cv determina el grado
llast¿r el cual 1a observación más reciente influye err el valor del pronóstico. Cuando rr es cercano a 1,
ett el rruevo pronóstico Ia observación más influyente será Ia rnás reciente. Inversamente, cuando a es
cercallo a 0, en el pronóstico influirárr todas las observaciorres de rranera similar.

IJn rnétodo para estimar cr consiste en encontrar aquel valor que minimiza el error cuadrático medio
(ECM):
17

t
. ',
(r -?,)
ECM: t:I
1
11,

para diferentes valores de a. Para generar pronristicos firturos se clige el valor de a que prodr.rcc el
cr-ror más pequeño.
370 Capítulo 72. Introducción a las Serjes de Tientpo

Err la siguiente tabla se preseutan los cálculos clc los valores dc las ponderaciones para dos valores cle
o, En clla se puede observaL cómo influyen los valorcs pastrdos cr los pronósticos, en dependencia de
a.

a:0.1 a :0.6
Periodo Cálculos Ponderación Cálculos Ponderación
t 0.100 0.600
t-I 0.9x 0.1 0.090 0.4 x 0.6 0.240
L_: 0.9x0.9x0.1 0.081 0.4x0.4x0.6 0.096
!t
l,-L) 0.9x0.9x0.9x0.1 0.073 0.4x0.4x0.4x0.6 0.038
Los lestantes 0.656 0.026
Total 1.000 1.000

Ejemplo. (Continuación) R,ealizar el pronóstico, rnediantc suavizamiento exponencial, de Ios datos


clel Cuaclro 12.1.

Solución: Los resultados se presentan en el Cuadrc 12.4 con r.alores de la constante de ateuuación de
0.1 y 0.6.

Vaior Errol cle Valor Errol de


Ventas suavizado prortostico stravizado pronostico
Yt ?, 1": o.r¡ €¡ ?, 1o : O.O; ei
1 598 598.0 598.0
2 390 598.0 -208.0 598.0 -208.0
3 267 577.2 -310.2 473.2 -206,2
1A <-t
JIJ 546.2 26.8 349,5 223.5
5 588 548.9 39.1 483.6 t04.4
6 425 552.8 -r27.8 546.2 -L2L.2
7 37t 540.0 -169.0 473.5 -102.5
8 609 523.7 85.9 4r2.0 197.0
I 777 531.7 245.3 530.2 246.8
10 532 556.2 -24.2 678.3 -146.3
11 433 553.8 -120.8 590.5 -I57.5
12 689 54r.7 t47.3 496.0 193.0
13 855 556.4 298.6 611.8 243.2
14 618 586.3 3t.7 757.7 -739.7
15 460 589.5 - 129.5 673.9 -213.9
16 720 576.5 143.5 545.6 774.4
17 590.9 650.2
EMC: 27902.7 EMC: 33 991.3
Cuadro 12.4: Valolcs atenuados exponerrciahneute.

La serie atenuacla se calcula asignando iniciahnent r, ?, : 598, que cs el primer valor observildo, a
continnación Los cálculos se re¿rlizan de Ia siguiente ntaDera:

?r-, : nY¡1_(f -.t)Yt


?, : (0.1)598 + (0.9)598 : 598.

El cllor-de pronóstico es
e2 : Y2 - ?, :3g0 - bg8 : -208.

P¿r'¡r cl pcrioclo 17, rcsrrlta


72.3. Atenuación de series de tientpo 37L

?n : oY16l (1 - *)ña
: (0.1)720 + (0.9)576.5 : 590.9.

Con sinrilares cálculos, para una constante a:0.6 el pronóstico del periodo 17 es?y:650.2.
Para definil cuál de Ios dos plonósticos es el más aceptable, se puedel comparar los errores cuadráticos
nrcdios cle l¿rs series.

L2.3.4. Suavizamiento exponencial doble


La tócnica de suavizarliento exponencial doble. tarnbién conocida como método de Brown, se emplea
p¿rra pronosticar series que tienen una tendencia lineal y cs semejante al atenuamiento por la media
mór'il doble.

Primero, conviene que tengamos en cuenta que debido a qlle los valores de la serie no son pronósticos
en sí rnismos, Ias ecuaciones de actualización son más comprensibles si se adopta la siguiente notación.

-{¿ : valor (simple) suavizado exponencialmente de Y¿ er el periodo ü.

--li : valor doblemente suavizado exponencialmcnte de Y¿ cn el periodo ú.

La técnica de suavizamiento exponencial doble se realiza de la forrna siguiente:

1. Se calcula el valor sirnple suavizado exponencialmente, con el método antes expuesto:

At+t: aYt,r t (l - a)At. (12.6)

2. Se calcula el valor doblerlente suavizado exporencialmente, realizando otro suavizarniento ex-


poncncial a los datos recién obtenidos:

Alt+t: aAt+t + (t - a)Atr. (72.7)

3. Se calcula la diferencia de los valores atenuados exponencialnente:

at:2At - Al. (12.8)

y un factor de ajuste adicional, sirnilar a la pendiente:

u,: fá(At - A') ' (12.e)

l. Se folna la ecuación para realizar el pronóstico de p periodos en el futuro:

Yr*o: ct¡ I b¡p. (12.10)

Ejemplo. (Continuación) Realizar el proróstico, mediante suavizamiento exponencial doble, de Ios


i,rtos clel Cuadro 12.1.

:,llLtc'i,ón,: Los resultados de los cálculos se encuentran en el Cuadro 12.5.

-1. coltinuación se pr-esentan Ios cálculos correspondientes para el pronóstico del periodo 17.
372 Capítulo 72. Introducción a las Series de Tietnpo

Valor V¿rior Pronostico


Ventas suavizado suavizado V¿r,lor Valor a I bp
t Y At A', dea deó (p-t)
1 598 598.0 598.0 598.0 0.0
2 390 577.2 595.9 558.5 -2.r 598.0
3 267 546.2 590.9 501.4 -5.0 556.4
r+ o /.1 548.9 586.7 511.0 -4.2 496.4
5 588 552.8 583.3 522.2 -3.4 506.8
6 425 540.0 579.0 501.0 -4.3 518.8
-
/
q-1
,)/l
(ot 1
573.1 472.8 -5.6 496.7
8 609 531.7 569.2 494.1 -4.2 467.2
I 777 556.2 567.9 544.5 -1.3 490.0
10 532 553.8 566.5 541.1 -r.4 543.2
il 433 541.7 564.0 519.4 -2.5 539.7
12 689 556.4 563.3 549.6 -0.8 516.9
13 855 586.3 565.6 607.0 2.3 548.8
14 618 589.5 56E.0 611.0 2,4 609.3
15 460 576.5 568.8 584.2 0.9 613.4
16 720 590.9 571.0 610.7 2.2 585.1
I7 612.9
Cuadro 12.5: Pronóstico por suavizamiento exponencial doble con cv : 0.1.

1. \''lediante la ecuación 12.6 se calcula el valor de la atenuación exponencial simple de la serie


inicial (columna 3):

Arc: aY16]_ (1 - cr)415


(0.1)720 + (0.9)576.5 : 590.9

2. La ecuación 12.7 se usa para calcular el valor doblemente suavizado exponencialmente (columna
4).

A','u
: .',&;J;; üÍí;,, B:571 0

3. En la colunna 5 se calculan las diferencias entre los valores atennados exponencialmente, me-
di¿rnie Ia igualdad 12.8:

arc: 2A16 - A'6


2(590.9) -571.0:610.7

4. Con la ecuación 12.9 se calcula el vaLor ¿rdicional cle a.iuste (columna 6).

brc: ,L (Y
-
=(A,o-Aio)
0.1
(590.9 571.0) :2.2.
U 9
-
5. Finalurente, se empiea Ia igualdad 12.10 para hacer el pronóstico en el futuro:

ñu*r a16 i b6p


: 610.7 + 2.2(1) :612.9.
72.3. Atenuación de series de tiernpo 373

12.3.5. Método de Holt


El método de Holt es una técnica que se emplea para manejar series de datos que tienen una tendencia
Iineal pero que no presentan estacionalidad. La técnica atenúa en forma directa la tendencia y la
pendiente utilizando diferentes constantes de suavizamiento para cada una de ellas. Por esta razón,
el rnétodo presenta mayor flexibilidad al seleccionar los modelos.

La técnica consiste de los siguientes pasos:

l. Se suaviza la serie mediante el método exponencial:

At : aY + (1 - a) (At-t + Tt_t) . (12.11)

2 Se estima la tendencia:
Tt : 0 (A, - Ar_t)+ (1 - p)Tr*t. (r2.12)

3 Se realiza el pronóstico de p periodos en el futuro:

Yt+p: At * PTt, (12.13)

donde

A¿ : nuevo valor atenuado;

a: constante de atenuación exponencial de los datos (0 < r < 1);


Y¿ : nueva observación o valor real en el periodo ú;

É : constante de atenuación para la estimación de la tendencia (0 < 0 < I);


7r : estimación de la tendencia;

i+o: pronóstico de p periodos en el futuro.

La primera ecuación es similar a la igualdad original de atenuación exponencial simple, con excepción
de que se incorpora el término ("ú) para la tendencia.

En la segunda ecuación se toman dos valores sucesivos de atenuación exponencial, ya que ellos se
atenuaron con fines de eliminar la aleatoriedad, su diferencia constituye una estimación de la tendencia
local de los datos. Se atenúa esta tendencia con la constante B y se le suma la tendencia anteriormente
calculada multiplicada por 1 - B. EI valor obtenido es una tendencia atenuada que excluye cualquier
aleat oriedad.

La ecuación del pronóstico suma el nivel actual de los datos A¿ y el producto de la tendencia T¡ por
los p periodos.

Notemos que para iniciar la iteración, se toma At:Yt y Tt:0.


Ejemplo. (Continuación) Realizar el pronóstico) con el método de Holt, de los datos del Cuadro
72.7.

Solución: Los resultados de los cálculos se encuentran en el Cuadro 12.6.

Examinemos cómo se realiza el pronóstico en los periodos 2 y 77 con a : 0.3 y 0 :0.2.


374 Capítulo 72. Introducción a las Ser"jes de Tientpo

Valor tle Ia Valor de la Pronóstico


Ventas actu¿lización terrdenci¿
" lAp
Yt At TLY
1 598 598.0 0.0
2 390 535.6 -L2.5
3 267 446,3 oaa 523.1.
4 573 464.8 -18.6 4t8.4
5 588 488.8 - 10.1 446.2
6 425 462.6 - 13.3 478.7
7 371 425.8 -r8.0 449.3
8 609 468.2 -5.9 407.8
I 777 556.7 13.0 462,3
l0 o32 558.4 t0.7 569.6
11 433 528.2 2.5 569.1
t2 689 578.3 t2.0 530.8
13 855 669.7 27.9 590.3
T4 618 673.7 23.t 697,6
15 460 625.8 8.9 696.9
16 720 660.3 14.0 634.7
t7 674.3
Cuaclro 12.6: Pronóstico mediante el nétodo de Holt.

1. Cálculo de1 valor de la actualización de la serie. Para iniciar el proceso tomamos Ar : }i :


ft:0:
A2 : cvYz I - ") (Az-, -l Tz_t)
(1
: 0.3(390) + (1 - 0.3)(598 + 0) : 535.6.

2. La estilnación de la tendencia:

Tz: 0 @z -
Az_l) + (1 - 0)Tz t
: 0.2(535.5-598) +(1 -0.2)0: -r2.5.

3. El pronóstico de un periodo en el futuro:

?t*, : AzrPTz
: 535.6 + (1)(-12.5) : 523.1.

Con el mismo proceso para el periodo 17 tenemos:

1. Actualización de la seric:

Arc aY16 t
(t - r) (Arc-t +
"ro-r)
0.3(720) + (1 - 0.3)(625.8 + B.e) : 660.3.

2. Estimación de la tendencia:

Tte : 0 (Arc Aro-r) + (1 - 0)Tu


: 0.2(660.3 - 625.8) + (1 - 0.2)8.9 : 14.0.

3. Pronóstico de un periodo en el futuro:

ñu*'
: !;;!?¿{^o)(1): 6T4s
72.3. Atenuación de series de tiernpo 375

12.3.6. Método de Winters

La atenr-ración por el método de Winters es apropiada cuando la serie presenta una tendencia lineal
y una variación estacional. Es una extensión del rnodelo de Holt, en la que se utiliza una ecuación
adicional para estimar la cstacionalidad nediante un índice estacional.

Los pasos que se siguen en este rnétodo son:

1. Se suartiza la serie exponenciahnente:


Y
A': oiJ- (1 - s)(At r +?r-r) (12.14)

2. Se estima la tendencia:
Tt:0(Ar-At_t) +(1 - p)Tt_t. (12.15)

Se estina la estacionalidad:
c,- Y'
^,i*(1 -r)5¿-¿. (12.16)

Se realiza el pronóstico de p periodos en el futuro:


Yt+p : (At + TtP) St-r+p, (12.77)

donde

A¿ : ttr,evo valor atenuado;

cv: constante de atenuación (0 < a < 1);

Y¿ : 1111s1r¿ observación o valor real en el periodo Ú;

,ú : constante de atenuación de la estimación de la tendencir (0 < 0 < l);


4: estirnación de la tendencia;

7: constante de atenuación de Ia estimación de la estacionalidad (0 < f < 1);


S¿ : estimación de la estacionaiidad;

-L : longitud de la estacionalidad;
)i+p :
?.
prorióstico de p periodos en el futuro.

Ot¡sérvesc que el índice estacional ^9¿


se calcu.la tornando en cuenta el índice estacional S¿-¿, corres-
pondiente a tr periodos anteriores, y gue para iniciar la iteración se toma Ar:Yt, ?r:0 y Si.:1,
cuando el índice k no es positivo.

Ejemplo. (Continuación) Realizar el pronóstico, mediante el rnétodo de Winters, de los datos del
Cuadro 12.1.

Solt¿ctót¿: Los resultados de ia aplicación de la técnica se encuentran en el Cuadro 12.7.

Para comenzar los cálculos, verios que la longitud de la estacionalidad es -L : 4 y que se requieren las
estimacioncs inicialcs del valor atenuado, de la tendencia y cuatro estimaciones de la estacionalidad.
Para principiar el proceso de cálculo, usaremos 598 como valor inicial de la actualización, 0 cono el
vak¡r de la estirnación inicial de la tendencia y 1 como la estirnación de la estacionalidad.

Analiceuros los cálculos de los periodos 2 y 17, utilizando los r,'alores de a: 0.3, P:0.2 y ?:0.1.
376 Capítulo 72. Introducción a las Series de Tiernpo

Valor de la Valor de la Valor de la Pronostico


Ventas actualizacion tendencia estacionalidad a* bp
Yt A¡ TtStY
1 598 598.0 0.0 1.00 598.0
2 390 535.6 -r2.5 0.97 598.0
3 267 344.4 -48.2 0.98 598.0
4 573 325.0 -+.4.¿ 1.08 598.0
5 588 547.8 10.6 1.01 282.6
6 425 550.1 8.9 0.95 543.2
7 37r 4I7.6 -19.3 0.97 546.4
8 609 415.9 -15.8 Lt2 428.6
I 777 646.6 33.5 1.03 403.0
10 532 734.8 44.4 0.93 648.0
11 433 Có Lll -3.9 0.95 754.8
12 689 485.7 13.5
- 1.15 595.1
13 855 722.7 36.6 1.04 484.9
t4 618 823.5 49.4 0.91 706.0
15 460 612.r -)7 0.93 831.3
16 720 508.7 -22.9 I.I7 698.0
l7 637.2
18 556.0
19 566.7
20 698.8
Cuadro 72.7: Pronóstico mediante el método de Winters.

1. Cálculo del valor de la actualización de la serie. Para iniciar el proceso tomamos At : Yt, Tt : 0
Y Sz_,+: I:

A2 :
"3J24 + (1 - o) (Az-t -t Tz-t)
: o tfS + (1 - 0.3)(5e8+o) :53b.6.

2. La estimación de la tendencia:
T2 : 0 @z - Az_t) + (1 _ p)Tz_t
: 0.2(5355-598)+(1 -0.2)0: -t2.5.
3. La estimación de la estacionalidad:

Sz: ^,*,*(1 -r)Sz-a


390
= O t"rr" +(t -0.1)I:0.97.
De manera setnejante, tenentos para el periodo 16 y los sucesivos pronósticos:

1. Actualización de Ia serie:

Arc: ",;]Yrc + (1 - a) (Aro-r + ?ro-r)


0 J2 + (1 - 0.3)(612.1 + (-2.7)) :614.4t.
1.15

2. Estimación de Ia tendencia:

Trc: 0 (Arc - ,4ro-r) + (1 - p)Trc,,


0.2(.614.4r - 612.1) + (1 - 0.2)(-2.7): -1.698.
72,4, Cornparación de los rnétodos 377

3. La estimación de la estacionalidad:

,5ro : t#1It6 +(1 -.y)Sro-¿


: -
,,
u.t
720
+ (1 - 0.1)(1.15) : 1.15.
6rL4r
4. Pronósticos:

a) De un periodo en el futuro, p : li
ñu*, : (1ro + Trcp),9ro-¿+r
1614.41 + (-1.6e8)(1)l (1.04) : 637.2.

b) De dos periodos en el futuro, p:2:


?ru*, : (Aro + Trcp) Src-++z

1674.41+ (-1.6e8)(2)l (0.e1) : 556.0.

c) De tres periodos en el futuro, p:3:


ñu** : (Áro * Trcp)^9ro ¿+s
1674.4r + (-1.6e8)(3)l (0.e3) : 566.7.

d) De dos periodos en el futuro, p: 4:

Yta+a : (Aro + Trcp) Src-+++


: 1614.4r + (-1.6e8)(4)l (1.15) :698.8.

El método de Winters presenta la ventaja sobre los otros métodos en que podemos realizar pronósticos
por más periodos (por lo menos por un ciclo completo de estacionalidad).

Hemos expuesto varios métodos sencillos de pronosticación de series de tiempo. En este punto surge
la siguiente inquietud: ¿cuál método ernplear?

L2.4. Comparación de los métodos

Primero tengamos en cuenta que no existe un método qtle sea el mejor en toda ocasión. La elección
del método dependerá del conjunto de datos que se disponga y de la finalidad de los mismos.

La comparación de las técnicas de atenuación se realiza rnediante el error cuadrático medio que, como
.va se indicó, se calcula por
n
2 t
t (t'-Y) >,"7 ^r2
t:7
ECM: tl
I

donde e¿ es el error de pronóstico para cada una de las observaciones de la serie. Entonces, podemos
enunciar la siguiente regla:

lAquel método que proporcione el menor ECM será el más apropiado para la serie de tiempo que
lse analiza.

Ejemplo. (Continuación) Para los datos del Cuadro 12.1 veamos cuál es el método más apropiado.
378 Capítulo 72. Introducción a las Series de Tiempo

Solu,ci,ón: En el siguiente cuadro se encuentra el resumerr de ios rnétodos analizados con su ECM.
Método Parárnetros ECM
Promedio móvil simple 20826.2
Promedio móvil doble 24834.8
Suavizamiento exponencial cv: 0.1 27 902.7
Suavizamien to exponencial a:0.6 33 991.3
Suavizamiento exponencial doble a:0.1 29 547.4
Método de Holt a : 0.1, D
t): 0.2 31634.7
NIétodo de Winters a : 0.1, a 0.2, 1 : Q.1 54548.9

De los resultados, aparenternente, el rnejor método es el prornedio rnóvil simple y el pronóstico basado
cn él serÍa el apropiado.l

Depeldiendo de las observaciones se sugiere que se utilicen los modelos:

Exponencial. Si la serie no tiene una tendencia marcada y no muestra variación estacional.

Holt. Si Ia serie tiene tendencia lineal pero no muestra estacionalidad.

Winters. Si la serie tiene tendencia lineal y nuestra variación estacional.

Respccto a Ios parámetros de suavizamiento debemos indicar que ellos siempre varían entre 0 y 1.
Para cada constante de atenuación, cuanto mayor sea su valor, tanto mayor importancia se le dará
a la obselvación más reciente. Téngase plesente c¡re la mayorÍa de Ios programas estadísticos que
disponcn de estos métodos tienen implenentados algoritmos que escogen automáticamente la combi-
nación de parámetros que dan el ECM mínimo, lo que permite tener una estimación apropiada a las
observaciones disponibles.

Se aconseja al lector que implernente las fórurulas de los dir.ersos métodos en una hoja electrónica, lo
que Ie facilitará la realización de los cálculos.

L2.5. Ejercicios
1. Eu una academia de idiomas se sigue un sisterna trirlestlal. El núrmero de alumnos que estudian
el idioma esperanto en cada trirlestre, durante 4 años, se resume en Ia siguiente tabla:

Año Tbimestre No. alumnos Año Trimestre No. alumnos


1 110 3113
2 31. 234
343 348
476 479
2 1 11 4 115
.) t.) ñ t-
t¿J ¿ ,)l
345 351
417 427
a) Grafique los datost
N'Iediante los nétodos qlre se indican, realice el suavizamiento de la serie y el pronóstico al
periodo serlalado. También, calcule el ECM respectivo.
tConlc.' cl objetivo del ejemplo es ilustlal cl funcionamiento cle
las técnicas, los valoles cle los paláruett'os cle suaviza-
tuiento sc tonlar-on cle tlanela albiti'aria; ellos r-ro son los óptimos pala ninguno cle los lr-rétodos
72.5, Ejercicios 379

b) promedios móviies de orden 4 y p: I;


c) rnedia móvil doble dc orden 4 y p : I;
d) suavizamiento expolencial con cv :0.2 y p : l'.
e) suavizarniento exponencial doble con a:0.2 y p:1;
f) método de Holt coll cv :0.2,0 : 0.3;

g) rnétodo de Wintels para cuatro trimcstres, con cv : 0.1, 0 :0.3 V ^/ :0.4.

Las ventas trimestrales de casas que ha lealizado una cornpañía inmobiliaria en Ios últimos años
se presenta a continuación:

Año TYirnestre Ventas Año Tbimestre Ventas


1 1 50 4 1 55
DF
2 Jd 2 35
.) 25 ó 25
4 40 4 55
2 1 45 1 55
2 35 2 40
J 20 ó 35
4 30 4 60
o<
3 1 L)d 6 1 75
2 20 2 50
e 1r
1J J 40
4 40 4 bl)

a) Grafique los datos;


N4ediante los métodos indicados, realice el suavizamiento de la serie y el pronóstico al
periodo señalado,
b) promedios móviles de orden 4 y p : 7;
c) media móvil doble de orden 4 y p : I;
d) suavizamiento exponencial con a : 0.1 y p: l;
e) suavizamiento exponencial doble con a : 0.3;

f) rnétodo de Holt con rl - 0.3, 13


:0.25;
g) método de Winters para cuatro trinestres, con cv:0.4, 0:0.7 y ?:0.3;
h) Encuentre el rnejor rnétodo de ajuste nediante el criterio ECM.

En una universidad se implantó el sisterna de estudios cuatrimestral. EI número de alumnos


matriculados en la materia de geometría se presenta a continuación:

Periodo Alumnos Periodo Alumnos


1
r/l I 101
2 58 l0 103
a
d rlD li r02
4 72 t2 110
5 fJ 13 IT2
6 7r 14 111
I 93 15 728
8 94
380 Capítulo 72. Introducción a las Series de Tíernpo

a) Grafique los datos;


Mediante los métodos indicados, realice el suavizamiento de la serie y el pronóstico al
periodo señalado.
b) promedios móviles de orden 3 y p : 1;
c) rnedia móvil doble de orden 3 y p:7;
d) suavizamiento exponencial con a : 0.4 y p: L;

e) suavizamiento exponencial doble con a:0.4 y p: I;


f) método de Holt con 0 : 0.35, F :0.15;
g) método de Winters para tres trimestres, con a :0.2, 0:0.15 y 7:0.1;
h) Encuentre el mejor método de ajuste mediante el criterio ECM.
Capítulo 13

Elementos de Muestreo

Pot'un per1ueñ,o ltcrl,o,zo tl,e tn,u.estru. pod,e'nr,os .ju,zqa,r a Lo" piezo, r:otn,'pleto,
Miguel clc Cervantes Saavedra

Clonro sc inclicó en el CapÍtulo 1, en mnchos estrrclios cstadísticos l¿r lccolección cle la infolmaciórr
sc lealiz¿r medi¿intc Ia invcstigación pol nruestLcc.l )/ sc sacan colclr-rsionos con b¿rse cu la <<ilfeleucia
cst¿rclístic¿r>>.

Ilstc ca1>ítulo cst¿i dcdicaclo a cxponel los métoclos básicos cmpleaclos cn l¿rs invcstigaciorlcs pol'
rrrLrcs'iLco. I)elo rlo solo en Io ciue tiele cluc vel con 1a par-te estaclístictr, también se clatr algtttrtrs
inclicaciorres par'¿r la realiz¿rción pr'ácticir cle los sonclcos.

13.1. Conceptos básicos

En las irivcstigaciorles cllyo objertivo cs la lecopila<:ión c1e infonn¿rción csl¿rrlÍstic¿ sobrc rrn glullo cle

l)orsor)¿rs o cosas) sc clist.irtgnen rlos tipos clc cstuclios:

1 L¿r cncucsta total o censo, cuvo objeto cs cr¿uninar a toclos los eienrcnbos dc la pobiación.
2 La cncuesta palcial () l)or- ruuestreo. cluc tir:nc por objeto examinal uua partc pequcrla rle la
población, e infelil rcsullaclos pala aplicar'los ¿r 1a población conplcta.

Ac¡rrí apaleccn clos conccptos rluc fi'ccucntcncntc rrtilizalernos: la poblaciótr (o univcrr-so rnucstlal) y Ia
rrrlostr t.
Dclinición (de población) Unir 1;oblacirirr cs rulr c:olcc:cióu cornplirlir clc pclsor¿ts. ¿uriuralcs,
plrrrt:rs o cos¿ls de las cn¿rles se rlesea rccolcct¿tl cl¡tos.

Definición (de muestra) Es un grlrpo de rrni<laclcs sclcccriou¿rrlas <lc un grupo nrayor (la
pobltrción).

Pol el estrrdio clc la rrnrcstr¿l so csper'¿r obtcncl'uorrt:ltrsiorrcs soblc lir pol-ililr:ió1 .

En ilnchos casos la clccción clc un:i mtLestr'¿r cs f¿icil: pol ejerlplo. p¿rrl conoccl la plopoicicirt r.Ll

<lespclclicio cll llrl s¿rco cle maíz o par¿r colloccr cl nrinrclo cle piczars clcfcctlLr-¡slLs cn un lote clc plodlLtt,.-,s.

381
382 CapÍtulo 73. Elententos de I\[uestreo

etc. Bast¿uá mezclar bien los ploductos )' tourar ttna pcclttetia paltc cle ellos. Lo clue se deduzca de
cstir peclueña polción (o muesir-a) ser-virá pala ,juzgar a la totalidad clel producto.

Par'¿r conocerla preferencia clc Llna rrarca de gaseosa por palhe dc los corrsumiclores, o el tiempo que
Iu población declica a mirar Ia televisión o cl favoritismo por cicrto particlo político entre los votantcs,
cs rnás complicaclo. Los elementos son más hetelogéneos )'serí¿r imposible aplicar el método clesc-.-ito
pala tomal una mnestr-a, como se hace con los plocluctos.
Aunque Ia muestra poclría tonralse corno Lul subcorrjunto cr.ralcluicra cle la población, en una iuvcsti-
gación es necesario que cr-rrnpla cor ciertos requisitos. par¿r c¡.lc rros pro\¡ea de inforrnación colfiable
sobre Ia población. La mlrestla ira de ser Llrla rcproducción cn peqneño cle la poblaciól. AsÍ. ha de
sel' nn Ecuador, un Guayas o un Quito en ruiniattua, si se trat¿r cle ul sondeo relativo al Ecttador, o
l:r. provincia clel Gr-rayas o a la ciudacl cle Qr-rito.

Pcro. ¿cómo hacer para qlrc l¿r mncstra sea una copia. cn pcc¡.rcño, de la población? La respttesta cs
qrrc ln rluestla debe cstal coustituida por uu. núrmelo suficicntc cle elernentos, tomados al azi'tr', clc la
población.

Pala l¿r correcta elección de la muestla, el] plirrel lugal cs necesalio hacel nna lista de los ob.jetos cle
l¿r c:ual se la seleccionar'á, hrego se procederá a sortearlos para incluirlos clr la nruestra.

Ilntonces, tenenlos las siguientes clcfiniciones:

Definición (de unidad rruestral) Los objetos que se scleccionan dc una poblacióu se llauran
Luricl¿rdes mnestlales.

Definición (de marco muestral) IJn malco muestral es nlla lista courpleta dc todas las uriclades
rnuestrales de la población.

Por ejemplo, se desca conocel las prefer-encias electorales de toclos los rniemblos aclultos de Ia ciudacl
clc Arnbato. La población est¿i constituida por todas 1as persorras cn capacidacl cle r:otal que viven eu
Ambato. El marco uruestlal es una lista complcta con los nolnbres de cada miembro de la población
(cl pachón electoral). Una uuiclad uruestral cs tin residentc cr. Ambato y qnc csté crr capacichcl de
r.otAt.

Obselveuros que IIo siemplc cs posible tener nn lllarco rnuestlal pelfectameutc clcfinido) ya sc¿r polqrle
óst,c es urtty glaude) o l1o cxislc, o rlo se lo pucdc colfcccionar', \{¿1s aúrn, solo cr-ranclo la poblaciórr cs
pcqrtcria o coutt'olablc por cl invcstigador, es posible corrtar con Lrr. rnarco muestral ideal. Preguuté-
nronos: ¿quiéu podría clabolal nna lista de toclos los individuos, o dc toclas las falnilias, que vivcu cri
Grrayac¡ril?

Anl-cs cle telurinal', tcLretnos c¡re t'cferirnos a las convcnicncias y a las liruitacioncs cle las rnneslr'¿rs) con
lcsJrecto a la re¿ilización clc Lut cjenso.

Ventajas de tomar muestras:

1. Sorr ur¿Ís ccorrórui('ns.

2. Se emplea rrenor ticmpo cn la rccolccción de Ios clatos.

3. Sc obticnc rrna rncjor caliclacl cic infoln¿rcirln

Se ernplea cuanclo la lioblaciórr es glanclc o prrede consiclcr'¿rlsc iufinita.


I
rJ Sort aplopiaclas clranclo cl ploceso clc rriedicl¿r cle cada elcmcnto cs clestlucbivo o conllcvrr riesgos
¿r la salud.
73.2. Muestreo aleatorio sitnple 383

Limitaciones de torlar mucstras:

1. Si se necesita ilfornación cle todos los elenentos qrre conforman el ruriverso estadístico.

2. Si se rec¡-riere informacióu rnny clesagregacl¿r) p¿rr¡l áreas lntr\' pccluciras.

3. eristcn los clcruorrl,os tócriicos


CLrarrclo no v luni¿uros qr.re girutruticerr Lul Jrucn cliseño lnueshr'¿rl v
rura buena ejecuc:ión clcl sorrdco.

A corrliurración expondrclllos ios plincipirlcs tipos cle iln'cstig¿rciorrcs pol rnrrcsl-r'co, qilc sorr cl ale¡rtoricr
sirn¡rlc. el cstr¿rtificirdo ¡' ¡l clc conglornelados.

I3.2. Muestreo aleatorio simple


Conro se dijo, un bucn cliseno nruestlal lequierc cluc los elernentos cscogiclos sean tomaclos al azar'.
Con ósto garantizanros c¡.rc la mucstra leplesentc a 1:r poblacióu v clue las infelcncias a lealizal searr
r'¿iliclas. Al cxanen cle cste l,ipo de investigación dcclicarerlos csta sección.

La mar-oría de sondeos tienc uno cle los tr-es ob,jetivos siguientcs: cstinal cl total poblacional r, o
c.stirn¿,r la mcclia de nna poblaciól p, o cstimar la plopot'ción pol-rlacional p.

13.2.1. Estimación del total poblacional


Si urrir poblaciórr csb¿1 c:onst,i hLicltr por'lV unicl¿rcles, cle las cuales intclesa rncclir el calacber':u clc cacla
nno: 21. iü2, ..., i,JN. Dl tt¡t¿rl Po)tllciontrl sc clcfinc 1-rclr'

t:fu¿:N¡t,
r.:1

clonclc ,u cs Ia, mcdia poblaciorral.

Pol ejemplo, cn Ltra cncltcsl-l lc¿ilizad¿r los grrstos cri salucl clc los habitantes clc uua
palr,L csbirrr¿rl
cir.iclacl. se investigaría cl gersto mcclio por pcrsona, l¿, que lcalizan cn Lrn arlo; o tzrrnbién, ltucde scl cle
intcr'és cl gasto tobal, r, cluc sc rcaliza en dicho pobiado por corccpto cle salucl.

Intelvalo cle confiauz¿r

ilrtcn'alo palir cl total Tr l rlc corrfi¿urza r-lcl (1 - a) x 100 % cs

Donrlc:

-\¡ cs el lrúllelo cle clcurentc'¡s c.rr la población.


r¿ cs cl nrlmelo clc clcmcltos cu la ulrestra.

? es la cstinación clcl toL¡l ¡roblacional: ? : ly'z


384 Capítulo 73. Eletnentos de Muestreo

7 es el prornedio de la m.uestra.
s es la desviación estándar de la muestra.
Q
zo¡2 eI coeficiente de la ley normal estándar1 para el cual el área en el extrerno superior es igual a-
2

Tamarlo de Ia muestra

La cantidad clue hay que sr.rmalle o restarle a un estimador, en la coufección del intervalo de confianza,
se denomina error. En nuestro caso

De aquí, si se desea tener una estimación al nivel (1 - .) x 100 % dc confianza, con un error E" dado.
a partir de una muestra obtenida de una población de tamaño l/, el núrmero de unidades a incluir en
el sondeo es
(r*¡21{ r)2
n] + (2,,¡z)' Nr'
trjernplo. Una empresa de telefonía celular desea estimar el tiempo total que se emplean sus líneas
errun fin de semana. Se seleccionó al azar una muestra de 420 clientes, de los 62000 que habían
hecho uso de sus teléfonos y se registró el tiempo de uso. El tiempo proneclio y la desviación estándar-
de la muestra fueron z:3.61min y s: 1.2Bmin. A un nivel del 95.5%: a) obtener un iltervalo
de confianza para el tiempo total de uso de ios teléfonos ese fin de semana; b) Considerando una
desviación estándar de 1.25. calcular el tamaño de la muestra para qne el error sea menor o igual a
20 000 minutos.

Soluctót¿:

a) Para este ejemplo, ly' : 62 000, n: 420, T : 3.61, s : 1.28 y zo.ozzs:2. Entonces,
i : Nr: 62000 x 3.61 :223820

El intelvalo es

62 000 x ooo x
(,,,r,, -, 1.28
;223 B2o * ,62
\/ 420
1 '28

o sea (216 100;231 540).


Por lo tanto, se estima que el tiempo total de uso de los teléfonos está entrc los 216 mil y 231
mil minutos.
b) Con s :7.25 y E,:20000, se tiene:

4N2 s2
'" E? t 4l\t s2
4(62 oo0)2(7.2q2
:60
(20 000)2 + 4(62 000)(1.25)2

Se uecesitará consultar al menos a 60 clientes.


lllrr la práctica se utilizan valoles d.e :o12 igr-rales a 2, cuanclo se tlabaja con ru)a confiabilidad clel g5.5 r/o, o a'i,
ctrar¡.c1o la confiabiliclacl es clcl 99.7%.
73.2. Muestreo aleatorio simple 385

L3.2.2. Estimación de la media poblacional


Como se dijo, puede ser necesario estirnar la rnedia poblacional, mediante la inforrnación obtenida en
un sondeo; por ejemplo, cuando se afilura que el nivel medio de escolaridad en el Ecuador es de 7.5
años, o si se desea conocer el consumo medio anual de café de la población adulta en una localidad.

Intervalo de confianza

El intervalo para la rnedia poblacional ¡i, a un nivel de confianza del (1 - CI) x 100% es

ñ-, :¡ ;o/2 " /F:7\


V t tñtl - )

Tamaño de la muestra

El tamaño de la muestra necesaria para tener rln error prefijado Er, a un nivel de confianza de nivel
(1 - r) x I00To, a partir de una población de tamaño Iy' es:

( :^.,,\2 N s2
,,_
NEu_\rq2)r"2.

Ejemplo. En un estudio nédico sobre el consumo de tabaco, por la población adulta, en una ciudad
de nn r-nillón de habitantes aclultos, se consultó a 120 personas. Los resultados de Ia investigación
mostralon ttn consumo promcdio diario de 3.8 cigarriilos, por persona, col] una desviación estándar
de 1.1, a) Deterrninar cl intervalo al97% pala el lúrmeLo promedio de cigarrillos que se consumel; b)
¿A cuántos individuos ha de consultarse para que la estimación del núrmero medio de cigarrillos quede
a rnenos de 0.3 del valor verdadero?, si se considera un nivel de confianza del g5 %.

Solución:

a) Tenemos que -|y':1000000, n - 120,7:3.8, s:1.1 y zoots:2.17.


El intervalo es

I 000000
'--" - 720
--".o o n1n 1.1
-'' 1 120
r 000000 t/tzo
(3.8-0.22;3.8+0.22)

Entonces, el intervalo es (3.58; 4.02).

b) Con Ios datos previos y Er: 0.3 y zo ozs : 1.96:

("o¡2)2 N 12

N E'zt, + (r*/r)2
"'
(1.e6)2 (1 ooo ooo) (1. i)2
:51.6
(1 000000)(0.3)2 + (1.e6)2(1.1)2

Pol lo tanto, se ha de iur¡estigal al menos ¿ g2 persorras) pal-a tener el error cleseado.


386 Capítulo 73. Elementos de Muestreo

13.2.3. Estimación de la proporción poblacional

Este caso es, probablentente, el más empleado en las investigaciones de rnercado y en los sondeos
políticos; así, frecuentemente se encuentra en periódicos y revistas datos como éstos: el 70% de la
población rechaza la decisión del gobiemo de aumentar el precio de los pasajes, o un 45 % de los
consumidores de gaseosas pr-efiere urra marca determinada.

Intervalo de confianza

EI inter-r,alo para la proporción p a un nivel de confianza del (1- CI) x 100% es


(^- zorzV
f¡f T*-,, * zolz
\P
n_ IV ¡¿
;F

Donde:

¡ú es el número de elementos en la población.

77 es el núrnero de elementos en la muestra.

f es la estimación de la proporción, que se calcula por O: 1, siendo g es el número de individuos


?I
que responde favorablenente er la encuesta y f : I -0.

Tamaño de la muestra

El tanrari.o de la r-iruestra necesaria para tener nn error prefij ado Ep, a un nivel de confianza del
(1 -.) x 100%, a partir de una población de tarnaño l/ es:

":ffiffi
Como nuchas veces se desconoce la estimación f, se toma el tamarlo máximo de la muestr-a, que se
obtiene haciendo F: l: 0.5; entonces,

Qot)2 N
"
to:-
4N EB - (rntz)2'

Ejemplos

1. Una empresa pr-oductora de comida deshidratada desea introducir al mercado su ploducto


Sopainstaut. Se lealiza un estudio para determinar la propolción de hogares que preparan
al tlenos ulla vez al rles sopa deshidratada. La muestra fue de tamaño 240 et una ciudad
de 20 rnil hogares, resultando 40 respuestas afi.rmativas. Si se considera un nivel de confianza
del 98 %: a) Encontrar el intervalo de confianza para la proporción; b) Utilizando la proporción
prerriamente calculada, ¿a cuántos hogares se ha de encuestar, si se desea tener un error de 0.06
en la estimación?; c) Calcular el tamaño máximo de muestra.
Sol,ución:
73,2. Muestreo aleatorio sintple 387

a) Se tiene que l/:20000, r¿:240,'g:40 y zo.or :2.33. E¡tonces,


u40
i:!:2n -0'167'

EI intervalo es

(u - ,^,, lf I z,,,lz

0.167 x 0.833 0.167 x 0.833


(0,u, -2rB
(0.111; 0.223).

Es decir, corl Lur 98 % de confianza, Ia pr-oporción de potenciales compradores del producto


está entre el 11.170 y el22.3% de los hogares de la localidad.

b) Consideremos que f: 0.167 y Ep:0.06.

17:
Q^p)'tvlQ
I\r Ei + Q"d2f Q

: 207.6.

Lo que quiere decir que se deberán cncuestar al menos 208 hogares.


c) Si suponernos qne pes desconocido y tonanos 0: 0.5, obtenemos:

Q*t)'l'l
4Iv E3-r Q^t)2
(2.33)220 000
: 370.
4(20 U00)(0.06)2 + (2 33)2

Este segundo caso provee el tamaño máximo de la muestra, igual a 370 hogares.

Una federación de transpot'tistas pelmite clue ciertos gastos de sus afiliados (gasolina, iubric¿rntes
v lavado) se hagan mediaute Ia utilizaciól dc la tarjeta de crédito expcclida para el pago en las
gasolineras locales. La ernpresa ha expedido 10 050 tarjetas.
Para realizar una investigación sobre la utiliz¿rción cle la tarjeta. Se realizó nna encuesta pre-
lim.inar de 90 tarjetas y se encontró que 63 de ellas fueron utilizadas para pagar servicios en el
rrcs en referencia. Se determinó clue el total de gastos canccl¿rdos con las tarjetas fue de 23 900
dólares y Ia desviación estánclar- de 60. Se clesc¿r detelminal el tamaño de la muestra, con un
error del 2Voy una confiauza det 95.5% para estimar': a) la proporción de afiliados que utilizan
Ia tarjeta; b) el gasto promeclio mcnsual cancelaclo con Ia taljcta; c) De los tamaños rluestrales
anter-iores, ¿cuál se aconsejaría?
Solución: Se tiene que ly': 10050 y rz:90.

rr) Calculemos toclos los elementos previos: t: #:0.7, ?:0.3, Ep:0.02. De aquÍ,

, .').,^^
lz..lt)'1\pQ
t{ Ei + Q"p)2fA
4(10 o5o)(0 7)(0.3)
: 1737.
(i0 050)(0.02)2 + 4(0.7)(0.3)
388 Capítulo 73. Elententos de Muestreo

23 900
b) El gasto promedio de las 63 tar,jetas es dc r: : 379.37.
ti3
El error es de -8, : 0.02 x379.37:7.587vs:40" El tamaño de la mllestra, es de
t- rl rv
n¡^2
\ ¿ol: / 5
n:
-\'E? + (:^,"\2 s2

4(10 050) (60)2


:244.1.
10 050(7 587)2 + 4(60)2

c) El tamaño óptirno cle 1a m,uestra es de 1737 tarjetas, puesto quc es el mavor valor calculado.

13.3. Ejercicios

Estimación del total y de la rnedia poblacionales

1. Se seleccionó nna muestra aleatoria de r¿ : 65 de una población de 400 individuos. La rnedia y


la varianza resultarolr 7 : 84 .2 y s2 : 170.8. Para un nivel de confianza del 95.5 %,

a) calcule los intervalos para el total 1r para la rnedia poblacionales;


b) Encuentre el tamaño de muestra necesario para tener un error máximo de 2 cuando se
estime la media.

Se quiere estirnar cuántas balas se gastaron en Llna práctica de combate en la que intervinieron
8000 efectivos. Para tal efccto, se tonó una mucstra de los registros del núrmero de balas
empleadas por 115 militares participantes, resr-rltando un promedio de94.7. Además, en prácticas
sinilares, se ha medido una desviación estándar c1e12.7. Para un rivel del 97%:

a) Encuentre ei intervalo de confianza para el total de balas empleadas en ia práctica;


b) Determine el tamaño de la llruestra para qrlc ei error máximo sea de 15 000 balas.

t
J. Ura empresa de alquiler de fotocopiadolas desea conocer el total de copias que sus clientes
lealizan en un rnes. De sus registrosr que indican que la enpresa tiene alquiladas 280 máquinas.
se seleccionó 33. En éstas cncontró que en Lrn nes se realizaron un promedio de 1228 copias.
con una desviación estándar de 193.

a) Calcule un intervalo de confianza para e1 total de copias de nivel 95 %;


b) ¿A cuántas máquinas habrá que incluir en la mucstra para tener un error de 21000 copias'?
4 En un estudio sobre el gasto rnedio mensual en rnedicinas y salud, en una ciudad de 25 000
familias se encontró, a través de una ericuesta a 201 farnilias, que el.las teuían un gasto promedio
de 84.4 dólares, con Lrna desviación estándar cle 5.6 dólares. Para nn nivel de confianza del 98 %:

a) encuentre el intcrvalo de confianza para el gasto famiiiar en salud, e interprételo;


b) calcule el tamairo de la nuestra para tener nn error menor a 1.3 dólares en la estimación.

trl dueño cle un restaurante de$ea €onocer e1 consumo meclio cle los clientes de su negocio. De
entre las 1469 facturas correspondientes a las vcntas que tnvo la úrltima semana seleccionó, al
azar-, a 119. En e1las deterrnirLó un gasto promedio de 4.5 dólarcs y una desviación estándar de
0.93 dólares.

a) Halle el interr'¿rlo de confi.anza al 94.5'% para el gasto meclio de los clientes;


73.3. Ejercicios 389

1r) Deternine cl tamarlo clc la mr-restra p¿rla c¡re cl clr-or se¿r. rnorlol' a 270 clólales cn Ia cstilr¿rción
del total;
c) Realice el intelvalo cle confianza, de nivel 99 %, pala el consumo tobal sem¿rnal en el r-estalr-
lante.

0 En urr estudio clc nelcaclo sc tomó nna mncstr'¿r cle 34 pclsol¿ls cle cl¿rsc rneclia. cluiencs inclic¿uon
c¡.re gastaban 48 clól¿rlcs rncnsuales eu clivclsiorres) coll clcsviaciórr cst¿irrclar clc 1.76 clólales. Corr
rur¿r confiabilicl¿rcl clcl 98.5 %, halle:

ir) cl tzrmario mucstlal rnÍnimo para lcalizal el mismo esturlio crl Lln grLlpo sirnilal cltte cttcntar
con 5000 pcrsorlas, si cl límitc palir la estim¿rciól clel cllol cs igual a 0.5 clólar-es;
lr) cl tamaño mucstr-¿rl mínimo para cl tot¿rl clel gasto pol cl glnpo de estuclio, si el líuritc palzr
el error dc cstimación cs cle 1500 dólales;
c) cl intelrralo clc confianza pala la meclia rlcl gasto, si los valoles clel gasto promeclio y cle Ia
clcsviación estánclar se manticnen en 48 S, I.76 clólalcs, r'cspcctivrrmentc, y se encuesta ¿r 67
pelsonas.

7. El gcrcntc de lcculsos hnmanos quiere estimar cl núrmer-o rueciio y el total clc horas anuales cle
cntrcnarniento pala los 280 cmpleados de una división de la compañía. Toma información cle
los lcgistlos del año ¿rntcliol cle 35 empleados y obtiene un promeclio cle 125 y una desviación
cstírnclar-dc 20 horas de cerpacitacióu anual.

rr) CalcLrle los iltelr'¿rlos clc confianza, ttl 99.7ya, perla la nlcclia )/ cl tot¿tl cle hor'¿rs enil>lcirrlirs
cn cntreuanicnto;
b) Corr Los datos ¿urtcliorcs ), si la estimaciórr cle ia mecli¿r h¿r clc cstar ir t4.5 holas clcl r'¿rlor'
tcrclaclclo, o l¿r cstirn¿rción clel iotal h¿r dc cstar a 41700 lror¿ts clcl valor r.crdaclelo, ¿cu:il cs
cl tanarlo mucstr'¿rl rcclueliclo?

Estirnación de la plopolción poblacional


8. Sc seleccionó nnr nlrcst,r'¿t alc¿rtolia cle 121 obsclr,¿rciones, sicnclo cacl¿r rrrr¿r lur óxito o r-rn fracirso,
clc rLrr¿t pobltrción clc tI40 elcrncntos.

n) Si cl rtÍrmelo cle éxitos fr.re de 40, calcule un intervalo cle confianza al 95.5% pala la propor-
ción clc éxitos;
l>) Flallc cl tarnaño cle l¿r nucstla pala clue el crrol máximo sca clel 6 %, cnplcanclo ia ploporción
ruuestl¿rl hallada plcviaruente;
c:) ILillc cl taltairo nr¿ixinro de la muestla, si no se tiene infolrnación plelirninal clc ll pro¡ror
ción.

'.) Err itn cstrLclio sobr-c tncrlios c1c conrunic¿rción sc cluicre cstinr¿rl la ¡llo¡rolción dc los cslucliaut.cs
<.[c urt colcgio sccr-tucl¿rt'ii-r <¡tc rniLau legrrlalnrcrrtc las noLici¿rs. Eutlc los 3100 cstucli¿url"cs clci
t:r>lcgio sc cscogiclon ¿r 250 p¿r.r'¿r. (lue lesponclan Ia plegnnta. De óstcls, 76 irrclicalorr cluo'llLir'¿ur
l¿rs nolici¿rs. Pal¿r un nivcl dc confianz¿r clci 98%:

rr) cncnentrc cl intclvirlo rlc confianztl par'¿\ ?r:

1r) fi.jc cl tam¡Lricr tle l¿r tlLtcstla ueccsalia p¿u¿l tencl un cllor'rncliol al 5% si, (i.) sc tonr¡r cl
valoi rlc 19cstirrlaclri rrnics. (ii.) si uo sc ticuc iclczr plcvirr clo l¿r ploi)orcitiu.

10. lll Sr. \/¿ug¿rs cst.¿rL Perrsirrrclo Post,ularr ¿r lrr ¿rlt;¿rl<lí¿r clc Pclilco. Alrtcs clc folriralizal srr c¿irLrlicl¿ltlrr'¿r
<lccirlc lcaliz¿rl un¿r crr'',ircstir clc o¡rinión cn l¡ loc¿rlicl¿rcl. Dll c-.1 c;¿rutólr hay 12 000 ¡rolcrrciirlcs
clcc:torcs y sc rcalizó iur¿r L)-imela cousult¿r a 270 pclsonirs, clctocttinciosc un ¿U)oyo clcl 30% clt:
los posibles elcctolcs.
390 Capítulo 73. Elententos cle Mttestreo

ir) EncuentLe un intcLvalo de confianza aI gT 01, pzrrer la plopolción dc votantcs que lpovaríztn
al Sr. Vargas e intelpretc cl lcsultado,

Como el Sr. Valgas no estaba segluo de los lesultados de la pliurer'¿r consulta, decide contratar
a una errrpresa para que reaiice uu segundo estudio. La emprcsa i,rdica que Ia encuesta tienc
u.u costo fijo cle 5000 c1ólales urás nn costo rrariable de 4 dólalcs pol czrda entlcr¡ista. ¿cuánto 1e
costar-á cstc tlaba.jo ¿rl Sr. Var-gas si ól qrrierc r('ner nn clror clc 4(% c'on nna confiabiliclad dei
98 %.

l,) si se iom¿r como polccntaje clc r.otautes favor'¿rbles ¿r l¿r cancliclatur'¿r ¿rl 30%'l:
c) si no sc tienc unl idea previar clc Ia popr-rl¿rliclacl cllel Sr'. Vargas?

11. Urra empr-es¿l clc asesc.r-Ía política ha sicio cr¡ntraf¿Lcla pulir clelclrrinal l¿r. populalidacl
cle uu
candidato ¿L alcalcle clc una ciudad cle 215 000 habitantes ¿rclultos. Eu ttn soudeo realizado cou
215 posibles votantes legistró un nivel de erceptación del 34 % pala el poLítico.

a) Halle un inten'alo de conliartza al 96.5 7o para la proporciórr rlc sinpatizautes del candidato:
b) Si se quisiera lcaiiz¿u otr-¿r cncrrcst¿r utilizando 1a ilfoln¿'rcióu clispolible, eticttertire cl
tamaño máximo dc la muestla a utilizal para c¡rc ci c1'rol sc¿r clc 0.03;
c) Si se collocc c¡rc ci cancliclato, históricarnentc. tenrdo una accptarción de alrededol clcl
h¿r
40 %, encncntlc cl taurario clc Ia rnnestltr a cmplealsc.

12. Pala efectos clc plane:Lción económica en la provincia clc Cotopaxi cs necesalio realizar un estudio
cntlc 2200 hatos ganacleros. Una cncuesta piloto alrojó las siguicntcs estinaciones:
Prorneclio clc vacas por hirto, 46 y clesviaciór estárrclar'. 2[J.

ll.cnclinienbo plonrcclio c1c lcchc por hato: 345 litros y r.ariarrrza rlc 9700.
DI 6A% clc los hatos tienc un r-enciimiento neclio cle iechc supcliol a 250 litros.
Con un errol del 8% ¡r una coufi.arrza ctel 95.5%, cletclrnilLe los t¿trr¿u-ros de l¿rs irlllestr¿IS si se r,¿'t

¿r estimar-:

a) cl nirnero cle r'¿rc¿rs lechcras por hato;


b) el rendimiento rrcciio cie leclie por hatol
c) ll propolción cic irirtos cou urr re-rrclinricrrto plt.rrneclicl clc lccirc, sllpcliol a 250 lit,los:
d) ¿QLré tamaño clc rrruestla ustcrl recorncrrdarí¿r'/

L¿r selección de la muestra

Los proccdimicntos cxpuestos cr. csta sccción se basan en e1 principio cle cluc las rlnestr-¿rs clebtrri
colstitnirse pol elemenios tomacios al azar'. clc; suclte c¡re cacla.t",,r¡1r1.o cLc la poblaciór, l,ergiL 1lr
r.Iisur¿t plobabiliciaci cie figulal en ia mncstr'¡r. Solo ¿rsí óslzr pnedc lcplcselt ¡rl a l¿r pobl:Lciórr, reploclr.rci r'
fielntcrttc los clirrersos calactelcs y cluedal soureticl¿r rr 1os Proc;ccliruielrlos t:sL¿rclísLicos clesclitos.

Dutonccs. nos plantcamos el signiente ploblerrizr pr'ác;lico ¿'l soir.rcion¿u: hlllal nn rnedio clc rrsegnlarrsc
clc t¡re toclos los elementos cle la rnucstlLr se¿ur tourados al rrz¿u.

l-eór'ic¿rmcntc. no h¿rblía problerla r-rlgnno. En u.na irrvestigación icleal clispolcmos del malco ulLerstr-al,
¿,rsÍ s¿rbr:mos cuántos y cluiénes son t¿rlcs clenrentos. Únicanrclte habr'Ía cprc sor'lear'los y los favolcciclos

scr'Íarr irLcluiclos err iir irntcstla. llasta rrntcs clc 1zr 1-rollrlariz¿rción clc lirs c:outprri-aclorits l¿r selccciól clc
ii..s l'llrcstlas sc realizirbt cc¡n cl crnPlco cl<: tlblas rle uiuneros ¿rlc¿t,oLios. l}r llr acl,Lirrlidacl r-'sia t¿lrc;l
73.4. Mttestreo aleatorio estratifrcado 391

la ayuda de plcigrarl¿rs informáticc-is, eu los cnaies hay cour¿rnclos especiales qlre BerreraII
se lc¿tliz¿r corr
nirrnclos aleatorios y facilitan la selección de la muestra.

Sin embargo, no siemprc se puede realizar la extracción de la ntuestra de Ia nanera descrita, ya sea
porcFre la población es bast¿rnte glande y Ia localización de cada elernento elegido es muy laboriosa
o t)orcLr(.r cl rrr¿rrcr.¡ rrrucstr'¿ri lo cstri brcrr definiclo. Ptrla srtper'¿rt'las clificultacles se han ideado otros
rri(:l,orlc¡s tlc: rnuestlco. (lue ¿r r:r¡ntinrraciórr los velcrri()s.

13.4. Muestreo aleatorio estratificado


llrr el cliserlo cl méti-rdo ¿rle¿rtolio simple, sc plcsentau valios ittcouvcnieutes
cle una mticstra, meclianie
r:u¿iriclo 1a población es bastante heter:ogónea o si esth distribuicla utuy anplitrntente; por lo tanto. el
núrlelo cle consultas necesarias 1-laln obIcncr infolmación coufi¿rble es ztlto, cort cl cousigtticntc aullcllto
cri cl costo de Ia iuvestigaciórr y crr el tierrrpo de ejecución.

LIn ploceclimiento adoptado par-a superal estos ploblemtrs es el cle fornal :u:na m'uestra estrat'ificuda
v al ¿rzar'. Segúrn este método, sc subclivide la población en varios grupos, llamados estro,tos, cada
nrro clc los cualcs debe'ser internamentc horlogénco. En c¿rcla cstrato, se cscogen al azal las unidades
rrruest,r'ales a inr-estigar. corfio ya se explicó: es decir'. para cada estrato se aplica tnuestreo aleatolio
sirnl>1e.

Los estlatos pueclen fornrarsc paltiendo dc divisiorres geogr-áficas (provincias, ciudadcs, centros urbanos
Y mr'¿rlcs, etc.) o bicn del sexo clc las personas. su eclad, la profesión, el nivel socioeconómico, etttr-e
ot ros.

Lrr lazón clel crnpleo de estc nótodo reside eu el hecho de clue pelmitc obtencr', gencralnrente, resultados
rrrirs pr-ecisos c¡.re aquellos qucl se colsigucn cou cl método alc¿rtolio simplc. Sin embalgo, es ttecesar-io
couo(icr' 1¿r cserrcia de c¿rcla cstrato p¿rr'¿r ploceder', en cada uuo dc ellos, ¿-L la elecciórr al az¿tr dc los
clerrrr¿rrtos rle la rlnestra.

Ot,leL snbrnncstt'as de los estr-trtos,


r.euttrja del método es que además cle cornbinal la infolnracióu rle l¿rs
p:rit obterrel inferencias de la poblaciól completa. también permitc utilizar la inforrlación cle las
subtrnrcstr'¿rs para corrocer cl conrportamiento de cada, estrato en particular') y corl]pararlos cntre sÍ.

Al igr-rni clue hicimos en i¿r sccción anteriol, examinar-emos los c¿rsos cle cstim¿rción clel total. la mcclia
'n' Ia 1-rlt.,1-rorciórr pobia.cionales.

Suporrgarnos c¡rc se clivide a lir poblacióu el .Ií est,ratt¡s. c¿rcia uuo clc los crrales const¿t de lü¿ elernerttos
(t:on ri :I,2,...,K), pollo clue ly': l{ri¡/z+".+A/( Dentlo clc cacla estlato elegilettros tt;
clcmentos c¡rc constibuir-ál la rnuestr-a.

L3.4.I. Estimación del total poblacional

Ill inteir'¿rio de confianza al (1- cv) x 100% pala el total pobltrciol¿rl r cs

(\-.)

l)onclc

:\r cs cl rrirrrrero cle elcmcntos el l¿r población.


392 Capítulo 73. Elententos de Muestreo

lI¿ es el núrmero dc clcnrcntos en el cstrato t,. i, : 7.2. ..., I( .

?¿? es el núrmero cic elemcltos cle i¿r mnestla i.:1,2.....Ii. cr el estr¿rto i.


7¿ es e1 prorredio de Ia muestra seleccion¿rda en el estlato i., 'i: 7,2,. . . ,I{.

,s; es ta valianza cle 1os cl¿rlos cle la muestla en el estrato i, 'i : I,2,. . . ,I(.
') t

?esla estinración clel total poblacional cono ?e"t : A¡7."¿.


:t65¡ eS Cl prolreclio cstlatific¡rclo. que sc calclll¿r l)or'
_ .1i

ÍcsL :f {rattr * Ar2i2 + ... + Ar¡¡T¡¡) : aNL\-,r,,o,


i:7

ro el:l tian]
trLl atICdo
Cr Ila ñoo llllt,restre I cie: los ?¿¿ es peqnerio con respecbo ¿r1 tan¿rrlo cle los estratos ly'¿, lt-r, fórnrul¿r
SC L'eclluc
Llce a

I i-
lr
.t\ )

"a/2' ? + zo¡2
D¡ri=
\
EjJel
E. llTlrplplo.t. LcOS clilec di
d ectlrtir¡os c1e LIIl. centl'(o edncatir.o desean conocer' el gasto total de los padres cle
Ier.Ini
Ie rili LArenrir tiltles
r ES escol
CS l¿rles. P¿l
el )o1¿rr rla facilita
I r 1¿r investigación se clii'idió ¿r los ¿tlumnos segiur su nivel. err
l)r
l)rc 'ep
rpli iur
I lio
It¿Il' xi nli
,Lil
, I)l 'io
ralio
tla y
))SCtscc :tutcl io.
cl¿u'i Un a tabla resLrrllen cle cómo se cst¿rbleció Ia muestr'¿r v los <latos
ltl
1i¿
r l lacl
1i¿t l1¿ os) f
SC CXrh
:hi be ¿I conti
CO rtin[racciónt.

NIVtrL
Preplimalio Primalio Secunclario
No. cle aluuuros (Ar¿) 1569 832 647
T¿rmario mr.Les ilal (r r.¿
) 767 72r 95
Gasto promedio (dólaLes) (7;) 88.4 131.6 97.0
Varianza mucstral (s]) 525 468 700

A urr nivel clcl 95.5 %: a) Enconbrar el erLor rnrrestlal en la invcs[igacióu; b) Construit' cl inten'rlc., clc
r:orfi¿\rLz¿r perla cl gasto total clc los padres clc farnilia del plrrntcl.

S'olu,ción,: P¿rla nncstlos clatos tenenros A¡:3[J48 l'1í:3.

r.r) EI cr-r'..rl clc la cstirlación cs

E, : ¡\.
.^,.,1f r't(N;-rr;\ si
\ñ 'v /.
6 910 295 + 2287 008 + 262632¿I: 6880.

lr) Calculcmos cl plomeclio cstrati ficado:

¡(l/rr r -l N2T2 + l/¡z:)


: 1. :
3e4s
l(ts0o)(ss,4) + (832)(131.6) + (647)(e7)l 102 0t

El lotal sc csbirra lror'


:r esr : .r\r=
_r \ "r,csr : (3U18)(102.01) : 3 t0 950.
73.4. l\[uestreo aleatorio esttatificaclo 393

Con todo lo eurtcrior, cl inbcn'alo buscado es

(i""t - ll"ii""t + E") : (310 950 - 6880; 310 950 + 6880)


: (30a 070; 317 830).

lf ntolccs. sc cslima quc cl gasto tobi-il cn ritiles csc:olalcs, clc toclos los pachcs clc famili¿r est¿i
cntrc los 304070 .1,-- 317830 clólalcs.

L3.4.2. Estirnación clc la medi¿l poblacional

Ii,l int,ol'\'rlo cle col al (1 - a) x 100% paltr nrcclia lroblircionrl ¡l cs

I t'"'' -
I
\
Cr.r'urcio cl l¿rnraño nrrcsir'¡l<lc los ?¿j cs pccluerio col respeclo al t¿rruaño clc los cstratos A¡¿,la f'órrttul¿r
sc r'cclLrcc lr
zo12
,:ol')
-^/

Ejcrrrplc. Una empresr cllrc rc¿rliza cstudios dc l¿r ¿ru<licnci¿r telerrisir'¿r dcscrt cstiur¿rl el tierrrpo medio
rlc: lroi¡rs cii¡r.r'ias cllrc pasar frcltc al telcvisor'las f¿rrnilias. ori urr carrtí-¡rr cspci:ílrco. Ll errprcsa diviciiir
l¿r zon¡ clc cshuclio en ulllan;r y r:nti-ri y sc cscogi<i urL¿r lnrestr¿r clcl 2 pol rnil; es clecir'. 2 de cacla
rnil f¿unili¿rs clc cacla hlcir pcrtcncccrhrr t i¿r mucstr'¿r. Con los cl¿rtcis lcsumiclos elr la siguiente ttrbla,
circrrerrtrc rur inter-valo clc confialza ¿rl 97.5% pi-lr'a cl tiernpo mcdio cluc cacla f¿rrlilia pasa frcntc a lzr
( c.lcvisiolr.

No. clc Tan¿uro cle Ticnrpo \/aliauz¿r


f'anrilias lr rnucstla plonrerclio r ultes tla I
')
Alcu A'; 't Li :l:i s:
Urban¿r 64 796 130 2.93 0,77
Iturai 42 18S a/1
1.46 0,53

S'cl,t¡.r:i ó¡t: C¿rlcilleiros cl lrloi Lrcrlio csilatificlclo:


I

Jc,r : ¡(AtrJr+-\rrr2)
: |
_____ ,,, :
____ _
r ú,+ 796)(2 93) + (42 188)(1 46)l 2 35
10f; 9s I"

Conrc, cl tarlarlo cle las submucstlas, eu cacla cstrato. cs pcc¡rer1o con lcl¡rción rrl lcspectivo totaI rlc
t lcuIcrr[os. clrrplerremos 1¡r fórurtila apioxirlacla

.- i).l2;ú.
39,1 Capítulo 73. Elententos de -N4tresúr'eo

Por tarrto,

(T""t- E¡,"izest+ Et,) (2.35 - 0.t27 6;2.35 + 0.1,276)


(2.22;2.a8).

Eutonces. el tienpo urcclio c1r.rc cacltr I¿rmilia girsta fientc ¿r la Lelevisión cstri cnLlc las 2tr 13 miu r,- 2]r
29 rnin, aproxirlaclalncntc.

13.4.3. Estimación clc la proporción poblacional

cle confia nz¿-L ¿tl (t - ct) x l00r/o pirla lil ploporciól poblacional 1., cs

^. J.)
Z ct/
-

"'- lv

Dorrde

N es cl númclo cr,c clcnrciitos cn Ia poblirción.

ff¿ cs cl nlimcro clc clcltcntos cn cl cstlato i, i: I,2,, , . ,I(.


?z¿ cs el utimclo clc clcmentos clc I¿r rntrestla cn el csblato 'i. i : L,2, ... ,I( .

j)¿ cs la plo¡rolciórr riitrcstr'¿rl clcl cstlato 'i, i:1,2,.. .,I(.


frest cs la ltlopotción csLlat,ificircla, quc se calcula por'

fi,"t
I .-^ i
: *(N,
/v it Ntf , +'..+ l/r,'lrr) : *r iiI,,',4,
i,-l

Cttallclo cl tamaito lnttcstriri clc los ?¿i cs pcquerio con tesllccto ¿rl Lanraño clc los csblaios AI,, la fórmtrla
sc tcclr.rcc tl,

f ¿8¡
--'----= rl)cst.
, zol2
tN
'tL¡
- L

Djemplo. Rcfiliórtclonos al cjcmplo rrutelior', en t¿rl estuclio tambión sc plcguntó si las f¿rrnilias nilril¡¿rn
regnlartneutc uua telcttovcl¿r clacla. Las plopolciones uruestr'¿rlcs clc cpricnes tienen prelelcricia poi c.i
cit¿rclo ploglaura sc cl¿rn cr-r la siguicntc tabla:

No. <lc liirn¿riro clc Plo¡rolciór r r ¡ricsi


r r'¿ri
f¿rrn ilias l¿r rrmcstr'¿r clcl cstr'¡to
r\t'c¿r Ar¿ 1t i D¡
Ur'b¿rtr¡r 64796 1ii0 0.19
j-lur'¿rI 42 183 8,,t 0.2,1

llstirrr¡r lrt ptoporcióll t[c toc[',s ]its f',rLuilirs crr cl c¿Lnl-ól¡ (lllc rnir'¡u l¿r, tclcrror'<:l¿r. Usc I - cv:0.(t2:5.
73.4. Mttestreo aleatorio estratifr,cado 395

SolLtci,ón: El pliurel hrgiu' calcnlcuros lir plopolciól estratific¿rclr:

i",t:
1

[(61796)(0.19) + (412188)(0 24)] : 0 2097.


",,,*
Cornolosl.¿ul¿rlosrnncstlalcs,soupc.llleiros,conr-espectoalosesllrtos, l{.1)\; =1,pzrra i:'I ,2,
\ /
rrtiliz¡rlcrnos la fórmnh i'rproxinrac[a

:^/.t lr: 1)iqi


Ep: A¡ \I /- ?l;-1
\ i:r
(6,17e6),Cle# !!) ,t I l') l RRlr
r0.21)''í 0.:
1l:oou:s
s3

M int.ctr.'¿rlo clc confi¿tttz¿r cs:

(; lr.í:.rIl\ t Lpl
\Y(sL Lp\1'¿sl (0 2097 - 0 0625;0 2097 -¡ 0 0625)
(0.12172;0.2722)

i\sí. crr¡r'c 14,72¡/ov cl 27.22% rl,.l i¡.s farlili¿rs irriLau la tclcnovcla.

!3.4.4. lb.n-^ año y asignación cle la nurestra

i)tt¡¡sto qlrc cn cl móioclo clc csl,irrtificación se folman r'¿rrios gr"l-rposr se acostuntltltr ir fijat'cle anteuratro
,rl rLivcl clcl crlor', clc rcrtcirl.o ¡r í-'slc sc cstablecc cl nrinrelo clc clcniorrl,os quc c:onst,i brrirán la rluestrir v
1r-Lcgo sc cletclrrrina cnirul-os clc clios sc iisignarán r carl¡r cstr¿rLo.

Sclrr , A'2, . . ., A'/i los clcrncriLos ilclLriclos cl c¿rtl¿r cstLirl.o, srr slunt cs igual ii ,l/, cl tolal clc li'L
-\I1
lrolrlirciiirt Sc sclccciorar. j ,'t12, ..,,'n.ti clcnicrtos, torn¿rclos al lzar, clc cacl¿r cst,r'ato. Tcnclicrrios
'/?

tlric cl tot¡rl clc ltnicl¿iclcs clc la trtncstla es '/¿ == ?t1 * 112]_ .. .* rr¡¡. Ntrestro ploltlcura seti c]etetrnirLal
el 1.¿rm¡iro cic Ia urttcstla v ci iir'ulcr'() clc uLriclacles qlre sc consrrlfar'án cl cacla csilabo.

Lrrtt¿'r ia rsiguaciól clc Jn',rrtcsi:'¡, sc rLtilizr nno clc los siguientcs 3 uróloclos'. er1'u,i,tat'iu(L) pt'o'lorc,i,or¿etL s,
1;,: lttúli,,t, inttn! (r! r' -' ,,,

A si gnación cqrritativa

E;l l¿r fblna clc asignirciórr crliiitltivi-, crt c¿tcl¿t utro rlc los cstr¿-itos sc invcstigii cl n¡isnro ntimoli.r ciLr

clcirrcnt os.

iii tlrruliio clc i.L inucstlrr ¡r scl ilr..'rstig¿rcl¿,. sc crrlcrrl,r iror

,)'I ^t,"i
ii
L -\ -r {: .;: )'-\,'.'
't- I
Capítulo 13. Elernentos de Muestreo

Una vez fijado el tamarlo total de la muestra se seleccionan, al azar) eI mismo nÍlrrero de unidadcs
muestlales en cada estrato. Este núrmero de unidades se calcula por:

,ro:
#, i : r,2,.. ., K.
Observación, En este y en los siguientes casos se debe tener presente qlre en el caso de la estimacritili
cle lar proporción Ia varianza se calcula mediante t? 0). : i¿Í -

Asignación proporcional al tamaño del estrato

Si en una investigación se han generado submuestras de igual tamarlo, podr'ía suceder que los estrat<;s
pequerlos estén sobrereplesentados, mientras aquellos con muchos elementos estén subrepresentados.

En la asignación proporcional, la rluestra está constituida pol Lrn núrmero de elementos, en cada
estlato, proporcional al tarnaño de éstos, con relación al total; es decir, los estratos [rayores serán los
clue tendrán subrnuestras de nayor tamalio.

El tamaño de la muestra se calcula por


K
N(".7)" D /V,"7
.i:1
tL
- I(
E2N2i(.^t)2DNut?
i:r

Los tamaños de las submuestras de cada estlato se calculan por:

-- n
rlr' : -A/r
__ ?l
llc' : -Ay'c-.
'N',
-. 'N',

Eri el nuestreo con asignación proporcional el error es mínimo, pero por razones de economía o de
facilidad en la recolección de los datos en el sondeo, pudiera ser mejor no hacerlo de esta nanera.

Asignación no proporcional al tamaño del estrato (o asignación de Neyman)

Supougatlos que la población a cxaminar está dividida en dos grandes estratos. Si el priurero de ellos
agllrp¿l a personas muy homogéneas entre sÍ, con lespecto a la calactei'Ística que se considere, bastar'¿i
con intelrogar a Lrras pocas personas para dedrrcir, con Ia plecisión snlicieute, la magnitucl c¡re str
invesbiga. Si, por cl coutratio, el segr-rnclo estrato está fornaclo por personas hetelogéneas, será pleciso
iltcllogar a un nirmero rraj¡ol' para obtener resultados que snpoilgan la misma exactitud que en cl
primel caso.

En lir rrsignación clc Ncymau, el tamaño de la nr-restra sc calcula pol

/ I{ \2
Q^/)2 (,e nt",)
I(
E2N2*("^/)2Dlr,17
i:L

P¿rr'¡ r'c¿rlizat- Ia zrsignación clc los bamar'ios de las subrluestras sc ploccclc clc la siguiente lnancl'¿l:
73.4. Muestreo aleatorio estratifi.cado 397

1. Si s1, s2 , ..., sK son las desviaciones estándar de cada uno de los estratos. se determina el valor
? definido por
K
? : ly'rsr * l/zsz +'.' + ly'¡<s¡r : INrrl,
i:1
2. Con ésto, Ios tamaños muestrales de los estratos se calcnlan así:
A¡ n
n1 : l/1s17. A¡ lI
nz: NzszT
n.
nI( - NNIKT.

En el siguiente cuadro se expone un esquema de rnuestra estratificada según los criterios de asignación
cquitativa, proporcional y no proporcional.

Proporción de Desviación N{uestra Nluestra Muestra no


Estratos
los estratos (N,/¡/) estándar (s¡) equitativa pro¡rorcional proporcional
A 0.40 1 500 800 400
B 0.30 2 500 600 600
C 0.20 .) 500 400 600
D 0.10 4 500 200 400
TotaI 100 2000 2000 2000

La rluestra con asignación no proporcional está formada por un núrmero de elementos, en cada estrato)
qne supone dar un mayor peso relativo a los que presentan una mayor variabilidad. Por ello, el estrato
A, annque incluye eI 40% de los elernentos de Ia población, figura en la muestra final con el tnismo
tamaño que el último (el D), que únicarnente comprende el 10 % de la población total. Esto es debido
a que la variabilidad del estrato D es el cuádruplo de la que tiene el estrato A.

tlna vez establecida la cornposición de Ia muestra se procederá al sorteo de Ios individuos a ser
entrevistados) que por lo general se lo hace bajo el criterio de la no reposición; es decir, qtte un
elemento de la muestra no puede ser consuitado más qrle una sola vez.

Ejemplo. Para los datos del ejernplo sobre el tiempo promedio diario que gasta la población viendo
la televisión) que a continuacióu se resllme:

^ No. de Tiernpo Varianza


Area
familias promedio muestral
Urbana 64796 2.93 0.77
Rtrral 42188 I.46 0.58

Considerando un error de 0.1 h, a un nivel de confianza del 95.5%, deterrninar los tamaños mlrestrales
v de las snbrnuestras mediante asignación: a) equitativa; b) proporcional; b) no proporcional.
Soltt,ci,ón: Se tiene que N:106984, E:0.1 y zoo22s:2.

a) Equitativa. El tamaño de la muestra es

K
K(r*/r)t D x?'?
,j: I
K
E2N2i("ul)2DNo"?
i:1
:297 '34.

298
La muestra total es de 298 familias. En cada área se consultará a 149 hogares.
2
398 Capítulo 73. Elernentos de Muestreo

b) Proporcional. El tamaño de la muestra es

K
N(r,/r)'D N t?
i:l
K
E2N2*("*lz)2DNlt?
i:r
106 984 x x (64796 x 0.77 + 42 1BB x 0,58)
22
:277.3I.
(0.1)2 x (106 984)2 t 22 x (64796 x 0.77 + 42I88 x 0.58)

El número de familias a consultarse es de 278.


Por la fórmula de la asignación proporcional:
278
rlt :NrL' :64796 x : 168.34,
N 1069E4
n
n2 : -. : 42 188 t
278
: 109.63.
tOOgg4
^ri
Entonces, se deberá tomar una muestra de 169 hogares en la zona urbana y de 110 en la rural.
c) De Neyman. EI tamaño de la muestra es
t

Qo/il' (á*"')
n: K
E2N2i(r./)2Dru,"7
i:r
z2 x (a+796 x lotl + 42188 ,. u658)' :276.
(0.1)2 x (106 984)2 t 22 x (64796 x 0.77 + 42 188 x 0.58)

Calculemos el denominador T:
7: ly'rsr i N2s2:64796 * t/O¡f + 42188 * r/O¡S : 88988.

Ahora, apliquemos las fórmulas correspondientes:

u : 1/rsr3
T
: 64796, Jolz " 2
88988
: 176.4,

n2 : Nzsz::
'T', 42188 . r/058 " :2:
88 988
99.7.

Lamuestradeberáestarformadapor177farniliasdeIazon.atrrbanav100delazonaruraI.<

En esta sección solo se presentaron las formas de fijar Los tam.años muestrales basados en infornacióu
estadística. Existen otras forrnas de realizar tal determinación, tomaldo en cuenta los costos de
efectuar la investigación, los costos fijos o el costo unitario de cada toma, éstos no los expondlemos.

Determinación de los estratos

El estratificado es el rnétodo más utilizado por Ias empresas y entidades que se ocupan de realizar
sondeos, con adaptaciones prácticas que tienen en cuenta los costos y las posibilidades reales de la
investigación.

Antes de la confección de la muestla conrriene tener en cLrenta, ante todo, los fines de la investi-
gación y las caracterÍsticas de Ia población que interesen de nodo particular, y que pueden tener tttt¿t
impor bancia fundamental en las conclusiones qne se daráu.

Las clasificaciones que más comúnrlente se consideran en la elaboración de ias muestras son:
73.5. F,.iercicios 399

t. El sexo de las persollas.

-: Los grupos de edad.

.). La región y la dispersión geográfica.

4. El ulbanisno o luralismo cle ia localidad.

5. El rrivel edncativi-r.
6. El nivel socioeconólnico, cntle otros.

P¿ua files pr'ácticos, el r-eldadelo y adecr-rado sorteo, en cada estrato, es frecnentemente impracticable
o inrplica gastos excesivos v pér:dida de tiempo. Por ello se recllrre aI ntétoclo de las cuotas, c¡te
colsistc en asignar un cierto nÍunero de entrevistas qrie se deberr lealizar en cada estlato (cuotas), pol
c¿rcla entLcvistador.

Compcte, entonces, al encalgaclo de la entrevista elegir al azar las personas clue han de ser interro-
grrclas c1cntro dcl ánbito de cada cuota que Ie ha sido asignada.

Para disminuir, las distolsiones que callsaría la falta dc ale¿rtorieclacl en estc método, las eurprestrs
snelen ¿urnentar la fiabilidad de sus estudios mediante el <sobremuestreo>>, o sea la realización de
ntás encuestas qtle el nirmero oliginalmente planificado, así se collpensaría e1 aumelto del error antes
iutroducido.

13.5. Ejercicios

Estirnación del total y de la rrredia poblacionales

1. Utilice los datos ile la siguiente tabla par-a:

zr) hallar un intcr-r'alo clc confi.anza al 95.5 % para e1 total poblacional r;


b) haliar un inten'alo de confianza al 95.5 % para la media poblacional ¡r,.

No. de unidades Tamaño de Promcclio Valianza


lnrlestrales ia mucstla mrrestral muestral
Estr-ato ¡/, 11.i Ii s:)
I 2000 200 ro1
¿:T 24r0
II 3000 200 402 2938
III 1000 200 tqr
t) -!t ) 2047

, Par'¿restablecer rlrl sistema de s¡-rbsidios cn el consnmo de Ia cncrgíer elóctrica se hizo una invcs-
bigación por nrlrestreo cn Ltlta cindad. Se dividió a los hogales scgirn su nivel socioeconómico
(NSE) y se tomó una muestra de\2Va. Los resultados se rcsrlnerl a continuacióu.

No. total No. de hogar-es Consumo Varialza


NStr
cle hogarcs nluestreados promedio nuestral
I t2 425 30 r25 232
II 34 871 70 g7 r75
III 69724 140 48 124

Para un nii'el clc confianz¿r dcl 96.5 %. hallc:


400 C.:pítulo 73. Elernentos de Muestreo

a) una estimación por intcr'\r¿rlo para el consnrlo tledio de los hogirles;


b) una estiuración cor Lrn inten'alo para cl consumo cle todos los hogates cle la ciud¿Ld.

Suponga qlle sc clcsea lealiz¿rL otro mnestreo en el clue se lendrá un error en la estimación de la
media de 3 dólares. Determine los tamarLos muestrales en cada estrato si Ia asignacióu se realiza
rnediante:

c) asignación eqr-ritatir':i:
d) asignación ploporcional;
e) asignación no proporciorral.

3 En un sondeo para cieterninar el gasto anual de la población de una cindad en arreglo persontrl.
se clasificó a los consultados segúrn sn sexo. Los datos se rl)uestr-an a continuación:
SEXO
\.{asculino Femenino
T¿im¿rño del estrato 2500 2300
Tamarlo mnestlal 250 150
Gasto promedio 70 740
Valialza rnuestral 25 169

a) Determinc el gasto prornedio y el gasto total. mediante un intervalo de confianza de g3 %:


Encuentrc el t¿Lmaño de cada estrato. para tener Lur crlor de 1.5 y para que la mllestra sea
realizada rlediante:
b) asigriación ccluitativa;
c) asignaciórr proporcional;
d) asignación no proporcic-inal.

4,. Se realizó Lrna elrclresta par¿r cstimar el total de rrentas scmanales de los locales de productos
naturistas cle Quito. De los 1415 negocios de este tipo, se escogierou al azar 135. A continuación
se resttnen los clatos recogidos, segirn la ubicación geogr'áfica cle 1os locales.

Situacirin
No. de Locales err Venta
Varianza
Iocales la muestra promedio
Nolte 600 ,lr 478 204
Centro 265 45 4r3 358
Sur 550 45 394 513

a) Encuentle un intervalo de confianza al 99.7 % pala el total cle ventas de dichos locales;
Si se quielc lealizar uu cstudio en el crlal el error de estimacióu sea de 5000 dólares, encuentlc
los taulanos muestlales. cn cad¿r estrato, para que la muestla sea r-ealizada nediante:
b) afijacióu ccluitativa;
c) afijación proporcional;
d) afi.jacióu de Neyman.
5. En uua universidad se deciclió llevar a cabo un estudio soble cl aholr-o que mantiererl slrs elr-
pleados pala cr.tando ellos se retirel. Se tomó nna muestr¿r aleatolia estlatificada del 10 % cle I¿r
población, pol gltlpos de cdad, con afijación plopolciolal. Luego de proccsal l¿r inform¿rciórr, sc
obturrieron los siguicltes rcsulbaclos:
Edad nlenos de 40 años 40 a 55 años más de 55 años
No. clc empleacios 280 150 220
N{eclia 800 1400 3200
Desr'. estándar 160 400 750
73.5. Ejercicios 401

a) trstime el ahorro medio de los empleados, mediante un intervalo, y obtenga el error de


estimación para un nivel de confiabilidad del 96 %;
b) Estime el total ahorrado por los empleados de la uni.,'ersidad.
Si se desearía realizar otro estudio, a nn nivel del 94To, en el cual se quiere tener un error
de 100 dólares en la estimación de la media. Encuentre 1os tamaños rnuestrales en cada
estrato mediante:
c) afijación equitativa;
d) afijación de Neyman.
6. LIn comerciante planeó comprar los remates de productos que reafizó Ia aduana. Para obtener
nn valor aproximado del lote, el comerciante seleccionó aleatoriamente 100 artículos de cada tipo
de producto puesto a remate. En la siguiente tabla aparecen el núrmero de artículos segÍtn su
tipo, el costo promedio de las rrruestras y sus desviaciones estándar.

Artículo ¡/, r¿ si
Calzado 450 800 200
Ropa 380 560 150
Juguetes 230 940 220
a) Encuentre un intervalo de confi,anza al 95.5 % pala el valor promedio y para el l'alor total
de la compra;
b) trl comerciante tiene un capital de 750 mil dólares para realizar la corlpr-a. ¿de acuerdo con
el resultado anterior, puede decirse que é1 se decida a corlr.pr-ar el lote?;

El comerciante decide que seleccionará una mnestra utilizando la información anterior y se ha


fijado un error de 15 000 dólares en la estimación del total. Encuerrtre los tamaños de c¿rda
estrato para que la muestra sea con:

c) asignación equitativa;
d) asignación proporcional;
e) asignación no proporcional.

Estimación de la proporción poblacional


7. Utilice los datos de la siguiente tabla para hallar un intcr.,'alo cle confianza al 98 % para la
proporción poblacional.

Estratos
II III
Tamarlo del estrato 1000 1200 700
Tamaño muestral 100 100 100
Proporción muestral 0.32 0.26 0.29
8 En un sondeo electoral para conocer la aceptación de tur candidato a prefecto de una provincia se
entrcvistó a un grupo de electores, previa clasificación scgírn su zona de residencia. La sigr.riente
tabla da Lln resumen
Area ¡/, rt,i, f¡
Urbana 92 000 250 0.43
Rural 88 000 150 U.5 t

a) Encuentr:e nna estilración, con Lrn intervalo aI 947o, del porceirta.je de votación que obtcn-
dría el candidato'
402 Capítulo 73. Elententos de Muestreo

b) Según el resultado, ¿podrÍa esperarse que el candidato gane las elecciones por una urayoría?:
Si se desea que el error de estinación sea del 5.5ya, encuentre la cornposición de la rnucstra
para que ella sea seleccionada mediante:
c) afijación equitativa;
d) afijación proporcional;
e) afijación no proporcional.
I Se desea establecer el porcentaje de habitantcs, en la provincia del Guayas, que tienen fe en San
Biritute2. Se dividió la zona de estudio en ciuclad y campo y se preguntó si creían o no en tal
deidad. A continuación se resnmen los resultados.

-
-Lona Población Tamario de Proporción
total la muestra muestral
Ciudad 2 800 000 450 0.29
Campo 650 000 350 0.61

Encuentre un intervalo de confianza al 97.5 % para el porcentaje dc la población de Ia provirtcia


del Guayas qlre es creyente en San Biritnte.

10. En una provincia. se realizó Llna encllesta, entre los niños en edad escolar, para couocer la
asistencia a las escuelas, Para el efecto sc seleccionaron 150 niños, 50 en cada estrato, y se
obtuvo los siguientes resultados:

de
Condición Población Propolción
pobreza total muestral
Indigentes 12 000 0.45
Pobres 36 000 0.60
No pobres 27 000 0.74

a) Calcule el intervalo de confianza al g8 7o para la proporción de nirios de la provilcia que


asisten a la escuela;
Si la estimación debe tener nn error dcl 3.5ya, cncuentre los tamaños muestrales para que:
b) La muestra sea mediante asignación equitatirra:
c) Ia muestra sea mcdiante asignación propurcional;
d) la nuestra sea por asignación cle Nevn¿rn.

11. El Sr. Vargas está pensaudo postular a la alcalclía del Pr-ryo. Antes de folrnalizar su candid¿rtura
decide realizar Llna encuesta de opinión err la localiclad. P¿rra ello se zonifrcó el cantón en 3
sectores y se obtuvo los siguientes resultados

Total de Número de Pobladores


Zona
habitantes consultados a favor
Norte 15 000 200 40
Centlo 5000 100 27
Sur 25 000 200 60

A un nivel de confiabilidad del g5 %:

a) Encuentre la estimación de intervalo errtle los cuales se podría considerar que se encnentra
la popularidad del precandidato;
:S¿irr Bilitr,rte es ulr santo cle l¿l tradicióu popular clel Guayas a quien se Ie asignzr el podel cle hacer llovcr
1,

nejolal las coseciras.


73.6. Muestreo por conglornerados 4O3

Si la encuesta tiene un costo fijo de 5000 dólares más nn costo variable de 4 dólares por cada
entrcvista, ¿cuánto le costará este trabajo al Sr. Vargas si se quiere tener un error de 5.57o y Ia
selccción será

b) asignación equit ativa;


c) asignación ploporcional;
d) asignación no proporcional?

12. En una investigaciór sobre Ia producción de manzanas en Ia Provincia del Tungurahua se desea
cstimar la proporción de agricultores que se dedican al cultivo de la mencionada fruta y la
pr:oducción media, en miles de kg, de cada parcela. Se realizó un sondeo en 3 cantones de Ia
provincia, a continuación se presenta un resulrlen de los datos obtenidos.

Tamarlo de Tamaño de Proporción Varianza


Cantón Promedio
la población la muestra muestral rnuestral
Arnbato 5135 75 0.65 6 000 640 000
Patate 2773 50 0.7r 8 000 722500
Pelileo 3472 50 0.52 5 000 518 400

a) Encuentre el intervalo de confianza al 96Vo para la proporción de agricultores que se dedican


al cultivo de la rnanzana;
b) Encuentre el intervalo de confianza al 96 Vo para la producción media de rnanzanas en Ia
zona de estudio;
Si en un estudio sc ¡rlanea realizar 175 etcr-restas, detcrmine los tamalios rnuestrales en cada
estrato, de mancra que la forma de asignación de los estratos sea:
c) ecluitativa;
d) proporcional al tanaño del estrato;
e) no proporcioual al tamaño del estrato.

13.6. Muestreo por conglomerados

La elaboración de uu muestreo aleatorio puede ser costoso y difÍcil de realizar porque la población
cstá clispersa en un área extensa y la localización de cada elerlento de la muestra podrÍa llevar mucho
tieurpo. En estos casos se practica el muestreo por conglomerados.

Definición (de conglomerado) Los conglomerados son subconjuntos de la población que tiencn
la propiedad de ser internamente lo más heterogéneos y entre ellos lo más honogéneos posible.

Por cjemplo) en Ltna inr.estigación se desea conocer la opinión de las arlas de casa de una ciudad. Err
h,rgar cle sortcar a los individttos, se procede a muestrear aleatoriarnente las lttanzanas de Ia ciudad y
clcspués a entrevistar a todas las arlas de casa que viven en cada tura de las nanzanas seleccionadas.
AsÍ, cada manzarla conteudrá ttu conglornerado de elementos y el núrmero de elementos variará de un
conglomerado a otro.

Eu este tipo de mLlestreo Ia construcción del marco muestral es fácil, porque se rlaneja elementos
nayores v los costos de la investigación se rebajan. En cambio, se corre el riesgo de que los elementos
el cacla conglomerado sean rnuy homogéneos; por e.jernplo, si en nna manzana viven úrnicamente
faurilias de un nirrel socioecouórnico alto, Ias respuestas de las amas de casa consultadas pueden ser
mny parecidas. perdiéndose 1a heterogeneidad interna requerida.
404 Capítulo 73. Elernentos de Muestreo

Para compensar estos problemas se necesita escoger el número suficiente de conglomerados para tener
Ia necesaria variación en las respuestas.

Al igual que en las otras secciones, examinaremos los intervalos de confianza para el total, Ia media I'
Ia proporción poblacionales.

13.6.1. Estimación del total poblaciona


A continuación presentaremos el estimador por intervalo del total poblacional T y una fórmula apro-
xirnada para el cálculo del tamaño de la muestra.

Intervalo de confianza

El intervalo de confianza al (1 CS

(^

Doride
I
¡/ es el número de conglomerados en la población

1L es el número de conglornerados en Ia muestra.

nti cs el número de elementos en el conglomerado i, con i: L,2,. . .,fr.

i,,o
i:t
rn es el tamaño promedio del conglomerado en Ia muestra, que se calcula por ñ,: n
N
h[ es el número de elementos en la población, que se calcula por M: D m¿.
i:r
M es el tamaño prornedio del conglomerado para Ia población, que se calcula po, M : +
¡/
ri es la surna de las observaciones correspondientes al i-ésimo conglomerado, con i:1,2....,rt.

i es la estimación del total poblacional corno ? : Mr.

i,o
o;t
T cs el promedio muestral, que se calcula por 7 =
D
i-7
nro

rL

L\r¿ - rnr¡)''D
s es Ia desviación estándar, que se calcula por s: i:7
n-l
rL
rD
iI \\r¡ - r,nrl)' -
i,:l
i "? -
2z i "¿m¿
+t2 i m|.

Nota. Si uo se dispone de M se utiliza m.


73.6. Muestreo por conglonterados 405

Tarnaño de la muestra

El núrmero de conglomerados a incluir er Llna muestra, obtenida de una población conformad.a por l/
conglomerados, con un 95.5 % de confianza y un error -8, dado es

N
?16 (zo¡)2N2s2
/i ::------;. dutidc /?U: --------;6--.
/r0 -+- lv ,E í

La fórmula de evaluación de r¿ incorpola, en el denomilador, una corrección que se debe a que tratamos
con Llna población finita.

trjemplo. En una ciudad viven 38 300 personas distribuidas en 10 500 farnilias. Se seleccionaron 12
fanilias para estimar el gasto mensual en transporte. Los datos se encuentran en la siguiente tabla:

No. de personas Gasto Gasto total


Familia
por familia (nz¿) mensual ($) por familia (r¿)
1
r
t) 25.2; 54.0;22.0 107.2
2 4 35.0; 18.6; 61.3; 18.0 132.9
3 2 46.2;45.3 91.5
4 1 53.9 53.9
I
L, ó 71.0; 69.3; 84.0 224.3
a
b 94.0; 78.8; 16.0 188.8
7 2 83.4; 19.3 702.7
B 4 27.7:94.8;38.1; 43.0 203.6
I 1 48.6 48.6
10 2 23.3; 58.9 82.2
?
11 d 73.6; 63.4; 31.0 168.0
12 3 68.5; 65.5; 42.1 176.r

a) Encoutrar un intervalo de confianza para el gasto total de la población en transporte, al g8.5 %;


b) \4anteuiendo los datos cle a) , detelrninar el tamarlo de la mnestra pala tener un error d.e 100 llil
dólares en Ia estimación de r.
Soluciótt': De los datos del enunciado, el núrmero total de conglomeraclos es l/ : 10 500 y el núulero
total de habitantes en la ciudad es,4,1 :38300; adenás, zolo7s:2.43.
De la tabla se obtiene que ?? : 12 y

I nz; : 31,
I"t : 1573.8.
i:T ;_1

ir) Carlcr.rlemos los conpolcntes del i'tervalo cle confianza para r:


1a

\-
1, .,:,
:: 'n, :__;;_:iu.7u7,
1573.8
rr
\ ttt;
i:t
'r : Alt: x :
38 300 50.767 1944376,
?INrL

>,r? :245491.5, I"¿,rrn : 4576.5, fi-7 rrl : Ot


i:7 i:I
406 Capítulo 73. Elententos de Muestt'eo

Corno

D,@o -¿-;.)2 : i,l - ruir¿nri tr2i,,?


i:7
245 4sr.5 - 2(50.767)(4576.5) + (50.767)2 (e1)
15 354.45,

15 354.45
t-¿-I 11
: 37.36.

Sustituyendo los rralor-es antes encontlados en Ia fólmula:


T^r
tr-' : z^t.N.stlt\ -1r .

"/' V Júrr
l0 500 - 12
: 2.43 x 10 500 x 37.36 x :275020.
l0 500 x 12

EI intervalo qr.reda:

(i - E,;i + E,) : (1944376-275020;7944376+275020)


: (1 669 356; 2 219 396).

Así, el gasto mensual total de la población en transpor-te está entlc los 1.67 y 2.22 millones de
clólares.

b) Para el cálculo del tauaño ruuestral usamos E":100000. Prirlero, obtengamos ns:

^^ Qn¡)2y2t2 e.$)2e0b00)2(37.36)2
r¡tr--
AA o,
E'l (100 000)2 -JU.O|.

Entonces,

tz6 ly'
11, :
ru6 f ltr
: 90.87 x 10 500
:90.1.
90.87 + 10 500

El tamaño es de 91 conglomerados.

13.6.2. Estirnación de la media poblacional


En Io que sigue se presenta el intervalo de estimación de la meclia poblacional y una forna aploximercla
de cleterminar el tamaño muestral.

Intervalo de confianza

El interrralo de confianz¿r al (1-


") x 100%
para la mcdia poblacional ¡r cs

s
( a-2^t¡:.,," At V
F- ly'r¿
73.6. Muestreo por conglonterados 407

Tarlaño de la muestr-¿r

El uúttlero de couglomelaclos a incluil erl Lrna lllrestra, obtenida de una población coltfolmacla por lú
conglomerados, con tur 95.5 % de confianza y un errol Ep daclo es

rr¡ l/ t - .^\2.2
(tolt(le l?n: --#
?¿o * ly''
'
( N\'2L-'2
'..., -ll

Ejemplo. Si en el ejemplo antclior', soble el gasto en tr-anspoltc de las f¿llilias clc n¡a ciuclacl, sc
rlctscar'¿t utta estitrr¿tción clel gasl,o mensual pr-omcclio en tlanspolte pol persona. a) Encontr.ar Lln
itttctr'¡tlo cle confianza par¿r l¿r n-rcclia poblacionerl, ¿rl 98.5%; b) \fantenielclo los mismos clatos, fi.jrrr.el
l¿rttr¿rrto clc la rluestr¿r pltl¿I lcrrel ul cllol de 5 clólales en la estimación clc
¡r,.

Sol,tt,r:i.ón:

a) Hirbíirmos cletelminaclo <¡-rc lV : 10 500, ¡1 : 38 300 y n: 72. Aclcmiis,

t
I2 12
\- : :
) rrr¡ J1' t¿ 1573.8,
i:1 i:T
n¿ : 2.583. M : 3.647.
i:50.767, J / .ót).

El clrol clueda:

Ti
.^t)
-'/ - s, IlÑ-.
_
ñ V A/-r¿

2.43 x 37.36
: 7.782.
3.647

Cortsccuenterrenl,c. cl inl,clvalo clc confi¿rlza l)¿rr.¿r l¿ cs

(r - Dt,;r -f D¡,) (50.767 - T .1.82: 50.767 + 7. 182)


(43.585;57 e4e).

Lo cFte siguific:L clttc cl girsto meclio clc Ia población en concepbo cle tlzlnspoltc csl,¿i e¡t1e los 43.59
y los 57.95 clól¿rlcs nlcnsualcs.
lr) El tamaño clc la mrLcstr'¿r pala tcncl Llrl clrol E¡,.:5 se calcul¿l asÍ:

)
zal2 s- (2.43)2(37 36)2
,¡r,I-
" :24.79
ytrt/\lI L¡t
/,r lt'l (3.oaz;z 15;z

l}rfonccs. cl t¿rrnaiLo rLe 1¿r runestr,¿r cs

rt6 1V
rr¡ * A¡
2J.79 x 10 500
: j-I. / J.
21.79 + 10 500

DI t¡rrnario 1cc¡-lcl iilo cs ric 25 lrruiliirs


Capítulo 73. Eletnentos de Alttestreo

13.6.3. Estimación de la proporción poblacional


Pr-esentamos ahora la forna de establecer el intervalo de confianza y el tamaño de la muestta cuando
se estima la proporción poblacional rnediante congiornerados.

Intervalo de confianza

El intervalo de confianza al (1 - a) x 100 % para la proporción poblacional p es

/ s.p
,ñU n-" :P^+ zonf;V
s.p tr-"\
\'- '", N" x" 1

Doncle

Ar es el númercl de conglornerados en la población.

r¿ es el número cle conglorlerados en la rlttestra.

???.i es el número clc elcmcltos cu el conglotnerado i, con 'i: I,2,...,t't.

l¿ r:s cl tarnaño plomeclio clel conglomelado en I¿l muesbra, que se calcula por T7z :
¡Í
,4'ir es el núrmero clc clemcntos cn l¿r población, qlre se calcttla por 11.[ - i:lD rro.

,41 cs el tanraño plor-ncdio clcl conglomerado palir la población, que sc calcula por A.[ : AI
F
/; cs el total de óxitos cn cl i-ósitlo colglomclado, cort 'i: I,2,. ..,tr,.

D'i
f cs la plopolción rnucshral, qric se calcula por t: ;l-
I
;-1
rn'"

7l
s, r)
L\y¡ _ ptrt¿)-
,s,, cs Ia desrriaciórr csl,ánclar, qne sc c¿rlcula por ,sp : i:t
n -7
]L]I?LIL

D(y¿ - f
v ,i.-). nr;)2 : D,L? - 2iD,tJ¡nti * f D rr?.
i-t i:I i:1

Nota. Si no se disponc dc ,41 sc utiliza ru.

Tama.iro de la rluestr¿t

El rlinrelo cle corglorner'¿rcios a inclrril crr Llua rnueslra, obl,enicl¡r de nna población confoltnacla ¡ror lY
c:onglonrer-aclos, cou rrn (1 - cr) x 100% clc corifianzr\ \¡ nn err-or -Eo claclo cs

,, : "o
A' clo'cle ,rn : &ú.
?¿s * Ar (M)2DB'
+

rl
,I
1 :].6. Muestreo por conglornerados 409

Eiemplo. el rtso de Internet por los ahrmnos de un¿l rrniversidad se seleccionó aleato-
P¿rra conocer
ri¿rmente 7 cle los.19E cnrsos de l¿r r:rt,iclircl. A los ahrmnos se les prepiuntó si en la última semana
¿r .l

habían rrtilizado los st:rvi<:ios cle lntelnct. A continrr¿rción se cla l¿r infornación respecto al número de
alumnos t:onsultaclos ert r.:arla (:urso v cl núrnelo clc lcspuestas afirmatirras.

Ctrrso No. cle No. r'esplrestils CrLrso No. cle No. respuestas
(r) consultas (rn¿) alirrnntiv:is (y¿) (i) corsultas (m¿) afirmativas (y¿)
1 2i 13 10 66 45
2 J.1 1ti il7851
3 56 '2t) 12 29 19
4 87 .J
'J 13 35 20
5 2I 11 14 48 22
6 3Ci 2b 15 27 16
7 45 o.)
16 64 39
E
(l
4,1 1E 17 54 48
i1 LI

a) IJallat' el intclr.alo rle t:oufiartza al g7 Vo para la ploporcirjn cle estucliarrtes cle la universidad clue han
utilizar:lo Iuternet: lr) ¿.A los alunlnos cle r:uántos (:illsos hay que consultar para tener un elror del 47a
en la e-qtinra<:irin'/

Solu,ción; l)e los rlatos clc la talrla se olttiene que N : 498, r¿:77 y
1¿ 7L

I "', : 5t)(l \ tti : JJi '


i-1 i- t

Pol tanto. la cstimacriril clc lir ¡rlcllloli;iírli ¡r r:s


n
\-,
¿- ll¡
^ ;-r lJ/t-
A
I): n
\) - rlti
' St)t)
.i=)

tr) Cak:rrk:mos los otr'os clcnrcnt,os ckrl in bclrrakr:


1I n, tL

D,r? :74245, I,Yr''u :24006, D"'? : 43336'


'i-l i:I i:\
llnton r:es,

\ty, - ilrtr¡)'¿ : D,ri 2frD,tliltti+i¿\r,ii


i-1
zrol'sr)lrz¿ooelT'ro s5e)2(4s836)
: ::l;t:,

: 7.697.

Par'¿t cl t'ált:ulo rlcl t'r'r'ol rr,:r sc clislrorur rlcl vlrlol clc 11, por'1o clue cnr¡rl<-.arcmos rrr.;

tr,

r7(r! rt
f,'
l1r'' : ().05216.
¡ .11)8 . t7
4to Capítttlo 73. Elernentos de Muestreo

Entoni:es, cl intervnlcl cs

(i - Ep;f + Er) : (0.5588-0.0846;0.5588+0.0846)


: Q.47 2;0.6434).

Es dc<;ir' <1rre entlc <:l 47.4Va y el 64.3 % de los estudi¿rntes h¿rn ¿rccedido a Internet, la última
serIl¿n¿.

b) En el cálculo clel tarrtaño enpleamos Ep: 4a/o:0.04. así,

t¿( : r

ry::i:
sz
(AtS'z
¡') ')

' ' . .6t)7 ,.:79.73.


(2.t7\'2 (7
= (47
\',z

.06)2 (0.04)',2

EI tanr¿rri<i cle La rnrrcst,r'¿r es


rr1¡ .|y'

rt1.¡ *.\¡
78.73 x 498
: 67.98.
78.73 + 498

Errtour:cs. sc clel-lt-' r:orisrrltal err 68 c:r.rlsos cle l¿r univer-siclacl.

L3.7. Ejercicios
trstimación del total y cle la media poblacionales

l. Conrcl lcsrrlt¿rdo dr: rrn rnrrcstrc;o llor conglorner'¿rdos sc obtuvo Ia siguiente inform¿rción:

A: : 10 000. r¿ : 100.
?t¿t : 'ttl.2 : .' . : tl¿100 : 15, .41 : 150 000,
II II

I,t, : 48otl, !{"r _ Írtr¿)2 :474.

a) Enr:u<;ntlt; uu intclvalo tle r;orrfianza al 95.570 para el total poblacional r;


li) Eru:rrcLrtrc rrn irrtclvirlo tlcr r:onfianz¿r ¿1 95.5%,paltr ltr rnedia ¡r.

2 Err una r:irrrlarl pcr<¡rcr'rir. rlontlr: ha-v" 3200 lurga,r'es. sc lcalizó ur sonrleo para cstimar cl tiempo
rneciio (l1ro crl los lrt-rgrrlcs sc ve l¿r tclcvisióu <li¿rliarrrenbc, La cnrplesa dividió Ia ciuclacl en 450
rrr¿rnz¿rrr¿is, l)or.'(luo rro tlisponía clc una lista clc los hogarcs y selecciouó 8 manzanas cle casas al
¿tz¿lr. En la sigrricntc t¿rbl¿r se inclicr¿n el nrirnelo cic hogares y el tiempo total (en minutos) clue
Ias famili¿rs. en t:¿rclt rrrirrrziru¿r. rlr,'clicr¿iu ¿r rniL¿u l¿r televisión.

t[tr Ti.trl¡r. No. rlc Ticmpo


^\I;rrrz¡rrr;r .N'r'
Iro¡1irri's l ol ¡rl
i\l¿rrz¿rrril
liogarcs total
(,) (rri¡) (,r,) (¿) (nt¡) ("¿)
1 5 7120 U 8 2610
2 6 1350 6 7 2780
:i E 2720 I 7 2550
1L 72 35titj 8 I 2770
73,7. Ejercicios 4Lt

¿r) H¿lle los intt:rr,¿rl<.,s clcl confirrnza ¿tl 94 %, ptLltr el tienr¡lo toterl y el tiempo medio que los
hogarrcs cil: l¿r t:irr<l¡rrl clerlii:¿rn ¿r vr-'L lir tclcvisión;
b) Enc:rrentre cl t¿rn,rno rlc I¿r rrnest,r'¿l pzrra tcner .,r, cle 19 rrrinrrtos en Ia estimación ch.
l¿r nedi¿r.
"rrnri

3. Err rtua acaclemia cletlicatla a la elseñanza tlel iugiés se clesea cstudial el nírmero de años que los
alututros Ilevau aplcntlicnckr cstc icliont¿r. Sc. r'ealizó csta plcgunta cl 5 cle las 68 clases que tienc
l¿ ac:aclemi¿r con los lcsrrltaclos sigrricntr:s:

Clase 1: 5,4.7,,5, 6, 5.
Clase 2: E, 6, 8, 9,6,7,10, E, 6.
Cl¿rse 3: E, 12,10, LI, 72,9, 13, 12.
Clase 4: 12, 9, 11, 10, 10, 8, 12, 10, 73,72
Clase 5: 14, 72,10, 11, 12, 13, 13.

a) Estirrrc t-'l llriutelo ltrcrlio rlc los arios rlrrr; llrrvrur cst,rrtlialrtLl iLrglcs Ios cst,udi¿rnl,cs tlt: llr
rrt:rrrlclttilr. IJstl,r' :,17,;
b) Si sr: clttisicttr cstirtr¿rl cl plorucclio tlc airos <1rre llci'iru cstudi¿rudo t.oclos los cstudiirntes <¡ur
sc cncuentlrtn <)r.r ¿rcrrlcnilrs Llc crrscr'r¿rnzu rlt-'inglés c1r-rc fr-rnciorriltr cll la ciuclacl, col] Lrrr clt'or
rb 0.5 i¡.uos v <;onIi¡rbilicl¿id tlcl g7%,. trtiliz¡lrrlo r:oLlro ulucstlil Piloto l;r r:orrsnltt lcilizaclr
ir krs 5 (:ru'sos lrrrti:r'iolcs, crrc;uclllo cl trnrlriro rlc Irr rlrr-rcsLla, si sc csLiml c¡rc Loclas Iirs
ar;irrlcrtri¿rs l,icucu trLicltr¡s rrri LoLal tl,e 725 cl¿rscs.

Dstirnación de la ¡rroporción poblacional


zl. Como lcsult¿rclo tk: rrrr lrnrcsLrco lror r:orrglomclaclos sc ha olr[crriclo I¿r siguicntc informar:itilr:

10 000, rr : 100,
,Il
II 'ttt'2 : .. . : tit100 : 15, If : 150 000,
t¿

L,,,, 3oo, !lu, - fr,,.,)z: 5628.


i: I

Dut:ttcnirc rur inl tttr,¿tl<) clt-'t:onfirruz¿r ¿rl 95.5% 1,artr la proPort:iól 1.robl¿r:iorri.rl 7.,.

5. Un inr¡rottirtlot tltt Lt.rlrit ttsittlir. rur (:¿llg¿llncrrt.o clc 500 ptrclueLcs, sclcr:r:ic.rrrti
tlcsptr<1s <lc rcr<:ilrir
alc¿ll.otiarnc¡r1,c 10 tlc rtlltts ),c()ntó cl rtriru<tlo rk: ltlcrrrlas rlcl.c<:t,rros¿rs 1.ror'ltirc1rrel,c, Drls¿rclos cl
lc.,s <l¿rtc's rlr: lir sigrricrrtc t¿rbl¡t:

h\<1. rle No, clc plcrrclas . No. <lc Nu. tlc prendas
Pirrlrrct,c
cntlrrs l'lttlttcl.
pt clef'ct:t rros¿rs 1;r'r:nclirs <lcfccIrros¿rs
(¡,) (rrr,) (.y,) (¿) (rr4) (y,)
L E5 'J:] 0ü615
24420 77825
;i 5ti 18 E5919
47723 95527
t-¡ 61 2I 10 68 22

ir) Etrt:rtcrrtli' rttt itrtt'Lr'¿ilt.r rlc r:ortfi¿rrtzii ril gU% l)rlr¿r l¿I lllopolciórr p <lc lrrcud¿rs tlcl'cct:rros¿rs
cn cl t:rtrgztulctrto tlc rt-r1.rar:

b) Estrrblczt¿r rrl 14,,r,,ñ,, nríninrr.r parit tcrrtr lur crlor'<lc l¿t cst,irri¡urióri rLcl .l%,.
4L2 Capítulo 73. Elernentos de Muestreo

(t. Una empresa ¿rgl'oexportador¿r empaca melones en carjas que contienen 8 rrnidades cada una. Por
ploblernas cn el truns¡rorte se estropcó lrn (:¿rrganlento de.1000 ca,ias. Para conocer las pérdidas
or:asionad¿rs se seler:<:ionó ¿rle¿rtorirrnlente 20 cajas y se contó el nrimero de melones golpeados en
r:ada, ca.ja. l,os lesult¡tclos sr-l clan a cc¡ntinu¿rción:

No. de frrrtas No. de frutas


\,
"
¿11 ¿1
golpeadas "
Ll¿rr ¿t
golpead¿ls
10 11 0
2I 12 1

31 130
42 142
50 150
60 160
72 173
85 18 1

93 190
100 204
a) Encrrentre rrn intervalo rle confianz¿r. al 96.5%o para ler ploporción de melones golpeados;
b) Si ei expolt¿rclor pier'<ie 1.7 dóltrr'<:s por caclar fruta est,r'opeada, encuentre el intervalo de
al 96.5% ptu'ir la pérdidar total del cargrr.nrento;
t:onfi¿rnz¿r

t') ¿,Crrtil clebe scr el trrnr¿ritc.r d<l l¿r mrrestr¿l par¿r tcner rrn error de 0.045?

7. Elr rur lralrir¡ de l¿r c:irrcl¿rd viven 200 faniilias. Un¿r muestra de I familias suministró información
n:latir'¿r al nrinrerrl <lc rnienll-rros, ingreso farliliar cluincenal (en dólares), gasto en alimentaciór
(cu tkilarcs) ¡r,si tierrc suscripción zL algún ¡relióclico. Los resultaclos fueron:

Nr.r. cle J ngreso Ciasto en Suscripción


F¿rrnili¿r
micrnblos c¡rinc:cnnl irlirncnta,ción ¡reriódico
1 2 262 82 si
2 ') 184 96 no
.)
3 D 193 101 no
4 5 145 76 no
5 4 283 722 si
b I 301
'113 si
7 2 247 104 no
cS 4 255 123 no
()
2 22r 1,02 si

Con rrn¿ confinbilid¿rcl clel g5 %, estime:

a) el ingteso <¡rirrr:errll merlio dc los miemlrros de las fan-rilias;


]r) cl cn ¿rlirlrclrtric:itirr pol l)ersona;
gasl,r.r prorrirrrlio

c) el inglr:so cluinrrcnal ¡rromeclio cle las familias que tienen suscripción, si se sabe que en el
lr¿ltlio h¿w 75 srrscuitos. Compare con los lesnltaclos de a) ;
d) la proporci<irr cle f¿ulilias suscliptoras a un pelióclico. Compalc con el dato real;
e) Con los d¿rtos de rr), b) y c), deterrninc el tamaño óptimo de I¿r muestra, si se desea tener'
lln cl r'()r' clc cstinra<ritin rlcl 15 %.
Capítulo 14

Respuestas

Capítulo 1

Sección 1.7

3. N: 40 Yo, R:75To, B: 45To.

4. a) categóricos; c) el2l%.
5. a) tamaño, peso, velocidad y agresividad son datos ordinales; función es nominal.

6. 2.5%.
8. c) 72.5%.
9.26%.
70. 20%.

77. 52.4%.

t2. 70%.

13. n:160.
)4. a) 880; b) 752.

15. n:50.
16. 76.

77.275.

18. 44.64%.

L9. r8%.

20.
lntervalo 0-40 40-80 B0 - 120 -
120 160 160 - 200
Frec. relativa 0.05 0.45 0.10 0.10 0.30

473
4L4 Capítulo 74. Respuesúas

Sección 1.12

1. La mediana.
2. a)T:4.875,b)Me:5; c) s:1.553; d) R:b; e) As:-0.644;f)Ap:0.b92.
3. a) 7: 6;b) Qz: 5; c) s :2;d) R : 5; e) RIQ : 4;f) As :0.362; d Ap: -1.g26.
4. c) r¿: 0.75; Ilfed¿: 0.35; s¿ : 7.789; h :2.33; Med,¿ : L.75; s¿ : 2.002.
5. 2.94%.
6. a) 6; c) 86%; d) 66%.
7. a) Cuantitativos: precio, proporción de malta y tiempo de añe.jamiento, Cualitativos: cate.
goría y nota; c) Precio: r :87.56, Mo :70, Qz: 86, Malta: Í :48.96, Mo : I00, Q2: 49-
Tiempo:7:9.06, Mo:12,Qz:8.5; d) Precio: s:23.166, RIQ:28,CV :0.2646, Malta:
s : 30.114, RIQ :42.5, CV :0.615, Tiempo: s :2.697, RIQ :5, CV : 0.298; e) Precio:
As : 1.339, Ap :2.801, Malta: As : I.092, Ap : -0.542, Tiempo: As : -0.233, Apt : -1.406.

8. r :32.54; Me:32, Mo:34.


9. a) r :6.56; b) Mo : 7; c) s : 2.727; d) E : 8.

10. u) Qz:6; b) r:5.046; c) s:2.63; d) RIQ:3.


11. b) Sugerencia: Use Lo:24.5 y A: 4.

72. a) r:167.5, s:7.265;b)TTH: 167.189, MG:t67.J44;c) ez:t6T.S, RIe:5.


13. a) Qt : : 5.4, Q¡ : 8.05; b) M H : 3.715; c) MG:
2.9, Qz 4.5837.

L4. a) T : 12.29, Qt : 7.73, Qz : LI.SI, Qr :17.36.


15. mín : 0, Qt :2, Qz : 3, Qs :4, máx : 8.
16. a) r":2I.57L, s":2.149; b) ft:70.829, s/:3.8685; c) rf :I.8r"132, s¡:1.8s".
17. a) s : 1.348, s = 1.15; b) (2.28;5.52), (1.48; 6.82), (0.t3; 8.22); c) n1:82, n2:49, ns:50.
18. b) Qz:116; c) Qt:107.25,Qs:121.5; d) r:114.59, s:12.43;f) As: -0.602, Ap:t.2IB.
19. 33.3%.

20. 665.6 km.


21. 85.62 km/día.
22. 168 cm.

23. 8.
24. 101.

25. 19.

26. Med : 37.92, Mo :36.92.

27. 500, la mediana y moda.


28. 20.
4L5

29. a) rr : 9; b) 8.1 cigarrillos.

30. 268 800 Tm.

31. a) 356 mil dólares; b) 49.5.

32. 80o/o.
33. 5r¿.

34. a) 850; b) 900.71.

35. a) 640; b) 2%.

36. 6.27.

37. r:6, Qz:6.375, s:2.94.


38. Í, : 47, Qz : 48.33, s : 13.75.
39. Qz:52.23.
40. a) 20; b) 30 %; c) r : 1108, Med: 1083.3, Mo : 1040.

Capítulo 2

Sección 2.6

1. a) 6; b) 1; c) 3; d) 3.

2. a) 12; b) 1; c) 6; d) 30.

3. a) 3! : 6; b) ! :24; c) 5! : 120; d) 6! : 720.

4. a) 12; b) 20; c) 40; d) 65.

5. a) 40, b) 700.

6. a) 9; b) 25; c) a9; d) 64.

7. a) Combinaciones: 10, variaciones: 60; b) Combinaciones: 20, variaciones: 120.

8. a) Son 20 parejas sin reposicióny 25 parejas con reposición; b) Son 30 parejas sin reposición y
36 parejas con reposición.

9. De 36 maneras.

10. 1330.

11. r20.

72. 720.

13. 504.

14. 84.

15. 0.5.

16. a) r20; b) 50a0, c) 2160.


4L6 Capítulo 14. Respuesúas

17. v? : 42; b) C? :2t.


")
18. 380.
19. r28.

20. 450 formas diferentes.


27. 105.

22. 84.

23. a) Cfo; b) 166; c) 15 x 165; d) 153

24. 77.
7
25. 26D36i:2.096 x 1012.
i:o
26. a) 4 x 75 : 67 228; b) 73 +3x 7a +4x 75 : 74774.

27. 6720.

28. a) r e Ac ) B' ) C"; b) r e Au B u C ; c) r e (A ) B') u (8" rt C") u (A o C');


d) r € (A'.8 nC) u (A.'8" nC) u (Ane.C"); e) r € (AnB^C)'.
29 Sugerencia: Utilice los axiomas de la probabilidad.

30 Pr(,4 n il :¿, Pr(A u B) : ,r{a n B') :


*4. 1.
1
a)'2-: b)'6',',8
1.3
31. -: c) -.
ao a) Pr(A") : 0.625, Pr(B') : 0'5; b) Pr(A u B) : 0.75; c) Pr(A' ) B") : 9.25'
d) Pr(A'n B) : 0.375, Pr(A n B') :0.25.
33. Sugerencia: Utilice Ia fórmula de la probabilidad de Ia unión.

34. O : {1C, lE,2C,2E,3C, 38, 4C, 48, 5C, 5E, 6C, 6E).
JJ, a) Pr(A) :0.4; b) Pr(AuB) :0.9; c) Pr(B") :0.4; d) Pr(AnB) :0.1; e) Pr(A\B) :0.3;
f) Pr(Á" n B") :0.1; s) Pr[(A n B)"] : 0.9; h) Pr(A U B"): 0.5.
36. a) f): {(I,I,I), (I,I,D), (I,D,I), (D,I,I), (I,D,D), (D,I,D), (D,D,I), (D,D,D)};
b) C : A \ B; c) B' : {(I,I,D), (I,D,I), (D,I,I), (I,D,D), (D,I,D), (D,D,I)};
BUC: {(1, I,I), (I,I,D), (I,D,I), (D,I,I), (D,D,n)}; AOB: {(I,I,I)};
A.ttB.: {(1, D,D), (D,I,D), (D,D,I)}.
37. a) Pr(A) : l; u) Pr(A u B) :3; c) Pr(A') :25.
38. 2:
4ll

39. a)
á'or i
, (i)': $,
36
40. a) o)
64
417

1
47
15

Ctr
42. :- 1
q- I
tJ

3
43
38

44
cB cá3 1-cá c8u
c13.
: 0.e231.
23
45.
t14'

46. al L c?nn' "' ' c?oo'


a)1_.-3u,b)1--$,.

47.
.-
l--.
c?n c?o
cBo

48. ,l't 4,
C%
ul
",
309to, ao93u.
! u/
"l Cuno C?o

t7
49
33'
cá c3, + cB c¿8 + cB c38
bo. ') ¿f ; u)

51

52.

53.

54.
20

55. p- -1 'tT

Sección 2.9

3. a) Pr(A lB) : l; r,) e,(rlA) : ); c) P,(AIB) : ]; a) er(a "lA) : ]; ") P,(,a" lB') : 5
g'

f) Pr(B'lA) : :
1
4. -.
4
11 : c) no son independientes.
5. a) Pr(A): i, b) Pr(B) ,;
7 1 11
6. a) Pr(B\A) : ,r, Pr(BlA): i,, Pr(Au B'):,r;a) Si son independientes.

7. a) A y B son independientes. b) Ay C no son independientes'


4L8 Capítulo 74. Respuesúas

1
8.
5

.)
9.
28'
10. Envío conjunto: a) 0.9; b) 0.9. Envío por separado: a) 0.81; b) 0.99.

,r. 20
n
72. 0.75

13. a)'
45 b) 99
-'46' ', -.
110

7a. Pr(ClD) : 0.7557s.


19
15.
2018
16. 979

t7. a) 75.9%; b) 0.5283.


18. a) 0.08; b) 0.24; c) 0.a; d) 0.842I.

19. a) 0.322; b) 0.258; c) 0.238; d) 0.375.

20. a) 0.2a;b) 0.4; c) Si son independientes; d) Si son independientes.

27. a) Pr(M):0.45,Pr(Iz) :0.375; b) 0.075; .) ¿) rro son independientes.


i; l, ")
Sexo Hombre Mujer Hábito No fuma Fuma Ex-fumador
22. a)
p 0.5 0.5 p 0.46 0.26 0.28

- 0.26,Pr(FlM) :0.32; c) no son independientes.


b) Pr(-F)

23. a)' *; ¡l j;
15', 5' "; ,ro son ind.ependientes.
24. a) 80 %; b) 0.59; c) 0.8537.

25. 0.3806.

26. ?.
4

27. a) 2a%;b) 0.667.


28. a) 0.65; b) 0.4.

29. a) 0.a; b) La B: Pr(BlH) :0.5.


.1 b)
7 c)
1
-"' *,t
30. a)
-:
L0,
', I0'", -7'
-:
31. 0.8235.

32.
y.
47

33. a) 0.898; b) 0.39.

34. a) 0.56; b) 0.7273.


4t9

35. a) 0.25; b) 0.25, c) independencia; d) 0.45; e) 0.45; f) 0.1.

36. 0.4539.
n7p
DN
d,. Card(A) :
2

Capítulo 3

Sección 3.3

1. a) discreta, {0,1,...,100 x 10e}; b) continua, 10, *[; c) discreta, {0,1,2,...};


d) discreta, {0, 1, 2, . . .}; e) continua, í0,24 horas]; f) continua, [0, -[;
g) discreta, {0,L,2,.. ., 100}; h) continua, ] - -, -[.
2. Sugerencia: Procure que sus ejemplos estén relacionados con su actividad diaria.

3. a) Pr(X € A) : ], erlx # A):|,vr1x € B) : |, er{x # A):?


0, si r<-2;
ll4, si -2<r10;
IIll2, si 0( r<t/3;
1, si r>t/3.
X 5 50 100
0.1 0.3 0.6

68/95 51/190 3/190

0, si r 10;
0.6, si 0<r<1;
X 0 1 2
a
J 4 0.92, si l1r<2;
p 0.0384 0.6 0.32 0.016 0.0256 0.936, si 2<r<3;
0.9616, si 3( r<4;
1, si r) 4.
X 0 1 2 3
p 0.00001 0.00167 0.07663 0.92169

3600. 1525.
a)k: b) Prrl < x <¿):
'5269',',\-5269
10 a) c:]; u) e.(x < 1) :
f,,Yr{x <2):f , e.{o < x <3) :;
11. b) 0.608e.

t2. Sugerencia: utilice las propiedades de las series telescópicas.


( l'l
13. u) r(r) :{ Dnn(J-dk siz)Q;
I o sir(O.
c) Pr(X >2): (1 -p)3, Pr(X > 4) : (1 -p)a, Pr(X < 3):p(p2 - 3p+3).
420 Capítulo 74. Respuesúas

14. a) c: u) c: 1; c)
r¡;
a) !,f) c:1.
,rg; ": ]; ") ":
2
15.
'3'-:b )]; ") I' ol
a)
i
16.
X rt o 1

17.

b) Pr(X :0.2): 0, Pr(X < n14) : +,Pr(X > trll) : 0,Pr(trfI2 < X < r) : t.

18 a)c:r,f(x): b) pr(x :rt3):0,pr(".1) :],r.(rxr .i):i


{á; ;F[3:i]: :l

19. a) a: r; b:2; b) .F(t) : I t,lr, :lsiú)1.


á=.?'. ,,
I
20. a) a:tu, u:f,; a) f @) : lilij;i"fj;
{to,,n,
c) pr(X < 0) : er1¡x¡ < 1.b) : l, er1¡xlr r.2):?.
|,
27. a) Pr(" > 1) : j; u) er(r <2):l; er(r t ¡) :01.
")

22. b) Pr(X 2 1) :0.3.

23.u ü

r(1 > z) : c) El 26 % de las veces; d) ú : 3.43.


i*'

25. a) c: ]; u) (i ) j, {tt.l l; .) er(a n B) : 3,


, , B son independientes.
26. a) Pr(X < 3) : 0.316; b) Pr(X > 6) : 0.156, c) n: 4.8t.

r)
27.
]; u) i*, "l nosonindependientes; d) ffi
( o, si3r<o;
28. u) :{ \/a,si0(a<I;
ry(y)
( 1, sig>1.
b) P'(+ <x2<á) :
i,r,(* .".;) :osbe
421

(T sr
29. Í(t): { to' si ;

|.0,
1

30 Pr(X2<l):;.

I zrr"'
( f: rr;
31 fu@): 4
-L.
I 0,
aJ¿'
14;
[ rario.

(0. si
Fr@):I;:, s¡ zÉ!!'t];
32. r z\&)
- Íz(*):Io'
- \ t,
rz\n)
I i; ",t
si z e [0,1]'

: b) fz(,)- o2exp(- o("o'-'))con -oo < n < oo


^) fv(,) {Z:,,
33.
; : 3:

Sección 3.6

1. E(X) : 0.161, Var(X) : 0.2153, E(y) : 4.4, Yar(Y) : 2.84'

2. E(X) :0, Var(X) : 1, o(X) :1.


3. Si, Var(X) > 0.

4. a) 2515; b) -50; c) 15; a¡ zJts; e) 160; f) 135.

5. a) E(^9) :3lt,Var(S) : 3o2;b) E(") : 3p, Var( T) :9o2;c) O(A) : Yar(A¡ :


¡1.,
t,
: :
d) E (S'z)
* * r'.
3o2 *9t"2, E (A')

6. a) E(X) :0, Var(Xl:X,b) E(X) :0, Var(Xl:|,c) n(x) :0, Var(Xl : *'
d) E(X) : 0, Var(X) :
;
7. a) e(x) - 2.5, o(x):0.866; b) E(x) :9r2,o(x):
$t OE(x) : '5,".}1:
;fo,
d) E(X) - -4, o(X) :0.556; e) c: #, tt") : #, o(X) : In 4 (ln 2)z
'

8. P:0.2, o : 11.

L Yar(Z): 0.09.

10.

11. pr : 0.35, Pz:0.20, Ps:0.45-

72.
422 Capítulo 74. Respuesúas

13. a) a:0.5, b: t; b) /(r) :0.5, si 2 < r 14; f ("):0, caso contrario;


c) Pr(l < X <3) : 0.5, Pr(X > 2.5) :0.25; d) E(X) :3, Var(X) :
].
r4 a) c:fi; t) *,q Pr(X > 5):2;,Pr(X < D:#,,Pr(x2 -rzx+Bb > 0)
3
4'
d) E(x) :T,var(x): #
15. a)
X
p 8lL5 6175 rl15 b) E(x) : fi, c) var(x) : #
16. E(X) : -1.6 (pérdida).
91
17. a) 0 : {A, FA, FFA, FFF}; ¡) c) E(c) : 1766.4; d) E(X) : Var(X) :0,62
*' 15'
18. C : L200

19. b) E(c) :37000.

20. a) E(X) : 3 autos. b) E(G) : 151 dólares; c) o(G): 90.8 dólares.


2t. E(X) : 202.94; o(X) :178.91

22. a)
: i)
Pr(X
100 100 100 100 100 100 100 100 100 100
b) E(X) : 3.85; c) Var(X) : 5.527.
23. a) E(X) : 109.39, Var(X) : 33.19; b) 54.70 dólares.
24. a) E(X) : 3, o(X) : 0.7746; b) E(v) - 5.5, Var(Y) :
+
25. a) E(X) :2;Yar(X) : 0.2; b) 50.225%.
26. a) E(") :4.8h, Var(") :2.56h2; b) E(C) : 48, o(C):t6.
27. a) Pr(X > 60) : 0.334; b) E(X) -- 5r2 : 49.348m; c) Var(X) : 461.3 m2; o(X) :2L.478m.
28. Sugerencia: utilice las propiedades de las series geométricas.
29. Sugerencia: utilice el ejercicio anterior.
30. E(xY +2Y -x) : #.
31. a) 2; b)
Í'"1 f;
32. E(^9,) :0, Var(,S",) :;.
33. E(S") : fret E(?l,.) : tupa, Var(S") : TLo2 ¡ V-(",) : np (o2 * o'O).
1

34. a) M(t): :3, Var(X):2;b) M(t):0.3e-2t +


,("-,*e-2t*e-Stte-4t+e-'t), E(X)
0.7e-at * 0.2e-5t r 0.4e-6t , n1¡l;!;!, var(x) : 2.84; c) M (t) : e.5"-2t t 0.Je2t , E(x) - 0.4,

Var(X) :3.04; d)M(t):+,E(x) :1,Var(X) :3; e)M(t):*,E(x) :*,


Var(X) : |; rl M(L):r!+#:, E(x) : i," - 1), Var(x) :; - *
423

Capítulo 4

Sección 4.6

1. a) t5 dOlares; b) 240 dólares.

2. 25 dólares.
, :
3. .) i; ¡) E(X) : 109.5 110 Palabras.

4. a) n(xk) : !-,+1-l; b) sik espar, var(xk) :f, ., /c esimpar,vr,(xk) :I.


5. 42020
b) c)
") i; 7; *.
6. '11(t0,7,2),57

7. Pr(X:3) :0.5, no porque la probabilidad es alta.


8. a) 0.2913; b) 0.8357.
e E h,u¡ ]]; "¡ r
10 q i,ur li' q k
11. a) 0.1536; b) 0.1808; c) 0.9728; d) E(X) : 0.8; e) Var(X) :0.64.
L2. 0.537.

13. a) 0.26214; b) 0.01536.

L4. a) 0.36754; b) 0.609.


15. a) 0.083e; b) 0.0374; J¡ o.sro.

16. a) 0.36; b) 0.997; c) a.

17. a) 0.9606; b) 0.9994; c) 3.97 x 10-6.

18. a) 0.05631; b) si es efectiva, pues la probabilidad de que nadie se contagie es muy baja.

19. a) 0.0002187; b) 0.67058; c) 13.

20. a) 0.109; b) 0.999a; c) 0.5885; d) 16; e) 3.2.


2L. E(G) : 11.6 millones de dólares. b) o(G) : 8.08 millones de dólares.

100
22. pr(x < 9b) :1- t cf00(0.0b)k(0.9s¡too-r.
k:96
23. Al azar:0.17188; con información: 0.5.

24. 0.0504.

X b) 10 preguntas.
25. a)
-
p 0.1 0.09 0.081 0.1 x 0.
424 Capítulo 74. Respuesúas

26. b) 5 cartuchos.
0.2 0.16 0.128

a) 0.22II; b) 0.007946; c) 3 partidos.

E(X) : 8.33, es decir 9 refrescos.

3 gusanos.

a) 0.04087; b) 0,03564.

0.3188.

a) 0.04364; b) 0.00032; c) 25.

a) 0.032; b) 5.

a) 0.0902; b) 0.9473; c) 0.0527; d) 0.2405.

): 6, a) 0.089235; b) 0.061969; c) 0.59278.

a) 0.14653; b) 0.56653.

a) 0.1954; b) 0.2381; c) 0.7619.

a) 0.224; b) 0.5768; c) 0.9502.

0.14288.

a) 0.60653; b) Binomial: 0.937; c) 0.96343.

700 dólares.

a) 0.3679; b) 0.2652; c) al menos 300.

E(C) : 200 dólares, : 47.43 dólares.


"(C)
a) 90.48%;b) 9.52%; c) 0.8187.

a) 0.0006415; b) ) :32, Pr(X < 30) : 0.338.

0.14288.

): 6, a) 0.1606; b) 0.1512; c) 0.715.

a) po : 7e-2 - 0.94735; b) 0.12896.

50. a)' .\ : 4, b) 0.4863.


20"
425

Sección 4"10

1. a) 0; b) 0.75; c) 0.5; ct) 0.75; e) ú


1

2. a) 0; b) 0"6; c) 0.a; d) 0.8; e) t : ;. 1

,)

t;
..).
i2'
4. L/,U.

a) A.4; b) 0.2; c) E(jf) : 22500 dóiares.


71
6. a) 0; b)
n;q;
7. a) 02; b) E(A) : lr'l
frn, Var(A) :6.223.

B. 0.75.

9. 0.8.

10. 0.15.

11. a).\:6, f(r):ía' u"-u',


^ sir10; E(x) : 1 var(x) : 1

!. si r ¿ o. u' B6t'
( sir<o; E(x) I var(x) _-
b) .\:3, l@) :1 o,
i"_*, ;; ;; ó i, ==
n;
1

\
c) ,\:0.5, f(d:Io' ó.r"-o't,, sir<o:
.t; i ó. E(x) :2,Yat(x):4;
t
: f o' si
: :
d) ,\ 0.25, I@) =-
I 0.2b"-r,r,, .t ;; 3" E(x) 4, var(x) 16'

72. a) 0.03; b) 0.66; c) 0.31; d) 0.34.


1
13. a) 0.6321; b) 0.1353; c) 0.2325; d) E(?-) :3h; e) E(C) :L20 centa.¡os.
": 3'
1.4. a) 60; b) 0"5034, c) 0.7788"

15. a) 0.368; b) 0.248; c) 0.451; cl) 0.2152.

16. a) 0.9rj; b) 0.35.

17. a) 0.287; b) 0.148; c) 0.0695"


10
ao. a) 0.13534; b) 0.2:336; c) 16; d) 790.

19. a) I t00; b) 0.135.

24. a) 0"368; b) 0.6065.


i ,"
21. a) /(r) : b) Pr(i,<5) :0.bg8,iJi(Y;,4) :0.598,p1(lyl <3) :0.28b.
{2nu(r-5)2132.
22. { A.4A2.; b) C.309; c) C.276 d) 0.tt28^

OD
¿rt- 82.28%.
426 Capítulo 74. Respuesúas

24. a) 0.71i8: b) 0.055; ci) 0.733.

25. a) 0.02275; b) 0.65542; c) 0.15866.

26. a) 0.titi1: lr) 22 rnin.

27. 0.403.

28. a) 72; b) 8a.6; c) 185.

29. a) 62 crn; b) 58.7 cm.

30. a) 145; b) 537; c) 7484.


31. h:2metros.
32. a) (i) Pr(X > 167) :0.5, (ii) Pr(x > 170) :0.16; b) (i) Pr(l' - 4): (0.16)4:0.0007,
(ii) Pr(}, - 2) : ctrQ.5)4: 0.375.

33. a) 0.9088; b) 03a67; c) 13.49; d) Pr(X < 12) :0.01, o : 0.34335.

34. Pr(Iz) : 0.5987, Pr(M): 0.6915, Ia mujer es relativamente más alta.

35. a) 95.45 %; b) 0.83.

36. a) 0.0062; b) t : I772h.


37. a) 11.5%; b) 15.8%; c) 0.00152.
38. a) 0.8413; b) 0.01068; c) 0.6658; cl) 0.2367.

39. Pr(X > 450) : 0.01, ¡r : 391.75g.

40. n) l.t : 70.72, o2 :3.

Sección 4.12

1. 0.023.

2. 0.0985.

3. 0.0003.

4. 192 083.99 kg.

5. 0.0227.

6. a) 0.2375; b) 0.6657.

7. 0.04595.

8. a) 0.97725; b) n > 108.

9. a.) ,A/(7.5,5.25); b) 0.1379.

10. 0.0207.
11. a) 0.0E23; b) 0.0446.
t2. a) 20; b) 0.1269; c) 0.8395.
427

13. a) 5BB; b) 0.92758; c) 0.2330.

74. a) 0.2557; b) 0.05593; c) 0.78636.

15. a) 9(0.36), E(X) : 2.778, Var(X) :4.938;


b) E(S4s) : 80, Var(,9¿s) :222.22;
c) 0.8324.

Capítulo 5

Sección 5.6
X
D
Y 0 2 J

l. 0 0/30 t/30 2/30 3/30


1 tl30 2130 3/30 4130
2 2/30 3/30 4/30 5130
23
n_ 1
;b)
3
a)
20 B' ") [; 120'

e) ^9
0 I2
PS 61 lr20 5rlr20 81r20 211120

1 29 cl) 55
3") 89; b)
*,") -:89', ', -:
89',

e)
X -1 01
PX 17 l8s t4189 t7 l8e 4718e PY 15/Be 27 l9e 47 l8e

4. a)
4
b)+ 01 2 X2 T2 c)
:'49
.40
49; 417 217 tl7 I 17 217 417 -.
X
Y 0 2 r) 4
5. -VJ 0.075 0.050 0.025 0.0375 0.0625
0 0.201 0.134 0.067 0.1005 0.1675
6 0.024 0.016 0.008 0.0120
v,) 0.0200

6. a) -3410 b) 0.1965.
Px 0.25 0.43 0.32 pv 0.55 0.45
7. a)
X 10 20 30 40 b) 0.7392.
PX 0.r4 0.42 0.19 0.25 0.7r

8. a) 1, b)
1 2 3
c) No son independientes;
60 115 31L0 215 PY 4lr5 rl3. 2/5

d) Pr(1 < X<3;2<Y 5a) :*, Pt(X +Y <3) : 1

10


9. ü +(\Á - 1); b) /¡(r) : "o"
r, fv(ü - coss.
JTa t' : fr
l0 lx\r) : *e '"'-'''; fv(a)
vrt "-'0";
no son indeperrdientes.
428 Capítulo 14. Respuesúas

4
11 4 b) si son indePendientes.
nrr
I2 a) fx@) : r) 0; fs,(y) : y > 0;b) (1 - (f +.lo)e ^") (t -" ^u);
^2tre-\',, ^e-\'!t,
c) 1 - (1 +.\a)e ^".

l3
p 1 o¡50 i3l50 21.150 7150 4150 p 3/50 22150 21150 4150

b)
t2 c)
xlv:o 1 2
rlrs 7 113 5113 213 113

t4. a)
X t2 ¿ 4 5 1 2
0.22 0.25 0.23 0.20 0.10 0.30 0.24 0.t7 0.11 0.08 0.06 0.04
ut Pr(x :
r \ _____________::_ l
t2 45
klY :1) I 1bl30 gllo 4130 7130 rl30

15. Cov(x, t'¡ : (n - 1)(t + 3)("' + r).


L2

16. Si rn y r¿ son pares: p(X^,X") : L; si m y r¿ son impares: p(X^,Xn) :1; si rn y n tiene


distinta paridad: p (X^, Xn) : 0.

77. a) 0.064; b) 0.102.

18. :2r; c) 0'1089; d) Son independientes.


a) a; b) f ("lvo)
r 2rI4
' Para w\e\r'
-,'t)ola 0(r(1;
19
")fx(r):1 [ 0, b caso contrario.
b)0.7a2:c) 0.04.

( (20 000)3
20. a)
"f(rr ,rz.rs):1
(rr*100)3trritoólt(rs+Loo)5' rt>.0' rz> 0' 13>0;
[ 0, caso contrario.
1
b) Pr(X1 < 100, X2 < 100, Xs > 200) -
16'

2r. a) k:1; b) /s(s) :{* si 0( s(8; h(,):{ +' si 0<L<7:


0,
[ caso contrario 0, caso contrario. |.
(0 si s(0; ú<0;
c) F(s,r) :i #, si 0(s(B; 0<t<7;
t, I si s)8; L>7.

22 .)'256
3; a) fr(t):2t; c) Son independientes.

oa
") *;
¡l IxQ)-+,si 0( r12; Ivfu):+ si2( u<4;c) Cov(x.v) :-*.
,A a) a; b) fx@):2tre-'",ft(y):2!Je-!"; c) E(X) :E(y) :{,d) Soninclependientes.

ox
att a) :t r2r2+l si0(¿(
"fx(r)
. 4 .,
1: h(u):iu(u't *2) si0<y< l:b) Cov(X.V): -2
r--,
209
c)trlX-Y)-' 350.E(X'-Y'\- 2527
429

'l t r\ ) t
26. a)fx(t):1(ur.."Írt+'t\E-F*;),fv|):?(ur".unt+tt/L=P);rr)Noindependientes.
-\
( 2r-r17 ) si úr)o.
' v'
27 a) 8; b) Ix@) 1 6(1 + z)a 'L
: c) No son independientes.
I O, caso contrario.

28. a) k:(n-I)(,n-2);
b) F(r.u\:
' \*,rt {I 0,
\- (r:_r)2-n - (a+r)2-" +(r+ a*r)2-''', si r ) 0; v> 0; n > 0;
caso contrario.

29. fx(r): i,t - r'), fv(a): 1, no son independientes;


a)

,,
b) f x@) :
f* * r¡r, fv(a): Gi l)s,
no son independientes'

30. fx(,): 3,," - *') ' #:"3;;; t' fv(ü: f 3a',


para 0<y1I;
{ I O, caso contrario.
31. Cov(X,Y) : -0.0f , p: -0.1306.

32. a) 8; b) f x(") : 4(r - r3), fv(ü : 4a3; c) E(X) : 9, : j,


15',E(v) 5', a; o.oon4; e) No son
independientes.

33. a) 10; b) /x(r) -5"4,0 <r<1, fv(y): fr{t _ y3),0<y <1, nosonindependientes;

c) Cov(X, rl : #, d) IvV::/z@lx : Il2): Bs, 0 < y < i'


I ",

34. a) I@,ü:;,si r ) 0,a ) 0, rts < 2; b) Ix(r):+, Iv(ü:?rc)


I
Cov(X, n: -I
35. a) f (r,r):; 11si lzl + lgl < 1; ¡) /(") - 1- lrl, si lrl < 1; ") E(x) :0, Var(X) : á'
d) E(XY) : 0; e) Cov(X, Y) : 0, p(X,V¡ : g.

36. a) 0.0153; b) 0.0234.

37. a) 0.025; b) 5.344 x 10-4.


38. a) 0.007; b) 0.013.

39. 0.02923.

/a -2 4\
40. I-z u -r)
\a -4 6/
47. Cov(S,,,, T,-) : rpo2.

/t 2 6\
42. Iz 6 18l.
\o 18 60)
430 Capítulo 74. Respuesúas

Capítulo 6

Sección 6.5

1. a) 0.7457, b) 0.9976; c) 0.0645; d) 0.0289.


2. ¡rr: 3100 g, ov:1.5g.
3. a) p:400, ov: 20; b) 0.9104.
4. 0.0668.
5. a) 0.9890; b) 0.9257; c) 0.81351.
6. 0.13936 exacto, 0.73929 aproximado.
7.0.15866.
8. 0.9053.

9. 0.06802.

10. p, e (2.87 3.79).

11. ¡t e (37.77;40.23).
12. a) 0.0456; b) 0.0228.

13. a) 0.0228.; b) 100.

t4. 0.0036.

15. 0.923.
16. 0.8132.
17. a) Estadístico; b) 0.00361; c) Si.

18. a) ParámetÍo, P :0.8; b) El valor de cada estadístico, calculado a partir de las muestras, estará
más cercano a 0.8, a medida que aumenta el tamaño de la muestra; c) 0.9846; d) la probabilidad
es mayor.

0.785.

a) 0.0918; b) 0.0485; c) 0.4772.

a) 0.9270; b) 2826.

0.0228.

0.0918.

0.09513.

p e (0.333;0.367).
p : 0.3679, Pr(f'> Il3) :0.758.
a) Pr(p'> 0.8) :0.1376; b) Pr(X > 20) :0.1935; c) La probabilidad de ganar debe mantenerse
constante durante el torneo.
43L

28. a) 3.33; b) 3.57; c) 34.17; d) 26.30.

29. 0.95.

30. a) 0.95; b) 0.09.

31. a) Pr(s2 > 8.1) = 0.0b; b) pr(2.66 < <9.52) x0.94.


"2
oo
¿¿. Pr(s2 ( 16) < 0.01, no es un valor válido parao2.

33. Pr(s>7) =0.95.

34. a) Pr(s2 > 150) = 0.9; b) Pr(s2 > 362) = 0.02b; c) E(s2) :225, Var(s2) : 3894.

35. o2 e (49.75;I6a37).

36. a) 1.383; b) 2.681; c) 2.086; d) t.746.

Jt. 0.8361.

38. a) 0.1; b) 0.75.

39. 0.99.

40. a) 3.32; b) a.76; c) 4.47; d) 5.86.

4t. 0.025.

42. 0.05.

o: ,Lg4: 0.34, b:2.84.


1
43.

44. a) F - f'(1,1); b) 0.95.

45. a) 0.5885; b) 0.1759.

46. 0.0062.

47. 0.0104.

48. ? - ¿(17), 0.05.

49. T - t(22),0.I.

50. 0.0207.

51. 0.9634.

52. 0.0322.

53. 0.9747.
432 Capítulo 74. Respuestas

Capítulo 7

Sección 7.5

2. Mejor -6r,3r,3r,3n - Peor.

-2
: i-, u-2 Var(73) : o-2
3. a) Si; b) Var(?'1)
'/ 2nz'Var(?z) -
n2', \ u/ 3; Bnz
c) Mejor 73.

4. ü6t02 y ?* .o.r estimadores insesgados; b) El estimador de menor varianza es34.

5. 101,32 y0, ror, estimadores insesgados; b) El estimador de menor varianza es ?3.

7. a) l:r; b) E(V) :48(X)+E(X\:4.\*)2+):5.\* \2;c)?:1É


n
r|+tt.
7=t

8. Es insesgado.

9. b) a:
oi+oi
10. b) c:
---ú-
n\
' nt lnz
11. a) E(X.): g , Var(x ,l : {, b) Tn:x,,, ECM (7'd : *
t2. a)O :, (t - t, A :, (#+), ao,.a" k es el número de veces que aparece et valor 1.
*),

13. L(p) : rttozs (7 - P)2r, f:
74. a) E(x) : 1 * 0,AL:X + t; b) Es insesgado; c) 6, :X; d) d2; e) 1.

15. a) F: #' o, F: t -"-oooi, I : -uooatt (rtr)


16. a)
' 2-9:b\t : 81
3', "' 100'
17. 6,:0.10129.

Sección 7.8

1. a) (3.013; 6.986); b) (36.02; 37.98); c) (18.147; 18.852); d) (-22.564;-21.436).


2. a) L:0.7052 b) ¿:53.572;c) L:1.662;d) t :2.773.
3. a) (117.98; 122.02); b) (220.26 2%.7\; c) (65.73; 66.27); d) (-38.17; -35.83).
4. a) (97.9; 102.t); b) (ae.1e; 56.81); c) @a.a2;87.58); d) (-39.5;-34.5).
5. (a7.7a 52.86)

6. a) (416.60; 503.40); b) 295.

7. a) (106.49; 113.51); b) 3.51.


8. a) 0.9938; b) 72.
433

9. 57.

10. a) (107.1; 108.9); b) 99.068%.


11. a) (165.01; 169.3e); b) 50.

72. a) 50 dólares; b) 490.

13. 62.
t4. 43.

15. 31.

16. a) (26.77;30.04); c) El intervalo hubiera sido más estrecho; d) El intervalo hubiera sido más
estrecho; e) El intervalo hubiera sido más estrecho; f) El intervalo hubiera sido de igual longitud,
desplazado hacia Ia izquierda.v

Sección 7.10
1. a) (2.889; 3.a71);b) @5.27; a6.73); c) (-1.33; 6.33); d) (-176.58; -87.a2).
2. (O.ee; 2.30).

3. a) (50.05; 51.38); b) No.


4. a) (16.46, 77 .57); b) (0.0396,0 .6724).

5. @0e.23;706.76).

6. (2793a;240.66).

7. 90%: (375.24; 485.0I);95 %: (363.40; 496.85);99% (337.87; 522.38).

8. a) (24.66;26.86); b) El lote no se acepta.


9. a) (1.89; 2.68); b) El lote no es aceptado.
10. a) (2793a;236.66); b) n: t2 (221.72;234.28); n:100: (226.79;229.8I).
11. a) (3.527;3.709); b) n : 8.
72. a) (169; 314); b) Si, el tiempo es mayor que el indicado.
13. a) T : 4.846, s :2.949; b) (3.234; 6.458); c) El intervalo sería más estrecho; d) EI ancho del
intervalo se mantendrá y se desplaza a la derecha; e) p:8126. La muestra posiblemente no
proviene de una población rrormal.

Sección 7.12

1. a) (86.43; 1928.57); b) (111.94; 725.87); c) (128.39; 516.25); d) (141.8a; 422.43).


2. 90%: (25.35; 109.17); 95%: (22.76; 130.61).

3. oe (6.61: 17.55). La información no es corlecta.

4. o2 e (2903.54: t3473.29); o e (53.88; 116.07).

5. o e (3.30r8.40). si le conviene.
434 Capítulo 74. Respuesúas

6. a) (19.245; 23.155); b) (1.51; 34.70).


7. Tr¿dicional: (ft.16; 89.70), Alterlativo: (9.99; 94.60). Mejor es el nrétoclo traclici<¡rral.

B. ¡r € (90.115; 92.385); o2 e (5.43;16.19).


9. ¿) /¿ € (20.0A;2r.13); o2 e (0.69;2.76); b) No se recomienda el cambio de variedacl.

10. a) p€(9.23;20.10);b)o2€(40.89;176.08); c) Noseintroducirálanuevalínea.

Sección 7.14

1. a) (0.69; 0.81); b) (0.702a;0.7976); c) (0.6711; 0.82se); d) (0.7108; 0.78e2).


2. a) Luis: 0.015, Juan 0.031, Paco, 0.062; b) Diana 0.4, Oliva, 0.2; c) 90To: C, 95To: A, 99To: B;
d) La mujer.
3. (0.5341; 0.6659).

4. 2177.

5. a) (0.688; 0.821), no se recomienda su uso; b) 311.

6. a) (0.6556; 0.80a3); b) 155.

7. a) (0.2475;0.3525); b) 276.

8. a) Bucnas: (0.865; 0.934), rnalas: (0.065, 0.134); b) No se aceptará; c) 4238.

9. (0.6587; 0.7319), no se puede introducir la nue'ua variedad.

10. E :0.0278 < 3%; si son estadístic¿rmente iguales.

11.97.84%.
12. a) (0.812; 0.928); b) Será más estrecho; c) Será más ancho.
13. a) p: 0.5, n:77;b) Se necesitan más estudiantes; c) Se necesitan más estudiantes.

Sección 7.16

1. (1.35;2.65), si tiene razón.

2. (4.033; 15.967). La afirmación es cierta.

3. (-0.68;6.68), son los mismos.


4. (20 - 61.08;81.08). En cualquiera de las dos ciudades.

5. (-3.93; 2.10), son iguales.


6. (0.93;7. \, varianzas iguales.
7. a) (0.635; 3.267), son iguales; b) (3.86; 10.14), es mayor el de las mujeres.
8. (-0.0211; -0.1956). No son iguales.
9. (-0.0339; 0.0539). Si afecta igual.
10. (0.0325; 0.2075). Si es eficaz.
435

Capítulo 8

Sección 8.6

1. a) H0: p':167, Ht F> 167;b) zo¡,":2.366, se rechaza.116.

2. zotts: -1.825. a) A a:0.05 se rechaza É10; b) A cr:0.01 no se rechaza -FIs.

3. a) znb":2.123, se rechaza 11¡, s€ debe recalibrar Ia balanza; b) a: 3.4%.

4' : -3; el costo me<lio no es 3.


zobs

5. Zobs : -4'47, se rechaza fl6-


6. a) zob": -3.16, se rechaza Ho; b) 0.0008.

7. zobs: -2.82. Con c:0.01 se rechaza Hs,ha descendido el número de clientes.


8. a) zoa": 2.38; con a : 0.01, ha cambiado la demanda; b) a : l.72To.
9. É :0'1963.

10. a) znu":4,|a afirmación de Ia socióloga es falsa; b) Pot:0 - 8485.

11. a) zob": -3.65, se rechaza Ilo; b) Pot :0.7088.

72. a) 1{6: ¡r : 18, HI F > 18; b) Rechazo Hs si t6t)s > ¿0.0b(10) : 1.812; c) toar:7.976, rechazo
Ho.

13. a) Son estadísticos; b) fIs: p : 26, HI Ir I 261' c) tobs :1.46, se rechaza Hs si t.6, > 2.069;
d) La edad de las novias no es diferente de 26 años.
14. tobs :3.378; cl periodo medio de espera es diferente a ocho días.

15' tobs: -I'4785, no se rechaza Ho.

16. tobs:2.56, se rechaza H6.


77. tobs : l'278, no se rechaza Hs.
18. tobs: -2'8247, se rechaza f16.
19. a) tou": -1.383; b) a:0.1; c) r:12.65 o s:0.973.
20. a) p. € (10.65; 18.36); b) úoo" :2,la ganancia si es menor que 18.5.
2I. a) Hs: o2 :15, H¡ o2 > 15; b) Se rechaza Ho sí y!"0" > Xfi.or : 42.98;
c) XZu":37.44, no se rechaza Hs. La varianza es igual a 15.

22. XZa" : 37.44, no se rechaza Hs.

23. XZa":26.33. La máquina si garantiza la precisión.

24- XZu":31'97, se rechaza -F16.

25. d) toar: -4.843, la media de la variable no es 51; b) XZu":16.84, la varianza es la uniclacl.


26. zr) .F16: p : 0.3, HI p < 0.3; b) Prueba unilateral; c) 2,,b" - -1.38, no se rechaza Hs.
proporción es igual a 0.3.
Capítulo 74. Respuestas

27. a) H0:P:0.2, H7:pt0-2;b) cv:0.04;c) zot,":7.75, aun nivelde cv:0.05 se rcchaza Hs.

28. zotts: -2.0785, se rechaza -É1¡.

29. zr¡bs : I.417, el medicamento B no es más efectivo.

30. zobs : -0.84852, no se rechaza H0.


31. a) zor'":0.771,Ia afirmación del proveedor es cierta; b) a:0.2386.

32. a) zou, - 1.16, a un nivel de a : 0.05 no se puede decir que la mayoría aprueba el endurecimiento
de las penas; b) a:0.123.
33. a) zou" - 2.26, se rechaza llo; b) 0 :0.2655.
34. a) zob": -1.854, Ia diferencia no es significativa, se debe solo al azar;b) 0.30554.

35. a) zour: 3.0; b) Si es significativo alLVo; c) Las observaciones provienen de una ley binomial, son
obtenidas aleatoriamente y el tamaño es lo suficientemente alto. Las hipótesis si se satisfacen.

Sección 8.10

1. Zobs:2.635; se rechaza fIs, las dos máquinas no envasan iguales cantidades.

2. Zobs : -L.434, no se rechaza Hg.


3. a) zob" : -2.572, se rechaza f1o; b) 0.005.
4. Zobs: -0.82; Ia media de la Universidad Nacional no es menor que la de Ia Universidad Técnica.
5. zobs : 3.677, se rechaza 116.
6. lroorl : 1.756; se acepta la igualdad de rendimientos académicos.
7. zobs :0.658' no existe evidencia.
8. zobs : 2.149, para a : 5To, se rechaza 116.
9. l"o,r"l : 4.205, se rechaza la igualdad. La norma si permitió el aumento del promedio de goles.
10. zobs:1.409, el consumo es similar.

11. tobs :3.735, si hay aumento en el nivel de plomo.

12. tobs :2.588; se rechaza fls, si hay evidencia.


13. tobs :2.544. EI número de surcos de los mestizos es mayor que el de los aborígenes.

74. a) lúoa"l :2.II5, el medicamento B es más efectivo; b) a = 0.025.

15' tobs:0.435. No hay diferencia.


16. tobs:2.885, para a : 0.01, se rechaza 11¡.

17. tobs:1.190. No se rechaza Hg, la diferencia no es mayor a un minuto.

18. tc,bs:3.939, la concentración a nivel del suelo es mayor.

19. lúo¡rl:3.254; se rechaza 11s, si es más lento en Ia noche.


20. tobs : 2.236; se rechaza -É16.
437
21' ltot,"l : I.29, no existe diferencia significativa en los ni'eles de
colesterol.
22' ltot'.rl:7'79, a nivei b 7o,Ios dos métodos dan ig'ales resnltaclos.
23. tobs: -2.494, se rechaza /J6.
24. a) Fou,r:1.86, las varianzas si son iguales; b) Nivel de
significación a :20To.
25' a) Fra" : 3'33, las varianzas no son iguales. La variabilidad
puede atribuirse a Ia máquina 1.
26. a) Foa, : 2.074, Ias varianzas si son iguales; b) úr¿" : 3.864, las dos estaciones no pronostican
temperaturas iguales.

27. a) Fo*:2.8, las varianzas son diferentes; b) tobs:4.44. Si es más efectivo.


28. a) Fou":2.945, se puede asumir varianzas iguales; b) úoa":0.5g97, no se rechaza Hs.
29' a) Hs: pr - p210; Ht pt - pz > 0; b) Zobs:3.193; c) para a : 0.0b se rechaza rrs.
30. l"ou"l:7.275; no se rechaza Hs, ias tasas de desocupación son iguales.
31'
^) l".u"l:2.041; no se rechaza Hs,los 2 canales tienen igual nivel de sintonía; b) 0.0a1.
32' a) zob": l'l2g,las dos empresas entregan resultados similares;
b) a: 0.256.
33. rechaza ¡10; b) p: O.0IT4.
^) l""u"l -
2.1I, se
34' a) Las proporciones muestrales se calculan a partir de dos
muestras seleccionadas de manera
aleatoria e independiente, de dos poblaciones binomiales,
cuyos tamaños son suficientemente
altos para que la distribución muestral sea aproximadamente
norrnal; b) 116: pt pz < 0.2;
Ht: Pt - Pz ) z"u": 0'833; c) Para a : 0.05, el incremento en el hábito á" -
!'f;
mayor que el20T0. r.,irr-"" *
óo. Zobs :2.619, se rechaza Hg.

36. zobs:1.368, la diferencia es menor que el 18 %.

Capítulo g

Sección 9.3

1. XZa":1,.654, no se rechaza Hs.


2' XZu":0'776' a un nivel de significación del r7o seacepta r{6. La moneda
es simétrica.
3. XZu" : 7 .324, se rechaza fI6 .

4. XZt ,: 3.021, no se recha za Hs.

5'
") xZu"6):19.009, xZu"Q):16.238; b) La empresa T dio un mejor resultado.
6' x1a":0.656' los clatos siguen ras probabilidades teóricas.

7' a) xlu": 12'346, se acepta -116. Los nútmeros si aparecen


uniformemente; b) a:0.1945.
8' XZa":2'699. Ei nirmero de hijos varones sigue una ley Bin(2,0.5).
9. XZu": J.I9. El lrimero de hijas sigue una ley Bin(b,0.b).
438 Capítulo 74. Respuesúas

10' XZu":4' Se acePta f16.


11. i:L.027, X?oar:5.506, no se rechazaqve el núrmero de goles sigue una ley P(7.027).

12. i:2.642, X?0":7.737, no se rechazaque el número de Ilamadas sigue una Iey P(2.642).
13. XZa" :17.88. La temperatura no está uniformemente distribuida.
74. XZa":20257; no se acePta IIs.
15. l: 1/1000, XZa":14.53. La duración no sigue la ley t(1/1000).

16' XZu":4'9; se acePta I/e'


17. XZa":5.6L4; con o : 0.05, si hay asociación.

18. XZu":122.33, no son independientes.


19. u) xZu,: I.528 b) x?"a": 1.528; c) No se rechaza IIs.
20' XZa": I'726; se acePta f/e.
27. u) xZa": 30.032, se rechaza Ilo; b) zobs:3.146, se reÁara FIs.
22' XZu": Ig'L2, se rechaza .[/s.
23' XZu": 4'876, se rechaza Ils'
24' b) xZa" : l'L25; se acePta f/s'

25' XZu":35'031; se techaza Hs.

Sección 9.6

1. a) pot'":0.1719; b) ?ra" :42.5' No se rechaza H¡.

2. a) 2poa": 0.3438; b) Tou" : 20.5. No se rechaza Hs.


3. robs :12, no se rechaza f/g.

4. a) rou":9, no se rechaza la aleatoriedad; b) 2pob":0.00028, se rechaza fIs.


5. a) rour:5, no se rechaza Ilo; b) 2pob":0.388, no se rechaza Hs.

6. Dobs:0.0268, no se rechaza Hs.

7. a) Dou": 0.233, se acepta Ho; b) 2pob":0.754.

8. a) rou":6, se acepta flo; b) Dobs:0.324, se acepta Ho;c) gou":1.907, no hay valores atípicos.

9. a)roa":5,seaceptaflo; b) Dob":0.147,seacepta Ho;c)Tobs:33,noserechazaIl¡;


d) goa" : L-767, no hay valores atípicos.

10. a)rou":4,norechazollo; b) Dob":0.1766,norechazo Ho;c)Tobs:0.344,norechazo11¡.


11. u) ,otr:7, no se rechaza lJo; b) Dobs:0.287, no se rechaza Hs; c) pot": 0.1938, no se rechaza
Ho.

12. a) rou": 6, no se rechaza 110; b) Dobs:0.226, no se rechaza Hg; c) Toa": 16, no se rechaza ,F16.
439

13. gobs : 77.264, si es un valor atípico.

14. r<I4lor)183.
15. 2pobr:0.289, los dos laboratorios entregan resultados iguales.
16. Prueba de los signos: 2pot":0.109, se acepta //6, Prueba de Wilcoxon:To¿,":6,'se rechaza Hs.

17. Uobs:73, se acepta la igualdad de niveles de contaminación.


18. Uobs:11, se acepta la igualdad de velocidades.
19. Uobs:4J, los dos tipos de lámparas tienen la misma duración.
20. a)roa":T,seaceptaIlo; b) Dobs:0.2444, seacepta Ho;c)Uobs:40,seaceptaIls.

21. a) Muestra X: ro6": 5, no se rechaza fIg, MuestraY: ro6":6, no se rechaza Hgl


b) Muestra X: 2po6, : L, Tob, : 4, to se rechaza fI¡, MuestraY: 2po6" : 0.754, Tobs :5, no se
rechaza HO; c) Uob" :25.5, se rechaza Hs, la mediana de X es mayor que la de Y.

22. r" : 0.818, si están correlacionadas.

23. rs:0.429, no hay asociación.


24. r" : 0.864, se rechaza .F16.
25. a) Prueba de los signos: 2pob" : 0.344, Prueba de Wilcoxon: To6": 9, se acepta 11¡;
b) r" : 0.018, no están correlacionadas.

Capítulo 10

Sección 10.9
1. 0 : 2.852 *3.704r,r : 0.948.
2. a) i:332.11* 0.65r; b) r : 0.993; c) tou": t6.895;
d) E(r) e (33e.63;344.09), f, e (335.e7fia7.75).
Fuente g.l. SC MC F
3. a) ó6 : -90.2, br :9; c) Regresión 1 810.0 810.0 54.24 d) 12 :0.948.
Residual 3 44.8 14.933
Total 4 854.8
4. b) g : -7.489 -10.r44r; c) F,¿" : 17.83; 12 :0.69; e) No.
Fuente s.l. S.C. M.C. F
5. a) Cantidad :18.976 +7.27I Tiempo; b) Regresión 1 37.01 37.01 79.73
Residual 4 1.857 0.464
Total corregido 5 38.686
c) 0o < (15.50;22.45), B1 e (5.01;9.53).

€ (-3.55;11.258 e (-0.021;1.031); c) 12 : 0.64,

tobs:2.667; d) t(12) € (0.06; L9.77); e)


440 Capítulo 74. Respuesúas

7 b) b c) Sí, Fobs : 29.87; d) 12 : 0.BBB, tobs : 74.57; .) E(azz) e (88.09;110.43);


f) aa 43).

8. a) G 5.245 + 2.746 Préstamos; b) Sí, r: 0.934;


Fuente g.l. S. C. C. M. F
Regresión 1 1735.53 1735.52 41.33 d) i(123) :
c) 38.70, a023) e (29.54:47.89).
R,esidual 6 25I.97 4I.996
Total 7 1987.50
9. a) A : 70.87 + 35.75r, r : 0.735; : II.47 - I.07r, r : -0.848; c) a:459.12-34.45r,
.Fue.-+te.. .S.1, - *SC MC F
: Regresión 1 156 965.6 156 965.6 32.63
r -0.896; d) Residual 8 38 478.9 4809.9
Total I 795 444.5

e) Éo € (366.7;551.5), Bt e (-487.35;-20.54); r) e(y) e (21e.0e;320.25).


10. b) b0:4.799, br:0.595; c) (44.53;69.73); d) (30.09; 8a.I7); e) r :0.569, r2 :0.323.
Fuente g.l. S. C. C. M. F
Regresión 1 400 400 16.66
11. a) 0: 5 + 0.5r; b)
Residual 18 432 24
Total 19 832
E(yoo) e (32.36; 37.64), yao e (24.38;45.63).
")
Fuente g. L S. C. C. M. F
12. a) g 8.02r; b) 12 : 0.946; c)
Regresión I 229867 229867.0 176
= 115.25 - Residual 10 13 061 1306.1
Total 11 242928

Fuente g.l. SC MC F
Regresión 1 3.210 3.210 73.2I
:
13. a) En los dos casos se rechaza I/o; b) Residual 10 0.439 0.044 c) 12 0.88.

Total 11 3.649

Fuente de variación g.l. SC MC F


14. a) Regresión 1 240 240 12
b) Se rechaza Hs.
Residual 7 I40 20
Total 8 380
15. a : e-2+3r, r2 : L.

0'0-136.
16. a) ¡:6.66g7¿o.oso7;b) 0:0.0799 - I r]:0.834, r?:0.gro.
17. al ¡:3.0348 - "jou, Lt)12 :0.9614.

18. u) 0 :15u 1'0588' b) t: -12 + 20.8r; c) rl:0.881, ri : 0.938.

19. b) : 0.5113, ú :0.27473; c) EI modelo es adecuado pues 12 :0.916.


b0

20. b) y: exp(4.0657+ 0.1983r); c) 12 :0.984; d) 0:258; e) La predicción no es buena.

2L. ln ? : -7.5I3 -F 1.5 ln r o T2 : 2.9805 x 10-713.


44L

" : ------:--:-----
1
'22. 'll t'2 :0.973.
-.
0.0852 -F 0.0375:r:

2:1. b) 0: -49857*36357r; c) r'2 :0.811;(t) t: 27559:r;e) y: cxlr(9.83f 0.:3352); f) t:2 :0.901.

Capítulo 11

Sección 11.9

i a) A: 742t4
+ * Urr, b) X'X : X¿Y: ( i, ); c) s2:0 602;
TS TSr,

d) R' : 0.2396, RZ:0.0875.


/ zs:z+'¡
2. a) b: I z+.szz I'ul a:202.8;c) R2 : 0.920, RZ :0.866.
\ 60.218 /
/ \ FuenteI. SC MC Fg.
-+o.tz Regresión 2 24.22 I2.I 3.42
3. a) b:{ r.sz f;u) fi'?:o.6eb; c)
Residual 3 10.62 3.5 se acepta 116;
\ 4.587 ) Total 5 34.84
d) ¿0: -L.562, tt:1.447, úz:1.085. En los 3 casos se acepta.Fls.

/ -7.6e0 \
4. a) b: ( o.oso I po. (8.a7;8.09), B, e (0.0J2;0.r47),B, e (-0.3t;r.245);h) Ir2 :0.961,
\ 0.607 I

RZ:0.92I; c) d) 0: 14.23,E(yr) e (1L44;L7.02),

ye e (8.4;20.02).
a) G:1.083+0.011+ 10.749F;ü R2:0.856, RZ:0.76t, s2:303.99; c) (-0.055; 0.07a);
d) Solo el tamaño familiar; e) 3.5; f) Fot":8.945, se acepta Ho, anivelsTo.
6. { f :92.074 - 0.576L r 0.r2A; b) 16.33; c) R2 :0.948, RZ:0.9r4;
Fuente e. l SC MC F
Regresión 2 13.521 6.76 27.438
d) 2 e) Mejor modelo: T :32.337 - 0.529L.
Error 0.739 0.246
Total 5 14.260

7. a) totr,o - 5.05, tobs,t :2.54, to6r,2:2.67, to¡r",3 : 0.90, tobs,4:1.11; b) 0@i : 12.917.

8. d) i : 14. 186- 2.0 4Ir 1 -0.53121 b) Fot


"
: 6.918; c) 0t e (-2.968; -L.t74), B2 e (-1.654; 0.59a);
d) fi2 :0.634.

9. { D :
-125.56 - 4.71u i 0.046u2; b) R' : 0.948;
Fuente gl SC MC F
Rcgresión 2 43396.4 21695.2 45.37
c)
Error iJ 2391.1 478.2
f,'t:rl ' : t {..ri17.5
442 Capítulo 74. Re.spuesúas

10. a) N'loclelo cuadrático; b) f : 24.14-'2.l0Al *0.2L1\4¿; c) Fnu":9.93;


cl) /,6.,r¡r" : 18.63, Lt,ob" : -4.46, L.¿,,,t s: 4.'.J2.

i1. a) Tiempo: 10.55 -2.02 Cant. +0.199(Cant.)2;b) f :5.87; c) R2 :0.853, R.,2,:0.794.

12. a) Concentr:103.79 - 8.29 Temp. f 0.50(Temp.)2;


-".-''.,*-
-Fuente de
e. l. SC MC F
varlaclon
b) Regresión 2 257I.25 7285.62 40.49
Residual 5 158.75 31.75
Total 7 2730.00
c) Si, modelo final: Concentr :4I.334+ 0.236(Te-p.)2.
13. Sexo: 1 si es hombre; 0 si es mujer. a) Sueldo : 7.997 + I.147 Experiencia *1.748 Sexo;
b) F"¿" : 9.8; c) to,ou" - 4.48, tt,ob" : 3.64, t2,o6" : 1.61; d) Puede decirse que no existe
discriminación.

t4. Sexo: 0 si es hombre; 1si es mujer. { A:4.63+0.911Sexo-0.223Aio; b) ,R2:0.817


F\rente s. l. SC MC F
Regresión 2 1.826 0.913 11.15
c) úo,o¿" : 17.90, tt,ob" : 4.4L, t2,o¡r" : -2.58.
Error 5 0.409 0.082
Total 7 2.235

15. Veneno: A:0, B:1. a) Sup:5.226+0.556 Edad-I.971Ven; b) Fobs:6.55, R2:0.652;


c) to,ut": 6.33, tr,ob":1.88, ú2.o6" : -3.26; d) Sup: 6.56 - 1.86 Ven.

Capítulo L2

Sección 12.5
1. : 31, ECM : 186.9; d ñr: 30.2, ECM : 19b.b; d) ñ, :297, ECM :279;
u) ?tt

")
lr; : 33.7, ECM :2gg; f) ?t : 34.5, ECM :280.2;
e) ñz: 18.7, ñ, : 42.8, ?1s :55, ?zo :23.g, ECM : 126.3.
2. b) ?zu : 57.5, ECM : 172.5; ü ?zs: 56.8, ECM :153.7; ¿) ?ru: 47, ECM :253.1;
59.7, ECM :243.7; il ?rt :57.4, ECM :224;
") %s -
e) ?2s:75,r, ?ru:54.6, ?27: 50.0, ?rr:71.9, ECM : 124.3.
3. b) ?tu - ll7, ECM : L32.7; ") ?rc - I27, ECM : 63.7; ¿) ?ro : 116.2, ECM -- t43.7;
?ro : 118..2, ECM : 39.8; f) ?tu : t26.6, EcM : 83.8;
")
s) ?ro :125.0, ?rr:L27.5, ñr: 133'4, ECM: 157.5.

Capítulo 13

Sección 13.3
1. a) ¿r € (81.23; 87.r7), r € (32 493; 34 867);
b) 121.
443

'). a) (73¡J 153;777 017); l>) t9')

3. a) (326 523;361 757); tt) 24.

4. a) (83 48:85.32); b) 10i.

5. a) @.34;4.66); b) 89; c) (6301;6920).

6. a) 73; b) 196; c) @7.a8,48.52).

7. a) ¡r e (115.aa;134.56), r e (32323;37 677); b) 110.


B. a) (0.251;0.410); b) 153; c) 1,64.

L a) (0.238;0.370); b) (i.) 400, (ii.) 461.

10. a) (0.2a;0.36); b) 7684; c) 8160.

11. a) (0.272;0.408); b) 1228; c) t779.


12. a) 113; b) 50; c) 351; d) 351.

Sección 13.5

1. a) r e (2558 604;2587396); b) p e @26.a3 43t.23).

2. a) (69.4a;72.11); b) (8126172;8438556); c) rr1 : TL2:7¿t: 31; d) n1 : B, n2:23, ns:45;


e) n1 : 10, n2:24, nz:4I.
3 a) p e (102.61;104.48), r e (492512;501488); b) nt: n2: 65; c) nt :70, n2:65; d) n1 : J3,
nz:79.
4. a) (608289;617601); b) nt : n2 : n3 : 79; c) n1 : 93, n2 : 42, n3: 86; d) nt : 70, n2 : 41,
n¡ : 101.

5. a) (L632.79; 1868.75); b) (1061313; 1 21a687); c) n1 : n2 : n3 : 25 d) n1 : 9, n2 : L3,


ns:34.
6. a) p e (725.29;763.38), r € (768812;809188); b) No; c) u: n2 - rL3:149; d) nt: I82,
nz : 154, ns : 93; e) n1 : I90, n2 - l2l, ns : I07.
7. (0.34e;0.455).

8. a) (0.4209; 0.5173); b) no; c) n1 : nz : I45 cl) n1 : I48, n2 : I42; e) ny : L47, n2 : I43.

9. (30.e8 %;3e.08%).

10. a) (0.5705;0.6823); b) n1 : n2: ?r3: 378; c) n1 - I57, n2 - 469, nz:352; d) n1 : 173,


nZ:502, 7:'¿:302.
11. a) (21 .48%,;31.19%);t>) 6292; c) 5972; d) 5976.

72. a) pe (0.5a 7;0.6969); b) pe (5972;6202);c)ny:rL2:ttr:58; d) nt:84,n2:35,ns:56;


e) z1 : 86, n2: 38, ns : 51.
444 Capítulo 74. Respuesúas

Sección 13.7
1. rr) r€ @756a6;a8$54); b) p€ (3.171;3.229).
2. a) r € (889 546; III9228), p e (277.98;349.76); b) 28.
3. a) (7.31;11.64); b) 98 clases.
4. p e (0.1;0.3).
5. a) (0.2831;0.3733); b) 25.
6. a) (0.0677; 0.2448); b) (115; aI6); c) 79.
7. a) p,¿ e (45.56; 85.12); b) pg e (20.32;37.L2); c) p¡ € (35.38; 106.89); d) p e (0.0272;0.2228);
e) no:26, n6:25, nc: 29. El tamaño óptimo es de 29 familias.
Ta blas Estad ísticas

1. Probabilidad acumulada de la ley de distribución normal estándar.

2. Probabilidad acumulada de 1 - AQ) para la ley de distribución normal estándar.

3. Puntos porcentuales de la ley de distribución ú de Student.

4. Puntos porcentuales de la ley de distribución X2.

5. Puntos porcentuales de la distribución del número de rachas.

6. Puntos porcentuales de la ley de distribución F.

. Nivel a :0.1.
. Nivel a : 0.05.
. Nivel a : 0.025.
. Nivel a : 0.01.

7. Puntos porcentuales de la distribución de los rangos signados de Wilcoxon.

8. Puntos porcentuales de la distribución de la prueba de Kolmogorov-Smirnov.

9. Puntos porcentuales de Ia distribución de la prueba de Grubbs.

10. Puntos porcentuales de la distribución del coeficiente de correlación de Spearman.

11. Puntos porcentuales de Ia distribución de la prueba de Mann-Whitney.

445
446 Tablas Estadísticas

Tabla 1. Probabilidad acumulada de -crc a z

para la distribución normal estándar

z .00 .01 .02 .03 .04 .05 .06 .01 .08 .09
-3.5 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002
-3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
-3.3 0.0005 0.000s 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
-3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.000s 0.0005 0.000s
-3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007

-3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.00r1 0.0011 0.0010 0.0010
_to 0.0019 0.00r8 0.0018 0.0017 0.0016 0.0016 0.001s 0.0015 0.0014 0.0014
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
_7',l 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
-2.6 0.0047 0.004s 0.0044 0.0043 0.004r 0.0040 0.0039 0.0038 0.0037 0.0036

_t< 0.0062 0.0060 0.00s9 0.0057 0.00ss 0.0054 0.00s2 0.0051 0.0049 0.0048
-2.4 0.0082 0.0080 0.0078 0.007s 0.0073 0.007r 0.0069 0.0068 0.0066 0.0064
-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
-2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0r16 0.0113 0.0110
-2.1 0.0179 0.0174 0.0170 0.0r66 0.0162 0.01s8 0.0154 0.0rs0 0.0146 0.0143

-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.02s6 0.0250 0.0244 0.0239 0.0233
-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.037s 0.0367
-1.6 0.0s48 0.0s37 0.0526 0.0516 0.0505 0.049s 0.0485 0.047s 0.0465 0.04ss

-1.5 0.0668 0.06s5 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.057r 0.0559
-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.073s 0.0721 0.0708 0.0694 0.0681
-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
-1.2 0.1151 0.1131 0.tttz 0.1093 0.1075 0.10s6 0.1038 0.r020 0.1003 0.098s
-1.1 0.13s7 0.133s 0.t314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170

-1.0 0.1s87 0.1562 0.1s39 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.t7tt 0.1685 0.1660 0.1635 0.1611
-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.r867
-0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2s14 0.2483 0.24s1

-0.5 0.308s 0.3050 0.301s 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
-0.3 0.3821 0.3783 0.374s 0.3707 0.3669 0.3632 0.3s94 0.35s7 0.3520 0.3483
-0.2 0.4207 0.4168 0.4129 0.4090 0.40s2 0.4013 0.3974 0.3936 0.3897 0.3859
-0.1 0.4602 0.4s62 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
-0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
447

Tabla 1. Probabilidad acumulada de -oo a z


para la distrit¡ución norrnal estándar(continuación)

z .00 .01 .02 .03 .04 .05 .06 .0't .08 .09
0.0 0.5000 0.5040 0.5080 0.5120 0.s160 0.5199 0.5239 0.s279 0.s319 0.s3s9
0.1 0.5398 0.5438 0.5478 0.s517 0.5557 0.s596 0.s636 0.5675 0.5714 0.5753
4.2 0.5793 0.s832 0.5871 0.5910 0.s948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.691s 0.69s0 0.6985 0.7019 0.70s4 0.7088 0.7123 0.715'l 0.7190 0.7224

0.6 0.7257 0.7291 0.7324 0.7s57 0.7389 0.7422 0.74s4 0.7486 0.7s17 0.7549
0.7 0.7580 0.7611 0.'t642 0.7673 0.7704 0.7'734 o-7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.799s 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.836s 0.8389
1.0 0.8413 0.8438 0.8461 0.848s 0.8508 0.8531 0.85s4 0.8577 0.8s99 0.8621

1.1 0.8643 0.866s 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.911s 0.9131 0.9147 0.9162 0.9177
74 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.934s 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441

1.6 0.9452 0"9463 0.9474 0.9484 0.949s 0.9505 0.9s15 0.9525 0.9535 0.9545
1.7 0.9554 0.9s64 0.9573 0.9s82 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.96s6 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
7.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.97s6 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817

2.1 0.9821 0.9826 0.9830 0.9834 0.9838 {1.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.99r3 0.9916
2.4 0.9918 0.9920 0.9922 0.992s 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
1< 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99s2

2.6 0.9953 0.995s 0.9956 0.99s7 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
,, ,|
0.996s 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.998s 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990

3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.999s
3.3 0.999s 0.9995 0.9995 4.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9991 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
í00.0"0 f,BSO'0 TOBB'B r00ü'0 i0$0'0 i000"0 t0ü0's [000'0 f,080-0 itsBB'$ It
r000"CI gB$B'S s$0fl'B r-üfl0'0 ESfl0'fl t-s00"0 b-ü0ü^s 90'0.0'0 f&80'0 f0$s'0 y'ü
f0ü0'0 t&08'0 F000'0 F00$'s F$0ü'B üü00'0 f$ú8'0 s000'0 !=008"0 s0ü010 IL
ss00'0 s8s8'8 ss0g's 900s'0 90üo'$ 9ü00'0 9SSS"0 90s0.0 ¿üB*"0 ¿000"0 rE
¿n00'0 ¿ES0'0 8S0B'S 8000'0 8ü00"$ -"'fl00'0 6CI0CI'0 60$0"s 60üts"0 0{0ü"0 1"r-

0T0B'0 0T00'0 1r0s'8 iI00'fl lTtl8"0 g{00'0 t-Í98'8 r-I&8',0 s'L-


1TOfl'ü rr0s"8
FT0ü'ü FTB$"$ sI0fl'0 sIü0'0 9I00'ü irü0"s 8rü0'0 sraS'ü 6I08"0 6¿.
9rss's
6r00'ü fl'¡,ffs'8 r¿09'* Ttsg'0 ttüfl's r-i00"0 r-ts0 il Fi00"0 s[88'0 9i0B'0 fL
9t00'n ¿t00'0 8r00'B 6ilS0'8 sr-0ü'B If0s'fl ír-00R sgo0'0 rt-Ee'0 st-98'0
9[08'0 l[80's sL-ff0'B 6f0$'s sFo{l"B If 00'fl r-F00'0 f t00'0 EFÜB'O ¿F00'0 9"í

sf 00'0 6F80'S IEOE'O +Sü0'0 ügil0'B 590ü"0 ¿s0s'0 6t 0 0'0 09sB'CI [908'S _L-'t

F900'0 9988"0 s900'8 6900'0 rtfl0'g f¿00'0 9i&0'0 8i00'0 BE$F1O rgB0's Tt-
ISÜB'O i.qBB'0 6S0B'ü T6S8'0 9600'0 6608"fl ¡0r0'0 rsTB'0 i0T0'0 tr.
0TI0's T-T T B'O 9II0'0 üT I0'ü ''6Sü'S
i¿rfl'0 6rTS'0 ;gTCI.O I r-10"s 6EIS'tl
-r-íT0"tl
r-tI['ü 9FTg'0 üs1$'8 F918'g üEIfl'$ ísIs'$ 99rü"ü 0f.I0"s F¿{B'D 6¿r0'0 LL'

t8T0'0 8SIfl'B i6I0'0 ¿6rfl'8 isi0'ü iflr0"0 [{i0'fl iIi0'0 crrU U 8iiü'ü 0'r
filo'0 6ürs'0 }F¡C'B BSifl'o 95Eü'S ¡9¡0"0 89iG'0 ilí0"0 TStF'0 i8i0's ó1
F6tü'B TBr-0'0 r0t0'0 FIüO'8 ;Ir-$'ü É¡r-0'cr 9Er-0"0 f f r-0'0 I9t0'CI 6Sr8'CI *'r
¿9t0'0 gif0"0 f8Lfl.B ¿6ts'0 r0?0'0 6üf0"0 BIFO^O ¿[rCI'I 9gFD^ü 9trF8"0 I-I
!EFÜ'O S9FÜ'Ü 9¿Fü'0 EStü'0 96f fl.0 -cfl9fl'0 9rsCI'$ 9iE0'0 Lr-ECI'0 8rE0'8 9"1

6950'D TigB,O iggB'B rÉtü'0 sü9fl'B *T90'0 CI99ü ü E'90"0 s59B"S s99S"ü
T890'S F690'0 s0¿0'B E¿¿O'O sr-¿fl 0 6f;¿0'0 F9¿0'0 8ii0"0 r-6¿B'S 8088"0 t"{
t-t80"0 8r-88'0 r--c8s'B é980'E s88fl'+ I ÜóO'O 8tú0'0 1.960"0 TE681S s9és'ü &L
!8Éfl'0 I]BBT"g OTEI'B 8r:SI'& 9SSr'0 E¿OT"O r"düT'fl [T IT'O IgET"S T9II'O 7'T

0¿T r'0 &6{t'ü 0Tlr'$ 0t-i,r.I'0 TSTT'B Ii;I'S i6rT"$ FTI-T'O sgr-T'0 ¿sr-T'0 T"T

6¿b-I"0 1BFI'0 giFl'(} 9tF{'0 69FilS r6FT'0 sn9z'0 útgr"0 egsT'0 i85r"0 0'{
ITFT'O grl9I'0 099r's E39r'0 II¿T-8 917tr'0 t9¿r's É8rT"0 rlst'0 I'gT'ü 6'S
rssr.0 F68t'ü ;iÉE.B 6F6{'S ¿¿6r'ü sfl0i"0 btní'0 T9üi'0 ü69r"CI 6ETt'$ 8'B
siTi'$ -l-,¡- LL U 90[t'B 9ft['0 99t['0 96'r'.['S ¿f,rrf,'0 8E$iT 68r-9"ü 0¿f'9"ü ¿o
TSf ['0 t-8hí'ü FIgf,'B gtgrg 8¿Ei'S ET9['0 t-'9E"0 919f,'CI 68tt'0 f,t¿i'CI 9'ü

9i¿i'0 8r8t'0 r-F8r'S ¿i8í'0 ¿t6r'B 9t6i's n86¿R sr0f'0 sE$r-'0 s80r-'0 s'B
TTIg'O 9gTt'0 í6rt'0 8t;t'0 F9trg ü0[-9"0 9gEg'o í¿ür-"0 60Fr-'0 9Frr-'0 f.s
[8Fr-'8 0i:l,f'ü t 99f'8 fr651-"g it-9b-"ü 699r-'0 rs¿D'ü 9fl.ü-"$ t-8¿b-10 r[8s'g g"s
6!'8S'ú ¿689'0 9S6!"8 f¿6üg gIÜF'$ iE0t'0 üÉüf'8 6iTf'0 tgTF.ü ¿0f,.ü'r0 r0
itít'B 98ti'ü s¿si'B 19r?'B F0Ft's r*}ti'0 r-stt"0 ¡¡gF'0 [95F'ú i09f "0 {'0
rr9F"g rs9F'0 rt¿t-B T9¿i'0 IOBI'B 0tst'0 0889'ü 0¡6''0 096r'0 00Bg'0 o'0
60' s0 ¿0' 9S' 90' t0' t'8" i0' tB' 08' 7

'Jtrpue+sa IEurJou ugrrnqrrlsrp e¡ e"red

?)O - 1 e.red epelnurnc€ p€prlrqeqord 'Z BIqBJ

serr+slPefsg selqeJ 8W
{4v

Tabla 3. Puntos porcentuales de la distribución ú-Student

Nivel de probabilidad (o)


0.4 0.3 0.2 0.r s 0.1 0.0s 0.02s 0.01 0.005 0.002
I 0.32s 0.721 L3'.76 1.963 3.078 6.314 12.706 31.821 63.656 12',7 .32t
1 0.289 0.617 1.06 t 1.386 r.886 2.920 4.303 6.965 9.925 14.08c)
3 0.271 0.584 0.978 1.250 1.638 2.3s3 3.182 4.54t 5.841 7.45 r
4 0.271 0.569 0.941 l .190 1.533 2.132 2.776 3.141 4.604 5.59R
5 0.267 0.s59 0.920 1.156 1.4'76 2.01s 2.57 t 3.365 4.032 4.1i)

6 0.265 0.s53 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.3t7
7 0.263 0.549 0.896 l.l 19 1.415 r.895 2.36s 2.998 3.499 4.029
8 0.262 0.546 0.889 l.108 1.397 r.860 2.306 2.896 3.355 3.ti-l.l
9 0.261 0.s43 0.883 I .100 1.383 1.833 2.262 2.821 3.2s0 3.690
10 0.260 0.542 0.879 1.093 1.372 1.812 2.228 2.764 3.r69 3.581
1'l 0.260 0.540 0.876 1.088 r.363 1.796 2.201 2.718 3.106 3.497
t2 0.259 0.539 0.873 1.083 1.356 1.182 2.179 2.681 3.055 3.428
l3 0.2s9 0.53 8 0.870 1.079 L350 1.77 | 2.t60 2.650 3.012 3.372
t4 0.258 0.537 0.868 1.076 1.345 t.761 2.145 2.624 2.977 3.326
15 0.258 0.536 0.866 1.014 1.341 1.753 2.131 2.602 2.941 3.286

16 0.258 0.535 0.865 I .071 1.337 1.146 2.t20 2.583 2.921 3.252
77 0.251 0.s34 0.863 1.069 L333 1.740 2.t10 2.567 2.898 3.222
18 0.251 0.534 0.862 ll067 r .330 1,734 2.101 2.5s2 2.878 3.19i
t9 0.251 0.533 0.861 1.066 ll328 1.729 2.093 2.539 2.861 3.17 4
20 0.257 0.s33 0.860 1.064 1.325 t.t25 2.086 2.528 2.84s 3.153

21 0.257 0.532 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.1 3-i
)) 0.256 0.532 0.858 r.06r t.321 1.7t7 2.014 2.508 2.819 3.1l9
23 0.256 0.532 0.85 8 1.060 r.3r9 1.114 2.069 2.500 2.80'7 3.104
24 0.256 0.531 0.857 1.059 1.3t8 1.71I 2.064 2.492 2.197 3.091
t< 0.256 0.53 r 0.8s6 1.0s8 1.316 1.708 2.060 2.485 2.787 3.078

26 0.2s6 0.531 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.061
aa 0.256 0.531 0.85s 1.051 1.314 1.703 2.052 2.473 2.711 3.051
28 0.256 0.530 0.855 1.0s6 1.313 I .701 2.048 2.467 2.763 3.041
29 0.256 0.530 0.854 I .055 l.3l I |.699 2.045 2.462 2.756 3.038
30 0.256 0.530 0.854 1.055 I.310 L697 2.042 2.457 2.750 3.030

35 0.255 0.529 0.852 1.052 1.306 r.690 2.030 2.438 2.724 2.996
40 0.255 0.529 0.85 r 1.050 1.303 1.684 2.021 2.423 2.704 2.971
45 0.255 0.528 0.850 1.049 1.30 t 1.619 2.014 2.4t2 2.690 2.952
50 0.255 0.528 0.849 L047 1.299 1.616 2.009 2,403 2.678 2.937
60 0.254 0.527 0.848 1.045 1.296 1 .611 2.000 2.390 2.660 2.915

70 0.254 0.521 0.847 1.044 1.294 1.667 t.994 2.381 2.648 2.899
80 0.254 0.526 0.846 t.043 1.292 t.664 1.990 2.374 2.639 2.881
90 0.254 0.526 0.846 1.042 1.29t t.662 1.987 2.368 2.632 2.878
100 0.254 0.526 0.845 ]l042 1.290 t.660 1.984 2.364 2.626 2.871
oo 0.615 0.525 0.615 1.037 1.282 t.645 1.960 2.327 2.576 2.808
450 Tablas Estadísticas

Tabla 4. Puntos porcerrtuales cle i¿r clistlil-¡ución.ii-cuadrado

Nivel de probabilidad (o)


0.995 0.99 0.975 0.95 0925 0.9 0.1 0.07s 0.05 0.025 0.01 0.0c5
I 0.00 0.00 0.00 0.00 0.0 r 0.02 2.71 3.11 3.84 5 .02 6.63 7.88
2 0.01 0.02 0.05 0. t0 0 16 0.2t 4.61 5.18 5.99 7.38 9 2t 10.60
3 0.01 0. r I 0.22 0.35 0.41 0.58 6.25 6.90 7.81 9.35 I1.34 t2.84
4 0.21 0.30 0.48 0.11 0.90 1.06 1.18 8.50 9.49 11 .t4 13.28 r 4.86
5 0.41 0.55 0.83 l.l5 1.39 I.61 9.24 r0.01 11.07 12.83 1 5.09 r 6.7_s

6 0.68 0.87 1.24 1.64 1.94 2.20 t0.64 11 .41 12.59 14.45 l6.8 I 18.55
7 0.99 1.21 1.69 2.11 2.53 2.83 t2.02 12.88 14.01 I6.01 18.48 20.28
I 1.34 1.65 2.18 2.13 3.14 3.49 13.36 14.21 1 5.5 1 11 .53 20.09 21.95
9 1.13 2.09 2.10 3.33 3.18 4.17 t4.68 15.63 16.92 19.02 21.61 23.59
10 2.16 2.56 3.25 3.94 4.45 4.87 15.99 16 97 18.31 20.48 23.2t 25.19

lt 2.60 3.05 3.82 4.51 5.12 5.58 t].28 18.29 19.68 2t.92 24.73 26.16
12 3.07 3.5'7 4.40 s.23 5.82 6.30 18.55 I 9.60 21.03 23.34 26.22 28.30
l3 3.57 4.t'l 5.01 5.89 6.s2 t.04 19.81 20.90 22.36 24.74 21.69 29.82
t1 4.07 4.66 5.63 6.57 1.24 7.79 21.06 22.t8 23.68 26.12 29.14 31.32
l5 4.60 5.23 6.26 1.26 1.91 8.55 22.31 23.45 25.00 21.49 30.58 32.80

t6 s.l4 5.8 r 6.91 1.96 8.7 r 9.31 23.54 24.72 26.30 28.85 32.00 34.21
l7 5.10 6.41 7.56 8.67 9.45 10.09 24.',71 25.97 21.59 30.19 33.41 35.12
l8 6.26 Ljt 8.23 9.39 10.21 l0 86 25.99 27 22 28.87 3 t .53 34.81 31 .16
l9 6.84 1.63 8.9 r 10.12 10.91 11.65 21.20 28.46 30.14 32.8s 36.19 38.s8
20 7.43 8.26 9.59 0.85
I I 1.73 12.44 28.41 29.69 31 .41 34.t1 31.57 40.00

2l 8.03 8.90 r0.28 I I .59 12.50 13.24 29.62 30.92 32.61 35.48 38.93 41.40
22 8.64 9.54 10.98 t2.34 13.28 14.04 30.8I 32.14 33.92 36.18 40.29 42.80
t1 9.26 r 0.20 I t.69 13.09 14.06 14.85 32.01 33.36 35.11 3 8.08 41.64 44.18
21 9.89 r0.86 t2.40 13.85 r4.85 15.66 33.20 34.57 36.42 39.36 42.98 45.56
25 10.52 1t.52 13.12 t4.61 15.64 16.47 34.38 35.78 37.65 40.6s 44.31 46.93
1A IL l6 12.20 13.84 r 5.3 8 16,44 11.29 35.56 36.98 38.89 41.92 45.64 48.29
27 1l.8l 12.88 14.51 16.ls 11.24 |8.tI 36.14 38.t 8 40.1 1 43.19 46.96 49.6s
28 t2.46 13.56 15.31 16.93 1 8.05 18.94 31.92 39.38 41.34 44.46 43.28 s0.99
29 13 .12 t4.26 I 6.05 t] .11 I 8.85 19.11 39.09 40.57 42.56 45.72 49.s9 52.34
30 13.19 14.95 16.79 I 8 49 19.66 20.60 40.26 4r.76 43.11 46.98 50.89 s3.6'/
35 17 .t9 18.51 20.s7 22.47 23.16 24.80 46.06 47.66 49.80 53.20 51.34 ()0.27
40 20.1t 22.16 24.43 26.51 21.93 29.05 5 I .81 53.50 s5.16 59.34 63.69 66.77
45 24.3t 25.90 28.31 30.61 32.14 33.35 51.51 s9.29 61.66 6s.4r 69.96 73.11
50 21 .99 29.71 32.36 34.76 36.40 37.69 63.17 65.03 67.s0 11.42 16.15 19.49
60 3s.s3 31.48 40.-18 43.t9 4s 02 46.46 14.40 16.41 79.08 83.30 88.38 91.9s

70 43.28 45.44 48.16 5t.14 53.15 55.33 85.53 87.68 90.53 95.02 100.43 104.21
80 51.17 s3.54 s].15 60.39 62.s1 64.28 96.58 98.86 I 01 .88 106.63 t12.33 116.32
90 59.20 61 .7 5 65.65 69.13 '/ t.46 13.29 101 .57 t09.97 113.r5 r18.14 r24.12 128.30
r00 6t.33 70.06 14.22 71.93 80.41 82.36 118.50 t21.02 t24.34 129.56 135.81 140.t1
120 83.8s 86.92 91.51 95.10 98.46 100.62 140.23 t42.96 t46.57 152.21 158.95 163.65
45L

'fabla 5. Prrntos porcentuales <le la distribuciórr del ntinrelc¡ de rachas

7tt

lt fitel ,{ ¡ 6 a\ I I13

C\=iir il -r { r ,a\q r'l i ;;- I J-_r


tl 1_i
'?
-,-t't l[t t,
¡J-1I ¡1i s-j J-l Ü--r
^,J ni
3
u=i!'J]
.L-)
fl(
ú-ú
f -
!- ' 10 Itr 3-S
tl -i-Y -1-9 -1-Y
n: ññ l¿ -ls 'lJ
^,_Al1f lr- _t 4-, ú-Lr r_¡-y ¡-:
iJ.=S $i S-i l-;- :-S i-B i-9 i-9 _i- fiifnM
d +-iu +-iú
rf,"=U.Ut il.5 &-7 S-S ]-g l-E+ 2-1] :- ! J- ir_t ,1- tI

6
€i- .s5 9-5 :-j j-s j-9 fr¡
u+- +- ! ttt i tl
..,-n ltt tr{ f a ,n 1i
^ j-iLf L- t J- 1
: t:a
_r-11 :r-i-l
.
f:

¿-¿-r.j."J -l '1 i 1 _r-Y +- Lrai11 \-11

tjf.= Lr u I ¡1 .i 4 to f 1t-t
_1-
tl l i-lt J-t; 4-t.1

I s.:s l.¡5 li )-Y 3- Lr +- I - )


I
: )-L) A
_l

^,_n nI ;-|-_r n I 1i- 1 l f


.) +-] + I
-l
1i
j--r a:
j-. + l]t L _\-
a5 ) I

I .-,- n ¡1
ü-i t-l
-1-Y

t-q J L} J-
lr _t I ¡ l1-
lr

LO
rx:i] $i l_i -i-; i-9 1- u _!- ! l 3 6-trJ A
_1

''! i l- lo l J I li
++- +
r --r-i J\-i A

u--J tj,l 11 i j-Y +t .l _1-


l -l
irl ! Alf
-1
11
u=11,.?t _l
1t J 4 -+ +-
U._IJ 'J J
)1 _1 +-v .f j\ f.É
_r u- I
:-l-r 6
1: jl\
-- 4 ,1f
_1-Y _1 1-l _1 + < td 5
]A
t:' ü- t
I l ri
J-t-¡ fi
LL- .J. L¡ -l +
13
1l l-l .É É !: É e1

L)--Ll ,-,
-' l-i j-l l-g j ti- 3 -. I lÁ 8- A
1.1
úr.= 'J J .t
ñ.-
cr--r
1r 'a
)-> ) l1
-¡" 6- $

L4-,i. J -l r_i 1
{ A .: O rÉ C
I:
iiü= < r¡ i rÉ-l t -+- 1 'rf ú
452 Tablas Estadísticas

Tabla 6. Puntos porcentuales de la distribuciór F'(n1,rry)


Nivel de probabilidad cr : 0.1

-4 .t\ f?t {{' *{ a.,t r-, c¡r !+ !p r.- (r cl¡ \ct r.l crr i.¡ ?,i 19\ r-. ,.r (fr rt L': ür @ r y¡ r¡r (tr r-. rr! rfr .4 ,:.1
.i \.1 1'l r-. .4 r'-. $il . ¡ -.d {¡ 4t\ (tl 'r¡
ñ q u) \t: qJ rt¡ t.t t(t t.t r-r r/1 +t 'i "t $l
f-. r-. !(i w -t ¿fr ..r a.l ..i r.i .'4 r..¡ ir
I
a{ sr af @ rrr rñ Cj} r,t q {¡r1 gtr "rf a
1. er r¡¡ €' {: r.¡ (.i r-- ,., ,., t.. (^ @ u, '-i $l rF! f.l +*d (1r ('1 idl -+ r¡ (5 C¡r at\
c.: "1 r -{ r-. r/1 arr (Í3 fJ @ m r-. r- r-. r- rC E W \O r-r rar ht ra) r¿r t(\ tr¡ rt {:'f tq f¡ f¿r rfl fq f.¡ .*.
* \$
"(

C r'- r.r c:J ,tt r.-' rl r-' l.¡ a1 5:r. r-. .{ r-. (i {tr \¡) .-l - . f)t r- qt \l .- D r- ql '/-¡ qr it *{ @ tf: t-¡ !I:'
É ".r * r.? *, .* tr, r.¡ r.i ü ,tj Al c),i sJ ? 11 T:. rj r-: rq ú rf) \ri frdiI v) Q¡ tn t(t tf\ ."t *i *f ü\
r7r .q (q rrr r¡
a-l a¡,'n f+! f.t -.{ r{ f-.1 -.1 .'l (-l *! !\i sr d d ri ¡.-. d '¡r*¿ ',.-)
s .-1 +d < 4 Fr s.., r./. !4 4 f{¡ !r
@
i4 r" \4) cJ \() tr qrt rQ 'n d4 rñ (^ ef' (¡ '.r .-, @ r.t rt .". ¡-^ rt \{) *:f f' T' c.: ch d r-. * s *l a{ qF +- @ c>
rriht--.@--{r-rñf4r.{r\dÉi)fl\f\@m@r".r-.r1r'..Q\o\6Js\É\clst.ltftttira-l."tq\'l..fcrrfqrrr
rjo',Ári

ri r.iririr..i¡"¡r..¡-i;*.ii^.j...;{*j.i;*i-.;;*; ;ñ*i;;ñJñ**"i -.-
rP \CJ r-..{ r-. <> É @ 'ñ \ó e4.*'\C:.-, ¡-. q *{ É \O s.l .t (1 (¡ r- w '-, *1 .., r.l s{ sl (> 4 q} \l ¡¡'.1 f
rfrr.F'4*,?,nÉ.r.1 *qqülq¡lü4?@.r".r"r:.r-r':\ól\ÓqÉtq!ci{lqtftt.\4r'.er.qih.ftl,/f'
...l('r'riltc.|f'"ff'¡r,lñ'¡.flf'l..|Ne.l4sÑd4+-qÉ.qdÑ!\s..qFl.q*q.{Fjfi4
\C5

*,1 {.t @ r:f N \:t Ür r{ cF üJ r'{ \p,. \o r¡ ú' ró.ef d lh a q} e|f (p! r..¡ -q €1 (!, Éq rf" rq r-."cf* rr'.,q <¡ (¡ rt
r-. rit +{ m llll m rrr s.l .r¡ .,¡ "*r <) c) qlr 'f, ú @ 4 --4 F{- r'-' T-. r'n f- r. r-. r.- \C! !É \tr \tX rrr r¡ rñ In lflr .41' rd
E
f{ --i <¡ '¡,i ri ri r.i ni r-l r.i r't ci r.i ¡j ¡
qJ
*' * "J *i *i *'i *q *i "*i ñ; ;; *i i * i..',i -'; "-"; .- *;... -
.'| rl () r-. 14 ra /rt x) nl \Y r- (2 ¡.r -- r-. ()1 ..1 -., (¡ u:) t¡ rr¡ .* {) fi r' \() '- qf /r! a.l \4J r,1 q'"er r" \e' A 5
a't r.l f l a fl ú. \f) Sl /.r r.l -e :a cf c) a¡, o @ vJ @ 6 @ ú Í- r-' r-. r-- r. r-. r-. \c) \É (, rñ r^ r¡r r.r rt
óqf}lñ¡t\t1?1.'lr{rlr,ll'¡r,'lr-l...|.*r¡!{*l4vdi.!ly4sq
\¿¡

l- .t s @ t.t @ 4+ q tñ \Q 4 ..t r- at ("¡1 'ñ r.t (J @ uJ rr (.t *


C:1.1r\útl@\P*l¡"tft-"^-ac)(ac),(:rolci\4@@@ü@r-.t-.r--r..r-.r-\¡:)r4júrr¡,rtt.tt.\tf.
t+) m r' vJ 'rr'ñ Et @ 1 tq $) (¡i m r- --

ñ !¿¡

4F
ql c-.frl '.' .F ^l r2 r. \.t f .l C¡, r-. s) r.t fn .q É") q¡ m r- \4) r-r (J \ó ql ..t -ñ 4¡ (J1 r.
cJ *r ,-r r¡ €
c.,..tr.lúa{@0\1 '.' q¡ E
rqr.{ñ..-¡4)cJÉl}cJ\cllcl\úJco€J@q@@r-.r-r..r".r-.r".vJ\()Q\l¡'{Jrñ'r
tsd {¡;,
J

+'$¡ '\. (':7 r-. {:: r':. 4? tr @ ?.r r¡r .-.) ttt . rf,) 3f ..' ,.
r-. \:l
rl
r¡ a..¡ rt, r-) rrt (.1 .l r-r c¡
. | '5 s 'rr ff1{ nr
ú1 q_tr
r r{ "*' .} f}q E-J r-.
q¿ r-. r-. r'.
..*J @ lrJ -,at fa
r-, v.:¡ l4:l tf,r (l)
.,1 -.,
\ó (c ,'-
ú t-l
rl a! -.{ ..J dr @ @ .n vJ v @ o)

14 \f,
e
& f" <) .t -1 q? .t a rt <j ct rr' I- Ft r" -rl . t @ t.t i¡, -. {) m r' r-, "1 r.t ..1 a <}l t)' { i) @ € '.¡ rrt \.1 r-
E .l 11.r'f n1 rlfr\ ¡t,f|-,-,cicl<>ol(l\¡..n<1 cr, m(tDr- t r-.{JtrqJ\Ó(¡!'r
WA I,¡,..t -@Fp,anioi
!<}
O
,,É qlf.l
Ó,(r1 .frr:.¡()Y{>.rlf4f-lr-rmYl'{}uiJrqc¡4qJ1ta{(í¡(ffir-.{)r,1 .drd¡r-¡-q..rh@r--\()u=.
Á¡\a.l(I..14trÍ-.tat.\1lri-'t?¡{rae{i:)C:\()(r!(}Ci!ftfrrúü@@@4¿bSr-.f-,r'-.r0(Ct¡lrCE
'i& -
\S @ {f Yll t"¡ \J +j.,-¡ r-" rd{ \Ér..t cJr r{J r.r \) @ !!J'¡,.Fr.-t 1d (} 9) r- r-- \df r-¡ qrr !e 3)T f4 -.t r^l ch.-
'E¡
Én r.1 S.J
a trt a.i.t1 ':,.| 4)1 r'-. r-, $1 ¡.t 11. ¡ -'r *i C> (1 t) (J 4h ü cn (r1 q¡ {:r @ @ @ 6 úi cü É- r: r: r-l r- r:. \É \9

ü
.. r:l f¡f t.t <1 eJ r- cjl r-. @ L-.: 'J C: '.' ri .J ., ,f,i @ (.t (5 f- E r., fl r.r --
r:t r' qf rtr
Q' r') rn tr- r.r +r .n .l ., i)
ñÉ ¿rf rl l¡ ..r u\ r-. t.t t:l .t ¿rr ...| (-1
^{ * ';: q} (}, €r {h úl <.h (ti .-¡ {.}, (Jt <Jr
r¡ o' ,¡i rr¡ ¡rj ¡i -"i ":i ri ¡-j r'¡ rr r.¡ r'i n{ ¡-¡ r.i ri ri ':'i ; '.t . ¡ .-¡ *.,; .,.,, "','¡ ..; .-: -" *.i *i *i *; ; *,j ..'; -
o m ü ú r'-, r'. r-, r.:" r-. I

-.¡ ¡.r r-. ql r-. 4 .1 *A .q ql @ r.r ú1 ró} fq q: p. r- r.t rn t -. \f q¡


--{
ft1 rr 4) r-. \(J rfr r.f rr' a.l f.l ?.¡.
!! El ".1 a{
(5 <J q5 ¿5 c;) q.¡, (¡r ¿Jr (¡ (¡ (ñ (t\ (f ú Éa FJj @
0\ 4 r-. {J i.r t{ cn D @ -r
t--.
<¡,.rr
' *; r.f
,ri r., r.i r*i ri r.i r¡ r,i ri r¡ ri ri r,i ri ri r.i ¡.;i r,i r.i r,i .-j j *; ..., ..; ..,.; -..; . ,i Á *," *,i
r-. r,
.,,.; ; * -
r-.i-.
'
C-¡ ¡r¡ a q{ q) r-r rq r-. t.t \ó q1 rrr o .tr .",m rñ ri -a q) .:l .¡ ^,¡ {) c: Crr @ r.t +' r: \{) ¡.t \1 r., --
rl rr' 1.{ q} ql É> ú \EJ trt il ú.r l.r f l a! t{ .- D.\
(p rF V)
(J 'ñ
(} {p Cr c} ó {:: rn (¡ {)\ 6, ra có m ffJ pa --
\É m d 'n "t:r., ¿"i r¡ r.;i ri .{ r"t ..i r.i ..i rj rj r;i ..¡ rri r.i r.i r.i r.i ri ..i ,:.1 r.i r.i *^; ** *'¡ d ; *.i *; ...,
^"-; -
i.l ol .{ t.t t.t ,i. q r.¡ e., r{ ¡Jr r¡r J, r-. .l .¡ <) @ \C, af fe (:t |J\ @ r1 r{"J W r.¡ ft r-. rrt Ft *t .r 1-
..1 r.{ ft (;> *:f .{ ú r'. \f) r.¡ 'rr
it {Yi ..¡ ..r r{ rt r{ f.¡ - (! c: c,} 4: c:1 (.:l (-, ó, 'r-,
ftr (^ (¡1 c} f, t
¡-l q¡i rri *x r.i ri r'¡ ':.:¡
rt ¡l ¡.1 ."i ¡.i ri r'l r't r"ii r.;i ¡,i r¡ ri r.i r.i r.ii .:i ,:;i .i rt r.i r,¡ ri *.i *j -.¡....; .-;.,, -
rrr al' qf {¡{ Cl @ \+ .. (¡J -]:4 $:t q? r.l 4h \dJ ':t 4{ ú'1 r-. r.r rr, ..,{ *R ür r4 r-. r- iÉ tñ vl. <rl {4) 4r' frr .l .... (> !-
€}f..¡\wlñ.''{Ole\f)t:|¿|\ti1l'r.tfftrt..¡r..i.-¡r¡.'i.-"tr'{.a4\{.)?¡¿\|i
,r, c¡. ,¡i .+ <q ..i ¡¡ ri r..r .t r¡ .{ ri rr ¡i ri rl ri ri r i ri ri -{ rt rr ri ri ,_-i .l -i r¡ ,:.1 ri rt ¡i rt -
"i
c¡. \ar ü' *1 aJ cJr r.-. rl elr iñr rcr r*{ rc cl (¡t \íi Yr a.l c¡ m qr r-r rY fñ -.{ c:¡ ch 4 @ fi *) @ r4, r-r r- il r
r.r 4 tri .* \ó f I () <¡' @ r-. l(: $ rr¡ r¡, ti e¡ .:i, <r'$f rrr rq (rr rrr .r all.i f.¡ ¡rr a,l r{ a.j r.l á:¡ w- "ii¡ u.r *¡ ,*l -
.r t¡, ,¡i a* ri .F; r'i rj r,i r;i ri rj r,i r.i r-q ri ri rt ri ri ri ri ri ri rj ri ri ci ri r{ ri .l rq r.i rr -.i r{ -.
c) i¡ \Q r'l m t{) \l¡ .{ .:t a:j i.cl ."{ t$ (p r.'r ..1 r.r r- \(] '.r "al fq .-..t éd a.!a +1 O\ rf' +*" t_¡ rD r,-. v) E =
(> *;t .r' r"-. 'J r ¡ *r (ts +\ 4 a r-. ':r'T-. r'-' \{J .ó i.t
EJ \A '3rar rrj ta¡ tf I ta\ rr) r.i '.-t '¡i t¡r *f +j, *.f (r' *.r t.r rq r.i --
t{ '-r
cl o: '¡r.:r c.,.., ¡.i ¡,i,,i ri ri r i r¡ri rirr rr ri ri e r ri .¡ -t..¡ r¡rir¡ r¡ riri r¡ rt ri rt ¡i rt -,
at' ':i
\É f"r e$ \:1" @ illt ,,t a ri L--a r+ r¡ ..¡ e-r r.- \¡"J r.r .-l rñ r.¡ *¡ (¡ qf1 ,7i @9- *
cJ1'1 'rl v¡. É(¿ ¡-,. l¡rñ $.)
qy' V:
frr rt .l .1 .a .: qi (:: t q c.¡ r¡ q l¡, (n r¡ ü: l\ fl qJ\ ct - q nq ec Q.,
@ r,-- Vl D
r., r'-" r-. r'-: r- ---
í1 @ ¡¡i \t sjl' .ft tn .r1 (Ft ffr r'.t I'r .Ff f¡ .fr iq fr¡ tf| r¡ a..¡ a1 r.¡ --l r,¡ l-.1 ajl frt r{ r{ .1 ..¡ a..{ al f.{ r.{ -:t r¡ -t

ftJ
- f, F) = 'ifl \e r- qo':\ xl E 593 Fi F1 Fi ri il Ii H !; frñ ff +ff g F * á 3 ;
R
= = = == l!
D$'E !i'T !í'E SF'' gF'i ll'{ ¡9'i sg'E LL $ -'L ¡ UL *
gs'{ ss t +Á'T Fft';' 8g"i I['¿ ¡t'¿ i9 ¿. $s g n.t'i m
ffi
f it s 6g'¡ 8F'¡ tS'$ ic'¡ s9'í LL 9 VL I i8'¡ q$'1 68'I r-Á.'E ., Á ¡ [*'¿ Et'u 6¡'i f [.i 9f,'í 8i'r 6s'g i6't 0CIt
*t ni'T f*" ¡ A4,'l Ci t 65'X 69'E $¿'I $S'E ts'¡ 98.tr s6'l i;i'¡ F'Á'I ItlL gi L. UiL L¿L ¿F'¿ 3¿ ¡ Ct 5 !6'5 0.6

!i ¡ {t ¡ ;t'c ?g-E s9-i s¿'{ st.c [8'n F8'T $8'E 16'! s6-rr ss'r 9*:¿ t$'t [r.r Ef i 6F'¿ il-¿ ¡ 1't g$'i $E
t5'I 5!'i g!'i ¿f'¡ E9 ¡ 'e¿'E !s.' Fs'i 98'¡ 6s-I [6'I ¿.6'! ¿0'E LU L f 1 L {í'i.. sil[ ss'i F¿'í 5I'5 86'! 0¿
ác'l ef,." ¡ 9q-¡ sg'l sg.t s¿'l F8'¡ S$'T 68'[ t6'{ S6'g 66't fo'e {.'g L L¡ L !{"[ ¿g'e [E'r 9¿'E 5t'[ 0*'F ts
)f ¡ L: t s-E Eg't 69'{ 8L'{ i
LU ¡
o'? aa-
VU
z
¡ ¿5'E !6-n 66'¡ t#"[ ¿s"¿ [$'[ EE í 6Íz Et'í st'[ 6¿T 8g'g t$'f üs
YE: ,69"1*9'I ü$-{ F¿.'T FS'C ffi't !6'g i -É'g
LU t 8S'r [¿'[ 8{'e 5f'[
l-ú¡'7
VV L {rf}'I
?V L t5'¿ sf'¿ ng'E F8-e ff'5 E*F 0t
[9'5 S¿ I 9¿'! 6{.'I FS'I l5.l IU L.
M'!
L 9$"C S"; [I'e 91'fl 3e t ¿e'fl ggT LIL E\t 69'C {.6'[ [t 5 J.;'f B[
ES'C SC'i VI'[ 8f 't r¿"¿ 8¿'¿ s|.e
FI.¡
ñ¡

; F*'¡ i¿'t {¿'tr l$'r s$ r r.6'f t$'[ ss'¿ tÉ'c 5t'[ #¿T 96[ [g'5 8t"F 6t
g9'¡ [¿ l s¿.'I cB'¡ ¿s'i 9'6'I *,s't *s'e s8't {{T 5t't 63't Fe'e 6{'t gtT E?"¿ 9!'{ T¿'C !6'[ F['[ S{'} $E
t\ ¿g'{ F¿'T I8"E F8-t 88't L6'{ 9S.[ S8"{ *1'C gN'E ¿I'E sr'fl E{"[ lf-r i.t'c ,t" L i_! L t¡.'g 9€-i Ef'l {c'F LL
E 69 E 9¿'i l.s'r s8'1 $6'1 66'E ¿s'E 6S.¿ ¿i'[ g¡'fl BI'l .T?-?
T.LL
t.¡ ¡
LCL i5'¿ 6S'e ¿F'f, 6!'t t¿'r 86'¡ ¿5 5 r¿'3 9t
ro
o
Ti-t
¡L S o/'r
DL ¡ fs-c ¿8'r 86.: t{}'U 60't [1'l ?:-í gt"c or'c a--
}.L L
dt'7
OL. L F['T O}T 6t'¿ 89'e 9L'7. 66¿ $['I i.i'] J"
tto
¡q st'1 $8'i gS'E 6S'¡ frÁ'f L-n'i i{-'[ [1.i st't $['¿ w'[ !í'r 0[T ña'a
:'¿L -5'7
L$L $'t t9'¿ B¿-g rs't sF'E gt'f Fi
9¿ l [s'{ 88'I E6'{ gS'C iS'[ ggT t¡'fl 8r'[ 8f? f['[ ¿rr [t'I LN L IS L r!'¿ t9.¿ 88-t 5.S't [t'S 8',['F ¿b
86'i ¿$.[ s['t [{'{ 8f-t 5f.e gx'c !g'¿ s'c ¿s'¿ _fE g fg''g s5'F
¡ie
üll Ea'E 58,'E ?#'8, y6'g E[-r sft st-t 9f i
Ed gs'3 8B'¡ f6'I 96'¡ ¡$.í ETT B¡"e s¿'¿ fll't lÍ'í E['[ '¿rÍ ¿f'¿ T3'T, SF'í r.f'c 89r f8T ¿0'5 ¿r'g ig'F IE
rÉ€ FS'S {6'S .r É't *3's jú'?
AU L
,t't
LI. l. IJLL
^?'?
+-'a
ILL !r[ 8't'E If i 5g'u 6f'e !FL ¡!L tfi L !i L ¿t't 8I'Í 6F't !t'F s¡
o! E:8'Í F6'3 ffi'e ff [ 9i'¿
ts'[ ¿$'E 9E'[ s['E xr-'[ tf'[ 8r-Í ¿F'¿ ü& L NL-? L?''
ts L :T't vi'f ü6'[ f{'f t!'t 8['f 6t
OA ¿s'3 86't s'{ 90'i !1'[ 6!"[ ¿t"e 6ür {E'[ St't LÍ'[ *s' L :rf i!-¿ ¡!r! B'?
L 8E? slT ¿i.¿ 56'f 9$'t !!"5 {F'F $T
O'(ü
?4 s6'T C$'r ss't 0T'i cI.¿ [e't Tg'c [E-i 5ffi 8fi trr !F't 6F e s!'t I9T 81"¿ l8-¿ 96'¿ St't 65'[ ii'! ¿T
IP 3S'[ ¿0'E í¡'e 5I'e 6¡'C 8["[ rr.a r a'? L L{ L
-M't
trl'(
rr', *'t
Lf L tf L 6?T F5'[ 6!'¿ W'T *¿'Í s8'¿ {0'[ tt'g t9'5 6F'f 9I
8¡'fl 0['[ gr[
-!.

Ha t
LU L
&'? ?t'7
L' L fg:i #'7
r-t' L
?&'T
L'' L fF'fl BfT TE'T rs-c 698 f$"e t¿'[ 6¿"¿ E6'¿ 9S'g 6e't 89'[ ]!'F 9I
o", gÍ'[ 6I'[ w-v t7'7
E5'[ 6r'[ 9F'[ ig'E [q'e ¿s'fl s"fl g9-[ st'[ 9¿'E s8'E 96 e {t"F Fg'[ F¿'g ffir FI
E¡ YLL LIL trST
O-
oo r'¿T 9Í'(, Eg't F5'[ Er[ gF'e [5"¿ S!'¿ 85'[ W-[ [9'[ ¿.s'E ¡¿"¿ ¿¿.'[ t8'[ [6'C [S't Bg'[ ¡F'5 f 8'[ ¿9'F EI
A.¿ sE'u E5'e GFT ff"¿ rg't
avL ta',
vtL ¡9't t*'t 99'E#'E LL'z. 5¿'¿ S8'¿ (s-[ [6't B0.f II'5 gt't 6f's 68'6' !¿'F TI
3Z ]v'[ 9]"[ Ig'e sE'l ¿!'[ !9"[ 7l '7
LLL
Si 'Y
TL.L g¿E 6t'[ [S'e gsT 06"¿ gst I8-g 6S'[ Se'F s['5 6!'S 86'g ]8"f II
F!'C 6g'¿ $9't 99-t #¿'{ ¿{.'[ !8t 98-¿ 68"[ ¡6T F6"{ 8S'E eS'[ f
LU
{\'C
!
tY'r-
t I i 7F-f ÍF't sF'f {¡'g $Í'? 96'F NI
tu 1¿¿ 9L;7. s8'E 58"¿ 98-e F6'[ TS'E [8'[ ss't ¿$-5 0I'[ Ft't 8t:E 9Tt á¡'r ¿[-5 8t'f [9'g 98-t 9['t tx's 6
<, f6T ¿6'¿ es't w't 8$'[ E['[ ¿t'g f'.¿-[ 9t'[ $rf t5'[ rf-r Áf'r F9'5 0g-€ ss'E 69't F8-5 ¿*? gf't trs B

d a7'{
üL i
f3'cÉ
LL [5'tr Fg g er-l *'r- !s'5 5!'5 $'g ¿!'5 ffi't F9-[ Sg't L-J l Éí'r- J A-l; t x-l- $'s [t'] *"¿'? 6t't I

rd
¿g',t I¿'f -tL S LL T E8'5 ¿$'[ F6't $6'g ss-t Es'F
9S'[
f^-!
)r\, fr rit '!r
^f !$-F ¡[E 8e''' 6rF $'v 9¿ F üI't 66'9
Er ¿t v ¡F'F }F'F gF-F $i'F 9S'?' ¿9'F Fg'F 99'F 89'S $¿.'S' *:í'* I f'1r [8'F 88'F s6'F 5S S 6T'9 IF'g 6¿'5 n9'9
[9'! 99'5 ü¿-t r¿'5 5¿'E 00't 96'5 r$'! 6$'5 16'! r.6'S g$'t 80'9 FS-g ó09 9['9 9¿'9 6t'9 6t'9 F6'9 [¿'¿
t!'8 5E'8 8!'B 65-8 fl9'8 99'E $i'8 I¿.8 [¿'8 F¿'il gi'S 6¿'8 ;8'B sB'8 68'8 f.6'8 {$'6 '¿{6 8[.6 !i'6 5n'0f t
&! 6C 6F'68 a 9"'AT J +¡'J<?
$v-sÍ Et'úK ¡*'ar
r-t vt
?*'ÉF
L¡ u* ¿.?'6¡ Cü'6i üF'ú{ 8F'6{ c'Ár ai'Át
Bg'67 f tt-61 st'si fi'sE 9{ úr 80'6[ r!'si
t G I UlL V D.¡L s !t¿ F'(Fi
igf fgr B'iEt t'tqr l'na ? 't¡:- n i *:" Jt ff:, tÁ cb¡
o ttL \u''L 6'rtr 8'9[r 8't[f ['sF{ g'Fr[ I'Sir S'66t f']91
ffi ü0I {H úF 0f sE sI rI tI il II 0t 6 I A I S t r- [ I eu
.ropE¡€rurnu F ercd pElJsqll eF soFE¡$ :r ff
A
g\
ü r: Gradss de libertad para el numer¡dar A
tla l ? 3 -t 5 ú 1 8 9 1$ n l: 13 14 15 ?* 3+ dt) 50 1ü0 s
i I á 9l: Lrt 1 *+s l 9.16.t 9ó-i 3 9t8.6 9l].ú 9sr.l 9S.r.9 ggi ! ]{*} lñ!- -r¡¡t,
I ó.11.8 t99 s61 899 S 9.,S.' Yi: ú i ut_,s [LrLt ü i.U,-l -u: ü
_.4
añ -:1 1a ?1 aá1-- an-.ar t^ 11 1a a¿ É4 {1 1a ¡1 -n ¡i a d( 1^1 aa dñ in
_1ü__r ! -^¡ú
_r:t-Lfu .-1:t -.¡ ._tlJ___r ltr-_\tI _1y._!-- _1Jq-_1{.t J:l J i -ly-J-q ,1:r_r iJ ]Y .+ z. _1y -+ I -1t i_ -r:/.+-r _1:t.-(J -ay.+_l 3Y.1v
^ft
-1Y.+ ¡ -l'.+ü -1Y-+ir -r:/.J ú'
! a aa .,¡ñr
4¿¡t.4 j..*.U-¿
3 1t.4{ i6$4 1-- ¡4
:-¡-€
{i !^
--¡.tt/
Gt 6d
¡! üü t4l_; f4.61 i;_ _rd I +.+ _r
\l{-+-
r ¡1
-+_J.¡ 1.{.t8 }4.1¡ :4.i1 !4.S8 l+-lja .t _1.9'll I _1-)u-

:l ¡:.r:l 3$-Si c*a cÁ4 ct6 Y.-.U 5-U r s.-qs s.9+ s.s* s t9 n rr-
ü-J-r
ñ 11
ü-.'- s.6s s.6,6 s.i6 $.{5 s.fl s.38 s.-1: s t6
{0.$l s .{l r,.,9 .¡_-ry I l_l É *8 S.Si 6.ü á Jl ó il s,i9 6.16 6..*_1 6.-il 6.1._1 s ¡8 s.t-¿ 6.{ls 6 0l E
ó ssi "i)6 l] l]ü O
--r -r Y-+ i.st l.ts i6.8 jil i.4S :i.,t I i 1a
/
_¡ -_1 _r .-1_1 i.:r8 l.ll -\.1 I i.C'l i.8: .1.9,8 $.9': :r gI D

7 s.$r 6.i4 _i.g_c 5._11 i ]9 5.11 .r.99 .{,9* ,t.81 4.t6 .r tl + 6t $.6i .$.6$ '{.-Íl 4.41 S_16, +-_i : ^ ü
+_<
añ .! 1! a'!.,
^-
I I {t d.06 \-¡t
).+-
*-^i
-r-L¡J
¡ñ1
+-ü- .t.si .t.il +-+-1 +--i¡ ¡ 1¡
+--1 J {4 Á+
\ t .{ 14
+-:u +.i tl4
lu +-t_r . ¿^ ,
+-tI,J +.Lrd
^^
ót
J-ü:
+ 4 ñ¡
¡-ü+
1ó!
_:-ü-L
4:{
r-:i
1aa
_1 {J.r

q t.t ! i.i ! 5 +8 lt. .$ +.9S .{ :1 t 1,ñ


+_iu +-u.-l J --+¡ -1.! l
:
J-ú ,r
ña 1 0-
-1.0_1 i.s* i.I i 6i l.is i _1__1 J.s r
i

-r-+rLf
¡^

f f -1
-
l0 69+ j 96 a Ol
- d-r
-t -4':r
+-+ ' .+1l
---- + u., -\-:l-r i.8-\ -i.ig 3.ll _i_66 J-tl- -1--1ü
j.-il 3.¡l ¡.¡l _1._;i i.t6 -i l: 1.15 3 0'3 5
ll 6.ll r.16 t.6,í 4.:S 4 *1 i 88 1.t6 _;.d5 3._59 3.i_¡ i.'{ l 1..t3 :i.39 _¡.J,6 t¡.3_i 5.t,1 3.tl r-'JD i.V:r r.E6 l.BS -¡+
tl i-i ¡6 t ,n -"{l .{11 lOg _1 _1_t - n 1l nü ., _t-_1_
I an
_1-, ü
14.
l.tt J i$ l $t 196
a
Y:
^4
a ñ-
!-ü J :.s$ I ti J(n
Ox
-- ;.;
_1 - ., _1-_1 -1--: -
I3 C+. -1 tj :-_r _) +_,.fu -l - r j '! f,.J _" :ü
: --1:J --r I
\ ai a 1A
_1.:._! -4,_u
+ *--
I :-,
a t1
:¡ :¡- 3.$S 3.Si l.ti l.${ r
-
to
.ro
a.i
I1 ..-
1 .Ál '1 .á:-1
-1 -r
l.gs I i¡:, l.s4 I li 1 .:Á a t3 ') !
l.t 6.i* 4.$6 .4.t4 i.s9 _t 6é
a
,a
*-^
_ru
-
_1,,1ó
-.ñ 1fA
-1-=.Y
- 1a
-1 - i -\- 1 -!
r ñ-'r
_l-tfi
1n.-_
_a-ú_r
^. ¡t,t
_r.iJ:
\ A1 1 É.¡
a 41
oo;J (!-AP
'u<w
t5 4a¡ _t-"! ¡ ¡ -:
;-;_t
1 nn
_r-Jü
- iñ
_i.+: -i.t,i
r ni
_1,-il
a t1
_-. l 1.86 _;
rJt t.8s :.86 : lú ?64 1 r_&
I S6 l..el a --\- 1 ¡a'
- +! ') -
I S9 I9_i lS'S lSl l.Sl : 19 l.6S l.:'l =.-; ;,-
L'-d + . _a _¡¡]

l6 í1a t AC + l-rs J, .: -r -1--1!i


jl4 _itl _1 l_ _r-t_) -rl -
!l 1 -rir
_-+u
1--1
Y_t-o ^.

ll Á O.l .r{ f,a * L : -1-Sil -1


:: 3.LS 3 '26
a^¿
,\ r¡ü
1nñ
-
:tü t9t :s? --o_
f 01 't ta
l.li lll :ll li{¡ r-+ 1 iri '1.+1
--a!
1 a1
-. l_1
'r -11
11--
- -)
'! ta
DFFN
:. U)
l8 I !¡i *._!s _i9_l _1-31 _r_.U -i t: -r is _1Ui
1ta
;Y_l
10t 1a1 t.il I t: 1li: 1l'l r -i4 'l 1 'n .4Q
-
_aü
1 5r-
, J-l
AP
:i.
t9 -- 41 t- -lr
-i.99 -i.:;á : j,i ^|r.4.- :36 I B$ t8t t16 1?1 16Q :.6i l 6t :.i 1 1..;q 1 11
- -1-i
1 :f,
*.-ru
a 11 1 !: lJ-
\-tD'
Á L¿.

:t] --;.st {.á6 is6 -ii: _i19 ,i.:f j!_liJl a c: a Q' 1I tll f Á0 I Éi ].fi,s _: 5l I +5 I _i5 .l r'9 I 15 11: I n¡
'lo.{
iJr^r+

il -- ftl_1
_r ü
¿ .1
+-+- 1 ü_ _1_: ü
a lL-^
_r
a ar
-vY :.v . I St 1.8+ tti tés aÉ.r aá4 l.i6 I il l.¡l I il 1 1i a 1: 1l> <l¿ñr

-- f 4 . 1ñ s rñ
_a . ü
R J¡
_1 +:
: 11
_1-;-
1n-: 1^1 1Qt 144
ll+ l6r \A^ aiá :.i_1 I i$ t.-ig I ll )a )'. l.l I 1ña
-.ú>
a ¡-^
= uu
il6'ñ+
1 ,1.( ¡l
1l J- ¡ -r a-f-) _r-,_l _r-Jl -1 -D
_
-r_r-
^1
1 i.^
,-3.i 1ar
;,ü 1
141
:. .'J :.6: I5: I -il l.:i-¡ !-_,d
a1:ñ a+a
_ + l
1:4 1lj 1ñ
- ^ü
1 14
;-r- 1
ñ:
34
\- 11
_l t
-
¿ 11
l-_1_
111
_t-.'-
. -ñ
_\__1¿
- i--
l. 9:a l.Sl f :o
-.iü
't t4
:-JV :áJ I t;! = -l+ -
1--d l aar 1 fr \ tt a ?l 111
lii -l'L' .lt3 ,tÍ1ú_ i^.4
:-t+
-a)
f !-r
25 r.é9 é.19 J fly _1._i-1 _a.:-a
1 ir
-.J '
1n-:
__ü_) 1.i ltQ
r6i :ir 1 -i: 1 .lQ r...¡ a.ii f:'' 11Q '1 40
---'i-i r.Y-
?6 iÁd .l 1l _r tr., _i._a_1 _1 -Ü
a l.
-.j+
1ña
--ü- L :-i 1.6-i :i9 :i4 1 ¡l f .ia
:.¿l l.:3 l.16
:._rg 1 úñ
_ Liy
1¡--
_ u_,
¡
i ilv' I
r.üú

{ 4: .{ 1.! - ¿i-
_a t-r,¡
. ^+
_r _1 1
_
- 4ñ
f l¡ r1 :.9t t.s8 1 :1 1c; l.ll I i ::
1 ll
- +l
1rl
: -19 t.i6 l:i l.:_i 1.f,r
i u.'
1na
; U'-r
.
^^
--)¿
a
i-ü-l
n^-

28 iA1 .l 1l i 5_i -i t9 _i.,$s


a
,-:ü^l'
1 rñ
-_.,d t.s9 I 5! 1 ii a .¡3 t.t< 'l J'
:.1i t 1.$ t ti l1: r ^i r X. ! 41
r Y-
t ¡1
r ü-r
:
?9
r_ .-a
_r ,ry
< 1^
{_-tt -r-¿ - -1-- l
rtG alf, 1.67 I i9 1--1
___r_1 _ rü
1 {ñ
t -^i l.:ig t._iÉ t.31 :.li l.sg - u-l r.YY
. 4n
: :/ú- ! ni
-.ú -

3fl -- <-
-1-_1,
t *ñ
+-iü
! 44
_1 _'v
- 1<
J--_'
- 4:
-1 üi l.$t t.l-i I {:; I -il '\ ii 1 ,{Á 1 t1
,-+ i
1r-
--_1.¡
1..*
--:'i
A_l
-.-rl
A1t
- -u
lrr-
-.U.. :. ri: !.91 ¿88 119
N

{ü i "t1 .+ !1-i
_r-+O _1 -_1 _ :'r
1 ':! r¡ a .Aa t -:1
_-_,_i
n ¡-:
- +_l I l? t._i:i 11C 1ai I l,: 1,.:s I Í11 '_.;!. i.ss :.s,i : ':r.r '!L .'U+
É _{

5fl ,r 1+ Jt,
.a 1A
-1 ,ly
a
_l_l.t_¡
^i
1ñ+
- D_1 I 5t t.55 n :4 a ?Q
l.ll -:16
111 a:Q I t+ 1.1: 1.19 :.Sl iar :1i !.Dtr i _)_1

60 -l --> -1-Y.l -1Ji -ii;: i.y I 6-i =l :;t a ¡t


--r!
141
-:!_1
t.t; t:l L.ii l.iJ -t.flg thó f .94 : sl
:. -.,+ I-iü I Áft, f .lC

7ü i tI i.89 _i-_ri.
1d-
:-:rr
a ---
j-.i_r 1 --1
-.-':
1 aa
^.+ |
'1 .-a!
* f ¡
1 an
-__au
11.1 f iQ 1r¿
: -!+
.1 :É
- ttr t.$* l.{Jl :,9i :.ls i.t¡ l.+r
g0 5.tt i s6 + 1ñ
-1.,ü
1ó<
¿-5-¡
a it
^ 1-r
a .-a
r--r I
1 (a-
--q-, ?._ri l.:$ r.t{ I iÉ i.i11r !
'1¡rl
-.u.f l.'J_; :.sú : ss :.r5 1.68 1.ói t__'_¡ i-nu

9ü i.t$ 1.8'{ l16 l.9l lr-j l._i5 :.'á-¡ a ---{ a aa 1.t9 Il.t .ldlo 1¡Í t.$l !.9$ á s6 1.1! -ü¡ :.o I I.ie x Li?
t.f 3 l.sl --vü t.fl* 1.9? 5.Si l.l: !.6=¿ :.59 !.s$
-r .l.l
lf0 i ts 3.t5 t.gl
_r.83 : l$ 1 i* 1 -*'! a ]'\ fro 1 \ {1á
-.Is 1.3i
s i $i -¡.69 i.il :.i9 I i; l4t tt9 ? t9 I ¡t t.s5 [ 99 i.95 1.9$ n.s? [.8,1 1.]] !.i.1 ¡.+5 i .qJ a ¡ñ i ¡+
- -r!ñ
{ ñn
¡ U!

ftu*N 4*,Flr &ir'r:r¡.! i *: *! w


fl r: GrudoE de libertad para el nu¡terador

l I J 4 5 6 ? I I l{} ll D 13 14 l5 20 3$ 40 50 l*0 ü
.{05t .1999 14$l _lc__l _l I Oj is-59 _*,913 59gi s8ll 68i6 6&8i 6tji 6t09 616? 61.$ I 63 r\i 6-i l4 6i
<t¡\A Áia; f!.!:
9S.JS 99.0ú 99.Íl 99.1i 99.i0 Yy -i-i )/9-_1s YH.-1 r YY--1Y :l:/.+v :rf -i L qg.,{j s.4i gs..{l 99..{t 99.dS 99.49 8ü5
Y-q.+¿ vt.1¿ yy.:{_1
3.1.il lS.Sl añ a{ an 1{
39..ró -ü J.if -ü.=+ tt.9t 1j.67 t?.49 ll.i5 2t.l-i:1.tr_¡ :l_*i :ó.9s t6.91 t6.s? 16.69 16.5$ t6.,Nr r.6..35 t6.14 16.t
l¡.Ls xs.0$ I6.69 35.9S ji.t: t_5.ii !+.98 I ¡ ir-
t4.8S t4.óú .¡+--rJ I I ¡a
¿+.iJ
i ¡ +a ! ¡ ^l
l"+__1 .r ¡.+._1 ! .:r*.jJ is.?$ t4.01 !3.3.1 i3.15 ii.ús 3_1.58 I
t { 1r- _1_

i6.r6 13.tt il.$6 Á!,i9 10.9t ts.ól !$.46 rs.39 ts.i6 !*.si 9.96 9.SS 9.Sr 9.?? 9.lt 9.J5 9.18 9.t9 9.t4 g.tJ B j

tJ. i_t tv_5i v- ü^9.1i 8.ti $.4? $.16


ld
J s.t$ l-gs l.st
v.t9 t.i3 1.&6 l.5S l.iú i..{0 7.:i ?.14 l.ü9 fi'.Sg 6.8 P

a1.15 9.5i 8.,t5 7.Si 1.46 i l:l g-Y! 6.$4 6.il 6.6] 6_i.1 6..á? 6.4i 6.-TS 6.3Á S.16 5.S j.gt j.S6 _i.t j i.6 p
11.]6 8.65 r'.ig t.*l 6.6_3 ó.-rt 6.1s 6.S3 i.91 i.s! i.l3 i.út 5.61 5.tó I.it 5._16 5.t$ 5.!] 5.+i .$.96 4 P
10.56 s.St ó.99 6.41 6.S.6 i.ss 5-sc 5..*t 5.35 _Í.fs i. f g i.$ ¡ 5.üi 5.s! "{.9{ 4.Str 4.65 á.57 ,1.51. 4.4I !+.J ¡
f s.&{ l.i6 6 j j 5.q9 5 64 5 l* i.ts ,t.7! ,6.ó1 4.6S 4.56 4.4n ,$.:5 a.{r'ttt {.¡¿
i.Sd 4.9,{ +.ü-¡
¡ rr- ¡ -a
+.,¡ I
.{tf .an!
*.u¡ ,1 !/t

9.6-Í l,:t 6 tl _5.61 _i.Jl i.sT s.39 's.14 d.6l '{.i'T 4.46 .*'ts 4.ij .1._:9 4.15 .é.:S ¡.94 3 S5 -1.8S i_11 zb
't 8: ,*.is 4.39 {-JV ,s.¡ó 4 i$ 4.$i .1.*1 i.86 3.lS 3.5? -1.11 l.4l J. a
9.1-i 6 9i 5.9i i..$t i.*6 +.f.t .4 ?fr .{ 1'l
+.¿L
olJ
9.8? 6.?S J.r4 5.tr 4.8d 4.{t) $,.*s .f._iü 4.{9 .{1 1{r ,{ lra 1.96 1.91 1.8ú -r.$l i.6ó 3.5n J.+-1 J.Jü a io - 1a
-1-- r _1 I

I 8.86 S.5r i.i6 1.84 4.69' .{ t6 .{ '\Q ¡ a¡ ¡ nó


i.9s t.B6 i C8 -1.;-l 3.lD 3.,6ú 3.ii -i 35 ;.1.1 ;.I1. 3. ! s J.i./l ^aro
r-'l

I 9.68 &.36 i.+: {.89 '$.56 a 11


{.-l- { t,
+-L+ .{ fú} t aa üU _1. _1. Joi -1.9i _r._]s, i.i: 3.31 i.)1 _3.t3 3,$S 1.98 r.ü,,
., _1
,rr5
I $._i,r 6.:3 i.tq +- r +.++
-,
-+
i iu
'lfi -d
+_uJ ef l.Sq i.¡-S _i.6* l.tl -i._i5 'l,iú' 3.ái j .át -¡.16 l.!$ i.$l t.gi t.só ll :-
#0J
I 8.4* S.¡ ! i.ts 4.61 .f .ij +_iu a lrn
_\--{-r i.i9 -r.6s J--ry
a --a i a1
-r--l- +o +{i J.JJ_a J 51 -i-i0
_1 -1-1ft,¡ t.El 1..81 I 16 1Á v!
DO
I s.tg 6.sÍ i 09 +.5S 4li ,{ S1 3.$.3 l.lt i É* _1-_r.¡ J.+_r'n J-J, -1-1i J.:t i t.t 3 $8 t.9? :84 1.lS 2.68 t.)1.4 I
? --1 . a 11 114
-a
É.i"$ r.93 i.*! { aA
+--lU
q al
i-¿ l ) i-L -\- J I 3.63 i.i2 -i-+i -j.-.0 j is i.r4 3.r9 i.ti _3.#] Ls4 t.?6 r.?i l.ú$ oo
¿s 5 s5 +.9j t ¿a
1 0a f titJ"
+ a^
:ri6 3+6 --1--1 11n,
-1.S9 :.9{ t.7$ l,.sf 1..64 .1.54
'1 D-
s +- +-+-1 D! _\-)u ¡ _r ^la J ),;i _i .iJ _r.-: U J. !_a op
$.st i.is 4.sl l-_1 -¡ +-Vr+ :i.8f -3-# ,r-J ¡ -1-+U
J ¡ra ¡ ñ¡
! J.-4 _1_J J. !. i J. É J -1.Lr .. l.*i t.ss l.7l \ a.4 'l i0 'l .40 '1 l
Qa.
i.S-\ l.ll .C
¡
Sl +-_1i -1.y>r na
IO
1 An.
J__jy 3.45 l.3i I.16 i. t8
_1 -1 ril J i,i.i
a ñ1
J.U-. 2.98 l.gi ?.67 : i$ 1.5i l.4l ilLn
ll +
t.88 -i.66 4-16 $.]6 3.94 a atI 1*-{ f.{^t a \1
)., ¿
-1_ |
I t t
J- l+ _r__r+
t ¿l a 1d
-1--1Ll
_1-\J J J. J-
1ñ1
:.' I ?.9i l.r$ :.61 1i4 :.49 l.il bd
ai ñ1
-üJ -- ¿t
J-Ut 4 a1
+, Ji 4.:t -t.9$ i.6t _i.i$ -i.ié 316 -i. I ¡ J.UY :i03 1.98 ].9-1 r..s9 t.?$ r.58 ? $9 :..$.1 l.3l :.: I
o
l.?l 55t +ós $. t 8 i.8i _1.S_{ 4C 3.J] l.f,l -i-lr -l.LJu _{ t-99 t.s4 l.sg 1.85 l.?$ l.i* 1 .{i 1 .{n 1 'rca
t.i
l --¡
l.ll _i.53 4.64 {.¿.t 3.81 J.J;q a ¡1
J-+¿ :_t9 i-Éc ,1_tIt J.u_ 2.96 t.g$ :.$6 2.8 E l. d.6 L.5S 1.{1
¿.li
1:É u
!
-,
11i Li
?.6$ i..f+ 4-6S +_át -r- ¡
t.i6 3.39 3,:,6 i.ii 3.{t'6 : 9E
I I ¡ a¡
1ü t_93 l.sl ).81 I ls :.ú3 3...11 I38 ?.3-i l.:l f1
i. I \
¡
?.ó4 i.si 4.,\l +_ül^1
n a{-
J_ l_r -i-],'r -t--{0 r lJ 3.tl l.*J : 96 :.9S l$.1 ll9 l.l5 2.ds 2.=t4 l i5 r..rs I l9 '1 {t :
5
;.6ü i..$l 4.i4 ¡ ñr f a1
+_\.ñ+ J. .¡ _1
1i¿
J-JU
\+f
J.JJ
afñ
J-!U
1m
-1.d')l _r.fflf -
y_1 l.$? t.st t.l? : ?3 :..51 1.4t ).33 2.Ij r1.ló -
ñ
l.i6 J.i$ 4.5! ^41
1añ
J.+ J a!^
J-,tv
a la
3 zf
>
^a
-l-Ll/ :.9S :.91 ? 94 I :-9 l.i-t t.i8 :.-\5 :.39 3 is t.t5 l.:l
a 1r -- iñ
I__1_t _r-;.ü
¡ 1a
+-_13"
1na
_l-J_1
1 *-l
J__r i
{ a-4
J--:
1 }a
_r- [¿ I99 ]..r9 1 ó&
- ¡IJ
1 a-
¡-l-1 : ó6 t.61 l.iú r 5; 1...3j l.:$ : $" l.ü6 :.94
l.j,l -r.0ó 4.lS i aa
f- r;
+ ¡t
-a.i t
1 t¿
_r t:f
1
i_u-
^1 t.s9 1...lg t.l* t.6! l.i6 l.it 1..-i6
a {a
4-+! a 1l¡
;.*. 1ln
¿. lV I *i r.95 !.Sl ?

?.$8 {.gfi .* ri _1-0_t -1* _r_ _i t: t.gi I Sl f.¡-,r :.Si f.:jd :19 t._ri l ls 2.$3 $.9.* s.ss !.]i
t.i$ l{4
7.Si .{.9: .t.$l ifs 319 J
a ñt
-ü.¡
1^t
L.Y t t.78 l.6l :.i9 :.45 l.-¡$ l. j j 3.-3! r 15 i.9$ 4l-ó:iñn *.:..'5J
r.51
n¡ i 1A
r. ru x

6.!Í6 .4 8E 4_0"{ 5._i6 i.?6 :1.S4 l.Sl r..l.i l_.6.$ t.:,j l,{8 t.41 1.36 2..?: t.tt t.i: i.g.t i.S! 1:-9 C.6,\ il
693 4S1 40i -\-,\t -)-;-r -i $: "t.s4 r.il I éi 1 i'l !_-,
a .{i I 39 l.i3 l 19 1a.* 1né to') t.st 3 t6 1.61. 7a
!,4_ ia il-
I ll i -j: l.f¡- r rl 1..$l i s9 t 8l 1.;-i t.ó.$ I -J-t
't Or
l0{ 6.9* 4.8: 3.98 _!_J: J -¡ 1d-t
i.tY
1 ña
:-ü- r:.69 I i9 1 .:fr -t: ür
ú 64 4.é¡ i.¡-$ -_1- -Ui_r _a
f Q¡. a Á.{ r.ji :.41 t._it. l.li r.t9 rfi t.$s t.{4 tss i70 I )g I 5i 1.3é I
456 ' Tablas Estadísticas

Tabla 7-. Puntos porcentuales.de la distribución


de los rangos signados de-Wilcoxon

Nivel de probabilidad (o)


n 0.005 0.01 0.02s o.0s 0.r
4 0 t, 0 0l
5 0 U 0 l3
6 0 0 I 34
7 0 I J 46
8 I 2 4 69
9 2 4 6 9 11
10 4 6 9 l1 15
ll 6 8 1l 14 18
t2 8 10 14 l8 22
13 l0 13 l8 22 27
t4 13 t6 22 26 32
15 16 20 26 31 37
16 20 24 30 36 43
l7 24 28 35 42 49
1s 28 JJ 41 48 56
19 33 38 47 54 63
20 38 44 53 61 70
2t 44 50 59 68 78
11 49 s6 67 76 87
23 55 63 74 84 95
24 62 70 82 92 105
25 69 11
90 101 114
26 '76 82 99 lll 125
27 84 94 108 120 135
28 92 t02 117 i3 I 146
29 101 1ll t2l 141 158
30 110 121 138 152 ll0
3l 119 131 148 164 182
32 129 141 160 t76 195
33 139 t52 171 188 208
34 149 t63 183 201 222
35 160 115 t96 214 236
36 t72 187 209 228 251
37 184 199 222 242 266
38 196 2t2 236 257 282
39 208 225 250 272 298
40 221 239 26s 281 314
4t 235 253 280 303 33 1

42 248 267 295 320 349


43 263 282 3ll 337 366
44 217 297 328 354 385
45 292 313 344 372 403
46 309 3?9 JOZ 390 423
47 324 346 319 408 442
48 340 363 391 428 463
49 3s7 38r 416 441 483
50 374 398 435 467 504
+o(

Tabla 8. Puntos porcentuales de la distribución de la


prueba de Kolmogorov-Smirnov

Nivel de probabilidad (a)


n 0.1 0.0s 0.02 0.01 0.005 0.002 0.001
5 0.509 0.563 0.627 0.669 0.705 0.750 0.781
6 0.468 0.5 19 0.577 0.617 0.653 0.696 0.725
7 0.436 0.483 0.53 8 0.576 0.610 0.651 0.679
8 0.410 0.454 0.507 0.542 0.574 0.614 0.641
9 0.3 87 0.430 0.480 0.5 l3 0.544 0.582 0.608
10 0.369 0.409 0.456 0.489 0.5 19 0.555 0.580
11 0.352 0.391 0.437 0.468 0.495 0.531 0.556
12 0.338 0.375 0.419 0.449 0.477 0.510 0.534
13 0.325 0.361 0.404 0.432 0.459 0.492 0.515
t4 0.314 0.349 0.390 0.418 0.444 0.475 0.498
15 0.304 0.338 0.377 0.404 0.429 0.456 0.482
t6 0.29s 0.327 0.366 0392 0.4t6 0.446 0.468
l7 0.286 0.318 0.355 0.381 0.405 0.434 0.455
18 0.279 0.309 0.346 0.371 0.394 0.422 0.442
l9 0.271 0.301 0.337 0.361 0,384 0.412 0.431
20 0.265 0.294 0329 0.352 0.375 0.402 0.421
2t 0.2s9 0.287 0.321 0.344 0.366 0.392 0.411
22 0.253 0.281 0.314 0.337 0.35 8 0.384 0.402
23 0.247 0.275 0.307 0.330 0.350 0.376 0.394
24 0.242 0.269 0.301 0.323 0.343 0.368 0.386
25 0.238 0.264 0.295 0.317 0.337 0.361 0.377
26 0.233 0.259 0.290 0.310 0.330 0.354 0.371
27 0.229 0.254 0.284 0.305 0.324 0.348 0.365
28 0.225 0.250 0.279 0.300 0.3 19 0.342 0.358
29 0.221 0.246 0.275 0.29s 0.313 0.336 0.3s2
30 0.218 0.242 0.270 0.290 0.308 0.331 0.347
31 0.214 0.238 0.266 0.285 0.303 0.326 0.341
32 0.211 0.234 0.262 0.281 0.299 0321 0.336
33 0.208 0.231 0.258 0.276 0.294 0.3 16 0.33 1

34 0.215 0.227 0.254 0.2v3 0.290 0.31 l 0.326


35 0.202 0.224 0.251 0.269 0.286 0.306 0.322
36 0.1 99 0.221 0.247 0.265 0.282 0.303 0.318
l7 0.1 96 0.218 q 244 0 252 0.278 0.?99 0.31 3
38 0.194 0.215 0.241 0.258 0.275 0.295 0.309
39 0. l9l 0.213 0.23 8 0.255 0.271 0.291 0.305
40 0.1 89 0.2t0 0.235 0.252 0.268 0.288 0.302
4l 0.1 87 0.208 0.232 0.249 0.265 0.284 0.298
42 0.1 85 0.205 0.229 0.246 0.262 0.281 0.295
43 0.1 83 0.203 0.227 0.243 0.2s9 0.278 0.29t
44 0.181 0.201 0.224 0.241 0.2s6 0.275 0.288
45 0.179 0.1 98 0.222 0.238 0.253 0.272 0.285
46 0.177 0.1 96 0.219 0.235 0.250 0.269 0.282
47 0.175 0.194 0.217 0.233 0.248 0.266 0.279
48 0.173 0.192 0.215 0.231 0.24s 0.263 0.276
49 0.171 0.r90 0.2't3 0.228 0.243 0.261 0.273
50 0.170 0.1 88 0.21t 0.226 0.240 0.258 0.271
1.22 1.36 1.52 1.63 1.73 r.85 : l.es
.,t, .,1, ^'1" 'ln .,tn "ln ^'ln
458 Tablas Estadísticas

Tabla 9. Puntos porcentuales para la prueba de Grubbs

Nivel de probabilidad (o)


n 0.10 0.05 0.02
3 Ll5 1.15 Ll5
4 1.46 1.48 1.49
1.61 1,71 t.75
6 1.82 1.89 |.94
7 1.94 2.02 2.10
8 2.03 2.13 2.22
9 2.11 2.21 2.32
l0 2.18 2.29 2.4t
ll 2.23 2.36 2.48
l2 2.29 2.41 2.55
13 2.33 2,46 2.61
t4 2.31 2.51 2.66
t5 2.41 2.55 2.71
l6 2.44 2.59 2.75
t7 2.4',7 i-i
2.62 2.79
;l
18 2.50 2.65 2.82
l9 2.53 2.68 2.85
20 2.56 2.7 t 2.88
2l 2.5 8 2.73 2.91
tt 2.60 2.16 2.94
23 2.62 2.18 2.96
24 2.64 2.80 2.99
25 2.66 2.82 3.0 r

30 2.7 5 291 3.03


¿
t
i

f
f;
tr

i
*
459

Tabla 10. Puntos porcentuales de la distribución


del coeficiente de correlación de Spearman

Nivel de probabilidad (o) - bilateral


n 0.005 0.01 0.02 0.05 0.1
4 1.000
5 1.000 1.000 0.900
6 1,000 L000 0.943 0.886 0.829
7 0.964 0.929 0.893 0.786 0.714
8 0.905 0.881 0.833 0.738 0.643
9 0.867 0.833 0.783 0.700 0.600
r0 0.830 0.794 0.745 0.648 0.564
1l 0.800 0.755 0.709 0.618 0.s36
12 0.776 0.727 0.671 0.587 0.503
13 0.747 0.703 0.648 0.560 0.484
l4 0.723 0.675 0.622 0.538 0.464'
l5 0.700 0.654 0.604 052t 0.443
l6 0,679 0.63 5 0.582 o.sp3 0.42e
t7 0,662 0.615 0.566 0.485 0.414
t8 0.643 0.600 0.550 0.472",,0.401
19 0.628 0.584 0.535 0.460 ' 0.391
20 0.612 0.570 0520 0.447 0.380
2t 0.599 0.556 0.508 0.43s' 0.370
22 0.586 0.544 0.496 0,425 0.361
23 0.573 0532 0.486 0.415 0.353
24 0.562 0.521 0.476 0.406 0.344
25 0.551 0.51 I 0.466 0.398 0.337
26 0.541 0.501 0.457 0.390 0.331
0.531 0.49t 0.448 0.382 0.324
28 0.522 0.483 0.440 0.3 75 0.317
29 0.5 l3 0.475 0.433 0.368 0.312
30 0.504 0.467 0.425 0.362 0.306
31 0.496 0.459 0.418 0.356 0.301
32 0.489 0.452 0.412 0.3s0 0.296
33 0.482 0.446 0.405 0.345 0.291
34 0.475 0.439 0.399 0.340 0.287
35 0.468 0.433 0.394 0.335 0.283
36 0.462 0.427 0.388 0.330 0.279
37 0.4s6 0.421 0.3 83 0.32s 0.27s
38 0.450 0.415 0.378 0.321 0.271
39 0.444 0.410 0.3'73 0.317 0.267
40 0.439 0.405 0.368 0.3 3
1 0.264
4l 0.433 0.400 0.364 0.309 0.26t
42 0.428 0.395 0.359 0,305 0.257
43 0.423 0.391 0.3 55 0.301 0.254
44 0.419 0.3 86 0.351 0.298 0.25t
45 0.414 0.382 0.347 0.294 0.248
46 0.410 0.378 0.343 0.291 0.246
47 0.405 0.374 0.340 0.288 0.243
48 0.401 0.370 0.336 0.285 0.240
49 0.397 0.366 0.333 0.282 0.238 -
50 0.393 0.363 0.329 0.279 0.235
460 Tablas Estadísticas

Tabla 11. Puntos porcentuales de la distribución


del coeficiente de Mann-Whitnev

Nivel de probabilidad cr: 0.025

n2 z 3 4 s 6 7 8 e r0 li 12 13 t4 ls 16 t7 i8 le z0
2 00 00001111222223333
J 00 01223344556611889
4 00 | 2 3 4 5 5 6 7 8 9 10 11 t2 12 13 14 15
01 2 3 4 6 7 8 9 10 12 13 14 ls 16 r8 19 20 21
6 02 3 4 6 1 9 ll 12 14 15 11 18 20 22 23 25 26 28
7 02 4 6 I 9 ll 13 15 11 19 21 23 25 21 29 31 33 35
8 t3 5 7 9 11 t4 16 18 20 23 25 21 30 32 35 31 39 42
9 l3 5 8 11 13 16 18 2t 24 27 29 32 35 38 40 43 46 49
t0 l4 6 9 12 15 18 2t 24"21 30 34 31 4A $ 46 49 53 s6
ll l4 1 10 14 l7 20 24 21 31 34 38 41 45 48 52 56 59 63
t2 25 8 12 15 19 23 27 30 34 38 42 46 50 54 58 62 66 10
l3 25 9 13 lt 21 25 29 34 38 42 46 51 55 60 64 68 73 17
t4 26 l0 14 18 23 27 32 37 4t 46 sl s6 60 6s 10 ]s 19 84
l5 26 ll 15 20 25 30 3s 40 45 50 55 60 65 7l ',76 Bl 86 91
l6 27 12 16 22 21 32 38 43 48 54 60 65 11 13 82 87 93 99
\7 31 12 18 23 29 35 40 46 52 58 64 10 16 82 88 94 100 06 1

l8 38 13 19 2s 31 37 43 49 56 62 68 11 81 87 94 100 107 113


t9 38 14 20 26 33 39 46 53 59 66 73 19 86 93 100 r07 114 120
20 39 15 2t 28 35 42 49 56 63 70 11 84 91 99 106 113 r20 128

Nivel de probabilidad c = 0.01


nr
n2 2 3 4 5 6 7 8 9 l0 11 t2 13 t4 15 t6 t7 l8 19 20
1 0 000000000011111122
J 0 000011222333445ss6
4 0 0 0 1 2 2 3 4 4 s 6 6 7 8 8 9 10 l0 tl
5 0 0 l 2 3 4 s 6 I 8 9 l0 11 12 13 t4 ls 16 17
6 0 0 2 3 4 5 7 8 9 l0 t2 13 14 16 16 19 20 2t 23
7 0 1 2 4 5 1 8 10 12 13 ls 17 18 20 22 24 25 21 29
8 0 1 3 5 7 8 10 12 14 16 18 2t 23 25 21 29 31 33 35
9 0 2 4 6 8 10 t2 ls 1',7 19 22 24 27 29 32 34 37 39 41
10 0 2 4 7 9 t2 t4 17 20 23 25 28 31 34 31 39 42 45 48
ll 0 2 5 8 10 13 t6 19 23 26 29 32 35 38 42 45 48 51 54
t2 0 3 6 9 12 15 182225293236394341 50 54st 6l )i
{
13 1 3 6 10 13 17 21 24 28 32 36 40 44 48 s2 s6 60 64 68
t4 1 3 I 11 14 18 23 27 31 35 39 44 48 52 51 64 66 72 14 *
15 I 4 8 12 t6 20 25 29 34 38 43 48 s2 57 62 61 71 76 8l
t6 I 4 8 13 17 22 27 32 31 42 41 52 57 62 61 12 t1 83 88 ,

5 9 14 t9 24 29 34 39 45 50 s6 61 67 12 78 83 89 94
.:

t7 I
I
18 I 5 l0 15 20 25 31 37 42 48 54 60 66 71 77 83 89 95 101 rl

l9 2 5 l0 16 21 27 33 39 45 51 51 64 70 16 83 89 95 102 108 f
20 2 6 ll 17 23 29 35 41 48 54 6t 68 t4 81 88 94 101 108 115
ü
&
:j,

También podría gustarte