Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadistica Metodos y Aplicaciones de Edwin Galindopdf PDF
Estadistica Metodos y Aplicaciones de Edwin Galindopdf PDF
ESTAASVTCA
illétodos y Z\pficaciones
Iidütin Galinclo
En cualquier actividad de Ia ciencia, la técnica, Ios negocios o de la vida cotidiana, que dé como
resultado una serie de mediciones, se obtiene más información que las simples cifras recolectadas. El
cómo conseguir la información, su análisis e interpretación se puede realizar de muchas maneras, pero
primero se debe tener una idea clara de las características más importantes de los datos obtenidos.
Los datos pueden ordenarse en tablas; sin embargo, éstas no muestran su comportamiento global.
Su representación gráfica ayuda a captar fácilmente tendencias y establecer modelos probabilísticos.
Conjuntamente con el empleo de métodos numér'icos sencillos, se puede presentar datos, resumir in-
formación y dar una respuesta rápida del comportamiento global de Ias unidades de donde provienen
dichos datos.
En este capítulo examinaremos varios de estos métodos, que son aquellos que frecuentemente aparecen
en los paquetes computacionales de estadística.
1.1. Introducción
En primer lugar, demos una definición de la ciencia Estadística que recoge mucho de lo que ella realiza.
Para su mejor estudio, a Ia EstadÍstica se Ia divide en dos grandes ramas: la Descriptiva y la Inferencial.
La Estadíst'ica Descriptiua -también conocida como Anó.lisis Erploratori,o de Datos- consiste, sobre
:odo, en la presentación de datos en forma de tablas y gráficos. Está diseñada para resumir o describir
los datos sin factores adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como
:ales.
Capitulo 7. AnáIísis Exploratorio de Datos
Para aplicar los métodos estadísticos a la información disponible, es necesario tener presente los tipos
de problemas que esta ciencia resuelve.
Análisis de muestras. Es frecuente que, por razones técnicas o económicas? no sea posible estudiar
los elementos de una población. Por ejemplo, para determinar Ia opinión de la población ante las
elecciones solo se investiga a un grupo pequeño, ya que es imposible consultar a todas las personas
en capacidad de votar. Análogamente, se acude a una muestra para estudiar la rentabilidad de un
proceso de fabricación o para de terminar el nivel de ocupación de la población.
La Estadística se utiliza para elegir una muestra representativa y para hacer inferencias respecto a la
población a partir de lo observado en la muestra. Este es el procedimiento aplicado para, por ejemplo:
Medición de relaciones. Los gastos en alimentación de una familia dependen de sus ingresos, pero,
es imposible determinar con exactitud cuál será el ga.sto de una familia de ingresos dados. Entonces,
no existe una relación exacta, sino estadística. Determinar y medir estas relaciones es importante
porque, debido a los errores de medición, las relaciones que observamos entre variables fÍsicas, sociales
o técnicas son, casi siempre, estadísticas.
Predicción. Muchas variables económicas y físicas tienen cierta inercia en su evolución y aunque
sus valores futuros son desconocidos, el estudio de su historia es informativo p¿rra prever su compor-
tamiento futuro. Este es el mecanismo que se emplea para prever la demanda de un producto, la
temperatura en un horno industrial o las magnitudes macroeconómicas.
7.2. Definiciones básicas
Para la obtención de información estadÍstica se emplean dos formas bien diferenciadas: los métodos
de muestreo y los experimentos diseñados.
Una investigación por muestreo es un estudio cuya finalidad es la recolección de datos y en el que
el investigador no tiene control sobre las condiciones o los individuos participantes. Ejemplos de
muestreos son los censos, las encuestas electorales o de consumo de un producto.
Un experimento es cualquier proceso o estudio en el que se realiza una recolección de datos donde el
investigador, usualmente, tiene control sobre algunas de las condiciones bajo las cuales el experimento
tiene lugar. Por ejemplo, en el desarrollo de un nuevo medicamento, en la preparación de una nueva
aleación de acero para usar en los automóviles, es necesario realizar experimentos para comparar su
efectividad con otros previamente existentes.
Las que antes indicamos son las principales aplicaciones de la Estadística, cuando esta ciencia se
utiliza para analizar procesos o fenómenos naturales a profundidad. Pero este no es nuestro caso, por
el momento, nosotros podemos pensar que la EstadÍstica es la ciencia de <<deducir hechos a partir de
datos y de figuras>>.
Aquí surgen varias ideas importantes en todo análisis estadístico: la unidad muestral,la población (o
uniaerso) y la muestra.
Definición (de unidad muestral o experimental) Una unidad es una persona, animal, planta o
cosa que es examinada por un investigador; es el objeto básico sobre el cual el estudio o experimento
se lleva a cabo.
Definición (de población o universo) Una población es una colección completa de personas,
animales, plantas o cosas de las cuales se desea recolectar datos. Es el grupo entero al que queremos
describir o del que deseamos sacar conclusiones.
Generalmente, se selecciona una muestra porque la población es demasiado grande para estudiarla
enteramente. La muestra debe ser representativa de la población general, lo que se logra mediante
una selección al azar de las unidades. También, es importante que el investigador defina, completa
y cuidadosamente, la población antes de recolectar una muestra, incluyendo una descripción de los
miembros a ser seleccionados.
3. Una dueña de almacén desea estimar el gasto medio de compra de sus clientes en su almacén
en el último año. La población es todas las facturas de compra en el indicado periodo. Una
muestra de ciento veinte facturas seleccionadas aleatoriamente, serviría para tener una idea del
gasto medio de los clientes.
En los ejemplos anteriores solo se enunciaron posibles muestras para las distintas poblaciones, sin
importar que tan buena pudiera ser ésta.1
2. Cuantitativos (Numéricos): Cuando ellos describen caracterÍsticas que son medibles; por ejem-
plo, la temperatura del ambiente, el número de hijos de un matrimonio, el salario de una persona.
A su vez, las variables cuantitativas se clasifican en discretas y en continuas.
Datos discretos. Un conjunto de datos se denomina discreto si los valores u observaciones
que pertenecen a él son distintas y separadas; es decir, ellas pueden ser contadas (1, 2,3, ...).
Ejemplos de datos discretos son: el número de clientes que ingresa a un almacén en un día, el
número de años que vive una persona.
Datos continuos. Un conjunto de datos se denomina continuo si Ios valores u observaciones que
pertenecen a él pueden tomar cualquier valor en un intervalo considerado. Ejemplos de datos
continuos son: el tiempo que se demora en ejecutarse un programa en la computadora, el peso
de una persona.
Definición (de escala de medición) Una escala de medición es un instrumento de medida con
el que se asignan valores a las unidades estadÍsticas.
I
La elección apropiada de las muestras se explicará en profundidad en el CapÍtulo 13
7.4. Característ,icas de los datos
Escala nominal' Un conjrrnto de clatos cstá mecliclo en esca,l,a nomin,al si a los vaiorcs que pertcnccen
a é1 se lcs puedc asignar un código, en la forma cle nn nrimero, clonde los núrmeros
sor simpleme¡te ula
cticlueta' Los datos en escala nominal ptteclen ser contados, pcro no pueden ser orclen¿clos o medi¿os.
Por ejemplo) elr Lln registro de pclsonas, los hornbres pueden ser codificados como 0 y las mujeres
como 1; el estado civil de un indirriduo puede codifi.carsc como "1" si es casado y como ,,2,'
si no lo es.
Escala ordinal. IJn conjunto de clatos cstá medido <:n esca,la ord.inal si a los valores qne per.tenecen a
él se les puede asignar un orden o asociar una escala. Los datos en escala ordinal pueden
ser contados
y ordenados, pero no pueden ser medidos.
Las categorías, para un conjunto ordinal, deben tener un orden natural; por ejemplo, suponga que
a
ur grupo de personas se les pide que clasifiquen la calidad de la señal de las emisiones de radio, en
una escala de 5 a 1, que representan excelente, buena, regular, mala y pésima. Un puntaje de
b indica
mejor señal que un puntaje de 4. Así, los datos resultantes son ordinales.
Escala de intervalo. Un conjunto de datos está medid o en escala d,e interualo si los valores que
pertenecen a él pueden tomar cualquier valor dentro de un intervalo finito o infinito, con
la particula-
ridad de que existe un <<cero relativo>>. Los datos en escala de intervalo pueden ser contados, ordenados
y son válidas las operaciones de adición y sustracción) pero no las de multiplicación y división.
Ejemplos de datos en escala de intervalo son: la temperatura medida en grados centígrados (donde
hay un cero elegido arbitrariamente), los puntajes obtenidos en una pruebalaonae un puntaje
de cero
no significa que quien lo obtuvo no sabe nada).
Escala de razón. Un conjunto de datos está medido en escala d,e razón si los valores que pertenecen
a él pueden tomar cualqnier valol dentro dc un intcrvalo finito o infi.nito, con Ia particula'idad
de que
existe un <<cero absoluto>>. Los datos en escala de intervalo pueden ser coritados, ordenados y
son
válidas las operaciones de adición, sustracción, multiplicación y división.
Ejemplos de datos en escala de lazón son: la temperatura medida en grados Kelvin (doncle
hay un
cero absoluto), la estatura de una persona, cl tiempo de vida úrtil de una máqnina.
1.3.3. Valoresatípicos
Un valor atípico -también denominado valor inusual o valor extremo- en un conjunto de datos,
es
t una observación que es lejana, en valor, del resto de datos; es clecir, es un d.ato inusualmente
grande
o innsnalmente pequeño, cotriparado con Ios dern¿is.
Un valor atípico ¡>uede ser el rcsultado de un error en una medición, en cuyo caso distorsiona Ia
interpretación de los datos al tetrer una influencia excesiva sobre los cálculos a partir
de la muestra.
Si el valor atípico cs un lesultado genuino es importante, porque podría indicar nn
compoltamicnto
S extremo del proceso en estudio. Por esta razón, toclos los valores atípicos deben
ser exarni¡ados
) cuidadosamente antes de rcalizar un análisis formal y no se los debería eliminar
sin una.justificación
pre\¡1a.
Todo conjunto de datos presenta ciertas características que perrniten, en rlna pr.imera
aproximación,
deducir el comportirmiento dcl proceso del cr-ral fueron obteniclos. Las tres principales
características
son: la localización, la dispersión y la simetría.
Capítulo 7. AnáIisis Exploratorio de Datos
o tr ocalización. La krcaliz¿tción <le nn conjrrnto clc clatos cs la Posición lelatir'¿r cltic cllos lllesentan.
En gc'rrcr:rl, se rrricle ¿L la localiz¿rción lror cl valcil que tiene el pLrnto mr:clio clel corrjurrto c.1e clatos.
Por cljernplo, r,:rr la rnedici<in cl<r la r¡st¿rttu'¿r rl<,r lrrr grlipo de personirFj) l¿)s medicioncs est¡rr'án
entre los trcirrta centírnetlos (clc los rcciérr naciclos) y los cLos mctlos veinl,e centíne-
localiza,cl¿¡.s
tros (clc los adultos muy altos), si se srrl>one qucl esta,turas rxayorcs no se prcsentar, y se pirede
caracterizal a todos ellos con una estatura prornedio de 1.70 mctros.
La iclea de localización fr-ic introcluci<la por R. A. Fisher er 7922.
Dispersión. Los valores obtenidos en url¿ mnestra no son todos iguales. La valiación cntre
estos valoles sc denomnzt dispe'rsión. Cu¿rndo sc mide la dispersión sc desea dctectar el grado
de disemirración de los valores individuales alrededor del centro de ias observaciones.
En los procesos de manufactura o de medición) una alta precisión está asociada con una baja
dispersión.
El concepto de dispersión fue introdr.rcido por F. Galton (en 1886) y por W. Lexis (en 1887) e
identificado como aqrrel en el que se reflejan las cliferencias entre las mediciones) provenientes de
una misma fuente o tomadas en condiciones semejantes.
Simetría y asimetría. Un conjunto de datos es sirnétrico cuando los valores de los datos están
distribuidos en la misma forma por encima y por debajo de su punto medio.
Los datos simétricos:
1. Son fáciles de interpretar, pLles los dal;os c¡re están por encima y por debajo del pr.rnto medio
pueden sel considelaclos con un misrrio critcrio;
2. Pelmitcn la fácii detección de valores atÍpicos;
d. Adrniten la comparación con conjurrtos de datos similales, en tér'minos de la dispersión.
La asimctría cn un conjrtnto cie datos es el ¿lgrtrpaniiento que ellos Jrresentan a un lado de su centro
Los valores situados a un lado de la rnitacl clc los datos ticnclen a estar rnás alejados qrre 1os \¡¿rlores
clue se enclrerrtran cn ei otro l¿rdo.
La distribuci,ónde ,f'rec'u,en"cias cs Lrrre herrarnicnta que se emplea para resurnir', mediantc una tabla,
nurnerosos d¿tos dc rnancra qlle sc ponga de maniliesto l¿ loc¿rlización y Ia clispersión de l¿rs ol¡serva-
cloLcs.
7.5. Distríbución de frecuencias
Con ltna tabla de frccuencia,s se puedcn resurnir- da,tos ctrtegór'icos, nominales u ordiuales. Si los clatos
son continrros se pr-rede lesumillos l.ln¿r \rez qlle se los ha dividido cn grupos serrsiltlcs.
Si se dispone (le un núrrnelo alto dc obsclvacioues) r¿, se procede ¿r cstablccel cr,rántas vcccs se rcpite
cada nrta de ellas, pala cletelrninar sn frecu,en,ci,u o,bsolutct, n". A par:til dc esta información bá,sic¿r se
puede obtencl o1,la, que es converriente poncrla etl nna tabla.
Par'¿r la confección de ltna tabla, de distribución dc frecuencias es lecomcrrdablc segu.ir los sigrrientes
Pasos:
Procedirniento.
1. Se ordenan los datos tr7) :[2) . . ., rk en ur]a columna, de forma ascendentc, poniendo a continuación
k
sus frecuencias absolutas n1, TL2¡ ...¡ n¡. Nótese que D rLi: n.
i:r
2. Luego se forma una tercera columna en la que se pone Ia frecuenc'ia relat'iua; que resulta de
dividir la frecuencia absoluta n¿ para el núrmero total de observaciones: /¿ - 3. Xo es más que
TL
la proporción de aparecimiento de cada observación.
3. Pueden, también, calculalse dos columrlas correspondientes a las fi'ecuencias acumuladas, tanto
absoluta como relativa, que resultan de sumar las frecuencias de todas las observaciones ante-
riores hasta la considerada inclusive. Muchas veces, a las frecuencias relativas se las pone como
porcentajes, en lugar de números flaccionarios.
Ejemplo. En nna fábrica de muebles de rnaclera, se contlolóe1 tiempo (en minutos) neccsario para
completar un trabajo cle armado de ciertos anaqueles. Se obturrieron las siguientes mediciones del
tiempo empleado por los obreros:
32.9 JJ.4 33.9 tao JJ.J 32.8 J.).1 .1.). i ) J,]..) 33.5
Dt ¡<
.)r).J 33.6 1') n .),). I 33.6 óó.4 33.6 33.8 33.9 t')
.)J. J
o
34.0 il :'t3.0 tD OD D
óó. DD
rlJ.+ r',
,1,1. ,),).4^ JJ.J JÓ.+ 33.6 33.6 /
.)t r '12 r) ,j.l 1
r)r).J 33.6 33.0 JJ.1 33.6 JJ.U 33.6 33.1 33.8
,),
J.J. / ,-),1., ) 33.8 JJ.
1
1 .),)..) 33.0 .).) ,.) 33.4 ÓJ. iJ 33.0
Capitulo 7. Análisis Exploratorio de Datos
La sigr-riente taJrla rrnrestra l¿i clistril¡rrción cle flecrrerrci¿ts dc clatos illrliviclrt¿rlns (crr 17 r':rl,rres).
Sc ha presentado una distribución de frccuencias para 100 datos individuales, pero la tabla pr-rede
Ilegar a scr exterlsa; y si bicn prescnta la, información resunicla, puede ser conveniente resumirla aúrr.
rrrtis, c;r'eando cl¿rses. La agrr-rpac:ión cle clatos cn cl¿rscs sirnplificir Ia presentación y el estuclio cle la
distribución) allnqlle se pierden algunos rleta,lles.
A continuaciórr sc enLlnleran los ptrsos a scguir para constrllir una clistribr-rción de fiecnenci¿rs cle dat,os
agmpatlos en cl¿rses:
Decida el número de clases (ft). La siguienl,e talrl¿r puccle clar rura olientación adccuada cn
Ia rnayor'ítr de los casos.
201 - 500 o
501 - 1000 10
rnás clc 1000 t|-20
Calcule la iongitud de ia clase. La longitrrcl clc la cl¿lsc cs igual a Ia obsclrración rnayol menoil
dividido por cl nLilrrero de clases. Rcdonclcc este rcsulLado pala obtenel rrn rrúrnrero
li1 ttrcnor,
cor)venicnte) que tenga el mismo níurelo de decimales qlre los d¿rtos.
/nráx - frnín
.4
k
,) Construya las clases indicando los cxtremos de Ias misrnas. Cor¡ro ayllda parzr cálculos
J)ostcIioICS:
a) El extremo inferior' (16) plimera clase será cl lírrrrero ilrnediatarnentc rnerror- a1 r'alor'
de 1a
mÍnimo, quc tierle rrn clecirn¡rl rnás y qlle terlnrna cn cnco-
7.5. Distribución de frecuencias
5. Calcule las columnas restantes. IJna vez que tiene la frecuencia absoluta, proceda a calcular
las frecuencias lelativa y acumuladas) como se explicó anteriorrnente.
Observación. El número de intervalos puede variar del inicialmente estimado al redondear el valor
de la longitud del intervalo y que se cumpla el paso 3 a).
Ejemplo. (Continuación.) Construir una distribución de frecuencias por clases de los datos de las
mediciones del tiempo necesario para armar anaqueles.
Solución: De acuerdo a la tabla los datos se distribuirán en k:7 clases. Los máximos y los mínimos
son:
r^5* -- 34.4, rmí. : 32.7, rmáx - trni. : L.7,
1n
longitud de la clase : ::: :0.24,
7
Ls : Le -l A:34.25 *0.2:34.45
Nótese que por efecto del redondeo en Ia longitud del intervalo ha dado un total de 9 clases. Queda
para el Iector realizar el mismo ejercicio redondeando la longitud de Ia clase a 0.3.
10
Capítulo 7. Análisis Exploratorio de Datos
1.6. Representaciones gráficas
de los datos
una rnanera rntly eficiente cle co'oce.
gráficamente' ya que permite
el corn¡lo.ta'riento de un conjunto
dar rtna descripciin a. cre datos es re¡rrese'tar.lo
-"r,lr" rápida y ráit de entender. La importancia
i: ::rff ;Tfi:,::l il:T:T.5 f*13¡,T# l.:, :ll" : ".o an ¿,isis ". t J.t i"o de b e ir acomp añado
i'if?sii u.,n*
Figura 1.2: Diagrama de puntos.
1. Los datc¡s están agnrpados ccrca del valor 3, antes que, digamos B o 10.
2. Las observaciones sc cxtiencleu en ah'ecledor clc 17 uriidacles) con Llua concentración entre 0 y 8.
o
a 3. EI valor 16.4 puede ser calificado de atípico, porque se clcuentra alejado del grupo principal de
o datos.
El diagrama de tallo g hojas, que es una técnica semigráfica que se emplea para ilustrar las principales
características de los datos (localización, dispersión y simetría). Además, tiene la ventaja de presentar
Ios valores de los datos. Por la forma en que se construye, se debe emplear para un conjunto de hasta
100 datos.
08 19 77 01 07 09 05 16
13 04 15 02 00 o4 01 12
es)
tar A los datos los clasificaremos considerando las decenas; así tendremos dos grupos, uno que empieza
trá con 0 y otro que empieza con 1. Ellos forman el tallo, al colocarlos de manera vertical:
)o
0
rar 1
lue
A continuación, para cada observación anotamos el segundo dígito (de las unidades) a la derecha de
la barra vertical, que vienen a constituir las hojas. La primera observación 08 da
las
üar
0
1
006
Al agregar la segunda observación 19, da
0 8
1 9
0 8L79542041
1 976352
Los valores que forman las hojas pueden reordenarse de menor a mayor, así:
0 0LI2445789
1 235679
12 Capítulo 7. Análisis Exploratorio de Datos
Podemos crear dos categorías en cada una de las decenas, en las cuales los dígitos de las unidades del
0 al 4 formen un F,rupo y los dígitos del 5 a 9 foimen otro; de esta manera se tiene:
t) r42047
0 8795
1
to
¿¿
1 9765
Cuando los datos constan de más de dos cifras, se deben escoger los rangos para las agrupaciones
que se realizarán;luego aI llcnar las hojas se separan mediante una coma para evitar confusiones. Si
disponemos de los siguientes datos:
qD
DJ 55 79 106 188 47 118 248
47 58 82 113 208 60 88
que está agrupado por centenas. El siguiente diagrama está agrupado en intervalos de 50:
0 33,47,47
0 55,58,60, 79, 82,88
1 06, 13, 18
1 88
2 08, 48
2
Asimismo, se pueden usar diagramas múltiples para comparar dos conjuntos de datos, para ello se
coloca un tallo común y las hojas de un conjunto se ponen a la izquierda del tallo y las hojas del
segundo conjunto a la derecha del tallo, de la siguiente manera:
4371 1 44
ft 9888655 1 5779
310 2 0L23344
99875 2 678
311 3 03
.) 5
4
Se observa que los datos de la izquierda están más agrupados en los valores bajos, con un rango mayor
y fuerte asimetría; mientras que el conjunto de la derecha es muy simétrico y con menor dispersión.
También, se emplean estos diagramas para representar datos con decimales; por ejemplo, si tenemos
los datos:
1.3 0.8 1.6 2.0 r.7 7.2 0.5 1.9 0.6 2.2 0.5 1.6.
7.6. Representaciones gráficas de los datos 13
0. 5568
1. 236679
2. 02
FYecuencias Fbecuencias
Categorías
absolutas (n¿) relativas (/¿)
Ct u f,
Cz n2 fz
Cn ;, ir
Total n, 1
Un gráfico de sectores es un círculo dividido en segmentos, donde el área de cada uno de los sectores
es proporcional a la frecuencia relativa de esa categoría. El ángulo central de la categoría es igual a
fi x 360".
Junto a cada uno de los sectores que constituyen el gráfico, se suele indicar el nombre, el número de
elementos y el porcentaje de cada categoría.
También, se puede resumir datos cualitativos mediante rn gró.fi,co de baryas. En éstos, los datos
se exhiben mediante rectángulos, del mismo ancho, cada uno de los cuales representa una categorÍa
particular. La longitud (y por lo tanto el área) de cada rectángulo es proporcional al número de casos
en la categoría que representa.
Si los datos son nominales, las categorÍas se pueden colocar en cualquier orden; pero si los datos son
ordinales, las categorías deben estar ordenadas.
Los gráficos de barras se pueden presentar de manera horizontal o vertical y usualmente hay un espacio
entre los rectángulos. Junto a cada uno de los segmentos que componen el gráfico se coloca el nombre
el número de elementos y el porcentaje de cada grupo.
Con el gráfico de barras se distinguen las principales caracterÍsticas de los datos, como aquellas causas
que son más importantes o que más frecuentemente se presentan en un proceso. También, tiene la
ventaja de que se pueden realizar gró,,ficos de barras agntpadas, que consiste en representar sobre el
mismo gráfico más de dos variables -siempre que estén medidas en las mismas unidades-, permitiendo
realizar comparaciones,
Ejemplo. En una empresa financiera, los empleados disponen de computadortrs portátiles de distintas
marcas. Un resumen del número de máquinas, de acuerdo a su respectiva marca, se presenta en el
siguiente cuadro.
Toshiba
L.6.4, Histograma
El histograma es apropiado para datos continuos, medidos con una misma escala y se lo emplea
cuando un diagrama de tallo y hojas es tedioso de construir. Igualmente, puede ayudar a detectar
observaciones atípicas y cualquier brecha entre los datos.
Ejemplo. (Continuación.) El histograma correspondiente a la tabla de distribución de frecuencias
de los tiempos de ensamblaje de anaqueles se presenta a continuación.
Figura 1.4:
Un polígono de frecuenci¿s es un gráfico que se obtiene uniendo con segmentos de recta los puntos que
tienen proporcionalmente como abscisa a la marca de clase y como ordenada la frecuencia respectiva.
Se cierra en ambos extremos en las marcas adyacentes con frecuencia cero.
7.7. Ejercicios 15
La ojiua es un polígono de frecuencias acumuladas; es decir, en las abscisas se colocan los límites
superiores de cada intervalo de clase y en Ias ordenadas se coloca la frecuencia acumulada (absoluta o
relativa) de la clase. La ojiva es útil para:
Una vez que se ha confeccionado una tabla de frecuencias y se ha realizado Ia representación gráfica
correspondiente, es necesario disponer de valores que permitan describir y compara¡ los conjuntos de
datos, mediante números que indiquen su posición, su variabilidad y su forma. Ésto se realiza con las
llamadas medidas estadísticas o simplemente estadísticos.
L.7. Ejercicios
1. Dé ejemplos (preferentemente de su propio campo) de poblaciones y muestras.
2. Para cada uno de los distintos tipos de datos: discretos (categóricos, ordinales y nominales) y
continuos, enuncie al menos dos ejemplos. Justifique sus respuestas.
3. En una encuesta de opinión acerca de las preferencias de bebidas gaseosas, por sus colores: negro
l
(N), blanco (B) V R (rojo), 20 consumidores dieron las siguientes respuestas:
i
N, B, B, N, R, B, B, N, N, B, N, B, B, R, N, B, N, R, N, B.
I
Construya el gráfico de sectores circulares.
4. Los siguientes datos corresponden al porcentaje de alumnos de cuarto grado de escuela, clasifi-
cados según su rendimiento académico en la materia lenguaje.
Calificación %
Insuficiente 53
Regular 26
tre
Bueno 15
c) ¿.Qué porcenta.jc de los alurnrros cle cuarto graclo tien<:u urr renclirnierrto <<bucno>> o mejor
que bueno?
E
i). En Ia siguiente tabla se describe diferentes razas d<r perros, según varias caracterÍsticas obser-
vadas.
R,aza Tamaño Peso Velocidad Agresividad Función
basset 11 I 2 2
boxer' 22 2 2 I
bauceron 32 2 2 r)
bulldog 11 I 1 1
caniche 11 2 1 1
chiguagua 11 1 1 1
cocker 2I 2 2 1
colley 32 3 1 1
doberman 32 3 2 3
dogo 33 3 2 ,
r)
fox hound 32 3 2 2
galgo 32 3 1 2
labrador 22 2 1 2
mastin 32 3 2 3
pekinés 11 1 1 I
podenco 22 2 1 2
pointer 32 3 1 2
san bernardo 33 1 2 3
teckel 11 1 1 1
teI'ranor¡a 22 1 1 3
¡,Qué porcentaie del peso total del cuerpo humano corresponde al peso total de la piel?
7. Se registró Ia distancia diaria (en km) que el representante comercial de una empresa recorre
para visitar a sus clientes:
36 19 29 37 33 22 29 31 2L 35
2042534 24 27 27 24 26 31
27 77 31 10 28 15 41. 30 18 39
46 26 12 23 18 33 25 28 23 28
a) Elabore una distribución de frecuencias con 7 intervalos de clase;
b) Realice el diagrama de tallo y hojas;
c) Determine el porcentaje de empresas con una inversión entre 14 mil y 20 mil dólares.
9. Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una distribu-
ción de frecuencias simétrica de 5 intervalos de clase de igual amplitud, resultando como ingreso
mÍnimo 125 dólares, marca de clase del cuarto intervalo: 300. Si el 8 % de los ingresos son
menores que 165 dólares y el 70 % de los ingresos son menores que 275 dólares. ¿Cuál es el
porcentaje de los ingresos que son superiores a 285 dólares?
10. Se tiene la siguiente tabla acerca de las edades de los obreros de cierta empresa:
No. de
Edades
obreros
22-27 L4
27 -32 17
32-37 25
37-42 10
42-47 I4
12 Al clasifical las no+"as cle 0 a 100 cn un exarnen,se obtuvo una distribución simét,rica, con 5
intervalos de clase de iglral ancho. Si el 10% desaprotró con rnenos de20, rnientra-s qurcel 40o/o
obtlrvo notas comprendidas entre 40 y 60, ¿,qrré porcentaje de alurrinos obtuvo una nota rnenor
de 60?
14. Los pesos de n artículos se ordenaron en una tabla de distribución de frecuencias de 7 intervalos
de igual ancho de clase, donde: mín : 50 g, máx : 120 g.
a) Determine el valor de n;
Frec. absoluta
Intervalo Frec. absoluta Frec. relativa
acurnulada
640 - 680
680 - 720 48 60
720 - 760 0.r25
760 - 800 0.075
800 - 840
Determine el número de familias que tienen un ingreso menor a 800 dólares mensuales.
17. Dado el siguiente histograma de frecuencias relativas. ¿Cuántas observaciones hay en el rango
[c, /], si el total de la rnuestra es de 400? 2(
7.7. Ejercicios 1_9
Figura 1.7:
¿Qué porcentaje del consumo diario se utiliza desde las 19h hasta las 24h?
100
55
45
25
10
12 17
Figura 1.9:
go
20. Dada la ojiva correspondiente a los gastos en servicios de los hogares de una ciudad.
20 Capítulo 7. Análisis Exploratorio de Datos
/D
Figura 1.10:
Existe una amplia variedad de medidas de localización; nos concentraremos en las m¿ís empleadas: el
promedio, la mediana, la moda, la media geométrica y la media armónica.
rt*rz*.'.*rn Drn
i=l
&-
n
. Si las observaciones están agrupadas en una tabla de frecuencias de datos individuales como la
siguiente:
Observación Flec. absoluta
rI fLy
I2 n2
rk nk
k
Dnn'n
¿:t
&
sa
I: ---=-,
n
COn n: z_rn.
d:l
7,8. Medidas de localización 2L
2 I2 S2 r2 TL2
k t"¡ 9p ;r rLk
se calcula el punto medio cle cacla clase rromo iri :; l¿ I s¡' ' '
Q,:1,2,, .. , k) y el promedio es
k
I
i1
rr,¡ r¡ k
4. Es único.
;EI 5. Su principal inconveniente es que se ve afectado por la presencia de valores atípicos.
Ejemplos
Solución: Como las mediciones están agrupados en una tabla de datos individuales, aplicamos
Ia fórmula que considera la frecuencia de cada una de ellas.
Téngase presente que el número de clases €s k : 9 y el tamaño de la muestra es n: 46.
I
I n'¡r¡
r:i:l
n,
2x I.45*4 x 1.48+... +3 x 1.63 * 1 x 1.65
46
r.545.
3. En una cooperativa de ahorro y crédito se realizó Ia tabla de frecuencias de Ios montos de los
ahorros de sus socios (en dóIares), según se presenta en la tabla,
D'¿*n
Á t--l
TL
1.8.2. La mediana
La mediana fue por primera vez utilizada, como una medida de localización, por A. A. Cournot en
1843 y redescubierta por F. Galton en L882, año desde el cual su empleo se ha generalizado.
Definición (de mediana) La mediana de un conjunto de datos xr, z2: .. ., rn es el valor que se
encuentra en el punto medio, cuando se ordenan los valores de menor a mayor.
1.8. Medidas de localización 23
Se la nota como Q2 o Med y tiene la propiedad de que a cada lado del valor se encuentra el 50 % de
las observaciones.
Si los datos están resumidos en una tabla de distribución de frecuencias de datos individuales.
1. Ordene las observaciones de manera creciente, con sus respectivas frecuencias acumuladas.
2. Calcule I2"v red.ondee al entero más cercano. Determine en Ia columna de Ia frecuencia
acumulada a qué dato pertenece, comparando el valor obtenido con el valor de la frecuencia
acumulada que es igual o inmediatamente superior; éste valor es la mediana.
Si los datos están resumidos en una tabla de distribución de frecuencias por clases, la mediana
se determina por interpolación, asÍ:
1. Establezca en qué intervalo está el valor mediano. Para ésto, se determina la primera
n
clase cuya frecuencia acumulad.a se
a mayor o igual a Dicho intervalo se denomina clase
5.
med'iana.
2. La mediana se calcula con la fórmula
n,
; - nl-r
Med,: L¡_t-r
donde: =-A,
,L¿-1 es el límite inferior de la clase mediana.
At-r es la frecuencia acumulada del intervalo inmediatamente anterior al intervalo de la
mediana.
n¿ esla frecuencia absoluta de la clase mediana.
A es Ia longitud de la clase de Ia mediana.
La interpretación gráfica del cálculo de la mediana se encuentra en la Figura 1.11.
1. Es la medida m¿is representativa en el caso de variables que solo admitan la escala ordinal.
2. Es fácil de calcular.
.). En Ia mediana solo influyen los valores centrales y es insensible a la presencia de valores atÍpicos.
L¡¡ MC L¡
lal
Figura 1.11: Interpretación geométrica del cálculo de la mediana.
Ejemplos
5.5 6.9 7.0 3.0 4.8 4.t 3.2 4.3 5 5 6.5 4.3.
3.0 3.2 4.7 4.3 4.3 4.8 5.5 5.5 6.5 6.9 7.0.
t70 r72 168 165 L73 178 180 165 167 L72.
la
3. (Continuación.) Calcular la mediana de la estatura de 46 señoras, cuyas medidas son:
Soluci,ón: Las mediciones están agrupados en una tabla de datos individuales y el tamañ0,d,9,1,1i
muestra es n: 46. , . .iJ,ríiri,!
Calculamos 2 : ZZ y vemos en Ia columna de Ia frecuencia acumulada que hay los valoles 19 y
2
31, que cumplen que 19 < 23 < 31.
i"r;i'r;'irt:;'/
Así, Ia mediana es el valor cuya frecuencia acumulada es 31; es d,ecir, Q2: 1.55-.i "
4. Para la liquidación del impuesto a Ia renta, en una pequeña empresa, se calcularon lcs'ingbesoS
anuales (en dólares) de todos los empleados. La tabla de distribución de frecuencias es la
siguiente: ,i'¡_l-
Número de Fbecuencia
Ingreso anual
personas (n¿) acumulada (Nr)
,,,r.1 t,
2400 - 3000 3 3
3000 - 4200 20 23
,,r,; r ¡ix llri.il
4200 - 5400 35 58
5400 - 7250 25 83
7250 - 9000 15 98
9000 - 12000 2 100
Solución: Los datos están dados en una tabla de frecuencias por clases con r¿: 100.
* - *n-,
Med: L;I*TO
!{-es): : 4200 + tO:"rrg¡ :5L25.7. 'i rr,','i;trÍ :'.i r1i',¡'¡1,\q;?.
35
t;i ir1¡;({ l:
La mediana del ingreso anual de los empleados de la empresa oist25'.1¿lil*áJ]
'" -- 1--.\' lrii:Lli-'rr "i'j ..'ilrrrrrri
r
'rli;rl.lirll;l
Definición (de moda) L" moda de un conjunto de ddüob'es aquel valor que tiene la mayor
frecuencia absoluta.
Se la nota como Mo. Hay ocasiones en las cuales los datos pueden tener dos o más modas, o no puede
existir, cuando todos los datos tienen igual frecuencia. Para su determinación es útil construir una
tabla de frecuencias de los datos.
. Si los datos están resumidos en una tabla de distribución de frecuencias por clases, la m'6dr
"e
determina mediante la fórmula: ii ,,'t:) i, ri ) lfl;'{
donde:
tr¿-1 es el límite inferior de la clase modal.
d1 es la diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.
d,2 es la diferencia entre la frecuencia de la clase modal y la frecuencia de Ia clase siguiente.
Aunque la icle¿r de <<valol rn¿1s fiecuente>> es mny trrrtigurr, no fue ernpleacla en estaciística, dc rn¿lnela
forrnal, hasta c¡re Ia po¡lrlirlizó K. Pe¿u'son en 1894.
2. Es la única medida de Iocalización que ptiede obtenerse en Ias variables de tipo cualitativo.
Ejemplos
9.4 8.1 9.0 5.6 7.0 9.0 6.5 9.0 3.8 7.0.
Soluc'ión: La moda de este conjunto es Mo:9.0, que es el valor que más veces se repite.
3. Para la liquidación del impuesto a la renta, en una pequeña empresa, se calcularon los ingresos
anuales (en dólares) de todos los empleados. La tabla de distribución de frecuencias es la
siguiente:
Número de
Ingreso anual
personas (n¿)
2400 - 3000 3
3000 - 4200 20
4200 - 5400 35
5400 7250 25
7250 - 9000 15
9000 - 12 000 2
Solución: La clase modal es el tercer intervalo, ya que tiene la mayor frecuencia (hs : 35).
I
: 50; por tanto, la mediana estará el el intervalo
Entonces,,2I (4200; 5400), de manera que
dr :35 -20:15, d¿:35 - 25:10 y A:5400 - 4200:7200. l
:
Ahora, tenemos que
Definición (de media geométrica) La media geornét,rica, notaclzr corno .{lG, clc urr conjunto dc
n, meclicion€s r1, 12:.. ., nr es igrral a Ia taíz r¿-ésirna de su ltroclucto; es decir,
AIG: Vqxrrx-xrk.
El empleo más frecuente de la media geométrica es el de promediar variables tales como porcentajes,
:asas, números Índices; es decir, en los casos en los que se supone que la variable presenta variaciones
acumulativas.
3. Es úrnica.
1. Su cálculo es más complicado que el de la media aritmética y solo se la puede calcular cuando
todos los valores son positivos.
50s
;la
Ejemplo. Calcular la media geométrica de la estatura de cinco personas que miden (en metros):
MG : (r¡x12x-xrn
: otT
11.70 x I.72 x 1.68 x 1.65 x I.73: 1.696.
Su empleo no es aconsejable en distribuciones de variables con valores pequeños. Se suele utilizar para
promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc.
28 Capítulo 7. AnáIisis Exploratorio de Datos
3. Es única.
Ejemplo. Calcular la media armónica de la estatura de cinco personas que miden (en metros):
11111 : 1.696.
A un conjunto de datos ordenado se lo puede dividir en un número fijo de partes iguales; cuando se lo
divide en cien partes se tienen los percentiles.
Definición (de percentiles) Los percentiles son cada uno de los 99 valores que dividen a la
distribución de los datos en 100 partes iguales.
A los percentiles se les nota como P¡. Con ellos se puede encontrar regiones donde se acumulan los
datos; así, el 30 % de los datos están por debajo del trigésimo percentil.
. Si los datos no estrín agrupados o están en una tabla de datos individuales, se efectúa la siguiente
descomposición:
nk
: j *r,
100
donde:
j es la parte enter u a" !.
100
r es la parte fraccionaria a. *.
100
Entonces, se tiene que
si r:
"+-,
rj+L, sir>0.
o;
7.8. Medídas de localización 29
,tk, _
l{r.
"
I'A,:LA-ta 1oo ',1,
,
7Lk'
rlor rcler:
,L¿ 1 es cl lírrrite inferior del intervalo ñ (cuva fi'ecucrrcia ¿rcurnulada es la primera mayor o igr.ral
tt,A:
a _).
100'
lü-l cs la fi'ecuencia acumulada hasta .L¡-1.
n¡ es la frecuencia absohrta del intervalo h.
A es la longitud del intervalo h.
Ejemplos
1. Calcular los percentiles de orden 20 y 33 de la estatura de diez personas que miden (en cm):
165 165 167 168 170 L72 r72 r73 178 180.
Pzo
Número de FYecuencia
Ingreso anual
personas (n¿) acumulada (¡/r)
2400 3000 3 ,)
3000 - 4200 20 23
4200 - 5400 35 58
5400 - 7250 25 83
7250 9000 15 9B
9000 - 12000 2 100
'k n,.
,I)A, . - 100 -
L¡-I
nk
D-
rSri 72t¡o +
tLUv |
uu - 83 trrn
15
: 7600.
--'l
Dos casos particulares, y muy utilizados, resultan cuando al conjunto de datos se Io clivide en cuatlo
o cinco partes iguales, que corresponden a los cuartiles y a los quintiles, respectivamente.
Definición (de cuartiles) Son valores que dividen a la distribución de los datos en 4 partes, cada
una de las cuales engloba eI25% de los mismos.
. El cuartil inferior (Qr), qre deja a su izquierda el 25% de los ctatos v se curnple eue Qr : P2ó.
. El cuartil medio (Qz), qre deja a sr.r izquierda el 50 % de Ios datos, coincide con la mediana y se
cttmple que Q2 : Pso.
. El cuartil superior (Q3), que deja a su izquierda el 75 % de los datos y se cumple eue Qe - Pzó.
AsÍ, para el cálculo de los cuartiles solo se deberá tener en cuenta que ellos son los percentiles de orden
25, 50 y 75, respectivamente (Figura 1.12).
500Á 500
mln Qt Qt Q¡ max
Definición (de quintiles) Los quintiles son valores que dividen a la distribución de Ios datos en
cinco grupos, cada uno de los cuales contiene el 20% de las observaciones.
. El primer quintil (qr), q.t" deja a su izquierda el 20% de los datos y se cumple que qr - P2o.
¡ El segundo quintil (qz), qrr" deja a su izquierda el 40% de los datos y se cumple eue 9z - P4o.
. El tercer quintil (qs), qn" deja a su izquierda el 60% de los datos y se cumple que qB - Poo.
r El cuarto quintil (g¿), qr" deja a su izquierda el 80% de los datos y se cumple que q4 - P80.
7.8. Medidas de localización 31
Ejernplos
1. (Continuación.) Dctcrrniuar los cuartilcs infcliol y su¡rcliol cle las estaturas de 46 señoras,
cuyas ntedid¿rs son:
1.65 1 46
Es decir, r: 0.5 y
P¡, * l-rt
Pzs : rsa : 1.57.
2 (Continuación.) Determinar Ios cuartiles inferior y superior de los ingresos anuales de los
empleados de una empresa.
Número de FYecuencia
Ingreso anual
personas (r¡) acumulada (Nr)
2400 - 3000 t) J
3000 4200 20 23
D'lu.
4200 - 5400 Jd
DT
58
P+0.
5400 - 7250 25 83
7250 - 9000 15 9B
'60. -
9000 12000 2 100
D-^
EU' Solu,ción: Tenemos que n : 100.
32 Capítulo 7. AnáIisis Exploratorio de Datos
109ri.25
. Cuartil inferior: Qt : Pz;, k::25 J, Y: : Z¡.
100 100
El irrtelr'¿rlo l¿ doncle se enc:uentra Q1 es @200;5a00) y Lt-t:4200.
Tambiérr, se tiene que N¡- t : 23,nt :
35 y A :54U0 - 4200 : 1200.
Entonces, lesrrlta que:
t'/t
- Ar,.-,
P¡, : Lt-tI loonk "'¿
t<_t?
Pzs : 4200 +'",;;'" 1200
Ji)
: 4268.6.
Estas medidas deben tener la propiedad de que si los datos están ampliamente extendidos, la medida
será alta; y cuando los datos se encuentren muy agrupados, será baja.
Existen varias medidas de dispersión, nosotros vamos a analizar la desviación estándar, el rango y el
rango intercuartil.
Definición (de desviación estándar o desviación típica) La desviación estándar, notada como
s, de nn corljunto de n mediciones 11, 12, ...¡ 2,, es la raíz cuadrada de la suma de los cuadrados
de Ias desviaciones de las mediciones, respecto al promedio z, di'l'idida entre n - 1; es clecir,
n-I D,@,
i:l
7.9. Medidas de dispersión 33
\ótese que la desviación estándal es siempre positiva y sus nnicladcs de medicla son las rnisnrrrs clrLt:
aquellas que corresponden a los datos originales.
- n \r)'
n-I
De la misma manera que para Ia media aritmética se consideran los siguientes casos:
' Si las observaciones están agrupadas en una tabla de frecuencias de datos individuales:
r2 n2
x) te ;o
la desviación estándar se calcula por
k
DnnrT
i:I
- n(T)2 k
o s: con n:, ni.
n-7 i:r
ión ' Si los datos se presentan en una tabla de frecuencias, agrupados por clases:
úas
Clase LIC LSC Punto medio Flec. absoluta
1 ly Sl I1 TL1
ida 2 l2 S2 I2 n2
: : : :
rel k l¡" Sk rk nk
s se calcula por
k
Ln¿rí - nlI)'
O /-\ñ
k
¡la o 8: i:l
con n: \-nr.
ión -itn¿(r¡-r)2
i:7 n-I /-¿;-l
ilar,
2. En su cálculo intervienen todos los valores de la distribución y por ello puede ser complicado.
3. Es única.
Ejemplos
1. (Continuación.) Calcular la clesviación estárrdar cle los srreldos cle diez l)crsonrrs que ganan
(en dólares):
r70 t72 168 165 173 178 180 165 167 t72.
Solu,ción: Previamente se habÍa calculado el promedio 7: L7I. Con ésto, resulta que:
*i@n-,¡'
(170 - t7L)2 + (I72 - I7r)2 +...+ (167 - tTL)2 + O72 - LTr)2
10-1
1.
Dn *?-n@)2 ffi
o:, , :.@:0.04627.
n-r
D-
n-l V ¿o-t
La estatura de las señoras analizadas tiene una desviación estándar de 4.6 cm.
3. (Continuación.) Calcular la desviación típica de los montos de ahorros de los socios de una
cooperativa de ahorro y crédito:
k
D ro"? - "(")2
,i.:1
n-7
:V/33002ffiéro-i :riYü¡'
Definición (de rango o recorrido) El rango de n mediciones es igual a la diferencia entre los
'.'alores mayor y menor de las mismas:
Rango : T..'áx
Ei rango se puede utilizar para hallar una aproximación de la desviación estándar mediante las si-
--rrientes relaciones :
R.anso
s = --É-) para n 176, para 16 q 7¿ ( 100,
1/n
R,anso
para100<n(400, para n > 400.
"=--,
1. En su cálculo solo intervienen los dos valores extremos de Ia distribución y por ello se ve muy
afectado por Ia presencia de valores atípicos.
Definición (de rango intercuartil) EI rango intercuartil, notado por RIQ, de un conjunto de
latos es igual a Ia diferencia entre ios cuartiles superior e inferior; es decir,
RIQ: Qs - Qt.
Las definiciones de los cuartiles superior e inferior y del rango intercuartil fueron dadas por F. Galton
en 1882.
36 Capítulo 7. AnáIisis Exploratorio de Datos
Ejemplo. (Continuación.) Calcular' la desviación estárrd¿rl de l¿r cst¿rtur¿r clc 46 señoras, cllvas
meclidas sc reslrmen en la siguierrtc t¿tbl¿r:
Estatura r.45 r.48 r.50 1.53 1.55 1.57 1.60 r.o.) 1.65
Fbecuencia 2 4 Ir 8 12 7 4 3 1
Rango 0.20
sFr : 0.05.
4 4
Como se ver el valor aploximado cs bastante cercano al exacto, calcuiado con la fórmula respectiva.
Esta rnedicl¿r se utiliz¿r l)¿lra conlp¿r'¿rr las rnccliciones de tun¿r misrna magnitrici rc¿liz¿rri¿r cn distintas
unidades o por distintos individuos.
Si u.rr conjurrto de cl¿rtos es honrog(rneo, CV < 1; si Cf/ > 1.5. los dzrtos poclrían ser hctclogóncos.
2. En sn cálculo interviencn toclas las obscrvaciones. pr-rclicnclo ser nluv iufluido pol valoles atípicos.
Ejernplo. (Continuaciórr.) C¿rlcrrl¿rr r:l c:oerficrierrtc clc r'¿rriaciórr clcrl srrclclo clc cliez pcrsorr¿rs clllc
-irr¿1rr (crL ckilzrrcs) :
170 rT2 168 165 r73 r78 180 165 167 r72.
: :,1 uc,i¡ir¿: Pleviarrx:rrtc s<t It¿rbía cirlculaclo clur: r: 177 1' ,s - 5.1. Con ésto, r'esulta que:
5'1 :0.02982.
CV:! T - 777
--omo
el valor de coeficiente es muy ba.jo, los datos son homogéneos.
-{asta ahora, heruos arralizado la localización y la dispersión cle una distribución, pero necesitamos
. r'locer más sobre el comportamiento de los datos. En esta sección, analizaremos las medidas de
-,)
- )inla'.
- as medidas de forma de ttna distlibución se clasifican en dos grllpos: medidas dc asinietr'ía y medidas
-- cttrtosis.
1.10.1. Asirnetrra
coet'íczente d,e a,s'intetría, dc nrra variable midc cl grado de asimetr'ía de la distribuciórr r,le sus datos
tolno ¿r sti meclia. Es aclirncnsional v se definc corno srg=Lre:
,s3
--,--.
crtl,o,s cle nn¿L variable cstárr coltstituidas por los r.alores alejaclos de la medía (r,a.1oles cxtrcmos).
--:,a l'¿rriable es ¿l,sinií:tric¿r si srr
col¿ ;r nn 1¿rclo cs rnás larga que sr1 col¿r al otro y sinrétric¿r si amb¿rs
-es solr igual cle largas.
si As > 0. la clistribui:ión ser¿i asiurótiic¿r a l¿r clcrccli¿r. La cola a la clerech¿r es más lirrga que 1a
cola a la izquierrl:r.
. si As < 0 la clistribrrciórt ser¿i ¿rsirnétlica a ltr izcluicrcla. La cola a lur izqnierd¿l es más lrrrgir que
la cola a I¿r clelech¿r.
rEn la definición cle las trreclicl¿rs rte ti¡rma no hal,'unidac.l cle criterios cntre los especi:rlista,s, por lo clrLc hay una amlrlia
r i cclacl
38 Capítulo 1. AnáIisis Exploratorio de Datos
ir", - *)n l,
i:t ,
Ap: e4 -J.
Leptocúrtica, si Ap ) 0; es decir, es más apuntada que Ia normal. Los valores que toma la
variable están muy concentrados en torno a su media y hay pocos valores extremos.
Platicúrtica, si Ap ( 0; es decir, es menos apuntada que la normal. Hay muchos valores extremos,
Ias colas de la variable son muy pesadas.
t70 172 168 165 r73 178 180 165 t67 172.
i@n-e)'
i:7 (170 - 171)3 + 072 -171)3 + .
+ (167 - i71)3 + O72 - t7D3
10
55.8.
i{,n-n)n
i:l - LTDA + $72 - I7I)4 +. . . + (167 - LTD4 + G72 -
(170 I7D4
n 10
1191.
7.77. Otras representaciones gráfrcas 39
- ntOnCeS,
In
\-.
T).
\ r; - ( T\'' lr¡,
1J"
'i-I 55.8
)11
As: t
so (5.1)3
0.42r.
ir", - ,)n l,
i:t 1191
Ap: s4
-J-
t
(5.1)n -.)
-t.239.
Ia
-,cs datos son levemente asimétricos, con asimetría hacia la derecha; también, son platicúrticos,
;,,rsible presencia de valores atípicos.
) Sobre una recta se ubican los valores del promedio, el mínimo y el máximo. Los segmentos que
unen el promedio con el mÍnimo y con el máximo se denominan brazos de Ia balanza.
3 Sobre la misma recta se ubican dos puntos -uno a la izquierda y otro a Ia derecha de la media-,
a una distancia igual a la desviación estándar.
x .x+.s
Figura 1.14:
40 Capítulo 7. AnáIisis Exploratorio de Datos
1 Si los cl¿tos solL sinrírtlic:os, r:l valor del plonreclio se sitú¿r r¡rr r:l <:c:rrtLo rlci grálico.
2 Si los d¿rtc¡s est¿ilr agrrrptrdos en torno ¿ri ccntlcl. los l¡r¿-Lzos rlr: l,r bal¿rnz¿ ser'¿ilr cortos; pr"u cl
contrzlricl, si ir"rs tlat,os estiirr dispclsos eu tor-rr<l ¿r.l coutlor lt-,s lrr'¿rzos clc l¿r bal¿rnza s<)r'¿'rir liilgos.
,) Si nno dc los rlos bl¿rzos clc 1¿r b¿rlarrz¿ es muchr¡ rl¿rs largo c¡rc r:l otlo, nos inclica (llre los (l¿1tos
sorl asirr)étricos y clue hay posible prcsencia cle r'¿rloles atípicos en l¿s obselv¿ciones.
Puede ser irtil combin¿rr' (solrre el mismo gr'áfico) con un cliagrzrma clc prrni;os pzrra visualiz¿rl Ia, Irillr(:lr'&
en que se distlibuycn ias observaciones.
5 5 5 5 1010202027 35
39 55 55 60 60 60 68 75 90 90
Entonces,
:L
-S 39.729.3:10.4.
-
T *s 39.7+29,3:69.0.
Figura 1 .15;
Scgirrt sc obscrvit crr i'i giálico, el prornedio no se encuentra crr cl centro del ralgo. entonces sc dr:drrc<:
quc los cltrtcs sotr asirtrétricros. Arlcrriás, lcs br'¿rzr¡s cie i¿r b¿l¿rnza rro ticrierr ig'ral longitnri, lo <1rri.r ri<rrtot¿r
la posrble plcserrcia cle vakrrcs atípicos elr cl ex1 r'errro clcrecho.
El rli,o,qt'ant,a" de c:o,.jo, fr-re irrtroduciclo r:n 1977, pol JoLrn \\I. Tuliey conLo lur¿l herranrierrtzr quc rrurcslr'tr,
er Lrn misuro gr:ific:o, l¿r foltna de los clatos, sn r'¿r,lol ccntlal y srr rrariabilicl¿rcI irl rcprr:sentar i¿r rne<li¿rrra.
los crr¿rtilc¡s) el r'¿1rlgo intercualtil y el rango c1e las observacicxrcs.
l. Soble lrn¿ líne¿l holizontal se loc¿rliz¿rn l¿ mcdiana. Ios cuartiles inferior y supr:rior ¡'los clatos
nrínilro I'm¿ixirno.
7.77. Otras representaciones gráfrcas 4L
,l
Se constrrtye rtna ca..ja angosta qlre une a Qt y Qz; a continu¿rción, se clivicle estar caja cn clos
mecliatrte una línea qne pase por Qz.
t
.J. Finalrnente, se ttazan las uallas, que son dos rectas, una desde cada extremo de la ca.ja, hacia el
valor rnínimo y hacia el valor máximo de los datos.
I trt I
min Qt Qz Qr max
;--n diagrama de caja es especialmente útil para examinar la simetrÍa de los datos, la presencia de
-"-:lores atípicos y para comparar dos conjuntos de muchos datos.
Ejemplos
Estatura r.45 1.48 1.50 1.53 1.55 L.57 1.60 1.63 1.65
Flecuencia 2 4 5 8 12 7 4 3 1
Solución: Antes se determinó que Qr : 1.53, Qz : L.55, Qs : t.57, rrnín: I.45 y z¡16* : 1.65.
. -lttc:cr
, lr rt¿i
I I
Como se observa, los datos son bastante simétricos, con una fuerte concentración en torno al
centro y -puesto que las vallas son largas- con la posible presencia de valores atípicos (el mínimo
y el máximo).
clirlos
Se recogieron los datos de los ingresos mensuales de 200 hombres y 250 mujeres, que realizan
42 Capítulo 7. Análisis Exploratorio de Datos
Comparar los ingresos de los dos grupos mediante sus diagramas de caja.
Solución: Se tiene la siguiente tabla que resume las medidas descriptivas reqtteridas:
mIn Qt Qz Qs max
Flombres i90 270 220 230 240
Mujeres 180 190 200 220 230
240
230
22O
o
ut
fl
s zro
tr
200
190
'180
Sexo
Figura 1.18:
L.1-2. Ejercicios
i. Una persona está rnanejando un carro en una autopista a 70 km/h y nota que el número de autos
a los que pasa es igual al número de autos que a ella le pasan. Los 70 km/h son el promedio, la
mediana o la moda de las velocidades de los autos en la carretera. ¿Por qué?
7.72. Ejercícios 43
2. Dadas r¿ : 8 nrccliciones: 4, 2, 6. 5, 7, 5, 4, 6.
Deterrnine: rr) f; lr) l¿r niecliarr¿r; c) ,s; cl) el lango; e) la asimetría; f) Ia cr-rrtosis.
3 Dadas n : I mediciones: 5, 8, 8, 4, 4, 9, 7, 5, 4.
1. En 1904, Cushny y Peebles publicaron en el artículo <The action of optimal isomers>> (Journal
of Physiologg), un estudio sobre el efecto de dos isómeros de Ia molécula hidrocinamida hidro
bromida en prodrtcir sueño. Se presentó la variación en el núrmero de horas de sueño por noche
al usar las dos versiones de Ia droga:
a) Realice un diagrama de puntos para cada uno de los dos tipos de drogas y comparárelos.
¿Cuál de los dos isómeros es más efectivo en producir aumento en las horas de sueño?
b) Realice un diagrama de tallo y hojas con los datos.
c) Calcule el promedio, la mediana y la desviación estándar de los datos de las dos drogas.
¿Cuál es más efectiva? Explique.
¿. Un inversor tiene ahorros repartidos en 3 depósitos con 2000, 5000 y 10000 dólares, respectiva-
mente. Si el primero le rinde un 5To anual, el segundo un 4To anual y el tercero un 2To anual.
¿Cuál es el tipo de interés que recibe?
tenla
En una empresa se registró la edad (en años completos) de sus empleados, resultando la siguiente
Como
tabla:
31 49 36 39 56 29 57 4t 40 51
Idela 45 61 40 39 47 27 36 37 16 37
)ertor, 51 18 29 42 38 62
34 31 28 25
36 40 46 37 49 25 2r 39 35 37
trenen 56 35 48 44 42 43 49 22 25 28
trados
teos.
a) Determine el número de clases que se debe utilizar en la distribución de frecuencias;
b) Construya la tabla de frecuencias y el histograma;
c) ¿Qué porcentaje de los empleados es menor que 50?;
: autos
d) ¿Qué porcentaje de los empleados es mayor que 35.5?
dio, la
7. En una bodega de venta de licores se registró las principales. características de 25 marcas de
44 Capítulo 7. AnáIisis Exploratorio de Datos
rn'hiskys:
No. de Precio Proporción Tiempo de Nota de
Categoría
whisky de venta de malta añejarniento calidad
.,
I 70 20 1 5 J
2 60 20 1 5 2
, 65 20 1 7.5 2
4 74 25 I I2 2
5 70 25 I t2 3
6 ,J 30 1 5 0
7 70 30 1 8 0
8 55 30 I 5 2
9 93 J,l 2 6.5 I
tt
Jd 2 8 3
10 62
tt
JJ 2 8.5 3
11 87
T2 78 35 2 8.5 2
13 83 40 2 8 4
t4 90 40 2 5.5 2
15 110 40 2 T2 1
16 113 40 2 8.5 1
t7 96 40 , T2 dt
18 82 45 2 12
,
d
19 r27 45 2 8.5 4
20 160 100 3 L2 3
2I 90 100 3 12 4
22 86 100 3 12 2
23 100 100 3 10 3
q
24 100 i00 3 11 d
25 95 100 3 T2 0
il. Sc rcirlizti rttta irrr'<rstigaciírn sobtc cl prccic'r rlc zapzrlos <lcportivos. clcr sirnilarets <:¿rr¿rctetrístic¿rs
crr rlivrtlsos ¿tllutr:ctttts clc l¿r trirrrl¿rcl, ob1<:nií:rrr[os<t los sigrricnt<:s cL¿ttos (cl<ilarcs):
50 4:l 39 43 40 38
,)-
r),J oi
,¡l
.)-
r) I
.)o
r)i
49 43 39 44 40 38 33 26 36 30
49 43 39 44 4U 38 33 27 36 30
+t 41 39 45 40 37
.).)
,),)
,)a
,l ') E
,)r)
J)^
.)t,
46 47 38 46 40 37 32 28 35 28
Esratura (en cm) | 155 160 165 170 \75 180 185
No. de eslrrdiantes I 10 14 26 28128
Halle:
o;
lpo
ror- Encuentre:
-=. La siguiente tabla muestra la temperatura nocturna (en "C) clr.rrantc 200 días:
Los siguientes datos se obtuvieron de una encuesta sobre las condiciones de vida, en el área nrral
dc los cantones dc Zapotillo y N{zrcará y corresponden al núrrnero de hornbres y de rnujeres que
Capítulo 7. AnáIisis Exploratorio de Datos
b) Realice la tabla de frecuencias y el histograma de los datos, según el sexo de los encuestados;
e) Determine el número total de miembros en cada familia. Con estos nuevos datos trace eI
diagrama de puntos, el diagrama de tallo y hojas, la tabla de frecuencias, el histograma y
el diagrama de caja. Interprete lo obtenido.
16. Las siguientes temperaturas fueron tomadas al medio día en Quito (en 'C) durante una semana:
17. En una investigación sobre la razón por Ia que frecuentemente habÍan colas muy largas en las
cajas de un banco, se obtuvo información del tiempo (en minutos) requerido para atender a los
clientes. Se tomaron 50 mediciones en una caja, las cuales se dan a continuación:
6.0 5.9 4.0 3.1 1.9 5.3 2.7 5.2 2.9 5.2
4.8 4.8 5.1 6.0 4.2 4.4 5.3 7.4 4.4 4.1
5.2 2.8 4.7 1.8 5.1 5.8 2.9 5.7 3.8 5.8
3.6 4.4 2.0 2.8 4.8 3.1 1.5 5.9 3.6 4.6
3.7 4.5 3.9 2.3 5.5 5.3 5.8 2.4 5.5 3.7
18. La siguientc tabla muestra los tiempos de duración (en minutos) de las versiones en DVD de 22
películas dirigidas por Alfred Hitchcock:
ios;
a) Construya un diagrama de tallo y hojas de los datos;
b) Calcule la mediana de los tiempos;
c) Calcule los cuartiles inferior y superior. Use esta información para detectar algún valor
:e el y
atípico para trazar el diagrama de caja;
ray
d) Determine el promedio y la desviación estándar;
e) Represente los datos mediante un diagrama de balanza. ¿Cuáles datos influyen más en los
valores calculados?
f) Calcule los coeficientes de asimetría y de apuntamiento.
19. Las notas de un examen de 6 alumnos son: 6, 5, 9, 19, 3 y 18. Un alumno aprueba si su nota es
mayor o igual que el promedio y que Ia mediana de las notas. ¿Qué porcentaje de los alumnos
aprobaron el examen?
+-
J-
ados 10. Un automóvil ha recorrido los 832 km que separan Loja de Esmeraldas, permutando regularmente
las 5 llantas (incluida la de emergencia) para que todas tengan igual desgaste. ¿Cuál es el
recorrido promedio de cada llanta?
11. El kilometraje que marca un auto, luego de 4 años de uso, es 100 mil kilómetros. Si el dueño
r las lo compró nuevo y lo hace descansar 1 dÍa, luego de usarlo 4 días seguidos, ¿cuál es el recorrido
a los promedio diario de los días manejados, considerando años de 365 días?
')2. De 400 alumnos de un colegio, cuya estatura promedio es 165 cm, 150 son mujeres y su estatura
promedio es 160 cm. ¿Cuál es la estatura promedio de los varones?
13 Se tiene cuatro números. AI añadir el promedio de tres de ellos al número restante, se obtienen
los números 17, 2I, 23 y 29. Si se excluye al mayor de estos números) ¿cuál es el promedio de
los tres restantes?
e b). Temp. ("C) 20.5 20.0 19.5 19.0 18.5 18.0 t7.5
No. días 2 4 3 13 3 4 2
48 Capítulo 7. Ar¡álisis Exploratorio de Datos
Iutclr¡¿rlo I'r'ccucucia
10 - 2i) 3
.)
20 -30 'J
30 - 4i) 12
40 50 B
50 60 5
1 gelente: 10 000
1 secretaria: 650
3 empleados: 500 (cada uno)
2 ayudantes: 400 (cada uno)
1 conserjc: 300
28 En una reunión hay 50 varones con una edad media de 20.5 años y 25 mu.jeres, las que en
promedio ,or, ] miís jóvenes qne los \¡arones. Halle el núrmero entero más próximo a la edacl
'10
media de las personas de dicha leunión.
29. Un ftrmador dice que su vicio empezó con un cigarrillo en la primera sernana, 2 en la segunda,
4 en la tercera, 8 en la cuarta, y así sucesivamente; hasta fumar casi 2 ca.jetillas diarias de 20
cigarrillos cada una, en promedio.
30. Si cada uno de los 28 millones de habitantes de cierto país come) el promedio, 12 kg de pescadcr
al año, entre conservas enlatadas y pescado fresco, siendo este rubro 4 veces el de conserva.
¿Cuántas toneladas de pescado fresco se consumen? en promedio, por año?
31. En una muestra de 20 empresas florÍcolas se obtuvieron los siguientes datos sobre el núrnero de
empleados y sus ingresos anuales, en miles de dólares:
Calcule:
32. De los datos de rrna tabla de distribución de frecuencias, con 5 intervalos de clase ;r ancho de
clase cornítn, se observó que: Qz:24, x:¡ : l$, 13 :24, nB : 2'n,r, n5 : )71r. ¿.Qué porcerrtaje
del total sor nrenores de 30?
7.72. Ejercicios 49
34. La siguiente tabla muestra la distribución de sueldos de 210 trabajadores de una empresa.
Sueldo Trabajadores
600 700 100
700 800 20
800 - 900 60
900 1000 20
1000 1100 10
35. En una muestra de 1000 trabaiadores, se registró sus sueldos en una tabla de frecuencias:
Sueldo Trabajadores
ue en 0 400 150
, edad
400 - 800 300
800 - 1200 200
1200 - 1600 250
¡rnda,
1600 2000 100
de 20
a) Calcule la moda de los datos;
b) ¿Qué porcentaje de los trabajadores tiene sueldos comprendidos entre el promedio y la
mediana?
irimo 36 En la siguiente ojiva se muestran los sueldos de Ios traba.jadores de un organismo estatal.
scado
lser\¡4.
rero de
Figura 1.19:
Calcrrle el pronrr:clio, la rnecliarr¿r v la clesvi¿rciól estánclar cle la cclacl de los niuos ¿rtcndirlos.
38 Err la sigr.rierite tabla se rnuestr'¿r i¿r clistlilncióu ck: frecnencias clc l¿rs vcntas rc¿rlizad¿ls pol' lc¡s
Si Ios intervalos tienen igual longitud, halle el promedio, la mediana y la desviación estándar de
Ias ventas.
7
0.06
El Concepto de Probab¡l¡dad
-enrbién existen fenómenos cuyo resultado no puede ser anticipado con cetteza, sino que existe una
:tbabi,Iidad de que un cierto resultado se dé; por ejemplo, la ganancia que obtendrá un inversionista
-=-pués de dos años, el tiempo que sobrevivirá un cónyuge a la muerte de su pareja o el número de
;-ros eu€ pasan por una esquina durante una hora determinada. Es evidente que nadie puede dar
-, resultado certero con anticipación a los tres euentos considerados, entonces si se da una respuesta,
-:'iste una incertidumbre en el resultado.
?ara dar una explicación matemática a aquellos resultados que aparecen en experiencias en que está
-r'olucrado el azar, se desarrolló la teoría de probabilidades.
51
52 Capítulo 2. El Concepto de Probabilidad
El desarrolio clel an¿ilisis rnatenrático los juegos dc azal se produjo dur¿rnte los siglos XVI y XVII.
c,le
Algunos autores consideran como origen del cálculo de probabilidades la lesolución del prolrlema de los
puntos en la correspondencia entre Pascal y Fermat en 1654. El problema planteado a estos autores
por Chevalier de Meré, fue cónro debería repartirse el dinero cle las apuestas, depositado en la mesa,
si los jugadores se ven obligados a finalizar la partida sin que existiera un ganador. Aunque ningur<-r
de estos dos matemáticos publicó al respecto, sí lo hizo Huygens en su tratado Ratioci,n'iis 'in In,do alae
(Razonamientos relativos al juego de dados). Su escrito tiene Ia trascendencia de ser el primer liblo
de probabilidades de la historia.
Pierre Simón Laplace (I749 - 7827), introdujo la primera definición explícita de probabilidad y desar-
rolló la ley normal como modelo para describir la variabilidad de los errores de medida. En esta época
también hubo importantes contribucfones de matemáticos como Legendre (1752 - 1833) y Gauss (1777
- 1855) para tratar de realizar predicciones del comportamiento de ciertos fenómenos.
Durante el siglo XIX, los matemáticos y astrónomos continuaron ampliando la teorÍa, de manera que
a mediados de este siglo ya existían Ias herramientas que permitieron su consolidación como una rama,
científica. A pesar de ello, la aplicación de estos principios se restringÍa a Ia Física y la Astronomía.
Una descripción axiomática de la idea de probabilidad fue dada en 1933, por A. N. Kolmogorov. Ello
constituyó la base de la moderna teoría, tal como hoy la conocemos. Con ésto, se consiguió elaborar
modelos complejos y aplicar las probabilidades a muchas ciencias y campos de Ia vida.
En las últimas décadas, el empleo de la teoría de probabilidades en las modernas ciencias naturales,
en las ciencias sociales y en ramas de aplicación, como la ingeniería, el cálculo actuarial o la economía
ha crecido enormemente y su conocimiento es una necesidad imprescindible.
Antes de iniciar el estudio de la probabilidad, revisemos los principales conceptos del análisis combi- E
natorio.
_I--
: .
Definición (de variación) Se clenornin¿r variaci(rrr a c¿r.cla nrro cle los irrrcgJ,os orclcrr¿rrlos clc /'
lenreutos, tornaclos cle otlo cle n r:lernentos (k ( n). cle rnanel'¿l cluc estos arrcrglos rlificrcrL cn algúur
.-enientr.i o en el orden de colocación.
r- rrúrrnero cle r'¿rri¿rciones de A; elementos qne pueden obtenelsc a partir: de rin coujlurto rl<r it, clcrrtcutos,
--.lotado por Vf,, es igual a
Wn:-
,nl
'n (n-A:)!
nl.
kt(n - k)t'
-:'lución: Se tiene n : 3 y lr : 2.
V! : .--
3! : 6 :
a) Se pueden formar
(3-2)! ;1 6 variaciones, qlle soII:
Definición (de permutación) Una permutación de n elementos es cada una de las variaciones
r: los n elementos distintos.
Pn: n!'
Ejemplo. Encontrar Ias permutaciones que se pueden forurar a paltir del conjunto {a,b,c}.
I 'iuc'ión: Son P3 : 3! : 6 permutaciones; éstas son:
A: {at,a2,.".,a,r} y B : {h,bz,...,brr}.
54 Capítulo 2. El Concepto de Probabilidad
Parejas. Con los n¿ elementos <.lc A y los tr elerucntos cle B cs posible forrn¿rl nt,xTt ptrlejirs (rt,¡,lt¡,)
<¡rr: contcngan lln cleniento rle c:¿rd¿r con.jrrnto.
Ejemplo. En uu¿r f¿ibrica cle calz¿rc,lo se confcccir¡n¿rn 4 Lnodcl<¡s de zapatos lttlla. clirmas, en 6 tztrrrarius
cliferentes. Por lo tanto, se pr-reden fabricar 4 x 6 : 24 distintos tipos de zapatos.
Otra forma de ver este concepto es considerar un procedimiento A que se puede realizar de m maneras;
un procedimiento B de n maneras; y así sucesivamente, hasta un procedimiento G de s rnaneras.
La acción consistente en realizar el procedimicnto A, seguido del procedimiento B, hasta llegar al
procedimiento G; se puede efectuar de m x n x - -' x s maneras diferentes.
Ejemplo. Suponga que se clasifica a un grupo de estudiantes universitarios según su sexo, estado
civil y la carrera que estudian. El sexo puede ser masculino o femenino; el estado civil puede ser
soltero, casado o divorciado; y, digamos que hay 7 carreras. Entonces, hay un total de 2 x3 x7 : 42
clasifi.caciones diferentes.
Anteriormente, se examinó las permutaciones de elementos de un conjunto, pero sin repetición; si ahora
queremos determinar las permutaciones con repetición, bastará considerar en los arreglos múltiples el
mismo conjunto.
Definición (de perrnutación con repetición) llna permutación con repetición, de k elementos
obtenidos a paltir de un conjunto de n elementos, es un arreglo de k elementos ordenados en el que
los elementos pueden repetirse arbitrariamente.
P,\, : nk
Ejemplo. Con los elementos del conjunto A: {a,b,c}, ¿cuántas permutaciones con repetición, de
dos elementos, se pueden formar?
Soluc'ión: Se van a formar parejas considerando dos veces el conjunto A, por Io tanto se tiene n:
y k :2; entonces, hay un total de 32 : 9 permutaciones con repetición; ellas son:
(a, a), (a,b), (a,c), (b,o), (b,b), (b, c), (c,a), (c,b), (c,c).
Examinemos un ejemplo: el lanzamiento de un dado una sola vez. Como resultado de la prueba se
pueden producir diferentes resultados: <<sale dos>>, <<sale cinco)>, <<€l número que aparece es par>>, etc.
Esto nos conduce a definir \os euentos.
Definición (de evento) Se llama evento, notado como (r, a cualquiera de los resultados posibles
de un experimento u otra situación que involucre incertidumbre.
Los eventos se clasifican en: elementales, aquellos que constan de un solo resultado: r compuestos,
que consisten de más de un resultado. Por ejemplo, <<sale dos>> es un evento elemental: mientras
2.4. Defrnición axiotnática de la probabilidad bl)
llre <<cl nrimcro qrre aparece es pal>> es un evento conpuesto, l)orque cstá conformado de Los cventos
-lementales <(sale dos>>, <s¿rle c;uatro>> y <<sale seis>.
,Jbselvernos que todo cvento relacionado con una pn,reba se pr"rede desclibir en términos de evertos
.lenrenta,les.
Definición (de espacio muestral) La colección de todos los eventos elementales, notirdo por Q,
-e denomina espacio muestral:
Señalemos que el concepto de espacio muestral fue introducido por Gaiileo para resolver el problema
-e por qué en el lanzamiento de tres dados "10" y "11" aparecen más frecuentemente qr-re "9" y "72" .
?ara resolverlo listó todos los casos posibles.
-,
olviendo al ejemplo, si consideramos el número de puntos que aparecen al arrojar un dado, tenemos:
::an A y B dos eventos de O, en el siguiente cuadro se presentan 1as equivalencias entre las proposi-
--rnes de las teorías de probabilidades y de conjuntos y en la Figura 2.1 se encuentran los diagramas
-r Venn correspondientes.
:
2.4. Definición axiomática de la probabilidad
Lna probabilidad provee una descripción cuantitativa de la posibilidad de ocurrencia de un evento
;,articular y se puede pensar que es su frecuencia relativa, en una serie larga de repeticiones de una
-rrueba, en la que uno de los resultados es el evento de interés.
s
ii
Figura 2.1: Interpretación de los conjuntos como eventos: a) Ocurre eI evento A. b) Ocurre A u ocurre
B (A U B). c) Ocurre A y ocurre B (An B). d) Si A ocurre, también B (A e B). e) Eventos
incompatibles (A ) B :0). f) No ocurre A (ocurre A").
. A2. Pr(Q) : r.
. A3. Si A y B son incompatibles: Pr(A U B) : Pr(,a) + Pr(B).
Ejemplos
1. Dados los eventos A, B y C del espacio muestral f). Expresar mediante las operaciones entre
conjuntos los eventos:
Solución:
2. Demostrar que:
a) Pr(Á") - 1- Pr(A).
2.5. Cálculo de probabilidades :)t
Soht,ción,:
k
Pr(A) : DPr({a.'¿}). (2.2)
i:t
Un caso particularmente importante se presenta cuando todas las probabilidades Pr(c.r) son iguales.
Casos favorables de A
Pr(A) :
Casos posibles
Card(A) k
Carcl(A) ¡/
En el ejemplo clel lanzamicrtto cle rrn dado cortsicleremos el evcnto A <<salc rtn nrimero ¡rar>>:
Pr(A) :ffi
Card(A)
:-:-31
62
En los siguientes ejemplos, consideraremos espacios mnestrales finitos y aplicaremos los conceptos de
análisis combinatorio al cálculo de probabilidades.
Ejemplos
1. En un estante hay 2 libros de historia y 3 de biología. ,Ll azar, se toma un libro y luego se toma
un segundo libro. Encontrar la probabilidad de que un libro de biología sea seleccionado: a) la
primera vez; b) ambas veces.
Soluci,ón:
Pr(A)
'-' :9'1!9 :I
Card(f^)) 5'
b) Que ambas veces se seleccione un libro de biología significa:
. que la primera elección es un libro de biologÍa, entonces se tiene 3 casos favorables; y
. que la segunda elección también sea un libro de biología, entonces hay 2 casos favorables.
Así, el número de casos favorables es igual a 3 x 2 : 6.
El número de casos posibles, de todas las parejas sin repetición, es 5 x 4 :20.
Entonces, la probabilidad buscada es
63
u- 20 10'
El número de casos favorables en el cual 2 de los 3 alumnos del colegio A ganan los premios es:
V3 : o. Luego,
Pr(B) :*:0.,
3. Entre 100 fotografías de un sobre se encuentra la foto buscada. Del sobre se extraen aI azar 70
fotos. Hallar la probabilidad de que entre ellas resulte la foto necesaria.
Solución: Ei espacio muestral Q está formado por los conjuntos de 10 elementos que pueden
formarse a partir de 100: Card(A) : Cl8o.
2.5. CáIculo de probabilidades 59
El núrmero de resultados favorables que nos interesa es igual al total de formas como pueden
escogerse 9 fotos de las 99 restantes; es d'ecir, Card(A) : CBg'
La probabilidad buscada es
CP^
:eÉ';:10. 1
Pr(A)
4, En el Consejo Universitario cada una de las 10 facultades está representada por el decano y
el subdecano. Se nombra una comisión de 10 miembros elegidos aI azar. Determinar Ia pro-
babilidad de que:
de
a) una determinada facultad esté representada;
b) todas Ias facultades estén representadas.
Solución:
)ma
a) Considerando el evento complementario A': facultad dada no está representada>>, y
<<una
i) la
calculemos su probabilidad. Hay 20 representantes, 18 de ellos no son de la facultad
en
Pr(B) : 0.00554.
#ry
Se arrojan dos dados. Hallar la probabilidad del evento ¡: {al menos en uno de los dos dados
salen más de dos puntos).
Solución: EI espacio muestral puede describirse como
reCen
rd de
cl: {(i, j)li, j: L,2,...,6},
j
donde el evento elemental (i,j) corresponde a los ¿ puntos aparecidos en un dado y los puntos
rarti-
aparecidos en el otro. Consecuentemente, Card(Q) : 36.
Designemos como 81 el evento consistente en que en el primer dado salen más de dos puntos y
con B2 el evento análogo para el segundo dado:
u10 por lo tanto, card(B1) : card(Bz) :21. Puesto qrue B1l\82: {(i, i)l i,i :3,4,5,6}, entonces
Card(B1 ¡ B) :42 :16. Ahora bien,
: :'! : ?, y ¡Bz):#:Í
Leden
Pr(81) Pr(Bz) Pr(81
36
60 Capítulo 2. El Concepto de Probabilidad
ie,1i,,,)) :1,
i:l
Pr(A) : t Pr({a.'¿}).
u¡,€A
Ejemplo. Juan y Andrés juegan tenis con la misma habilidad. Deciden jugar una secuencia de sets
hasta que uno de ellos gane 2 sets seguidos. Halle la probabilidad de que se necesite jugar número
par de sets para terminar el juego.
Solución: Sean los eventos: J: <<gana el set Juan>> y A: <<gana el set Andrés>>.
Segúrn el enunciado, el espacio muestral está conformado por los siguientes eventos elementales:
El evento B: jugará hasta que uno de ellos gane 2 sets consecutivos>> es la unión de los eventos
<<se
que están señalados con una estrella (*) en el espacio muestral.
Se tiene que
Pr(AA) :
1
Pr(JJ) +
i'
Pr(JAJJ)+ Pr(AJAA) : 1
=.
8
-
2.5. Cálculo de probabilidades 61
O -.
En general, si A es un evento cle un espacio mnestral continuo O, tal que su rnedicla (longitud, ',rotrr*"r.,
,iempo, etc.) existe; entonccs, su probabilidad cs
\{edida cle ,4
Pr(A):
\tledida de O'
Ejemplos
Figura 2.3:
T
:s:loo;"-t:o'75'
75r cttt2
Pr(A)
62 Capítulo 2. El Concepto de Proba'bilidad
2. Sr:¡L l) :
{(:r;. !l) I () <:t; I 1; il í :l I ii (i,';grui.2"4) ci i:sirir.<:io irirrstliil ,i,:r rrrr fcririrrrcro akrirtoli¡r
v sitP<ttticrttlo c.irrr: io<lrl prulto <l<r (l'¡itrrr,'l;r ¡risrir¿r ¡rlolrrrlrilirltlrl ilc sLl 1r".r¡LtLo clL r;rrerL1a.
Jr
il 4 x
,,4n8 E
117
Figura 2.4:
a) Árca O: 1 x 1 : 1.
cle
2.8" ;i!e::cir:ios
Análisis cornbinatorio
l" Culcuie lcis siguierri,cs (iocúcitintcs bilorrri¿lcs Cf,: n) Ci; b) C1]; r) Ci:
2. C.lc.le Vf eri l<,rs sigrricrrtcs c¿r:jos: ,r) Vl; lr) V!; ,r) V3; cl) \¡.].
6. Cnántas palejas con rclposicrón pueden formar-se con conjuntos crtya c¿rlclina.lidad es:
l. Ftxure todas las combinaciones y valiacioncs qlre se pnerlen obtener a parl,ir de los cortjuntos:
8. Para los conjuntos indicaclos forme todas las pa,r'ejas sin reposición y parejas con reposición:
A: {a,e,i,o,u}; b) B: {I,2,3,4,5,6).
^)
r;¡r cortrruc uv.r-iu!ar--- -, .--:. eiirr-'131. ql.- -.-:ii¡r::-,i', , $:rL)iici y [1 silllg:r'ente; debe elegi' un
presidente y r-rn vicepresiderr c. ¿De cuántas maneras se pueclerr elcgrr esr,e par dc fiutcrorr¡ilios
si el presidente debe ser nn ;:iente?
Ul hospital cuenta con 21 ci r.ijanos (ion ri)s, ,,'-¡.ies hay que folrnar ter-uas para re¿lizar guardias.
¿.Cuánttrs ternas sc pueclen f:rrnar?
Un amigo le quiere regalar a ¡tro 3 cliscos y los quiele clegir cntre los 10 que más Ie gustan. ¿.Dc
cuántas marreras pucde hace¡'lo?
Eu cl ejcrcrcio ¿rntelior considéresc qrre los 3 enrpleirclos \¡an a ir ¿l l¿ misrna planta. ¿.D<: curintas
rnaneras se puede hacer la seleccicin?
_)
¿.Cuárrtos nrirneros de 6 cifras pucderr haccrse con los dígitos {I,2,3.4, 5, 6}:
rr) sin rcstlicción algrrua'/; b) sin rcpctil ling;'.url cifra?; c) maStolcs c¡rc 500000?
Sicte pcrson¿rs h¿1n soiicitado empleo para lleuar dos r.acantcs. ¿De cuárrtos modos se puerclen
llcrrar l¿ts vat:¿rrrtcs si:
18. i',Cttárrtos partidos sc .jucgatt cII ull cirruptxrrrato. crrr cl qrre prrlticipan 20 cqrripos y en el quc
.iuegan toclos contla to<[os. rul{) crr c¿rsa V otlo <lc visil ¿rlrte?
19. Etr tttr lestattrarttr: cie cotnicla rtipicla se inclir:a al clicrrtc (lrrc sri harnbrrlgr-resa. a rnás del pan 1,
la catne, puede ir cou todo lo siguiente r¡ sin ello: sals¡r clc tornatc, nrostaza, rnayollesa) lechuga,
cebolla, tomate o queso. ¿.Crt:intos tipos difercnt<,rs <1r: hirrnburguesas son posibles?
20. La producción de una rnáqnina cronsta de 4 f¿rses. Ilirl' 6 líneas cle montajc pala la primera fase,
3 para la segunda, 5 para l:t telcrerir, y 5 para la irltirrr¿r. Detelmine de cnántas forrnas distintas
se puede montar Ia máquina en este proceso de producciórr.
21. Eu un plano hay 15 puntos de los cuales rro hay tles que sean colineales. ¿Cr-riintas rectas
determinan?
26. En cualquier set de un partido de tenis, el oponente X puede vencer al oponente Y de siete
maneras. (Con el marcador 6 - 6, se juega uu desernpate: tie breaker) El primer tenista que
gane tres sets obtiene la victoria. ¿De cuántas maneras se pueden registrar los resultados si:
27. ¿De cuántos modos se pucden poner 5 anillos diferentes en los dedos de una narlo. omitiendo el
pulgar?
Definición de probabilidad
28 Sean Q un espacio muestral y A, B y C eventos cualesquiela) exprese las siguientes afirmaciones
conro uniones e intersecciones de A, B y C y de sus conrplementos.
aj 30. Se arrojan dos dados, sean A el evento <<la suma de las caras es impar>>, y B el evento <<sale por
Io menos un tres>>. Describa los eventos A a B, Atl B, A l\ 8". Encuentre sus probabilidades
si se supone que los 36 eventos elementales tienel igual probabilidad.
i€,
AS 31. Se consideran dos eventos A y B, tales que Pr(A) : 1 r PrlB) : 1. Determine el valor de
3" 2
Pr(A'O B) en los siguientes casos:
:32. Se consideran dos eventos Ay B, con Pr(A) : 0.375, Pr(B) : 0.5 y er(AnB) :0.125. Calcule:
'),). Sean A y B dos eventos tales que Pr(A) :0.9 y Pr(B) :0.8. Demuestre quePr(AnB) > 0.7.
34. Un experimento aleatorio consiste en arrojar una moneda y un dado a la vez y observar el
resultado. Escriba el espacio muestral del experimento.
rdo
tos ,JD Una empresa tiene dos tiendas distribuidoras, una en el norte y otra en el sur de la ciudad. De
utl Ios potenciales clientes, se sabe que el 30% solo compra en la tienda norte, el 50% solo compra
en la tienda sur, el 10 % compra indistintamente en las dos tiendas y el 10 % de los consumidores
no compra en ninguna de las dos. Sean los eventos A: <<el cliente compra en la tienda norte>> y
de B: <<el cliente compra en la tienda sur>>. Calcule las probabilidades (e interprételas):
las
tes a) Pr(A); d) Pr(A n B); g) Pr[(A n B)"];
b) Pr(,A u B); e) Pr(A \ B);
ete c) Pr(B"); f) Pr(Á" ñ B"); h) Pr(A u B').
lue
: 36. En la intersección de una autopista, los automóviles pueden girar a Ia derecha (D) o a la izquierda
(1) Desde un puesto de observación se registra el sentido de la maniobra de los tres primeros
vehículos.
Cálculo de probabilidades
.)/. Un gerente de compras desea hacer pedidos a proveedores diferentes, a los que nombra corno A,
B y C. Todos los proveedores son iguales en lo que respecta a la calidad por lo que escribe cada
letra en un papel, rnezcla los papeles y selecciona a ciegas a uno de ellos. Se hará el pedido al
vendedor que salga seleccionado. Calcule las probabilidades de los eventos:
66 Capítulo 2. El Concepto de Probabilidad
Sttpong:t quo cll ttn soLt(:o itr lrrolrirlrilicl¿tcl rlc galiar prirner prcrrric-r.,,
f v
38 c1 1a,1" girnzrr cl
3^Si 1a
:. 3
r.cgLttLc[,r ¡rt.'tnio,'s
¡i irrolrabilirl¿rr1 r[c B¿ur¿:r1 ¿rl nretrros rrrro clc los rlr¡s ltlcrnios es ;-l . ;.r:irlcrrlc
la probabilicl¿rcl clc garr¿rl solo rrrro dc los rlos plenrios'/
39 Sc enr'í¿rtt 3 oficios a 3 personas diferrentcs. Sin ernb¡rr'Élo, una secret¿ria distr'¿rícla levrir:lvc los
oficins v sc pttccle consitlelal clttc los lnalr(ló ¿rl ¿z¿1r. Si tur¿r coirrcidencria <rs el hcchri rle rlrrc rrna
persona recil-,a el oficio correcto. cak:ule la probabilidad de que haya:
a) ninguna coincidcricia;
b) exactarrrente rrna coincidencia.
40 La fábrica errsarnbladora ha dcterminado que Ia demanda clel arrto Honda Civic es igual para
cada uno de los colores azul, blanco, verde y rojo. Se haceu tres pedidos sucesivos de autos de
ese rnodelo. Deterrnine la probrrbilidad rle que:
4I Lr-icgo dc las 1>ntel)¿ls tr)¿I a ocupar un puesto a los 6 aspir;r.rrtes se lcs clasifica de a<rrrerclo al 1>untaje
obtenido. Los rcsrtlt¿r<los uo le llegtrn al empleador pol lo quc él contlat¿r a clos aspirantes al
azar'. ¿,Cuál cs ia ltrobabili<lad tle quc haya contratado a los dos aspirantes me,jor c¿rlificados?
r)
,1
Un pacltrete cle 6 focos tienc 2 rrnidacles clefectuosas. Si se cscogen 3 focos para su uso, calcrrle
la probabilidad cle qr-re ninguno tenga clef'cctos.
43 En ttna caja hay 20 fotografías en la cual htry 6 mal tomadas. ¿,Cuál es la probabilid¿rd de
selecciorrar 2 fotografías clefectuosas'/
44. Entre 100 artículos de ttn lote hay 5 <iefectuosos. Halle Ia probabilidad de que entre 10 altículos
escogidos aI azar, no sc tenga más cle un artículo defectnoso.
45 Un distribuiclor de electrodomésticos recibe un euvío de 20 pianchas, cie las cu¿rles hay 3 defcc-
tuosas. Para conocer si el lote está buerro pmeba 6 aparatos. trl distribuidor aceptar¿i el lote
si cltcttetitra a lo rnás ltn aparato dcfec:tnoso cntrc los prolrados. ¿Cuál cs l¿t pl'ollabili<lad cle
rechazar el envío'/
46. De un áttft-rrir, quc contietre 100 boletos. se extr¿err tres bolctos ganadores. ;.Crrá1 cs la lrrob:r-
biliclad de que gane una persona que conrlrró:
47. Entt'e 1as 80 t:stacioncs de sen,ir:io qrrc hay ell nnA cindarl, 10 errtrcgan un¿r ca:i-i'la,l merrol clue
la que el cliente compr¿r. tlu inspect,or clc la Dirccción de Hiclrocarbrrros r-i..it:r aie¿rtori¿rmente
cinco de ellas para velificar si la cantidad'n'enrlid¿r cs correct¿t. ¿,CLrál es la p:'',rt,airrliclad rle que
descubra al nenos una fiaudulenta?
48. En el juego del <<cuarenta>> se reparten 5 cartas, al azar, a cada jugador. a palil' ,Le rrn mazo de
40 cartas. ¿,Cuál es la probabilidad de que un jugador tenga:
2.7. Independencia y condicionalidad 67
¿r) urr as) rur dos, un trr:s, un cuatLo y un c:irrro, clel rnisnio pnlo'/;
l,) 4 c¿u'tas <lel rnismo pirlo'/;
t:) rrua <<rorrcla>>; cs rlecir', 3 calt¿.rs rle ia rnisrna clelornil¿lci<in (as, clos, etc.)?
i9 En nrr closet hay 6 pales cle z¿rpatos. Se escogcn 4 zapatos al azar. Encuentre la probabilidad
rle de qnc haya pol io rnenos lrn par de zapatos errtre los 4 zapatos escogidos.
50 Err los países europeos existe una forma muy popular de lotería, llamada Lotto, que consiste en
OS seleccionar'6 números de una cartilla que contiene 44 núrmeros (del I aI 44). El día del sorteo
na se seleccionan 6 bolas al azar y sin reposición. Una persona gana el premio principal si los
6 números sorteados coinciden con los seleccionados; también se puede ganar prernios si 4 o 5
núrmeros sorteados coinciden. Determine la probabilidad de:
rra 51. Una persona presiona, aI azar, 8 cifras en una calculadora. ¿Cuál es la probabilidad de los
de eventos siguientes:
Dentro del rectángulo limitado por las rectas , : -L,, :;, A : -7, A : l, se tiene el
bc- gráfico de la función trigonométrica seno. Sobre el rectángulo cae una gota de tinta. ¿Cuál es
ote la probabilidad de que Ia gota de tinta haya caído dentro del área comprendida entre el eje r y
de la curva A: sel:x? (Observación: Suponga que el área, de Ia mancha de tinta es despreciable.)
Fn la teoría de probabilidad un concepto muy útil es el de independencia de eventos, que significa que
-a ocurrencia de uno de los eventos no da información sobre si otro evento ocurrirá o no; es decir, Ios
lue -r-entos no influyen uno sobre otro.
nte
lue
Definición (de independencia) Dos eventos A y B se llaman independientes si la probabilidad
de que ambos ocurran es igual al producto de las probabilidades de los dos eventos individuales.
Es decir,
,de Pr(A n B) :Pr(A) x Pr(B).
Capítulo 2. El Concepto de Prcbabilidad
Ejemplos
1. Sea Q: [0,1]x [0,1] y dados los eventos: A: {(r,a)10 S r 5ll2; 0 < y < I}, B : {(",A)10 <
r 1I;0 <y <Il ). Probar si A y B son independientes.
Figura 2.5:
Pcu lo trutto.
Pr(C) : Pr'(,4 a 13") * Pr(4" . 13) :0.095 + 0.045 : 0.14.
Tles bicllogos, irr<lepcnclierrtcrncutc uno clel otlo, nriclielon el c:<¡rrtcniclo <,1<'l suero c1t tlll¿l tttttestra.
La proba.bilidacl cle <¡-re cada uno comet¿r Lln el'ror eu I¿r lcctur:r dol apzrlato cs igutrl a 0.1, 0.15 y
0.2, r'r:s¡rectivarrrente. Hallal la probabilidad de que cll ttna s<,rla rnecliciótt pol lo meros ttno de:
Ios investig¿rclores coureta Lrrl erlor.
Soluc,ió,n,: Se¿r el evento ¿: {por lo menos uno de los investigaclolcs coniete urr crror}, el
complerrento es A" : {ninguno de los investigadores comete un error}.
Caicul¿rrernosPr(4"), considerando que las medicioltcs son evctttos inclcpendientcs.
(dis- Sean p¿ la probabilidad de que el i-ésimo investigador cometa un error (i: I,2,3), entonces
Pr(A') : (1 -pr)(t-pz)(I-pz)
: (1 - 0.1)(1 - 0.15)(1 - 0.2) :0.612.
/0< Resulta que Pr(A) - 1- 0.612 : 0.388.
Pr(AlB):HF
Ejemplos
r). a) ¿.Cuál es Ia probabilidad condicional de qtte ttrr esposo seir fiel, clirclo qr-re sll esposa es fiel?
b) ¿'.Cuál es Ia probabilidad de ctrr-te ttl)a esposa sea fiel, claclo
(luc srr csposo es infiel'/
n B).
Sol'u,ción; Corrvengarnos en la siguiente not¿ciórr de los ercrrtos:
.f1F: Hornbre fi.el, 111: Hombre iuficl,
,41F: N{u.ler fiel, 11,/1: \4Lr.jer infiel.
70 Capítulo 2. El Concepto de Probabilidad
a) Dcseamos calcular
PI(II I-IAI F) : f'r(II F. n{F)
Pr(r1F)
De 1a tabla se obi:ierrcr cllle
trL(i1F . AI F) ¡),
Pr(n1F) 0.22 + 0.31 :0.53.
Con ésto,
0.22
Pr(111¡lrt{F) : : 0.415.
0.53
b) Calculcmos
n HI)
Pr(A,I FIH i) : Pr(MF
Pr(H/) )
con
Pr(MFnf{f) :0.31 y PI(III): 0.31 + 0.23 : 0"54.
Entonces,
g'31
pr.(,41 FIHI\:
' 0.54
:0.bT4.
Pr(BlA\:9:?
__\_r--l
9 3
u La pI'r¡babilidad de que el tercero sea hombre sabir:rrdo que los dos primeros t¿rnrbién lo son,
es la probabiiidacl dc C dado A y B:
:'r(C An : !.
ll),E
tr-ir pr"obabiiid¿rci buscacla tlc clrrc las i,lcs i)crson¿rs escc.rgiclirs sean holrlrres es
La probabilid¿rd clc: A, que puccic ocrrriir sclo ¿rl ¿lll¿rlecel uno rl,:.'. . .1 ,,< r-trLrtuarnerLtr:
Lttt cvonto
f:xclltt¡'g¡¡iss B t, 82, .. , 8,, (Figura 2.6), talcs (llre sli uniórr es el espacio rri,r.:j r.- j ,'1 (lada por
Supongamos que el evento A puede ocurrir a condición de que aparezca uno de los eventos Bt, Bz,
..., Bn. Si A ya ocurrió, la probabiiidad (condicional) del evento B¿ es igual a
Pr(B6lA) :ffi:g;ffi
Pr(AnB¡) Pr(B¡)Pr(AlB¡)
i:I
?ara e1cálculo mediante la fórmula de Bayes puede resultar conveniente disponer las probabilidades
:t rn diaqrama de ó"'rbol como el siguiente'.
A
Pr(81)Pr(Al81)
A'
Pr(81)Pr(A'lB1)
A
Pr(82)Pr(AlB2)
Ac
Pr(82)Pr(A'lB2)
A
Pr(8,)Pr(AlB")
Pr(8")Pr(A'lB")
rsta dispctsiciórr de los datos facilita la rcaiización de los cálculos ya que
únicamente se debe realizar
-na slrma de los resultados en las ramas de interés
Ejer.:rIos
l. En una oficina hay 6 computador¿rs de marca y 4 ciones. La probabiliclad de que al utilizar una
mác1lrina, ósta encienda correctameirte es 0.95 para las de marca y 0"8 para las clones. Un em-
pleado utiliza aI azar una computadora, hallar la probabilidad dc que se encienda correctamente.
.4oluci,ón: Definamos los eventos:
.3)
A: el empleado ul,iliza una máquina de marca,
B: el crnpleado utiliza una máquina ción,
C: la máquina enciende correctarnente.
72 Capítulo 2. EI Concepto de Probabilidad
Sc ticrrc,
4
PL(A) :*:,,0, Pr(ll) :r0:,,.n.
Pr(ClA): 0.95, Pr(ClB): 0 8.
a) Se tiene
Pr(81) : j,2I Pr(82) : :.
La probabilidad condicional de que la botella contenga la cantidad exacta, si ha sido en-
vasada por Ia primera máquina es
Pr(AlB1) :0.6.
Por tanto, la probabilidad de que la botell¿r tomada aI azar contenga la cantid¿d exacta es
1-,) Ltr prcibttbilidtrd del cr¡cnto <se escogió un¿r botcll¿r r:on la cantidad exacta llcuada poi' Iir
segurrcla má<¡rirrir>> es
É 17.
Este resultado tarnbién se puede calcular eurpleando cl concepto dc evento cornl lerlentario.
Err trna ciudad, el 25% de los habitantes son ancianos, el 35 % adultos y ei 40 % sorr liños. Se
sabe que la glipe afecta al5% cle Ios ancianos, al4To de los adultos y al2% de los rriños.
Ahora, basta sumar los resultados parciales en las ramas para obtener el resultado deseado:
or l¿r
Pr(,4u¡/lG) : Pr(AlG) +Pr(.n/lc)
r25 80
345+3*:0'594'
La lrlobabilidad de que si urt habitante tiene gripe, éste sea anciano o rriiro, es clel 59.4%.
74 Capítulo 2. EI Concepto de Probabilidad
4 EI 35'/r, clc los ct'óclitos clttrt rtt<-ltger rtrr banc<l es par¿r vivicncla, eI 50%, ltara pr.ochrc:cióu y el r'esto
(r()llsittlllo. R,cstrlt¿rrr lltot()sos r:l 20(X, tk: krs cl'írtlit,cts
l)¿r1 ¿i ltrua vivic¡r,la, el l5%, rlc los clérlitgs
lrillrr ¡>r'orlrrcrción y t>l 70c,4, r[c Ios cr'éditos I)¿i,t'a c:orrsurr]o.
a) Tengamos presente que el evento <<el crédito se paga a tiempo> es el complemento del
evento <el crédito está en mora>; entonces, buscamos Pr(M.).
Por la fórmula de la probabilidad total,
2.9. Ejercicios
1. Sean A y B dos eventos con Pr(A) # 0 V Pr(B) 10. Demuestre que
En una biblioteca hay B libros de literatura de ciencia fi.cción, 3 de los cuales son de Isaac Asimov.
La bibliotecaria toma al azar 2 libros. Determine la probabilidad de que ambos libros resulten
ser de Isaac Asimov.
10 La Empresa de Correos ha determinado que el 70% de los paquetes enviados al exterior no llegan
a su destino. Dos libros se pueden enviar separadamente o en un solo paquete. Para cada una
de las dos formas de envío postal, encuentre:
t2. El 35% de los créditos de un banco es para vivienda, el 50%o para industrias y el 15 % para
consumo. Resultan morosos eI 20To de los créditos para vivienda, el 15% de los créditos para
industrias y el 70 % de los créditos para consumo. Calcule Ia probabilidad de que se pague un
crédito elegido al azar.
1t
1J En una exhibición de arte hay 12 pinturas de las cuales 10 son originales. Un visitante selecciona
una pintura al azar y decide comprarla después de escuchar la opinión de un experto sobre la
autenticidad de la pintura. El experto está en lo correcto en 9 de cada 10 casos, en promedio.
a) Dado que el experto decide que la pintura es auténtica, icuál es la probabilidad de que él
no se equivoque?;
b) Si el experto decide que Ia pintura es una copia, entonces el visitante la devuelve y escoge
Le el
otra, ¿cuál es Ia probabilidad de que Ia segunda pintura escogida sea original?
dad
14. Hay una epidernia de cólera (C). Consideramos como uno de los sÍntomas la diarrea (D), pero
este síntoma se presenta también en personas con intoxicación (1) , e incluso en algunas que no
tengan nada serio (N). Las probabilidades son:
cule
Pr(DlC): 0.99; Pr(Dl1) : 0.5; Pr(Dl,n/) : 0.004
Se dan los siguientes porcentajes: el 27odela población tiene cólera y el 0.5% intoxicación. Si
una persona tiene diarrea calcule la probabilidad de que tenga cólera.
76 Capítulo 2. EI Concepto de Probabilidad
15. Urta pru<tlril cl vitrts del SIDA eu la sangle cl¿ el cliagnóstico correcto coll urra pro-
l)¿tl¿r rlctct:t¿rt
babilicl¿rcl rlcl 9ll %. Sogrin clatos módicos) lrrio clc carla 2 000 habitantes cl<ll país. en prornr:clio, es
poltaclol rlrtl virtts. Da<lo qrte la pnrebzr fire positivtr I)ar¿r una persorl¿1) 1',clr¿il es la proira.lriliclacl
cle que cll¿r, r'e¿lnrcrrte tcnga Ia enfermed¿rd?
16. Utra emplesa financiera opera en las tles regiones del país: Costa, Sierra y Arnazonía. El 50 %
de las opeLaciones se realizan en la Costa, el 40 To er Ia Sierra y el resto en la Amazonía. Se
ha estimaclo, derlrido a la larga experiencia, el porcentaje de clientes qne no pagan sus deudas en
cada una cle las regioues. Para Ia Costa es del I%o, para la Sierra deI 2To y para la Amazonía
del 8 %. Si la empresa tiene 1000 clientes, determine cuántos pagan sus deudas puntualmente.
17. Una encuesta revela que el 70% de la población tiene estudios secundarios, de los cuales eI 72%c
no tiene trabajo. Del 30 '70 q:ue no tiene estudios secundarios , eI 25 % no tiene traba.jo. Calcule:
18. De 200 aspirantes a un cargo se conoce Ia siguiente tabla respecto a experiencia en funciones
similares y la formación académica necesaria
a) con experiencia y con folmación; d) sin formación dado que no tiene experien-
b) con experrencra; cia.
c) con experiencia dado que tiene formación;
19. En una investigación sobre el crédito bancario a trabajadores agrícolas se obtu\¡o el siguiente
modelo, en el que se califica al campesitto como propietario o no propietario del terreno que
cultiva y si mantiene o no mantiene deudas con los bancos.
Propietario
Deudor SI NO
SI 12 28
NO 20 64
20 A 100 empleados se les hizo un examen para determinar su destreza mar,'.,:-- C''ralenta clc los
ernpleados er¿n hombles. Scsenta de los empleados pasaron el exameli 1., _: .. ¡ ¡.lcanzaron rur¿l
2.9. Ejercicios 77
ro- calific¿rcióu rriayot que cicrto rrivcL Pledetr:r'ruil¿rdo cle a¡rr'<x,'eclrarnictrtci. L¿r cl¿rsific¿-Lción entre
CS
hornll'ers y rnujer-cs fue Ia sigrrielrte:
[¿cl
Honrlrr.cs (11) N{u,lcres (,4'1)
Pasaron (P) '24 36
)% No pasarou (.Ay') r6 24
Se
ien Sr-rponga que se selecciona al azar un eurpleado dc los 100 que hicielon el examen.
lnía
Lte. a) Calcule la probabilidad de que el empleado Laya ptrsado y sea hornbre;
2%
b) Calcule la probabilidad de que el emplead., sea hombre dado ctrtrc pasó el examen;
q.ue
2I. Los empleados de la compañía Crrz del Sur se encuentran distribuidos en 3 divisiones: Admi-
nistración, Operación de Planta y Ventas. La siguiente tabla indica el núrmero de empleados en
cada división, clasificados por sexo.
úente 22. Dada la siguiente tabla que indica el comportamiento respecto del hábito de fumar en un grupo
) que de 100 estudiantes que fueron averiguados.
Hábito
Sexo No fuma Fuma Ex-fumador TOTA
Hombre 16 10 24 50
Mujer 30 16 4 50
TOTAL 46 26 28 100
25. En un paÍs hay 4 partidos políticos que se dividen la opinión pública. Se sabe que:
Entre los adherentes al partido I, un 36 % corresponde a personas con ingresos inferiores a dos
salarios mínimos. Entre los adherentes al partido II, esa proporción es del 52'/o. Para el partido
III es un 42V0, y para el partido IV es 11%. Si se elige una persona al azar y resulta tener un
ingreso mayor a dos salarios mínimos, calcule la probabilidad que sea adherente al partido I.
26. La señora Sonia se fue de viaje y encargó a su hijo, Pablo, que riegue el rosal. La probabilidad
El rosal está en un estado inseguro:
", ].
de que Pablo olvide regar el rosal durante su ausen"iu
3
si se riega tiene igual probabilidad de secarse que de no secarse) pero solamente tiene un 0.25 de
probabilidad de no secarse si no se riega. Después del viaje Sonia encuentra el rosal seco, ¿cuál
es Ia probabilidad de que Pablo no lo haya regado?
27. Se estima que sólo un20To de los que compran acciones en Bolsa tienen conocimientos bursátiles.
De ellos el 80 % obtienen beneficios. De los que compran acciones sin conocimientos bursátiles.
sólo un 10% obtienen beneficios. Se desea saber:
a) El tanto por ciento de los que compran acciones en Bolsa que obtienen beneficios;
b) Si se elige al azar una persona que ha comprado acciones en Bolsa y resulta que ha obtenido
beneficios, ¿cuál es la probabilidad de que tenga conocimientos bursátiles?
28. En un supermercado el 70 % de las compras las realizan las mujeres; de las compras realizadas
por estas, el 80 % supera los 20 dólares, mientras que de las compras realizadas por hombres sólo
el 30% supera esa cantidad.
29. En una universidad existen tres facultades: A, B y C. En A hay matriculadas 150 chicas y 5[
chicos; en B, 300 chicas y 200 chicos; y en C, 150 chicas y 150 chicos.
-i-
2.9. Ejercicíos
30. E¡tr.e los cinco rrs¡tirantes a un calgo cle geleute, a <los se ios considera excelentes y a los riernás
se les consicler'¿r bucnos. Para una entrevista se escoge al azal a dos de los cinco. Calcule l¿r,
probabiiidacl de que se esco.ia:
31 Se dispone de dos métodos A y B para enseñar una destreza manual. El índice de reprobados es
del 20 To para el método A y 10 To para el método B. Sin embargo, el método B es más caro por
Io que solo se le usa el 30 % del tiempo y el A el otro 70 %. A un trabajador se le adiestra con
uno de los d.os métodos, pero no puede aprender en forma correcta. ¿Cuál es Ia probabilidad de
que se le haya adiestrado con el método A?
32 En los exámenes de ingreso a una universidad cada candidato es admitido o rechazado de acuerdo
a si él ha aprobado o reprobado la prueba. De los candidatos que realmente son capaces' el 80 %
pasa la prueba; y de Ios que no son capaces, el 25To pasan Ia prueba. Dado que el40% de los
dos candidatos son realmente capaces, encuentre Ia proporción de estudiantes capaces que ingresan
ido a la universidad.
un
JJ Según datos de investigaciones genéticas se ha establecido que: los padres de ojos claros y los
hijos de ojos claros constituyen el 5To de las personas estudiadas; los padres de ojos claros y loB
dad hijos de ojos oscuros el 7.9 %o; los padres de ojos oscuros y los hijos de ojos claros el 8.9 %; los
padres de ojos oscuros y los hijos de ojos oscuros eI78.2Vo. Halle la probabilidad de que:
uro:
5de a) el hijo sea de ojos oscuros, si el padre es de ojos oscuros;
cuál
b) el hijo sea de ojos claros, dado que el padre es de ojos claros.
,iles. :l-1 Como un acto de buena vecindad Dios y Satanás acordaron un intercambio cultural entre el
:iles, Cielo y el Infierno. Demonios del Infierno van a vivir en el Cielo, mientras que ángeles del Cielo
van a vivir en el Infierno. Los demonios tienden a no decir la verdad más frecuentemente que los
ángeles. Los demonios mienten el 80 % de las veces y los ángeles mienten el20% de las veces (¡en
estos días es difícil encontrar ángeles buenos!). Después del intercambio, la proporción entre los
demonios y ángeles en el Cielo es 2:3. Mi amigo José murió y fue al Cielo. Él encuentra a una
rnido
persona en la calle y Ie pregunta donde encontrar un baño para hombres. Desafortunadamente,
Ios demonios y los ángeles no se pueden distinguir por su aspecto físico. Deseamos determinar:
:adas
; sólo
a) ¿Cuál es la probabilidad de que Ia respuesta haya sido una verdad a la pregunta de José?
b) Dado que la respuesta fue una mentira, ¿cuál es la probabilidad de que haya sido dada por
un demonio?
os 20
.)=
)'J Una compañía de tarjetas de crédito encuentra que cada mes el 50% de quienes poseen la tarjeta
ilidad cubren totalmente sus deudas.
a) Si se seleccionan dos usuarios al azar, ¿cuál es la probabilidad de que ambos paguen total-
;y50 mente su deuda ese mes?;
b) Si se selecciona un cliente al azar, ¿cuál es la probabilidad de que dicha persona pague
totalmente sus deudas en dos meses consecutivos?
c) ¿En qué hipótesis se apoyó para responder a los dos apartados anteriores? ¿Le parece que
ef alguna de ellas no es razonable?;
80 Capítulo 2. El Concepto de ProbabíIidad
<1) Urr cxarrrerr rn¿is <1et¿rllaclo der los rcgistlos cle la conipañía rnuestr'¿r quc el 90 % cle los clicutcs
que l)agau t<it¿.rllneut,e un¿r cLr<lrrt¿l nrensual tarnbién lo hacen al mes siguiente v <1uc sólcr
eI 70%, clc los cluc l)o l)ag¿]lr tot¿r.lrnente en llrl rnes cttl-¡ren totalmente srr dcrrcl¿ al mes
siguierrte. Calculc, cn este c¿so. la probabilidad pedida en b).
e) Con las hipótesis de d), calcule la probabilidad de que un cliente seleccionado al azar no
pague totalmente ningr-rna cle las dos cuentas rnensuales consecutivas;
f) Calcule Ia probabilidad de que sólo pague una de las dos cuentas.
37. El cardinal de un espacio muestral finito es rn. Los eventos A y B son independientes y cumplen
que:
38. Demuestre que si se tienen Bt, Bzr..., B, eventos mutuamente excluyentes, tales que su unión
es el espacio muestral, ertonces se tiene que
fi,:r e'1an¡a) : t.
Capítulo 3
Definición (de variable aleatoria) Se llama variable aleatoria a cualquier función definida en
':: espacio muestral f) con recorrido en un subconiunto finito o infinito de R.
- decir, Ia función
X:Q --) R
u F-f X(r)
81
82 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
Figrira 3.1:
Ya hemos estado trabajando con variables aleatolias sin leferirnos cxplícitarncnte a ellas; por ejernplo,
al arrojar un dado son posibles seis casos. Designando por o¿ ei evento element¿l consistente en saiir
¿ puntos, tenemos:
CI : {cuf ,u)2,u)Srw4rrr'5rw6}.
Lavariable aleatoria X(rn): i identifica al núrmero z de puntos obtenidos al lanzar cl dado, se define
así:
Al arro,jar una rnoneda tenerlos dos eventos: C: <<sale cara>> o -E: <<sale escudo>>; definimos la variable
aleatoria X, que cuenta el número de caras aparecidas en una serie de lanzamientos, de la siguiente
manera:
Las variables aleatorias se clasificanten d'isc'retas y co'nti,rtuas, de acuerclo a los v¿lores qne ellas tomen.
\rkrtniis, ti p,, : Pr'(X : x:¿). cs lir ytt'tillzrlrilirl¿rrl <lc tlrtc X tonrc <rl vtlol ru¡, sc ctuttplc <¡ue
rn ottas palablas, X os disc:r'cta si rrna unirlarl rkr ur¿ls¿r clc plobabilicl¿rd cst¿i <listribrricla sobre el e.ie
-=al, cc'rrLcerrtránclose rrri¿l rn¡rs¿r I)ositi\'¿1 err cacla prrut,o <le c:ielto c:on.jrrnto finito o infinito nrrrnerable y
.:- los restaltes purrtos uo l)¿ry lnas¿r.
-,-¿r'iables
aleatorias discretas sorr usualmente (pelo no rrecesariamente) conteos de ciertos elementos'
- -,r ejemplo, el nirmero de hi.jos de una familia, el rniulcro de ventas realizadas por Lrn almacén, etc.
- la vez qlre se ha determinado las probabilidades ¿isociadas a cada uno de los rralores de nna variable
-:atoria discreta, es ritil ponerlas en forma dc una distribu.ci,ón de probabilidad, que es una tabla con
:,,ios sus posibles valores y sus correspondientes probabilidades, como la siguiente:
f 1 2 n
Pr(X : r) Pt PZ P,,
Ejemplos
Po : :0) : PL({CCC}): 1
Pr(X
8'
t
J
Pt : Pr(X: 1) : PL({CCE}): g'
3
Pz : Pr(X : 2) : Pr({C EE}) :
8'
Ps : Pr(X : 3) : Pr(iE EEI) : 1
-:.
8
T 0 1 2 3
Pr(X : r) 1/8 318 318 r18
y se cumple que
1331
Po*h-lPz+Pt : B + d + S + g : 1
Consideremos la sigrriettte plueba: se dispara corr nna pistola a un blanco situado a cierta dis-
tancia. Nos interesa analizal los eventos uJ¿: <<rlúmero de balas empleadas por un tirador hasta
(lne se da en el lrlarrco por prirnelavez>,.
Definimos la variable aleatoria X: <<núrnero de balas gastadas>>:
EI corrj nnto de posibles valores que puede tc¡mar Ia variable aleatoria es { 1, 2,3, . . .} .
Este es un conjunto infinito numerable, pues no se conoce un máximo para el número de balas
empleadas que pudiera ser extremadamente grande para una persona con muy mala puntería-;
es decir, X es una variable aleatoria discreta definida sobre un conjunto infinito numerable.
Más adelante se demostrará que también se cumple que i p¡: I col p¿: Pr{X : ¿}.
i:r
84 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
Definición (de función de distribución) Sea X una variable aleatoria discreta, la función leal
-F tal que
VÚ e R, F(t): Pr(X < ú)
Propiedades
Observación. La probabilidad Pr(X: a) se calcula mediante Pr(X: a): F(a) - F(o_), donde
F("-) es el límite, por la izquierda, de la función de distribución en el punto a. Este concepto tiene
importancia para el cálculo de las probabilidades en los puntos donde ,F tiene saltos.
Ejemplos
0, si ú<0;
Il8, si 0(ú<1;
F(t) : Il2, si L<t<2;
718, si 2(ú<3;
1, si ú23.
Los gráficos de las funciones de probabilidad y de distribución se dan en la Figura 3.2:
F(t)
0.4 I F
H
0.3 0.75
0.2 0. H
0.1
o€
Figura 3.2:
3.1. Valial-¡ies aleatorias 8Ír
Elr rrrL¿r lltrr<:l-,ir rkt c:¿tli<l¿r<l rk. ttrr ltLorltt, l,r sl tillrr'(lllr'{'n tLrt [o1<: tlt¡ l') Piczas lr¿n'!i ].,1[tttttt.
t¡ .1 rlcf<r<:tlros¡rs. L)rr cl rkrP;uliunollt() rlc <:r¡rrtlol tlt' r:irlir[¿rrI st: lr¡rrr¿t tur¡t nrttcsl t¿l tlc ]] lriczits
Clorrstlrril l¿r lct'rkr l¿r r'¿rriirlrlc alc¿rtoLi¿r <<L¡rirrrr:Lo rl<r lrir:z;ts lrlrcLr,lsr,.
Sol,tLr:irin,: La r'¿ilialrlr: a,lc¡rtolia crL crLcstirilr prr<rrlc torrrar'krs r'¿rlolr.s 0. 1.2 \¡,J: rIctr:nnirolnos
srrs prol)¿rl )ilir [¿<ics.
El llrill<:r'<.1 r[c srrbc:onjrrrrtos cl<l 3 c]crnerrtos rilrtcrrilrlcs rlc rrrr c;ou,jrtrtto <[c 12 clrlurcrrtos cs C:fr.
que es Card(O).
r Si X:0, cutolrccs tocl¿rs las Piczas sou dcfcctuosas, lr¿iv C[ lorrnirs clc <:scogctlirs.
. Si ,Y : 1, crrtorrc:es 1 es lrucrr¿r y 2 sorr clefcctrros¿rs. c\istcu Cl f.rlrn,rs cle csc:ogt:t l:rs Piclzirs
buen¿ls v Cl de cscoger las clefectnosas) crrton(ies lr¿v C¡C; forur¿ts clc: cornlrilr¿rr l¿rs lrttett¿rs
y las defectuosas.
. Si X : 2,ltay C! conjuntos de las piezas buen¿rs y C] dc dcfcctuosas) p¿rr'¿-r, rrn total cle
Cl|6C| formas cle combinarlas.
. Si X: 3, hay C! cornbinaciones de piezas bueuas.
Entclnces,
Para clefinir urr¿r variablc ale¿rtoriir no cs nccesario cxhil.¡il urr fcrtcirrrcrto ¿rleat<lrio pat'ticttltrr',
es suficiente clar ulla función cle probabilictad o cle clistlibucicln r¡re cr-rrnpla las plopic<l¿rclcs
enunciad¿rs.
si l,<-3;
si -3<ú<0;
si 0(t<2;
si ú>2,
Coustruil Ia tal-¡la de clistribución de probabilidacl clc )'.
Sol'ució¡t: De acuerdo a la definición de la ftrncióu cle clistribuciórr ¡roclenlos \'ol cluc l¿r r-¿rri¿rblc
aleatoria torn¿r los valoles -3,0 y 2.
r l-rlo l2
Pr()':trlIl2 lll4lIl4
86 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
4. Un¿r variable ¿rleatoria X está dcfinida medi¿rnte lir siguierrte lcy de plobabilidacl
Jr l rlzl¡ | qI s
a) Determinar F(r).
b) Graficar f(r)y F(r).
c) Hallar: Pr(X:1), Pr(X < 1), Pr(X < 1), Pr(1 < X < 2), Pr(1 < X < 2), Pr(1 < X <2).
Soluci,ón:
Pr
F
0.
0. H
H
0.1 H
0.1 H
Figura 3.3:
c) Se tiene:
Definición (de variable aleatoria continua) La variable aleatoria ouyo recorrido es un intervalo
inito o infinito de R se llama variable aleatoria corrtinua.
También, se dice que Lrna variable aleatoria X es continua si para todo valor real r se tiene que
Pr(X: z) :0.
- sualmente, lasvariables continuas representan mediciones; por ejemplo, la estatura de una persona,
-l tiempo que se demora un programa en buscar un registro en una base de datos, la cantidad de
:¿ngre que tiene un animal.
Definición (de función de distribución) Sea X una variable aleatoria continua, Ia función real
F tal que
V¿ € R, F(t): Pr(X < ú)
=e denomina función de distribución de la variable aleatoria X.
Fropiedades
l. Pr(a< X <b):Pr(¿<X <b) :Pr(¿ < X < b) :Pt(a <X < b) :f'(b) - F(").
Definición (de función de densidad) La función de densidad de una variable aleatoria continua
-'t es una función real / que cumple:
)
") f (r) 0 Para cualquier valor z.
b) /A f@)dr:r.
c) Para cualquier intervalo A: lo,b], se tiene que
-,
-amos cómo estárr relacionadas las funciones de distribución y de densidad. (Ver Figura 3.4)
F(r):
l"*r@ot y f (*): F'(r).
88 Capít,tttra 3. Varían¡Jes Aleadorias, Espet'anza I \-ariattza
f {t}
Figura 3.4: Rel¿ición cntr-c las firncion<:s clc clclsidaci y c1e clistrilruc:iórr.
¡b
Pr(a<X<q: I I(r)dr:F(b) -F(").
En las valiables aleatorias continuas es suficiente indicar la función de densidad o Ia función de dis-
tribución para que la variable aleatoria qr-rede completamente definida.
Ejemplos
"'(0.".1)
2 L¿r fiurción de densidacl de una vali¿rble aleatoria está clada por /(z) : (\.e-s:L cn el intern,alc
(0,-) v f @): 0 fitera cle cste itttetvalo. Hallar' el v¿rlor de la constante cv para que /(z) as-
clefilricl¿r sc¿l unA función <le densid¡ld.
. En (0, oo) se debe tener f (") >- 0, es decir (\e-3* ) 0. Pero Vr € (0, rc), e t" > 0; entouces,
se dobe tener que a ) 0.
Consecuentemente, : tt entonces a : 3.
Í
Dada la función de densidad de la variable aleatoria continua X:
( o, sic(o;
f(*): { cosr, si0(r<rf2;
r dis-
I o, sir>rf2.
a) Hallar la función de distribución F'(r).
b) Determinar: pr (t = *. ;), e, (x ,;),"'(; <x <
#)
Solución:
( o, sir(o;
F(r):l ';" ', si o < '<X,
I r, six>[.
b) Para calcular las probabilidades emplearemos Ia función de distribución.
r Pr(a < X <b) :F(b) - F("). Si ¿: I y U:[,
erval<¡ 6" 3
(r) así
: -"(á)
"'(á=".á) "(á)
: *" (á) : rfr1
2 -5
'"" (á) -
: 0.36603.
90 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
"("'i) : '-'(;)
1-sen/1):
\ 4/
r-Jt2
_ 0.29289.
r 17tr
e Pr(a < X < b) : F'(b) - F(o), con ¿¿: vb-_.
3" t2
4. La función de densidad de una variable aleatoria ? está dada por f (t) : t-f, y /(¿) : O
"n(1,2)
fuera de este intervalo. Hallar las probabilidades:
a) Pr(0<?<1.8):
,t) Pr(r.4<7<3):
r.1 r ¿
_ t)',n+o
[,'^('-;)"* 1,'o
1.. ..
ilt'-2)-({r+)2- 72.
5. Hallar la función de densidad /(r) de una variable aleatoria cuya función de distribución es
'17
4'
( !"-,,r, si ú > o;
f (t): \ 0, '2
|. en Io demás;
donde ú es el tiempo (en horas). Calcular la probabilidad de que un elemento dure más de tres
horas, dado que ya ha estado en uso m¿is de dos horas.
Solución: Nos interesa Pr(? > 3lf > 2), que según Ia fórmula de la probabilidad condicional se
tiene:
Pr(?>3lT>rl :#fi;
porque Ia intersección de los eventos (7 > 3) y (T > 2) es el evento (" > 3). Entonces,
l'* | -rtz
Pr(? > s) _ ./r rt :- "-t1," _ e-rlz:
Pr(I > 2) -
0.606.
[* !"-* r'
.lz 2
Sea g una función real cuyo dominio contiene el recorrido de la variable aleatoria X, podemos definir
-l-na nueva variable aleatoria Y mediante
y: g(X),
92 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
y9por
gtB ------+ R conAe B
r r---' g(r)
Y : Q ------+ R
ul-----' Y(u): s6@)).
¡ Si X es una variable aleatoria continua. Supongamos que g es una función continua y estricta-
mente creciente en todo el eje real; entonces, existe la función inversa de g que la llamaremos l¿.
Ésta también es continua y estrictamente creciente, por lo que
Aplicando la función inversa a los dos miembros de la desigualdad del argumento de la última
expresión se obtiene
Pr(e(X) (ú) :Pr(X<h(¿)) : Fx(h(t)).
Luego, se tiene la siguiente equivalencia entre las funciones de distribución de X y de Y:
Fv(t): ¡k(h(¿)).
Si las funciones F¡ y h son derivables, se pueden derivar ambos miembros de la igualdad anterior,
empleando la regla de Ia cadena:
Ejern¡rlos
1. Da<[a l¿l [rrrrc:iót¡ <lc <listlilrrr<:ión F¡ clc l¿r vari¿tll]cr ¿rlc¿rtoli¿t -\. hall¿rl l¿.rs ftttt<:i<.¡trcs rl<r rlisl tilrrrt iritr
<lc rkrusiclir<l d<l \" : u,X * b,
r' pala: a) rr, ) 0; lr) tr, < 0.
Soht.r:i.titt:
La función de densidad es
: -r/t).
Si F.v es coutiuua SC
<0;
>0.
Si lr.v <s rl<lrivable er rlcusiclad:
<0;
>0.
94 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
x I -s I -21 o | 2
Sol'ución: Como Ia variable aleatoria es discreta, basta aplicar la relación Pr(Y : A¿) : Pr(X :
ri), a cada uno de Ios valores que toma Y : X2. Entonces, tenemos que
v2 l(-¡)rl(-z)rlo, lz,
Es decir,
Y lglq lol+
Como el valor Y : 4 se repite 2 veces, unificamos sus probabilidades y la tabla queda así:
( 0, si ú<-1;
¡k(ú):{ +,sisiú>1.
-1<ü<1;
( t,
Solución: Se tienen las siguientes igualdades:
0, si -lnt<-I;
F¡(- lnü) :{ -lnú*1 si - 1< -lnú <
2' 1;
1, si -lnt>L.
:t 0,
-lnú*1
1,
2'
siú>e;
si e-l 1t 1 e:
si ú < e-1.
Por tanto,
1, siú>e:
+ lnú
- 1- Fx? lnú) :
1
Fv(t)
2
sie-'1t1e:
0, siú<e-1.
3.3. Ejercicios 95
3.3. Ejercicios
1. Irrclique si las siguierrtes variables aleatolias son discretas o corrtiuuas y su rarrgo cle <lefinición:
,l Se arroja un dado y se designan por ¿ : {el número de los puntos aparecidos es par} y por
6 : {el número de los puntos aparecidos se divide por 3}. Para los dos eventos, halle Ia Iey de
distribución y grafíquelas.
4. Determine Ia función de distribución de la variable aleatoria X que está definida por la ley que
se presenta en la tabla.
-2 rt
rl4 213 rlL2
¡. Un escritor ha lanzado al mercado una nueva novela. La probabilidad de que Ia novela sea muy
exitosa es 0.6, de que sea medianamente exitosa es 0.3 y de que sea un fracaso es 0.1. Los bene-
ficios esperados son: si la novela es muy exitosa, 100 mil dólares; si la novela es moderadamente
existosa, 50 mil dólares; y, si es un fracaso, 10 mil dólares. Forme la ley de distribución de los
beneficios esperados por el escritor.
6 Una agencia automotriz recibe un embarque de 20 automóviles nuevos; entre éstos, 2 tienen defec-
tos. La agencia debe seleccionar, aleatoriamente, 3 automóviles de entre los 20 para venderlos.
Forme la ley de distribución de la variable aleatoria <<número de carros defectuosos entre los
escogidos>>.
7 IJn apuesto príncipe visita a un rey que tiene cuatro hijas casaderas, con la intención de integrarse
en la familia. Las probabilidades que tiene el príncipe de ser aceptado por cada una de las
princesas son 0.6, 0.8, 0.2 y 0.4. El príncipe pide la mano de cada una de ellas de forma
consecutiva y se casa con la primera que acepte. Sea X la variable aleatoria definida como
X:i si se casa con Ia i-ésima hija (i - 1,.. .,4) y X:0 si todas le rechazan. Calcule la ley
de probabilidad de X y su función de distribución.
8 Una chapa para puertas consta de tres piezas mecánicas. Suponga que las probabilidades de que
Ia primera, la segunda y la tercera piezas cumplan con las especificaciones son 0.95, 0.98 y 0.99,
respectivamente. Determine la distribución de probabilidad del número de piezas que cumplen
las especificaciones en una chapa.
9. Sea X una variable aleatoria discreta cuya función de probabilidad es p(r) : :1,2,3,4,5.
#,r
a) Encuentre el valor de & para que la función p(r) sea la función de probabilidad de X;
b) CalculePr(l < X34).
C)a¡>ítulo 3. Vari¿tltl¡:s Aleatorias, Esperattza y Varianza
l(. l,¡r lr¡:¡.'i,irr ,lr'¡rrol,irlrilirl:r<1 ./'cl<: rulr r'¡uiirl¡lc ¿rl<r¿tloti¿r -f <:s rrttl¿t s¿rh'o cn lr.rs lrtttrtos /.:0. f .i'
'1. lirr cl[r,¡ l()nr¿r lr)s vitl()los:
il. t':r,r r''u'ialllc ¿r,leatoli:r -Y se dicc <¡ur: sigrr<: lrr lcy cle B<rnfot'cl si se cttrnple qtte
,:) /(t ) =
{iZ;:, :i ;: l]
15. Dncla la fttttcióu de distlillrrt:ititr rk: r¡¡¡:¡ r'¿tt'ia,lrlc ale¿rtori¿ .{:
0. si z(0;
L 14. si 0lr(1;
F(.r:) =
t l:J. si | 3r <2;
:r fr.t. si 2(1t14;
(t: -').)/3. si 4l:r. ( 5;
l. si ;u)5.
C)al<:r tlc lits ¡rt'o! r;.l,rriid¿ul<ts:
3.3. Ejercicios 97
0, si r<-J2;
Il8, si -J2<r10;
215, si 0(r1I;
Il2, si t <, < J2;
314, si t/2<r<512;
1, si r>512.
Determine la función de probabilidad asociada y grafíquela.
10, sir<-2;
F(r):l ar+b, si -2Sr<2;
I t, sir>2.
a) Determine los valores de a y b; c) Halle: Pr(X
b) Encuentre la densidad /; Pr(lxl > 1.2).
El tiempo en minutos que una persona espera un autobús es una variable aleatoria cuya función
de densidad viene dada por las fórmulas: /(¿) : j ouru 0 < ú < t, f(t) : o.ru I < t < 4,,
(t):0 I
para los demás valores de ú. Calcule Ia probabilidad de que el tiempo de espera sea:
f
98 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
22 Los registros de ventas diarias de una empresa que comercializa computadoras muestran que
venderán 0, 1 o 2 computadoras de acuerdo a Ia siguiente tabla:
No. de ventas 0t1t2
Probabilidad
24. Una empresa alquila el tiempo de cómputo de un tipo especial de computadora a una universidad.
La empresa debe planear su presupuesto, por lo que ha estudiado el tiempo de empleo de Ia
computadora. El tiempo semanal de alquiler (en horas) sigue la función de densidad dada por:
si o( t<4;
*U'n-U'
f(t):{ 0,
[ caso contrario.
25. La cantidad de pan (en cientos de kilogramos) que vende una panaderÍa en un día es una variable
aleatoria con función de densidad
cÍ, si 0Sr13;'
c(6-r), si 3l r16;
0, caso contrario.
a) Encuentre el valor de c;
b) ¿Cuál es la probabilidad que el número de kilos de pan que se vende en un día sea: (i) más
de 300 kg?, (ii) entre 150 y 450 kg?;
c) Denote por A y B los eventos definidos en (i) e (ii), respectivamente. ¿Son independientes
Av B?
26. La cantidad (en gramos) de fertilizante químico que una planta puede recibir es una variable
aleatoria cuya función de densidad es
f srla z;
(r): { ff, - si r € [o' 8];
f
0,[ caso contrario.
Ejercicios 99
l;. Se extrae una bolita al azar de un bolillero que contiene 3 bolitas numeradas de 1 a 3. Llarnamos
X al número de la bolita extraída. Una vez conocido el valor de X, extraemos una nueva bolita
alazardeotrobolilleroquecontiene4-XbolitasnumeradasdeXa3(porejernplo: siX:2,
la segunda bolita se extrae de un bolillero que contiene dos bolitas con los números 2 y 3).
Llamamos Y al número de la bolita extraída en el segundo bolillero.
f(n\:Ir'siz€[o'1];
\"¿/-lo, sizl[0,t].
a) Si Y - X2, halle la función de distribución de Y;
[ si z [-1,1].
Halle Ia ley de la variable T : -52.
i.'. IJna variable aleatoria X tiene función de densidad
rf") : (! sir€l-z,Z);
I o1 si n ( l-2,21.
Halle la probabilidad Pr(X2 < 1).
5,
sig€l-t,Z];
0, caso contrario.
Una variable aleatoria X tiene función de distribución Fy(r) - 1 - e-o', si r ) 0. Halle las
funciones de densidad de:
100 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
{Y:f7; b) Z :1tnt.
En las secciones precedentes vimos que una variable aleatoria queda definida por su función de dis-
tribución, pero muchas veces solo se desea tener una idea del comportamiento general de las variables
aleatorias, sin dar detalles de su distribución de probabilidad; para tal propósito, examinaremos dos
características teóricas de las variabtes aleatorias: la esperanza y la varianza, que son dos parámetros
que miden la Iocalización y la dispersión de Ios valores que toma la variable.
1. Si X toma un número finito de valores rr¡ 12, ..., rn con probabilidades h:Pr(X : rt),
pz : Pr(X : r2), . . ., pn: Pr(X - ,n)t
E(x) : f,o*rr.
l^-1
2. SiX toma un número infinito de valores rr, 12, .. . con probabilidades p¡ : Pr(X : rk),
k:I,2,-..; oo
E(X) : ln*"r.
/c: f
E@:
l: rf (r) dr.
Observación. Si /(r) toma valores distintos de cero en un intervalo [a., b], Ia esperanza se calcula
como
Fj(x): rf (r)d,r.
L
La esperanza posee varias propiedades, independientes del tipo de la variable aleatoria. A continuación
vamos a enunciarlas y demostrar algunas de ellas, en el caso de una variable aleatoria continua, los
otros dos casos quedan como ejercicio para el lector.
Propiedades
D en¿ostt'o,ciór¿:
dis-
2. Aditividad. La esperanza de la suma de dos variables aleatorias es igual a la suma de la^s
bles
esperarrzas de los dos surnandos:
dos
tIoS E(x+Y) :E(X) +E(Y).
3. Un factor constante c se puede sacar del símbolo de la esperanza matemática:
E(cX) : cE(X).
Demostración:
l'c. f@
E(cX) : (r) O, : (r) dx : cE(X).
.l_*crf " .l_*rf
4. Sea g una función real, la esperanza de la variable aleatoria Y : S(X) está definida por
E (x,) : l:,2¡q,¡d,.
5. Si X y Y son dos variables aleatorias independientes
E(xv) : E(x)E(r).
Observaciones:
E(Y):aE(x) +b.
1 2. Si la función de densidad es simétrica respecto a Ia recta
3.5)
r: rr¿, entonces E(X) : rn. (Figura
rria y
ücula
aclon
a, los
Dos variables aleatorias con la misma esperanza pueden tener distribuciones diferentes. Para diferen-
-iarlas es lecesario introducir otra característica teórica que informe sobre la dispersión de su posibles
r-alores.
LO2 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
3.5. La varianza
L¿r iclea de <lspelanza no ittclica cótuo cst¿i clistlibuicl¿ Ia m¿ts¿r en torrro ¿ su <l<ntro; ósto sc explrcs¿)
rrrecli¿rnte la Ia valiable ale¿rtoria X, que se nota Var(X) o o2.
uari,an,zo, de
Definición (de varianza) La varianz¿t de nn¿t variable aleatoria X es rrn núrmero no negrrtivo que
se calcula por:
Var(X) : E(X -E(X))',
o, equivalentemente, por
Var(x) :E(x2) - (E(x))''
1. Para una variable aleatoria discreta que toma un número finito de valores rtt r2t .) trn con
probabilidades p1 : Pr(X : rt), pz:Pr(X : rz), ..., pn: Pr(X : r,-)i
2. Para una variable aleatoria discreta que toma un número infinito de valores rr, 12, .. . con
probabilidades p¡ : Pr(X : rk), k : L,2,. ..:
La varianza da la idea de cuán ampliamente dispersos se encuentran, en torno de la media, los valores
que toma Ia variable aleatoria:
1. Una mayor varianza indica que Ios valores tienden a estar más alejados de la media.
2. Una menor varianza indica que los valores tienden a estar más concentrados alrededor de la
media.
o:\@.
3.5. La varianza 103
Propiedades
Var(c) : g, c constante.
Den¿ostración:
Var(oX + b) : a2 Yar(X).
Fj,emplos
de la
-. La variable aleatoria discreta X está definida según Ia ley
x I -41 6 10
p10.2 10.3 0.5
3
a) E(X) : D : -4 x0.2 +6 x 0,3 * 10 x 0.5 : 6.
A:1 "xp*,
Calculemos E(X2):
Entonces,
Var(X) : P(X2) - (E(x))2 :64 - (6)2 :2a.
b) Vamos a aplicar las propiedades de la esperanza y la varianza para calcularlas:
xl 1oo I so I ro I o
p | 1/Boo | 1/3oo I sTaoo I zoaTaoo
Así,
293
E(X) rooxfr*5ox #.rox.*I+ox 300
0.67.
Como la persona paga 1 dólar por el boleto, Ia ganancia (total) esperada es E(G) : 0.67 - 1-
-0.33 dólares; es decir, una pérdida.
3. Una persona quiere abrir una puerta y tiene 5 llaves, de las cuales solo una corresponde a la
cerradura. La persona va eligiendo al azar y probando abrir Ia puerta. Calcular la esperanza y
la varianza del número de intentos si separa las llaves que probó anteriormente.
Solu,ción: Como cadavez separa las llaves utilizadas, cada llave tiene la misma probabilidad de
abrir la cerradura; por lo que la variable aleatoriaX: <<número de llaves utilizadas>), sigue la
siguiente ley:
xl1 I 213 I 4l b
Entonces,
515
E(x): D*ou:;I/c:3,
l--1 t- r
515
E(x') : Dk'rr:;tk2:rr,
l': I [:1
Var(X) : lI - 32 :2.
3.5. La varianza 105
4. Una variable aleatori¿r X toma solarnente dos valores rt- y r2t tales que 12 > r1. La probabilidad
de que X tome el valor zl es 0.6. Hallar la ley c¡re sigr.re X, si la esperanza rnatemática y la
varianza son conocidas: E(X) :1.4 y Var(X) :0.24.
Sol'uci,ón: Esclibamos Ia ley de X:
La ley de X2 es
Entonces,
E(X') :0.6r? + g.arl
v
Var(X) : n(X2) - [E(X)]2 : 0.6r? + g.arl - r.42 : 0.24
I o.aq t olq:1.4
\ o.o"l -t o.4r| :2.2
.6 t.4
(,1. z
si Ít<, -1;
F(r) : si -1l<r 3;
si r,) ' .).
(r): si -1(r(3;
f
caso contrario.
De manera que
E(x) : (,)l_,
rf
1)
o":
e (x') :
[_,
r2r@ (i) r"
106 Capítttlo 3. Variables Aleatorias, Esperanza y Varianza
Pot lo t¿urto,
v.u(-K) : p (x') - (E(x))2 :: - r' :: .)
J
b) Tenerrros la vari¿rblc ¿le¿rtor-i¿r Y :5X *2, cuyzr. función de densiclad no la corrocerno$. pero
podenos enrplezrr' las propiedacLes cle Ia esperanza y de Ia varianza:
E(Y) : :5E(X)+E(2) :5 x It2:7,
E(5X +2)
Var(Y) : Var(5X + 2) :25 Var(X) :25 x * : +
.) .)
b. Una valiable aleatoria X está definicla por slr densidad J'@):r+l2 el intervalo (0, 1), fuela
"n
de este intervalo f (r):0. H¿llar la esperanza matemática de la variable aleatolia Y : X3.
Soluctón:
E(v) : rs f @) o, : ,t (, **) o,
.lo'
,)ar:1" *1 4l '
)"- ls 2 a)o
u--.40I3
7. Determinar la esperanza y lti ', ' a valiable aleatoria 7 cr.rya fnnción de distlibrrción
csF(ú) -1-e2t,t>0.
Soluczón: La función de deusidad es:,/(/) : F'(t):2"-2t, ú > 0; y 0, caso contr¿rrio.
Calculemos Ia esperarrzn:
fx
tr(x) : /.oo
2re-2''d,r.
.l_,"r.tb)nt: .lo
Irrtcgrando por partes, ponicriclo rL: :1. rl,u : e-2'cl,r; pol lo tanto: ilu,: dn, Lu : _
'r"-r',
: -rc2 l-*1 l'n
2'
l'*
.lo r".,,rh
ln'2.1u "-r."rl,
,"-" l* 1 __r,.1-
z io-4c l.
;'^'^
Entonces,
E(X): , lo*
,"-'2'rL*:r(i) - I
Necesitamos el cálculo cle E(X2):
var(X) : E (X,)
1 tt/1\2 1
- (tr(.Y))2
o \ol
\o /
¡
"
S.S. La varianza
Etr ttlt slll)crlriercacro se r¡o,,.1,. ,,-.-
ro7
-.
crescrir,e ; ;;;;'.,". .:ff:fii:::;1ij,."":J1,*,:,i:"..T;"^,jj,f,:i,,ililTjc arcaroria quc
.f(r):[;*'sjo<'<5o;
I o, caso contrario.
a) ;.Crrál es Ia c¿nt jdact
de calnc quc se esr)
Ü¡l)el'a vender diariamente
llién, halle ia desviació" en el supermercaclo?
Tam_
"r*0""..oq
b) Si la ganancia en el producto
se expresa
-r"4vvu por
ganancia esperada. vvL la ecuación
r'L ccuaclÓn C:
).
a) Calcularemos l¿
de la variable aleatoria
efectúra ,ro"r.lr,lifjlllza como er indicador
de las ventas que
",
E(x): ['o
to " Gil o*: # fo,o
,, o,
,hl#]; :3333
Así' el supernrercatro
espe.aría
-- vender
Calcrrlernos E (X2): 'v'uL 33.33 kg diarios cre car'e.
La r.ar.iarrza es
-\v'/ :
E(c) n(2.-, \
"rl*o" *'o):
.r
P,_1
Propiedad 1. Va € (0,1), , It,
41,-
l.;:0 | - (L
I (1 -P)A
po,:-ñ7, h:I,'2,..,;
L- 1.' P€ (0,1).
: io-,k:i(-#) (r -P)k ¡
E(x)
A=1 A:1 '
: l-r) i,'- :- (*)
\ I'p)3' ir, -or*
\nP/7_o
p)k
: L-p
Dttono
: ct + q2 + q3 +... - Dnr
k:1 k:r
: /. r,\\ ¿
'P)
3.6. Función generadora de rnornentos 109
Los momentos de una variable aleatoria son númelos que representan algunas calacterísticas de la
jistribución de probabilidad asociada. Bajo ciertas condiciones el conjunto de momentos determinan
ie manera única a la ley de probabilidad.
Definición (Mornentos) Sea X una variable aleatoria y sea r¿ un número natural. Cuando existe,
el nútrnero pr:E (Xk) es el k-ésimo momento de X.
f ntonces, tenemos que Ia media p es el primer momento de la variable aleatoria; es decir, F: lJt.
-isociada a cada variable aleatoria podemos encontrar una función que permite calcular sus rnomentos.
fsta función tiene Ia propiedad de que, al igual que la función de distribución, caracteriza de manera
:rica a la ley de probabilidad de la que proviene
M(t):E("t"),
iefinida para valores reales de ú tales que la esperanza existe.
- . función generadora de momentos se utiliza tanto para variables aleatorias discretas como continuas.
alrt o
Ejemplos
x I -4 I 6 I 10
p 102 | 0.3 | 0.5
Solución: Resulta que
I[(t) : E("t"):|pr"tr
k
: 0.2 e-at * 0,3 e6¿ f 0.5 e1o¿
Hallar la función generadora de momentos de una variable aleatoria cuya función de densidad es
rI si
r, ' I
f\L;): \ -.
4 -1<r(3;
[ 0. caso cont rario.
,et' 4
r- siguiente resu.ltado nos indica córno se pueden obtener los momentos de cualquier orden con el
:-:rpleo de la f.g.m.
110 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
Teorema. Sea X con furrción generaclora de rnomentos,4f (rl), con derivadas continuas dc cualquier
orden; entonces,
.,_
I-Ik-L qlxu):
j-nt,,,l
tr,,,=o
\-'/- dj",
Es decir, el k-ésimo momento de una variable aleatoria se calcula como la derivacla de orden k de la
f.g.-., evaluada en cero.
Observación. Se tiene que E(X) : Ft y Var(X) : Fz - F?.
Ejemplos
x I -4 I 6 I r0
p10.2 10.3 10.5
Soluc'ión: Antes calculamos que il{(ú) : 0.2 e-4t * 0.3 e6¿ * 0.5 e10ú; por tanto,
.1
: _0.8e-at * 1.8e6¿ * belo¿
aual
t,)
o.-
AI ft) : 3.2e-at * 10.8e6¿ f 50e10Ú.
dt2
Entonces,
ltt :
ftnup¡: -0.8e-a(o) + 1.8"u(o) -¡ 5"10(0) : 6,
(l
I@):l q,'si -1<r(3;
[ 0,
conrrario. caso
Por tanto,
!u,rt (3t-1)e3¿*(1-t)e-r
dt ¡t2
+t,
(st' - 6t + 2) e3t - - l:
.-)
',:r
#,u,
3,7. Ejercicios 111
¿2
Puesto que 1,1(ú) no está definida para l, : 0. para hallar M (0) aplicaremos la
*r*r|, ,ljz
regla de L'Hospital; entonces,
¿2
Por lo tanto,
Var(X) : pz- Lr?: 56.4
243
3.7. Ejercicios
l. Halle la esperanza y la varianza de las variables aleatorias discretas definidas por
xl-0.7t10.24 10.61 Yt 2 t 4 t 5 I 6
pl 0.2 10.5 10.3 p 10.3 10.1 10.2 10.4
Se escoge aleatoriamente un número de conjunto $ : {-1;0; 1}. Sea X el número escogido.
Encuentre su valor esperado, La varianza y la desviación estándar de X.
¿Existe una variable aleatoria X que cumple qLre E(X - 2) :8 y que E ((X + 1)2) : 120?
a) Jx\r): r;
I b) fy(r):lrl. c)fx@):t-lzl. d) f x@) :t '.
Encuentre la esperanza y desviación estándal de las variables aleatorias definidas mediante las
leyes:
f 0. si r ( l;
.) r(,) :{ +, si 1(.c14;
t,I sir>4.
t12 Capítulo 3, Variables Aleatorías, Esperattza y Varianza
(o sir!1;
l:lr): {L2-r'
,
t2 - si11.r.<2;
b)
I t. sir)2.
c) r,-..:l I Zr. si z e (0. l):
/(rt o. sir((0, 1).
d) ' ))' * Br - l2). si r € (-5. -3):
..\ <Í - *frt
f¡,(t:):
--
I O, caso contrario.
(t. si re [1,2]:
e) f(r):1 '
I o, si zl11.2l.
(Determine primero el valor de c.)
8 Una variable aleatoria X toma los valores 4, 6 y o con probabilidades Pr(X - 4) : 0.5, Pr(X :
6) : 0.3 y Pr(X : a) : p. Si se sabe que 1a esperanza de X es igual a 6, halle los valores de p
ya.
q Halle la varianza de una variable aleatoria Z q:ue solo puede tomar dos valores, el uno el doble
del otro, con la misma probabilidad, si se sabe que E(Z) :0.9.
10 I-a variable aleatoria discreta X tiene solamente dos posibles valores: rr y fr2, además 11 1 12.
La probabilidad de que X tome el valor 11 es igual a 0.2. Halle Ia ley de distribución de X.
conociendo la esperanza E(X) :2.6 y la desviación estándar o : 0.8.
11. Una variable aleatoria X puede tomar tres valorest r,1 : -I, 12:0 y 13:1. Si se conocen las
esperanzas matemáticas E(X) :0.1y E(X') :0.8, enci-r.entre las probabilidades Pt,Pz yp¡, de
los I'alores rt, 12 y 13) respectivamente.
12. La variable aleatolia X tiene ítnicamente tres posibles'u.alores rr:1,:x2 y x3 (rt < rz <'J4).
Las probabilidades de que X torne los valores rr y 12 son respectivamente iguales a 0.3 ¡,'
A.2. Determine la ley de distribución de X, conociendo Ia esperanza E(X) :2.2 y la varianza
Var(X) :0.76.
i3. La variable aleatoria X tiene función d e distribución
0, parar12l
F(r) : arlb, para21r14;
1, parar>4.
a) I{alle e1 valor de las constantes cr y b;
74. Suponga que se escoge un núrmero real X en el intervato [2; 10] con urra función de densidad de
Ia forma f (r) : Cz, donde C es una constante.
a) Halle el valor de C;
b) Calcule Pr(D), donde ¡1 : 13;71;
c) Encuentre Pr(X > 5), Pr(X < 7) y Pr(X2 - 72X * 35 > 0):
d) Encuentre la espera\za y la varianza de X.
3.7. 4jercicios 113
15. Uu cstudiante rinde ttnil plr-reba consisterrte en 2 probleuras de elección múrltiple. La primcra ticrrc
3 posiblcs resprtest:rs y la scgurrda 5. El estrrcliante cscoge las 2 r'espuestas al ¿rz¿rr. Encuentl-e:
6 tlna organizac:íón benéfica realiza una rifa para conseguir fondos. cn la que sc vendieron 10000
boletos, a 4 dólales cada uno. E1 prerrio es un antomóvil de 12 000 dólares. Si un ciudadarro
compra 2 boletos, ¿cuál es la ganancia esperada del comprador de los boletos?
IJna persona participa en un concurso de la televisión. Le hacen una pregunta con 5 respuestas
(solo una es verdadera) si acierta, gana 10 000. Si falla le vuelven hacer otra pregunta con tres
posibles respuestas de las cuales solo una es verdadera. Si acierta, gana 1000 y si falla se le
vuelve hacer otra pregunta con solo dos respuestas si acierta, entonces no gana nada y si falla
pierde 500. El juego termina cuando la persona acierta c después de fallar la tercera pregunta.
Se asegura un vehículo de 50 000 dólares por su valor total, pagando una plima de C. Si la
probabilidad de robo en un año es de 0.02, ¿cuál es el valor de la prima que debe cobrar la
compañía de seguros, si espera ganar 200 dólares?
9 Si Roberto termina sus estudios en Junio, podrá disfrutar de una beca para poder realizar un
curso de especialización con todos los gastos pagados. Si aprueba en Septiembre, la beca sólo le
cubrirá el 40% de los gastos. Si no consigue aprobar, también realizará el curso pero abonando
50000 dólares, que es 1o que cuesta. Roberto sabe que la probabilidad de aprobar en Junio es
sólo de un 10%, mientras que la de aprobar en Septiembre es de:un 4ATa.
:0, Una agencia que renta autos tiene disponibles 4 carros todo terreno, para alquilarlos. El precio
de alquiler de cada carro es 60 dólares diarios. En un estudio de mercado el propietario ha
determinado el siguiente modelo probabilÍstico sobre la demanda de estos autos:
Demanda Probabilidad
0 0.05
1 0.10
2 0.20
c
r) 0.25
4 0.20
5 0.15
() 0.05
Además, en el mismo estudio ha encontrado que sus gastos diarios son: 20 dólares por alquiler
del local y 15 por pago a ul empleado.
lL4 Capítulo 3. Variables Alcatarias, Esperanza y Vatiai;za
a) C¡rlcttltt r:l tLítrrtelo csp<:r'aclo dc carlc-'s tocl,r tellerro <¡re la agencia alqr-',il.rrri urr rlÍa (;Lralquiera;
l,) CalcrLl<-r ltr girrrnirciir cli¿rli¿ csperad a:
,') Caicule Ia <l¡:sviación cst¡inclal cle lii gzrrranr;iir
'21 Urr poltafolio r-lc invcrsi<irr sig-ue r:l .,iguicltc: (iselr€r1ir lrlolrabilístic:o:
22.Uncírculoderaclio1eszonificaclcen10"írculoscorcélrtricosd.eradios "' 10
10' 10"
lanza un dardo sobre el círculo, si éstc cac en la zona ccmprerdida ertre los cír'culos de radios
i^"lJellar:zad.organa10-idólalcs, i:0,l,...,g.SeaXlacantidaddedineroganaclo,
i0 10
a) Halle Ia ley de la variable aleatolia X;
b) Calcule su esperanza y su varianza.
23. EI espesor del recubrimiento de unos cables tiene funciórr de densidud ry, corr 100 l1rn <:r <
'r'¿
2ao ¡tm.
a) Determirre la media y la varianza del espesor del recublimiento;
b) Si el costo del recubrimiento es de 0.5 délares por micrómetro de espesor, ¿,cuál es el costo
medio por recubrir los cables?
24. Un supermercado tiene una dcmanda dialia variable X de la cantrdad de caile que vende, de
tal manera que X (medida en cientos de krlogramos) tiene una funcrón cie densidad
(
f@):1oq1r'. sio( r<4'
|. 0, caso contrario.
26. El tiempo de uso diario de la red Internet en Lrna oficina tiene p,-r1 :r,;r-ción cie densidad (medida
en horas) a
( gr2(g - ,\
f("):{'-ñr-' sio(¡(s:
0, [ carco conira:- .
3.7. Ejercicios r-15
a) Calcrrle cl v¿rlot eslrclaclo y la virriarrza rlcl tieurpo <.lialio clc rlso de l¿r lecl Intelnel,.
lt) El tictlitct cle ttso ilc Irrtcrrrcl' crlcsta 2 clólares pol hora. C¿Llcule el v¿r,lor esperiiclo v lzl
clesviat:ióu estárrdat ck:l costr¡ scur¡-n¿ri (cn 5 clÍas laLorablcs) por el citilrio rrso.
La lcy cle 1tloltabiliclacl rlue rlesclibc la clistarrr'lia (cn inctros) a Ia. <¡-re un atlet¿r lanza la,jabirlina
CS
a) Halle la probairilicl¿rd de qLre rula jal;alir'a lanz¡id¿r llcgue a nna dist¿rncia mayor quc 60 m;
b) Determinc el valor esperado dc Ia distancia a la que llr:ga la jabalina;
c) Halle Ia varianza y la desviación estándar de la distancia cubielta por la jabalina.
:3 Dcmuestre quc la ebperanza y la valianza de Ia variable aleatoria discreta definida por
Calcule:
Halle la esperanza matemática y la varianzadela variable aleatoria Sn: Xrt Xz*... * Xr.
116 Capítulo 3. Variables Aleatorias, Esperanza y Varianza
33. Las variablcs aleatolias X1 , X2, . .. , Xrr,Y,Yz,. . . ,Y,, son independicntes. Pongamos
E(X¡,) : a, Var(X¡) : s2
35. Sean XyYdos variables aleatorias independientes e idénticamente distribuidas con f.g.-. M(t)
Demuestre qtte My¡y(t): Mx(t)llv(t) y qlue My-Y(t): Mx(t)M\'(-t)-
36. sea X con f.g.m. Mx(t), y sean a y b dos constantes. Demuestre que Moy¡6(t):"'btwx(ot).
Capítulo 4
:r este capítulo se presentan, en detalle, algunos tipos de leyes que siguen las variables aleatorias, que
:f,arecen frecuentemente en problemas prácticos y cuyas propiedades deben ser conocidas.
-{ una variable aleatoria X que sigue una ley L de parámetros (pr,pz) Ia notaremos como X - L(pt,pz).
E(X) : n*7
: :U Vaflanza
^2 -'t
VarlX)
t2
-
' equiprobabilidad es la forma m¿ís obvia de asignar probabilidades dentro de un fenómeno aleato-
:-,- cuyo comportarniento es desconocido. Esta ley aparece en los jr.regos de azar en los que todos
r,s jugadores tienen iguales posibilidades; además, esta ley es la básica en la simulación de eventos
u,=atorios mediante comput adora.
E¡emplos
717
118 Capítulo 4. Principales D istr ibttciones de P rob abilidad
Sol,tt,c'i,ón: Sc tir:rre que ?¿ - B )' sr: asigrtzr lir probabiliti¿rl Pt (X : i),8: 1; ,,trt,rt,""r,
(l
¡r-F1 8+1
E(,Y)
2
,2
,
Var(X) :
n,2 -I 64-r 27
12 1')
2. Una máquina registra, en rninutos conipletos, la di.felencia de tiernpo en e1 paso cic c¿rrrriones
por cierto lugar de la carretera. Se sabe clue ia diferencia máxima puede ser 9 rninutos. Si se
asrlme qne los arril-ros son aleatolios, calculal cl tiempo qlle se es1;eraría exista errtlc dos ¿rniJ¡os
consecutivos, su varianza y desviación estándar.
Soluci,ón: La variable aleatoria puede tomar los valores 7,2, ..., 9, que suponemos tiene dis-
tribución uniforme, por Io tanto,
E(x) : '+]:nrt:5min,
22
Var(X) : +: \/:6.62min2,
o : J6.6? : 2.58 min.
3. Un reloj está descompuesto y suena) aleatoriamente, a la hora en punto; es decir, puede sonar
a Ia una, a las dos, . .., a las doce; dando ese mismo número de campanadas. Determinar la
esperanza y varianza de la vari¿rble aleatoria que describe el núrmero de campanadas que se habrá
de esperar que dé el relo.j.
Solttción: Encontremos la esperanza y la varianza, considerando n: 12:
n2 -r L44-I
Var(X) : 11.92 h2
72 72
Nos planteamos el siguiente problema: en una urna se tienen ly' bolas, n de las cuales son rojas y las
N -n restantes negras, de las cuales se extraen al azar r bolas; investigaremos la probabilidad de qne
el grupo eiegido contenga exactamente k bolas rojas. Aquí, k puecle ser cualquier entero entrc cclo l
TL A T.
l,a probabilidad es
Pr'(X : : Cf,C'f!,,
/,')
ci
Si consideramos l¿ proporción de irolas rojas en la composición inícial de bolas contenidas en la urna
n,
p : I y q : I- p, la fórmula de Ia probabilidad puede expresalse colno
' N"
Ck,,,Ch-"*
Pr(X: tt): ff, A:0. 1,...,mín{Np,r},
por Io que la probabilidad p de obtener una bola roja se puede introducir como un parárnetro que
define la ley.
4.2. Distribución hipergeornétrica 119
-\ ttrta variable ¿rlc¿toti¿r X c¡-rer sigue una ley hipelgeornétlica cle lralá,rnetlos (Iy',n,r) se la uota
.rrcr li;rItl c tl(A'. r¿.r').
Lir csp<rlauza cs
'.' la rrarianza
vartx\:rL(l_
,u¡\-, i,
/A/-r\ : rr(,
" ' (,^,, /l/-r\
¡/ \' 1,,) _ r) -ttt (¡v _ r/
(,nú-n)!(N-r)!
Po: ¡/!(¡/ -n-r)l
n'll-k r-17-k
Pk : Pn-r f ñ_n_r+k, k : I,2,.. .,T.
Ejemplos
-. En ttn grupo de 12 estudiantes 8 son sobresalientes. Por Iista se escogieron 9 al azar. a) ¿Cuál es
la probabilidad de que entre los estudiantes seleccionados hayan 5 sobresalientes?; b) ¿Cuántos
estudiantes sobresalientes se espera encontrar entre los seleccionados?
SoIución:
8! 4l
Pr(Z :5) :
elqi : 5!3t4CI 14
c?, 12t - 55
9!3!
b) Calctrlemos la esperanza de Z:
E(Z): rn 9x8
¡'¡ 12
Se esperaría encontrar 6 sobresalientes.
Drane, J. W., Cao, S., lVang, L. y Postelnicu, T. (1993), "Limiting Forms of Probability \,Iass Functions via Recur-
-:- re Formulas," T he American Statist'icia'n, 47, 269-27 4.
L20 Capítulo 4. Púncipales Distribuciones de Probabilídad
En trn contlol de calidacl inch.rstli¿rl se ton¿r un lote dc 10 lriezas l)¿lra nna irrsirelción. ELr el lotc
Luy 8 piczas correct¿rs. Sr: tottiart al azat2 piezas. Form¿rr lil lcy clc clistlil.,rrcirin clel nírrnero clc
picz:rs corlcctas cntrc 1¿rs escogi<lir"s .y calcrrltrl su esl)eranz¿1.
Sc¡ht,c'ió'r¿: La variable l'(nirmcro
aleatori¿r. c-le piezas correctas entre las escogiclas) tiene los
siguientes r,¿lores: zt : 0, L2:7, :t:3 : ).
Ernplearerrios la ley hipergeométlica con A¡:10 (rrúrmero total cle piezas), ¡¿: B (núrrncro total
de piezas correcta^s) y r :2 (tarnairo de Ia muestra); es decir, Y - ft(10,8,2), obteniendo:
C3C3
Pr'()/ : 0) : 1
- 10x9 -
1
c?n 4,)
7x2
Pr(Y: 1) : c¿c¿ 8x2 16
c?o 45 45
Bx7
Pr()':2):W Ix2 28
45 45
w Yl o | 1 | 2
La esperanza es
E(Y) :6 ¡ 116 28
+'2x-:1.6.
45
-+1x- 45 45
Generalmente, se define la variable aleatoria que sigue una ley de Bernoulli asÍ:
La ley de probabilidad es
La ley de Belnoulli desempeña un papel fundamental en el análisis de fenómenos en los cuales solo se
tienen dos resultados mutuamente excluyentes, como es el caso de muchas preguntas en todo tipo de
encuestas o Ia cleterminación del sexo de los recién nacidos.
4.3. Distribuciones de Bernoulli y binomial L2L
Ejernplos
: -pongamos que se reah.za una sucesión de n pruebas de Bernoulli e interesa conocer el número de
-ritos>> obtenidos, al margen del orden en que ellos se presenten. EI nirmero de éxitos puede ser 0,
'- 2'
"', n'
:- ilama binomial a la ley de distribución de una variable aleatoria discreta X
que describe el número
' ie éxitos en una sucesión de n pruebas de Bernoulli independientes, en cada una de las cuales la
-:.,babilidad de éxito es igual a p.
-'t-';ley de distribución binomial fue descubierta por James Bernoulli, quien Ia dejó escrita en su obra
Conjectandi,, ptblicada en 1713, después de su muerte ocurrida en 1705.
,iistribución
--'-:ra binomial tiene amplia aplicación en Ia teoría de mr.restreo cuando se puede contestar
r pregunta írnicamente con dos opciones (por ejemplo SI-NO).
; -álculo de ias probabilidades puede ser un proceso difícil porque los factoriales en los coeficientes
--- -,rriales crecen muy rápido, mientras que las potencias de p y q decrecen rápidamente. Por estas
:-r-)nes se utiliza la siguiente fórmula recursiva para su cálculo2:
Po : (l-p)"
pk :
n-._l-l;
pk,I--------;-
p
ff : I. Z)... jll.
K l--,
I-P
-)rane, J. U/. y otros (1994), op. cit
122 Capítulo 4. Principales Distribuciones de Probabilidad
Ejemplos
1. Su¡>ongamos que en r,rna población existen igual nirmero cle holnbres y de rnqjeres y consideremos
aquellas familias que tienen 4 hi.jos.
a) Formar Ia ley de Ia variable aleatoria que describe el núrmero de hijos varones en dichas
familias.
b) Calcular la probabilidad de que en una de estas familias haya miís de un hijo varón.
c) ¿Cuántos hijos varones se espera que haya en una familia que tiene 4 hijos?
1
Soluci,ón: )emos que p :
Sat y el número total de hijos es n : 4. Entonces, Ia variable
t
aleatoria X: <<Número de hijos varones>>, sigue una ley binomial de parámetros (4,|f 2); o sea,
X - Bin(4,t12).
Pr(x: o) : c3 (;)'(;)'-': *
o Si hay un varón, k: I:
Pr(x:1) : cl (;)'(;)^-': i
o Si hay dos varones, k:2:
n-'
Pr(X :2) : (;) :z
"1(;)'
o Si hay tres varones, /c : 3:
Pr(X:3) : cl (;)'(;)'-': i
o Si hay cuatro varones) le:4:
Un dispositivo est¿i cornpuesto 1>or tres elementos que traba.jan independientemente. La pro-
l¡abiliclad cle f¿rlla de c¿rda elemento en Lrrr día es igual a 0.1. Formar la ley de distribución del
rrúmero de elementos qr-re fallan en r-ru día.
Soluciórt: La variable aieatoria X (<nirmero de elernentos que fallan>>) puede tomar los siguientes
valoles:
z1 : 0 (ningún elemento falló), 12: I (falló un solo elemento), 13 : 2 (fallaron dos elementos),
fr4:3 (fallaron tres elementos).
Las probabilidades de fallo de cada uno de los elementos son iguales entre si, entonces es aplicable
la ley binomial; por lo tanto, X - Bin(3,0.1):
pt : Pr(X : 0) : c3(o.t)o(0.9)' : 1. (0.1)0. (0.9)' :0.729,
pz : Pr(x : 1) : cl(o.t)t(0.9)' : 3.0.1. (0.9)2 :0.243,
ps : Pr(x : 2) : c3(o.t)'(0.9)t : 3. (0.1)2 .0.9 : 0.027,
p+ : Pr(X : 3) : c3(0.l)t(0.9)o : 1. (0.1)3. (0.9)0 :0.001.
Bn resumen,
3. Un examen consta de ocho preguntas de elección múltiple, cada una de ellas ofrece cinco al-
ternativas, de las cuales solo una es correcta. Para aprobar ei examen es necesario contestar
correctamente al menos tres preguntas. Si un estudiante se propone responder a las preguntas
al azar.
Lo que nos indica que es muy difícil que adivine todas las respuestas.
b) Para aprobar se debe contestar correctamente al menos tres preguntas, por lo tanto Z > 3-
Pr(Z>3): I-P¡(Z<3)
: r - lPr(Z : 0) * Pr(Z : I) +Pr(Z :2))
: 1 - c3(0.2)o(o.e)t - cA(0.2)1(0.8)' - c!10.2¡210.s¡6
: 0.20308.
Una agencia de turismo ofrece viajes a la amazonía. La utilidad mínima que le reporta uno
de estos viajes es 6 dólares por cliente. Ademiis, ofrece dos planes especiales, A y B. Por un
plan de tipo A, obtiene una ganancia adicional de B dólares y por un plan de tipo B, 13 dólares.
Además, se sabe que el 60% de los clientes que contratan planes especiales prefieren uno de
tipo A. Si una semana, la agencia vendió 25 viajes a la amazonía, 20 de los cuales no fueron
especiales, ¿cuál es la ganancia esperada?
Solución: La agencia vendió 25 planes: 20 normales y 5 especiales.
f24 Capítulo 4. Principales Distribuciones de Probabilidad
Consideremos una secuencia de pruebas de Bernoulli, con probabilidad de éxito p, pero en lugar de
contar el número de éxitos, nos interesa conocer el número de intentos hasta obtener el primer éxito.
Una sucesión de pruebas de este tipo se dice que forman un erperimento geométrico.
Una variable aleatoria discreta X que puede tomar un número infinito de valores I,2, . .., se dice que
sigue una ley de distribución geométrica de parámetro p (0 < p < 1), si la probabilidad de que X
tome el valor k es
Pr(X : k) : p(I - dk-t, k: I,2,. . .
A esta variable aleatoria se la nota como X- A(p). Su esperanza y su varíanza son iguales a
E(X) : p
1
Var(X) :
L-p
p2
Ejernplos
1. Si la probabilidad de que un estudiante pase una prueba de ingreso a una universidad es 0.25.
¿cuál es la probabilidad de que el estudiante pase la prueba en el cuarto intento?
Soluc'ión: En nuestro caso p : 0.25 y el número de intentos es k : 4, por lo que
Pr(X:4) : p(L-p)a-1
: 0.25(1 - 0.25)3 : 0.105.
2. En una promoción una marca de papas fritas incluye, en cada una de las fr"rndas, una de las
figuras de los tres chiflados. Si un comprador cree que hay igual número de figuras cle cada uno
de los personajes en Ia promoción, ¿cuántas fundas ha de esperar comprar para obtener las tres
figuras?
Solu"ci;ón: En Ia primera compra) siempre obtiene una figura que no se tenÍa, por Io tanto
E(X1) :1.
Para la segunda compra se tiene una probabiiidad de p2: Ió O" .orrr"*uir rrna figura nueva; así.
I
Un¿) r'cz (luo sc ticrrcrr rlos figruirs, la Prolrabilirlad <lc crLr:(¡rrtr'¿ll la figrrtzr clrc fallrr es p.l : -\¡cl
,)
r)
Así,seeSI)erarea]izar.altncrios6cotriprasc1elproc1ttcto])araobte1leI'lacoIecciórrcclrtlpleta.<
-\hora, gclrcr'¿rlicernos la iclea de l¿r lev geométrica )/ nos intcresa cl núrrnero de pnrebtrs cle Bemoulli
:recesari¿ls hast¿ obtencl exactanlente r' éxitos.
-ua variable aleatoria cliscreta X que puede tomar nn núrmero infinito de valores r, r]_7,r'12,...,
=: dice que sigue una ley de distribución binomial ncgativa de parámetros (r, p) (r > 1,0<p<1),si
-r probabilidad de que X tome el valor k es
Pr(X : ¡x) : C'r--tpr'(t - r¡n-t, k : r','t" + l)r *2,...
:l parámetro r es el nirmero de éxitos que se desea obtener y ¡r es la probabilidad de obtener un éxito.
-\ esta variable aleatoria se la nota como X - BN(r,p). Su esperanza y su varianza son iguales a
E(X) : L
p
l-n
Var(X) : ,;
\ la ley cle distlibución l;inornial negativtr tamJrién se le llama distr"ibttczón d,e Pa,sco,l y tierre las nrisrnas
.:licaciones que la ley geornétlica.
Ejemplo. Una máquina. que está clañacla) ellvasa lat¿rs cle collserva de una en una y de rnauela
--,lependiente. Se considera que el 5% de lo envasado resulta defectuoso. Si Ia máquina se detiene
::lenas produce el tercer defectuoso:
: 'l.ució'n: Definimos la variable aleatoria X: <<número <le latas producidas hasta que hayan 3 clefec-
--rsas>>; X BN(3,0.05).
-
a) Calculemos la esper¿rnza de X:
E(X) :l:,1
p 0.05 --Or-t.
c) Quc ningunl lata ploducid¿r fuc bLrcna, significa qr.re las 3 plirueras l¿Lt¿s fueron defectuosas; es
decir, A; : 3.
Pr(X : 3) : C3_1(0.05)3(1 - 0.OS;:-;t : 0.000125.
t26 Capítulo 4. Principales Distribuciones de P robabilidad
Uria r'¿rriable ¿le¿rtoria <liscret¿ X quc puedc tonr¿rr rin núrrneLo infinito de valor.<ts 0, 1, 2, .,., sc dice
quc sigue una ley cle Poisson de pirrámetro ) () > 0), si la probabilid¿d cle qrre X tome el r,¿lor k es
)' sl':
Pr(X: :
k) "-
k! , k:0,r,2,...
A esta variable aleatoria se Ia nota como X - P(^).
Su esperanza y su varianza son, respectivamente, iguales a
E(x)
Var(X) ^,
^.
La distribución de Poisson se aplica a sucesos que se presentan en el tiempo o en el espacio, tales como
número de accidentes de tráfico, número de llamadas telefónicas a una central, número de goles que
marca un equipo en un partido, número de bacterias en una placa, entre otros.
Para la ley de distribución de Poisson también existe una fórmula de recurrencia para el cálculo de
las probabilidades3, dada por
PO
:e -,\
Pt : P*-t x ^ k: L,2,. . .
k'
Ejemplos
e-3:12
Pr(X:2):;:0.224.
3Drane,
J. W. y otros (1994), op. cit
D istribución de Poisson t27
: e-330 e-331
0! 1!
:i t-(
'rii,i I--;;; f :li; "J'";f_:^'].: "''"
1r 2! * o " i:o'352'
"
El promedio de llamadas que pasan por una central telefónica en un minuto es igual a dos.
Hallar la probabilidad de que en tres minutos se hagan: a) 4 llamadas; b) menos de 4 llamadas;
c) al menos 4llamadas.
Solución: En este caso es necesario utilizar la segunda forma de la ley de Poisson con )- 2y
+
L
D.
¿.
--
Pr(X: a) ^ll"-
a) La probabilidad de que en 3 minutos se hagan 4 llamadas es
3)n _ .-66a
Pr(X:4) : "-z's(2.
41 24
:0.1339.
Lr=
: 0.1512.
c) Los eventos <<se hicieron menos de 4 llamadas> y <<se hicieron al menos 4 llamadas>> son
complementarios; por eso, su probabilidad es:
Un libro se edita con un tiraje de 1000 ejemplares. La probabilidad de que un libro esté en-
cuadernado incorrectamente es igual a 0.01. Hallar la probabilidad de que el tiraje contenga
exactamente cinco libros defectuosos.
Solu,ción: Según los datos del probleman:1000, p:0.01 y k:5. El núrmero z¿ es grande yp
pequeño, por lo que utilizaremos la distribución de Poisson. Estimamos ),: np: 1000 x 0.01 :
10.
La probabilidad buscada es
0.000045 . 105
Pr(X:5) : "-10195
< : : 0.0375.
El gerente de una fábrica planea comprar una máquina r.ueva de entre dos tipos A y B. Por
cada día de funcionarniento, el núrmero de reparaciones X que necesita Ia máquina A es una
variable aleatoria de Poisson cuya media es 0.1ú, siendo ú el tiempo de funcionamiento diario
(en horas). El número de reparaciones diarias Y de la máquina B es una variable aleatoria de
Poisson con media 0.12t. El costo diario de operación de A es C¡(t): 10ü +30X2 y para B
128 Capitttlo 4. Principales Distribtrciones de Probabilidad
as Cp(¿) : + 301'2. ¿'Cuál cle las rni'rcluirra,s cl¿r cl rnerror (:osto esPclackr, si iur clí¿r clr: tralrtr.icr
S¿
corrsisl c crL: a) 10 lror'¿is'/ 1r) 20 Lolas'l
Sol,u,t:iri¡t,: El costo cspr:raclo pzrlrL;t os
Igualrnente,
4.6. Ejercicios
Ley uniforme discreta
I IJn leloj automático registra la hora a la cual llegan los empleados de una oficinzr, err troras 1'
minutos completos. Una persona puede atrasarse irasta 59 minutos luego de la hora prefijada
para entrar, caso contrario se le corrsidera corno falta. Por cada minuto de ¿rtlaso se le col¡ra
trua multa de 50 centavos. Si los tiernpos de atraso se consideran aleatorios:
a) ¿Cuánto esperará una persona que se lc ciescuente por un día que se atrasó?;
b) Si en ia oficina hay 8 persoDas) que se atlasaron 2 r'eces al mes cada nna, ¿.cuánto ser'á el
descuento global esperado ¿r estos ernpleados de la oficina?
2. Pala el sen'icio de transporte entre dos ciudades hay 10 buses, cle los cuales 5 son de tiPo normai
(costo clel ptrsa.le 2 dólares) y 5 sou clc tipo r:spocial (costo clel pasa.je 3 dólales). Una pclsorra
tietre que r¡i¿r.iar etrtre las dos ciudades (ida y vuelta) durante los 5 dÍas la.borables clc I¿r senran¿r.
y p¿rr'¿r tLruts¡roltalse tonta el primcr lms c¡-re apalece en es¿r mt¿l) sin difelenci¿r' el tilto; ¡.cntinto
(:)Spelzllií gastar esta lrelsona en la sem¿rua?
li.
'
Eu ttna escuela prirnaria se registró el nrimero de palabras por minuto que lcían los estucliantes,
cricontr'¿irrclose qtle leían r-rrr rnÍnirno de B0 palablasi y Lrrr máximo dc 139. Ba.jo la suposición cle <¡rc
la variable aleatoria clrte clcsclibe el núrrnero rlc palabrtrs leíc,l¿ls est¿i uuiformcmente clistribuicla.
a) Halle la probabilidad de qlle un estudiante, seleccionado al azar', 1ea ¿l menos 100 paltrbras;
b) Determine el nrinero de palabras qlre se esperar'ía lea nn estudiante selcccionaclo al az¿lr..
Sea X una varia,trle aleatoria que sigue una ley uniforne sobre {-1,0,1}. Calcule: a) E (Xa)
para k : I,2,... ; b) Var (X*)
Ley hipergeométrica
Una variable aleatoria X tiene distribución hipergeométrícaH(7,4,5). Calcule:
a) Pr(X:3);
b) la esperanzartllízando la definición y verifíquela empleando la fórmula de E(X);
c) la varianza de X.
En una línea de control de calidad se revisan 10 artículos, determinándose que hay 3 que no
cumplen con las especificaciones. Si se escogen al azar dos artÍculos, identifique los parámetros
de la ley y halle la esperanza de la variable aleatoria X, que describe el número de piezas correctas
entre las dos escogidas.
Una empresa renta autos, a los que no les da el mantenimiento clebido, por lo que algunos
funcionan mal. IJn día tiene disponibles B autos para ser rentados, de los cuales 3 funcionan
mal. Ese día se rentaron 4 autos. Calcule la probabilidad de que:
a) ningún cliente haya recibido un auto que funcione mal;
b) por lo menos un cliente reciba un auto que funcione mal;
c) tres clientes reciban autos que funcionen mal.
Leyes de Bernoulli y binomial
Una variable aleatoria X tiene distribución binomial Bin(4,0.2). Calcule:
130 Capítulo 4. Principales Distribuciones de Probabilidad
t2 Urra rnáquin¿r llena las ca.jas cle palillos de fósforo. En una Jrroporción del 10 % la rnáquina no
llena las cajas por completo. Se toman al azar 25 ca.jas de fósforos, calcule Ia probabilidad de
que no haya más de dos cajas incompletas.
13 IJna encuesta revela que el 20%o de la población es favorable a un polÍtico y el lesto es desfavo-
rable. Si se eligenseis personas al azar, se desea saber:
a) ¿Cuál es la probabilidad de que sean exactamente 4 radares Ios que descubren al avión?;
b) ¿Cuál es la probabilidad de que por lo menos uno lo descubra?;
c) ¿De cuántos radares ha de constar la instalación para asegurarse en detectar aviones al
menos en un 98 % de las veces?
a) no se observen fallas?;
b) no se observe más de una falla?
c) Si un avión puede seguir volando si al menos 2 motores continúran funcionando, ¿cuál es la
probabilidad de que el avión se accidente?
18 Supóngase que ia tasa de infección de una enfermedad contagiosa es del 25 %. En una oficina
hay 10 personas que se vacunaron contra la enfermedad y ninguna se contagió.
Una compañía petrolera va a perforar 29 pozos, cada uno de ellos tiene una probabilidad de 0.1
de producir petróleo de manera rentable. A la compañía Ie cuesta 100 mil dólares perforar cada
pozo. Un pozo comercial extrae petróleo por un valor de 5 millones de dólares. Calcule:
Una línea aérea, habiendo observado que el 5% de las personas que hacen reservación no se
presentan para el vuelo, vende 100 boletos para un avión que tiene 95 asientos. ¿Cuál es Ia
probabilidad de que, el momento del vuelo, haya un asiento disponible para cada pasajero?
tl En un examen se plantean 10 preguntas a las que debe responderse verdadero o falso. Un alumno
-)
aprobará el examen si aI menos 7 respuestas son acertadas. ¿Qué probabilidad de aprobar tiene
un estudiante que responde todo al azar? ¿Y uno que sabe el 30 % de la asignatura?
Leyes geornétrica y binornial negativa
Cuando se graba un comercial de televisión, la probabilidad de que un actor recite correctamente
0.3. ¿Cuál es la probabilidad que el actor recite correctamente su diálogo
el diálogo de su toma es
en la sexta vez?
-'a. La probabilidad de que un tirador haga blanco en un solo disparo es igual a 0.2. Al tirador se
le entregan cartuchos hasta tanto no yerre el tiro.
En un examen, en el que se realizan preguntas sucesivas, para aprobar hay que contestar correc-
tamente a 10 preguntas. Suponiendo que el alumno sepa el 80 % de las respuestas, ¿cuál es la
probabilidad de que apruebe en las 12 primeras preguntas?
t32 Capítulo 4- Principales Distribuciones de Probabilidad
29 {Jna marca de refrescos tiene impresas, en cada una de las tapas, una de las fi.guras de los 4
jinetes del apocalipsis, y quien retina la colección completa ganar'á un premio. Si nn comprador'
cree qlre hay igual nútnero de figulas de cada uno de los pelsona,jes en la promoción, ¿cuántos
refrescos ha de esperal comprar para ganar el premio?
30. Un pájaro de cierta especie come gusanos de una población muy grande. Estos glrsanos pueden
comer) a su vez) de una planta venenosa) de manera que si el pájaro come un gusano envenenado,
deja de comer gusanos ese día. Suponiendo que el 33% de la población de gusanos come de ia
planta venenosa) hallar el número medio de gusanos comidos por un pájaro en un día.
31. Un lepidopterista solo está interesado en los ejemplares de una clase de mariposas, que consti-
tuyen el75To de todas las mariposas de la zona. Hallelaprobabilidad de que estapersonatenga
que cazar 8 mariposas de las que no le interesan antes de encontrar:
32. En una fábrica, el departamento de contlol de calidad, revisa los lotes de piezas que entran, de
acuerdo con el siguiente criterio: se van extrayendo piezas sucesivamente y el lote es rechazado
si se encuentra Ia primer pieza defectuosa antes de la vigésima extracción. Si conocemos que el
2% de piezas son defectuosas, ¿cuál es la probabilidad de que un lote sea rechazado?
t.f En una fábrica, se examinan las piezas que salen de una determinada máquina. Supongamos que
si en una hora salen mas de 5 piezas defectuosas, la máquina debe ser recalibrada. Si suponemos
qrre la probabilidad de que una pieza sea defectuosa es 0.2, y es la misma para todas las piezas
fabricadas ; encontrar:
a) ¿Cuál es ia probabilidad de que el terccr usuario sea el primero que cierra adecuadamente
el Windows?;
b) ¿Cuál es el número medio de personas que usan Ia computadora desde el momento en qlle
se enciende hasta que alguien no cierra el programa adecuadamente?
Ley de Poisson
35. Sea Y una variable aleatoria que sigue una distribución de Poisson de medía ),:2. Calcule:
4.6. Ejercicios 133
16. El prornedio cle ll¿rnaclas clue recibe urra ccntlal telcfórrica cn Lur rninuto es cle 1.5. Halle la
plolrabilidad de que en cuatro rninntos se rec:il;¿rn:
19. Una fábrica de gaseosas recibió 100 botellas vacías. La probabilidad de que al transportarlas
resulte una botella rota es 0.03. Halle la probabilidad de que Ia fábrica reciba rotas:
Se supone que el núrmero de bacterias por mm3 de agua en un estanque es una variable aleatoria
X con distribución de Poisson de parámetro ) : 0.5.
a) ¿Cuál es la probabilidad de que en 1mm3 de agua del estanque no haya ninguna bacteria?;
b) En 40 tubos de ensayo se toman muestras de agua del estanque (1mm3 de agua en cada
tubo) . ¿,Qué distribtición sigue la variable Y: <<número de tubos de ensayo, entre los 40,
qlre no contienen bacterias>>? Calcule Pr(I' > 20);
c) Si sabemos qlre en un tubo hay bacterias, ¿cuál es la probabilidad de que haya menos de
tles?
Urra planta ernbotelladora de refrescos tiene una máquina vieja para llenar botellas. La máquina
produce una ganancia de 100 dóiares por dÍa de traba.jo; sin embargo, se descompone en promedio
2 r'eces cacla 10 días. Si )' replesent¿r el núrrnero de descompostur-as clurante el funcionamiento
de la rnáquina y ú es el núrmero de días que traba.jó lzr máquina, la ganancia generada por Ia
máqr.rina se expresa por G : 100ú -50Y2. Dctermine Ia ganancia esperada en 10 días de trabajo.
<:) , CLtiirr grarrrlc <lel¡tt scl lttr¿l lrrtt<lstl¿r ale¿rtolia (c:orr lecrrrl,lrrzo) lr,rrir (iri,, i,r lrlrrlr;rlrili,l'1, I ,lr,
rlttc al ltren()s tur¡I l)oISorr¿r tcrrg¿l <l¿ll rtrrisrrro so¿r llrirl()r o igrral ¿t ().1.1i'
44 ]llt tttt lrosrltte rlc c;eclt'o t:l rrúru<:ro rk: ¿ir'l>olcs <;orr plirgrr pol lrcclár'c¿r )' tj(,rlr, rrrr;r <[istr ilrrr i,,rr
c-lr:Poissorr 2(10). Los ¿itl¡olcs c:ort 1.,lir¡1r'r. se tr¿rt¿rn con insccticicl¿t ¿r urL co:jt() (lo 3 rlcil¿rr(.: l)()r
át'l¡ol; ¿rrlcrnás. clr: urt costcl fijo. por rlso del r:quipo y tr'¿lir,jl)otte. igual ¿r 50 clril¿rr<ts. I{¿rllr,,'l
vaiol cspcr¿rclo y la dcsi'i¿tcióu estárLcl¡rr'<.lel cost,o total C de firrnigai'5 hect¿ilcirs rlc lrosrlrrr'.
45 Para cl control cle calidacl de discos para corrrplrtadora se errrl)le¿ un dispositivo clcctr'órrico <¡rrc
cltent¿r cl nirmelo de bytes defectuosos. Una marca de discos de computadora tierie rrrL plouLcr lio
<1e 0.1 bytes defectlLosos pol disco. Calculc el porcenta.je clc <liscos que:
46 EI núrmero de automóviles que llegan a un estacionamiento, que tiene una capacidad de 12 ¿rLrtos.
es una variable aleatoria que sigue r-rna Iey de Poisson, con Lln promedio de 4 pol hora. Si al
inicio del día el estacionamiento está r'acío,
47. Si hay en promedio, un 1 por ciento de zurdos, ¿cuál es la probabilidad de tener porlo menos 4
zrirclos entre 200 personas?
48. En una investigación de mercado se detelminó que el 2 por ciento de Ia pobiación torna regultrr-
rnente Llna marca de yogurt. Se escogió una muestra de 300 personas, determine Ia prolrabiii<ltrti
de que:
50 En estudios demográficos sobre matrimonios que tienen algúrn tipo de planificaciórr farniliar. c,i
número X de hijos por matrimonio es igual a 2, salvo ciertas clesviaciones debidas al azar. St'
ha comprobado que, o bien
X:2-(Y+1),
donde Y es nna variable de Bernoulli de parám etro p - 0.3, y ésto ocurre con probalriiiclact 'p ::
(pues se cr.rmple en el 50% cie ios matlimonios), o bien es
X:2* Z,
dorrde Z sig:ue una distribuciórt de Poisson de parámetro ,\; v esto seguudo ocul'r'e <:ou tarnbi(ll-
con probabilidact p::. Halle:
2
rl,
I b-" si z e 1".ü]
f(r): 4 =-1.
I o, sirf [o.ü]
E(x) a* b
2'
Var(X)
(b - ")'
t2
Esta ley es ei análogo continuo de la distribución uniforme discreta, que asigna igual probabilidad a
-¿da resultado de un experimento. Tiene amplia aplicación en problemas de simulación estadística
-,-en fenómenos que presentan regularidad en su aparecimiento, pero qne no es posible usar variabies
-iscretas, como cuando dependen dei tiempo. También, el error originado por el redondeo de un
---imero se describe satisfactoriamente mediante una ley unifbrme en el interv.t" [-:,:l
L 2 2l
Ejemplos
I
,f (r) : I t.sir€¡-2,31;
I 0, sir(l-2,3).
r pr(X - r) : f ,rrd.r:0. porque X es una variable aleatoria continua.
.[,'
o Pr(x < 1.g) : l'" f (r)d.r: dr :0.66.
-m .t L,'!,
o Pr(lxl < 1.5) : Pr(-1.5 < X < 1.5) : ['
rtr[(r)dt
: l'
r'rtr^,
:l : 0.6.
b) Calculemos Pr(X > ú):
/'oo ' ,'3 /m
Pr(X >L)
' I
.lt tf"ld.*:l)ar+l
,lt s .ls
o¿*
lrl3
t-l
3 -t
Lblr.
bntonces.
3-¿ :",corr 1
lo crr l r:
4
b 3.
2. Dos amigos, Roberto v Fernando, deben encontrarse en una parada de bus entre las 9:00 r
10:00 h. Cada uno esperará r-rn máximo de 10 minutos. ¿Cuál es la probabilidad cie que rro se
encuentren, si Fernando llegará a las 9:30 en punto?
Soluci.ón: La variable aleatoria X que describe el tiempo de llegada de Roberto puede tomar
cualqniervalorentrelas9:00y 10:00hoentre0y60minutos. DemaneraqueX -Ula,b] ysu
f'nción de densidad es
( :, si o ( ú < 6o;
/(f) :{ t'0
( 0. caso contrario.
Puesto que Fernando llegará a las 9:30 o a los 30 minutos después de las 9 y esperará a lo más
10 minutos, Roberto no se encontrará con Fernando si llega de g:00 a rnenos de 9:20 o si llega
después de las 9:40.
Entonces, la probabilidad de qne no se encrrentren es
C :200 + l2T2
4.8. Distribución exponencial r37
a) Ctrlculirr la probabilid¿rcl de qrre el tiempo de espela sea cle: clos <lías o rrtás.
b) Calcrrlar el costc¡ esperirclo cle r-rna falla.
Soht,ci,<i'n:
a) trl tiempo de entrega está uniforme distribnido cle trno a ciuco clías, de rnodo que
o":lyb:5:
si1(ú<5;
f(t):
caso contrario.
Así,
Pr(r > ,):
l, f (L)dt: .[r'Lor:1,r - 2):X
b) Por las propiedades de la esperanza, E(C) : 200* I2F,(f\. Calculemos E("2) : Var(?)*
(E("))2:
E(r'): ry.(+)'
(5-1)2-/r+s\':I
: r2-r\, :T
)
Así,
E(c) : 2oo + t, (+) : 2oo + t24: r24.
EI costo esperado de una falla es de 324 dólares.
F(r): sir(0
{ ?'- -\r, si r ) 0
"
E(x) : +,
¡
Var(x) : I.\l'
Esta ley sLlrge en problemas de genética, duración de aparatos electrónicos o desintegración lacliactiva
También, es Ia principal en la teoría de los procesos ie Markov.
Sea X la variable que cuenta el número de eventos que ocurren en el tiempo [0,ú] , con media )ú:
entonces,
Sea ? eI tiempo que transcurre hasta que sucede el primer evento de Poisson. El rango de 7 es el
intervalo [0, -[ y su función de distribución es
donde el evento Q > t) indica que el primer evento de Poisson ocurre después de ú, o lo que es io
mismo, que no ocurre ningún evento en el intervalo [0,ú];es decir, (T > t): (X:0).
1. Una variable aleatoria continua Y está distribuida según una Iey exponencial t(3).
.55
b) Se tiene que
E(v)
11
) 3'
"(Y)
: \Ñ;(n:
D ist r ibución exp onenc ial 139
El tiernpo dut'ante el cual las baterías para teléfono cehrlar trabajan en folma efectir,a hasta que
f¿rllan se distribuye sr:gúur un modelo expouencial, cr)n Lrn tiempo promcdio de falla cle 500 holas.
a) Calcular la probabilidad de que una bater'ía funcione por rnás de 600 horas;
b) Si una batería ha trabajado 350 horas, ¿cuál es la probabilidad de que trabaje más de 300
horas adicionaies?
Solución: Consideremos la variable aleatoria X: <<tiempo que dura Ia batería hasta que falla>>.
E(X) :500: ): X
# r -E(#). Sufuncióndedistribuciónes:
Como
], ".'to'ces
( o, sir<o;
F(r): siu )0,
{,_ "_rlsoo,
a) Calculemos Pr(X > 600):
.fr(t):4"-nt, ¿>0.
a) La probabilidad de que eI primer cliente llegue en los primeros 30 segundos es
,.0.5
Pr(?<0.5)' : | +"-n'¿ú:0.86b.
.lo
La ley de probabilidad de una variable aleatoria continua X se llama nortnal si s:.:t función de densiclad
donde É¿ es un valor real cualquiera yd es positivo. A tal variable aleatoria se notará como X
.M(p,o').
La función de distribución correspondiente es la integral
F(r): ¿t.
t/2"" "-(t-ü2lzo2
Por esto, se dice que es una ley normal de media ¡t y varianza o2. Obviamente o es la desviaciól
estándar de X.
Observemos que la función de densidad de una variable aleatoria X - Jtí(p,o2) es simétrica respect,
a Ia recta r: IL.
Esta ley tiene amplia aplicación en física, economía, ingeniería y biología, pues como una primer,
aproximación- se asume que los fenómenos siguen una ley normal. También, juega un papel mr-l-.'
importante en toda Ia teoría estadística ya que, bajo amplias suposiciones, el comportamiento de l-
sumas de magnitudes aleatorias es aproximadamente normal, lo que constituye el Teorema del LÍmir-
Central.
El nombre de normal fue aplicado a esta ley de distribución por F. Galton en 1889, no sin reparos p-l
otros científicos, porque este nombre puede hacer pensar a las personas que las otras distribuciont:
son) en uno Ll otro sentido, anormales. En el plano anecdótico, remitámonos a lo que se dice en =-
libro de Mosteiler, Rourke y Thornas (1970, p. 226) respecto al nombre de esta ley: <Algunas vecr:
la distribución normal es llamada gaussiana, especialmente en la ingeniería y la física. En Francia =-.
llamada laplaciana. Estos nombres son usados, probablemente, porque la distlibución fue inventac"
por de Moivre.>>
Un caso importante de esta ley de probabilidad se tiene cuando F:0 y o2 :1, que se denomi-:
4.9. Distribución norrnal t4t
,t¡ttnol. cstti,¡tdot'(^/(0. 1)), sus funcic¡ues cle clcusid¿rci y distlibucicilr sorr
L
7\:'/
^t-.\
,ryi.
n-"'¡2. ., € (-co. rc)
.1. <
o(,) : t'/2
cu,
h [__"
:espcctir,aruente. Obsérvese qlre) en este caso particular, la función de densidad se nota mediante cp y
-a ftrnción clc clistribución por ó.
Si se ticnc urra variable aleatoria X - N(p,,o2), pr-redeu calcularse los valores de su función de dis-
:ril¡ución lncdiante el empleo de la ley normal estándar aplicando la trausfolmación
F(r\ :o l" - P\ .
\o /
distribución de la ley normal estándar no se puede dar como una función explícita, sino
li-a función de
=tlamente en forma de una integral, por lo que se emplean tablas, como la que se encuentra en la
Tabla 1 del Apéndice, para calcular los valores de O(z).
Si X - Jt[(p,o'), se puede dar la siguiente regla empírica que da el área bajo Ia curva limitada por
-na, dos y tres veces la desviación estándar (ver Figura 4.4).
Ejemplos
l. La esperanza cle una variable aleatoria X normal es igual a 6 y su varianza es 16. Escribir la
ley cle la variable aleatoria y calcular:
a) Pr(X < 3); b) Pr(X > a); c) Pr(4.5 . * .r)t
d) Encontrar el valor de ú de manera que se cumpla que Pr(X { ú) : 0.9264.
SoLu,c'ión: La espelanza es E(X) - lL:6 y la valianza .s 02 :16, por lo que o:4; etttottccs,
r@) :
#r""p ( g#) : #".' (-q#)
L42 Capitulo 4. Principales Distribuciones de Probabilidad
Por otro lado, en la tabla de Ia ley normal, se encuentra que (D(1.45) :0.926q; es decir, se
cumple que
t : t'nu'
Entonces, t: 1.45 x 4 * 6: 11.8. ^u
2. El perÍmetro craneal de los hombres, en una ciudad, es una variable aleatoria de media 60 cm ¡'
desviación estándar 2 cm.
Por otro lado, eu la tabla de la ley norm¿,rl est¿inclar se observa que Q(0.97) : 0.834.
Entonces,
r-60 : 0.97.
De donde, z:61.94cm.
c) Ahora, hallemos z tal que Pr(X < z) :0.352.
z-60 :
-0.38.
En una fábrica de autos un ingeniero está diseñando autobuses pequeños. Sabe que la esta[ura
de la población está normalmente distribuida con media 1.70 m y varianza 02, con o :5cm.
¿Qué altura mínima deberán tener los autobuses para que no más del l% de las personas golpee
su cabeza con la parte superior del autobús?
Solución: Sea X la variable aleatoria <<estatura de las personas>, X - N(t.70, (0.05)2). De-
nominemos h ala altura mínima para que la probabilidad de que una persona golpee su cabeza
con el techo del autobús sea del LTo; es decir,
Pr(X>h) : 0.01
1-oln;=t:to)
0.05
: o.or.
\ /
oft¿-1'70\
-\ o.o5
: v'v! :o.ee.
r1-0.01
)
En una ciudad habitan 150 mil familias, cuyo ingreso anual sigue distribución normal con media
de 8000 dólares y desviación estándar de 1200 dólares.
EI 12.1% clc las faltrili¿rs tictrc ingresos anuales menores a 6600 clólares. Eso quir,.r'c clccir
que sorr 0.121 x 150 000 : 18150 farnilias.
b) Si buscarnos el riltino quintil de ingreso, qniere decir aquellas farrrilias r,¡re tienen el 207,
dc los inglesos nrás altos; o sea) tenem s que encontral rrn valor :¿: de nlancla que Pr(I >
r) :0'2'
>r) : 1-Pr(/ 1r):0.2,
Pr(I
I r) : F(r) : 1- 0.2 : 0.8,
Pr(/
o l" -,99!o) : 0.8.
\ 1200 )
En la tabla de la ley normal, \¡emos que se velifica que iD(0.84) : 0.8. Por tanto,
z - 8000
: 0'84'
1200
Al resolver esta ecr.tación, nos da r : 9008. Consecuentemente, el 20 % de las familias tiene
un ingreso superior a 9008 dólares anuales
Se tomaron <Ios exámencs sobre 100 puntos, crr el ¡.rrimero se obtur,'o ¡r1 :80, ot:4 y en e-
segundo p2 : 65, 02 : 5. Un cstrrdiante sacó 84 en el primer exalnen y 75 en el segrrnclo
Cornparativamcnte, ¿en cuál de los exárncnes obtu.r'o rnejor resultado?
Sol'u,ciórt: Deterrnincrllos, p¿tl'a cada examen, el porcentaje cle corn¡rarleros (lue s¿rc¿]r'on rnclroi
nota que é1, sabiendo qr.re
Una empresa ernbotella t'efrescos rnediante una máquina que envasa el líquiclo, con un nredia ¡r -.
desviación estándar de 10crn3. Calcular el valor de Ia media p¿rra que solo se lebase la cantida-
de 310cm3 en elSTo cle Ias lrotellas, si se supone que la canliclad de líquido ernl-¡otellaclo tierr.
distribuciórr nonn¿1.
Sol'ución: Sea X: <<la c¿ntidad de lÍquido embotellado>>, corr X - N(F,(10)2). Se brrsca el,r,¿rlc,:
de ¡r tal que
Pr(X > 310) :9.65.
Ahola bien,
clorrde Z - N(O,I). Por la tabla de la ley normal, Pr'(Z > 1.645) : 0.05, debiéndose cumplir
que
310-p:1.645.
10
AsÍ,
¡¿ : 310 - 10(1.645) : 293.55.
ElmarcadorqueindicaIacantidadmediadelíquidodebeestarposicionadoen293.5cm3.<
En el Cuadro 4.7 se encuentra un resumen de las leyes de probabilidad analizadas en este capítulo.
Uniforme discreta, r¿
'lt(N,n,r) -r
Hipergeométrica
# #(t-#) N-1
Bernoulli Ber(p)
Binomial Bin(n,p) np
Geométrica
r-p
9(p)
p2
l/(a,b) (b - o)'
Uniforme continua
+ L2
I I
Exponencial r(r) ;
^2
Normal N(t",o")
Normal estándar
^/(0,1)
Cuadro 4.1: Principales leyes de distribución de probabilidad
4.10. Ejercicios
Ley uniforme
4. Los ¿utobrrses de cierta líne¿r salcrr c:on holario estricto cada cinco minutos. I{alle la plolrabilicliLrl
ckr cluc 1ul l)asa.jero c1r-rc llcga n lzr pzrraclzr tenga que esperar el ¿rutobris nlclros cle tlcs rrtintrtos.
r
L,. Al cstrrcli¿u' las ofertas de contlatos cle ern'ío, un fablicante de coml>ut¿doras ve que los cxlrtr'¿rtr.,-
clc los intelesados tienen ofertas que se distribuyen ltniformemente entre 20 nril y 25 nlil dólarcs
Calcule lil plobabiliclad de que el siguiente contrato sea:
6. Sqróngase que Ia velocidad de los autos en un sector de una carretera sigue urta ley uniforntt
entre 60 y 120 kmlh. ¿Cuál es la probabilidad de que un auto:
12. Se prueban dos elementos que trabajan independienternente. El tiempo de trabajo del primer
elemento tiene distribución á(0.02) y el segundo elemento t(0.05). Halle la probabilidad de que
en el tiempo de duración t :6 horas:
13. La duración (en minutos) de las llamadas telefónicas de larga distancia desde Quito es una
variable aleatoria con densidad
14. La duración (en años) de la vida de los individuos de una población humana se puede modelar
mediante una'r,ariable aleatoria con función de densidad
si ú > o;
f (t) :{ {oe-.t/ao,
0, siú10.
a) Determine la vida media de la población;
b) ¿Cuál es la probabilidad de que un individuo no llegue alos 42 años?;
c) ¿Cuál es la probabilidad de que una persona que tiene más de 50 años, supere los 65?
-o Suponga que la duración, en minutos, de una conversación telefónica sigue una ley exponencial
eOlS). Encuentre la probabilidad de que Ia duración de una conversación telefónica:
6 Se prueban tres elementos que trabajan independientemente entre sí. La duración del tiempo
de trabajo sin fallo está distribuida según una ley exponencial: para el primer elemento h(t) :
0.1e-0'1¿, para el segundo elemento fz(t) :9.2"-o'2t, para el tercer elemento /s(¿) : g.3"-0'3t.
Halle la probabilidad de que en el intervalo de tiempo (0,10) horas, fallen:
La escala Richter para medir la magnitud de los terremotos sigue una ley exponencial de media
2.4. Calcule la probabilidad de que un sismo sea:
-5. El tiempo de duración, en meses. de un tipo de resistencia eléctrica se expresa mediante una
variable aleatoria X que sigue una ley exponencial á(0.5).
a) ¿Cuál es la probabilidad de que una de tales resistencias eléctricas dure más de 4 meses?
b) Si se prueban 10 resistencias eléctricas, ¿cuál es la probabilidad de que ninguna dure más
de 4 meses?
c) ¿Cuántas resistencias se probarían para que con probabilidad igual a 0.9 se tenga al menos
una resistencia que dure m¿is de 4 meses?
148 Capítulo 4. Principales Distribuciones de Probabilidad
cl) Si el costo de producción cle una resistencia es C : 2 + (30 - X)' , ¿cuál es el costo espelaclo
de una resistencia?
19 El tiernpo 7 que se demora para completar una reparación eléctrica es una variable aleatoria
distribuida exponencialmente, con media 10 horas. El costo C de llevar a cabo este trabajo se
relaciona con el tiempo empleado mediante la fórmula
20. La duración de los neumáticos de una marca determinada siguen una ley exponencial cuyo
promedio es 30 (en miles de kilómetros). Calcule la probabilidad de que un neumático dure:
Ley normal
21. Se tiene una variable aleatoria Y con media 5 y varianza 16.
23. cigarrillos es, para los fumadores, de 5 dólares diarios por término medio.
Se sabe que el gasto en
y que la desviación estándar es de 0.8 dólares. Suponiendo que el gasto sigue una distribución
normal, ¿qué proporción de los fumadores gastan entre 4 y 6.2 dólares diarios?
24. Se experimenta con un medicamento que produce variación en el peso de las personas que lo
toman. Pruebas de laboratorio han demostrado que al cabo de un mes la rrariación del peso
sigue una distribución gaussiana de media 2 kg y desviación estándar 1.25 kg. Determine la
probabilidad de que una persona:
25. La compañía aérea Helios sabe que el tiempo de retraso de sus vuelos sigue una ley normal, con
un retraso medio de 10 minutos y desviación estándar 5 minutos. Calcule la probabilidad de
que:
26 La Cruz Roja ha determinado que tiempo necesario para que una de sus ambulancias llegue al
sitio donde hay una emergencia se distribuye según una variable normal de media 17 minutos y
desviación estándar 3 minutos.
4.70. Ejercicios t49
Los r:r'r'olcs rlc clc pcso cle Ltna balanz¿l obeclccelr a una ley normal con desviaciórt
l¿r nrcclir:i<irr
y
cst ¿incl¿rr' 20 nrg csl)cr ¿irrza 0 rng. Hzrlle Ia probabiiidad cle clue cle tres niediciones iridcpendientcs,
el clrol tlc por lo rncnos una cle ellas no sea mayor) en valor absoluto, que 4 mg.
Se aplicó rrrrzr plueba clc fluiclez ver-bal a 500 alumnos de Educación Básica. Se supone que las
¡rtrrrtnaciones obtcnidas se clistlibr.ryen segúrn Lrna rrornlal de media 80 y desviación estándar 12.
a) ¿Qué puntuación separ¿r cl25% de los alumnos con menos fluidez verbal?;
b) ¿.A partir de qué puntuación se enclrentr a el 45 % de los alumnos con mayor fluidez verbal?;
c) ¿Cuántos alumrros tienen una fluidez menor que 76 puntos?
l9 El per'ímetro craneal de los hombres, en medido en cm, es una variable aleatoria normal ¡/(60, 4) .
a) ¿Qué perímetro craneal debe tener un hombre para que el 16.6% de sus paisanos <<tengan
más cabeza que él>>?
rl. Se llama cociente intelectual(C.I.) al cociente entre la edad mental y la edad real. Se sabe que
Ia ley de distribución del C.I. es normal con media 0.95 y desviación estándar 0.22. En nna
población con 2600 personas se desea saber:
a) ¿.Cuántas tendrán un C.I. superior a 1.3'/; c) ¿Cuáltas tendrán un C.I. entre 0.8 y 1.15?
b) ¿.Crrántas tendrán un C.L inferior a0.77?;
l1
JI Se va ¿ construir nn n)arco para montar una puerta. ¿Qué altura mínima ha de tener el rrrarco
para que el 7%o de Ia población tenga riesgo de chocar su cabeza al atravezarla, si la estatura de
la lroblación estadistribuiclanormalmente, con media F:1.72m y varianzao2, con o:12cm?
i2 La cstattrra de la población masculina está normalmente distribuida con F : L67 cm yo : 3 cm.
(i) mayor que 167 cm?; (ii) mayor que 170 cm?; (iii) entre 161 y 173 cm?
El peso de las fundas de papas fritas producidas por una fábrica sigue una distribución rrolmal
con media 12.8 onzas y desviación estándar 0.6 onzas.
34. La <:st¿rtr-rr'¿t ct: lzr pobla,ción rnascrrlina y femcnina siguen leyes de distlibución nclrrnal. La
rtascrtliu¿t tirtnc ¡t,1 - I.67 trl y 01 : 12crn v ]a fcnlr:nina" p2:1.55 In y 612 :10c1r. Se tic¡e
urra 1rarcjir ert l¿t c:ual cl varólr rnicle 1.70tn y Ia rtru.ler 1.60rn. Cornparil,tir/amente) ¿.cuál cle los
dos es rnás ¿rlto Li:spccto a los miembros cle su sexo?
OE
Ji, Los conductoles quc se fabric¿rn para utilizar en las computadoras deben tenel resistencias clue
varían entre 0.12 y 0.74 ohm. Las medidas de las resistcncias que produce Lrna compañía siguen
una ley de distribución normal de media 0.13 ohm y desviación estándar 0.005 ohm.
36. Los tiempos de Ia primera avería de una máquina de cierta marca tienen distribución gaussiana
con un promedio de 1500 horas de uso y desviación estándar de 200 horas.
37. El promedio de las calificaciones de los estudiantes universitarios se distribuye normalmente co-
media 5.4 y desviación estándar igual a 0.5 puntos.
38. En el grupo étnico A, la estatura de las personas (en cm) sigue una distribución,Af(t6S;25): .,-
el grupo étnico B sigue una,A/(170;25) y en el grupo C una N(175;25). Los tres grupos étnio-¡
son muy numerosos.
a) Si elegimos una persona del grupo A, ¿cuál es la probabilidad de que mida más de 160 cn
b) Si elegimos 10 personas al azar del grupo étnico A, independientemente unas de otras, ¿ct-
es la probabilidad de que 5 de ellas midan más de 160 cm?;
c) En una ciudad, el 50 To de Ia población pertenece a la etnia A, el 20 % pertenece a la E '
el30% r'estante a la C. Si elegimos una persona al azar en esta ciudad y mide m¿ís de ---
cm, ¿cuál es la probabilidad de que pertenezca al grupo étnico C?;
d) Si elegimos 10 pelsonas al azar del grupo B, independientemente unas de otras, icuál a -"
probabilidad de que al menos 5 midan más de 172 cm?
39. Una máquina para llenar cajas de cereal tiene una desviación estándar de 25 gramos sobrt *r
peso de llenado de lascajas. ¿Qué medida debe indicar el marcador de llenado de las cajas p--.
que permita que ha5,a cajas de 450 gramos o más durante elI% del tiempo? Se supone qu€ iiüu
cantidad de cereal por caja sigue una ley normal.
40. La anclrura, en mm, de una población de coleópteros sigue una distribrción N(p,;o2). Se esti
que el 77% de la población mide menos de 12 mm y que el 84% mide más de 7 mm. Halle
parámetros de Ia ley.
4.77. EI teoretna del Límite Central 151
Teorema (del Límite Central) Sean Xt, X2, .. ., X,,, n r'¿rriables aleatorias independientes,
,listribuidas con media ¡t y varianzd 02, y que signen una ley de probabilidad cualquiera -no nece-
sariamente la misma-. Se forma Ia variable suma
Y:Xt]-Xz-+..-tX,,,
que tiene esperauza E(Y) varianza Var(Y) : no2. Entonces, la distribución de la variable
aleatoria
Y -E(Y) Y -np
Jv*@ o{n
riende hacia una ley de distribución normal estándar, cuando n tiende al infinito.
ii teorema implica que si n es grande, se puede aproximar las probabilidades de Y utilizando que
-
= formulación de este teorema es, en su forma más elemental, debida a P. S. Laplace y fue demostrado
:--a-rlrosamente, en primer lugar, por Liapunov en 1901.
Ejemplos
-. Sean X1, Xz, ..., X1o, cincuenta variables aleatorias independientes que siguen la ley
r 0 1 2
Pr(X : r) rl8 3i8 t/2
E(X¿):
+, Var(X,) : #
Entonces, si Y : Xt * Xz*.'. *X¡0,
E(v) : 50x+:T,
Var(Y) :
31 775
bux6a:E'
I irl l'tittt i¡t:ri,'.s fij.,l til¡ttt it;¡¡cs rlc l'¡t,!¡.¡ltilitl;t'l
I'ri) i{) i
l-,1'
l-l t'osto rli¿tti,r rlc o¡rcliu llll iullr¡l¡tis lir,tl,) rurt'rrsto li.irr r[t: ]J0,l,rlalcs v rrn \alol \'¿ui¿rl]le rlcl 30:.-
rlr: los ittgl'r's<ls. EI itrglt'so lier<'r t¡tr¿r,lisl Iilrrrr i,ilr unilr,r nrc t'r¡1r'r:5r0 l'250 dólales. a) Cirlt:rr1;r:
la ¡rr,rltr,lrili,la,l rle (luc ('l ('()sto ([r: <l¡ret.;rL rur :rr¡t()l)ris. rlruarrtr,S[ <lias. sllpele los 2500 clólares
lr) ;.C'rrÍrrtos rlÍ¿s rle o¡rt'ta<:irirr s<:r'átr no('('s;uios ¡r;tt;r (,lll(\ (()lr llrrir l)tol)¿l)ilidad cle 0.95. cl c()st,-
,li,,rlrct';u:ir'll sea .lo it,l Irrclr()s 2.li() d<'¡larcs.'
-\ : ltr¡;rt'so rli;rtir r ¡rol r )l)('t;r( irlrr .lt:l ¿rutol)rij: .\' - ¿/i;(). 2;01 .
('' f'..1,r ¡!i;rl i,,,lt',,)t 't ;t,'iritr,lr,l ;rr¡l,rlr¡is: C..' : .i0 : 0.:1.\.
Sr: t it'trt' r¡ttc
l-tti,,!tt,'..
ii
;t) Slrr l' : I l',. r'l r'rtsl,r r[t,olrt'l:tci,ilr trr,.tisrr¿rl ilcl it¡tol)tis. l:,rttctrrccs,
r=l
lr) Sctr U cl costo dt: o¡rt'r';t<'irirr eu rr rlí¿s: r:¡rtorr('es. l¿l vali¿rlrk: ¿rleatotia
z:ry_^/(o,t).
t/300{u,
.5r: rL,l,r'rlllr,r r¡rirr¡r,r'eI r,;rlot rlc lr. tal (llrc [)l(¿.i > 2350) :0.95:
|,t({'>.]:l..-l(l)=i,,(z'ffi):'_*(,l¡ooá#'',):o.n'.
I'¡l'I;tttlrl.
3i(l - i ¿l
yf.rt)t¡ttT = -1'645'
i, '¡r. rlsrrltil rlil(, ,r : .f:l ;:j. Ls rktcir'. sr: lrcfirsiti\Il 34 clÍ¿rs.
4.77. El teoretna del Lírnite Central 153
a) Se necesitan más de 36 componentes durante 210 días, si la vida útil es menor a 5040 horas
(210 días por 24 horas). De manera que
too) :
Pr(Y36 < bo4o) = r Itot,==tuj
\ 100y'36
a Q'4)
: 0.9918.
Luego,
4600 - 100n
: -2.33
Lasolucióndelaecuaciórresn:64.5;esdecir,65componerrtes.<
,:j*, i=l
a.üe una distribución Bin(n,p), con media np y varianza npq) corr Q : I - p. Por el Teorema del
- -:cite
Central, la variable
Z_ Y-np
J"w
ii:re apl'oximadamente una ley normal estándar, cuando n es suficientemente grande; es decir,
En la siguiente tabla se presenta una relación entre los parámetros n y p para que la aproximación
normal a la ley binomial sea válidaa.
p n requerido p n requerido
0+ 22t 0.25 74
0.01 214 0.30 51
0.05 188 0.35 32
0.10 757 0.40 16
0.15 728 0.45 13
0.20 100 0.50 13
pq
Otro criterio para escoger n es que el intervalo (o ,Pl2 T)
\ -
Z se encuentre completamentÉ
n
dentro del intervalo (0, 1).
Ejemplo. La Superitendencia de Bancos cree que el 32% de los créditos al sector agrícola están e-
mora. En un estudio se tomo una muestrade2T0 créditos a la agricultura. a) Hallar la probabilida-
de que más de 80 de ellos estén en mora; b) ¿Cuál es la probabilidad de que exactamente 95 cliente.
estén en mora?
270
pr(X > 80) : pr(x > 81) :
I
/r:81
clro(0.32¡k10.68¡270-k,
cuyo cálculo puede ser muy complicado. Aplicando la aproximación de la ley normal a la l.n
binomial, se tiene
Luego,
1.L2. Ejercicios
1. En una caja se empacan 100 latas de conservas. Según los datos de la fábrica, cada lata tiene
un peso promedio de 1 oz con desviación estándar de 0.1 oz. ¿Cuál es la probabilidad de que
una caja pese más de I02 oz?
Un borracho camina de forma aleatoria de la siguiente forma: cada minuto da un paso hacia
adelante o hacia atrás con igual probabilidad y con independencia de los pasos anteriores. Cada
paso es de 50 cm. Calcule la probabilidad de que en una hora avance m¡ís de 5 metros.
.). Los clientes de cierto banco efectúan depósitos con media 157.92 dólares y desviación estándar
30.20 dólares. Aparte de ésto no se sabe nada más acerca de Ia distribución de estos depósitos.
Como parte de un estudio, se eligieron aI azar e independientemente 75 depósitos. ¿Cuál es la
probabilidad de que la suma de estos 75 depósitos sea 12 750 dólares o mayor?
Los vehÍculos que cruzan un puente tienen pesos cuya media es de 4675 kg y cuya desviación
estándar es de 345 kg. Si hay 40 vehículos sobre el puente en un instante dado, halla.r el número
o tal que la probabilidad (aproximada) de que su peso total no supere a o sea del 99 %.
La empresa Rapid Express envía paquetes de distintos pesos, con una media de 1.5 kg y una
Á desviación estándar de 1.0 kg. Teniendo en cuenta que los paquetes provienen de una gran
cantidad de clientes diferentes, es razonable modelizar sus pesos como variables aleatorias inde-
pendientes. Calcule la probabilidad de que el peso total de 100 paquetes exceda de 170 kg.
6. El propietario de una copiadora ha determinado que el número diario de copias que se realizan
en su local tiene una media de 1250 con una desviación estándar de 350. Halle Ia probabilidad
de que en un mes de trabajo (25 dfas) el total de copias:
b) ¿Cuáltos hilos se rrecesital pala qr-re el cable sosterrga 300 kg corr urr gg% cle seguricl¿rci/
9. Utr jugador de baloncesto encesta urr lanz¿rrniento de 3 puntos con plobal,'ilidacl 0.3.
10 En promedio, de las personas que ingresan a una librerÍa solo el 25o/o realiza una compla. Si
en un dÍa entraron 80 clientes, calcule Ia probabilidad aproximada de que se hagan al menos 28
cornpras.
11. Se ha encontrado que el 70% de las personas que entran en un centro comercial lealizan cuando
menos una compra. Para una muestra de 50 personas,
a) ¿cuál es Ia probabilidad de que cuando menos 40 de ellas realicen una ó más compras?;
b) ¿cuál es la probabilidad de que menos de 30 de entre 50 personas muestreadas realicen
cuando menos una compra?
13. Se conoce, por estudios previos, que Ia proporción de vacas que enfer-marán después de su-
ministrarles la vacuna contra la fiebre aftosa es del 2To. Una granja tiene 600 vacas qtre sor
vacunadas. Determine:
Distribuciones Multidimensionales de
Probab¡l¡dad
;-, muchos casos) un fenómeno aleatorio no depende de una sola variable, sino de dos o miíÉ; por
- =:rplo, algo tan simple como el tiempo que empleamos en trasladarnos desde la casa a la universidad
l':!e¡61s, entre otras cosas, de Ia velocidad media del carro y del número de veces que nos detengamos
: -: los semáforos en luz roja. Es decir, el resultado en la prueba descrita depende de, al menos, dos
--=:l ables aleatorias.
;- .o que sigue, trataremos con conjuntos de varias variables aleatorias que se manifiestan simultánea-
- --te en un fenómeno y determinaremos si ellas están o no relacionadas. Para simplificar la exposición,
-jzaremos eI caso bivariante ya que Ia generalización a más variables es inmediata.
fefinición (de variable aleatoria bidimensional) Sean X y Y dos variables aleatorias unidi-
-=:rsionales deflnidas sobre un mismo espacio muestral f,); entonces, la función
RxR
r_F
-+
LD r------ (X (r) ,y (r)),
-'--,de w es un evento elemental, es una variable aleatoria bidimensional.
Sea? : {(r,ü eFr2l Í@,y) > 0}; es decir, el conjunto de puntos con probabilictad positiva, es finito
o infinito numerable y se cumple que
I
(x,v)eT
f (r,a) : L.
Supongamos quezl, 12¡...y At,Uzr... son los valores posibles deX y Y, respectivamente, ysea
La probabilidad del evento (X,Y) € .E es igual a la suma de todos los p¿¡ para los cuales (r¿,y¡) € E:
Observación. Si los espacios muestrales son finitos, las series deben reemplazar,je por sumas finita-s
5.7. Variables aleatorias bidimensionales 159
,l'on rq,1161¿ cle r'¿rrial¡lcs ak:¿torias bicliurcnsiouales se ¡ruecle clal uu¿t defrrrición cle iuclependerrcitr e<1tti-
"¿rlerrtc ¿r l¿r autetiot'trlclttc cl¿rclir:
Ejemplos
Para que / sea una función de probabilidad, la suma de todos los términos que acabamos de
calcular deben dar 1; es decir,
X
Y I 2 3
1 r/36 2136 3136
2 2136 4136 6136
3 3136 6136 e136
s
T -1 0 1
La intersección de las filas y Ias columnas da la probabilidaA p¿¡ : Pr(S : i,T : j) (i : -I,
0,l; j - -1, t). u) Calcular Pr(S I 0.5, ? a 0.9); b) Hallar las leyes de las variables aleatorias
svT.
Solución:
Entonces,
F(0.b,0.3) : I tPr(^9:i,T:¡¡
j<0,3
¿<0.5
: Pr(S : -l,T - -1) + Pr(S :0,7 - -1)
: 115
8-12:i4'
b) Por la fórmula de la función de probabilidad marginal tenemos: f s(i) : ! Pr(S : 'i.,7 : j):
J
por lo que
B' 24 3'
/s(o) : Pr(,s: 0,7 :-1)+Pr(S:0,?: 1)
111 I
12' 6 4'
/s(t) : Pr(S : l,T :-1) +Pr(,$: I,T :I)
7r5
: %- E: 12'
De manera análoga, se obtiene la ley de ?:
8-12-24-t
fr!) : Pr(.9 : -1,7 :1) + Pr(S :0,7: 1) f Pr(^9 : 7,7 :1)
: 24-
5 *1*1:1
6- 8- t'
Entonces, las variables aleatorias S y T siguen las leyes:
-1 01 T l-r 1
A la variable aleatoria (X,Y) está asociada una función no negativa /, denominada fu,nción, de densida,:
conjunta, que cumple con Ias siguierrtes propiedades:
tI4
.l \&r Y
,
'tl J --
o2 F(r,y)
- or oa
db
Pr(a<X<b,c<Y< o): @,y)d,rdy: J ,o,fid,rd,y
Il"f I
Definición (de función de densidad marginal) Las funciones de densidad marginal de las
-.-ariables aleatorias X y Y están dadas, respectivamente, por las relaciones
/'oo f
fx@):l .l
l@,a)da v fv(a):l,l f@,a)tu.
-a -*
too¿oo
Fx(t):
I f@,y)dyd.r y Fy(t):
I If@,s)d,rd,y
"[
lon este tipo de variables aleatorias también se puede reformular la definición de independencia.
Ejemplos
1. Un círculo de radio o está inscrito dentro de un cuadrado cuyo lado tiene una longitud de 2a
(véase Ia Figura 5.1). Se supone que Ia probabilidad de que un daldo arrojado hacia el cuadrado
es idéntica para cualquier punto. a) Calcular la probabilidad de que el dardo impacte dentro
del círculo; b) Encontrar las leyes marginales de X y de Y.
L62 Capítulo 5. Distribuciones Multidirnensionales
Solución:
Determinar: a) las funciones de densidad marginal de cada una de las variables; b) la función de
distribución asociada.
Solución:
: (#) (")
Consecuentemente, la función de distribución queda como
f (t-¿Xt-v).
Fxv(x,y)={ ra ' sir)1, y2L;
I O, caso contrario.
5.2. Dístribución condicionada 163
: : at : u)
Pr(X rlY
' ,, -P'(I:^!'Y
Pr(Y:Y¡
.
. Para variables aleatorias continuas, la función de densidad condicionada de r, para un valor fijo
de la variable g, se calcula por
f @la) : f
,@)',) .
TY\A )
Como fv(a) :
l*_rr",a)
d,r : l_ f (al")f x@) dr; entonces,
I
f (alr)f x(")
f(,(rga) f@1
J
I f (al")f x@) dr
-'x
que puede interpretarse como el teorema de Bayes para funciones de densidad.
Ejemplos
Pr(Y: 2) 1 2'
5
164 Capítulo 5. Distübuciones Multidimensionales
, f 2, si0(r1).,0<y<r,rly<r;
r'\r \ ¿/: I .0,
"fxr'(r,ll) L casoconl,r'ario.
dr :2(I _ y).
La distribución condi
f@lao) , Para0(rlr-ao;
caso contrario.
Al igual que en el caso de las variables aleatorias unidimensionales, en las bidimensionales es posible
calcular la esperanza y la varianza, previa la realización de una transformación de variables.
Definición (de esperanza) Sean (X, Y) un vector aleatorio bidimensional y g(r,y) una función
real
g iPt2 --J R
@,a) g(r,a).
'-
1. Si (X,Y) es un vector aleatorio discreto, cuya función de probabilidad es /(z,g), entonces
2. Si (X,Y) es un vector aleatorio continuo, cuya función de densidad conjunta es /(r, A), en-
tonces
E(g(x,Y)) : r@,a)d,vd,r
l:l:s@,a)
Observemos que si XyY son independientes, se deduce que
als@)n( )l : E[g(x)]Eth(Y)1.
Para las variables aleatorias bidimensionales se tiene una medida estadística nueva, ia covarianza) que
permite evaluar la relación entre Ias variables aleatorias X y Y.
Definición (de covarianza) Sean X y Y dos variables aleatorias, Ia covarianza entre XyY se
calcula por
Cov(x, Y) : E[(x - E(x))(Y - E(Y))].
-\ contirmación, se deduce una expresión para la varianza de la suma de dos variables aleatorias
'.ralesquiera.
p(x,v¡ : Cov(X, Y)
-r. Si )' st: cxprcsa linc¿rlnrenbe err función de X, pol Y : a,X f ü, donde cr, y b son dos constantes,
crltorICCS lf(X )-)l : f .
166 Capítulo 5. Distribuciones Multidirnensionales
Observación. Se debc tener en cucnta c¡re si clos rraliables aleatolias sorr independientes, cntoncc.
son no correlacrionadas; pero la afirmación rccÍ¡rroca no es correcta; es decir', si dos variables ale¿toriar.
no están <rorrelacionadas, uo son obligatoriamente inclependientes.
Ejemplos
s l-r 0 1
-1 1
En consecuencia,
:
157t1
8 24 24'8 --I
4'
5.3. Esperanza y covarianza 1.67
Por Io tiurt,o,
Cov(.S,7)
p(s,ll) :
-+:
-?
-0.29.
(i#) .'
t/toz
I
/ Y), : 12, si0(r.-I,0<y<!,r*a<L;
txv\r,
t o, caso contrario.
Hallar la correlación entre X y Y.
Soluci,ón: Anteriormente determinamos que
lo' .[ot-'
Entonces,
: 111
Cov(X, Y) E(XY) - E(X)E (n : + - 3"3- 36
De manera que
Cov(^9, T)
P(S,T) : 1
2'
IJ¿rr:irtrrrLo :-.¿ ll Lt
: t' r/,r' - ,/ t - ll.2dz. crtcotttrarLtr¡s:
,/ t tt: -
I .'tt..2t:., / - .: /, , 7 ,,.,.tz.
l-./,,\-
) tt t I Ct/-,la:-, t :t -)O<r< \.
't ' - )tT' .l -^ rf-'l-
Y) : E(Xi') - :
Cor'(X. E(X)E(Y)
l:l:rurxv (r,y) rlr d'y - 0
=
h'[- o"-o'''(l: J';I _H 1
- ¡r- Ry)2 I Q(1-R2)) ar\ ¿y.
/
La integral interior es igual a Ry; por lo tanto,
Los corrceptos descritos, r'áliclos prrra variables aleatori¿rs biclirnensionales, se pneden generalizar r.
vcctorcs aleatorios de cnalc¡riel dimcnsiórl; por lo tanto, solo vamos a exponer las definicioles d.
m¿rner¿l r-esumida.
Si Xl , Xz, ..., X, son variables ¿rleatorias discretas, el vector aleatorio Z es discreto y su función ci¿
¡r'obabilidad es
.fz(r¡, "',r,'.) : Pr(Xt : t7¡.'.,X,, : r,,).
Si Xl. ... ,X, son r'¿rriablcs ¿rlc¿rlolias continttas, el vector aleatorio Z es cotttittuo y la probabilida.-
dcl cvento u(Xr, ...,X,,) e E C R">> se calcula por
-, eqtrivzrlentcntertte,
J'z@,,.. . ):t:¡t) : .frr(tr) . .' [x,,(L:,,.).
Sea g urra fitnción clefinicla de R" err R, la espcrtrnza nr¿rtemátic¿r cle tL(Xt,...,X,,), segrin l:r lc¡' ¡[s
Z. sc calcrrla por
:uando Z es continua.
Cot,(X,,., X,,r)
P(X,,X,n):
Var(X,.) Var(X,")
:.-
:-
*=
la
de eda como
Ejemplo. En una empresa operadora de tarjetas de crédito se registró las causas para la renovaciórr
de las tarjetas. Se estableció que 60 % es por pérdida, el25'/o por vencimiento y el 15 To por deterioro
Un dÍa se recibieron 28 solicitudes de renovación de tarjetas. Evaluar la probabilidad de que 15 sean
por pérdida, 7 por vencimiento y 6 por deterioro.
Solución: Sean:
5.6. Ejercicios
1. Si la función conjunta de probabilidad de X y Y está dada por
r*u
J lr,a) : -30=, para Í : 0, I,2,3; A :0,I,2.
Construya una tabla que muestre los valores de la función conjunta de probabilidad de las dos
variables aleatorias.
2. Las variables aleatorias ,9 y 7 tienen Ia función de probabilidad conjunta que se resume en la
siguiente tabla:
s
T 0 1 2
0 rlr2 Llg rl24
1 114 rl4 tl40
2 rl8 rl2o
3 r/20
Encuentre:
t72 Capítulo 5. Distribttciones Multidimensionales
X1
Xz 012
0 p p12 pl4
1 2p p pl2
2 4p 2pp
a) Halle el valor de p;
b) Halle las leyes marginales de X1 y de X2. ¿Son independientes?;
c) Sean Y : Xt x X2, calcule la esperanza de Y.
5. Las variables aleatorias X y Y son independientes ent¡e sí y sns funciones de probabilidad son
z 0 1 2 .l 4 J
_VÓ 0 t/z
Pr(X : Z) 03 0.2 0.1 0.15 0.25 Pr(Y :.i¡ 0.25 0.67 0.08
x
Y -3 4 10
2 0.15 0.13 0.27
4 0.10 0.30 0.05
a) Halle las leyes de distribución de X y de Y;
b) Calcule el coeficiente de correlación cntrc X r,' }, .
7. Dada la distlibución cle 1>robabilidacl clc uu¿r variable aleatoria bidimcnsional cliscreta
X
Y l0 20 30 40
0 0.05 0.1.2 0.08 0.04
1 0.09 0.30 0. r1 0.21
3. Sc r:ousicl<trzr 1a sigtLictrtc f\urcióri de plolrabili<1acl corrjrLrrta. rlc la,s r'¿rli¿rbles ¡rlc¿rtoti¡Ls XyY
1. , ,
./.\)'(¡'lt: I ', Qr -,¡1. .i .r'É {0 I 1.3}. // c {1.?.3}:
\ tt. (.;r¡O r.(rull.al.iu.
nt , f senrser\y1 si 0( r'1
rw'lJ):l rf2, 0<y<rf2;
o, si r(0, y<0.
a) Halle la probabilidad de que el punto aleatorio (X,Y) caiga en el rectángulo limitado pol
las rectas r -- 0,, :;, y : :
[,, tt
b) Deterrnine las fr-rncioues de densidad marginal de cada una de las variables aleatorias.
v
-,\
.l
Y L ) ,) 4 5
0 2150 r ls0
1 3/5n 7150 12150
') 5150 e l50 41 50 :t 150
3 3ltt) \ 150
c) Olrtcrrgir l¿ distribrrr:i<irL plol-ralrilÍstica cle 1>r'och-rctos. \:¿:l (ln(' rlr ticrur próstirrrr<ls.
T4 Uu soc:icikrgo irrvr:stigrr cl c:<lrrr¡rortirnrietrto <lcliuttrcrr<:i¿rl <[c los irrtcr rros <lc trrr pr.rral. L¿r r'¿rrial
X relltcscut¿r c-.1 ruirrrcro rle voccs rlue ha cst¿ulo clctcrri<lo v l¿r r'¿rriabkr )'- cl uliurclro rlc rlcll-
c[istitrtcls llor los (¡rc] ha siclcl s<lrrtcuci¿r.clr. Srrs r1¿rtos sc reslrrl)clr crr Ia sigrriorrte talrla:
.Y
.)
Y i 2 .) 4 5
1 15/100 e/100 41r00 1/100 1/i00
2 5/100 1 1/ 100 51700 21r00 1/100
3 21r00 41t00 7 1100 3/100 1/100
4 rlrc} 3/100 5/100 21r00
I
tJ 21r00 41r00 211.00
6 21r00 3/100 1/100
7 21r00 21t00
15. Sea X
una variable aleatoria que sigue una ley ul)ifolure sobre {1,2,...,n}. Sea Y la variab-.
aleatoria definida ¡ror Y : (X + l)2. Calcule la cor'¿rianza entre X y Y .
16 Sea X
una lariable aleatoria qne sigue una ley unifornre sobre {-1,0, 1}. Calcule el coeficiel,:.
de colrelación cntre Xtn y X'tL.
17, En nna urriversidad se toma, a los aspirantes, pmebas de ingleso en ciencias y en humanidades. S
X y Y sou, rcspectivamente, Ias ploporciones de rcspuestas correctas que un estudiante alcaui..
en las pruebas ¡r su función de densidad conjurta vie¡e dada por'
r 4r -l6u
,,^ ^.t
IV,A):- \ J
5
[ 0. caso corrtrario.
b) rrrás del 80% de respuestas correctas en ciencias r,. rnenos de 50% en hurnanidades?
18. La c'arrtidad en rniligramos de dos componentes con[enidos er] un producto es nrra valial.'--
aleat<¡ria hrir,ariantc. cuya fttnción de densidad viene dada pol Ia expresión
o<v < r;
r@,ú:
{ ;:r, ::j:":;:,;''
a) Errcucrrtre el valol cie la constante c;
lr) I{¿rlle Ia ley condicional /(zlys):
C:) C¡tlt:ule la ¡rrobabilidad de <¡ue la c¿ntidacl clcl primer componente sea menor que 0.3:
rrritigramos cuando la del segundo cs 0.8 nriligramos;
d) ;.S,ru irr,ül¡rendientes los dos <.:omponentes'?
5.6. Ejercicios L75
19. Si X cs l;r pr'oilorc:i<itt rlc pcrsonas que I'csl)ontlcrr ¿r ulra cnclrost¿r le¿rlizacla por correo y )'' t:s
la ¡rtopor< iritr <lcl l)0lsorras cllre resl)onclen a otla errr:rrest¿r rr:aliz¿<l¿ll)ol correo, y la ftLrrciirn r1<''
rlcnsirl¿rrl <:orr.jrurtit <lc X y )/ est¿i dada por
r| -*'-!,
2ri8t
.lb,v): I 5
para 0(r(1; 0<yl1;
[ 0, caso colrl r'¿trio.
Eucueutle:
20. La vida de uso (en horas) de cierta clase de circuitos integrados es una variable aleatoria con
función de densidad
I 20000
st z ) u;
l@): { G+ looF'
I O, caso contrario.
a) la densidad conjunta de X1, Xz y Xs, que representan la duración de cada uno de los
circuitos;
b) la probabilidad Pr(X1 < 100,X2 < 100,X3 > 200).
2r Sean .9 y T dos variables aleatorias cuya función de densidad conjunta está dada por
a) Encuentre el valor de k;
b) Obtenga las densidades marginales de ^9 y de ?;
c) Determine la función de distribución F(s, ú).
22. Una función de densidad conjunta está dada por
¿' t/
f(r,a,-,, I l6ryzt' si 0( r1I; 0<y<1; 0<z1I; 0l¿11;
- I 0, caso contrario.
- r - u)' <a< 4;
l.;}]
r(*,v):
{ i:t :'-: ;ffi?,I'
a) Halle el valor de k;
b) Obtenga l¿s densidades marginales de X y deY;
176 Capítulo 5. Distribuciones Multidimensionales
a) Halle el valol de c;
f
. ( !6rr+yr)y,
(r,a):1 5
sio( r1r; o1y< l;
|. 0. caso contrario.
26. Sea (X, Y) distribuido uniformemente sobre el sernicírculo del diagrama. Entonces, f (r,y):
si (r,y) está en cl semicírctilo.
a) c) ¿.Son independientes X v Y?
b) al de X;
28. Pala :
si z 0, y>0; conn),2,
+ YY
caso contlario.
5.6. Ejercicios L77
,)
h
a) l?,a) :3 a"",
at:-
0 ( r 1y 1 l?; b) "f(r,A): (r+r ta)4
r) 0; rr>0?
s I 1;
r@,a):
{3:r' :ff"h;,s
a) Encuentre el valor de k;
b) Calcule ias funciones de densidad marginal deXydeY;
c) Calcule las esperanzas de X y de Y;
d) Calcule Pr(X < 0.51Y : 0.6);
e) ¿,Son XyY independientes?
')t
'),) Sca (X, Y) una variablc aleatoria liidirnensional con función dc densidad conjunta
0<g<r<1.
Calcule:
a) el valor de la constante k;
b) Ias ftrnciones de densidad rnalgiual cle X y Y. ¿Son independientes?;
c) la corrarianza entre X y Y;
cl) la función clc clensicla<l <tc )''lX : 1;
2'
e) la csperanza de YIX ::.
'2
ji. Si (X, Y) está uniforrnemente distribuido en cl triángulo limitado por las rectas t :0, A :0 y
r + lJ :2, encuentre:
a) iafunción cie densida"d de (X,Y); c) lacovarianzaentre X yY.
b) las funciones de densicl¿rd clc X y de Y;
l;. La distribrrción coljnnta cle las r.ariables ale¿rtoli¿rs X :,Y es uniformc en el cnadrado con vértices
en (1, 0), (-1, 0), (0, 1) v (0, -1).
178 capítulo E. r)istribuciones Multidimensionales
tr) Escrilra
l¿,1 frrrrciórr clc clensicltcl conjrrnta cle X y y;
¿'Cuál es Ia probabilidad de que e rtre 9 plantas así obtenidas, 4 sea¡ cle semill¿r amarill¿ lisa. _
sean de semilla amarilla rugosa, 3 de semilla vercle lisa y ninguna
cle semilla vercle rugosa?
40' Las variallles aleatorias Xt, Xz y X3 siguen las siguientes leyes de probabilidad: X1 I
Xz - N(20, 1) y X¡ -.A/(30,4). le definen -
^f(10.
Zt: XtlX2- X3, Zz: XtlXzlXz, Zs: Xt_Xz- X¡.
Si X1 , Xz, Xs son independietrtes calcule la nlatriz cle covarianzas cle (21,22,2;).
4r' Las variabies aleatorias xt, X2, . ., Xr, yt, y2, - . ., y, son inclepenclientes. porrgamos
*
Capítulo 6
Distribuciones de Muestreo
L,c chinos, también efectuaron censos hace más de cuarenta siglos. Los griegos realizaron censos
;eriódicamente con fines tributarios, sociales y militares. La investigación histórica revela que se
:o-alizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia
SUerrera.
Fero fueron los romanos quienes mejor supieron emplear los recursos de la estadlstica. Cada cinco
úm realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anota¡
179
1ECI Caytítulo 6. Distribucior:¡es de M¡-¡esúreo
defnnciolres 1- rna.1 r'iurorrios) sin olviclar los iecurr:ntos petióclictos clcl g;lnarlo
n¿r<:itnicni<¡-s, I' de lirs
licluezils contcnic,l¿rs crr l¿rs tict r¿rs colc¡tisladas. li
lp
Durante los rnil años sigrrientcs a. la caída del impclio Rornaro sc rc¿iliz¿rron rruy po.i¿rs irn'estigaciones
I
est¿rdísticas. E1 primel intento de aplicar un razonamicrrtu propiirmentc cstadístico, en el seul,ido actua. tt
del tér'mino, a datos clernoglzificos es clebido ¿r John Granrrt, err 1662, quien sc plarrteó el problem:r de
l',
I
estirnar Ja pol-rlaciórr inglcsir de la época.
Durante el siglo XVIII y 1a mayor parte del siglo XIX, Ia Estadística evolucionó como ciencia separada
del Cálculo de Probabilidades. Una contribución importante al desarrollo de la Estadística es debid¿
a A. Quetelet (1846), quien sostuvo la importancia del cálculo de probabilidades para el estudio de
datos humanos. Quetelet demostró que la estatura de los reclutas de un regimiento seguía una le¡'
probabilística, e introdujo el concepto de <<hombre medio>>.
A finales del siglo XIX, Sir Francis Galton ideó el métoclo conocido por correlación, que tenía por
objeto medir ia influencia relativa de los factores. Sus irrvestigaciones se dirigieron a aplicar métodos
cuantitativos en el estudio de la herencia humana. La importancia de Galton radicó no solamente en
el nuevo enfoquc que introdujo en los problemas de estadística, sino también en su influencia direct¿-
sobre W. Weldon, K. Pearson y Edgcworth, entre otros. Además, fundó el primer departamento de
Estadística. E
'de
Pero, talvez qu.ien rnás ha influido en ei desarrollo de la Estadística moderna es R. A. Fisher (1890 - po
-En
1962). Fisher se interesó plimero por la eugenesia, Io que le condujo, siguiendo ios pasos de Galton, :.
la investigación estadística. Sus trabajos culminaron con la publicación del libro,9ú¿listi,cal Method:
Por
t'or Research Workers. En esta obra aparece el cuerpo mctodológico básico de la Estadística actual. Iup
A partir de 1950 se puede considclar que comienza ia época moderna de la Estadística. tln aspect,-
Ger
clifercncial respecto a ios periodos ¿rnterioles es La aparición cle las computadolas) que revolucionalor,
par¿
1a metodología estadÍstica y abren enormes posibilidades para 1a construcción de modelos complejos
En la actualidad, ia trstadÍstica es una discipiina que actira como pncnte entre los modelos matemático- Den
y los fenómenos reales. IJn modelo es una abstracción sirrrpliflcada de una realidad más compleja - nás
siempre existirá discrepancia entre lo observado y 1o previsto por el modelo. La Estadística proporcioni- por
una metodología para ev¿rluar y jr.rzgar estas discrepancias entre la realidad y la teoría.
Los
Defi.nición (de población) Una población (o universo) es una colección completa de pelsonas.
anirnalcs, plantas o cosas de las crrales se desea recolectar datos. Es el glr-rpo cutero al que querernos
dr:scribir o del que deseanros sacar conciusiones.
La población debe tener características medibles o cántables, cle rraturaleza cuarrtitativa o cualitatir'
A la r:aracterística nredible sc denomina uar-iabl,e estadística t¡ a los r-¿rloles ciue tom¿r se los llal
ol¡ s cr-ur¡,cior¿cs.
6.2. Definiciones básicas 181
. La media, /_¿;
r El total, r;
. La varianza, o21
. La desviación estándar, o;
. La proporción, 7T o p.
Definición (de estadístico) Un estadístico es una cantidad que se calcula a partir de una muestra
dedatos. Se los emplea para dar información sobre los valores desconocidos correspondientes a la
población.
Por ejemplo, el promedio de Ios datos de una muestra, se usa para dar información sobre Ia media de
-a población, de la cual se extrajo Ia muestra.
leneralmente, a los estadísticos se les asigna letras latinas (por ejemplo, m y s); en cambio, a ios
:arámetros poblacionales se les asigna letras griegas (por ejemplo, ¡,t,y o).
Jentro de una población, un parámetro es un valor fijo que no varÍa; mientras que es posible extraer
-'ás de una muestra de la misma población y eI valor de un estadístico variará de muestra a muestra.
lr ello, un estadístico es una variable aleatoria que sigue una ley de probabilidad.
-..rs
estadísticos más importantes y sus valores, calculados a partir de una muestra de tamaño ?¿) son:
i"n
. La media muest¡al o promedio , T : L;
m
'ln
La r.arianza mucstral, s'2 - ---:- T.@, - ¡)2;
'rL
1
. La desviación estándar muestral. s : D@, - r)";
n-I i-I
. La proporción rnuestral, f : Lt
, donde y es el número de éxitos entre n intentos.
n,
182 Capitulo 6. Distribuciones de Muestreo
Si decirnos que un estadÍstico es Lrna v¿rlialrlc aleatoria, entonces tendr'á una Icv de lrrobabilidad
asociada.
1. E(x) : l-L;
o2
2. Var(X) -
-1TL
X-u,
3. '+
ol\/n
sigue aproximadamente urla ley normal estánclar (por el Teorema clel Lírnite Central).
Es decir,
\"11")'
donde Z es tna variable aleatoria normal estándar.
Téngase en cuenta qlre) para la mayoría de aplicaciones, ya se obtiene una buena aproximación cor-
un tamaño de muestra de n:25.
Ejemplos
Solución: La distribución de la media muestral X sigue una ley normal con media p: 7:
. o2: (0.9)2es declr' 0 0.9
:
varlanza u'rc'
; 36 ; ,fr: ,,/g6
6.3. Distribuciones de ntuestreo 183
a) Así,
Pr(6.8 '^\(8:J
<X <z.zs¡ : e, o.lb <\z\z <7'2e-7)
o,lb )
- o(-1 33) :0 e732 - 0 0e18
: i:iffl
El número de clientes que ocupan un cajero automático) en un lapso de 5 minutos, es una variable
aleatoria distribuida según la siguiente ley de probabilidad:
k 0 1 2 3 4 5
PI, r/tz 2/72 3l12 3lt2 2lt2 r/72
: aQ.45) - o(-1.47)
: 0.922L.
184 Capítulo 6. Distribuciones de Muestreo
3. En una plania pasteurizadora se ha observado que la máquina que llena las fundas de leche.
envasa el líquido con una media p y una desviación estándar de o:20cnr3. Si un día se llevarL
a cabo 25 mediciones de la cantidad de leche en cada funda. a) Caicular Ia probabilidad de que
el promedio medido difiera a lo mucho en 8 cm3 de la media teórica que debe tener el volumen
de leche envasado; b) ¿cuántas mediciones deben realizarse para que 7 difiera dc ¡r, en menos de
Bcm3, con una probabilidad de 0.99?
Solucíón: Como n : 25, se puede asumir que la distribución de X es aprc:,i-:ladamente normal.
a) Entonces,
Pr(lX-/rl <B) : Pr(-8<X-p<8)
: /88\
"'|.-r¡E<zsn/6)
: Pr(-2.2.2),
donde Z : X -# sigue una distribución normal estándar. La probabilidad buscada es
olt/n
Pr(-2 < Z <2) : o(2) - o(-2)
0.9772 - 0.0228 : 0.9544.
b) Se tiene que
Pr(lX - pl l8) : P'(-s <X -p S 8) : 0.99.
Como o:20,
\ -Y Y)
,, (
20 ,X ,-1,_
-olr/n-
:pr(-0.4Jñ
--\ --v < z < 0.4Jn): o.ee.
= 20)
Mediante la tabla de la ley normal se encuentra que
Pr(-2.57 < Z < 2.57) : 9.99,
por lo que se deduce qne 0.4Jn:2.57, o sea
":(#):40e6'
Se necesitan al menos 41 mediciones para que el promedio de la ¡nuestra esté a 8 cm3 de ,
n:irn
i-r
donde X¿:7 con probabilid^'r p y X¿:0 con probabilidad Q: I - p, i : I, 2, ..., n. Entonce.
cuenta el número de éxitos en . intentos. La proporción de <<éxitos>> en la muestra es
f:Y: li",
TL 7I4;- 1
La variable aleatoria Y tiene distribución binomial de parámetros (n,p). Por lo eu€, py:
o2" : npe, y se cumple que:
6.3. Distribuciones de muestreo 185
r E(i) : 1
: p;
n-E(Y)
l. 1
Var(f) = I Var()')
rL'
:?3:
n
l. + sigrre aproximadarnente Lrna ley normal cstánclar' (por el Teorema del Lírnite Central)
\/ pq ln
Es decir.
./ \ / \
P,(Fsl) =Pr(z1l!) :of '-1 )
\ - t/pql" ) \r/pql" )
dorrde Z es tna variable aleatoria normal estándar.
Ejemplos
o(!zg::2.\-rlors-oz\
\v/0.16/loo/ \v/0.16/1oo/
aQ.25) - O(-1.25) : 0.9878 - 0.1057
0. BB2 1.
Eu lrna investigación por muestreo interesaba saber el nivel de sintonía, en los hogares, de un
partido de fúrtbol. Se realizó nna encllcsta en Qr-rito a 213 hogares y se encontr'ó qr-re el 53% de
los hogares habían visto el nencionaclo partido. Srrpongamos clue la proporción 7r de hogares
en los que se vio cl partido fue realmente igual a 0.5. ¿,Cuál es la probabilidad de observar una
proporción muestral f igual o mayor qr.re la observada 0.53?
Por 1o que,
Hzq qrre totnar Lrr.¿i nltcstla. alc¿rt,or'ía para estimar Ia proporciórr de artículos defcctnosos p de lur
ploceso de prochrcción. a) Establecer el tanraño mínirnc¡ de ia rnr-restla de modo que la proporción
observ¿rda difiera de la propolción velda,clcrr'¿ on irrerios cle 0.1, oon riua 1>robabi iclad c,le al rnenos
eI 957o; b) Realizar el inciso antelior si se conoce qr.re la ploporci<in dc artÍculos defectuosos es
mcnor clue c1 12 %.
Soht"ci,rin,;
186 Capítulo 6. Distribuciones de Muestreo
zr) Deseanros cletermirtar el ta,rnaño nríuirno cle 1a mrrestr¿r clc tal moclo quc Pr(lp tl < 0.1)
0.95:
0.I{"
,/w
n
La ley de distrit¡ución y2
Sean X1 , X2, .. ., Xrr., fr variables aleatorias,independientes que siguen una distribución normal e. . .¡,.
dar, la variable aleatoria definida por T : D X? tiene una distribución X2 (jl-cuadrado) con n gr1-ul
,i-I
de libertad (g.1.), denotada y2(n).
Su función de densidad es
,(n-2) lz lz
"-r , siz)Q;
f(r):
i; 2"trt (;)
sir(0.
2.
z@)
:sta distribución está definida para valores mayores que cero y viene tabulada. La Tabla 3 del Apéndice
--,ntiene los valores X?qrre cortan un área a en el extremo derecho de la distribución (Figura 6.1).
- a lectura de la tabla se realiza de la siguiente manera:
Ejemplo. Se desea conocer el valor de la ley X2 a 4 g.l. para el cual el área en el extremo superior es
-.ral a 0.025.
-' .lución: Se busca Xl.ozs(a) : ll.l4. Esto quiere decir que el área a la derecha del valor t : II.I4
-= Ia ley y2 cor. 4 g.l. es igual a 0.025: Yr (X2 > 11.14) :0.025.
:;pongamos que se obtiene una muestra Xy, X2, ..., Xn de una población que sigue una ley normal
-'i ri,¡.t,o2). A partir de la muestra calculamos la varianza muestral, s2 : ' n-rl-tÉ
-i (X, -X)2; entonces,
- cumple que:
-. E(s2):oz'
)n4
l. '*'\"Ls2),,
Var
n_1,
(n
J # - 1\.s2
sigue una ley ¡2(n - t;.
=jemplo. Un jugador profesional de dardos decide tratar de mejorar su técnica de lanzamiento y va
. -stndial la varianza de Ias distarrcias al centro del blanco a las que cae el dardo. Para una cierta
-rrnica de lauzamiento se sabe que esas distancias tienen una distribución normal cuya desviación
+ ándar es 4 cm. Realiza 30 lanzamientos y calcula la varianza de Ias distancias entre el sitio de
--pacto del dardo y el centro del blanco. a) Calcular Ia probabilidad de que Ia desviación estándar
-. los lanzamientos sea m¿yor a 3 cm.; b) Hallar Pr(10 < s2 < 27), aploximadamente; c) Calcular Ia
:--dia y la varianza de s2.
pr(10 < ,2 < 2T¡ : v, (!rc <n _ut ,' t}rr\: pr(18.13 < u< 48.s4)
\16 o¿ -16 /
: Pr(U < 48.94) - Pr(U < 18.13)
: [1 - Pr(U > 48.e4)] - [1 - Pr(U > 18.13)]
: Pr(U > 18.13) -Pr(U > 48.94).
En csta sección presentaremos distirrtas distribuciones cle muestrcoT qlre se presentan cuando tratantc,.
con transformaciones adecttadas cle los estadísticos. Estas transformaciones son rlecesarias para oJ¡tene:
leyes clc probabilidad que permitan traba,jar adecuadamente.
trn 1908, \ /. S. Gosset, esclibieldo c:on cl nornbre de Studcnt, publicó en la rcvista Biont,ett"i,ka s'
dcclucción cle la distribución ú e inclrryó tlrblas cle probtrbilicl¿rd acurnr-rlacla de la ley.
trl gráfico de la función de densidad de la Ie5, / 1i"t n rrna forrna parecida al de la ley rrormal, simétric
rcspecto a 0 y se extiende a Io largo clel eje leal.
Los valores de probabiliclad clue tona vienen tabul¿clos. La Tabla 2 del Apénclice contienc los v¿rlole:
dc úo qrte colt¡lrr nn área igrral a o err cl extlemo clelecho clc la distribución (FigLrrrr 6.2).
6.4. Otras distribucíones de ntuestreo 189
Los valores tabulados dependen de los grados de libertad, porque la ley de probabilidad ú cambia si n
;aría. Cuando n aumenta, la distribución ú se aproxima a la normal estándar.
La lectura de la tabla se realiza de la siguiente manera:
Ejemplo. Encontrar el valor de Ia ley ú a 6 g.l. para el cual el área en el extremo superior es igual a
_.t125.
jolución: Se busca fo.ozs(6) :2.447.Esto quiere decir que el área a la derecha del valor t:2.447 de
--,Iey t es igual a 0.025: Pr (? > 2.447) : 0.025.
La ley de distribución de X
Srpongamos que se obtiene una muestra X1, X2, . . ., Xn de una población que sigue una ley normal
-l'(p,,o2), donde o2 es desconocida. Entonces, se cumple que la variable aleatoria 7: j
s/\/n "igu"
.ra ley ú de Student con (n - 1) grados de libertad. Es decir,
/ t- \
Pr(X < ú):
' Pr (r.- Z- 41
sl'/n)
\
Ejemplo. IJn fabricante de cigarrillos asegura que el contenido medio de nicotina, en una de sus
-arcas) es de 0.6 mg por cigarrillo. Una organización independiente mide el contenido de nicotina
-e 16 cigarrillos de esta marca y enclrentra que el promedio y la desviación est¿índar son de 0-744 y
-.i75 mg de nicotina, respectivamente. Si se supone que la cantidad de nicotina de estos cigarrillos
= una variable aleatoria normal, ¿qué tan probable es el resultado obtenido por la organización
- Cependiente?
i'.,iución: Se tiene que p:0.6, s:0.175, n: L6. Encontremos la probabilidad de hallar un valor
::omedio igual o superior a 0.744.
) Ia lectura de la tabla de la ley ú con 15 g.1., resulta que Pr (" > 3.29) : 0.0025. De manera que el
-'Lto proporcionado es muy poco probable.
190 Capítulo 6. Distribuciones de Muestreo
SLrl>orrgtrrnos qLlc se clispone de dos pol-rlaciones que tienen rriedias Ft y lrz y varianza, ol v o)r.
respcctivarnente. Sean X1 y X2 ias lreclia muestrales de dos muestras ¿leatorias indepenclientes de
tarrr¿rños TLr y rL2l seleccionadas les¡rcctivarnelte de las poblaciones 1 y 2. trntonces, X1 - X2 cunlple
qr.le:
2. o7r-¡r: Var(Xr
o?-l- oZ
-¡2): TL1
-
¡I
-ln2
7-
(Ft -x2) - (pr- t'z)
<z< 2-(40-40
r:d------'=t
t5'
tl-L-
Vro go
o(1.55) - o(-1.55) : 0.9394 - 0.0606
0.8788.
Supongamos que se dispone de dos poblaciones que siguen una ley normal: la población 1 sigue una le¡-
.M (lrr, ol) y la población 2 sigue una ley ,A/(¡ 12, 03) . Sean X 1 y X2 las media muestrales de dos rnuestras
aleatorias independientes de tamaños Uy n2, seleccionadas respectivamente de las poblaciones 1y 2.
6.4. Otras disúribuciones de ntuestreo 191
(*.*)'
9-
1ntlft2
Ft:Lfx,
fl,'t a
y Fz:!fy,.
nt- u
- i:l i:t
, 1r ,^ ^\ pt(J-pt).pz1-pz)
2 -Pt-P2
va - '*-\rr
vaLtul
- r''/
tt)t T )
- - TL1 n2
3 Para n1 y n2 suficientemente grandes, la variable aleatoria
- -
.
t-.-
-rr
\- -.
L92 Capítulo 6. Distúbuciones de Muestreo
sigue aproximadamente una Iey normal estándar (por el del Límite Central). Es decir,
t-(pt-pz) t-(pt-pz)
Pr(Fr - lt) =rr( , t
Fz
\
ffi
U"r-rr" Un2
Ejemplo. Una-6rma especializada en sondeos polÍticos afirma que el 30 % de las mujeres y el20%
de los hombres están a favor de la reelección del actual alcalde. Si se hace un sondeo aleatorio a 150
personas de cada sexo, ¿con qué probabilidad la diferencia entre las proporciones muestrales de las
mujeres y de los hombres es, en valor absoluto, menor a 0.19?
n1o
-pt-rn
0.3(1 - 0.3) , 0.2(1 - 0.2):0'00247' A
150 '* ff
Buscamos la probabilidad Pr (lfn - f^l < 0.19):
pt(10¿
-0^l < 0.19) : Pr(-0.19 <Fn-A' < 0.19)
La ley de distribución F
Sean X1 y X2 dos variables aleatorias independientes que tienen distribución y2 con nL y n2 grados
de Iibertad, respectivamente; entonces la variable aleatoria
,, xrlnt
' - Vrln,
sigue una distribución F (de Snedecor) con (n 1, n2) grados de libertad, que se Ia notará como F(n1,n2)
(Véase la Figura 6.3)
Su función de densid
-??2\ n,/2
I (-)n'i"'n,
-/rt n2f2
: 2n|(n1+ n2 - 2)
E(Y) "^,sin2>2
TL2- ¿
y Ya{V1: nt(nz-2)z(n2-4)' sín2>.4.
Nótese que esta ley depende de dos parámetros (nt,nz) que corresponden a sus grados de libertad del
numerador y del denominador, respectivamente.
Los valores de las probabilidades vienen tabulados. En la tabla 4 del Apéndice se presenta el valor r
para el cual la variable aleatoria V - F(n1,n2) es igual a una probabilidad a: Pr(V ) r) : q.
Para la lectura de los valores porcentuales del extremo inferior de la tabla de la ley -F se emplea la
siguiente relación:
F1r-,"¡(u,nil p,()r,nr)
Ejemplos
2. Hallar el valor de r tal que Pr(V { r):0.05, donde V - F(6,9). Aquí, n1 :6, TL2:9 y si
Pr(V < z) : 0.05, entonces Pr(V > r) : 0.95. Por la relación anterior,
Fo.gs(6,9) : 1L :
,. ou.g,
^:0.244.
^2
La ley de distribución d" 1
si
S rpongamos que se dispone de dos poblaciones que siguen una ley normal: la población 1 sigue una
ol) y Ia población 2 sigue una ley J!'(pr,"}). Sean sl y s2rlas varianzas de dos muestras
-.r-,A/(¡21,
ieatorias independientes de tamaños n).y n2t seleccionadas respectivamente de las poblaciones 1y 2.
trntonces, Ia variable aleatoria
'n- '?1"?
'31"3
:-3-ue una distribución -F' con (rt - I,n2 - 7) g.I.
t
fengamos presente que si o?: o3: 02, entonces f' : 3 - F(n, - !,n2 - I).
D2
Ejemplo. Una marca de automóviles tiene dos plantas que ensamblan el mismo modelo de autos.
=l rendimiento de estos automóviles debe tener la misma media y desviación estándar. La empresa
--ene Ia política de regularmente comparar los rendimientos de los carros ensamblados, escogiendo
t94 Capítulo 6. Distríbuciones de Muestreo
rnrr<lstlas aie¿rtori¿rs en las clos plarrta.s. Se tonl¿uorr serx.l¿s mrrestr'lrs cLc tarri¿rño 30 y se controlrj l¿r
clcsvi¿rcicin est¿irrclar clc:l corrsumo clc c:acla urr¿r. Hallar' 1zr probabilicL¿rd clc quc l¿r clesvi¿rcicin cstárrc1¿-rr
cle una rnucstr¿] se¿r al rnenos 1.5 r't:<;es nravor qrtc lir clt: l:r seguncla.
- :.,( p,.r^)
", (; ")
Como F : t: - F(29,29); entonces.
/.?
001<r.(ü > 2.25) < o.o2b,
6.5. Ejercicios
Distribución de la media
1. Para una prueba de aritmética se sabe, con base en Ia experiencia, que la puntuación media es 7[t
puntos con una desviación estándar de 12.5. Si se aplica la prueba a 90 personas seleccionadas
al azar, aproxime las siguientes probabilidades:
2. En una ciudad, el peso de los recién nacidos se distribuye segÍrn una ley de media ¡¿ : 3100 g :
desviación estándar o : 150 g, Halle los parámetros de la distribución que siguen las medias de
las muestras de tamaño 100.
o
!). Un actuario estableció el siguiente modelo probabilístico sobre los sueldos que reciben los traba-
jadores en el sector de la agroindustria:
4. Las normas internacionales de calidad indican que los neumáticos deben durar al menos 33 m:l
km. Un fabricante de neumáticos señala qlre su producto tiene una dulación promedio de 34 nr-
km y desviación estándar de 4 mil km. En un iaboratorio que controla la calidad de fabricación s=
probaron 36 llantas de esta marca. ¿.Cuál es la probabilidad de que, en promedio, los neumáticc'.
probados no cumplan con las normas internacionales?
IEste valor se obtuvo mediante el empleo de r.rn proglama conputacional.
Nosotros) por la lirnitaciór-r cle las tabla-.
solo podemos acotar el valor de la probabilidad.
6.5. Ejercicios 195
5. El tierripo qne los usu¿rios dc nna emplcs¿l intcrlplovirrcial de transpolte esperan l)ar'¿r cpre stl
brrs salga clel telrnin¿r1 es rrn¿ r'ariabk: alcatolia con mcclia. rle 8.2 rnin y clesr.'iación estáncl¿rr cle
5.5 rnin. Sr-rporrga qnc err uri l¡us se ernl;arc:¿trorr 49 p:rstr.jeros. Halle l¿r probabiliclacl cle clue el
tienipo plorneclio quc ellos turrielori cllre esl)elal se¿l:
[1. La gente que freclrenta cierto bar tiene una probabilidad de 0.001 de salir y cantar con el grupo
que está actuando. En una noche de fin de semana hay 150 personas en el bar. ¿Cr-rál es la
probarbilidad de que al rnenos una pelsol1a salga y cante con el grr-rpo? (Suponga que cad¿r
persona en el bar toma la decisión independienternente del resto. Halle el verdadero valor y erl
aproximado)
8. La estatura de los varones de 18 años de Quito sigue una distribución normal de media 162 cm
y desviación estándar 13 cm. Se toma una muestraalazar de 85 de estos chicos encuestados y
se calcula el promedio. ¿Cuál es Ia probabilidad de que este promedio se encuentre entre 159 y
164 cm?
9. EI centro de cómputo de su universidad dispone de un servidor para gestionar las páginas web
personales de profesores y alumnos. Supongamos que la cantidad de memoria ocupada por una
de estas páginas puede considerarse como una variable aleatoria con una media de 1.3 Mb y
una desviación estándar de 0.3. Si el servidor va a gestionar un total de 500 páginas, calcnle,
aproximadamente, la probabilidad de que la cantidad promedio de memoria necesaria supere los
1.32 Mb.
10 Se efectuó un análisis sobre Ia duración de las máquinas impresoras, de una cierta marca) que
tienen las empresas púrblicas. Se eligió una rnuestra de 179 máquinas utilizadas en una empresa
elegida al azar. La vida media de las impresoras resultó ser de 3.33 airos y una desviación
estándar de 2.05 años. Con una probabilidad del 99.7%o, ¿en qué intervalo de tiempo puede
considerarse que se encnentra la vida media de las impresoras de tal marca?
Con una muestra de 160 entrevistas realizadas a mujeres que trabajan, resultó que el gasto
promedio mensual en arreglo del cabello fue de 39 dólares y desviación estándar de 5.2 dólares.
Con una probabilidad del 99.7To, ¿entre qué lÍmites variará el gasto medio en arreglo del cabello
para las mujeres que trabajan?
Un proceso automático llena fundas de chifles cuyo peso medio es de 450 g y una desviación
estándar de 3 g. Pala controlar el proceso, cacla hora se pesan 36 fundas escogidas al azar'; si
el peso neto está entre 449 g y 451 g se continlra con el proceso, en caso contrario se detiene el
proceso para recalibra,r la máquina.
a) ¿Cuál es la probabiliclad de detener el proceso cuando el peso neto medio realmente es 450
b')
b) ¿Cuál es la probabilidad de aceptar que el peso neto promedio es 450 g, cuando realmerite
es de 448 g?
_.f
-'f . La vida útil de cierta ürarca de llantas sigr-re unt-r distribución normal X con media 38 mil km y
desviación estándar 3 mil km.
196 Capítulo 6. Disúribuciones de Muestreo
a) Si Ia utilidad Y (en dólares) que produce cada llanta está dada por Ia relación Y :0.2X -f
100, ¿cuál es la probabilidad de que la utilidad sea mayor que 8900 dólares?;
b) Determine el número de tales llantas que debe adquirir una empresa de transporte para
conseguir una utilidad media de al menos 7547 dólares, con una probabilidad de 0.996.
14. En Manabí, el peso de los esDosos y de las esposas se distribuye según las leyes
y N(64,69), respectivamente, y son independientes. Si se eligen 25 matrimonios, ^/(80,100)
al azar, de
Manabí, calcule la probabilidad de que el promedio de los pesos sea a lo más 137 kg.
Distribución de la proporción
1
15. Se extrae una muestra aleatoria de 150 elementos de una población binomial corr pt :
4' ¿cuál
es la probabilidad de que Ia proporción muestral satisfaga
*=U= *t
16. El suceso A tiene una probabilidad de 0.4. Esto significa que esperamos que la frecuencia relativa
de A esté cercana a 0.4 en una larga serie de repeticiones del experimento que se está modelando.
¿Cuál es la probabilidad de que en 1000 experimentos, la frecuencia relativa esté entre 0.38 y
0.42 (inclusive)?
17. La FIFA está interesada en conocer si las selecciones nacionales ganan más de la mitad de
los partidos que juegan en casa. Suponga que se escogen aleatoriamente los resultados de 80
partidos, efectuados en las más recientes eliminatorias para el Mundial de Fútbol, y se encuentra
que 65% de ellos fueron ganados por el equipo local.
18. Supongamos que el 80 % de todos los residentes en Guayaquil celebran la fiesta de Navidad (el 25
de diciembre.) Se planea seleccionar una muestra aleatoria de 300 guayaquileños y determinar
la proporción de ellos que celebran la Navidad.
19. En un canal de transmisión de datos Ia probabilidad de que un bits se reciba con un error es
1 x 10-5. Si en una transmisión se envían 16 millones de bits, ¿cuál es la probabilidad de que
no ocurran m¿ís de 150 errores?
20. Según las estadÍsticas de tránsito, se ha establecido que en una noche de viernes, en promedio.
1 de cada 10 conductores está ebrio. Si un fin de semana la policía realiza 400 pruebas de
alcolemia, ¿cuál es la probabilidad de que el número de conductores ebrios detectados:
6.5. Ejercicios L97
21. Supongamos que el 40% de los votantes está a favor de Ia reelección del actual alcalde.
ü
a) Si se selecciona una muestra de 600 electores de la ciudad, ¿cuál es la probabilidad de que
la proporción muestral de votos a favor del alcalde esté entre eI37To y el4570?;
ie
b) ¿Cuál debe ser el tamairo rruestral para terrer una probabilidad det 97 % de que la proporciórr
de votos a favor del alcalde en la muestra no se diferencie de la proporción supuesta en más
deI2%?
a_
22. La mediana de la edad de los habitantes del Ecuador es de 26 años. Si se seleccionan 100
residentesenEcuador aIazar, calculelaprobabilidaddequeporIomenos el 60% deellostenga
menos de 26 años.
.tD
1.,-, ,
Lt) Se ha estimado que eI 437a de los estudiantes de leyes considera que es
muy importante que se
imparta un curso de ética en la abogacía. De una población de 800 estudiantes se tomó una
muestra de 80. Calcule la probabilidad de que más de la mitad de ellos opinen de ese modo.
24. En la segunda vuelta electoral los resultados clan que el candidato ganador obtuvo el 55 % de
los votos. ¿Cuál es la probabilidad de que en una encuesta realizada a 169 personas el resultado
no muestre una mayoría a favor dei candidato?
oÉ
En una encuesta realizada con una muestra de 3000 personas adultas escogidas al azar, ha
resultado que el 35 % toma café al menos una vez al día. Con una probabilidad del 95.5 %,
¿entre qué lÍmites variará esta proporción para Ia población completa?
26 El tiempo que esperan los peatones para crllzar una vía muy transitada se distribuye en forma
exponencial con media de 1 minuto. Si en una hora llegan 95 peatones, calcule la probabilidad
<i de que por lo menos la tercera parte de ellos tenga que esperar más de un minuto.
-.-
Lr--
Distribución de la varianza
28 Con el empleo de Ia tabla de la ley X2 Iocalice Ios siguientes valores y represéntelos, aproximacla-
mente:
rr 29 Si X1 , X2,...,X9 son nueve variables aleatorias independientes y distribuidas según una ley
l.- !-
It[(t2,32), calcule la probabilidad de que la varianza muestral sea menor o igual que 56.28.
30 Calcule Ia probabilidad de que una muestra de tamaño 13 seleccionada de una población normal
con varianza 4 tenga una varianza muestral:
31. Encuentre la probabilidad de que una muestra aleatoria de 20 observaciones, de una población
normal con varianza o2 :5, tenga nna varianza nuestral s2: a) rrayor a 8.1; b) entre 2.66 y
9.52.
ta
¿L, En los últimos 5 años, las califlcaciones del exarrren de aptitud para el ingreso a la universidad,
siguen urra distribución nolmal con variarrza o2 :8. ¿Consideraría usted o2 :8 como un valor
válido de la varianza de las notas de los exámenes que se rindieron este año, si una muestra
aleatoria de 20 calificaciones arrojó un valor de s2 : 16?
J.t. En una oficina de seiección de aspiral.tes para optar por una beca se estudia Ia varianza de las
calificaciones para identificar fácilmente a los mejores aspirantes. Para una prueba de matemáti
cas se supone que las calificaciones se distril)uyen normalmente con desviación estándar de 10.
Hay 15 aspirantes a optar por una beca. Calcule Ia probabilidad de que la desviación estándar
de las calificaciones de clichos aspirantes sea mayor clue 7.
q/
t)1. En una granja piscícola se mide la varialrilidad en el peso de los peces capturados. Las normas
internacionales indican que el peso está distrilruiclo según la ley normal con varianza o2 : 225 82 .
.)/ Si X1, Xz, ..., X9 son nueve variables aleatorias independientes y distribuidas según una Iey
¡/(8, 4), calcule la probabilidad Pr (f ST < 9; 1.09 < t2 < 10.045) . (X v s2 son independientes)
38 En la ciudad capital. el precio rredio de venta de las casas nlrevas es 115mil dólares. Se toma
una rnuestra aleatoria de 10 casas nuevasr resultando una desviación estándar de 25 rril dólares.
¿Cuál es la probabilidad de que la media muestral de los precios de venta sea:
39 Se tomó una muestra de 16 directores de oficinas de una ciudad con el fin de estimar el tiempo
medio diario que emplean en desplazarse hasta su trabajo. Si Ia media cle los tiempos es de 87
minutos y Ia desviación estándar de 20 minutos, calcule la probabilidad de clue la media muestral
sea menor de 100 minutos.
40 Con el empleo de la tabla de la ley F localice los siguientes valores y represéntelos, aproximada-
mente:
72 Dos nruestras ale¿rtotias irrclependicntcs cie tanraños 7 y 13, r'cspcc:tivarnente, se toüt¿u] dt: ula
rnisrna población rronrr¿lrnente clistribrricl¿r. ¿.Cuál cs lir probabilicl¿id cle que la variarrz¿ cle l¡r
¡llirnela rnrestla sc¿l rr)¿r-\/or igrral zrl tliplc clc l¿r r'¿rlianza cle lrr strgrrnd¿r mucstra?
Una muestra aleatolia de tarnaño 16 sc seleccionó a partir de una población normal de media 75
y desviación estándar B. Una segunda muestra alcatoria de tamaño 9 se tomó a partir de una
pobiación normal de media 70 y desviación estándar 12. Sean X1 y X2 dos medias mrrestrales.
Halle:
6 Una firma comercializaclora afi.rma que el peso medio (en gramos) tq y pz de dos marcas de
atúrr enlatado, A1 y Az, es el mismo. Para verificar la afirm¿rción se escogen dos muestras
independientes de tarnaños 36 de cada marca. Si la rnedia mlrestlal de A1 es mayor que la
media muestral de y'.2, sc rechaza gue Fr : 11,2, e\ caso contrario, se accpta gue Fr : 1tr. ¿Cl'ál
es la probabilidad de aceptar eue ¡lr : lt2, cuando realmeute p¡ : ll2 l2? Suponga que las
poblacionales son o?:9 y o2n : 4.
Para comparar la duración media (en rneses) Ltt y ltz de dos marcas de baterías , A y B, se
tomaron dos muestlas aleatorias independicrrtes de tamarlos 32 y 36, respectivamcnte. Si Ia
duración promedio (mrrestral) de ,4 es mayor que la de B en más de dos rneses, se acepta que
ltt ) l-tz; caso contrario, se acepta qlre /¿t : 1t,r. Calcule la probabilidad de aceptar q:ue ¡17 ) ¡r"2,
cuando realmente Ft: ltz. Suponga que las varianzas de las duraciones son o2¡: 16 y o2B: g.
,i
EI administrador dc r-tn edificio quiere decidir la compra de lámparas fluorescentes de m¿rca 7
o [/. Pala ayudarle a lealizar su decisión) se escogen dos muestras de tamaños 10 y 9 lámparas,
respectivamente, rcsultando las desviaciones estándar de s1 : 200 y sz : 150. Si la diferencia
entre los promedios es rllayor que 173 horas, se acepta eue pt I pz; de 1o contrario se acepta que
l-Lt: llt. ¿Cuál es la ltrobabilidad cle aceptar c¡re /¿t f ¡-t"2, ctando realmente pr: p2? (Asuma
que Ia vida irtil dc ambas narcas tiene distribución normal con valianzas iguales.)
Para cornparar los salarios que pagan a sr.rs empleados dos fáblicas cle cobijas, San Lucas y
Cebra, se escogen dos muestras aleatorias cle tamaños 16 y 13, respectivamente, de las dos
fáblicas. Resultó que la^s desviaciones est¿indar filerori sr: I20 dólales y sc : 55 dólares. Si
la difer-encia entre las rnedias rnnestrales no es tr]¿yor a 65 dólares, sc acepta que ¡,r,1 - /-¿2; caso
contrario, se accpta eue /r,1 I Itz. ¿Cuál es la probabilidad de aceptar que /¿1 I p,z, cuando
lealrtretrte Ft : I,tz7 Suporrga que los salarios, cn ambas empresas, siguerr una distlibución
nornral con valianzas difeleutes.
;c Dos plogramas de televisión tienen como latings 40% y 20Vo, t'espectivamente. Se tomó una
muestra de 300 hogales qne poseen televisor, durante Ia transmisión del programa A y otra
muestra de 100 hogar"es durante Ia transmisión de B. ¿Cuál es la probabilidad de que los
resultados muestren qr:e el programa A tiene un rating mayor al de B, en un 70%?
Capítulo 6. Distribuciones de Muestreo
52. Se escoge una mnestra de 600 electores c¡rrc acaban de votar, entre la,s 9:00 h y las 15:00 h, pare,
estimar la propolción cle votantes a favor de los canclidatos H y M. En una encuesta re¿rlizada l¿.
víspera, se estimó en 30% y 35% los polccntajes cle apoyo de los dos candid¿rtos, respectivanielte.
¿.Cr"rál es la probabilidad cle clue la proporciórr rnuestral de B excecla a la proporción rnuestral de
A en al menos I0%?
53. La música romántica es preferida por el 30% de mujeres y eL25 % de hombres. En una encuesta
realizada a 300 personas de cada-sexo, ¿cuál es la probabilidad de qne la proporción muestral de
mujeres que prefieren la música romántica, sea mayor a la de los hombres?
Crpítulo 7
Estlmación de Paránnetros
:n el Capítuio 1 se expusieron varios métodos qr-re permiten descrilrir un conjurrto de datos de rna-
,-era r'ápida, generai y efi.caz; estos métodos son grtíficos y su intelpretación es fácil, pero tienerr el
:-cortverrieute c¡te la dcscripci<in cle los datos no es úrnica y no sc plcstan para realizar Jrreclicciorres.
:l rtso clc la ittforrnación que se obtiene a partir dc un¿r muestra pa.la sacar corrcinsiones soblc l¿r
;.1. Estirnación
-. teoría de 1¿r estirnación de parámetros fue clesarrollacla en las primeras décadas clel siglo XX,
Ilo rur¿t parte de otra teoría (las pruebas de hipótcsis) y sistematizaclir por J. Neyrnarr cu 1934.
-- tualmente, esta teoría es la basc de cr-ralquier estudio estadístico.
-"tartclo sr¡ toma ttna nutestra de una poblaciórr, e1 olljetivo es tenel un indicio cle los valoles cle los
.-rárnetros descorrocidos de ésta. Tal proceso se dc:nomirta est'imarción y a los valoles c¿rlcul¿rclos
'. inladores.
Definición (de estimador) IJu cstimador es rlua nieclida est¿rdístic¿r qrre permite conocer o
-:,a idea del valol de ttn paliimetro dcsconocido, basándose en la información de la mr-rcstra.
- :' ejcrnplo, si disponerrtos cle una poblaciórr cr-rya rneclia ¡.r, es desconocida, es natulal cscogcl el
:. rrnedio r conro estirnador clr-. ¡r,.
,:,,selvemos que un estirnar,lol es nna variable aleatolia; rnientras que Llua estirnaciórr es nn núrrnct'o.
:--lr.ttr¿s veces)
los estirnadorcs dc los parzímetros poblacionales se distingr"ren clel verdadero r'¿rlol
:'--diante el empleo del símbolol Por ejenplo,
20r
202 Capítulo 7. Estimación de Parárutetros
Las siguientcs secciones l¿rs declicalenros ¿r cono(icll las plopiecl:rclcs cle los cstinr¿rdores clc los pnr'ámetr,,-
poblacionales, a evaluar su r.aliclez \' ¿r cxporlcr s'.is aplicaciones.
Cuando sc obticrre una rnuestra de nua población, el objetivo es tomar una decisióti cu b¿rse de I
estadísticos calculaclos a partir de los datos rnuestlales; luego ellos se resumen en frascs como I..
siguientes:
1. trn 2930 de los 10 000 hogares de Ia ciudad se sintonizaba cierto prograrna de televrsrón.
Los estimadores anteriores dan una idea concisa de los resultados de la muestra, pero no inform¿.:
de su precisión. Así, pudiera haber gran diferencia entre tales estimaciones, calculadas a partir C=
una muestra, y Io que uno podría obtener si dispusiera de una cantidad ilimitada de datos. Pr::
ejemplo, 74Vo sería una estimación razonable (o predicción) de la desocupación el próxirno mes; per'(,,
¿',cuán <<buen>> estimador es? Teniendo en cuenta Ia variación en el mercado laboral, sabemos que e:
improbable que el próximo mes haya un nivel de desocupación de eractamente el 74%. Sin embargc
podemos esperar que su valor sea <<cercano>> alI4To, y ¿qué tan cercano? ¿Podemos esperar que se:-
dentro del 10.1% ¿el estimador?, o ¿dentro del tl Vo?, o ¿dentro del +I0%?
A partir de la discusión anterior podemos deducir que existen dos tipos de estimadores: uno que ci:-
un valor numérico qlre resume lo observado en la muestra; y otro que, además, expresa la incertidunr-
bre debida a Ia variabilidad en los (generalmente limitados) datos. A continuación definimos má-.
formalmcnte estos tipos.
Definición (de estirnador puntual) Sea X1, Xz, ..., X,"Ltrra muestra aleatoria seleccionada de
población con distribución de parámetro 9. Se denomina estimador puntual del parámefto 0 a
r.rna
cualquier estadístico que proporciona una estimaciórr del verdadero valor de 0.
Por ejemplo, si la media poblacional es p : 6, obtenemos ttna muestra 5r determinamos Lrn promedi,-
z : 5.85. Ésta es una estimación puntual de ¡1.
Tambión, mencionamos que la estim¿ción puede realizarse mediante Lrn r-ango de valolcs entre lo.
cuales se encontrará cl verdadero','alor á con alta pr-obabilidad.
Definición (de estimador por intervalo) Un estimador por intervalo de un parámetro descono-
cido á está dado por clos puntos, qne pretenden abarcar el valor leal del parámetro.
E(6):e
De otra manera ? se llama sesgado.
D--
L -_
:-'
i::
\otemos que la rlistribución muestral para el estimador sesgado está desplazada hacia la derecha de
4. Este estimador sesgado, probablemente, sobrestima 0.
sesgo(?) :E(A) - a
Ejemplos
Él
1. La media muestral X es r,rn estimador insesgado de ¡;, ya que E (X) : p
,n
>a x?
,i-t
\/ -X2 :
'
El estaclísti c<¡ no es un estimador insesgado de ¡r, ya quc E (t/F) + u
17
.'l- disponemos de dos estimadores insesgados de á, interesa tener nn criterio para elegir uno de ellos
E(0:) = 0
l-igrrla 7.2: Estirn¿rcloles insesga<,los corr clistirrt¿i valiarrza: Var(d2) < Val(91)
lDados dos estimaclores iusesgados de un misnro par'árnetro, es irrcferibl€ escoger_'el nrás eflciente. I
A vcces se prcsenfa el problema de elcgir entre dos est.irnaclorcs corr propiedades contrapr-restas: Llno
de cllrs es iusesgado y el otro es sesgado, per-o con nrcnor valianza. En estos ca,sos cs necesario dcfinir
una mcdida qrle Dos pcrmita lcaiizar tal conrl>aración.
Definición (de error cuadrático medio) El error cu¿rdrático medio debido a la estimación de
d nrediante D cs ECM(D) - P lf e -hV].
L' l
Áv
u]
-
14 1, ir: ,r(Xr +,Y.r + xr;,
^t
0t: )(xr
'2- * 2_Y¡), 0q:-Y:
I
F-Y2-r- Xtr-Xq-X¡).
r("t
a) Segúrn el criterio de la eficiencia, ¿cuál es el rnejor?; b) Cornparar los estimaclores0zy ?3 rnecliantc
el ECM.
Sol,ttc'ión,: Calcnlemos lzrs esperanzas y las variarrzas de <:acl¿r r.uro de los esl.imadores:
I )
t¡ar'(0¡) ;(Var (X¡) + 4 Var'(Xs)) : a,
DO-
44
,2
Var(?a) VallX,) : --.
r-
7.3, Estitnaciótt ¡tuttLual
205
¿r) Elcstinta'<[,r03css.sgirclo,rttictrtt¿1s.1,,,r?,.i.t:,/,usr.rrrirscsg¿rtles;
estinl¿ldor
aclenrás,04:Xcsel rrc.loI
<[e ¡1, ¡lol'r¡rte ticnr¡ l¿l nrcrror r'¿rr'i¿rrLz¿t (r,s cl rrriis <rfir:i.rrtc).
l,) C¿rlctrlcrtr<-¡s los scsg<_ls clc los dos cstiru;r, lorcs
l¡') :
ECM(as) : Var(?3) +(."rgu1D3¡)2 :-Tii:¡o' /7 \2
. La esperanza de X es
E(X) : --E
I
_1 ttt'' : !@r')
lt ?t
f
De manera que T es un estimaclor insesgtrcl r.t <I<: ¡t.
La varianza de X es
o-,
77
5"*l --,,,
206 Capítulo 7. Estinación de Parántetros
os rlll cstirlrrclor'lrrrrrlrral ci<r o2. ¡rerro lirtuc cl irLc:orrvclricrrl.c clc s<:r scsgado. pol Jo (¡rc sc rkrfinc
D(xu -x)'
,i.:t
rt-7
', f "
E(s2) : fr' + o") -, ,lI (r'- #)l
" - L¿=l ' )
I.).)r.)1,)
: -i-(npt
11
+ no2 - ,, ¡r2 - o2) : n-l (n - l)o:
-t
: o2.
2oo
L¿ r'arianza de ,S2 es Vzrr'(52) : (este resultaclo no se clernostr-ar'á ya qLle su complejida,J
TL- a
|
sale del alcarrce dc esta obrz-r) .
Para detelrniual la cstimación cle rLn pirrámetro poblacional existen varios niétodos, los dos más im-
¡roltantcs son el de los rnomentos y el de máxinra verosimilitud.
EI rnétoclo de estiniación de los tnornentos fire dcsarrollado pol K. Pealson en 1880. Es r.rn método
gcller'¿rl t1c estiul¿rciórr de uuo o más pirlzinreltos y se b¿rsa cn l¿r idea de torn¿rr conro estimadol cle la
media a la rnecli¿r rnuestlal. colrro estirn¿tclol de I¿t rtaliarrza ¿r I¿r valianza rnnestlal, y así succsiv¿mente.
Err genelirl, si derrot¿rrnos fr,¡: E(X¿'), denomin¿rdo el A-ósimo nn'ntento teóri,co clr¡ larrariable X. EI
/i;-ésir¡o nt,c¡n¿ett,to nnt,e,stra,L es 1¿r vali¿rble
rrl
i^ : L, rL
A, : 1.2.3.. . .
Entonces, igualamos los correspondientes momentos teórico 1'muestrali pk: p¡. y resolvemos Ia
ecuación resultante para d.
7.4. Métodos de estitnación puntual 207
El itcorrvcuicnte cl<,r cste rrrétoclo es (lrre los estirrr¿r,:loles olrtclri<[os, rnnc:hzrs \¡eces sou sesg¿t(los.
Ejerrrplo. Disp<trrcrrros <le rrtr¿t lnllestr'¿r Xt, X2,.. ., I,,. ixovtrtriculr: clc tttt¿t irrtblacióu t:orr rlistlilrrr<:iótr
Ul-9,ál , rlorr<lc d > 0 cs clcsc:ouociclo. H¿li¿rr'l¿i cstirn¿rciórr clc á.
Sea X1, Xz, ..., X,, una mnestLa proveniente de una distribr-rción con par'árnetro 0 y ley ,f (r;0). El
procedimiento a seguir es el sigttiente:
3. Hallal el valor cle d que maximiza Ia log-r'erosiniilitud. En este casoT es el valor'?, q.," cs solución
de Ia ecuaciórr
dt
-:n
d0
Observación. Si l¿r distribución de probabiiiclad contierre k lrarámetros, 01. 02, . . ., d¡., la estinración
ie rnáxirna verosiniilitucl de c¿rda uno será I¿r solución dc las ecuaciones lespcctivas:
ar, ¡¡ _at, _ t) at _ /l
00t 002 0o*
Ejemplo. X2, ..., Xr, Llna muestla provenierite de tirra población con distribuciórt
Sea X1 , N(p,o2).
Hallar los estimadoles de p. y de o2.
(X=
SoLuctón: La función cle densidad de la ley es /(X; p,o2) : +"*O-'v (- f)'\
2o2 )
/2tro \
208 Capítulo 7. Estimación de Paráutetros
1'r
t(p,o'): Iog(.1(¡r, o2)): -|bgQno2) - *f(xo-¡,)'
¿O' i_1
-
p):0,
#:-o* # lrx,-
de doncle p : - x.
Por c¡tlo laclo.
nI 1
-t7 +;VDtx' - p)2 :o
0t, 'L
o(ot) i:l
IL
Drxn-X)'
cuya solución es o2 : l-1
: S*2.
l.D. Ejercicios
1. <El pr-incipio subyacente etr todas las técuicas de inferencia estadística es que nllo Llsa estadís-
ticos rnuestrales para aprendel algo (es decir, para inferil algo) acerca de los partirnetros pobla-
cionales>>. Si usted entendió Io qr.re quiere decir esta afir'mación, escriba uu 1>iillafo en el que
describa una situación en la que se pueda emplear un estadístico muestlal para irrfelir algo sobre
uu palrimetro poblacional. En su ejemplo, identifique claramente Ia rnuestrtr, Ia población, el
estadÍstico y el patárnetro. Sea t¿rn específico como sea posible y no use cjelnplos clad<ls en el
Iibro.
2. Se tom¿r Lrrta muestla cle tamairo 4 de una lroblación de rnedia ¡t" y varianza o2. Sc lrroptnre los
siguientes estimadores de I¿ media:
Xt -l Xz + 3X4 -f
0,: , 02: Xr Xz + 2XJ
4'
03: Xt'l Xz * Xs * Xq Xt*Xz*X¡+X+-J
, 6n:
lndique su orden de prefelettc;ia (clel me.jor al peor) 1, explic$re los motivos dc su <rl¿rsific¿rli,irr.
7.5. Ejercicios
3. Dos muestras alcatorias independientes se extraen de una población con media p, y varíanza o2.
Los tamaños nruestraleS Sor ??,1 y rL2 : ? v tu. meclias muestrales son X1 y X2, respectivamente.
2'
Para estimar a lL se proponen tres estimadores,
4. Si se dispone de una muestra Xt , Xz, X3 de observaciones que siguen una ley exponencial e Q' 1 0) .
0,
*t .
: .yr, 0., : ', :2"2 a, : IJ:3!2, :x an .
5. Si se dispone de una muestra Xt , Xz, X3, Xs, Xs de observaciones que siguen una ley de Poisson
P(^). Considere los siguientes estimadores:
Xt -f2Xz * X: * 2Xq -f Xs
a,
0n :xl+xl.
a) ¿Cuáles estimadores son insesgados para )?;
b) trscoja el mejor estimador insesgado de ).
A partil de una población que tiene media p, y varianza o2 se tomalon tles muestras de tamaño
rtr : 7, n2 : 74 y nz : 9. Sean sl, tS V t:3 las varianzas muestrales calculadas a partir de las
muestras. Compruebe que
t tsl+usi?r+osl
30
El número de clientes que ingresan a una librería en una hora es una variable aleatoria X que
sigue una distribución de Poisson con media ). Se dispone de una muestra aleatoria Xt, . .., Xn
del número de clientes por hora.
SiXl y X2 son dos variables aleatorias independientes tales que E(Xr) : E(Xz) : p y
Var(X1) : Var(Xz) : 02 j determine si el estimador.
10 Suponga qr-re X1 y X2 son dos medias muestrales caLculadas a ptrrtir de dos nurestras dc tarnaño
n,r y n2, respectivamente, obtenidas dc una población normal de media ¡r, y varianza o2.
11. Considere una sucesión de variables aleatorias Xr, Xz, ..., X", independientes e idénticamente
distribuidas que siguen Lrna ley uniforme en el intervalo l0 -7;0 +tl, donde I es un parámetro
desconocido. Denotamos por X," el promedio de estas variables.
12. Sea X1, .. ., X,, una muestra aleatoria de una población con la siguiente distribución discreta
_1. ) Sca X1, .. ., X2s una mnestra aleatoria de tamaño 25 una población binomial de
¡r e (0, 1).
Pr(X: r): Cíp'"(1 - r¡2-z
Determine estimador de máxinia el valor 0 ocurre 5 veces, el valor 1 ocurre
11 veces y valor2ocnrre9veces.
15. EI tiempo, eu ltoras, que dura un elemento electlcinjco es Llna vtrriable aleatoria ? que tienc.
distribución exponencial de 1:irrámetro ). Pala estim¿rr ) se pruebzrn 30 elemerrtos y sc enclrentLa
que 18 fallan antes de Ias 600 horas de uso.
7.6. Estintaciót) pof interv¿tlo 217
rL) \lr'<li;tLrl,: r'l Lrri'rtr.rr-[<l <l.c ru¡lxiLrlt vctosiurililrr<1. <rstirnar I;r lrLo1>or'{:irjn <l<r t<t<los ]os clcrrrclrtos
r¡rtt' Irll;ur ;r]l1r'¡ <lc l;ts 0()() lrrlr'¿rs
lr) tltilir r: r'I tt'ru]t¿trlo rlt¡ ii) I)¿u ¿r ol rltrrrt'l lul osl irrr¿r,-lor rlr: ).
10. A lr.' l;trgo rlc rttL ¿tio, l¡r ltcnrl rr¿r rlc tigrillo prrctlc tcrrcr rur¿r o rLos r:r'íits. o lr() t<:rrct rrttrgrtrr;r.
I)
Scg-rirr tllr ('sl ttrIio ttr¿t]iz¿tclr-' pot lllr grrrl)o tl<r zorilogos. lir plopolr:ii¡rr rle lrcnrllr¿ls slll (:ll¿ts os -..)
.)
t) IJrillc <,'l urirnr:Lo mc<iio csl)cllirclo clr: cr'Ías pol lrcrnlrrir ¿r lo lalgo clc un ¿rrio:
lr) AI lc¿llizar un cstrldio de 200 henrlrr'¿s chrlantc nu ¿ño, cl cc¡ripo cle científir:os nlcliciorr¿i(lo
cncontr'ó 55 hembras quc rlo h¿ur tenido crít.rs, 106 quc h.¿u) telido urra cría y 39 clue han
tcnido <1os. Eshirrrc el par'árnctro p l)or el rnétodo cle lr¡s lnomentos.
L7. EI control tle r.rna paltidzr de loclillos se rcaliz¿r clasificardo las piezas en ¡leqneñas, rrormales y
glatrdes. Ltrs propolciones teót'ic¿rs sc stlporel) pr : 0.05; pz : 0.90; ps : 0.05. Pero sc sospeclta
clLte h¿'r. aumentado la dispersión y, por tanto, las piczas siguen las ploporciones: pr : 0.05 f ¿;
pz : 0.90 - 3n; ps : 0.05 + 2r¿. Se an¿rlizal 5000 ¡riezas obteniénclose n1 : 7278; n2 : 2928;
?B : 794 cle cacla clase. Obtenga una estimacióu cle n¿txirna verosimilitud cle ¿.
-isí. por ejcrnplo, con base eu ula rl)uestr'¿r cle hogirres crr los quo se está r'icndo televisión, podemos
Itrstruir urt inten alo qlre coltenga, corl un glado cspecÍfico de coufi¿rbilidad, la rnedia o la desviacióu
,-.tánclal clel tierrrpo clue ia ¡roirlaciór'r consrrltacla vc tclcvisiólr .
-rtltes cle au¿lliz¿1r los r-lifclctrtes c¿rsos) cx¿nrincrnos zrlgrrntrs icletrs irrclirnin¿rlos.
Dcfinición (de intervalo de coufiatrza) Uu interr'¿rlo cle r;onfianz¿l cs nn rango cle valores,
llcttl¿rclo zr par [it de ios clatos rnuestrarles, el clral 1-rrobablcrnento incluye cl verdadero v¿rlor cle nn
-,
¿r ¿irrret,r'o r lescorrocido.
.-, cad¿r intcrr,'alo cle confiattz¿r se Ie ¿rsoci¿t rrna 1l'obtrbiliclacl (l - o) clc clue corrtenga el veld¿rrlero \/alor
-'llratiirnctlo á. A tal ptolrabilidarl se lt: clcli¡rnitn tñ,t¡c,l d,e cort,fia,ttzn, y a los cxtrernos clt¡l irLtelvalcr
tiÍe i.n,.feri,t¡t v Litn'ittt srtltel"ior'<l<t c:<trrfi¿urza: (LIC:.LSC). Esto s<: r'esLunc cll
r\(LIC<0<LSC',):l ri.
-',- irrtt:tr'¿rkr <1ur: c:rttnllle cst¿rs c:ottdicioues se <ierLorlinit'i,tttet'uo,l,o d,e co'n,tiarr¿ cle rrivcl (1-or) xI00(/r¡.
- :¡t t<:ucr tr,'sultitclos fi¿rlrl<s. ci rrivc] clc r;orrli¿rnz¿r <lcbr: ser'¿rlto, lo rn¿is cercir.lro a ruro: gc:trt-.rtrlnrerrtc
., f ornr 0.9. 0.95 o 0.99.
:- ¿rtrcho de tLl iltten'alo clc cr¡ttfi¿rrtz¿r nos da l¿r icie¿r clc cu¿rnta inc;cltidumble existe, alredcdor del
,:¿iurctlo rlesc:onociclo. Uu inbelvalo muy ¿rncho prrede inclic¿rr qtre deber'íarnos recolectar más datos
-"-tes clc dt:cil algo tlefinitivo sol¡re el partinretro.
212 Capítulo 7. Estitnación de Parántetros
Ulr intervaio cle conlianza para lir mcclia poblacional vcl clel 100(1 a) %, cstá cla,:,lo por
o
(t- ttt/,2 r1r
.; L (7 1)
vn
Dondc:
a n es el tamaÍio de la rnuestla"
zo¡2 eI valor z que colresponde al á.",- I en el extlerno superior de tra distribuciórt norrnai
2
estárrdar; es decir, 7 - ú (z*¡2)
\ttl.,/2,
: : (Figura 7.3).
Aclní se aplicir el Teorerra del Límite Central y es aconsejable tencr un tam¿rño rnucstlal n) 25.
Iln Xrr siguiente tabla se preserrta ios intervalos de confi¿rnza más corrLrrrtnente usaclos:
Nivel de
cor:fiarlza
0.90 0.10 1.6.15 I.6a5 oI ¡/n ;) 1.645 o l1/n,
0.95 0"05 1.96 T. 1.96 o I yE 4), t.s6 oI lñ
0.99 0.01 2.58 '-u 2.58 o I yñ, ;I 2.58 o I yñ.
Observaciones
1 Si cl tam¿rño de l¿ rnucstr¿t cs suficic¡ttcmentc gltrrrcLc (rt / 25) ¡'se <lescorioce 1¿r r'¿rri¿-Lrrza. -.
i)uecle rrtilizar el intervalo 7.1. r'eeuLplazar.Lclo {r }lol'su i:stirn¿rclor',s) siri póiclicla cle cx¿rctitlLcl
2. Prresto (llre Para urr valol de znr2:3 sc tierie un rtir.cl cle r:ou{ianza clcl 99.7%- crr las zrPlicacionc..
prácticas sc supone que nrl intelvalo <le conlianz¿ al 99.7% conticne el r'¿rlol cle lir rnediir, co
I rttltt ttO'"'''O o O '
Estirnación de la rnedia cuando Ia varianza es conocida 2L3
Ejernplos
Deterrninar un intervakt cle confianza cle nivel 95 % pala I¿r rnecli¿r poblacional p" sí n: 36,r : 15
y o2 :3.24.
Sol'uci,ón: Sabemos c¡uie :3.24, o sea o:
o2 1.8,
/ o=) : /
(r- - .. o .o,' 'atz
'o/2
^ o\ ''rw
I.B
ltt-1.96{;1b+t ''' go 1.8\
| ''"" ^=-=
)
\- lE1" ¡n) \'" ¡76t J36)
(L4.4t2;15.588).
/- o o\ : ( qA 3.6+ / 3.64\
In- z,¡2J-;T
*," + z*¡2:71 - - 2$:=;46+
- "- 2.33"'";
""
\ r/r,, ",. t/n ) \ ,/ñ JrT )
I
@6-1.2;46+t.2)
(aa.8; a7.2).
Ello significa que, con una probabilidad del gB %, la media del número de horas trabajadas
aquella semana se encuentra entre 44.8 y 47.2.
Según los consumidores, las empresas pasteurizadoras de leche no entregan la cantidad exacta
de producto. Para verificar esta denuncia, se tomó una muestra de 45 fundas, cuyo contenido
teórico era de 1 litro de leche. Se encontró un promedio de g72cm3 y una desviación estándar
de 51cm3. Sobre la base de un intervalo de confianza al 99.7 Vo, ¿se puede clecir que Ia denuncia
de los consumidores tiene fundamento?
Como el nivel de confiabilidad es del 99.7%, podemos decir qlre con toda seguridad,),a denuncia
de los consumidores es verdadera.
2t4 Capítulo 7. Estimación de Paráutetros
errrtlc str r,¿rlor vttrclaclclc> v 1.r cstiuracitirr: 17 t-Ll. Sus v¿rlorr:s rr¿rr'íarr en1 rc 0 y zr, 12!-.
Pc-,clerrnos planl<:iunos erl ploblcnra r1e enc:outlal erl t¿rrn¿rño cLe 1¿r rtLr<rstla rle rrr¿ur()I ¿r clrLe el error rlr-
r:stirrr¡r:i<in DO sc¿1 rnayor' <¡re E.
El irrterr,¿rlo de confianz¿l para ia rneclia pol)lacion¿rl tierre I¿i forrn¿r @ - n;r + E), cloncle p: lt - ¡L
<rs el cu or err l¿i estim¿ciórr dc 1¿r rneclia pala el uivci cle confi¿rbilirlad dado. Si el irrtcn'alo tierrr: 1¡r
- / o o\ o
Irrnrfa {:r'- 3. /.) -;Ll zo¡2 f , elt1.e¡1¡p5 f'::,r.¡2--7.
\ Vn -
\/n / \/?l
Si de esta igualdad despejamos n, obteucmos
za/2o\2
n,: |/ ------
\E/ |
que es el tamairo de L¿r muestra, necesario para tener un error de estimación -E a nn nivel de confianza
7-c..
Ejernplo. Se desea conocer la distancia media que cor-ren scmanalmente un grlipo de atletas de fonclo.
Por estrrclios anterioles se conoce qr.re la desviación estándal de esas distancias es cle 3 knr. ¿;A cuánto¡
atletas habrá quc muestrear si la estimación debe quedar a rnenos de 0.5 km de la media verdadela.
con rur rrivel cle confi.anza deI g5a/a?
Sohtczón: El irrtervalo de confianza es cle Ia forrna (Z - 0.S;r + 0.5), entonces E : 0.5 y za/2: 1.96
Se sr-rgiele que el Iectol a,juste los parárnetlos, para tenel nna rnnestra aproxirnada cle 50 ¿rtletas, y lo.
llrteIi)rete.
7.8. Ejercicios
1. Deternine los intervalos de corrfi¿nza al 95 To para t¿:I media pciblacional desconocid¿
l
si
n:45, r:5,
tt) o : 6.8; c) l : 13(). 7 - 1d.5. o2 : 4.2:
b) n, : 100, r:37, .,2
D
-
-L<)
q<.
d) n : 169, 7: -22, o2 : 14.
Dctcrminc rtri interv¿tlo en el que se pueda dccir que se encuentla el valor de la rncdia con casi
toda seguridad si
6. En cierto barrio se seleccionó, al azar, una muestra de 100 personas cuyo promedio de ingresos
mensuales es z:460 dólares y una desviación estándar de o : 200 dólares.
a) Si se toma un nivel de conflanza del 97To, Lcuál es el intervalo de confianza para la media
de los ingresos rnensuales de toda la población?;
b) Si se toma un nivel de confianza del g9 %o, el tamaño muestral necesario para
¿cuáI es
estimar la media de ingresos mensuales con un error menor a 30 dólares?
7 Se tomó tlna muestra aleatoria de BB individuos a Ios que se midió el nivel de glucosa en la
sangre, obteniendo una media rnuestral de 110mg/cm3. Se sabe que Ia desviación estándar de
la población es 20 mg/ cm3.
8 La media de edad de los alumnos qne se presentan a las pruebas de acceso a la universidad es
de 18.1 años y la desviación estándar 0.6 años. De los alumnos se elige, aI azar, una muestra de
720"
a) ¿Cuál es lir probabilidad de que la media de edad de la muestra esté comprendida entre
17.95 y 18.25 airos?;
b) ¿Qué tamaño debe tener rrna muestra de dicha población para que su media esté compren-
dida entre 77.9 y 18.3 ahos, con uua conflanza del99.5%'l
9. Una fábrica produce varillas de hierro con Lrüa desr¡iación estándar de 25 cm. La empresa recibe
tin pedido de rrarillas que inclica que la longitud promcdio debe tener Lrna des\/iación máxima de
10 cm de la longitud requerida. ¿Cuántas varillas se tendrán que prodncir para cumplir con la,
especificación, con c¿rsi toda seguridad?
10 Se realizaron 169 mcdiciorres del voltaje de ia recl de alurnbrado púrblico y se registró un promedio
de 108 voltios y desviación estánclar de 5 voitios.
a) ¿Cuáles son los lírnites de confianza, a un nivei del 987o, para el voltaje medio de red dc
alumbrado público?;
b) ¿A qué nivel de confianza puede decirse que la estimación de la media incluye el valor 109
voltios?
2L6 Capítulo 7. Estimación de Parántetros
11. En una región geográfica, la estatura de los individuos varores (en cm) sigue r-rna N (U;7.52).
a) Halle el intervalo de confianza al nivel 92To para estimar ¡.r,, a partir de una mnestra aleatoria
de tamaño 36, cuya estatura promedio es 167.2 crn;
b) Para la rnisma población, determire el tamaño mínimo de la muestra para estimar LL con
un error inferior a !2 cm con un nivel de confianza de| g4%.
a) La estimación puntual que daríamos para el gasto mensual por familia en electricidad en
esa ciudad;
b) ¿Qué número de familias tendríamos que seleccionar aI azar como mínimo para garanti-
zaÍÍros) con una confianza del 96 To, wa estimación de dicho gasto medio con un error
máximo no superior a 3 dólares?
13. La vida activa (en días) de cierto fármaco sigue una distribución A/ (tZOO;402). Se desea enviar
un lote de medicamentos de modo que Ia vida media del lote no sea inferior a 1190 días, con
probabilidad 0.95. Halle el tamaño mínimo del lote.
l4 Se desea conocer el nivel de consumo medio con una determinada tarjeta de crédito con un error
máximo de 15 dólares y un nivel de confranza de 0.97. ¿Cuál debe ser el tamaño mínimo de la
muestra que se debe tomar, si se ha estimado una desviación estándar de 45 dólares?
15 Se sabe que el contenido de fructosa de una variedad de manzana sigue una distribución normal
cuya varianza es conocida teniendo un valor de 0.25. Se desea estimar el valor de la media
poblacional mediante el valor de la media de una muestra, admitiendo un error máximo de 0.18.
con Llna confianza del 95.5 %. ¿Cuál es el tamaño de la muestra?
16 Suponga que se midió la longitud del pie dereciro a 41 estudiantes de su universidad. EI promedio
de todas las mediciones fue de28.4 cm y la desviación estándar fue 5.1 cm.
a) Encuentre un intervalo de confianza al96% para la longitud media del pie derecho de todos
los estudiantes de su universidad;
b) ¿Esperaría usted que alrededor del 96% de todos los estudiantes tengan longitudes de pies
en este intervalo? Explique;
c) Si usted hubiera encontrado un intervalo de confranza al 907o, ¿cómo habrÍa diferido del
intervalo antes obtenido?;
d) Si Ia muestra hubiera constado de 141 estudiantes (los restantes datos se mantienen iguales),
¿cómo habría variado el intervalo de confianza?;
e) Si Ia desviación estándar hubiera sido de 3.7 cm (sin variar los demás datos), ¿cómo se
hubiera visto afectado el intervaio de confi.anza?;
f) Si la media mLrestral hubiera resultado ser de 25.4 cm (sin variar los demás datos), ¿qué
habría sucedido con el intervalo de confianza?
Srrpóngase qLrc se desea estimar la media p para r.rna población cuya varianza o2 es desconocida y que
se dispone de una muestra de n mediciones que siguen una ley normal: rt¡ t2¡ ..., rr..
7.9. Estirnación de Ia tnedia cuando Ia varianza es desconocida 217
Un irrtetvalo cle confianza para la media poblacional ¿r, a un nivel del 100(1 - a)Ta, está. daclo por
Ejemplos
1. La cotización diaria de una moneda frente al dólar sigue una distribución normal de media y
varianza desconocidas. Se eligieron 9 días aI azar, Ia cotización fue:
a) Determine tln intervalo de confianza, al g9 7o, para la cotización media de la citada moneda'
b) ¿Con qué confiabilidad se estima la media en un intervalo cuya longitud es 1.116?
a) trl intelvalo es
1.116
b) Si la longitud del intervalo es 1.116, entonces el en.or.m¿íximo es -E : : 0.558 y como
E : t,"¡2(n - f)*; entonces, sustituyend.o valores:
\/n
0.558 : t,n6)9.
\/9
Si examinamos en la tabla de la ley ú a 8 g.1., verros clue /sos(8) :1.36. De maner.a qnc
a
; : (-).05; por lo tanto, ci:0.1 y I - d:0.9. El nivel de confianza es del 90%.
El tiempo qlle un aparato de televisión perrnanece encendido sigue una ley nolmal. Por meclio
de rtn audímetro se registró este dato en 10 hogares dulante Llna senrana y se calculó el promedio
dialio (en rninutos). Los resultados son los siguientes:
248 r77 110 200 135 i85 224 155 180 166.
a) Deterrnilrar un intet'valo de confialza para el tiempo promedio diario que los hogares rlilarr
. televisión, a un nivel del g5 %;
218 Capítulo 7. Estitnación de Paránreúros
,9ol,ttt:irit¡:
tr) El lrlr>ine<lio v 1¿r rlcsvi¡rc:ión crsl¿ilrcl¿rl son igrrakrs ¿ti - I77.(i v s - 39.92. r'r:spr:irtiviurrorrtci
y si I - ci: : 0.95. /o.o:¡(9) :2.262.
lll irrterr.alo r cclueri<[o (lllcda cc)nro
b) Aquí no se puede aplicar dircct¿rmente la fór'mr-rla del cálculo del tamaño muestral, ya cluÉ
Ios v¿rlores de la lev / r¡arían scgrin el nirmcrr¡ cle grados cl<¡ libertad) pcro el plincipio cs e-
nusnlo.
Se¿ -B : to¡t(n - l+ y como éste debe sel nrcrtol que 20, se tiene to/z(n - yJ¡ < ztt
\/lt Vn
Entonces.
t'o¡2@ - 1)
to¡2(n - I)
Folmemos una tal:>l¿r en la que se tenga los dos miernblos de la desigualdad. El tam¿rñ
míriirno cle la rnuestra es el corlespondiente al nenol valor cle ?¿ para el cr.ral se cunple I
desigrraldrrd.
n 0.51n 1,,12(n - L)
10 1.581 2.262
16 2.000 2.\37
17 2.061 2.r20
18 2.r2L 2.1 10
7.LO. Ejercicios
I. Encuentle ul interv¿rlcr ctc confianza cle nivel (1 - cr) pala la rncclia si
Se d<,.sc¿r estucliar cl girsto scrnan¿rl rlc fotocopiirs, crr clólarcs, clc L.ls eslucli¿:urtcs ulrivelsit¿li
Se eligiti una rnnestr'¿i <lc 9 cstur,litlrrtcs, elegidos ¿l ¿rz¿rr'. r'csrLlt,¿r.rrclo los gastos:
Se srrpouc que la r,¿tliable rrleatoli¿r oll.jeto clc cstuclio siguc rurir clistlibrrciór). rrorlral <tc nrc.,.
dcsc;onocicL¿r,. Detolrnine el interr'¿k¡ clc confi.¿urza clcl 95 % par',r l¿r rneclia clel grusto semauirl
fotocopiirs pol estuclizrnte.
7.70. Ejercicios 2l-9
Err los crrllcrr¿trrriorLtos rlc lrn rrar[¿Lclor sc rrrirk: cl tierLrlr<t <¡re crrrplr:a elr |ecoller los 10() lrrctr os
lilrl<ts tIirr'¿rrrtc sttis <lí¿Ls r:onst)<]1rfl\.()s. S<r ltarr olrtcrriclo los siglrirtrrt,'s ticrrrl>os pr orrcclio rlc cacl¿r
Luro clc los clí¿rs rlt: l¿t sclr;ilr¿r c)lr (fllo rrrrll<)rrri:
¿) Si scr <:rtnsi<icLir clrrt' los 1;icrrrpos sr: clistrilrrLyclr liol'rn¿1lrnrlrrte. etr<rncntre rur interlvalo cle
corrfi¿)nz¿I. <lc ttivcl 91.-) %,. 1>irlrr el ti<:nrpo pt'onrr:clio irlvcltickr:
l,) ¿,Puccle csl)cr'¿r'sc c¡re cl la<l¿rclol leba.jc srr ticrnpo dc 50 s<-.gunclos? ¿,Por qrró?
4 L¿rs tensiotrr:s dc totur'¿r (cu Iip) clc 5 cables cle acelo fuctolt
Suponicndo normalidad para las tcnsioncs, estinre la tcnsión mcdia de lotura rnediante lrn in-
telvaio c1e confianza al nivel 99 %.
5. Se desea estimar ei tiernpo medio de e.jccr-rción de un programa. Para ello sc ejecutó dicho
programa B veces utilizando conjuntos clc datos elegidos aleatoriamentc, obteniéndose que Ia
media mlrcstral y la desviación estándar- rnriestr-al son, r'espectivamente, 230 ms y 14 ms. Obtcnga
un intervalo de confianza aI90% para la rncdia. (Suponga normalidad.)
6 En una entidad de crédito para la rnicroempresa se desea conocer la dcuda media de los clientes
que tienen préstarnos. Los siguientes datos corresponden a la dcuda, en dólares, de 16 clientes
que se seleccionaron de manera aleatoria.
I Al fumigal los ¡rrodr-rctos agr'ícolas existe cl riesgo de qr-re se coloque demasiada canticl¿rcl dc
irgroquínricosi cou cl consignieute riesgo pala el consurniclor. De nl lote se extra.jo una muestra
de 10 tomates y se midió la concentración (cn É¿g/ kg de producto) cle fosfatos qr-re ellos contenían,
resultanclo:
24.9 23.5 26.7 28.2 26.4 23.8 25.r 25.3 27.7 26.6.
a) Determine Lrn intelvalo de confiarrz¿r del 95 To pata la concentlación;
b) Si la concentlación máxiur¿r permiticla es cle 24 LLgl kg, ¿puede esperarse que el lote sea
aceptaclo pirla cl corlslrmo hr,rrrrano'/
8. Elr una f¿ilrrica cle corrselr¡as se micie ias irrrPulczas cn rrn lotc ck:stinado a la exPortaci<in. En
ur1¿l nlnestr¿r do 12 fr¿scos de mernielacl¿r sc obtr-rvo los siguientes polcelta.jes de inrpr-uezrrs:
2.:3 1.9 2.7 2.8 2.3 3.6 1.4 1.8 2.\ 3.2 2.0 1 L
a) Asurnier.rclo c1r.Le las medicioncs están normalrneDte clistlil¡uidas. ertcuerrtle el interr,¿rlo de
confj¿urz¿r ¿tI 95%,:
b) Si cl polceuttr.je rrr¿ixinro c1e inrpulczirs peruriticlo pzt,r'zi la r:xpor-taciórr es c.le 1.5%, ¿.sc,rccp-
tar¿i cl lote par a scl (lxpolt¿rclo/
9. El r,ic'rnpo cLe virl¿r cn c;¿rrtivelio de B cspecímenc.s cle urr tipo clc insec;to fue cle 228 hot'zrs, con
uu¿ des\¡i¿l(:ión est¿ir.cl¿l cle 7 holas.
220 Capítulo 7. Estimación de Parántetros
10 IJrra máqr-rirra ploduce artír:ulos cuya dirnensión se corrtrclla rnediante Ia torna de unrr rruestr¿.1
aieatori¿r. Un clía se obtuvieron las sigrrientcs rnediciou<:s:
:3.7 3.4 3.5 3.5 3.4 3.7 3.9 3.7 3.5 3.7 3.8.
11 Los siguientes son los tiempos, rnedidos en días laborables, que demoraron 16 trámites de jubi-
lación en cl IESS, elegidos al azar:
DÍas
159 280 362 222 264 224 101 2t2
t70 485 250 379 779 168 260 149
a) Bajo Ia suposición de que los tiempos se distribuyen nolmalmente, detelmine urr intervalo
de confianza ai 9970 para el tiempo medio de nn trámite de jubilación;
b) El director del Instituto ha indicado que ios trámites no se demoran más de 180 días. ¿Es
razonable suponer que e1 tiempo meclio verdadero es mayol que lo indicado por cl director'/
12 La siguiente lista contiene la longitud (rrúrmero de letras en las pala)rras) para rrna muestra clc
26 palabras del libro Rayuela cle Julio Cortáz¿r
102 3 7 2E 4821752
54 '¿12294252347
a) Calcule el promedio y la clesviación cstándar cle l¿r longitud de las palabras;
b) Constmya un interr'¿lo cle confianza al 99 % para Ia longitud rnedia de las palabras el
Rayueltr;
c) Si el tamairo muestral fuera mayor' (v el prorneclio y Ia desviación estándar fueran los
mismos), ¿,cómo cambi¿r,rí¿r el interv¿rlo cle confianza?;
d) Si el prornedio fuera mayor (rnanteniéndose el tam¿rño muestral y la desviación estándar).
¿cómo cambiar'ía el intervalo de confianza?;
e) Un intcrv¿rlo de confianz¿ al g5 % cs (3.655; 6.037). ¿Qué proporción de las 26 palabras de la
muestra están dentro clcl intelvalo? ¿,Su lesPuesta scrá siempre ccrc¿ln¿l aI 95%il Explique.
Un intctvalo de confianz¿ par:¿r i¿r valianza polrlirciorrirl 02, ,r ,1lr rrivcl del 100(1 - cl) %, cstri dado
por
( (rr - I ).'2 (rr - 1)s2 \
\ñ,(,,-Df"d-D)
7.77. Estimación de Ia varianza (distribución norrnal) 22t
T s2 es la varianza muestlal.
\?
\j,o/z^,"(n - 1) es el valor, de la clistribución X2 a (, - 1) grados cle libertacl) para el cual el área
en el cxrlemo inlerior os igual a
].
X,-o,,
z,_o,, Latz
Ejemplos
1. Hallar un intervalo de confianza para la varianza poblacional, al 90 Yo, para una muestra de
tamaño n : 10, si s2 : 196.
si 1-cv:0.9, a:0.1,
]:o.osy 1- |-o.os. Los valoles d" x8o¡ y
Sol,ución: entonces
Xfr n, correspondientes a n - 1.: 9 g.1. son
El intervalo de confianza es
( (n_ t)s2 (n_ r)s2 \ /9x196 9x196\
:
\q,¡" - tl';-ql" 1) ) \ reoro' n% )
: Q0a.26; b30.b3).
2. IJn hombre de negocios está interesado en invertir en un instrumento que piensa le puede dar
altos rendimientos. lrlo obstante, sabe que, en general, a mayor rendimiento se tiene mayor riesgo.
Al considerar instrumentos sirnilares se observaron los siguientes rendimientos porcentuales, que
suponemos siguen una ley normal:
7.t2. Ejercicicrs
1. Halle un intervalo cle confi.anza al 90 To si s'2 :225 para los siguientes tamaños de muestra:
116 105 t2r 119 110 105 108 t02 107 t02 104 116.
Detclminc los intcrvalos clc confi.abilidad dcl 90 "/c y cleI95%: para o2.
3. En los rn¿rrrualcs de fábric¿r cle un ¿lpar'¿rto pala cleterrninar- el rrivel de alcohol cn la strugle.
sc irrdica que las niediciones tienen una clcsviaciórr estándal de 5 ulidacles. Pala p-t-obar est¿L
afilruación, cn la oficina de normas se reaiizarol mediciones clcl contenido de alcoiroi en Ia szrn¡¡rc I
LL
83 75 92 79 60 85 92 77 76. i
Basándosc crt LlD ilrtervalo cle confi¿rrrza dc 95 %, cleterminc si Ia afirrnación <lel fabricarrte
cs cortecta.
4. Sc ¿rnlizó Llr)¿t nlalca c1e rnirrgarin¿r rlietótic¿r pzrlir dcterminar el nivei cle acic,los gl'¿l,sos ltolisatr-r-
raclos (en lrorcenta.jc). Un¿,r ntuestr'¿t de scis paquel;cs ltrovcyó ltr siguientc informa<rirln.
a) el intcrr'¿rlo clc confianza para cl contenido medio de glasa. con rln nirrcl del g9 %;
b) r:l irrtelr'¿rlo clc <;onfianz¿r par'¿r I¿r vaLi¿rrrza del conteniclo dc g1 ¿lsa, corr Lrn nivr:l del 95%.
5. En nrra mncstra alc¿rtoria cle 15 cuentas bancarias que realizaron depósitos la úrltirna serrralta sc
encontró que la desviación estándar era de 73.6 dólares. Se supone que los depósitos siguen una
ley normal. Estime Ia varianza y la desviación estándar de los depósitos mediante un intervalo
de confianza al g5To.
7.72. Ejercicios 223
Ir Urr httrribre clc nr:gor:ios está, intercs¿rdo crr ilrutil err bcnos cle un pirís lrrtinorrrnclicauo, qrrc
lticttszr lc ¡rueclcu <l¿u altos t'euclinientos. No obstiurte, s¿1be ouo. en gcuerzrl, a nr¿yor rcnclirnicnto
se tietrcr IIl¿1yot lictsgo. AI cotrsiclctal ptrpcles similarr:s sc obsel'r'alorr los sigrricrit,cs lcndirnicntos
( ')/,t):
9.7 21,5 17.0 16.9 13.4 20.7 24.6 15.8.
7. El conteniclo cn nicotin¿i de los cigarlillos de un¿l nralc¿) dcterrnirrada sigue uua distriliuciórr
N (U;"2). Sc tornó urta mucstr:a cle 5 cigarrillos, obteniéndose en cst¿r muestra un cc¡ntenir-lo
medio de 27.2 rng y varianza rmestral 4.2025. Obtenga:
8. Se desea ptobar ttn nnevo método de embalaje de rnercaderÍas, para Io cual se registra el tiempo
(en segtindos) quc un misrno tlaba.jador emplea err realizar la tarea:
Procedimiento Procedimiento
tradicional alternativo
31 36
36 32
34 30
27 26
40 ÓO
4,f 4I
AA
28
30 33
,t
Jt)
Si el tiempo empleado es similal en los dos casos, entonces se decidirá emplear aquel método
qtre presente la menol r'¿rliación. Mediante un intervalo de confianza a). 9570, ¡,cu.ál de los dos
métoclos escogcrÍa, el traclicional o el alternativo?
93 90 97 90 93 91 96 94 91 88
93 95 91 89 92 87 88 90 86 91
Strponiendo que la dnlación sigue una distribución noLmal, hallar los intervalos de confianza aI
90 % para la rnecii¿r y Ia r.arianza.
Etr el enib¿rlajc dc fi'rtta pala ltr cxporttrción es importante conocer Ia variabilidaci del caliJ¡re
cle la fruta (que es el cliárnetro máxirno de Ia fmta). Una fruta con Lrn calibre bajo se cotiza
a l:a.jo prercio y una con calible alto da ploblemas en el embalaje. Las siguientes mediciones
corlesponderr ¿rl calibr-c plorncclio (en cm) de los rnclones contenidos en 113 ca,jas:
a) Determine los intervalos de confianza, al g0To, para la media y la varianza del calibre;
224 Capítulo 7. Estirnación de Parárnetros
b) Si el calibre promedio es nlenor que 20 crn o mayor que 21.5 cm, o si Iavatianza es mayor o
igual a 3, se recomienda el cambio de Ia variedad de melón. ¿Cree tisted que será necesario
hacer tal cambio? ¿Por qué'/
l1 Una ernpresa de venta de cosméticos está interesada en introducir una nueva línea de artículos.
para ello se examina Ia ganancia (en dólares) que le dejarían cada uno de los productos:
23 38 15 7 t2 10 10 11 18 13 9 10
Strponga que se dispone de una muestra rt¡ 12, ..., rrr., de n observaciones que siguen una ley de
Bernoulli, cuyo parámetro p (la proporciórr poblacional) deseamos estimar.
Un intervalo de confianza aproximado para la proporción7t, a un nivel de 100(1 - a)% viene dado
por
Donde:
,n
. p:- 9 , siendo y : D r¿ el núrmero de éxitos en las n pruebas.
TL i.:1
' za/2 el valor z que corresponde a,l área 9 en el extremo superior de la distribución normal
2
estándar.
EI tamaño de la muestra necesaria para tener Lrn error -8, a un nivel de confianza (1 - a) es
n: Qo/)'0Q - A)
E2
Observación. Si no se conoce de antemano una estirnación de p como sucede cuando se realiza una
investigación por primeravez , se toma fr:0.5, porque este valol permite obtener el tamaño máximo
de rnuestra.
7.73. Estimación de Ia proporción (distribución binomial) 225
Ejemplos
1. Cott cl ob.jcto rle estirrra,t'la Jrroporción clc televiderrtes qr-re han visto el anuncio de un proclucto,
se enl,rcvistó ¿ 400 tek:spectacloles y result,ri que 344 de ellos lo habíarr visto.
a) Ertcuentrc un intcrvalo de c:onfianza clc g7'% para la proporción de todos los espectadores
que harr visto la ltublicidacl r.[el producto;
b) Obtenga el tanraño cle rrnrestra indispensable para que cl intervalo del inciso a) terr.ga una
Iongitud máxima cle 67a corr la misrna confianza.
a) El intervalo de confi.anza es
/
- z"rz
\n
(0.86)(0.14)
(o ;0.86 * : (0.8306; 0.8894).
400
'u
b) Si la longitr rd del intervalo es 6 %, quiere esdecir,E:0.03.
El ta mari.o le la rrmestra
< es
'F2
("n/.¿)'2 fr(t - i) (r.695)2(0.86)(0.r4) .){, ?(
_ roa'rJU'
- (ob¡z- -
Habr'á qr-rer consuJ.t¿r a 385 tcle','id<tutes.
2. En un¿r encuesta piloto, plevitr 1>ara la lcaliz¿rción cle la encnesta clcfinitiva) se encontró que el
630ñ, de lir población (ircle que el plirrcipal problerna clel país cs la colrupción. La ficha técnica
de la cncuesta definitiva indica c¡re ci sonclco tendrá un 97 % de confi¿rlrilidad y el error estimado
clel 4(%. A cuántos cirrcladanos se debelá cousultar si:
r¿: @¿#f:@*áffi@
(2.i7)2(0 63) (0.37)
: 686.
0.0016
La eucnesta deberá ser realiz¿da a Lrrr mínirno de 686 personas.
b) Como no se tiene iriforrnaci<irt previa soble p, se toma 0: 0.5 y el cálculo del tarnaño queda:
r: @ü#r:e%l&i#e
: 7:35.77 .
Sin urr conocirnieuto previo de Ia proporción, se deberá muestrear al menos a 736 pelsonas.
::i el Cu¿rdto 7.7 se encnentra un resLrilren de los intervalos de confianza de una muestra analizados
-- este capítulo.
226 Capítulo 7. Estimación de Parántetros
Distribución
proporcron p f! rulz F0-Í)
binomiai
7 "L4" Ejencicios
1. Determine Ios intervalos de confianza para la proporción, de una muestra de tamaño 200 en la
cual se han obtenido 150 éxitos, según los siguientes niveles:
2. En esta pregunta no realice cálculos, responda mediante una frase que explique su razonamiento
J. llna muestra realizada a los clientes de un supermercado dio que 120 de 300 clientes usan
regularmente tarjeta de crédito o cheques para sus compras. Encuentre un intervalo de confi.anza
aI 98% para el porcentaje de personas qlre usan efectivo en sus cornpras.
4 Un partido político que concurre a las elecciones mr-rnicipales en la ciudad quiere encargar una
encuesta para estimar su porcentaje de votación mediante un intervalo de la forma P +1.5%.
cuyo nivel de confianza sea 95 %. ¿Qué tamaño muestral debe utilizarse en la encuesta para
alcanzar aproximadamente este objetivo, sabiendo que en una muestra piloto el porcentaje de
votación estimado fue del 75%?
7.74. Ejercicios 227
5. La efectividad cle tut trtcclic¿tnrcrrto oorrlla cl dolor dc cabez¿ se examirra deterrninando si éste
elirnin¿ o tro r:l síntonra. St: arlrrriuistr'<i <r1 mcclic¿rurerito a 225 pacientes voluntarios, de los ctLaies
en 170 c¿rnsó el efr:cto rlr-'sc¿rclo. El rrrcclic¿Lr¡ento se trr:epta l)ara, su u,<jo general si ticnc uu¿r
efectividad en al menos cl 80 % clc los c¿rsori.
a) Basándose en Ltn intervalo de confianza c-lel 98 %, ¡.puede recomendarse el uso dei meclica-
mento'/;
b) Sin variar la propolción estimacla, ¿.qr-ré tan grande deberá ser Llna muestra si se clesea tener
una confianza del 96(% de que el error máximo de estimación es 0.05?
6. Segúrrrrtn estudio sobre los niños que padecen clolor de pecho, realizado por Selbst, Ruddy y
Clark (Cli,nical Ped'iatrics,1990), se encontló que de 137 niños que tenían dolor de pecho, 100
daban radiografías de tórax normales.
a) Obtenga un intervalo de confianza del 957a pata la proporción p de niños con dolor de
pecho que dieron radiografías normales;
b) Halle el mínimo tamaño muestral para que el error cometido en la estimación de p sea
inferior a 0.07, al nivel de g5%.
7. En una población, nadie es indiferente respecto a la iniciativa propuesta por el alcalde de construir
un nuevo parque en el norte de la ciudad. Cada habitante adulto o bien está a favor, o bien en
contra de la iniciativa. Se desea conocer el porcentaj" (P) de las personas que están en contra.
Entre 250 habitantes adultos elegidos al azar,75 afi.rmaron que estaban en contra (v los 175
restantes a favor).
S. En una línea de control de calidad en un día se examinan 250 piezas de un lote, de las cuales 25
tienen algún tipo de defecto.
9. Para la introducción al mercado de una nue\¡a variedad de semilla de naíz la empresa productora
estima que deben germinar al menos eI 73u/o de1 total de semillas sembradas. En una prueba de
laboratorio se sembraron 745 semillas, de 1as cuales germinaron 518. Con base en un intervalo
de confianza de nivel igual a1 97T0, [,poclrá la empresa introducir al melcado la nueva variedad?
-0. Err un sondeo sobre la preferencia deportiva de la población masculina ecuatoriana, realizada a
1000 personas, se determinó que eI 72% de 1os encuestados gustaba ver regularmente partidos
de fútbol por televisión. Con una seguridad del g5 a/o, ¿se puede decir que los resultados son
iguales, con Lrn margen de más o menos 3 puntos porcentuales, a los que se habrían obtenido si
se hubiera consultado la opinión de la población masculina completa?
:1. Una noticia de prensa dice que, de 1200 persorras encnestadas sobre la conveniencia de hacer
reformas a la ley de tránsito, 756 se muestr¿u a favor y 444en contra, y concluye afirmando que
eI 63% de la población se mltestra a favor, con un rnargen de error de t3 %. ¿Cuál es el nivel
de confianza de esta afirrnación?
228 Capítulo 7. Estirnación de Parámetros
72. En ttna errtlevista realiz¿rc.la a 130 rnujercs casadas, 113 de ellas indicaron qlle habÍan sido r.íctirnas
clc zrlgrin tilto de agresi<in ltor parte de su cónyuge.
a) Asumieudo qtle estas nnrjeles form¿:ur una nnrestra aleatoria, calcule r,rn intelvalo r-le con-
fi.anza de nivel 95% para la proporción de las mujeres casadas que han sicio agrediclas;
r) Si se hubiera consultado a 520 mujercs, ¿.cree usted qrre el intervalo hubiera sido rn¿is ancho,
más estrecho o de igual ancho? Explique y no realice cálculos;
c) ¿El intervalo hubiera sido más ancho) más estrecho o de igual ancho si 73 de las 130 mujeres
hubieran respondido afir'mativamente? Explique;
d) Realice una interprctación del intervaio.
13. Se desea estimar la proporción de estudiantes universitarios a favor de sustituir el actual himno
nacional por otra canción.
a) Para estimar esta proporción con una precisión de 0.10 a un nivel de confianza del 92Vo,
¿a cuántos estudiantes se necesitará preguntar? (Para determinar el tamaño de mnestra
necesario, fije su propia proporciórr rnuestral, identificándola claramente.)
Para responder las siguientes preguntas, usted no necesita realizar cálculos. Explique sus
respuestas.
b) Si se deseara estimar la proporción con nna precisión del 0.05, a un nivel del 92 To, ¿es
necesario muestrear a más o menos estudiantes que en a)?;
c) Si se cleseala estirnar Ia proporción con una precisión del 0.02, a un nivel del 95 To, ¿,es
necesalio muestrcar ¿r m¿is o trtenos cstudiantes que en a)?
Un intervalo de conhan za par a la diferencia de medias poblacionales ¡r, - F2, d un nivel del 100(1-
a)To, está dado por
I
| (zr - rz) - t../z(nt -t nz - 2) @t - rz) + /z(nt t nz - r
lE=-;
t
\
*
rE=-)
^r_(ra-t)"?+(n2-r)sl
U+n2-2
Donde g : + slln2)2
('?1",
("?1",)' , G3/"r)'
u-L - nr-r
Ejemplos
1. Se pretende comparar la duración de dos marcas de pilas alcalinas. Para ello se escogieron dos
muestras de cinco piias cada una. Los datos se presentan a continuación.
Marca A 100 96 92 96 92
Marca B 76 80 75 84 82
Si suponemos que las varianzas poblacionales son o2A: II y q2B :15, determine, basándose en
un intervalo de confianza de nivel g5 %, si las dos marcas de pilas tienen igual duración.
Soluctón: Se tiene que
nl :5, r1 :95.2; o?: l!,
TL2: 5, rZ :79.4; 03: 15.
Entonces,
(,r,-,
- - zat2U
la* o" \r,'- - rz) - ,"/r\,1@:¿
\,,,
"'2) ; ó, ;' _ ):
: (11.33; 20.27).
Si las dos medias fueran estadÍsticamente iguales, su diferencia sería igual a cero. Como cero no
se encuentra en el intervalo de confianza, podemos afirmal que las dos marcas no tienen igual
durabilidad.
230 Capítulo 7. Estimación de Parántetros
2. Lhr irgr:nir:r'o desea cletelrnin¿rl si los automrj.¡lles a,nrcric¿rrros ), los japorreses tienen igual consrrmcr
rl<¡cor¡irrstible. Par'¿relloescogíoliir¿trnrrest,r¿rcle10c¿r.r'rosarnclicarros), 12,jaPc¡rresesrlesinril¿rlr.:s
c¿rr'¿,rcterísticas y rnidió cl cc¡risurrro por 100 hrn cle recolrickr, con los siguicirtcs r-csult¿rclos:
Estinrar, mediante un intelvalo de confianza a,l 95'%,).a cliferencia eirtle las clos rnedias de con-
sllrllo. ¿,Se puede decir el conslrilro de cornbustible no depende del oligen clel ¿ruto?
SoLucióu. Supondremos que las poblaciores son norrnales con varianzas desconocidas, supuestas
iguales. Además, se tienen los siguientes resultados:
El estimador de la vananza es
2
5:
(n1 -1)sl +(n2-I)s2; (10 - r)2.216 + (t2 - 1)0.87e : 1.481.
n1 +n2-2 10+12-2
Entonces, el intervalo es
rz) tn/z(nt + nz -
(,', - - 2)
1.4811.481
(,t.uu - 6.04) - ts s25(20) *
,o i, (7.86 - 6.04) + úo.ozs(20)
Suponga que disponemos de dos muestras independientes de tamaños TLt y n2. seleccionadas de dos
poblaciones que siguen leyes normales con varianzas o? y o3, respectivarnente. Deseamos construir
un intervalo de confia\zapata la razén de las dos varianzas.
o?
Un intervalo de confianza para la razón de las varianzas poblacionales i,oi aun nivel del 100(1-c)%,
está dado por
4,,, 4-otz
Figura 7.5:Localización de los valores de la ley F en el intervalo de confianza para larazón entre dos
rrarianzas.
Ejemplo. LIn inversionista quiere comparar, en términos de las varianzas, los rendimientos de las
acciones de dos compañías del sector servicios. Calculó los rendimientos mensuales del último semestre
de las dos compañías, como se muestra a continuación.
Con el empleo de un intervalo de confi.anza de nivel 95To para las varianzas, determine si los rendimien-
tos tienen igual variabilidad.
EI intervalo queda:
/^2 \
(?rFr-*p(n¡ "?
- r,nz - r); 3F-tr@, - t,n2- 1) ) :
\si si /
(3#"-' ozs(5, 5);
.iz8q!ryFo
oru(5, 5)) : (0'433; 22'082)'
Si las varianzas son iguales, su cociente es igual a uno. En este caso, el valor 1 se encuentra dentro
iel intervalo; por tanto, las varianzas de los rendimientos de las dos compañías son iguales.
Sean f1 y f2 Ias proporciones de éxitos de dos muestras aleatorias independientes, de tamaños rLr y n2,
:rovenientes de dos poblaciones de Bernoulli, Ber(p1) y Ber(p2), respectivamente. Ahora, deseamos
-timar, mediante un intervalo, la diferencia de esas proporciones poblacionales.
:--n intervalo de confi,anza aproximadc-r para la diferencia de proporciones pr a \rr
l-r:
- p21
-00(1 - a)To viene dado por
l,,rnde 0r : 1 -ñ y lz : I _ fz.
Ejemplo. Un fabricante cree que su marca de yogurt es más preferida en la Sierra que en la Costa.
?ara probar su sospecha escogío dos muestras aleatorias de 500 consumidores en la Costa y 300 en
232 Capítulo 7. Estirnación de Parárnetros
la Sierra. Las muestras revelaron que 210 consurnidores en la Sierra y 320 en la Costa consumen su
producto. De acuerdo a un intervalo de confianza al 98T0, ¿se puede inferir que el fabricante tiene
razón?
ComoceroestádentrodeIintervalo'noSepuedeafirmarquelasospechadelfabricanteseacierta.<
En el Cuadrc 7.2 se encuentra un resumen de los intervalos de confianza de dos muestras analizados
en este capítulo.
Parámetro Intervalo
Distribución oi o3
general
o7 y o2 conocidas (rt - rz) t 2,,
/2 r\ n2
Distribución or y o2 desconocidas sZ
normal supuestas iguales
(t t - iz) tt o/2,(ntrn2-2)l * 'lL2
I'O
Distribución ot y 02 desconocidas (¡t-r)It,,/2,nrl! .9Í
normal distintas Ft- Pz '" nt r2
V t¿2
A lo largo de este capítulo la idea de que los intervalos estaclísticos reflejan la in-
se ha enfatizado
cer-tidumbre debida a la variabilidad de los datos, pero en la mayoría de casos prácticos, a más de
que las hipótesis básicas sobre la muestra (como aleatoriedad, independcncia y normalidad) son vio-
1adas, influyen otros factoles cuya magrritud es incuantifi.cable, por ejemplo, el comportamiento de las
personas y los equipos, el medio ambiente, etc.
Entonces, en la correcta interpretación de los intervalos estadísticos habrá qlle tomar en cuenta que
ellos no leflejan la incertidumbre total presente en las rnediciones y solo proveer wa cota'inferior de
la verdadera incertidumbre; por lo tanto, son una cruda aproximación a Ia realidad.
t
7.76. Ejercicios 233
7.16. Ejercicios
1. El gercrrte de una empresa quc tiene dos locales de ferretería cree c¡re las venlas en el local del
norte son mayores que en el Iocal del sur. Para verificarlo, tomó una muestra de 200 factur¿rs
en el local del sur v 250 facturas del local del norte, resultando un promedio de 13 y 15 ciólares
y desviaciones estándar de 3 y 4 dólares, r'espectivamente. Mediante un intervalo de confianza
de rrivel 95To, ¿,se puede concluir que e1 gerente tiene razón?
2 Una organización de defensa de los derechos civiles afirma que en la industria de Ia construcción
el salario r4edio semanal de los hombres supera en 13 dólares al de las mu.jeres. Una muestra
aleatoria de 20 hombres y otra de 25 mujeres reveló promedios de 110 y 100 dólares, respecti-
vamente. Si Ias dos poblaciones de salarios son normales con varianzas de 100 y 64, mediante
un intervalo de confiarrza para la diferencia de medias, de nivel 98 %, ¿se puede decir que la
afi.rmación es cierta?
Se cree que el precio de arriendo de las casas es mayor en Cuenca que en Ambato. Estudios
anteriores revelan que las dos poblaciones de arriendos tienen distribución normal con varianza
homogénea. Dos muestras aleatorias de tamaño 16 revelaron lo siguiente: z1 : 138, sr : 6 y
Tz:135, s2:4. Con el empleo de un intervalo de confianza al 957o, ¿se puede concluir que Ia
suposición es correcta?
4 Un inversionista hizo un estudio para determinar en qué ciudad, Manta o Loja, podría abrir un
supermercado. En una muestr a de 2I hogares de la ciudad de Manta halló un ingreso promedio
de 500 dólares y una desviacióri estándar de 120 dólares. En otra muestra de 16 hogares de Ia
ciudad de Loja halló un ingreso promedio de 480 dólares y desviación estándar de 60 dólares.
Suponiendo poblaciones normales con varianzas diferentes y con el empleo de un intervalo clc
nivel 957o, ¿en cuál de Ias ciudades le conviene abrir el supermercado?
El dueño de dos restaurantes que verrde pollo a la brasa quiere dcterminar si sus dos locales
venden Ia misma cantidad de pollos diarios. Dos muestras de las ventas de 12 días dieron los
siguientes números de pollos vendidos:
Local A 12 17 I4 1B I 10 20 l5 72 1ti B 74
Local B 72 L4 13 11 12 15 21 l4 13 14 22 15
Además, Ias muestras revelaron que las dos poblaciones de muestras son normales con valianzas
diferentes.¿Se puede inferir que en los dos locales las ventas diarias de pollos son Ias misrnas?
Una manera de comparar el riesgo de dos inversiones es a través de sus varianzas. Para una
itrversión en Ia industria electrónica se tomó una muestra de 10 datos y resultó una desvi¿ción
estándar de 52. Para una inversión en la industria siderúrgica se tomó una muestra de 15 datos
y resultó ttna desviación estándar de 31. Si se asume que cada una de las invcrsiones sigucn
leyes normales, ¿cuál es su conclusión si utiliza un intervalo de confianza al 90% para la razón
de varianzas?
IJn investigador sospecha que los hombres y las mujeres difieren significativamente en ticmpcr
diario de utilización del teléfono. Entrevista a 25 sujetos de cada sexo obteniendo ios siguientes
resrrlt ados:
Mujeres: :38; or:6,
Ffornbres: : 31; 02:5.
Utilice un nivel de confianza del g5 7o para:
a) construir un intervalo para larazón entre las varianzas. ¿Se puede decir que son
234 Capítulo 7. Dstimación de Parámtetros
El ctrtrclaclol clc rtu cqrLipo cle fiitbol quietc (jor]'lp¿rar l¡i r:fcctir,'icl¿rri cle srrs.jrrgaciolcs al c<tlrlar'
trn tiro pena1. En los cntrenarnicntos, Ios jr-rgaclores n:rcrionalcs, clc 120 tilos intcnta<ftrs, accrta,r'on
91, tnientras que krs extlaqjelos rle 90 tiros lea,lizados, accltaiolt 78. N,Icdiant.: rrn iutelvakr de
corrfiauza de nivel 90 %, ¿se puede infcrir que rro hay diferencia cntle los jrrga<lores ritrciorrirlcs 1'
extran jeros a,l col¡rar un tiro penal'?
I En lur estudio epidemiológico, se tonró una rnuestra alcatoria de 300 hombres y 27 de ellos
padecicron o padecen Llna determinada varied¿rd de gripe. Tambión, se tornó una rnlrestr:a de
400 rnujeres y a 32 les oculría lo misrno. A la vista dc cstos datos, ¿se pucde consideral que estc
tipo de gripe afecta a hornbres y mujeles por igual? (Usc 1 - cl : 0.96)
10. Se quiere comprobal la efectividad de una vacuna contra una enfermedad y para ello, tras
contagiar a 200 animales, se Ia suministra a 100 y se compara con otros 100, a los cuales no se les
suministró. De entre los vacunados, mueren 8 a causa de la enfermedad y de los no vacurrados
20. A un nivel de confiabilidad del 93%o, ¿podemos decir que la vacuna es eficaz pala reducir la
tasa de mortalidad?
I
4
a
C*pstulo I
Pruebas de Hipótesis
En el capítulo anterior se vio que se puede realizar inferencias acerca de un parámetro poblacional
estimando su valor, ya sea de manera puntual o como un intervalo de confianza. Pero en muchas
ocasiones no interesa conocer o tener una idea dcl valor del parámetro, sino comprobar (o rechazar)
una afirrnación sobre el valor que tiene el parámetro, sin ímportar la longitud o la localización del
intervalo.
Suporrgamos que un investigador desea probar que actualmente, el ingreso mensual de los ecuatorianos
es mayor que el ingreso que tenían 5 años atrás. Par-a verificarlo, recolecta los datos mediante una
muestra tomada al azar. El investigador podría desear cornprobar la hipótesis de que el aumento del
ingreso es rnayor que un cierto valor prefijado. Un intervalo de confianza de la variación media del
ingreso proporcionará menor información que una prueba de hipótesis sobre la variación del ingreso.
Las hipótesis son, en general, afirmaciones sobre los parámetros poblacionales, como 1a media y la
tarianza; así, se pudiera desear probar que el ingreso medio actual no es diferente de aquel que los
ecuatorianos tenían hace 5 años. Una hipótesis también puede ser una afirmación sobre la distribución
de una característica de interés; por ejemplo, que el ingreso mensual sigue una distribución normal.
La teoría de las pruebas de hipótesis sobre parámetros poblaciont.:.les fue desarrollada en los primeros
años del siglo XX y sistematizada por R. A. Fisher, E. S. Pearson y J. Ncyman. Éstos últimos la
formalizaron e introdujeron el vocabulario actua,lmentc en uso) en una publicación realizada en 1933.
-\quí se expondrán los casos de mayor uso e importancia.
Para probar una hipótesis estadística es necesario tcner en cuenta cicrtos elementos que conducirán
a aceptar o rechazar la hipótesis planteada, de manera correcta. Ello 1o ilustraremos con el e.jemplo
anterior.
El investigador cree qLle) en condiciones normales, el aumento dcl ingreso medio d debe ser menor que
un nivel prefijado do :60 dólares. y decide probar esta afirmación; pero en el curso de Ja investigación
235
236 Capítulo 8. Pruebas de Hipótesis
se podríaconclllir que Ia variación del ingreso es mayor que 60 dólares. Para tornal cnalquier dr¡cisión
es necesario que el investigador compare cori Lrn valor que le informe de la validez o irn'alidez de su
liipótesis.
En la terminología de las pruebas de hipótesis, aquelLa que especifica un valor particuJ.ar del par'ámetlo
que se estudia se llama hzpóteszs nula, que se representa por 11g. trsta hipótesis, usualmente, corres-
ponde al procedimiento de operación normal de un sistema de especificaciones corrocidas. En el
ejemplo, d < 60 es la hipótesis nula, pues representa Io que debería suceder cuando ha habido un
incremento del ingreso, en condiciones normales; o sea) Hg: 0 < 60.
La hipótesis que especifica aquellos valores de1 parámetro que representan un cambio importante del
procedimiento normal o de las especificaciones conocidas, se llama hipótesis alternatiua y se repre-
senta por 111 . En el ejemplo los valores mayores que 60 indicarían un comportamiento anómalo o
extraordinario; así, la hipótesis aiternativa es -111: e > 60.
La cantidad, calculada a partir de la muestra, que permite decidir si la hipótesis nula será o no
será rechazada se denomina estadíst'ico de p'rueba. La distribución de probabilidad del mencionado
estadístico debe ser conocida para poder realizar Ia prueba.
EI conjunto de valores del estadÍstico de prueba que conduce al rechazo de la hipótesis nula, en favor de
la hipótesis alternativa, se llama regi,ón de recl¿azo o región crítica de la prueba. La dec,istón consiste
en rechazar la hipótesis nula en favor de la alternativa si el valor del estadístico de prueba cae en la
región de rechazo; caso contrario no se descarta fIs.
EstadÍstico de prueba.
4 Región de rechazo.
5. Decisión.
Al tomar una decisión sc puede cometel dos tipos de errores: rechazar Ia hipótesis nula cuanclo es
verdadela, lo que se llama error de tipo I; o bien, no rechazar la hipótesis nula cuando en realidad es
falsa, lo que se denomina error de tipo II. Ello se resllme en el siguiente cuadro:
Hipótesis Nula
Decisión Verdadera Falsa
Rechazar É1¡ I
Error tipo Decisióu col-recta
No rechazar 116 Decisión correcta Error tipo II
1. La probabilidad de cometer Lln error de tipo I se denota poÍ a y se fija al escoger la región de
rech¿lzo. Este valor se denomina niueL de s'iqnzficación de la prueba estaclística:
2. El niuel de signifi.ca,ci,ón obseruado o p-valor', es el mínimo valor del nivel cle significación para
el cual los datos observados irrdican que Ia hipótesis nula debe ser rechazada.
Este valor se utiliza cuando se trabaja con paquctes computacionales para detelrninar si se
rechaza Hs. La regla es la siguiente:
Si el valor de p ( a, entonces se rechaza 116. Caso contrario, no se rechaza (se acepta).
Para un tamaño de muestra frjo, al aumentar la región de rechazo (y por lo tanto a), B disminuye.
¡s de pruebas de hipótesis
Definición (de prueba estadística unilateral) Una prueba estadística urrilateral es aquella en
Ia que la región de rechazo se localiza solamerrte en un extrerno cle la distribución de probabilidad
del estadístico de prueba.
Para detectar si 0 I 0o la región de rechazo se sitúra err el extrerno superior de la distribución del
estimador d (Figura 8_.2). Para detectar si d ) d6 la región de rechazo se sitúa en el extremo inferior
de la distribución de d.
eo 0o+C
Acentar Hn I Rechazar Hn
Definición (de prueba estadística bilateral) Una prueba estadística bilateral es aquella que
sitúa la región de rechazo en ambos extremos de la distribución de probabilidad del estadístico de
prueba.
Las pruebas bilaterales se utilizan para detectar 0 < d6 o bien 0 > 0ol es decir, 0l0o (Figura 8.3).
Uno de los casos más comunes en la realización de pruebas de hipótesis es hacerla sobre el valor de
la media poblacional, cuando se dispone de una muestra de dicha población. El parámetro 0 que se
desea probar es LL y el estimador d es la media muestral 7.
A continuación se exponen -de manera sucinta-, las pruebas estadísticas, bilateral y unilaterales,
cuando deseamos probar que el valor de la media poblacional ¡l es igual a un valor prefijado ¡-r,s.
Ejemplo. IJna empresa farrnacéutic¿ ha estat¡lecido qlre un compriniido dcbc tcncr Ltn peso
nredio igual a lo:0.5g y una desviación estándar de o:0.11g. Se tomó una muestradeT44
comprimidos de un lote de fármacos, cuyo peso promedio fue de Z:0.53g.
a) Para un nivel de significación de 0.01, ¿,el peso de los comprimidos en e1 lote se diferencia
del admisible por Ia empresa'/;
b) Determinar el p-valor de la prueba.
Solucdón:
4.
"l\ñ,' zo6"
Regi,ón de Rechazo. Zobs > zo (obien { -zat cuando HI F < ttd.
Ejemplo. Si en el ejemplo anterior, el peso máximo admisible para que el medicamento no sea
tóxico es igual'd LLo:0.52g.
a) Se desea saber si los comprimidos del lote son aptos para el consumo humano, a un nivel
de significación del 5 %;
b) Determinar el nivel de significación de la prueba.
Solución:
a) Los datos son los mismos que antes se usaron, solo debiéndose cambiar las hipótesis.
24O Capítulo 8. Pruebas de Hipótesis
Errtonces, por el Teorema del Límite Central, la variable 7 : !-4 sigue una Iey normal estándar.
ol\/n
Ejemplo. En el ejemplo anterior, calcular Ia potencia de Ia prueba si el verdadero valor de la media
es 0.54 mg.
Solución: Veamos qué signiflca <<aceptar -É16>> en términos de los valores que puede tomar el promedio,
r.
Aceptamos Hs si+ < 1.6b; es decir, ,01.?,, < 1.65, o seaz < 0.53b13.
o I \/n - 0.rll\/144
=u-- -
Por tanto, la probabilidad B la podemos poner de la siguiente manera:
Cuando la varianza es desconocida, no es posible aplicar el Teorema del Límite Central; en este caso,
para que sea posible aplicar esta prueba es necesario que la muestra provenga de una población que
sigue una ley normal, de manera que el estadístico de prr"reba sigue una ley de distribución ú. Entonces
la prueba estadística es la siguiente:
8.3. Pruebas de hipótesis sobre la rnedia, cuando Ia varianza es desconocida 24L
4. 'l'F,
{ -to/z(n -
Regi,ón de Rechazo. tob" 1) o tob" ) t^¡2(n - I).
Ejemplo. Según un estudio del Ministerio de Educación, el costo medio de la lista de útiles
de los escolares de educación básica es 87 dólares. Para verifi.carlo, un investigador tomó una
muestra con los siguientes resultados:
Para un nivel de significación de 0.05, verificar la hipótesis de que la máquina cumple con la
especificación.
Solución: Previamente hallamos eL promedio y la desviación estándar: Í :97.7 y s : 18.728
(los cálculos se dejan como ejercicio para el lector).
Con ésto planteamos el contraste:
5. Dectsión. Como el valor úo6" s€ encuentra en Ia región crítica, ya que 2.555 > 2.093, se
rechaza la hipótesis nula; es decir, el precio medio de las listas de útiles es distinto al que
afirma el Ministerio.
Ejernplo. Según las previsiones del gobierno, la inflación para este año será de 3.g %. Un
economista, desconfiado de Ia cifra, realizó una investigación por su cuenta y registró la variación
de los precios en los 22 artículos que a su juicio tienen la mayor incidencia en Ia economía popular.
Obtu'r'o una variación de 4.5 7o y una desviación estándar de 1.3 %. Pruebe si la cifra de inflaciórr
del investigadol será mayor que la del gobierno.
Solución: Se tienen los siguientes datos del problemai rL:22, r:4.5 y s: 1.3. La prueba es:
2.518; pcto si sc tonta r-v:0.1-J5 y l¡s5(21) - I"721,1:r reg,ión ur'ítir-'¡ es ú..¿,,, > 1.72]1.
Dec:i,si,ón, P¿rla cr - 0.01 no se rechaza H¡; cs dccir, no existe evidencia quc indiqu,,rl¡{'ia
cifl¿r clacla, pol cl gobierno está subestirrrada. Srn embargo, si sc torna r-v - 0.05, resulta que
Lob., ) ú... se rechaza Ho; es decir, 1a infla',ón cs inayor que la estimada por el gobici"no.
Para realizar una prueba de hipótesis sobre la varianza, supondremos que las observaciones provienen
de una distribución normal) para que el estadísti * @# siga una distribución y2 con (n - t)
grados de libertad. Bajo este supuesto, las pruebas de hipótesis son las siguientes.
Ejemplo. Un fabricante de cables de cobre afirmó que su producto tenía una resistencia a la ruptura
relativamente estable y que se ubicaría en un rango de 40 kilogramos-fuerza (kgf) . IJna muestra de
16 mediciones arrojó una varianza igual a s2 : 195.
4. R.egiór'r de Recl¿azct. P¿rra nn rrivel cle significación o:0.05 y 15 g.1., fSoo(15) :25.00. La
región crítica es Xlo" > 25.
5. Decisión. Como 29.25 > 25, se conch.r.yc qrre la hipótesis es falsa y qtle la variación de la,s
mediciones excede ias especificacioues del fablicante.
:jemplo. Una empresa realizó una investigación de mercado para determinar el nivel de consumo de
- refi'esco, para lo que consultó a200 consumidores, de los cuales 28 expresaron sll preferencia por
.-:roducto. El fabricante, de acuerdo a sus ventas, cree que tiene el 10% del mercado de refrescos.
244 Capítulo 8. Pruebas de Hipótesis
a) ¿Son los resultados de Ia investigación consistentes con los datos del fabricante?;
28
Soluczón: Se tiene Po : 0.1 Y el estimador de Ia proporclon es p - :0.14.
200
b) Como zobs :1.886, el valor de probabilidad correspondiente es A(1.886) : 0.9706. Por ser una
prueba bilateral, se cumple que 0.9706 +;:1; por lo tanto, a:0.0588.
3,i,"Ti3:.fi;TH' i
grarrcle) =
i;i r,lli , t!
-ro/\/n
,
t4,"'),,,'
(rrruestra Lt,2 tt,o lt { I,t,o z4 -zo
Distribución riorrnal ¡¿: l1,o F I H, ,'- i - l"o lt > t^/,
va'iarrza lt1. po Fllro slJn- tltu
clescolocida y,) l.ro lt 1 fto (n - 1) g.l. t { -to
8.6. Ejercicios
Se sospecha que los varones de las nuevas generaciones tienen, en promedio) mayor estatura que
las antiguas. En un estudio realizado hace clos décadas se determinó que la población adulta
masculina tcnía una cstatura media de 167 cm, con desviación estándar de 10 cm.
Un fabricarrte de fertilizantes afirma que el uso de su producto dará por resultado una cosecha
de por lo rnenos 3.5 toneladas de trigo por hectárea, como media, con una desviación estándar
de 0.5 toneladas. La aplicación del fertilizante a un álea de 37 hectáreas dio una cosecha de
3.35 toneladas por hectárea.
Una emplesa qlle elabora plarrchas plásl,icas puso en práctica un nlrevo rnétodo de fabricación
tal que el costo medio por rnetro cuadrado sc distribuye rrormalmente con va,rianza poblaciorral
4. Se obtuvo una muestra aleatoria simple de tamaño 100, resultando un costo promedio de 2.4
dólares. Verifique la hipótesis de que el costo medio es dc 3 dólares, con rrn nivel de significación
del4.5%.
246 Capítulo 8. Prttebas de Hipótests
5. Pol cstudios ¿rrrt<:Liorcs, scr srrbc c¡rer lir" rrc¡rli¿r dr: I¿ ecl¿rd rle los tlclirrcrrcrrt<:s crr cl pzrís cs rlc 23
años: sirr cnrl.,argo. crr un estrrclio rer:icnt<r (ioll Lln¿t unrcstL¡r rlc: 80 clr:tcrriclos. sc obtrrvo r-rrr 1>rorrrc<1io
clc 21.5 arlos y urr¿t <lesviar:irirr est¿irlrl¿rr' <lc i-J. Cr¡l rrn nivcl rle sigrriÉic:ir<:irirr cl<:1 '2 %, r:r.,ur1.,nLelrc
ia, hipritcsis clc quo l¿r rnecli¿r cie ecla,cl cle los clelirrcrrcntes sc h¿r lc<hrciclo sigrrific:rtivirrle:lr(,c.
(i LLr l¿rbor'¿rtorio f¿rlrrr¿rcéuti<:o asegura qllc rrn nrcdic¿rriertto c¡rc fal rric¿r ti<rrre nrr <rolrtenirlo rrreclio
dc 10 000 unidadcs cln ca(la dosis. Para corrl"rol.r¿rr si c1 l¿rl-ior'¿itolio cs de fial se torn<i uua
mur:stla cle 40 dosis, obterricnclo una rucclia <le 9940 uuiri¿rrles )¡ ulla desvi¿rción ost¿inclar clc 120
unida<les.
a) ¡.Poclcrnos aceptal la iuclicación clel I¿rboratori<.r cou ulr rrivcl cle significacitit r.IeI I%il:
b) Calculc ei nivel de significación de la prueba.
7 En un restaurante se hai¡ía tenido una media de 160 consumiclores diarios y nlla dcsviaciórt
estárrclar clc 17.5. Se aumerrrtó los precios cle la cornida y el propietalio notó que 1os 30 riltimos
días había un prornedio de 151 clientes diarios. ¿trI propietario pnede pensar que efectivament<:
ha descendido el número de clientes o que la variación es debida aI azatrl
B IJna emprcsa exportadora de camarón el año pasado embarcó una media de 10500 c:rjas por'
sernana) corr una desviación estándar de 1500. Eu los primeros seis rneses (26 sernanas) dc estc
año exportó un plornedio cle 11200 cajas cada semana.
10 Una socióloga afirma que cl tiempo que los niños cle tres ¿r cinco ¿riros dedican a ver la televisiórr
cada semana se distribuye normalmente con media 22 horas y desviación estándar 6 horas. Frentc
a este estr-rclio, una ernpresa de investigación de mercados cree que la media es mayor y pala
probar su hipótesis tomó una mucstra de 64 observaciones procedentes de la misrna poblaciórr.
obtcniendo como resultaclo una meclia dc 25. Si se utiliza un nivel de significaciórr del 5 %:
11. Urr rnicroernpresario está considerando la posibilidad de administrar cl bar clc uu colcgio. trl
adrrrinistradol actual del b¿rr afilma quc r:l inglescr diario sigue una distrilrución nolrnal rle rnedia
87.5 dólares y una desviaciórr estánd¿rr di: 7.5 dólares. Para comprobar si decí¿r la vercl¿ld) torn(i
Lur¿r rnlrestra de treinta días y í:sta revel<i r-ru ingreso dialio promedio dt: 82.5 dól¿rres. Utilizarrck¡
o: 0.1,
a) ¡,hay evidenci¿r de quc cl iirgreso diario promcdio se¿l nenor clcl que ¿rfir'ma el clueño actrral'/;
b) Calcule la potcncia clcl contraste si l¿r verdaclera rncdia fucra pr,:85.
Se dcsca saber si la cdad promedio a la cual sc clesposan las rlujeres en la ciudacl cle Cuenca es
diferente cle los 26 años de edad. Sc tornó rrna muestraclc24 registros dc rn¿rtrimoriio, resultandcr
las sigr-ricntcs edades de las novias:
18 28 46 21 29 23 47 43 23 32 20 56
26 40 19 35 20 18 16 65 22 19 24 32
14. Una compañÍa de televisión por cable anuncia que el periodo medio de espera desde la solicitud
hasta la conexión a la red de sus nuevos clientes es de ocho días. Una asociación de consumidores
desea verificar dicha hipótesis, para lo cual tomó urra rnuestra del periodo de espera (en dÍas) de
15 clientes con los siguientes resultados:
\5. La resistencia, en kgf crn2, de Ia fibra de carbono se distribuye normalmente. Se tomó una
mnestra de 10 elementos fabricados con este material, obteniendo:
203 229 275 220 223 233 233 208 228 209
Contraste la hipótesis de que la muestra proviene de una población de media 275 kgf cm2.
6 Segúrn los datos de una universidad, sus estudiantes obtienían en el examen de evaluación clel
inglés como segunda lengua una media de 50 puntos. Un profesor de inglés quiso comprobirr
si sus alumnos tenían un promeclio rnás alto, para ello seleccionó una muestra aleatoria de 20
alumnos y les envió a examinarse. Los resultados dieron una nota promedio de 54 y desviación
estándar dc 7 puntos. ¿A qué conclusión llegará el profesor, con un nivel de significación del
f,(Yn
¿ /a:
En una ciudad se quiele hacer un cstr-rdio rápido para'r,'alorar el consunlo de agua en los domicilios
palticulares dulantc los meses de mayor seqnÍtr. Para ello sc seleccionalon, al azar, 15 domicilios y
se midieron slrs consumos (r¿) en metros cúrbicos durante el mes de agosto. Los resultados fueron
Dr :280.5, Dr? :5308.35. En vista cle estos clatos, ¿hay suficiente evidencia estadística, al
nivel 0.05, ¿r favor cle la hipótesis de que el conslrmo medio de los particulares durante el mes de
agosto es llayor clue 18m3 (q,-,e es el consnmc¡ considerado como <sostenible>>)?
El consumo de gasolina (en litros por 100 km) de los automóviles de 3 puertas sigue una distribu-
ción normal con rnedia 8. Se introdujo una modificación en el motor con objeto de disminuir el
248 Capítulo B. Pruebas de Hipótesis
corrslrnlo y se probaron 10 ¿rutos corr el motclr modificaclo, obtcrriérrclose los siguierrtes esta,rlísticos
por' 100 krrr:
10 10
f
,¡.-r ",:77'5, T,r;i -
i.- I
(i01.33
a) ¿Hay suficiente evidencia estadística, al nivel 0.05, a favor de ia hipótesis de que el rruevo
modelo disminuye el tiempo dc acceso'/;
b) Calcule el p-valor.
c) Indique un par de valores de 7 y de s que hubiesen llevado a un p-valor de 0.005. ¿Qué
decisión se dcberÍa tomar eri este caso respecto al nucvo rnoclelo?
20 Una muestra de 25 traba.jadores informales, que sc dedican a vender golosinas en los buses.
ganan un promedio de 17.5 dólarcs diarios con una desviar:ión estándar de 2.5 dólares.
a) Estime la ganancia pr:ornedio diaria r-le es1,c tipo cle trabtrj:rdores informales, usa,ndo nn
intervalo de confianza aI g57a;
b) ¿trs Ia ganarrcia promedio de 17.5 cl<ilares significativ¿mente inferior a los 18.5 dólares qrrc
ganan los vencledores qne tienen un prresto fijo en los cines? (Utilice nn nivel del 5%.)
Verilique si la nráqrrinir gartrrrtiza lir prer:isión neer:salia p;rlzr el uivel cle significirr:irin ck: (-).05.
24. estándar-de un proceso ir.ciustLi¿rl (irrc plo(hlce valillas, <:l concliciones nolrnirles,
L¿r c{esvia,cicin
es clc 3 crn. Se dispone de una nnestra ck: tarnairo 15, con los sigr-rientes valores:
25. Una máquina de crnpaquetado automático deposita en cada paquete una ciclta cantidad de papas
fritas. Se scleccionan 20 paquetes, se pesa su contcnido y se obtienen los sigr.rientes resultados:
49 50 49 t10 50 50 49 50 50 50
49 50 50 51 52 48 50 51 51 51
a) Verifique si la media de esa variable es 51, con un nivel de significación del 1%;
b) Verifique si la varianza es la unidad, con un nivel de significación clel 5 %.
27. Una marca de aceite comestible cubre actualmente el 20 % de los ¡rotencialcs clientes. Para
incrementar las ventas se estructura una campaña pubiicitaria intensiva. AI final de la misma se
realizará una investigación a 400 consumidores potenciales para determinar si tra tenido éxito.
r8 En una encuesta a 300 taxistas, 132 contestaron que utilizan el cinturón de segulidad. {Jtilizanclo
un nivel de significación del 5 %, ¿podemos concluir que la mitacl de los conductores utilizan el
cinturón?
')9 De acuerdo con sns registros, una clínica ha establecido que la probabilidad de curación completa
de un enfermo que ha tomado el medicamento A es 0.8. La clínica experimentó con un nuevo
medicamento B en 700 pacientes, de los cuales 575 se cllraroll totalmente. ¿Se puede considelar
que el nuevo medicanrento es más eficaz que el tradicional, al nivel dc significación de 5To?
Una agencia dedicada a1 cobro de cheques encontró <¡re el 5 % de toclos los cheques remitidos
a la agencia eran cle cuentas sin fondos. Después de implantar nn sistema de verificación, pa,r'a
disminuir sr"rs pérdidas, se hallalon solarnente 50 cheques sin fonclos erl Lrna mncstra aleatoria cle
1124 cheques. ¿Existe suficientc evidenci¿r, estadística para concluil quc el sistema de verificación
ha reducido la proporción de cheques sin fondos?
Un proveedor ascgura que los artículos que é1 snnrinistra sorr defectu.osos en un 1% cle los casos.
Se realizó r-rna pmeba ¿r 200 de sus artícnlos y resr-rltaron 3 r-lefectllosos.
a) A un nivel cle significación del 1 '%, ¡;t:s falsa o cierta la afir'mación del ploveedor?;
b) Halle el nivel de significación observado de la plueba.
En una encuesta en Quito se entrevistó a 850 adlrltos. A la pregunta de que si ellos estaban a
favor del endurecimiento de las penas por ciertos delitos, eI 52% respondió afi.rmativamente.
250 Capítulo 8. Pruebas de Hipótesis
¿r) ¡.Sc Pucclc cc¡ttr:lttil c¡tct lir rti¿t\rorí¿r clet los ¿rdultos están ¿r favol del enchrrc<tirrLierrto rle l¿rs
l) oll¿rs ?i
33. Utt ecortornista clcl Battco Cerrtral está intcres¿lclo err conrl)ar'¿rr cl íuilice cle arrsentisrno labolal
crr (.)rrito con el dcl rcsto del país, doncle se sitria <n eI 77(%. Corr estc plopósito se:ieccionci, al
azar') urra rnuestra cle 200 tlaba.jaclores de dicha, ciuclad, la cual proporcionó rur porcenta.je de
ausentisnro del \6(Vo.
a) ¿Se pr-rede sacar la conclusi,ón de que el arrsentisrno es rnayor en Qr-rito qlle cn el lesto de1
país, al nivel de significación a : 0.025?;
34. Una agencia de publicidad trató de convencel a un industrial para que hiciera propaganda
televisada de uno de sus productos, asegurándole que el programa en el que se incluiría su
aruncio era visto por el 2A% de las familias. trl industrial quiso hacer un experimento por su
cuenta. Llamó por teléfono, durante Ia hora del programa, a 220 familias y halló que en 33 de
ellas se veÍa el programa.
35. En un programa periodístico de opinión se pidió que los televidentes Ilamaran al canal y respon-
dan a la pregunta << ¿,cree usted que es necesario que se hagan reformas en el sistema educativo
del país?>> De 812 llamadas recibidas, 790 se expresaron afi.rmativamente.
a) Use esta información para realizar Lura prueba de que más del 95% de los ecnatorianos
adultos cree que se deben hacer reformas en el sistema educativo;
b) ¿trs el resultado de la prueba estadísticamente significativa al nivel 0.01?;
c) Liste las hipótesis requeridas para que Ios resultados de Ia prueba sean válidos en esta
situación. En este caso, ¿,se satisfacen tales hipótesis?
Al igual que en el caso de observaciones realizadas sc\bre una misma población, cuanclo se dispone
de varias muestras provenientes de poblaciones distintas, se podría desear conocer si ellas compalten
irlgurra característica o si son totalmente diferentes. En Io que siguc nos ocuparemos de las pmebas
de hipótesis que involucran dos mllestras.
Igual a lo que se hizo en la sección cledicada a las pruebas de hipótesis sobre la rnediir, se deben
considerar los casos en qne es posible aplicar el Teorema del Límite Central y aquellos erl que no es
posible. Adicionalmente, se deberá terrer en cuenta un tercer caso, cuando las muestr-irs provienen de
una misma unidad muestral, mediante mediciones repetidas.
8.7. Pruebas para Ia diferencia entre dos rnedias 25t
Sr-rporrgarnos !1[te sc) clispone r[c clos poblaciorres, rlrri: liLs rrr)rnl-,r'¿rlcn]os conlo I -y 2, y se clesc¿r 1rrt.r]rzrl si
la difcreucia entre l¿rs clos rnccUas polrl:rcionales es igual ¿l nrra c¿rnticlad 1)¡; cs clecir, H1¡: ¡1 - lLt - Do,
o se clese¿i lrlobal el caso lrirlticular cLe ltr igualcl¿ic.l dc talcs rnedi¿rs, o scA) H¡'. ¡t1 - ¡,t,.r.
De la pobltrción 1 se extrae irn¿t rnrtestta de tarnaño r¿L y de la pobl:rciót 2 sc extr¿rc un¿l mlrestl¿r (le
tarlaño n2. Si l¿rs colrcsporrdientes r,'arianzas poblaciontrles son corrociclas. las 1>nrebas de hipótcsis
son las signientes:
Y n'' n2
4. Región de Rechazo. zobs 1 -zryl2 o zobs > za/2.
2 F"r-,rí"!i¡n ,lo
3. Estadístico p,"",.t,^ z.t¡s: (rt -¡z) - Do
de P'rueba. - l,
loi o;"
U^--q
4. Región de Rechazo. zobs> zo (oltierr zo¿," -zat cuarrdo H¡ (¡t1 - pz) < Do).
Ejernplo. Una inversionista tiene dos hoteles en la ciudad, uno en el norte y otro en el sur. El
sospecha que el conslrmo medio en el restaurante del norte es menor que en el del sur. Del primer'
-ocal se obtuvo una muestra de 30 facturas, r'esultando un consumo medio de 59 dólares. Del segunclo
-ocal se tomó una muestra de 50 facturas, con Lln consunlo medio de 63 dólares. Las varianzas de los
: onsumos en los clos locales son conocidas e iguales a 60 y 80, respectivamente.
a) Para un nivel de signiflcación de 0.05, r'erifíque si es cierta la sospech.a del duer-ro cle los hoteles;
4. Ile.qió,n de Rechq,zo. Para el nivel clc significaciórt o : 0.05, 1a regirlrr cle rechazo es z,'¡," {
-7.645.
cl loca1 del nortc
Dccisi,ó,n. Corno zobsl (:aceu la rcgión cle rechazo; se concluye qlle cn
e1
5.
conslrmo es menor.
b) Puesto qtLe zobs: -2.17, entonces o(-2.11) :0.0174; es decir', el p-valor <:s 7'74o/c''
8.7.2.Caso2:Varianzasd'esconocidas'Supuestasiguales
- 7t 'i-,"1'-2'
, (nr- r)r? - - ls|: it'
s-:-
qn2
¡
"
ntln'¿-2
n¡¡,.¿-2
4. Regió,n d.e Rechazo. tob, ) t,,(rr1 + n'2 - 2) (o bicn tot," { -to(U I nz - 2), cuando
Hr (h - P) < Do)'
8.7. Pruebas para Ia diferencia entre dos medias 253
Observación. EI supuesto que realizamos de igualdad entre las varianzas poblaciones--, debe ser
comprobado mecli¿rnte la prueba cle hipótesis cor'r'espondiente, qr.re Ia explica cn la Sección 8.8.
Ejemplo. Un irrversionista no sabe si invertir en bonos ernitidos por un país A o por un país B.
Para realizar Lrna decisión, seleccionó dos muestras correspondientes a los rendimientos de los bonos
emitidos por los dos paÍses, obteniendo los siguientes resultados:
País A
Rendimiento (%) 12.3 t2.5 r2.B 13.0 13.5
Frecuencia
País B
Rendimiento (7o) U¿ 12.2 72.3 13.0
Flecuencia rn;
A un nivel de significación del 0.01, verificar si el rendimiento de los bonos de los dos países es el
mismo. (Asumir que los rendimientos siguen una distribución normal y tienen igual varianza.)
Solución: Se tiene que
.1, 12.80, s7:0.71, n" : 70,
a-
-
12.35, s? : 0.07, nv : 16.
4. Región de Rechazo. Como to oos(24) : 2.797 , la región crítica es úo¿" > 2.797 o to6" 1 -2.797 .
5. Decis'ión. Como to6" cáe en la región de rechazo) se puede asegurar que los bonos de los dos
países tienen rendimientos diferentes.
Queda como ejercicio para el lector determinar en cuáles bonos se recomienda invertir.
Sr-rpongamos que se dispone de dos poblaciones y se desea probar si la diferencia entre sus correspon-
lientcs medias pobltr,cionales es igr,ral a r0; es decir, 11¡: h - lrz - Ds. Para ello. admitiremos que
.as poblaciones sorl normales, cuyas varianzas poblacionales sorr desconocidas y distintas.
2. H ip óte si s A It ernat'iu a.
3. Estadístico de Prueba.
4. Región de RecL¿o,zo. tob, 1-trtzG) oto¿,, ) t.lz(g), donde cl nirmero de grados de libcrtad
, ,) ¡,2
/"í,"i\
'
\tt n.r)
se calcula pot g -
l'? , s]
Ejemplo. Se desea conocer el efecto delfrío extremo sobre la realización de operacioncs manuales.
Fara ello se eligieron al azar 20 voluntarios, clivididos en dos grupos de 10. Al primer grupo se le
expuso a una temperatura de 4oC, rnientras que al otro se le mantuvo a temperatura ambiente. Se
contabilizó el número de veces que los voluntarios podían abrir y cerrar Ia mano en un lapso de 15
segundos, con los siguientes resultados:
No expuestos al frío 54 tr1
¿, a 40 45 48 46 45
(o 49 50
Expuestos al f,río 32 29 3B 33 34 tt
r)rJ 36 óo 29 o.)
Lt)
Probar Ia hipótesis que el estar expuesto al frío reduce la capacidad de abrir y cerrar la mano en más
de 12 veces.
/ L6.Bg 19.16 \ 2
9:
(ro**) : 17,9 ¡v 18.
8.7. Pruebas para Ia diferencia entre dos rnedias 255
1. Hipóteszs - t z) : Do.
Nula. Ho: (h
2. H'ipótesis Alternat'iua. Hr (fq - LL) I Do.
(lt - ¡ü - no
3. Estad,ísti,co d,e Prueba. tob, :
l"? , sl
U^--
4. Región de Rechazo. tob" 1-t^tzj) oto6") t,/z(g), donde el número de grados de libertad
nz-l
Cuando g no es un número natural, se redondea al entero más cercano.
Las pruebas para las diferericias de las medias, realizadas anteriormente, se aplican cuando las dos
muestras son independientes, pero existen casos en los que Ia información recogida no es independiente
(como cuando se Ia toma de un mismo individuo de manera repetida) .
Sea (r1,y1), (rz,Az),..., (rn,an) una muestra aleatoria de pares de observaciones; donde (r¿,y¿)
representa dos mediciones tomadas de la misma unidad muestral, antes y después de un tratamiento
o fenómeno que Ia afectó. Se desea conocer si Ia población cambió de manera apreciable después
del fenómeno indicado; para ello se emplea la prueba de diferencias por parejas de la manera que a
continuación se describe.
256 Capítulo 8. Pruebas de Hipótesis
Se construye una muestra aleatoria de las diferencias dt, d2, .. ., dn, donde d¿: r¿-Ai (i :1,2,. .. ,n),
que las supondremos siguen una ley normal de media p,,1 y varianza o2(1. Para estos parámetros
poblacionales se calculan sus estimadores:
lft1lL
,I: ! r¿, y s7.: -- . r(¿n - ¿)r.
i.:1 i.:1
Observación. También, se pueden realizar los contrastes unilaterales considerando las hipótesis alter-
nativas F¿ 1 Do o F¿ ) Dg; para cada caso se escogerá, de Ia manera antes indicada, la correspondiente
región de rechazo. Se recomienda que el lector formule tales pruebas.
Para un nivel de significación de 0.05, establecer si el acondicionamiento físico varió de manera signi-
ficativa la frecuencia cardiaca, suponiendo una distribución normal de las diferencias.
A:2: :3.22,
r_l
sa,:8.2r.
5. Deci,sión. Como to6" r1o está en la región crÍtica, no se rechaza Hg; es decir, no hay por qué
considerar que hubo una variación apreciable en la frecuencia cardiaca.
8.8. Pruebas de hipótesis para la razón entre dos varianzas 257
Supongamos cllre se desea probar la igualclad de las varianzas dc dos poblaciones normalmente dis-
tlibuidas, de las que se han extraído dos muestras independientes; es decir, se desea probar Hg: ol : 6/.
Las pruebas de hipótesis son las siguientes:
5. Deciszón. Prtesto que 1.571 < 3.12, no se debe rcchazar la hipótesis de la igualdad cle las
variarrzas. Entonces, fite correcto ¿rsumir que las varianzas elan igrrales, cuando realizamos la
prueba sobre la igualdad de las me<lias.
:--ipongamos qnc se han scleccionado dos muestras, de rnanera aleatolia e irrdependiente, de dos pobla-
.-rnes binorniales, cr.tyos tantarios, llr y'r¿2 sorr sufi.cierrtemente altos palir que las distribuciones rnucs-
-:ales de Ft y fz sealt aproxirnadanrente norrnales. Se desea probal si I¿r difclencia de las proporciones
:'nestrales es igual a un valor D6. Se deben tomar en cuenta dos casos: cr-r¿ndo Do : 0 (igualdad de
-is proporciones) y cuando Do 10.
258 Capítulo 8. Pruebas de llipótesis
io(!
\nr
.;)
4. Reqión de Rechazo. Zobs { -zo/z o 2o6" } zo¡2.
Pt:go :
5
0.0625, Fz:
6
: 0.0882,
6B
5+6
0: 80+68 :0.0743.
Observación. También, se pueden realizar las pruebas unilaterales para probar que I11 : (pt-pz) > Do
f11 : (pt - pz) < Do, cambiando las regiones de rechazo según cada caso particular.
o qtre
Ejemplo. En el deporte del balonmano) en un partido está permitido sustituir al portero solo
para que detenega los tiros penalties. El entrenador de un equipo, al definir su estrategia para un
partido, examina las estadÍsticas individuales de los porteros titular y suplente. En una muestra de
los registros cle los entrenamientos del último mes, el titular ha detenido 128 de 510 penalties y el
suplente ha detenido 183 cle 480 tiros. El cntrenador decidirá sustituir al portero titular, el momento
de parar un penalti, si el suplente ha detenido al menos un 10 Va :más de tiros que el titular. A un
nivel de significación del 5 7o, ¿qré decisión tomará el entrenador?
128 183
'Pl : =-:=:0.2ó1, T)t:- :0.381.
510 480
1. Regi,ón de Recha,zo. AI nivel de significación 0 05, la región de rechazo es zobs > 1.645.
5. Decisiór¿. Conio zobs:1.023, no cae en 1a legión de lechazo, no hay razón para pensa. que la
diferencia es mayor qr-re 0.1; entonces, e1 cntrcnador no debelía decidirse a sustituir al portero
titular.
in el Cuadro 8.2 se presenta Lrn resumen de las pruebas de hipótesis con dos muestras.
260 Capítttlo 8. Pruebas de Hipótesis
(t:r -rz) - Do
Normal lrt : Do
[L'¿ ¡r'r- Prf Do Itl > t.i't
anzas desconocidas
v¿rri trtt -¡ttIDo ¡t, - ¡t,2 ) D¡¡ t) t.,,
\it-rz)-Do
Norrnal Ft Fz: Do ut-t-LtlDo Itl > t,,¡z
varianzas desconocidas 11't-Fz{Do t1,,,-Fz)Do tlto
supuestas clistintas LIt - Fz) Do ¡r.r-¡t"{D6
Normal Fn: F,o,, H o I trtn,, D-u^ Itl > t.t"
observaciones llo I Ho,, l-Lo) 11n,, sdlJn t>t-
empareiadas ILn ) Fo,, lto { 11o,, n-1g1, t<-t^
o I :o 2 oíloó
2, F:5st F ) F,/z
No¡ma1 o 21 1o 2
2 01)02 2
F>T-.
o 1 )o 2
2 < ur:nr-I,u2-n2-I F I Ft-o
"? "',
8.10. Ejercicios
Pruebas sobre la diferencia de dos medias (varianzas conocidas)
1. Dos máquinas envasan cereal en ca.ias. De la prirnera rnáquina se obtu\¡o una muestra dc 30
cajas) resrlltando un peso promedio de 130 g y de la segunda máquina se tomó Lrna muestla
de 50 cajas) con un peso promedio cle 125 g. Las varianz¿rs de los pcsos envasados por las dos
rláqlrinas son conoci(las e igr-raIes a 60 y 80, respectivamentc. Para un nivel clc significaciórr rle
0.C5, velifiqlle si laij clos máquinas er]\¡asan iguales canticl¿irlcs de ccreal.
2 En del Minist,erio de S¿rhLcl se rniclié el conterriclo clc nicotirra c-le clc¡s rnarc¿rs
un¿r iuv<:s1,igaciórr
de cigallillo. Err un experinlentocorr 50 cigarrilkrs de la priruer'¿ nralc¿r se elrr:ontrci que tielre
un corrtenido promeclio de 2.47 nlg corr clesviación estárrclar de 0.12 rng; mierf,ras quc p¿1ra 40
cigarrillos de lzr segurrda m¿rrca el crorrterriclo 1)rorncdio fuc <le 2.39 mg colr clesvii.rción est¿inclar rle
0.14 mg. Prr.rcbe la hipótesis rlula //,1 - I,L2 - 0.12 contr¿1 la ¿tlte¡ttatiya /¿r - l,¿ 10.12, tisa¡rlo
cv : 0.05.
En un¿t ciuclarl operan 2 elrpresas dc telerfoní¿r cclular: Flirius y Qualli. Por los registros ltrs
c[]ples¿rs sal)cn que cl gasto inenslr¿11 de slrs ¿borr¿rdos ticrren clcsrriaciorrcs cst¿ilrclar'<lc 6.5 y 5
clólares, iespectivamerlte. Parrr conrpalal ol gasto nreclio dc los c:lientes cle las <los enrplesas, se
tomó una rnuestra) aI azar, de 34 clierrtes dc Sirius y otra ullrestr¿r de 41 clientes de Quark. Los
corresl)ondientes conslrmos mensuales fueron 35 v 38.5 dólares.
8.70. Ejercicios 26r
a) ¿Proporcionan estos datos evidencia estadística, al nivel 0.04, a favor de la hipótesis de que
el gasto de los clientes de Sirir-rs es menor que es gasto dc los clicntes de Quark?;
b) Halle el p-valor de la prueba.
4 Los ingresos del primer ernpleo de los ingenieros informáticos, egresados de cualquier universidad,
siguen una distribuciól normal con desviación estándar de 3800 dólares. Se tomó una muestra
aleatoria de 15 ingenieros procedentes de la Universidad Nacional, resu.ltando que en su plimer
empleo los ingresos medios anuales fueron de 12000 dólares. Otra muestra independiente de
12 ingenieros de Ia Universidad Técnica dio como resultado unos ingresos medios en el primcr
empleo de 13 200 dólares. Se pide, con un nivel de significación dei 2'/o, probar Ia hipótesis dc
que las medias son iguales frente a la alternativa de que la media de la Universidad Nacional es
menor que Ia de la Universidad Técnica.
5. Una cooperativa agrícola produce cierto atroz con fertilizante natural y con abono químico. En
las parcelas donde se emplea fertilizante natural se obtienen plantas cuya altura tiene varianza
de 47 cm2. En los terrenos donde se usa abono químico la altura de las plantas tiene un varianza
igual a 39cm2. Para comprobar las medias se toma aleatoriamente una muestra de 65 plantas,
31 correspondientes al primer tipo de tierras y 34 al segundo; obteniéndose en las muestras 92
cm y 86 cm de alturas medias, respectivamente. Para un nivel de significación del 6 %, contraste
Ia hipótesis de que los fertilizantes son igualmente eficaces, frente a Ia hipótesis alternativa de
que es más eficaz el natural.
En un proceso químico para producir oxígeno (O2) se emplea un catalizador. Durante treinta
días se midió Ia cantidad promedio de oxígeno producido luego de haber colocado el catalizador
y cuatro horas después, resultando que, en el primer caso se producÍan 1000 litros de 02 en una
hora, con una desviación estándar de 90 litros y en el segundo caso se producían 880 litros de Oz
con una desviación estándar de 140 litros. ¿Existe evidencia que indique que el catalizador se
degrada, produciendo una merma de al menos 100 litros de 02, cuando han transcurrido cuatro
horas?
Se efectuó un análisis sobre la duración de las máquinas computadoras que se utilizan en las
empresas púrblicas. Se eligieron dos muestras de computadoras, de marca y de clones, cada una
constituida por 80 máquinas. Para las de marca, resultó una vida promedio de 4.8 años y una
desviación estándar de 1.7 años. Para las clones, dio una vida promedio de 3.3 años y desviación
estándar de 1.2 airos. ¿Puede considerarse que la vida media de las computadoras de marca es
superior en al menos un año a las que son clones?
La FIFA realizó un cambio en la forma de puntuación en los partidos de fútbol ganados: se otorgá
tres puntos al equipo ganador, en lugar de los dos puntos usuales. Para examinar la efectividad
de la nueva norma) se examinó los resultados de los partidos jugados en 1995 y 1996 (año en
el que entró en vigencia la nueva norma) . En 45 partidos examinados, jugados el año 1995, se
encontró un promedio de 2.87 goles por partido y una desviación estándar de 0.21; en los 38
partidos examinados de 1996, se halló que se habÍan ploducido un promedio de 3.05 goles con
Capítula E. .Fruebas de Í{ipótesis
dcsviacirjn estáridal cle 0.18. ¿Fuede decirse c¡-re irr rrlreva rrolrrra pelrniti<i ¿unlr:n1,ar t:l prornoclic-r
cl: goles por partido'/
10 Una persona desea comprar un automór'il nr-revo y toma conro factor de decisión el consumo meclio
de cornbustible que tienen dos nlodelos de calacterísticas similarcs, uno fabricraclo en Europa v
otro en Corea. Consulta una rerrista especiahzada y encuentra qr.rc e1 auto eulopeo tiene nn
recorrido prornedio de 28.3 krn por gaión de cornbustible. con nna desr¡iación estándar de 6.2
km; para el auto coreano encucntra qr-re el rccorrido es dc 26.7 krn por ga1óll una desviacicirr
"v
estándar de 5.1 km; además, la revista indica que los datos estadísticos fuerorr tomados a partir
de las mediciones realizadas en 50 autos de cada oligen. ¿Cuátr de los dos aritos cieber'¿i cornl-iral?
o ¿deberá tornar en consideración otras calacterísticas, distintas clel renclirniento del combustible.
para tomar su decisión'/
Fruebas sobre la diferencia de dos rnedias (varianzas desconocidas)
11. Se realizaron pruebas para conocer la cantidad de plomo en la sangre de personas expucstas a
la contaminación en ia ciudad. Se tomaron muestras aleatorias de 24 niños y 18 adultos que
dieron los siguientes resultados (en ppm):
Adultos Niños
rt : 0.043, rz:0.028,
sr : 0.018, sz : 0.007.
Asumiendo que las varianzas poblacionales son iguales, pruebe la hipótesis de que no hay dife-
rencia entre el contenido medio de plomo en la sangre de los niños y de Ios adultos, contra ia
hipótesis de que los adultos tienen mayor cantidad que los niños.
12. En un estudio sobre un nuevo programa piloto para el aprendizaje a distancia mediante com-
putadora, se eligieron al azar,21 estudiantes de una clase para seguir el nuevo prograna (grupo
piloto) mientras que los 23 restantes seguían el método tradicional (grupo control). Finalizado
el curso, se realizó un examen obteniéndose los siguientes resultados:
Grupo piloto Grupo control
Nota promedio 51.48 47.52
Desv. estándar 11.01 14.15
Suponiendo igualdad de varianzas, contraste si hay evidencia (a nivel del 5 %) de que el nuevo
método piloto da mejores resultados que el método tradicional.
Pruebe la hipótesis de que no existe diferencia entre el total de surcos) contra una tripótesis
adecuada a los datos, asumiendo igualdad en las varianzas.
tr) Pruebe Ia hipótesis de que los dos medicarnentos tienen igual efecto, contla la hipótesis de
que el mec.licamento B es rnás efectivo. ¿Qué conclusión saca?;
b) Encuentre el nivel de significación a¡rroximado de la prueba.
15 Dos empresas competidoras (S y T) que venden implementos deportivos han puesto en marcha)
casi simultárreamente, páginas de internet para la venta electrónica. Se eligieron, al azar) ocho
clientes que visitaron la página S y, de manera independiente, otros ocho que visitaron la T y sc
midió el tiempo (en minutos) de la duración de ia visita de cada cliente. Los resnitados fueron
los siguientes:
Pág naS oa c).tr tJ 42 3.2 44 21 16 d"t) É .)
Páe naT 1t
IJ z-,1 44 2B ri.5 3.6 /t
¿Proporcionan estos datos suficiente evidencia (al nivel 0.05) para afirmar que los tiempos medios
de duración de las visitas en ambas páginas son diferentes?
16. Para los tres primeros meses del año, 15 vendedores de la Costa tuvieron ventas semanales
promedio de 300 dólares con una desviación estándar de 50 dólares; en tanto, 10 vendedores de
ia Sierra tuvieron ventas semanales promedio de 260 dólares, con una desviación estándar de 16
dólares. Si consideramos que las desviaciones estándar de las ventas son diferentes, determine
si los vendedores de la Costa tienen mayores ventas semanales.
t7. Se compararon los tiempos (en segundos) que realizan atletas escolares, masculinos y femeninos,
al recorrer una distancia de 500 metros. Para el efecto, se registraron las marcas de 9 niños y 7
niñas, obteniendo lo siguiente:
Niños 187 223 235 r92 259 775 206 t94 247
Niñas 248 366 223 326 274 369 301
Determine si la diferencia en el tiempo medio entre hombres y mujeres es mayor que un minuto.
Use rr : I0'7a.
18. Se sospecha que Ia concentración media de dióxido de carbono es mayor en la capa de aire más
próxima a la superficie. Para contrastar esta hipótesis se analizó el aire en 20 puntos elegidos
aleatoriamente a un metro de altura del suelo, resultando una media muestral de 580 p.p.m.v.
(partes por millón en volumen) y una desviación estándar de 60. También, se realizaron 16
mediciones de la concentración, a una altura de 18 metros, resultando una concentración de 365
p.p.m.v. y una desviación estándar de 110. Suponiendo norrnalidad para las mediciones y que
Ias varianzas son diferentes, ¿proporcionan estos datos sufi,ciente evidencia, al nivel 0.01, a favor
de la hipótesis de que la concentración es mayor cerca del suelo?
Pruebas sobre Ia diferencia por parejas
19 Se hizo un estudio para comparar los tiempos de acceso, en diferentes momentos del día, a
internet desde computadoras domésticas con módem. Para ello, se cargaron 8 páginas web por
la tarde en el periodo de 14 a 15 h. y, con Ia misma máquina, Ias mismas 8 páginas por Ia noche
en el periodo de 22 a 23 h. Los respectivos tiempos de acceso en minutos fueron:
¿Se puede concluir, al nivel 0.01, que el acceso es más lento en el horario nocturno?
20. Para poner a prueba un nuevo método de estudio, se seleccionó a 10 sujetos que fueron sometidos
a una prueba antes y después de entrenarse con el nuevo método. Las calificaciones fueron:
Antes 19 T4 23 25 18 24 17 19 20 11
Después 20 15 26 24 t7 26 18 22 26 11
264 Capítulo 8. Pruebas de Hipótesis
A un nivel clc significación dei 5'%, ¿,se prrecle decir <¡re el nrtevo método es efcctivo'?
2L Urr glnpo dc invcstigaclores afirma haber dcscrrbiclto un ti1.ro clc alirncnt,ación pzua las gallinas,
ba.jo la cual éstas prodricen hnervos que rlo aumcnl,¿rrr cl c;olcsterol en L¿i,s personas que los q)n-
slrrten. Parzr cornprobal dicha teoría, sc seleccionaron al azar 36 personas a las <,¡rte se les rniclié
su nivel de colesterol habitual (z¿ ) . Desprrós sometcr' ¿r estas rnismas pcrsolas a ulla dieta ¿r base
de los huevos en estudio, se miclió cn ellas cle nu.cvo dicho nivcl (y¿). Los resultaclos fiterort:
l Ji -., :
I =2a3. s -200, ;t1\ 4) . (d,-d)- ls6
r.- 1
22. Se quiere comparar dos métodos rápidos para estimar la carga eléctrica en Ltn circuito. En
un laboratorio se midieron B circuitos, mediante los dos métodos, obteniendo los siguientes
resr-rltados:
Circuito 1 2 3 4 r
d 6 7 B
- a) ¿Ha¡, suficiente evic,lcncia l)¿r.ra pertri¿)r q,re al. : o?.?, ¿-r q¡ nirrcl cle significaciórr cle 0 05;
lr) Encucntre el rtivcl dc siguificación dc la plr,rebtr, c inter'lrrete el lcsultaclo.
25. Un¿r fábrica cle refrcsctos tiene clos máquirrirs enrbotcll¿rclor¿rs qrre eDvasan el líqr-rid<; err las botcllas.
Los expencledores h¿rtt irrfor-ni¿rdo ¿rl fabtic¡rrrte quc lrr.s botell¿rs ltrcsentirl clemasi¿rcl¿r yali¿-Lltiliclad
eu la cantidacl de líquido que cortlienert. llala exanrinar la que.ja se nidiri la var.i¿r¡za clel vr¡l¡meir
clc 1íquido crnbotellado ltol cacla ttna de las maic¡.rirras, resrrltanclo qrre con rrn¿r r¡qcstra c1e 18
botellas cle la máquirta 1, se obtrtvo una varianza clc 700 y ciou una mucstla de 15 botellas clc l¿r
rrtáquirra 2, se obtuvo ttna vali¿nza de 210. ¿L¿1 v¿uial)ilidad err los volirmenes crrvasaclos
ser atribuida a una o a las dos r,ráquinas? Utilice a : 0.05. 'r-rcclc
8.70. Ejercicios 265
26. Dos estaciones rneteorológicas predicen Ia temperatura a medio día en la ciudad con seis horas de
anticipación. Se tornaron dos muestras independientes de los datos de cacla estación, resultando:
a) Verifique si las varianzas de las temperaturas pronosticadas son distintas. (Tome c:0.1);
b) Empleando el resultado anterior, pruebe si las dos estaciones pronostican iguales tempera-
turas, a un nivel de significación de 0.1.
27. Se van a probar dos medicamentos A y B contra una enfermedad. Para ésto se trataron 21
ratones enfermos con A y otros 21 con B. EI número medio de horas que sobreviven con A es
1200 y el número medio con B es L225. Suponiendo normalidad en ambos casos:
a) Se puede aceptar igualdad de varianzas si se sabe que D@o - ,)" :9800 y D(An - y)' :
3500? (Tomeo:0.05);
b) ¿Es más efectivo el medicamento B? Plantee el contraste adecuado para estudiar esto con
un nivel de significación del 5 %.
18. Una compañía petrolera está considerando Ia posibilidad de introducir un aditivo en su gasolina,
esperando incrementar el kilometraje medio por litro. Los ingenieros del gupo de investigación
probaron 10 autos con la gasolina habitual y otros 10 autos con la gasolina con el aditivo. trl
resumen de los resultados es:
a) ¿Es razonable suponer que las varianzas son iguales? Use a : 0.1;
b) ¿La introducción del aditivo incrementa el kilometraje medio por litro?
ll. IJn economista del Instituto Nacional de Censos desea conocer si las tasas de desocupación
urbanas son iguales en las dos principales ciudades del país. Con base en sendas muestras de
500 personas en cada ttna de las ciudades, el economista encontró 46 personas desocupadas en
una ciudad y 35 en la otra. A un nivel de significación del 3 %, ¿puede snponerse que las tasas
de desempleo en las dos ciudades son diferentes?
,1. De una muestra de 300 televidentes escogidos al azar, que tenían sus televisores encendidos en la
hora del noticiero, 50 indicaron que tenían sintonizado el canal 4y 70 que sintonizatotr el canal
8.
a) ¿Puede afirmarse que los dos canales tienen igual nivel de sintonía a Ia hora del noticiero?
(Utilice un a:2To);
266 Capítulo 8. Pruebas de Hipótesis
.Jo
¿L Dos ernpresas encrrestadoras realizan investigaciones para determinar el porcenta.je dc pcrsonas
que votarán a favor de una pregunta en Lrn plebiscito. La primera cnrplesa etrtrevistó a 1000
pelsonas de las cuales 367 contestaron afirrnativamente. La segunda empresa entrevistó a 300
personas y obtuvo 121 r'espuestas afirmativas.
a) Puede considerarse que las dos empresas entregan resultados similares respecto del núrmero
de electores que votarán SI a la pregunta. Utilice a : 0.05;
b) Encuentre el nivel de significación de Ia prueba.
.).) Se seleccionó,al azar,500 usuarios de correo electrónico que trabajan en empresas públicas ¡-
resultó que 32 de ellos habían recibido virus informáticos a través del correo en eI último año.
Se realizóotro muestreo independiente eligiendo, al azar, 300 usuarios que trabajan en empresas
privadas, resultando que 9 de ellos habÍan tenido este mismo problema.
a) ¿Proporcionan estos datos sufi.ciente evidencia estadÍstica, al nivel 0.04, a favor de la hipóte-
sis de que la incidencia de los virus es mayor en las empresas públicas?;
b) El p-valor del contraste, ¿es mayor o menor que 0.01?
34. Un estudio indicaba que las hijas de madres fumadoras durante el embarazo tienen mayor proba-
bilidad de ser ellas mismas fumadoras. El estudio se Ilevó a cabo con niñas, preguntándo si ellas
habían fumado el último año y a la vez se consultó a las madres si ellas había fumado cuando
estaban embarazadas. Solo el 4% de las hijas, de 200 madres que no fumaron cuando estaban
embarazadas, habían fumado el último año, comparado con el26% de las hijas, de 500 madres
que habían fumado, también lo habían hecho. En la investigación se propone que el hecho que
una madre haya fumado en estado de embarazo, aumenta Ia proporción de hijas fumadoras en
w 20To.
35. Se desea comparar Ia proporción de viviendas con servicio de alcantarillado en las áreas urbana
y rural de Pastaza. Se hizo un muestreo en las dos áreas con los siguientes resultados:
¿Hay suficiente evidencia para concluir, con un nivel de significación del 3 %, que en Pastaza,
la proporción de viviendas con alcantarillado en la zona urbana excede en más del 15 %o a la
proporción de viviendas con alcantarillado en la zona rural?
36. Para estudiar el efecto de una nueva terapia sobre el cáncer de seno se tomaron dos muestras,
una de 300 pacientes que no recibieron Ia terapia y otra de 200 que si lo hicieron. De Ias que
no recibieron, L7L pacientes murieron y de las que si recibieron, 66 murieron. Un tratamiento
se considera efectivo si rebaja en más del 18 % el porcentaje de los pacientes fallecidos. A un
nivel de significación de 0.05, ¿es efectivo el nuevo tratamiento?
Capítulo I
Pruebas de Hipótesis No Paramétricas
En las pruebas de hipótesis que utilizan Ias distribuciones normal, t o F, se supone que la ley de
probabilidad de la población de la cual se extrae la muestra tiene determinada forma y que sus
parámetros verifican ciertas condiciones de manera que el estadístico muestral correspondiente tiene
una distribución de probabilidad conocida, por lo que se llaman pruebas paramétricas. Por ejemplo,
para la aplicación de Ia prueba ú, se debe suponer que Ia población es normal. Además, para la
aplicación de las pruebas paramétricas se requiere que el nivel de las mediciones sea al menos de escala
de intervalos.
Sin embargo, existen muchas aplicaciones en las ciencias y Ia ingeniería donde no es posible conocer las
distribuciones de las poblaciones de las que se extraen las muestras o los datos se reportan como valores
en escala ordinal. En estos casos, se utilizan métodos alternativos equivalentes a los paramétricos,
denominados métodos no paramétricos o de distribución li,bre.
Con frecuencia se utilizan las pruebas no paramétricas cuando se tratan de inferencias con muestras
pequeñas y distribución desconocida de la población, ya que en estos casos no se puede utilizar el
Teorema del Límite Central. La aplicación de los métodos no paramétricos no requiere conocimientos
matemáticos avanzados, debido a que la tarea matemática consiste en ordenar por rangos Ios datos
observados.
Si se verifican Ias condiciones exigidas para el uso de una prueba par-amétrica, entonces, es siempre
preferible utilizar ésta y no su equivalente no paramétrico. EIlo se debe a que si se utiliza el misrno
nivel de significación en ambas pruebas, Ia potencia de una prr.reba no paramétrica es siempre menor
a la de su equivalente pararnétrico. Por otro lado, con los métodos no paramétricos se pierde gran
7)
cantidad de información al no operar explícitamente con los valores sino con sus rangos.
Las pruebas no palamétricas tienen varias ventajas sobre las pruebas paramétricas:
267
268 Capítulo 9. Pruebas de Hipótesis lVo Paramétricas
3. Llevan a una mayor probabilidad de no rechazal una hipótesis nula falsa (error de tipo II).
Las pruebas no paramétricas se dividen en dos grupos: sobre una sola muestra y sobre varias muestras.
También, hay un grupo de pruebas que se basarr en la ley de distribución ji cuadrado.
En este capítulo examinaremos un conjunto básico de pruebas no paramétricas, que permiten con-
trastar hipótesis sobre la independencia de variables, el ajuste a una ley de distribución dada, la
aleatoriedad de las observaciones, entre otras. En la prirnera parte examinaremos aquellas pruebas
que emplean la ley ji-cuadrado, mientras que la segunda parte dedicaremos a otro tipo de pruebas.
Itrteresa. conocer si el número cle c¡bservaciones clue se ubican en cada categor'ía se ajusta a un esqlle-
rna cle probabilidnd <lado; es clccir', si las probabilidadcs dc ¡rertenencia a cada gr,r-rpo tiencn valores
especÍficos: pr : pro¡ p2: p20, . . ., pk : pk¡. Entonces la pruebzr queda así:
9.7. Pruebas X'2 de bondad de ajuste a una ley 269
2. Htpóteszs Alte'r'no,t'rua,. I11 : Al rnenos uncl cle los ¡r, es <listirrto c.Ic., p,¡g,'i - I,2,...,k.
, (rr¡-ttp¡¡)2
3. Estad'íst'ico de Prtt,ebo^ '\r/r'\ -
7-t nP¿o
4. Regi,órr de Recl¿azo. Se rechaza 11¡ cuando X?"1,, > XZ@ - l).
Se supone que los datos esLán distribuidos según una ley trinomial de parámetros (100;p1,Pz,Ps)
: P2: I
4Y Pt: I2
Pt Probar Ia hipótesis a un nivel de significación del 5 %.
4. Región de Rechazo. Tenemos que XSos(2) :5.99 y la región crÍtica es XZt" > 5.99.
5. Deciszón. Como 13.18 > 5.99, se rechaza 116, o sea, los nacimientos de los gemelos no siguen Ia
Ley indicada.
Se recomierrda que el lector cambie las probabilidades de pertenencia a cada grupo) de manera que se
acepte la hipótesis nula.
Disponemos de un conjunto de n observaciones, que se supone siguen una ley de probabilidad dada y
que están agrupadas en k clases o categorías.
Por otro lado, sea X una variable aleatoría que sigue Ia indicada ley probabilidad, que toma valores
.r:r) tr2). . .; entonces. Pr(Y : r¡.) : p¿.
270 Capítulo 9. Pruebas de Hipótesis lVo Paramétricas
Pr(X:r¡):P¡ ="-tr)'"
,l
donde el par'ámetro ) puede estar previamente especificado o debe ser estimado.
A partir de las probabilidades teóricas se calculan las frecuencias esperadas de cada clase como ei : np,i.
Cuando alguna clase tiene una frecuencia observada menor que 5 se Ia puede unir con alguna clase
adyacente y sumar las probabilidades correspondientes. Luego de agrupar las observaciones que lo
ameriten, se dispondrá de una tabla de frecuencias con k clases, como Ia siguiente:
k ;r ;* ek: nplr
Total n
El estadístico de prueba, para comprobar si los datos siguen una ley especÍfica, es
k .o
,"0
xZu":
I
L=I "n",,"
,
que sigue aproximadamente una distribución y2 con [(k - I)-(número de parámetros esti,mados)]
grados de libertad. Así, si se supone una ley de Poisson, de parámetro ,\ conocido, entonces Xlr" sigue
unaley X2(k-1);perosiseestimaelparámetro),elestadísticoXl6"sigueunadistribuciOny2(k-2).
La prueba de hipótesis queda como sigue:
1. Hi,pótesi,s NuIa. fls: Los datos siguen una \ey L(p) dada.
2. Hipótesi,s Alternatiua. I11: Los datos no siguen la ley 4(p) dada.
('¿ -
.). Estad,ístico d,e Prueba. XZn. : ! "¿)2 ,
i:t ei
donde &: es el número de clases que se forman luego de agrupar los datos.
4. Regi,ón de Rechazo, Se rechaza Hs si XZt" > X?"@ - 1- l), donde I : número de parámetros
estimados a partir de la muestra.
Ejemplos
1. En una agencia bancaria hay cinco cajas para atender a los clientes. Un día, el encargado de la
agencia contabilizó el número de clientes que escogía cada una de las cajas, obteniendo:
o
Caja 1 2 4 5 Total
FYecuencia 34 54 39 48 45 220
De acuerdo a estos resultados, ¿se puede concluir que ha¡'preferencia por alguna de las cajas?
9.7. Pruebas X2 de bondad de ajuste a una ley 27L
Sohtc'ión,: La hipótesis nnla es sriponel que no hay ¡l'eferrencia por una caja palticular o, lo que
es 1o rnismo, que los datos siglren Lrna ley uniforrne con
xza" : f@t-"t)2
ei
i.:r
: (34-4q2 _64-4q2 _Q9-44)2 _gB-4q2
44=44.44=44-44 -(+S-+q2
4. Regi,ón rl,e Rechazo. Como X3.os(5 - 1) : 9.49,\aregión es XZt"> 9.49.
5. Deci.szón Aquí, XZa"no está en la región de rechazo; de manera que se puede decir que no
hay preferencia por ninguna caja.
2 En una ensambladora de carros se registró el número de defectos por unidad en una muestra de
100 unidades que se inspeccionaron durante una semana dada, dando la siguiente distribución
de frecuencias:
Número de defectos 0 1 2 .) 4
Número de carros 63 20 8 5 4
€_0.67(0.67)o
Po : Pr(X:Q) : : 0.512,
0!
€-0.67(0.67)1
Pt, : Pr(X: 1) : : 0.343,
1!
67
e_o (0.6n2
Pz : Pr(X :2) :
2t'
:0.115,
6T
e-o (0.67)3
P3 : Pr(X:3) : ol
JI
:0.026,
e-0.67 (0.6n4
P+ - Pr'(X:4) : : 0.004.
4
eo : 100 x 0.512
-- 51.2, et: 100 x 0.343 :34.3,
ez:100x0.115-11.5, e3: 100x0.026-2.6,
et : 100 x 0.004 :0.4.
272 Capítulo 9. Pruebas de Hipótesis lVo Paratnétricas
1. Hipótesis NuIa. 11¡: Los datos siguen una ley de Poisson P(0.67).
2. Hi,pótesis Alternatzua. 11r: Los datos no siguen una ley de Poisson P(0.67).
3. Estadísti,co de Prueba. X?ot":4I.72.
4. Regi,ón de Rechazo. Como x3.os(5 - 1- 1) :7.81 y la región es XZu" > 7.81.
5. Deci,si,ón Se cumple que 4I.72 > 7.81; entonces, se rechaza Ia hipótesis nula. El número
de defectos no siguen la ley de Poisson P(0.67).
Para el nivel cle sigrrificación 0.01, 'i'erificar la hipótesis de que el tiempo rnedio de trabajo de Ios
elementos está distlibuido según una Iey exponencial.
Solu,czón: El parámetro .\, que sigue la ley exponencial, se estima po, 1 : ! : O.r.
T
Calculemos las probabilidades de que la variable aleatoria tome valores en cada inten'alo:
Análogamente, se obtienen
Como las tres úrltimas frecuencias son pequeiras, se las puede agrlrpar en una sola clase, obtenién-
dose k : 4 clases. De esta manera, se dispone de Ia siguiente tabla que muestra el grupo, la
frecuencia observada y la frecuencia teórica.
1 133 t26.42
2 45 46.52
D 15 17.10
4 7 9.48
Total 200
1 fI'ipótcs'is Nrtla. 11¡: Las obserr,¿ciorres sigucrr rrrrrr lcy <rxporrcuciul t(0.2).
2 Htpótes'is Altr:tr¿a,ti,tstt,. H1: Los cl¿rtos u<l sigucrr rrrrir Icy r:xponencial €,(0.2).
3 Estct,díst'i,co de Prt¿ebu.
f
,
rlr., : rl
)
(rt,
.-:
- c,)'2 (133 - 126.4D2 (45 - 46.5\2
+
(15 - 17.10)2
e i 126.42 46.s2 17.70
-,:,
: 1.299.
150 - 155 61
155 160 22
160 165
-\ cotrtintiaciótt se ¡rresenta ttn resurnen de los estirn¿rdoles cle los prrr'árnetros de las Ieyes más comLlrl-
rlentc enipleaclas.
274 Capítulo 9. Pruebas de Hipótesis -lVo Paratnétricas
Ley Estimador
Binomial Bin(n,p) p- -u
TL
Cuando tenemos la información de 2 variables de tipo cualitativo, se la resume en Lrna tabla de cont'in-
gencia, que es una tabla de frecuencias de doble entrada, donde en las filas se ponen las modalidades
de una variable, y en las columnas las modalidades de la otra; en las celdas resultantes del cruce de
las filas y las columnas se coloca el número de elementos que presentan ambas modalidades.
Si se tiene información de.lü elementos acerca de las variables Ay B, de tal forma que prescntarl r y
c modalidades respectivamente, Ia tabla de contingencia r x c (r filas y c columnas) es de la forrna:
Variable B
Variable -4 B1 B, B. lbtal
At ??"TI nli n C nL
Total n.7 n1 nc ¡ú
donde,
ni.
f¿: N' 7r. . . ,T,
f¡ : n.i J
¡y'' r
;-
lr''' ,c'
Bajo la hipótesis de independencia entre filas y columnas, se tiene que la frecuencia esperada en la
celda ubicada en la i-ésima fila y j-ésima columna es
e¡j: NF¿.0t:U#
xZa":iiry,
i:l j:L "Ll
que sigue aproximadamente una distribtción y2 con [(r - 1)(" - 1)] grados de libertad.
2. Hipótesi.s Alternatiua. Ht: p¿t * p¿.p.¡, para al menos una celda de la tabla (la variatlles A y B
no son independientes).
@¿¡ e'¿¡)2
3 Estad,ísti,co d,e Prueba. XZu,: i É - .
Ejernplo. En una investigación se desea revelar si existe relación entre el consumo de combustible y
el origen de los carros que circulan por la ciudad.
Origen
Consumo EE.UU. Europa Japón Total
Bajo 76 56 70 202
Alto 160 t4 9 183
Total 236 70 79 385
en
nt.n.r 202 x 236 : !23.82,
nL.n.2 202 x 70
:36.72,
N 385 ¡/ 385
etg :
nt.n.s 202 x 79
:4I.45, e2l:
n2.n.l
-----;=-
183 x 236
: 112.18,
N 385 /v 385
n2.n.2 183 x 70
:33.27, (,.r.!
n2.n.3 183 x 79
: 37.55.
¡ú 385 - A,/ 385
-
276 Capítulo 9. Pruebas de Hipótesis lVo Pararnétricas
Origen
Constlmo EE.UU. Europa Japón
Bajo 723.82 36.72 4\.45
Alto 112.18 33.27 37.55
1. H,i;pótesis N,ula. /16: El origen del c¿rlro y el consurno de combustible sou iudependientcs.
2. Hi,pótesis Alternat'iua. .F1r: EI origen del carro y el consumo de combustible están relacionados.
3. Estadístico de Prueba.
(76 - t23.s\2
xZt
" r23.82
(160 - 112.18)2
112.18
: 101.51.
5. Deci,si,rin. Como 101.51 > 5.99, se rechaz¿r ltr hipótesis nula. Coucluinros qtte ltal'relacióIt entre
el consurno de combttstible y eI origen de los carros.
Tablas de contingencia de 2 x 2
Variable ll
Variable A 81 132 Total
A1 ab a*b
A2 cd ctd
Total aic b+d n,
t{ad - bc)2
xZt* = (a b)(c d)(a c)(b d)'
+ + + +
Sexo
R.c¡rcción HorrrlrLr-'s \Irrjcles Tolal
Dcsfavorable 1t) ,] 15
Favolablc 3 7 10
Total 13 72 o-
:¿
1 ÍIipótesis AluLa. fI6: La lc¿rccióri ¿rntc el corr,:rrtri¿rl crs inclcpcrrclicntc clel sero.
') Hi,pótcs'is tlltent,otiuo. 111 : l,a rc¡cr:icirr ¿rltr¡ cl c:orrrcr'<:i¿rl y cl ,5cxo cst¿itr rclacionacios.
Rngzón de Recl¿o.zo. Si escogcrrlos rr:0.05, \'crrros,1,,e ¡lo¡,(l) :3.34. La legión cle lecliazo cs
\;i,, > 3.84.
5. Decis'iótl Como 3.23 < 3.81, no sc lech¿rza la hipótcsis lula. Se concluye clue hay inclepenclencia
entre el sexo del espectacLol y la accptaciórr clel comcrci¿rl.
Sc srLgiele c¡re cl leciot re¿rlicc cl c.jeLcicio niecliante el r:¿ilc:rLlo cle las ficcLrcricias cspeladas
i. Hi,pótesi,s Nrtla. ÍIs: L¿ts tltLLcstlzts ptttvir-'rrcrL rlc rrrra rLrisrr:r ¡toltlurciórr (lers llLlest,t¿irs sttrr lro-
nrogénears).
') Alternatiua.
H t'pótes i,s 11¡ : Las nttlcstras no ptovicncrr clcl rur¿r nrisrua ltoblarción (lars rnucstlz-rs
son hetelogéneas),
(tt'j
Estn,díst'ico dc PrtteLto, \I\, r/,.r -.-
- r-1- 1-
r- ' ',t)
it¡t ('j
4 R, qión ,le Rcc'l,azo. l.¡t hipcitesis cie inclepcrrrlcnc:i¿,r sc lcc:hrrz¿r .i 13,,., > X3l(?'- t)(c- i)].
trjemplo. En uua Facultacl sc clasificó ¿i las rrolas obfr:nicl¿is L)or sus alumnos, luego cle lenclil cl
luisllo exalren Física. conro )ra.jas. rlccli¿rs v all¿rs. 'fanbión. sc rcgislr'ó cl plofcsol clue clictirba la
cle
rlater-ia. obtenienclo:
C¿ililic¿rcic'rrr
Plofcsoi lia.¡a i\lc<liir,,\ll¡ lLbral
tl 1,2 23 l .12
1) 2¡ r7 r! .16
,)
lirl rl ,l 0 ll ,!8
278 Capítulo 9. Pruebas de Hipótesis No Parantétricas
Calificación
Profesor Baja \'Iedia AIta
A .7 19.1
t7 5.3
t)
l) 19.3 20.9 5.8
1. Hipótests Nula. 11¡: Las difer-elcias eu las not¿rs no son debidas rrl plofesor de la materia.
2. II'ipótesis Alternatiuu,. ,F11 : Lrs cliferencias crr las notas se debelr al profesor.
9.3. Ejercicios
1. En un cluce de carretelas los aulos pueden gir-al a 1a izquierclrr, l Ia derecha o seguir de frentc.
Se supone que la rnitad de los autos scgr-rir'¿irr de fi-ente, la nna cu¿trta parte irá a Ia izquielda 1-
Ia cuarta parte restante a la clclecha. Sc re¿rlizó urr colteo cle los autos según la dirección quc
ellos siguen:
De fi'ente A la izqr-rierda A la derecha
Frecuencia 29 149
Pruebe Ia hipótesis indicada a un nir.cl clc significirciórr de 0.1.
Cuando el naturalista francés del siglo XVIII Georgcs Louis llrLflbn realizó 4040 lanzamientos
cle una rnoneda observó 2048 calas. ¿Cclncuerrlarrr estos datos coL la hipótesis de que la rloned¿r
cs simétrica?
Una zona de \4indo es cl hábitat natur'¿rl <le tles cspccics dc colibríes. Se cree (hipótesis nula)
qlle ulla quinta parte de los colibr'íes pcltcrrecc tr la prirrrera cspccie, dos quintas partes a l;r
segunda especie y otlas dos quintas part<rs ¿r la tercera. En una nnestr"a aleatolia de 34 colibr'ícs
de la zona, se observalol 12 cle Ia priirrcr-er especle. 15 clc la scgrLnda" y 7 de la telcera. ¿IIav
suficiente evidencia estadística (al nrvcl 0.05) pala acepterr Ia hipótesis propuesta?
4 Segirn los datos de un estudio c-rhaustivo rle rrrercado qlle se lc;ilizó en la ciudad, las ventas clc
irnpresoras para comptltadoras lrersonalcs der uso cloméstico sc ciividen entre cuatro marcas (4,
B, C y D) cuyos porcenta,jes dcl total de las vcntas son 18 c/o,22Vu.35% y 25To, respectivamentc.
Un ario después, se quiere analizal de urrcro l¿r situación pcro sc cree qrle no se debe repetir ur
estudio de mercado a gran escal¿r. Se clccicte obserr.ar Ia narc¿r adquil-ida por 200 compradores
cle inrpresoras elegidos al azar. obtcnienclo cpre c1e cllos 28 habíalr clegido la marca 4,48 LaR,77
Itr C y 47 LaD. ¿Hay suficientc cvidenci¿r. ¿..1 rrivcl 0.05, para tl[iL'r,-rzrr clue el reparto del mercacio
y¿r no es el mismo quc el arlo ¿rnl-eriol'/
9.3. Ejercicios 279
a) Compare los resultados de la elección con cada Llna de las investigaciones de las empresas;
b) ¿Se puede determinar cuál de las ernpresas dio el resultado más certero? Explique.
6. Cuando Gregor N4endel realizó sus experinrcrrtos clc cnlzarniento de guisantes, obserr,ó las fre-
cuencias de varias semillas producidas por híbriclos dc guisantes amarillos Lisos y guisantes verdes
mgosos. Estos datos y sr-rs respectivas probabilida,cles, segirn las predicciones de la teoría de la
herencia de Nlendel, se dan en la siguientc tab1a.
Para un nivel de significación del 1%, erarline si las frecuencias rle los datos son consistentes
con las probabilidades teóricas.
7. En el desarrollo decimal de z- entle los 10 03E primeros dígitos aparecen 968 ceros, 1062 unos,
1021 dos, 974 tres, 1014 cuatros, 1046 cincos. 1021 seis, 970 sietes. 948 ochos y 1014 nueves.
a) ¿Se puede considerar clue los dÍgitos apa,recen nniformementc distribuidos, a un nivel de
significación a : 0.05?;
b) A qué nivel de significación rechazarii ln hipótesis'/
8. Entre 2000 familias que tienen 2 hijos. 522 f¿rnulias lienen dos r.alones, 471 dos mujeres y 1007
de los dos sexos. A un nivel de significaciórr de 0.05. ¿,se puecle consiclerar que el núrmero de hijos
\rarones en las familias es rlna variable alcatoria binomial?
9. En nn estudio a 107 familias qr-re tienen 5 hi.jos. sc coutal¡ilizó el núrmcro de hijas que tienen tales
fanilias, con el siguiente resultado:
Número de )
t) I .) 4 5
hijas
Frecuencia 5 17 28 to
¿L 19 6
¿Puede afi.rmarse que) para las fanilias estucliaclas. el rrúrrler-o cle hijas sigue una ley binonial?
(Use a : 0.05.)
280 Capítu.Io 9. Plueb¿rs de Hipótesis No Pararnétricas
10. Para estudiar la delilcueuci¿r ol] Llrr¿1 r:irrrlacl se ¿rrrot¡r'on l¿r-s clcuulcias ¡lol lobo rle automór.iles
recibidas en los riltinros 575 r1ías. obtt¡niírrrrlose krs siguicritcs losrrltaclos:
No. denuncias 0 L 2 3 4 5
Frecuencia 23t) 210 90 JiJ 8 2
Contraste la liii.rótcsis clc c¡rc los cl¿¡tos plocorlcrr cic rrna <listribucióu rle Poisson con ) : 1.
(a : 0.05)
i1 Se registró la cantiriacl cle goles colsegrrirli.rs uu 1,19 p;rr'1 iclos <lisprrbados por r-rn ecluip o profesiottzrl
de fiitbol
No. cler golc.s
en Lur p¿riti(lo
01234
Frectterttc,i¿t 50 64 23 84
Verifique la hipótesis dc que ol uiruero rlcr golcs Pt.,r llarticlcl cst¿i distribuido segúrr una ley dc
Poisson. para el nivcl clc sig-nificirción 0.l)5.
12 En el transcurso de dos holits, cl nrirlcto dc llaul¿rrlas pol rrrinuto, solicitadas ¿r una cetittal
telefónica ftre:
No. llarnadas/min 0 i ') J tl 5 t)
Frecuencia 6 18
.)
,)-)
,)
JJ
- I7 10 2
¿,Se puede aceptar que e1 núrnrelo clc ll¿rrrr¿rrl¿rs pol rrrirnrto signc una distlibución clc Poisson'J
13. En cierta región sc registró la temperirtur'¿r ck:l ¿rilc chrrantc 300 clías. L¿rs medicioncs se rcsruneu
cn Ia siguiente tabla (en la plinrcla cohurLn¿r se inrlic:¿l el intclvalo de tr,.nperatnr¿r en grados 1'
en la segunda el nÍrmero de clí¿is cuv¿r fclrrL)clratLrLa rrrecli¿,r collcsponclc ¿l cse intervalo). Ver-ifi<¡.re
clue la tenperatura rrrecli¿r est¿i clistribuicl¿r rLrrifolnonrcnte ¿r un livel cle significzrción dc 0.05.
14. Un estudio realizado iuclica c¡re el ticnrpo clc cspera cri l¿r crola rlc la, ca,ja de un banco se pucclc
rnodelizar con Ltlla distribución cxporrcrrci¿rl clc r¡reclia 3 rninr,rtos. Para cornprobar si este noclclo
sigue siendo r'áliclo, sc tomó la sigrricrrtcr ntrrcstLa:
3 2 6 ,,t 1 3 2 1 1. 4.
\¡erifiquc si los d¿rtos Jloccclcn clcl rrroclckr ospecrifir::rrlo cn cl cstrrclio (cr:0.05).
15. Se probaron 450 focos, t-egistlrindose e1 ticrtrpo c¡rc <lulitlon enccncliclos hasta que ftrilaron:
Nrirnclo Niunelo
Tiernpo Ticrnpo
clc firr:os clc focos
0a40u 131 L6(X) a 20t10 ói)
400 a 800 95 2000 a 24U0 3ij
800 a 1200 76 2'100 a 2E00 )1
1200 a 160i) 5(i
Pala un nivel de significación de 0.01. r-clifÍc1ue la hipótesis clc clue el ticrlpo de dulación clc los
focos está distlibuicla segúrn rrrrrr ic). exlrrIttcuci¿rl.
9.3" Ejercicios 287
16. En la Facultad de Ciencias se quiere averiguar los conociurientos sobre Física que tienen los
alurnnos matriculados por primera \¡ez en dicha Facultad, para lo cual se realizó el primer día
de clase una prueba genera,l. Los resultados correspondientes a rlna nnestra de 211 alumnos se
recogerl en la siguiente tabla:
Puntuaciones Frecuencia
50.5 55.5 4
55.5 60.5 77
b(J.b bli.l) 45
65.5 70.5 67
70.5 75.5 It
dL)
75.5 - 80.5 15
80.5 85.5 10
17. En una investigación sobre el hábito de fumar por lur grupo de estudiantes universitarios se
obtuvo Ia siguiente tabla, en la cuaL se relaciona el sexo del entrevistado y si él o elia es un
funador.
¿Fuma?
Sexo SI NO
Masculino 26 10
Femenino 11 15
18. En un estudio médico a 300 pacicntes que fueron opcradas por cáncer de ovario, se clasificaron
en quienes han sobrevivido 10 años después tl.: la operación y quienes no lo hicir:i.rn, y el estado
del tumor al momento de la operación.
¿La sobrevivencia de Ia paciente es independientc del estado del tumor el momento de Ia ope-
ración?
l9 A firr de probar el supuesto de que una persona desernpleada rcpresenta un alto riesgo crediticio,
en nn banco se realizó un estudio de 100 c:nentas escogidas aleatoriamente con los siguientes
resultados:
Situación laboral
Situación actual del cliente
del préstamo Ernpleado Desempleado
En mora 16 10
No en mora 55 19
20. Se realizó un análisis de sangre de un grupo de 1000 habitantes (elegidos al azar) cie una ciudad
con la siguiente distribución, según el grupo sanguíneo y el factor Rh:
C A B AB
t7-
Rh+ 3r7 81 39
Rh 96 82 29 10
Según estos datos. ¿puede aceptarse la liipótesis de inclependencia, del factor Rh de1 grupo san-
guíneo? (Use cr : 0.05)
2I Se ejecutó un estudio sobre la utilizacióu de ciertas fuentes de financiamiento externas para 1as
pequeñas y medianas empresas (PYN'ItrS), Fara e1lo, se seleccionó aleatoriamente 500 PYMES a
nivel nacional. Las empresas se clasifi.caron segr1n su tarlaño en tres categorías (micros, pequeñas
y medianas) I' según hayan utilizado o rLo a).gr.rna fi.relte de financiación. Los datos obtenidos
fueron:
Con financiamiento Sin financiamiento
Nlicros 115 ó¿o
Pequeñas 20 20
Medianas 15 5
22 Se realizó un sondeo en ia ciudad paradetenlinal 1as posibles relaciones entre el nivel educativo
(superior, medio o primario) de las persolras y el consumo (bajo, medio o alto) de productos
electrónicos. Los resultados, para 400 personas seleccionadas al azar, ftteron:
Nivel Consurno
Educativo Bajo \'Iedio Alto
t)1 4.4
Superior .)-L 47 ++
\4edio 2B 79 125
Primario 16 17 19
23. En una investigación sociológica a un grupo de pcrsonas casadas, se desea saber si el nivel so-
cioeconómico de los encuestados incide sobre el éxito o fracaso de su matrimonio. Los resultados
se dan en la siguiente tabla:
NSE
¿FYacasó? I II III IV V
Si 28 62 79 181 724
No t27 230 443 850 582
¿,Se puede concluir que la diferencia en el índice de fracaso se debe al nivel socioeconómico de
los matrinonios?'
24. trl Consejo Directivo cle una universidad cluer'Ía determinar la opinión de cl.iversos grupos en
relación con el calendario docente propuesto. LIna muestra aleatoria selecciolada entre 100
estudiantes, 50 empleados y 50 profesores dio 1os siguientcs resultados:
Estudiantes Ernpleados Profesores
Favorak¡le 63 27 30
Desfavorable JI z,\ tn
9.4. Pruebas sobre ¿rna soJa ntuestra 283
Si se desea saber si hay prucbas dc una difcrr:ucia, rrrr la ¿rctitucl hacia el calendario entre los
diversos grrpos:
a) Indique cuál es Ia prueba adecuada para la realización de este contraste, y especifique las
hipótesis a contrastar
b) Realice el contraste corrcspondiente, con un livcl de significación del 1 %.
25. Un estudio sobre tabaquismo cn tres ciuciadcs, rnediante tres muestras aleatorias de tamaño 100,
proporcionó los siguientes resultados:
¿Se pueden considerar homogéneas las tres poblaciones respecto a sus hábitos fumadores, al nivel
0.05?
Esta parte del capítulo la dedicaremos al análisis de la,s prucbas no paramétricas que involucran una o
dos muestras y cuyo objetivo es probar si los parámetros de los que provienen las muestras adquieren
ciertos valores particulares. EI lector notará la sinilitud con las pruebas desarrolladas en el capÍtulo
anterior.
En las pruebas no paramétricas sobre Lrna nuestLa se distinguel dos clases: aquellas que contrastan
el valor de una rnedida estadÍstica (de localización, de clisper-sión, etc.) y las que contrastan una
caracterÍstica general de los datos (ajuste a una lcy, aleatoriedacl, etc.).
Existe una amplia variedad de estas prnebas, nosotlos solo exarninarenos los contrastes más comlrn-
mente utilizados y que generalmente se presentan en los plograrlas estadísticos.
Podemos establecer hipótesis acerca de la mediana: sabemos cluc la mediana deja por encima de sÍ el
nrisrno núrmero de valores que por derbajo. Considcrando c¡.re r¿- A'Ied > 0, darán signos positivos
(+) y - Med { 0 signos negativos (-), en la poblaciórr original tendremos tantos (+) como (-). S"
tratará"ode ver hasta que punto el núrrlero de sigrios (+) esta dentro de Io que cabe esperar que ocurra
por azar si el valor propuesto cono mediana es verdaclerol .
Teniendo en cuenta que se trabaja con dos clases de valores, Ios que están por encima y los que están
por debajo de la mediana, los estadísticos de contraste sigucn ura distribución binomial Bin(n,0.5),
si se supone independencia y constancia c.e la plobabilidad el el lnuestreo, ya que la probabilidad de
qne Lur valor se encuentre por encirna (o por deba.jo) rle la urediarra es p : 0.5.
ILo misr-no se puede decil lespecto a los cualtiles, qrrintrles o clecilcs
284 Capítulo 9. Pruebas cle Hipótesis lVo Pararnétricas
Si X es la variable aleatoria que cuenta el nÍrmelo de ocur-rencias del signo menos frecuente; entonces.
su probabilidad se calcula por
Como nos interesa la ocurrencia de valores tan extrernos o más extremos que el observado, la proba-
bilidad deseada es Pr(X < k).
Observaciones
1. Si al determinar los signos de las diferencias, obtenemos un valor cero, a éste no se lo considerará
el momento de contabilizar el número de signos.
2. Si n < 30, se utiliza la ley binomial; en carnbio, si n ) 30, se utiliza la aproximación mediante
x-n
la ley norm al Z : --J - ,A/(0, 1).
\/n
2
r:0 ,'
4. Cri,teri,o d,e Rechazo. 2po6, 1 a.
6.6 6.8 4,4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.
1.6 1.8 - 0.6 2.3 3.5 - 0.5 r.7 1.0 - 1.6 4.7 0.3 _ 0.2.
Lasecuenciadesignos queseobtiene es + + - + +- + + -+ + -. Elsignomenos frecuente
es ( ), que aparece 4 veces; de manera que la prueba es
248912147721222426.
AI nivel de significación del 10 %, probar que Ia mediana de los puntos acumulados por los
equipos en el campeonato es menor a 22.
Soluczón: Tenemos eue ío : 22; entonces hay B signos negativos, 2 positivos y un cero. Por
tanto, n: l0 y k :2; de manera que la prueba queda asÍ:
5. Deci,sión. Como 0,0547 < 0.1, se rechaza -FIs. La mediana es menor a 22.
Esta prueba, también conocida como contraste T de Wi,lcoron, se utiliza para comprobar que la
mediana es igual a un valor dado y para su aplicación es necesario que los datos vengan dados en
escala ordinal o de intervalo. EI procedimielto es el siguiente:
Se determinan las diferencias entre cada uno de los valores observados y el valor hipotético de
la medianai d"¡: r¿ - po.
Se ordenan los valores absolutos de las diferencias, de menor a mayor, asignando el rango 1 a la
rnenor diferencia absoluta, 2 a la siguiente diferencia rnenor, y así sucesivamente. Cuando las
diferencias son iguales, se asigna el rango promedio a los valores que son iguales.
Se obtienen, por separado, la suma de los rangos para las diferencias negativas (T-) y positivas
(7+).
286 Capítulo 9. Pruebas de Hipótesis lVo Pararnétricas
6.6 6.8 4.4 7.3 E.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.
6.7 +r.7 8
6.0 +1.0 5
3.4 - 1.6 65
9.1 +4.r 1,2
ID
U.J +0.3 2
4.8 -0.2 1
Total 63.5 I4,5
La prueba es
Al nivel de significación del 10 %, probar qne la nediana de los pu.ntos acumulados es menor a
22.
donde Fo@) y,S,.(r) son las probabilidades acumuladas esperadas y observadas, respectivarnente.
Los valores de Dr(n) se encuentran tabnlados p¿ua cliver-sos valor-es cle ay n. (Tabla 7)
Ejemplos
1. Tras jugar a los dados, nn apostador conrcnzci a sospechar qlle el casino hacía trampa. Decidió.
por tanto, anotar las tiradas del dado corl c¡re.jugaba,, obteniendo la siguiente tabla:
Número 1 2 .) 4 5 6
Frecuencia 16 10 l6 11 32 15
I. Hipótesis NuIa. -I1¡: Los datos siguerr Llna Iey uniforme discleta coD p: If 6.
2. Hipótesi,s Alternat'iua. 111 : Los datos no sigucn una lcy nniforrne discreta con pt: !f g.
3. Estadístico de Prtteba. D¿s : máx lF6(r) - S,,(r)l : 0.1362.
4. Región de Rechazo. En Ia tabla del contrastc K-S encontramos que D6.65(100) :0.136. Se
define la región de rechazo Dor,,, ) 0.136.
5. Dectsiót¿. Como Dob,) D,r(n), se rcchaza 11¡ v concluimos clue el dado está cargado.
) En uua ellrpresa) el salario rnerisnal cle los t,raba.ja<lotcs se distribuye según Ia siguiente tabla:
Comprobar si se puedc asegurar c¡-re el s¿rl¿r,r'ic,r ureusu¿l.l err clicha clnpresa puede considerarse Lul¿I,
valiable ¡/(306,58).
9,4, Pruebas sobr"e u¡ra soJa rnuestra 289
Sohtción: Completemos la tabl¿-L de frccucnci¿rs rel¿rtir'¿rs acurnuladas, calculando ias dos dis-
tribuciones (la muestral v Ia teórica) , tcnicnclo en crreuta que para calcular F6(r) deberelros
utilizar la tabla de la lev nornal.
4. Región d,e Rechazo. En la tabla encorrtrarnos clue D¡¡5(1 46): +:0.1126; etltonces,
,/ua
la región es Do6,u > 0.1126.
5. Dec,is,ión. No se rechaza 11¡; consectrelte[rente. los sa]arios siguen 1a ley,A/(306,58).
Definición (de racha). Una racha es nna sucesión c1e v¿rloles por cncima o por deba.jo de ia
mediana.
La longitud de una racha es el número de observaciones consecutivas que tienen esta propiedad.
6.6 6.8 4.4 7.3 E.5 4.5 6"7 6.0 3.4 9.1 5.3 4.8.
ia rnediana es Q2 :6.3, luego de representar por ( ) Ios valolcs infcriorcs a la rnediana y por (+) a los
snperiores, obtenemos la secuencia: +, +. -, *, *, , +. , , *, . Existen 8 rachas de longitudes
2,7,2, r, r,2, 1,,2.
Scetn rn6" el núrmero de rachas enuna sucesicin or-dcrracl¿l <-le observaciones; nr v n eI número de obser-
r.aciones que están por debajo v por encima cle l¿r nrecliana cle los datos, r'espectivamente. Con estos
elernentos e1 contraste queda de la siguiente irtattcta:
1. Reqiór¿ tle Rech,o,zo. 't'ol¡.s 1 1,, (rrr, rr) {) ?',,¿," ) r,,, (lrr. tr ).
Los'r,¿rlorcs cle compa,ración para, esta pmeba se errcrrentr'¿ur tat¡rrlados (Tablzr 5).
Ejemplo. En nna prueba de aptitr-rd tomacla a 12 aspirautes a un puesto en una elnpresa sc oblnvielor
Ios siguientes punta.jes:
6.6 6.8 4.4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.
Solución: La mediana de estos datos es 6.3. Si a cada nno de los datos Ie restamos la mediana, queclr
Ia siguiente secuencia de signos: f , *, , +, +, -. +, , , *, ) .
4. Región de Recho,zo. En la tabla, verfros los valores críticos con cy :\Tt 3 ( ro¿," ( 10.
5. Dectsión. Como robs :8 cae en la región de aceptación, podemos afirmar que los valores ¿lpare(ier-
aleatoriamente.
Esta prueba permite identificar la presencia de r'¿rkrres extr-emos cn Lll conjunto de d¿rtos. Par'¿'
la detección de valores atípicos, en gelelal, se manejarr cliterios empír'icos; por ejempio, cllre Lu1r,
observación esté alejada una distancia dc nrás de 3 desviacioles estándar de ia media) pero esto:
criterios no tienen fundamento técnico y descuidan la influcrcia del tamaño de la muestra.
Este contraste detecta un valor atípico a la vcz y cada nno clebe letirarse de la rnuestra iterativ¿rrnentc-
hasta que no se dctecten más valores atípicos. La prr.reba fue desarrollada por Gnrbbs2 y se basa en
ia suposiciór qrle los datos sigrten de una lcy normai o qlre prreden ser aproximados razorrablcrncntc
pol ésta;i.
:
rnáx{lz¡ - rl}
3. Est,odísti,co de Pruel¡a. gobs
La tabla de puntos porcentuales para la prueba dc Grubbs se encuentra en el Apéndice (Tabla 8).
Ejemplo. En una prueba de aptitud tomada a 12 aspirantes a un puesto en Lrna empresa se obtuvieron
los sigrrientes puntajes:
6.6 6.8 4.4 7.3 8.5 4.5 6.7 6.0 3.4 9.1 5.3 4.8.
2. H'tpótests Alternatzua. I11 : Hay al menos urr valor atípico en el conjunto de datos.
máx{lz¡ - 7}
? Estadístico de Prueba. gobs: l-
19.1 - ''
- 6.1171 1.74.
s 1.776
4. Regi,óndeRechazo. EnlatabladelapuntosporcentualesseleequeG6.65(12):2.¿tylaregión
de rechazo€S gobs > 2.4I.
5. Decis'ión. Como 7.74 < 2.29, entonces r : 9.1 no es un valor atípico; es decir, la muestra no
contiene valores atípicos.
Las pruebas no paramétricas sobre dos muestras que examilaremos son análogas a las paramétricas
para comparar dos medias; es decir, para datos emparejados y para muestras independientes. También
se presentará una versión no paramétrica del coefi.ciente de correlación.
Sea (r1,y1), (rz,Az), ..., (rrr,gr,,) una muestra aleatoria de pares de observaciones; donde (r¡,A¡)
representa dos mediciones tomadas de la misma ulidad nuestral. antes y después de un tratamiento o
fenónrenoquelaafecté. Seconstruyeunamllestradelasdiferenciasdl , c12,..., dr,,,donde d¡:r¿-A¿
(z : 1, 2,. . . ,n) y se aplica la prueba del signo para Lrna muestra; es decir, contamos el número de
observaciones negativas y positivas y determinanos cuál es el signo que menos aparece y cuántas
veces Io hace (k). Además, llamaremos Q, ala mediana de la población X y Qy a la rnediana de la
población Y. Con ésto, las pruebas son las siguicntes:
li;
n
Pr(X < A) :
3. Estorlístzco d,e Pru"eba. pt¡bs:
t
l':0
C'|,p'(7 - p)tl-l j clonde k <
t
4. Crzterio de Rechazo. 2po6" I a.
2. Se asignan rangos a la mucstra conbin¿rd¿r clc l¿rs dos mncstras. Si se prodr,rccn empates,
asignará el promedio de los rarlgos a las obselvaciolr:s cntpataclas.
Los valores de comparación pala esta prueba se encnentlan tabulados (Tabla 10).
Ejemplo. EI dueño de nn ahlacén registr'ó l¿rs r.errtas scnranalcs de sus dos erlpleados y quier-e sabet'
si ellos pueden considerarse iguales como verrclcclores. En la siguiente tabla se numeran las'u,cntas cle
cada dependiente.
Empleado A t97 191 188 185 180 1-rt
1/J 169 169
Ernpleado B 190 166 175 172 1b/ 180 160
169 4.5
n¿:E 7 ! RLrngos : 77.5 Rangos : 42.5
1. R.egiórL d,e Recl¿o.zo. Par'¿r cL:0.01, [/ooL(8,7) :8; crtorrccs, la, región cs [/o6" ) 8.
5. Deciszón. Corno 14.5> 8. se lcchaza 110: cs rlccir. los clos cnr¡rleaclos venclen iguales canticl¿-rclcs
Capítulo 9. Pruebas de Hipótesis No Parantétricas
Si disponernos de n parejas de obscrvaciones (r1, At), @2,y2), ,.., (",r,A") de dos variables X y Y
y asignamos rangos a la primeru (Rr.) y a la segunda courponent" (Ru) de las parejas, se define el
coeficiente de correlación de Spearman como
cS¿r
-1- L
' t:l
r":1
ttltP 1)'
donde di: Rro - R.0,, es la diferencia entre los raugos asiguados a.T,¿ y yi.
El procedimiento para su cálculo es el siguiente:
" Cttando el valor del coeficiente cs cercarro ¿-r ciero, inclica qrre hay poca o ninguna asociación entre
las variables.
2. Hipótesis Alternatiua. H¡ p l0
3. Estadístico de Prttebn. t'.s
Alumno 1 2 4
I
i) 6 7 8 I 10
Algebra I7 18 l9 72 OD
it)
.)2 o( 26 31 aa
.)< DO ,D
Cálculo 2T I4 27 18 20 34 .)L 39 JJ
9.6. Ejercicios 295
t) o,
L¿ 25 55 5 05
7 25
t^
,)+ 7 I -z
o
8 26 32 8 7 1
I 31 39 9 r0 -1
10
DD
r)r) tt 10 8 2
Do? :2e.5
rl:l
1A
c\-¿2
",/-*t
6 x 29.5
r-:7-
' ,i,l :l : 0.821.
tlQt¿-l) 1o(100 - 1)
2. H¡ p l0
Hipótesis Alternatiua.
9.6. Ejercicios
17 15 20 20 25 32 28 25 35 12 26 24
Utilice un nivel de significación del 570 para pr-obal clue la nediana del núrmero de denuncias no
es nayor a 20 por día:
2. En un estudio sobre las relDesas enviadas por los parientcs emigrantes a varias fanilias dio los
siguientes resultados (eu miles de dólares):
2.4 2.3 1..7 r.2 2.5 3.6 4.2 2.2 2.3 3.1
Con el empleo de o : 0.05, pruebe si la trediana de estas lemesas es diferente de 2700 dólares:
3. Para ingresar a Lula agencia balcaria se formó una cola folmada por H (hornbres) y lVI (mu.jer:es),
que está formada así:
H \4 H N4 II H H N{ H H H N,f N4 H M
4. Un profesor registró el nirmero de estudiarrtes ausentes a sus clases durante 24días corrsecutivos.
38 31 32 27 28 30 26 33 36 30 28 35
32 29 35 3i 33 31 28 30 28 25 29 33
Enero 19 Julio 22
Febrero 23 Agosto 24
N4arzo 20 Septiembre 25
Abril 17 Octubre 28
Mayo 18 Noviemble 30
Junio 20 Diciembre 27
a) Aplique una prueba de rachas para decidir si los datos pueden considerarse aleatorios;
b) ¿Es posible afirmar que la mediana es igual a 23?
6. Se desea ajustar la clistr-ibución cle la canticlad cle corr-eos clectrónicos que recibe el serviclor cle
uDa empresa durante ltu ilterr¡alo de cinco ninntos. Pala 400 intervalos de cinco minutos se
contaron la cantidad dc mensajes recibidos y se obtr-rvierou las siguientes frecuencias:
No. correos 0 1 2 ,) 4
I
O 6 7 8 I 10
Frecuencia I 11 47 76 68 74 46 39 15 o 8
¿Los datos pueden considelalse distribuidos con la distribución de Poisson con ): 4.6?
7 Los siguientes datos collcspondcr a los tienipos clc clulación (medidos en meses) de lámparas
malca Lucky:
3.33 6.71 2.53 7:5 16.82 3.56 0.17 2.r5 3.51 7.24.
a) Estudie si es razottablc suponer c¡Lc los clalos colresponclen a Lrn¿r distlibución exponencia.l;
il
9.6. Ejercicios 297
8. Los siguientes datos corresponden a los tiempos de vida (en semanas) de colonias de bacterias
criadas en un laboratorio bajo condiciones estables de temperatura y humedad:
9. Se registró el caudal promedio (en m3/s) que ingresó a una central hidroeléctrica durante 12
días consecutivos:
99.0 79,8 77.4 87.8 59.0 7r.0 5r.4 92.7 69"4 68.9 70.r 90.2.
11. Se dispone de una máquina para llenar latas con 10cm3 de aceite (las latas llenadas al borde
tienen una capacidad de 11cm3). Un operario afirma haberla ajustado de modo que la cantidad
de aceite Uue envla el pico ae la¡alrina e.nvasadora es de (10+e)cm3, donde € es una variable
aleatoria con la distribución U I -+,+1. Para verificar la afirmación anterior se estudió el
contenido de 12 ratas out",.'i",'¿) r"t*;-tl/"."::1J::':" ,,
0.098 0.068 -0.004 -0.026 -0.012 0.096 0.050 0.062 0.036 0.04 0 0.054.
\2. llrr fal¡ric:¿urtc ilc frrsiblcs asegura que) colr una sobrecarga del 207a,los tiernpos dc r.ida dc sri.
fusibles (descle (lue se conectan con sobrccarga hasta que se funden) se clistribuyen unifornenerrtL
cntrc 10 minntos y
15 minutos. Para probar esta afirmación Lrna mlrestra de B fusiblcs fue
sometida a Llna sobrecarga del 20%. Los tiempos en quc tarclaron en fundirse dichos fusibles
firerorr los siguientes:
13. En una empresa operadora de tarjetas de crédito se está analizando el historial del último an,,
de1 consumo mensual de un cliente. Se conoce que el promedio de sus conslrrrros es 645 dólares
y desviación estándar de 148 dólares. Si se encontr'ó que este mes tuvo un consumo de 320t,
dólares, ¿debe considerarse que el cliente tuvo un comportamiento atípico?
L4 La población ecuatoriana adulta tiene una estatura promedio de 162 cm y desviación estándal
de 7.5 cm. En una muestra de 25 personas) ¿a partir de qué valores de la estatura podeno.
colsiderar que hay presencia de valores atÍpicos? (Use cr : 0.05).
Pruebas sobre dos muestras
15 En dos laboratorios se realizaron rnediciones del punto de ebullición de nn compuesto de silicr,-
(en "C) de 8 muestras diferentes.
Muestra 1 2 3 4 5 6 7 8
Medic ón1 99.78 99.17 100.06 100.14 99.43 100.60 100.59 99.98
Medic ón2 100.16 100.09 99.91 100.36 99.77 101.09 99.93 100.06
1b Se presume que un tratamiento reduce el peso de las personas. Mediante una muestra aleatoli.
se seleccionan 10 personas que siguieron dicho tratarniento durante todo el tiernpo exigido. E:
la siguiente tabla se presenta el peso de cada paciente, antes y después del tratamiento (rnedid
en kg).
o
Persona 1 2 r) 4 5 6 7 B o 10
Antes 108 72 B1 r04 69 /d n, tl4 86 92 98
Después 95 76 69 B1 56 81 92 B1 77 97
Analice si hay diferencias entre las localizaciones de las dos muestras. Use a:570.
9.6. Ejercicios 299
19. Los siguientes datos son los tiempos de duración (mcdidos en meses) de 10 lámparas marca
Luckv:
3.33 6"T1 2.bz r.rb 16.82 3.b6 0.r7 2.r5 3.b1 7.24.
Se dispone ahora de una nueva muestra, independiente de Ia anterior, de los tiempos de duración
de Iámparas de marca Wizard:
5.60 3.03 7.46 r.6.52 0.37 0.58 3.38 9.15 0.90 4.44.
Implernente una prueba de cornparación de rluestras para concluir si es razonable suponer que
las nuevas iámparas tienen la misma duración que las anteriores.
20. Los siguientes datos corresponden a los tiernpos de vida (medidos en nanosegundos) de partÍculas
radioactivas emitidas por cierto material:
20.05 1.30 2.54 1.95 9.20 4.20 1.84 7.02 5.60 1.80.
rr,--\
\:L): Ilt-! r
si r>l;
|. 0. caso conl rario
2.60 4.81 12.79 3.82 7.2r 1.68 15.50 12.03 r.70 9.40.
2I. Se tienen dos muestras independientes entre sí, correspondientes a los tiempos de duración (en
años) de sistemas electrónicos de marcas distintas. Se desea saber si los equipos de arlbas marcas
tienen niveles similares de Curación o si alg.,rna de ellas presenta una duración significativamcntc
lnaYor.
a) Aplique La prueba cie rachas a ias muestras para decidir si se pueden suponel aieatolias;
b) Aplique a ambas muestras las pruebas de siglros y de rangos signados de Wilcoxon para
decidir si los valores X^:0.69 y Yrn:A35 son vaLores aceptables para las medianas;
c) Pruebe si la mediana de la muestra X es mayor que Ia de la muestra Y.
22 En una investigación de mercado se pidió a dos niños que calificaran a 10 juguetes en orden de
preferencia (de 1 a 10), obteniéndose la siguiente tabla:
Juguete A B C D tr F G }I I J
Niño 1 B I 6 2 1 4
I
J 7 O
rJ r0
Niño 2 7 10 8 5 a 2 4 6 1 9
at
¿¿ En un estudio sobre cor¡.ercio internacion¿.r1. sc orrlcn¿rron dc rnaner¿r decreciente a los principai,,-
socios comerciales sudanericanos de Ecu¿rdor v Algcntina.
Calculc ei coeficiente de corleiaci<in rle Speannan v verifiqr-rc si hav asociación entre Ias ordeu¿.-
crones.
24. Las siguientes son las calificaciones obtcuidtrs por 11 jtir.erres cluc se soneticlon a evalllacionÉ.
en destreza rnanual v memoria rrislr¿rl.
D. manual 1 3 4 5 6 8 l0 11 13 I4 16
M. visual l8 j,J an
11 15 16 31 39 5ti 45 43 t) I
R.ealice una prueba para determinar si existe correlación errtre las calificaciones en las dos er'.--
luaciones.
25. Un grupo de irn,estigadores desea er.alrlar si un nuevo equipo dc tratamiento aguas residual¿.
es efectivo para reducir Ios niveles de contaniración de las agllas vertidas a rrn río por 1.
curtiembres. A tales efectos se midió el nivel de contaminantes antcs v despnés del tratarnient,-
Ios resultados fnelon los siguientes:
Planta I 2 3 4 5 t) 7 B I 10
Antes 1.52 2.92 4.44 4.24 t.72 3.70 3.64 4.82 2.72 2.08
Después 2.08 303 0.80 096 2.7r 2.39 3.07 2.87 0.33 r.76
a) Detenliue si efcctivamcnte se lta proclnciclo rrna reclucción en los rrivcles cle contaminacic,:
b) ¿Las dos muestras están cor-relacionadas?
Ca pítu lo 1ü
¡Iuchas de las aplicaciones estadísticas requieren la estimación de las relaciones existentes entre dos
' más r'¿rriables; por ejcmplo, puede ser necesario responder a las preguntas ¿cómo varía el prccio
:-,lomedio anual del maí2, según la producción a nivel nacional? o ¿cómo varÍa el consunio de gasolina
le nn ¿rulo. según su peso y ia potencia del motor? trl interés se centra, entonces, en determinar una
.cnación clue relacione Llna variable dada con nna o más variables que contienen información sobre
.,i primera. A estos problemas dedicaremos los dos sigtr,ientes capítulos; antes reviscmos algo de Ia
--istoria de esta parte dc la estadística.
lio exactitud, quién y cuándo empezó a tratar de expresar algebraicamente las rclaciones
se conoce) con
.ltre dos o más vanables, de las cuales solo se dispone de un conjunto de observaciones; pero eu los
-scritos de Leonardo da Vinci, cuando él trata de las proporciones del cuerpo humano, se encuentt'an
.:lpresiones aritméticas que relacionan las medidas de diversas partes del cuerpo.
-,-n
intento, que está bien documentado, data de 1755, cuando Boscovich y Christopher Maire estaban
-lcargados de medir la longitud del arco de meridiano qne pasa por Roma. Boscovich concibió nn
,étodo para encontrar nn modelo que relacione los datos correspondientes a dos variablcs, mediante
., empleo de las llarnadas <<regresiones elementales>>. Esta técnica fue mejorada por su autolen 1760
'' I.L-.esii.:l Lir.a ícrl,a iriás csi,rticl.ti¿r,j.e por Laplace) Linos alos más tarCe.
rn 1805, Legendre publicó una obra de astronomía, en la que describió el método de los mÍnirnos
- radrados y 1o aplicó ai ajuste de datos observacionales. Tarnbién, hay una serie de artículos pre-
.-ntados por C. F. Gauss a Ia Sociedad Real de Gotinga en los que describe el método de mínimos
Ladrados. Luego, en 1885, Sir F. Galton presentó en la rer.'ista IYature el desarrollo complcto de esta
-=cnica. aplicada a lo que él denominó modelos de regresiótz. A partir de esta fecha se mejoró y se
-,mpietó la técnica, haciendo que ella sea la de nayor erlpleo en el ajuste de coniuntos clc datos"
301
Capítulo 70. Regresión Lineal Simple
altura dada, o la fórurula que nos indica el interés ganado por un capital, dados la tasa de interés y e1
Sin embargo, en la vida diaria, tara vez se presentan fenórnenos que reproducen con exactitud una Ie¡'.
ya sea porque existen errores en la medición o porque hay otras variables que no son consideradas.
por stl escasa influencia, pero que son sufi.cientes para que el modelo propuesto no sea exacto.
1. Descripción cuantitativa de las relaciones entre una variable dada y un conjunto de variables.
En lo que sigue, nuestro interés será determinar una ecuación clue relacione una variabie dada con otra
variable de respuesta, bajo el supuesto que ellas se vinculan mediante una ecuación lineal de primer
grado, caso particular conocido como regres'ión lineal si,mple.
lJ: l3ol7fl,
donde B¡ es la intercepción de Ia recta con el eje y y Ér es la pendiente de la recta. (Véase Figura
10.2)
Intercepción
- Pendiente:p,
-{
! = fro
Este rnodelo es determinista porque no considera el error y los valores de g se obtienen, de manera
exacta, al sustituir los valores de r en la ecuación de Ia recta.
Cuando se desea incorporar al modelo determinista ei efecto aleatorio de las variables se le añade una
componente que corresponde al error y el modelo queda como
a: 0ot Ap I e, (10.1)
donde
B1 la pendiente de la recta.
Para recoger el efecto aleatorio del error, harenos las siguientes hipótesis sobre e:
2. Los errores, correspondientes a dos observaciones distintas, son independientes entre sí: E(e ¿e¡) :
0.
Ejernplos de modelos de regresión que se presentan en la vida cotidiana son los siguientes:
,
u €
Efecto del nivel socioeconómico,
Presupuesto de gastos Número de miembros
tenencia de la vivienda, servicios
de un hogar del hogar
que dispone, etc.
Efecto de la zona de ubicación,
Precio de nn
Area de construcción trpo cie acabados, piso en el que
departamento
se encuentra, etc.
Efecto de las variaciones climáticas,
Crecirniento anual
trdad del árbol variedad del árbol, fertilización de
de un é.r1-.ol
Ia tierra, etc.
Número de páginas Efecto del tipo de papel, la encua-
Precio de un libro
del libro dernación, número de ilustraciones, etc.
rn el análisis de regresiónes necesario tener en cuenta los siguientes pasos que llevan a estimar un
'len modelo) que se ajuste a los datos:
Tener una visión clara de los objetivos del estudio, para determinar cuál ha de ser Ia variable
respuesta y qué variables pueden incluirse como variables independientes.
Recopilar los datos correspondientes a las variables identificadas como dependiente e indepen-
dientes.
304 Capítulo 70. Regresión Lineal Sirnple
3. Postular un modelo, al que se supone se a,justan los datos (en nuestro caso se presume que es €-
Iineal simple).
4. Determinar la ecuación de regresión; es decir, estimar los coeficientes del modelo propuesto.
I
L,. Comprobar estadísticamente la adecuación del modelo. Esto incluye la realización de prueba..
estadísticas sobre los parárnetros, la ejecución de transformaciones de las variables para obtene:
un mejor ajuste o retirar variables de nna ecuación si su aporte no es signiflcativo en ia ecuació-
de predicción.
6, Cuando la ecuación sea satisfactoria, usar el nodelo para efectuar estim.aciones o predicciones.
Una vez que se han curnplido los tres primcros pasos) nuestro objetivo será estimar los coeficientes de
modelo y comprobar la adecuación del modelo.
donde bo y h son los estimadores de B¡ y B1, respecti-u'amerrte; ellos deben ser tales que la surla d¡
los cuadrados de las diferencias entre los valores observados de la variable respuesta y su estimaciór-
por la ecuación de regresión sea mÍnima.
Nosotros buscaremos los valores de ó¡ y b1 eue minimicen la snma de los cuadrados cle los errores.
tarnbién llamada suma d,e los cuadrados de los res'idu,os:
scE : >,"::f,fun-\)2
: Llr, - (bo + lrr¿)12
i:7
305
70.3. Método de los rnínitnos cuadrados
ecuaciones:
Dcrivando SCE con resPecto a b6 Y b1 , e igualando el resultado a cero se obtienen las
11
clya solución es
1a
D@¿ -',)(tt'¡
i-l
- Y) gCru
(10.3)
h: TL
r) SCr"'
Llr¡ - -rt )-
i:I
(10.4)
b6 : U-bti,
i",
TL
;,1
Dv
i:7
,iurrclcn-:-j--t'g: sonlospromecliosclclos\¡aloresdelasvariablesinclependientey
?.1 17
,-Lr:penclietite.
queda establecid¿r
u na vcz obtenidos los valores de bs y b1 se
los sttstituye en Ia ecuación; de esta manera
ia recta cle predicción pol m'ínimos cuadrados:
i:bo*b1r'
se clebe tener presente la incorporación de elroles
Observación. En Ia estimación cle los parámetlos de
ie lecloncleo en el cálculo de sc", t- d'e scrr; se recotrriettcla el empleo de un nírrnero suficiente
-ifrassigrrificativasalrealizarloscálculosdeforrrrarnanllai.
de los automóviles v stl con'sulllo
Ejemplo. En un estudio pala determinar la relación entre el peso
con los sigttientes resultados:
ie combustible se escogió .,r,,a rl].,estra de 10 caIlos,
, )l I ilLl ]llf)
rrlra tabla:
?ara simplificar los cálculos, Iestl]nalnos los componentes eu
z: 996.1; ?l :11.4.
,- :
b-
sC,,
--*v 14 905.6
:f-).r-1131.
sc,.,- I 115 830.9
bo : A -bt7 :11.4-0.0134 x 996.1 : -I.9477.
0:-7.9477+0'0734r.
Ahora se puede, por ejemplo, predecir el consurno de un auto que pesa 1000 kg; esto es, z : 1000:
Una vez que se halla una estimación de la recta de regresión) es necesario determinar si 1¿ ss11¿gir-:-
obtenida es un buen rnodelo para los datos y cuantificar el elror que se cornete cuando se emplea t:.-
ecuación. Ésto se logra mediante el empleo de los coeficientes d.e correlación y de d.eterminación, ¡- .,
través de la realización de pruebas estadísticas sobre los parámetros.
Recordemos que si se tienen dos variables aleatorias) una medida de Ia relación que existe entre ell¿-.
es el coeficiente de correlación p. Análogamente, para determinar si existe una reLación lineal entre le-¡
variables predictora y de respuesta se utiliza el coeficiente de correlaczón I'ineal de Pearson, denotad
por r, que se define por
11
L,r¡A¡- nrA
3 Valores de r cercanos a 1 o a -1 indican que existe una fuerte relación entre Ias dos variables.
En la Figura 10.4 se rnuestran diversos diagramas de la rclación entre r y A, segúrn los valores de r.
70.4. Cornprobación de Ia adecttación del rnodelo 307
f*e t
. * \
ü*
A%\
*aa ó
*&-ó úg
Be **s
'd"s
I r r.;.ru1 7*
r = [1.ó7
: tgura 10.4: Diagratnas de dispersión de los datos y valores aproximados del coeficiente de correlación.
:-empre debemos tener en cuenta que el coeficiente r solo aporta información cuando existe tura
-.-ación lineal entre las variables. Pudiera suceder que se tenga un valor de r cercano a 0 v, sin
.:.rbargo, haya una relación no-lineal entre las variables.
308 Capítulo 70. Regresión Lineal Sirnple
Tarnbién, se pueden conducir pruebas unilaterales sobre p, pero ellas solo tienen un valor estadístic-
y su valor práctico es restringido.
Ejemplo (Continuación). Para los datos del consumo de gasolina de los automóviles: a) caicr-rla--
el coeficiente de correlación de Pearson; b) realizar una prueba para probar si p : 0 al nivel o=
significación de 0.05.
Soluc'ión: Los componentes de r son: ,SC"" : 1115 830.9, SCaa :224.4, $Cxu :14905.6.
$cw 14 905.6
:0.94197.
Como r es muy cercano a 1, existe una fuerte relación lineal entre las variables.
b) Para la prueba bilateral consideremos un nivel de significación del 5 %,
Otra medida de la relación entre las variables es eI coeficiente de deterrn'inación, 12. Su empleo st
debe a que da mayor frterza de interpretación a la relación entre las variables. Tenemos que
n n
er1
DUay :D@o - y)2 :Dr? - ne2,
i:). i:7
que se le conoce como surna de los cuadrados alrededor de la media de y o suma de cuadrados corregzd -
de y.
Si denotamos por:
70.4. Contprobación de la adecuación del rnodelo 309
SCE -- D(ao - fr)2, que se denomina como sttma, de uro,drados de los erT'ores. Este término
i:I
también se puede calcular mediante la relación
l,(uo
i:1
-il' fi:I tvo -0¡)2 +L(9, -il2
i:1
2. Como rnedida de bondad de a.iuste. Clrando el ajuste es perfecto, t-2 :I y cuanclo no hery
ajuste, 12 : 0.
Cuanto rnayor sea el valor de 12, mejor será el a.juste y mayor utilidad tendrá corno instrumento
de predicción.
Ejernplo (Continuación). Para los datos dei consllmo de gasolina de los automóviles, calcttlal el
:oeficiente de determinación.
De rnodo que
25.287
t'2:l- : 0.8873.
224.4
Es decir. el 88.73 % de ia variabilidad de ios datos es recogida por la recta cle regresión
SCE
r¿-2'
Ejemplo (Continuación). Calcular Ia estimación de o2 para los datos del conslrrno de combustible
de los carros.
,,: SC E 25.287
:3
's' 161'
"
1: 10 J
Auuque s2 se puede considerar una medida de 1a calidad cle ajr.rste, su principal utilidad se encuentL¿.
en la determinación de la bondad de ajr-rste, ya sea mecliante un intervalo de conflar^za o con Lrn¿-
prueba dc hipótesis.
En primer lugar se desea estudiar si existe o no existe relación entre las variables r y A. Se dese¿-
coutestar a la preguuta ¿aporta r información pala predccir 17? Esta pregr-rnta se refiere a Br, pues
afirmar que y no se lelaciona linealmente con z equivale a decir que B, : 6.
Eutonces, se desea probar la hipótesis nula <<r no contribuye con ilformación para predecir y>>; contr:^
la hipótesis altelnativa, <<las valiables están rclacionadas de forrna lineal con una pendiente distint¡
de ccro>>; es decir,
Ho, 0t:0,
Hr 0tlo.
Para efectuar Ia prueba habrá que encontrar l¿r distribuciól de lnuestreo de 1,1 .
Y
,i
70.4. Cornprobación de la adecuación del rnodelo 311
[,
i
Distribución de muestreo de b1
1{,
Si los componentes del error son variables aleatorias independientes normalmente distribuidas con
nredia cero y varianza o2, la distribución de muestreo del estimador b1 es norrnal con media B1 y
desviación estándar
o
ubt
JSe;
Ésto quiere decir que b1 es un estimador insesgado para p1, pucs E(b1) : 0t y que la desviación
estándar de b1 puede estimarse pol
5
q,
"ut
\/ /.d7'-,
JV, ,.
Entonces. la variable aleatoria ¿:b'- Sbr A' sigue una ley ú a (n-2) grados de libertacl.
a) Prueba unilateral.
1. Hi,pótesis Nula. H6: B, : g.
2. Hi,pótesi,s Alternati,ua. Hr 0t < 0 (o bien .Í11: É, > 0).
3. Estad,íst'ico d,e Prtteba. tobs: --L
slt/Se -,'
4. Región de Rechazo. Se rechaza 116 si tob" 1-to(n-2) (o bien úo6" ) Lo,(n-2) cuando 111:
Ér > o')
b) Plueba bilateral.
1. Hzpótesis Nula. Hs: Br: g.
2. Hipótesr,s Alternat'iua. HI 0t * 0.
Ejernplo (Continuación). Para los datos del consumo de cornbustible de varios carros: a) probar
.i Br :0, a ttn nivel de significación de 0.05; b) obtener el intervalo de confianza algSTo.
Solu,ción,: Antes se había determinado los valores de s y de SCrr:
: r/3J61 : r.TTTS, sc",", :1 11b 830.g.
"
a) Realizaremos una prueba bilateral:
3I2 Capítulo 70. Regresión Lineal Sirnple
4. Región, tle Rechozo. Como tob" ) ioot¡(E) : 2.306 v la r-egión es lúo¿,"1 > 2.306
5. Dectsi,ón, Se lcchaza la hipótesis nnla.: es dccir, el consurno de combustible aument¿-
meclicla qlle se inclcrnrent¿-L el pcso de los carros.
/rs\
(Lr - r" "rr, :t ,r-: t't i i,, .{tt 2)É)
(.,.,,,,-r.30b-]j.I1::{l'(}13.lr.30Ü+):(0.0095l0.0l73,).
\ vr11iE30.9 /rlr5ó30.9/
Sr.rpongarnos c¡.lc se clese¿i ¿rr-crigrral si Ú¡ {)s r$ ual. 1or cspecífico: ello se logra efectuando
prucba rle hipótesis o colr un intervalo cie r:olfi A\Z ncra sirnilar a la rlescrita para p1 .
O[.¡o: o\
\),,i
4. Regi,ón r|,e Rech,azo. S¡.. rcclL¿r,za H¡¡ si t,,¡1," { -Lr, 12(n. - 2) o tub, )> to¡2(rt - 2).
t.,,
i2(rt, 2') :lt¡¡!f ,,/:(n -
[,-
70.5. Análisis de la vartanza 313
Ejemplo (Continuación). Para los datos del consurno de combustible de varios carros: a) probar
si Bo:0, a un nivel de significación de 0.05; b) obtener el intervalo de confi.anza al957a.
Soluc't,ón:
b) El intervalo de confianza es
(
-, .rrr',- r.rouL]Zg./ffi : t roul3l@) : (-6.025; 2.130).
\ x 1115830 9 -r.()J77-
/10 v I 115830.9 J10 /
Significa que la suma de los cuadrados corregida es igual a la suma de cuadrados de los errores más la
snrna de cuadrados debida a la regresión.
La suma de los cuadrados corregida tiene (n - 1) grados de libertad, Ia suma de cuadrados de los
errores tiene (n - 2) grados de libertad y Ia surna de cuadrados debida a la regresión tiene 1 grado de
libertad. Es decir, la igualdad correspondiente a los grados de libertad de la ecuación (10.5) es
n-t:(n-2)+I (10.6)
314 Capítulo 70. Regresión Lineal Sirnple
De las ecnaciones (10.5) v (10.6) se tiene la tabla de análisis de Ia varianza) como la que se presen:
a continuación.
La colnmna dcl <<cuadrado rnedio> (htC) se obtiene al dividir cada una de las suma de ios cuadrad,,
entre sus correspondientes grados de libertad.
El valor de 4a" r-esu.lta de la división del cnadrado medio de la regresión para el cuadrado med-
AIC R
resld.rtal: tobo: a .
5'
Una vez elaborada la tabla de análisis de varianza, el valor de Fo¿" se emplea para conducir una pruet
de hipótesis sobre la razón de dos varianzas) qrre sirve para probar si Ér : 0. La prueba es Ia siguientt
LIna vez que el modelo es satisfactorio habrá que emplearlo para reafizar estimaciones y predicciones
que servirán para analizar el comportamiento de la variable respuesta ante condiciones que no fueron
probadas empíricamente.
Nótese que Ios valores de estimación y de predicción de Y son idénticos en los dos casos, la diferencia
radica en la precisión relativa de cada unar que se ven refleiadas en sus varianzas e intervalos de
confianza.
0p: bo I b1rp,
La varianza es
| (rp-r)2.-
(t t.;2, - 2)s
;-E::!r+t^¡2(n-2)s
0p:bo!b:rp,
La varianza es
oL-st:o'(t+1+Q--u)'\
\' "' sc,, )
y en su estimación se emplea s2 en lugar de o2 en la expresión anterior.
Ejemplo (Continuación). Para los datos del consumo de combustible de los carros, obtener Ic=
intervalos de estimación y de predicción para un carro cuyo peso es 1000 kg.
Solución: Como se indicó los valores estimado v pronosticado son los mismos:
La varianza o?v es
)
: 3161(++ (1000 -
1 115 830.9
996.1)2
: 0.316.
"v la varianza o?
\u-a^.
es
)
o'(t+;.ffi)
"/ r (r^-T)2\
El intervalo de predicción es
Comoseve,elintervalodepredicciónesmásanchoqtreeldeestinración.<
70.7. Formulación rnatricial de Ia regresión lineal 3t7
Se deberá tener Ia precaución de no usar el modelo obtenido para estimar el valor medio de g o
predecir un valor particular de g, con valores de r que se encuentren fuera del rango de la variable
independiente que sirvió para su elaboración.
E1 modelo podrÍa ajustarse perfectamentea los datos recogidos para hallar la ecuación, pero nada
garantiza que el mismo comportamiento se consiga fuera de tales límites, pudiendo darse un ajuste
bastante malo. (Figura 10.5.)
-v Recta de t')Error de
minimos -
- \-
',-Jnredicción
\
Relación verdadera
entre y y x
x
Límites de¡
Figura 10.5: Uso errado de un modelo para realizar predicciones fuera del rango de definición de r.
a:0olPple.
at : B0 + Bp1+ e1,
az : BslBP2*e2, (10.7)
:-:
An : 0o-1 0p,, le,.
x- p: (i: )
X es Lrna rnatrizn x 2 de los valores de Ia variable independiente, cuya primera columna tiene la
particularidad que todos sus componentes son iguales a 1.
Y:XÉte.
u:f ),
\01 /
ete : (y-Xb)¿(y-Xb)
Y¿Y-2bx¿Y+b¿x¿xb.
\et e
:-2xtY+2xÚxb:o'
ab
cuyo resultado es el sistema de ecuaciones
XrX:l
l"D,,ll)ao\ y y:l I
n n h-
t'n D"?
I\ t:l i:t t\ ¡:lt,,a,
Si la matriz X¿X es inversible, se llega a la ecuación de estimación de los parámetros
b: (xúx)-1x¿Y,
La matriz (XÚX)-1 es
(X¿X;_l :
n / n \2
"l)*?-(D",)
i:r \¿=l /
9: Xb.
tEn 1o que sigue se empleará la notación A¿ para indicar 1a matriz o vector transpuesto de A
70.7. Forrnulación tnatricial de la regresión lineal 319
Up -- xlrb,
entes m
p-(;:) ,:(1)
)
, : / 1
x/x I t\ / to 9961
(tin 1187 1650 ) -\ I
ooor 11037983 )
I / l
rxlxl-I : 11 15830e (
1 037 983
-9961
--,--
x'Y: / t I 1\ ( ttt
(táo 1187 rc50 ) \ 128 461 )
Así,
b: qxtx¡-1xty
: _t
1 / 11037983 -9961 714 -1.906 \
11 158 309 \ -9961 10 )( L2B 467 ):( o.o34 )
Por ianto, ia ecuación de regresión' ." g - -1 906+0 0134 r.
Recordemos que
TL
n2 \- -2
o2 'i-1
Var(b1) : TL , Var(b¡) : ,)L
2La diferencia en el valor del término independiente entle 1as formuiaciones algebraica y matricial, se debe al núr¡ero
.le decimalesutilizados en el cálculo de la formulación algebrarca,
32O Capítulo 70. Regresión Lineal Sirnple
D@¿
l.:l
- ")2
l¿
"2Dr? L- T
-o
-no"
TL
: ( .J,1,1,j..1,, .i.",,0ü,1', :
't t,
L\r¿ - r)'
n
r?
\ 14 e\2
-'O
var(b, i:1
-
,i-7
) _o
-ro'
t
o-
t7 rL
D@¿
i.-1.
-r)2 D@¿
i:I
-r)2
Var(b) : o'(X'X)-t
Con el empleo de la formulación rnatricial dc los componentes de la regresión se puede poner las sumas
de los cuadrados como
SCE: Y¿Y-brx¿Y,
/ n \2
lrv,)
t" /
scR b1x/Y - n
,
/ ,,\2
(Iu')
\r -l
SCoo : YtY - '/
'rL
,
T-
sCro
Análisis de la Varianza
Soluc'¿ón: no de los t
: ((t -l I,
YÚY : (s
Drn :
;_1
r14.
Entonces,
En rnuchas ocasiones los modelos no lineales pueden ser tratados corno lineales si se efectúan algunas
trattsformaciones a las variables, ya sea a la predictora, a la respuesta o a ambas.
322 Capítulo 70. Regresión Lineal Sirnple
A.1 ernplear tales transformaciones se deberá tener la precaución de verificar que el modelo modificad
cr"rnple con la hipótesis sobre Ia distribución que siguen los errores.
EI m.odelo es
'g - gSoI0tt:+e '
Ini/:3oilttIe.
Si poncmos z : In;r7 qucda z : Aoi 0fl * e. c¡re es utt rnodelo lineal simple, que se estirna
?: bo * hr,
2. Modelo recíproco o inverso (Figur-a 10.7.)
1
Poniendo Ia última igualdad qr-rcda corno
a
-.)'1..-r-
':90iLll.¿t¿.
Y : o,r\€'
InY:lna*)lnr*lns'
Haciendo z :lna, ú : ln r, 0o :lno y 0t : \, el modelo se escribe como
z:Jo_3rt+t.
que se estima por ei modelo lineal 2: bo I bú.
Otros modelos no iineales comunmente utilizados son Ios siguientes:
Se recomienda que el lector realice las operaciones necesarias para linealizar estos modelos.
Ejemplo. En el desarrollo de un algoritmo de computación, para ser usado con una gran cantidad de
-rformación, se desea conocer Ia relación que existe entre el número de datos y el tiempo que emplea
',na computadora en entregar resultados. Para cada una de las distintas cantidades de datos, se
;icieron 10 mediciones del tiempo empleado y Iuego se calculó el tiempo promedio, según se resumen
-l Ia tabla:
icl,-tc'ión: El modelo propuesto es de la forma A : c,r\€.. Para transformarlo en uno lineal se deberá
-- mar logarit mos:
i- suponemos que se cumplen las hipótesis básicas, que permiten tener un modelo de regresión lineal
.-.rple, entonces se tiene la siguiente ecuación de predicción lnf : lna * blnr.
324 Capítulo 70. Regresión LineaI Simple
Por tanto, se deberá reaTízar una regresión lineal de 1ny respecto a lnr.
Tomando logaritmos en las dos variables:
lnr 0.0000 0.4055 0.6931 0.9163 1.0986 1.2528 1.3863 1.6094 2.0749 2.3026
lna 0.223r 0.4719 1.0986 r.48 16 1.9169 2.2727 2.6101 3.1046 3.6964 4.2822
Además, se obtiene un coeficiente de determinación muy alto, del 99 Y,t, para la ecuación transformada.
A partir de la ecuación se podría proponer que e1 tiempo de ejecución de1 algoritmo es proporcional
al cuadrado del número de datos: A:0.8312. Para verificarlo es necesario realizar las pruebas de
hipótesis sobre los parámetros. Esta tarea se deja a1 lector.
10.9. Ejercicios
Modelos lineales
Ajuste un modelo lineal simple y calcule el coeficiente de correlación lineal entre las variables.
2. Se realizóun experimento pa,ra medir la velocidad del sonido en el aire a diferentes temperaturas.
Los resultados obtenidos se indican en la siguiente tabla:
Ventas 20 27 33 47
a) Realice r"rn gráfico de los datos y diga si es recorrrendable ajustarlos a un modelo lineal
simple;
b) Halle la ecuación de regresión simple que ajusta los datos;
c) Realice un análisis de varianza y pruebe la significación del ajuste;
d) Halle el coeficiente de determinación del modelo. Interprete su valor.
e) ¿Hay alguna manera de simplificar el modelo?
En una investigación de las propiedades de un pegamento de secado rápido se midió el tiernpo
que se demora en cristalizarse en función de la cantidad de pega depositada sobre uria superficie
de material cerámico de prueba.
Cantidad (g)
Tiempo (seg) 26.2 27.9 29.4 30.5 31.0 34.3
a) Realice Ia formulación matricial del problema y ajr-rste los datos a un modelo lineal. Inter-
prete ios coeficrentes;
b) Calcule s y obtenga un intervalo de confianza, al 95 %, para los coeficientes de regresión;
c) Evalúe 12 e interprete su valor. Pruebe si p : g'
d) Realice una predicción para cuando el núrmero de depósitos es 12;
e) Obtenga la tabla ANOVA y realice la prueba F' correspondiente.
En el mercado inmobiliario se realíza el. avalúo de una propiedad para luego efectuar su venta,
la diferencia constituye la ganancia del vendedor. En la tabla se dan los valores (en rniles de
dólares) de avalúo y precio de venta de doce propiedades en Quito.
8. El nna entidad finarrciera se desea tenel nn método que permita realizar pronósticos de las
ganancias obtenidas en base a inforrrración c¡re pueda estar disponible de ulanera rápicla. trl
gerente de crédito plantea uu modelo qr-re relaciorra el lúrrnero de préstamos realizados en Lln lres
v la ganancia obtcnida en el misrno períocio. P¡r¡r t¿rl efecto recoge la siguiente información de
los 8 Írltimos meses:
No. préstanos L25 131 r42 127 140 121 136 133
Ganancia 44 54 77 35 BO 47 66 ti5
9. La siguiente tabla muestra la captr-rra de anchoas (captnra, en millones cle toneladas métricas)
v el precio de la harina de pescado (precio, en dólares por tonelada) para los úrltimos 10 años:
Año 1 2 ,) 4 i_) ú 7 8 9 10
Precic¡ 190 160 134 129 172 239 542 245 454 410
Captura (.¿,1 E,53 982 10.26 8.96 4.45 1.78 D'
t).r) 08 05
Construlra ios rnodelos lineales que lelacionen las variables (" - y) e interprete los coeficientes:
a) Precio 1' año;
b) Captura y ario;
c) Precio y captura;
Con el modelo que tenga 1a máxima correlación:
d) Realice la tabla ANfOVA e interprétcla;
e) Construya los interr.aios de confiallza para los coeficientes de regresión;
f) Realice la estim¿rción de y cn¿rndo r: 5.5.
70.9. Ejercicios 327
_1. Los siguientes datos corresponden al ritmo cardiaco en reposo (Y) v el peso (X, en kg) de 6
personas.
90 62
86 45
67 40
89 55
81 64
75 53
Dr¿: 488, Dg¿:319'
Dr? : 40092, Drnan : 26784, Dy? :17 399.
a) Grafique los datos y examine si parece que hay una relación lineal entre las dos variables;
b) Calcule los estimadores de los parámetros de regresión;
c) Obtenga la estimación por intervalo de Ia media cuando r : 88, al nivel 95 %;
d) Obtenga el intervalo de predicción de Ia media cuando z : 88, al nivel g5 %;
e) Calcule los coeficientes de determinación y de correlación entre las dos variables.
D(ao - ü2 :832.
i:7
Se realizó un estudio para determinar el efectc que tiene la temperatura (r) sobre la c¿rntitlad
de gas residual generado (y) un proceso químico. Se analizaron 12 unidades nrnt:stlales y se
"r.
midieron las siguientes cantidades.
Uua teorÍa financiera sostiene que hay uua relación directa entre el riesgo de una inversiól y el
rendimiento que promete. El riesgo de una acción se mide por su valor, Ilamado p. En Ia tabla
se muestran los rendimientos y valores de 12 acciones:
Rendimiento 89 ¿.í) 15 ,) / 82 53 05 13 59 68 72
Valor Beta 1.5 1.9 1.0 05 15 18 13 -0.5 05 IB 19 19
328 Capítulo 70. Regresión Litteal Simple
a) Pruebe si los coefi.cientes del ruocleio son siguificativos. Escriba las pruebas .r, liru¡l¿s c :
14. Suponga qlre se ha ajustado trna línea r(x'ta a uu conjunto de 9 pare.jas de observaciones, dand,
a- x |l-
lJ - -¿ -r '.L'
Además, se obtnrrieron las siguientcs clcsr.iaciorres: (r;, - r): -4, -3, -2, -1, 0, I,2,3, 4 5"-
tabla de análisis de la valianza:
Modelos no lineales
15 A continuación sc presentan 7 mediciories dc clos variables
:L 05 10 15 20 25 3.0 3.5
a 06 27 12.2 54.6 244.7 1096.6 4914.8
Encuentre 1a ecuaciórr de regresión cluc a.justa los datos, según un modelo exponencial y calcul.
el coeficiente de determinación.
17. Un ingeniero está investigando la relación eritrc l¿r veloc:irl¿'rd clcl r.iento y la cantidad de electridad
generada. Luego de 10 nediciones obtttr.o:
.)
Velocidad del viento ti0 60 /1
61 10.0 97 96 3.1 B2 6.2
Corriente generada l.58 t82 1.06 1.93 2.24 2.39 2.29 0.56 2.17 1.87
18. El gerente de una ernpresa desea lelacional la evoluci<iu de Ias ventas y el gasto publicitario,
segúrn los datos que aparecen en el cuadro:
o.)
Ventas (9) L(l 15 18 .a¿ 25
Gasto (z) i9 22 4), 72 9B
f I T4 77 i1 8 10 5 7
20 A continuación se presenta la evolucióri anual clcl s¿rlario mÍnirno vital en nn país con alto índice
de inflación.
Año 1 2 J 4 5 6 7 B I l0 11 I2
S.M.V. 66 95 720 r20 I45 190 220 320 320 400 600 600
21. En astronomÍa se denomina año sideral al niulero de arios tcrrestrcs qlre un plancta se demora
en completar nna revolución alrededor del Sol y rlepencle de la distancia entre Ios dos astros.
En ia tabia se muestra la distancia promeclio ;' el arlo sideral para los planetas del Sistema
Solar. Emplear los datos para detelninal nrr modelo de legr-esión que relacione las dos variables,
330 Capítulo 70. Regresión Lineal Sirnple
tomando com.o variable dependiente al ¿rrio sideral. (Pala lealizar la transformación adecuad¿r
refiérase a la tercera ley de Kepler).
22. Los siguientes datos corresponden al precio de venta (en cientos de dólares) de un modelo de
automóvil, según los años de uso
Años de uso 0 1 2 J 4 5 6
Precio r0.2 B3 69 5.5 4.0 3.5 3.3
Año Abonados
1 32 000
2 37 500
3 41 000
4 58 000
5 107 000
6 138 000
7 175 000
8 321 500
Regresión Múltiple
En el capítulo anterior estudiamos el caso en el cual la variable de respuesta g depende de una sola
i-ariable predictora z, estableciendo el modelo de regresión lineal simple. Pero, podría suceder que
este modelo sea insuficiente y que sea necesario incorporar nlle\¡as variables explicativas del fenómeno
rnvestigado.
-\nalicemos el siguiente caso: el gerente de una empresa desea incrementar las ventas, para lo cual
lecide realizar gastos en publicidad y medir la variación ell slrs ventas, Inicialmente, decide poner
rublicidad en televisión, pero posteriormente decidc también ponerla en la radio y los periódicos.
En la primera etapa la variable de respuesta, qlle es el incremento en las ventas, depende de una
.ola variable predictora (los gastos en televisión) y para realizar un análisis es suficiente ernplear un
:lodelo de regresión lineal simple. Mas en la segunda etapa, la variable de respuesta depende de
--arias variables predictoras (los gastos en televisión, radio y prensa), consecuentemente para realizar
'rn análisis ya no es suficiente la regresión lineal simpl.e.
Fu general, aunque hay rnuchos problemas prácticos clue atañen a variables predictoras Írnicas, es
--tucho más frecuente que la variable respuesta dependa de un conjunto de variables predictoras o de
:ausfolrnaciones de las mismas. De la estimación de tales modelos y de su calidad de ajuste nos
cnparemos en el presente capítulo.
331
332 Capítulo 77. Regr"esión Múltiple
Al igual qlre en cl caso de una sola vari¿rblc. se cor.sidera qr-le cl crror s tiene esperanza igual a cero v
rrarianza a2 y qne los errores ei) col-respondientcrs a cacl¿i obserr'¿tción. son no correlacionados.
clonde y denota el incremento en las ventas. u1 los gastos en tclevisión) 12 los gastos crr radio y z¡
Ios gastos en prensa. Los coefi,cientes p6, 0t, A'¿ 1'.83 son paránctros que defineu cL moclelo, eLlos son
desconocidos y el problema inicial es detcrminat estos croeficicntcs'
Nlediante la técnica de regresión Lineal mÍrltiple sc puccle ¿rnalizar uua serie de modelos particulares
como el polinonial de ttna'r'ariable
o de dos o más variables: por cjcrnplo. cl dc scgrrnclo grnclo con clos r.ariables
Otros nodelos niás complejos pr-reden rcclucilse a rrn rrroclelo clc regresión line¿rl múrltiple necliaute
cambios de variable adecuados.
Snponga que disponemos de n ) k obscr'\'aciones. 1' si se cletrota como r¿¡ al valor de la i-ésima
obser-r'ación de la variable rj, como se obsclva cll la siguiente tabla:
'!jt r rr :L 12 u 1A
donde bo , br , , . . , b* son tales que la sttrna cle los cuach-¿rclos cle l¿rs difcrerrcias entre los valores observados
cle la r,ariable respuesta y su estirlaciól por la ecuacióu cle r-cgresiórr sea mínima.
o en forma abreviada
¡c
li
a6c E) \-i..-.\-n
0b* -2D:ü,ik,(u,i. -00-
-A^ ) ojxij):v.
i-l j-1
Ltrego de simplificar las igualdades, se obtiene \as ecu,a,ci,oncs norma,l,es de rnínimos cuadrados:
boDr,, - f
bt-.¿J rl,¿r + b2f
'/-J
t,rr',, - . .' * bu I ).ir:xik : D',rro
i:1 i- 1
TL 1'¿ 1L TL
Entonces, se dispone de uu sistema de k * 1 ecuaciones normales quc invoh-rcran a los coeficientes des-
conocidos. Su solución permite conocel los estimaclorcs cle los parárnetlos del modelo lineal múrltiple.
alrnque debe observarse que tal tarea. en general, suele sel rrruy laboliosa.
334 Capítulo 77. Regresión Múltiple
Formulación matricial
De manera similar a Ia realizada cn el moclelo lineal sinrple, el linea,l múrltiple es factible ponerlo en
forma matricial. Por la cantidad de variables irn'olucradas csta formulación es más fácil de manipulal
que la forma algebraica. El proceso es idérttico a1 explicado en el capÍtulo anterior; sin embargo, lo
repetiremos de manera simplificada.
Y:X0+e.
Los miembros de esta ecuación se forman de 1a, siguiente lranera:
X es una matriz rtx (k+1) de los rralores cle la vari¿rble inclcpendientc, cuya primera colunna tiene
la particularidad de que todos sus componerrtes son igr-r:rles a 1.
p es un vector (k + 1) x 1 de los parámetros cle la ecuación.
Esta explesión es la forrna rnatricial cle las ccurtcioncs lolrlalcs clc regresión antcs deducidas.
Si la rnatriz X¿X es invcrsiblc se obticne cl estirn¿idor b c:omo Ia solrrción del sistcrna (11.3):
tt D Drn T -..
1' ''tk \- u'
i:1. "¿t i-l i1
i-I
r¿ r¿ rL 11 rL
D r¿, \- -2
/r *iI D,or,o, )- J;r.1.;¿. D r¿run
¿:1 i-I i-I i:1 i:T
rL r¿ rL 1I TL
')
D rn^ D rnnro, D r¿nr¿z 5- z;r.u,
i.:1 _1 ; i-1 i.:1 i:r
Observemos la estructura especial de ta natrices X'Y y X¿X; ésta riitima es simétrica de orden k * 1.
Ejernplo. Una compañÍa, con objeto de progranrar la producción para e1 resto del año, necesita un
plonóstico de las ventas totales. En sus registros ticne las r.crrtas realizadas (en miles de dólares) v
los gastos en publicidad e insumos para sus productos en los irltirnos 10 meses como se muestra en la
sigr-riente tabla.
Encontrar la ecuación de regresión que relacione las vcntas con los gastos en publicidad y en insunos.
Soluc'ión: Nombremos la variable ventas cono y) los ga^stos en publicidad como ,r1 y los gastos en
insumos como 12. El modelo de regresión es
I,.
y,,-A tJO- u1r r J,.- .
- I -r u).t 2 c.
15596 tt.)
J J.)
15984 310
16974 311
16566 290
X- I7191 Y- 342
I67E6 348
77678 .)
¿-a
¡-I
15966 275
77767 311
I 64 7l,t 298
l.X¿es
111 11 1 111
59 69 65 71 67 76 59 77 64,
84 74 66 91 86 78 66 67 75 )
336 Capítulo 77. Regresión MúItipIe
Y el cálculo de X¿Y da
/ zr4s \
XiY : f zog oog I
\ zas 055 )
Finalmente, multiplicando los dos últimos resultados llegamos aquebes
1x''':(i:,\ :( 37.30 \
1.717 I
Yu, I 2.088 )
Con todo ésto, la ecuación de regresión es
Propiedades de b
1. Es insesgado para p.
Puesto que E(e) - 0 y (X'X)-1 X,X : I se tiene:
Cov(b) : o'(X'X)-t.
La matúz Cov(b) es simétrica; además, el valor de o2 suele ser clesconocido, debiendo ser esti-
mado.
Estimación de o2
SC E -- Y¿Y_b¿X¿Y.
Así, el cllol cuadr'ático meclio! cllre cs nn estimaclor- irrsesgaclo cIc o2, sc caicula pol
SCE
ItCE:.s2 : n-k'-I'
l0
Y¿Y : D, r? : 993 957.
'i:l
Pol lo t:tnto, SC E es
39()'37
.5
2
: llCE - - 55.7666.
I
-0.18441 -0.11200
cólGr : 0 002266 0 000438
0.000438 0.001059
Crrando se realiza un mocielo de le-qrcsiórr rtrúrlti¡rlc, gerrclirlrrrt:utc. las clc urecliciórr u.o sol
rLr¡icli-Lrles
las ruislnas pala la vali¡rblc cleperrclicrrlo l¡ I)ar'¿1, las i'irri;ilrlr:s irr<lcpurrclit:¡rics. cle ltr¿rLrcL¿t qrrc los coe-
lir:icntcs dc regresión no se prrcclcn colnl)¿lr'¿\r dilcc:tun'rcutc. Pi'Lla srr¡rultl cst¿r clificultad. sc cn¡lk:an
Ios coc.fici,cntc,s de reqrcsi.ón cstrnt,d,a't i,zr¿do.s bet¿r.
il,as rruicl¿rdes clc lnedic:ión clc l"o<l¿rs 1;ts i'¿iliablcs sc lL¿irtsfrrrtnatt cst ¿irrcl¿rr'.
:rlividicnclo cada variablc 1rcl str dcsvi.,tción cst¿ittdar'.
i:bo*br¿l *b.¿:-.¡.
338 Capítulo 71. R.egresión Atltiltiple
se tiene
r-
5tt
:le,\1 - (u,-),,
,q.'¡ -
('r-=),,
t,/,/
5,7
1 / \ 'sr.z
Los coeficientcs
.{ ..
beta¡ - Itt:'-!
sll
sou los coeficientes de regrcsión parcral est¿inclar v srr intcr'prc¡t¿rci<in es liL siguieutc: si hay un¿i r,¿ui¿rciórr
de ltna desviación est¿inclat en ui) habrá una clesr.i¿rción cle beta; dcsviaciones estándar en y.
Ejemplo. (Continuación) Encontrar los cocficientes clc reglesión cstandarizaclos de los clatos clel
ejerlplo.
. s,.
i,r- 7.30
betal l.7l;-_^
')¡J
_.
;¿.::
;);)
0.53C3,
beta2
. s,,
b,-:-' - uSs-
^^ - 10.68
5t1 -'l '3.22 0.9604.
Iruesto c|re el vector de coeficientes B es clesconociclo. lo consiclcramos colro nna valiable aleator-ia
rrtrltiv¿rriante, nornalmente clistlibnicla cou mecli¿r b )'nratliz cle covarial"a o2(XtX) 1, por 1o clue
c¿rda uno cle los estaclísticos
tt¡-j.t
,:0.1.....A;
t r/C.,t
sigrtc ttntr ley ú con (r1- l; - 1) graclos dc libeltacl r-clonclc C.i, cs cl j-ósirno clcrnento clc la cliagonal
cle la uratriz (X¿X)-1.
Utr inter-r'alo de confianza al 100(1 - a)% para cl cocficientc clc regrcsíón B¡ (.i : 0,1,. . ., k), cs
Solu.c:i,ón: El cstimador cle o2 cs s2 : 55.7666 l' /o ou¡(7) : 2.365; crttotLc:es, sc tieneu los siguierrtcs
intervalos:
77.3. Intervalos de confranza 339
1. Pala p¡:
(bs - tt(tt - k - 1) s r/Coo-; b¡1 I t,, ¡,2Qt, - k - 1) s /C0-;)
^¡
(ez.ro - 2.36b x T.4T x JlrtTT ,37.30 + 2.36b x 7.47 x ,f2tnn)
(-43.80: 118.40)
Par-a 6i:
(U, - t^¡r(n, - k- 1) srldrr; b1 I tn12(n - li - l) s\/e¡)
Q.rv - 2.365 xT,4T x,/0.0022:r,Tr7 + 2.36b x T.4T x /lrtrnl)
(0 888r2.546) .
3. Para P2:
(b2 - t
^
¡ 2(rt - k- \
Je 22: b2 + t,, t(r t, - k - t) s t/en)
s
1
Si se dcsea conocer el intelvaLo cle colfi,anza meclia cle un punto en palticulal uT1t
iI)
¡t2t . , ., Lpkt definitnos el I'ectol
xp
ip: xlpb'
IJstc cstiruaclor es insesgaclo (cs ,i..i', o (%) : x|r1) )' stt rr¿tt'i¿tttz¿t cs
/^
lir-to¡'2(tt-A' i,, * tn¡,('tt - fu - 1) 5\ x,¿,(X¿X)-1x,,
\ )
IJn tnoclelo de reglesión se aplica eu la r-eaiización cle ploncisticos collcsponclientes a rr¿rlor-es particulares
clc las vali¿rb1es incleperrdientes, xn. Lzr respncsl¿r en cste ltuut,o es jr: yt¡¡.
te rrr¿rlo clc con fianza cle ni \¡e.I 100(1 - a)'7n P¿u¿ r la plccli cctot)1 ?/2
( j, - t,,,¡2(n' -l;-1)s I
xf (XrX t, !l¡t - l; - l) 'V 1+ xj,(X¿X)-Ix,,
340 Capítulo 77. Regresiótt Múltiple
Ejemplo. (Continuación) Elabolar los inten alos clc confi¿rnz¿r al 95 % para la r-espuesta rncdia y
para la predicción, cuando los gastos en publiciclacl son de 72 mil y en insumos 90 l.r- il dólares.
-,: (*
)
La respuesta en el punto considerado es frr, : xf,b : 348.844.
La plueba global del modelo se enplea para corrocer si existe rclación lineal entre Ia variable dcpen-
diente y y eI conjunto de las variables indcpendientes e-1 , L2, ..., lxk.
Pre'u'ianeute, desconpolgamos la suma total de los cuaclrados SCou en dos sllnras, una debicla a I¿L
donde
SCE: Y¿Y-b¿X¿Y,
,
/11
,)
(D'')
SCR : b,x,Y_'t-L
\i r
/I .
n
_
/ t) \-
¡)
/S \
I ),Y¡l
SCoo : Y¡Y - \':t ,tL
'/
77.4. Pruebas de lúpótesis 34L
qtle llos siLrten para realizar de manera or-denada toclos los p¿isos involllcrados en la prueba de hipótesis,
con el ernpleo de una tabla de arrálisis de la va,lianza.
En el siguietrte cuadro se resunre los elenentos dc rur análisis cle varianza para nna regresión miritiple:
ATCR
3. Estadíst'tco de Prt¿eba. LH, obs
- A,ICE.
4. Región de Rechazo. Se rechaza Hs si Fo¡r, > ¡L(k,n, - k - I)
El rechazo de Ilo significa qr,Le al meuos una de las variables independientes r, contribuye signiflcati-
vamente al modelo lineal propuesto.
Calculemos el tercero:
/,, \2
(I'')
\ j-1 ,3145)2
' : -l¡l- : 989102'5'
''
Tanrbién. se calculó que SCE:390.36. Las restantes sllmas de cuadrados so¡
qr q93 :
""!J!J 957
¿¿¿JQt - JoJ 102.5
989 fW_,U _
4854.5.
SCR : 993 566.63 - 989102.5 : 4464.73.
5. Decistón. Conio 40.02 > 4.74, resulta que se rcchaz¿\ la liipótesis nula y se conclnye que las
t'elttaSestánrelacionadasconlosgastosenprrblicidaclyerrinstttrros.<
Con esta prueba estadística únicamente se concluye la validez del rnodelo, en forma global; clla no
indica Ia importancia relativa de cada una de las variables predictoras sobre la variable respuesta.
b¿
3. Estadístico de Prueba. tobs :
s\/e;'
1. Regiónde Rechazo. Serechazalls si tob"1-t,,¡2(n-A-1) oúo6, )tu¡2Qt -4, -1)
Ejemplo. (Continuación) Eu el modelo piantc:ido, realizar la pnreba para los parámetlos ¡6,.
I : 0. 1,2, al nivel deI95%.
b) Pzrra p1:
3. Pnreba. tobs:
7'717 :
Estadístico d.e
-+
.5vL il
- 7'47\/0n0'n
4.9.
77.5. Coefrcientes de deterntinación y de correlación parcial 343
Ir Deci,si,ór¿. Como 4.9 > 2.365, se lcchaza -I1¡: entonc:cs, la variable <<gastos en publicidad>>
:rporta información al moclclo
c) Para p2:
El rnodelo final podría scr uno en el que no se considere cl término independiente: y - |flt I 0zrz.
Se recrouienda al iector que recalcule tal modclo.
EI cocficiente cle detcrninación se emplea conro rlra meclicl¿r clc la ¿rdecuación clel rnodelo, c¡re infortua
sobre Ia fu.erza de la relación cxistcnte entre 1as valiablcs indepenclientes y la dependiente.
n2 scR
' Se uo .
scE
b'C rr'
Puesto c¡re 112 tiencle a soblcstimar cl valor de la corlelación entre las variables involucradas, se etlplea
,:l cocficicntc dc determinación ajustado, -R1., c¡re cstá cliserl¿rclo pala conpensar el sesgo optimista cle
R2.
ot
I1,t:
t>2 ,('t1 /lrl
lt
- -
t¡,-A; -l
,
SCEI(n A'- 1)
-
n.?,:t- SC,,rf(rt,-l'¡
-1 rango de variación de 1l"2 es 0 < ,Rl < 1y su intcr'pret¿rci<irr cs ia misnt¿r c¡tc h clcl coeficicutc clc
ietcrnirración nniltiplc Ii2.
344 Capítulo 77. Regresión Múltiple
Como el valor de R2 es alto) se concluye que el modelo se adecua a los datos y que el 9I.96% de
la variabilidad en las ventas se explica mediante las variables <<gastos en publicidad>> v <<gastos en
lnsunos>>.
R?": n'-JJJ4;
2(1 - 0.e1e6)
: 0.9196 - r0-2-r : 0.8966.
En canrbio, si interpretarnos ,Rl, podemos decir que la calidad del ajuste es de un 90Vo. Paru mejorar
el rnodelo se podría incluir una tercera variable explicativa y comprobar si ella es o no significativa.
Por ejemplo, con k regresores, el coeficiente de correlación parcial entre rt V 12t que se denota 112,24...k;
se define como el coeficiente de correlación Iineal entre ;r1 1r rr2 cuando se elirnina de ambas variables el
efecto de los otros k - 2 regresores, Se calcula obteniendo el coefi.ciente de correlación en la regresión
donde er¡ ...t y e2,g4...k son los residuos de la regresión rnúrltiple de 11 y ,r2 respecto a las variables de
control rB¡ , . .¡ rk.
Si tuviéramos el modelo A - l3o* gpt* Azrz *e, el coeficiente de correlación parcial de y con 11,
cuando z2 permanece constante, se define por
Tyt - Ta2Tt2
Tvr,2:
(1- r?2)0 - r?z)
donde rsrt rs2 y r12 son los coeficientes de correlación de Pearson de y con 11, de y corr 12 y de 11
con 12) respectivamente. De rnanera análoga, se tiene
Tt2 - I'utTa2
T12,a:
(r - rl)0 -,7r)
el coeficiente de correlación parcial entre rt y 12.
Por Io complicado que puede resultar el cálculo de las correlaciones parciales, sus valores se obtienen
rnediante programas est adÍsticos.
Ejemplo. (Continuación) Caicular los coeficiertes de correlación parcial para el modelo planteado.
77.6. Regresiól politrcnúal 345
SoLttción: Terrernos los coefrcientes de corrclacióri rle Pc¿rlsou ctrtlc l¿rs v¿uiables:
Entonccs.
0,268-0807x(-0.283) :
TuL,2 : 0.876.
/(t - (0 807)2) (1 (-0.283)2)
(t - rl2)Q -,'?z) -
I'A2 - I'aI?-72 0.807-0.268x(-0.283) :
Ta2,l : 0.955.
(r - rf 1)(r -,'?) Jtt - (0.268)2) (1 - (-0.283)2)
T72,a
-0.283-0.268x0.807 : -0.878.
(t - rfl)(r -,lr)
El pr-imer paso para escoger un rlodeio que describa los clatos, es la realización de un gráfico de
,lispcrsióu de las observacioucs. La rclaciól srrgelicla por los cl¿rtos cs la que permite escoger un
nodelo que los describa adecuadarnente.
G
ülr, Cuando Ios datos presentau un csqlrema de comportaniento curvilíneo puede ser rlecesario proponer'
# ,ur modclo de tipo polinonial para los datos. AsÍ lo obsen'arros cn la Figura 11.1.
¡
&
.il1
Veatlos, con Lul ejemplo, cómo se puede trausfolnrar un modelo polinomial en uno de regresión mÍrlti-
ple.
1l:00-l 7fitl0zrz*e,
c¡-rc esrtti tnodclo de reglcsiótr rnúrltiple en dos variables. Err cslc urornelto cstanr<-¡s err posibiliclacl cle
¿rplicar la teoría anteriorrnentc desclita.
Otros modelos polinomiales que incluyen más de una variable, que pueden transformarse a uno lineai
múltiple, son los polinomios en varias variables. como el de segundo grado en dos variables:
Cuando se ajusta un modelo polinornial es preciso escoger el polinomio Ce menor grado posible.
consecuentemente se deberán realizar reiteradas pruebas de hipótesis, en las que se fijarán aquellas
variables que se han de incluir y excluir en el modelo final.
Ejemplo. Consideremos los datos que relacionan el nirmero de páginas de un folleto y el costo de los
insumos utilizados en la impresión de 100 e.jenplares.
S oluct ón:
a) Como se observa en el gráfico de los datos, éstos podrían ajustarse a un rnodelo de segundo
grado de la variable independiente, entonces planteanos el nrodelo A : go -l pfl * l3zn2 I e.
2
1.8
1.6
a.t'
1
j <-J'J'a --ltt'
1.2 a
1
10 20 30 40 s0 60 70 80 90
1 90 8100 204
1 80 6400 170
7 75 5625 165
7 70 4900 155
1 65 4225 148
X- 1 60 3600 Y- 140
p:
1
r
50 2500
40 1600
130
726 G)
1 35 t225 t24
1 30 900 12l
r 25 625 100
r 20 400 98
Puesto eue Foa" : 6.91, que si se cornpara con el rralor de la tabla correspondiente a Foos(2,9) :
4.26, resulta que Fob" ) Fo.os(2,0). El resultado es significativo al nivel del 5%; es decir, al
meros uno de los parámetros pr o B2 es distinto de cero. Además, -R2 :0.605? qne en este caso
indica que la calidad del ajuste es buena, pero no lo suficiente.
Sc sugiete que el lector reaiice los análisis con el empleo de un paquete estadÍstico.
trtt los noclelos tratados se empleó variables independientes cle latur¿rleza cuantitativa; es decir, que se
:\pt€sall uuméricamente y son el resultado de mecliciones iustnunentales. Pero si se desea incorporar
348 Capítulo 77. Regresión Múltiple
en el modelo una variable cualitativa, es necesario intloducir uariables indicadoras (o ficticias), q:ue
permiten diferenciar los distintos niveles que toma tal variable; por ejemplo, una variable X que
indique Ia estación del año puede ser defi,nida conro
": { ?, :l :: ;il:T:
En general, una variable cualitativa con ú niveles se representa mediante t-I variables indicadoras, a
Ia^s cuales se les asignan valores de 0 y 1.
Ejemplo. En un estudio para determinar Ia relación entre el peso y el origen de ios automóviles y su
consumo de combustible se escogió una muestra de 10 carros, con los siguientes resultados:
Soluc'ión:
a) Se va a ajustar el modelo
a:0ol7fitl0zrzle,
donde la variable peso es cuantitativa (rt) y la."'ariable origen es cualitativa (r2), con dos riveles:
USA y Japón, que Ia codifrcaremos de Ia siguiente manera:
'I'ñ: f 0.
<
si el origerr es Japón;
[ 1. si cl oligen es USA.
r 739 8
1 1187 16
1 655 6
7 729 7
X- 1 B8B
Y_ 7
7 797 9
1 963 11
1 802 t2
1 1551 18
1 1650 20
Y el modelo estim.ado es
El significado clel téI'tlino correspondiente al origen del auloniór,il es el sigr,riente: para dos antos,
de igual peso, Lulo clc oligen amelicano y otro clc oligen .japonés, cl arncricano cousluuc, cu
promedio, 3.42 litlos más que cl japonés, al rccor-r'er 100 krn.
77.8. Probletnas en la regresión múItiple 349
Pol el alto valor de 4A, : 77.66, se deduce que al nlenos una de las dos variables consideradas
sirve para explicar el consumo de combustible de los carros.
Si comparamos los valores de úo¿," con 1s.625(7) - 2.365. deducimos que los términos correspon-
dientes al peso y origen son distintos de cero, mieltras que el término constante se puede conside-
rar nulo.
Para terminar, exarninerrios los valores a.justados, conparándolos con los datos originales y el
error respectivo:
A¿ U¡ ei
8 7.18 0.82
16 14.97 1.03
6 6.36 -0.36
7 7.08 -0.08
7 8.63 -1.63
9 7.75 t.25
11 12.79 -r.79
12 Lt.22 0.78
1B 18.53 -0.53
20 19.49 0.51
Cor'(e) :o2(I-V)'
Para comparar los residuos suele ser más córnodo cambiarlos de escala, estandarizándolos o estuden-
tizándolos.
s(¿)
que siguen una ley t con n grados de Iibertad; donde s(¿) son los residuos de la regresióu cuando
- k -2
se excluye la i-ésima observación.
Análisis gráfico
IJnavez que se han construido los residuos ("¡,r¿ o ú¿) es cómodo real\zar gráficos como los siguientes:
Error de especificación
Se comete error de especifi.cación cuando establecemos ura depeldencia errónea de la respuesta en fun-
ciól cle las variables explicativas: omitimos variables irnportantes, introducimos variables innecesarias
o snponemos una relación lineal cuando la dependencia es no lineal.
La especificación incorrecta del modelo conduce a que los lesicluos tengan esperanza no nula y que los
estimadores obtenidos sean sesgados.
Los estirladores de los parárnetros serán insesgados, pero sus intervalos de confiattza y las pruebas
de hipótesis serán incorrectas. Sin embargo, la prueba .F- es razonablemente robusta contla Ia no
normaiidad.
Para cletectar Ia normalidad de los errores es conveniente fi.iarse en los coeficientes de asimetr'ía y de
cu.rtosis. Adernás, se pueden realizar gráficos Q-Q o P-P de boudad de a.juste a Ia ley nornral.
77.8. Probtretnas en la regresión múItiple 351
-. .ansformación de la variable dependientc a lLna forrna que sca más cercana a la norrrral es un
' --so tluy empleado. Estas transformaciones sneler ser sugelidas por los gr'áficos de los residuos.
l=- :,iéu, se puede utilizar el método de Box-Cox de transformación potencial,
-::-i€m€nte se han desarrollado modelos que consideran clue los errores están distribuidos según
-f,,¡,-
üH*i -:.'l. de un nirmero de grados de libertad desconociclo) corno una generalización de la hipótesis
-.r - ::rralidad.
:.-,:rrente, se espera, que los datos correspondientes a las observaciones se encuentren distribuidos
lr. -:gión más o nrenos cercana? pero puede sucecler- qne una o varias observaciones estén alejadas
.:-- - ,Le los datos. Esta-s observaciones pueden influir mucho en el modelo final.
-::cto es rnuy importante: podemos disponer de 100 obselrraciones y, sin embargo, construir
-- : ',rn modelo cuyas propiedades son debidas irrricamente a dos puntos. Conocer si este tipo cle
- -:-lLrve perjudicialmente en el rnodelo permite mc,iorarlo.
- ,,tt'os tipos de distancias que permiten la detecciórr de valores atípicos y puntos influyentes,
--, 1 con distintas propiedacles) pero todas siguen el nismo priucipio para la identificar tales
-¡J11eS.
iento
-:- -,tcalizado un pnnto iuttsual, se estudiará su inflnencia eliminándolo del modelo, repitiendo el
-----ento para todos estos puntos. Aquí es necesario realiz¿rl un análisis de la estabilidad de los
;--es de regresión tlediante pruebas estadísticas o sus iltelvalos de confianza.
L.-- se han desarrollado métod,os d,e regresiórt robttsto, clue ateniran Ia influencia de las obsen'a-
---',-.uales en el modelo o que toman como nrcdicla cstadística sobre la cual se basa la regresióu
ur - ana en lugar de tomal la media, couro 1o ltcrnos irecho chrlarrte este tratado.
77.8, Probtrenl.as en la regresión múItiple 351
La transformación de la variable dependiente ¿r rrn¿r forrla qr"re sea más cercana a la normal es url
recrlrso mu.y empleado. Estas transformaciones suelen ser sugeridas por los gráficos de los residuos.
Tambiél, se puede utilizar e1 método de Box-Cox de transfolmación potencial.
Recientemente se han desarrollado modelos qlre consideran que los errores están distribuidos según
una 1ey ú, de un núrmero de grados de libertad desconocido, colrro una generalización de la hipótesis
de normalidad.
Generalmente, se espera que los datos correspondientcs a 1as observaciones se encuentren distribuidos
en Llna región más o nenos cercanar pero pu.ede snceder cpre Llna o varias observaciones estén alejadas
del resto de los datos. Estas observaciones pueden iufluir rlucho en el modelo final.
Este aspecto es muv importante: podemos disponer dc 100 observaciones y, sin embargo, construir
con ellos un modelo cuyas propiedades son debidas irrricamente a dos puntos. Conocer si este tipo de
puntos influye perjudicialmente en el modelo permite mejorarlo.
Identificación
La primera forma para determinar si un valor es atípico es rnediante los residuos estudentizados. Se
colnpara con los valores de ú¿ con los valores críticos de una lev I con n - k - 2 grados de libertad.
Otra folma de conocer cuáles son los <<puntos distantes>> es a trar'és de la distancia:
,h
/)? : \-
t /J
i: I,2,.. . ,fr.
.l-L
Existen otros tipos de distancias qne perniten la detección de valores atípicos y puntos influyentes,
cada uua con distintas propiedades, pero todas siguen el mismo principio para la identificar tales
observaciones.
Tratamiento
Una localizado r-rn printo inusual, se estudiará su influencia elininándolo de1 modelo, repitiendo el
.u'ez
procedimiento para todos estos pr-rntos. Ac¡rí es lecesalio realiz¿rr un análisis de la estabilidad de los
coeficientes de regresión mediante pruebas estadísticas o sus intervalos de confianza.
Tanrbiérr, se ]ran desarrollaclo métodos de reqresi,ór¿ r'obttsta que atenÍran la ilfluencia de las observa-
ciones inusuales en e1 modelo o que toman como mcclida, cstaciística sobre la cnal se basa la regresión
a la rnediana en lugar de tomar la media, como 1o hemos hecho chllalte estc tratado.
352 Capítulo 77. Regresiótt MúItipIe
no es aplicablc.
L¿rs consecuencias de la heterocedasticidad en el modelo lineal son las siguientes: los estimadores serán
iusesgaclos, pero dejan de ser eficientes. Las fórnul¿rs para las varianzas ro son correctas y las pruebas
de hipótesis dejan de ser aplicables.
Identificación
^i
una prueba de a.juste a una lev. Pala el efecto se puede realizar el contraste de razól de
clLle es
verosinilitudes, que se basa en el estaclÍstico
Tratamiento
1. Si la heterocedasticidad está asociada cori la valiable respr-resta y crece con e1 increrrento cle
los valorcs de y. una posible forma de tratarla es rcalizar la regresión de log g en lugar de y.
Este caso suele aparecer cuando hay una forrnulación errónea del modelo; por ejcrnplo cuando
el moclelo real. es r-nultiplicativo y se a,justzr rncdiante rrno lincal.
s-
dorrde, al cliviclir todos los télminos pol' z/r, los lesicluos e* - tendrán valianza constantc.
Este procediniento es equivalcnte ¿r utiliz¿rr rlíninos
",,u,lr,rdnrfencraliz¿rclos.
77.8. Problernas en la regresiótt rnúItiple 353
11.8.5. Multicolinealidad
El los ploblemas de regresión múrltiple, algunas veces. dos o más r,ariables independientes contribuyen
con iriforrnación redundante, porque se encucntr¿rn bastante correlacionadas ertre sí. En los casos
en que tal correlación sea alta, se dice que existe rmt,lticol,ineo,Iidad. Por ejemplo, se desea formar
r.rn modelo para predecir el precio del metro cua<hado de tielra en Lln sector de la ciudad (g), como
función del índice de irrflación ("r) y del precio clel clólar en el mercado libre (r2). Aunque las dos
va,riables aportan información, es conocido qne las dos -"ariables independientes están fuertemente
colrcl¿rcionadas; por 1o tanto, ia información pol ellas aportada es redundante o se traslapa.
En este caso, J.a matriz XrX es casi singular. originando clue sea difícil encontrar su inversa.
clondc r
cs el coeficientc de colrelación entle las dos variables. Así, si aumenta (en valor absolu-
to) lzr correla ión entre las variables explicativas. aumentarán las varianzas de las estimaciones y su
dcpeldencia.
Identificación
Si un¿-L variable es combinación lineal de las restantes variables. se debe analizar Ia matriz R-l. AsÍ.
sr: define el <<factor de inflación de la varianza>> corro cl z-ésimo término de la diagonal de Ia matriz
Rt:
FIV¡: diagr (R-1) .
Por tanto, eiernentos diagonales glandes (mayores a 10) en la rnatriz R-1 indican alta colinealidad.
rnáx{)¿i
nín {)¿}
Err La pr'áctica se adrnite clue existe alta multicolinealidad cuando el IC es rnayor que 30; una colinea-
iiclad modclada si el IC está entre 10 y 30; y, cnando el IC es merlor que 10 se considera que la rlatriz
está bicrr clefinida.
354 Capítulo 77. Regresión MúItipIe
Tbatamiento
11.8.6. Autocorrelación
Una de las hipótesis iniciales para desarollar el modelo de regresión es que los errores, €i) son variables
aleatorias no correlacionadas. Si esta hipótesis es violada, se dice que existe autocorrelación.
Los efectos de esta dependencia son los siguientes:
Eu el caso de un modelo lineal simple, la varianza del estimador de la pendiente resulta ser
')/
var(b) :- !' -l,1_,rDit':-t)
'^/
D,? \' D"? )
'
.
Í2
Si p > 0, la varianza puede resultar sustancialmente mayor que $5,ri cle rnanera que el estimador es
ineficiente. L
Identificación
Tbatamiento
Para explicar Ia evolución de variables que tienen r.rn comportamiento en el que aparece autocorrelación,
es conr.eniente utilizar métodos del análisis de series de tiempo, que permiten abordar de rnanera rnás
global el problema de construcción de modelos para estas r.ariables. También, se pueden utilizar
métodos especiales de regresión) colrro los míninos cuadrados generalizados o los modelos lineales
generalizados.
Por Ia dificultad que entraña la realización mannal de los cálcr-rlos, especialmente en la determinación
de los potenciales problemas que el modelo pudiera prescltar, ésto se hace mediante el empleo de pro-
Élramas estadísticos especializados) que facilitan su cálculo, correspondiendo al usuario la interpretación
correcta de los resultados.
EI lector deberá notar que los temas tratados aquí solo cubren la parte central del análisis de regresión.
Existen textos especializados que lo tratan de manera detallada y en extenso. (Véase Rawlings y otros,
200 1. )
11.9. Ejercicios
Modelos de regresión múltiple
13bo*2b1-2b2 : 4
2bo*2bt-bz : 2
-2bo-bt*4bz : -1
a) Resuelva el sistema de ecuaciones y encuentre el estimador b de coeficientes. Escliba
explícitamente la ecuación de regresión;
b) trscriba la forrnulación nratricial del problema;
c) Si Y¿Y:6, encuentre s2;
d) Calcule los coeficientes de determinaciórr múrltipl" R2 y arjustado Rl e interprételos.
llna empresa de transporte ha tomado una m,uestra de los pesos de seis ernbarques, ia distancia
transportada y el gasto que erl ellos se ha incurriclo:
a) Estime los coeficientes B6, 0ty Fz del modelo de regresiól lineal núltiple:
b) Use el nodelo para predecir el gasto cuando el embarque pesa 2.4Tm y se lo transporta a
1200 krn;
c) Calcule e interprete el coeficiente de deterninación urirltiple y el coeficiente dc determi-
nación ajustado. Conente los resultados.
Capítulo 71. Regresión MúItiple
ó Un economista está interesado en Ia relación quc cxiste cntre Ia demanda de viviend¿rs, su precicr
y el ingreso rnedio anual de los hogares. Si denoniin¿rrlos por y Ia denanda de vivienda, medidtr
en unidades adecuadasi z1 al precio pronedio de las vivicndas; y, 12 el ingreso familiar promedio.
Los valores de estas variables se recogieror] para 6 periodos y se muestran en Ia siguiente tabla:
Periodo ?l :x7 r2
1 8 72 6.8
2 I IL) 7.2
ó 12 1ó 74
4 I T4 77
a
r) 12 l4 7.0
6 15 l5 7.4
a) Asumiendo que el modelo de regresión es lineal rnúltiple, estime los coeficientes Bs, 0t y 0z
y sus intervalos de confianza corresporrclientes (rrse g5 %);
b) Calcnle R2 y RZ. Intelprete los valores obteniclos;
c) Construya la tabla ANOVA y realice ltr prueba de adecuación del modelo;
d) Use el modelo para realizar la estimación y la predicción de la venta semanal de un restau-
rante que será instalado con una capacidad de 150 asientos y se espera que ingresen 1400
clientes.
5. De una encuesta de presupuestos familiares se han obtenido los siguientes datos rnensuales:
a) Construya interprete un modelo par-a explical el gasto en energía eléctrica en función del
e
ingreso familiar y el tamaño de Ia familia:
b) Caicule los coeficientes de deterrnin¿rción (mirltipie y ajustado) v la varianza residual;
c) Constluya un intelvalo de corfiauza corr nivcl 95 % par-a el efecto de Ia variable ilgleso
farniliar;
17.9. Ejercicios 367
6. Sear las variables: .L : latitud en grados, A : altura en metros sobre el nivel del mar y 7:
ternperatura media anuai.
L tt ,4
J(J.9 JJ.Z 31.3 29.5 26.8 26.5
A 722 145 195 124 t07 r30
T 139 14.9 16.4 77.2 18.0 18.0
b) Prevea Ia temperatura media para Lrra ciudad cuya latitud es 30.5 y la altitud es 150 m;
c) Calcule los coefi.cientes de deterninación mriltiple y a.justado;
d) Realice la tabla de análisis de la r.arianza e interprétela;
e) Contraste la nulidad de cada uno de los parárnetros de Ia regresión e indique si es posible
encontrar un modelo mejor que el plariteado.
En un estudio sobre la relación entre tres varia,bles se cibtuvieron 11 mediciones con los siguientes
resultados
11 11 11
11 11 11
\-
Zr r"'
: -22, Dr3o: 484,
Drr,rn: r42,
,i:l t-1 i-I
1t 11 11
Regresión polinomial
10. En una entidad bancaria las tasas efectir.as de interés varÍan de acnerdo al monto del préstarno
que se concede) ya que se incluyen gastos administrativos e impuestos que cobra el estado. Para
encontrar un modelo, se recogieron los siguientes datos, de varios préstamos concedidos:
a) Grafique los datos ;' postule un rloclelo de regresión para los datos;
b) Ajuste los datos mediante el modelo de regrcsión de a);
c) Realice una prueba global de adecuación del modclo;
d) Pruebe si los términos individuales del rlodelo pueclen eliminarse.
11
t.t. Los datos que se presentan a continnación corresponden a1 tiernpo de secado de un balniz y la
cantidad de cierto aditivo quínico anadido:
Cantidad de aditivo ( g) 1 2 ,) 4 5 b 7 B
Horas de secado B5 80 60 50 6.0 tt
(J r, n.5 7.0
a) Use el método de ajuste a un modelo polinomial de segundo orden para modelizar los datos;
b) Realice una predicción para e1 tienpo de sccado, cuando se han añadido 6.5 gramos de
aditivo químico;
c) Calcnle los coeficientes de determinación R2 y RZ e ilterprételos.
12. En ttn estudio de la contaminación por gases despcclidos por ios vehículos en las calles de Quito.
se midió la concentración de plomo (en ppm) en cl aire y se registró la temperatura ambiente
(en "C) el momento de la medición.
1D
t,) Sc cree que en ciertas enlprcsas cxiste discrirninaci<il scxual cn el trabajo y quc se paga más a los
hombres clue a las mr-rjeres cuando re¿rlizan el misrno trabajo. Los datos de la tabla corr-esponden
a los años de expeliencia, el sexo y 1u..11¡klrrs arrttales (err miles de dólares), de empleados que
tienen las misrnas funciones en 9 empresas dc consultor'ía.
l.l Err lrna erl]presa que se dedica a la transpoltación cle triristas, se sospecha que el constuno clc
c-:ornbnstible de los autos dcpende dc la aritigiicda<l clc óstos y clel scxo cle c¡rieu los c<¡l<lucre.
Para probal esta sospecha se r-ecogió la siguientc infonr¿rciriri:
Los siguientes datos corr-espon<lcu al tierrrpo d<¡ sobrevirrerrci¿r, en horas. rle uuas ratas luego c¡rt:
se les suministra cierta closis de veneno. En ci expcrinrernto se consicleró 2 tipos de r.eneno (A I'
B) y la edad de la rata.
Edad (rneses) t 2
._)
J 4 1 2 3 4 2
D
()
Veneno A A A A B B B B A B
Sobrevivencia 45 8.2 63 7I 36 49 4.4 5.6 67 5.0
360 Capítulo 77. Regresión MúItipIe
P¿rr¿r cl análisis cle las serics de ticrnpo existen varios cnfoc¡res, ninguno de los cuales se puede decir
cllle es mejor clue los restatttes. Nosotros nos lefe-,-iremos al urás simple) qlre cs el de identificar los
pr-irrcipales factores qllc pal'ecen influil en los valoles inclividuaies de la misma y examilarcmos los
métodos de predicción que se agmpan bajo el nolrbrc genérico dc métodos de suavizamiento o cle
aterruat:ión.
L2.L. Introducción
Pala cl análisis de ttua valied¿rd de fcnórlenos físicos, económicos o fi.nancieros disponcmos de una
cierta cantidad de observaciotres de una lrism¿r variable aleatoria numérica, tomadas en norncntos
ecluiclistantes; entonces, los datos analizados tienen plopiedades interesantes aigunas de las cuales las
vanlos a presentar.
Prinrero, definamos lo quc se ctrtiende por serie de tienrpo (c1uc también se denomina como serie
ltistórito. r¡ serie cronolóq ico,).
Defirrición (de serie de tiernpo) Una scrie dc ticmpo cs un conjunto de datos que están
orcleu¿'rclos en el tietlpo y cllre lian sido tomados a interv¿rlos ecluiclistantes en el tiempo.
361
362 Capítulo 12. Introdttcción a las Series de Tientpo
Si Ias observaciones de un fenórneno se han realizaclo a trar¡és del tiernpo, es posible qrle preser]-
ten escluemas qr-le se repiten periódicaruente v que las obscrvaciones contiguas sean) probablernente.
dependientes.
A las series cronológicas se las representa mediante diagramas de dispersión (gráficos X -Y) donde las
observaciones se representan en e1 eje de las ordenadas y lar variable tcm.poral en el eje de las abscisas.
La r'¿rriable tiempo (ú) es la variable indeperrdiente.
1. La variable tiempo (ú), que tomará \ralores en los entelos positivos: t:0, I,2, ..., n.
_a- La variable de las observaciones (Y), que 1a supondremos dependiente del tiempo: Yo, Yr, ...,
v
Para realizar el análisis, en primera instancia, se aplicarán los rnétodos tradicionales de la inferencia
estadística para modelizar los datos y corocer la bondad del ajuste realizado.
Desde el punto de vista tradicional, los componentes de nna serie de tiempo son: la tendencia secular'.
y los conponentes estacional, cíclico e irregr.rlar.
De los conponentes que afectan a los valores individuales en una serie clolológica, el más inportante
es, getreraltnente, Ia tendenc'ia secttlar (o llamada sinplemente tendencia), que se define corlo el
mor.imiento característico de crecimiento (o de declecimiento) a largo plazo de la serie. Por eso, Ia
tendencia solo se pu.ede determinar si se dispone de datos de la serie en Lrn periodo largo de años.
La tendencia es la dirección subyacente (hacia arriba o hacia abajo) en la serie de datos, a largo
plazo.
Las ftterzas básicas que producen o afectan la tendencia son: los cambios en la población, la inflación.
el ca,mbio tecnológico, el incremento de Ia productividad y los ciclos de vida de los productos.
Para la modelización de este componente se ritilizan modelos lineales, polinomiales y otros. EI método
más simple, y más ampliarnente usado pala describir- la tenclencia es la regresión lineal sirnple y las
transformaciones que pueden hacerse hacia este modelo. Así, la tendencia puede ser lineal creciendo
a una cantidad absoluta constante a lo largo del tiempo- o puede ser exponencial, creciendo a una
tasa const¿rnte a lo largo del tiempo. Alternativamcnte, la tendencia puede ajustarse a un polinonio
o otlo modelo más cornplejo.
El coupouente estacional de la serie es un patrón de carnlrio qlre se repite legularmente err el tienrpo.
Este movimiento debe courpletarse dentro del pcriodo de un año y rcpetirsc, de rranera semejante año
tras ario, a fin de consicleralsc un cambio estacional. Así. ptrla identificar el conponente estaciolal cn
una scric histórica, es necesario recopilar los cl¿tos para rrrils cle rrrr pelio<lo de un ar-ro.
Por eiemplo, si considerarros Ios registlos dc clem¿rncla clc liabitacioncs er los hoteles de los sitios
turísticos más visitados, dnr-ante el ario. En los r]rcses rlc vac¿rciorres clc los regímer).es escolares de
la Costa ), de Ia Sicrra se procluce rlrayor derlanda cllle cn el lcsto cle mescs del ario. Así, los datos
presentarán rrariacioncs estacionales) con Lula rllarcAd¿r tendeucia a aurtrent¿rr, durarrtc los pcriodos
señalados.
\{ientlas que ia tendencia se rttiliza pala la plalificaciórr a largo plazo, el análisis del componente
estacional dc una seric histórica tienc implicaciones a cor-to plazo, más inniecli¿rtas.
Las fluctuaciolles estaciolales sc preseltan típictrniente err los clatos clasificados por rneses o trimestres;
Io clue conduce a qlre se deba c¿rlcular Lln valol estacioual por sepalacio para cacla rnes (o trimestre)
clel aiio, por Io general en la folma de un núuler'c1 írrclicc.
Etr la Fignra 12.1 se gráfica tura seric con collportalrierrto cstar:ional. La variación estacional se
reprcsenta nrcdiaute .D.
El coutponente cÍclico cs la flnctuación en for-tr. a, de on<l¿Ls cl ciclos, de urás cle un año dc duración,
proclr.rciclo por cambios en las concliciones ccouónricas.
Los coupouentes cíclicos sc asctrejan a los estacionalcs erl que t¿rmbiél son movimientos ondulato-
rios lepetitivos, pero difieren erl que 1os rr.ovimielrtos son de duración más prolongada y sotl menos
predecibies en cluración y en amplitud.
Un ejernplo dc variaciórr cíclica se presenta en el plecio clcl petróleo, que cll las úrltirnas décadas ha
tenido periodos largos de crecimiento sosteuido, segr.riclos cle perioclos cle fuelte caída.
El componente irreguiar puede deberse a fenórlerros como un clima poco usual, huelgas, guerras,
elecciones y cambios el las leyes, o por los errorcs qne se corneten al realizar Ias mediciones.
El principal uso de las series de tiempo es la realizacióu de pronósticos. En este capítulo nos con-
centrarenros en Lrn conjunto de técnicas de pronósticos conocidas como m,étodos de atenuo,cidn de las
series, qne son fáciles de implernentar y no requieren cle técnicas matemáticas sofisticadas.
Las técnicas de atennación o su"auizamtento se enplcan para reducir las irregularidades; es decir, las
fluctnaciones aleatorias) en una serie de tiempo, proveyendo una visión más clara del comportamiento
subyacente en la serie de datos.
En algulas series cronológicas la variación estacional es tan pronunciada que no permite apreciar la
tendenci¿r o los ciclos, que soL muy irnportantes para entender el proceso observado. El suavizamiento
pu.ede rerrover Ia estacionalidad y hace que las fluctuaciories a largo plazo aparezcan más claras.
Adeurás, con frecuencia, el analista quiere actualizar los pronósticos diaria, semanal o mensualnente
de manera rápida, barata y sencilla, eso se puede lograr mediante los métodos de suavizamiento de
los datos.
Las técnicas más cornunes son el suavizamiento por prom,ed,i,os m,óui:les y eI suaui,zami,ento erponencial.
Cono el tipo de estacionalidad varía de serie a serie, así debe variar el tipo de suavizamiento empleado.
Estas técnicas se basan en promedios ponderados cle rnediciones anteriores. La explicación consiste en
que los vaLores pasados contienen información de 1o que ocurrirá en el futuro. Debido a que los valores
anteriores incluyen fluctuaciones aleatorias, así como información relativa al patrón subyacente de la
variable en estudio, se hace un intento de suavizar estos valores.
Ventajas
Precisión aceptable (pcro de ninguna lrlauera cxactitud total) en una amplia variedad de apli-
ca(:10tles.
Desventajas
2. No pronostican los pr,rntos cr-ucialcs, cu.ariclo ha1' ¡'¿1m1,ius bluscos en cl patrón de los datos.
5. Pucclerr presentar problcmas técnicos en 1¿-¡ sclccción del moclclo corlecto y en la selección de Ias
coustantes de snarrizamienlo.
El método más simple e intuitivo es usar el pronredio sirnple, consistentc cl cncontrar la media arit-
n'rética cle todas las observaciones y tisarlo para pronostic¿rr el siguiente peliodo; es decir,
Vr.
1)''
rt+I : t:l
<>
?1,
Este nétodo, en gcneral, tiene una validez muy lirnitacla ya qr-lc es aplicable cuando 1os datos no
I)r'esentan tendencia, estacionalidad u otros patrones sisternátic<ts.
Ejemplo. En el Cuadro 12.1sc presentan las observacriorres qne corrcsponden alas ventas trimestrales
de una errpl'esa en el periodo 2003 a 2006.
El valol del pronóstico puede parecer bzrjo ya clue cr1 los plimeros trimestres de los irltinos arios las
t¡entas fucron nayores que el valor pronosticaclo. Adcn¿is. si deseamos un pronóstico para cada uno
clc ios trimestres dcl arlo 2007, no podcmos hacello. Vclrros que el método propuesto es insuficiente
pma nucstros propósitos.
En tnuchos análisis, 1os clatos clue prcsentan nl¿t\or intcrés sorr 1os nrás recicntes ya que ellos darán
lnayor información del actual estado del proceso que aclut:llos d¿rtos que fucron tornados al inicio del
tnismo. P¿'Lra realizar ésto sc puedc cralcular el pronreclio para l¿rs observaciones más recientes. AI
cstar disponible una nlle\¡a observación, se puecle calcul¿u' r-lna nlieva media eliminando el valor rlás
arrtiguo e incluyendo el rlás recientc.
P¿rra describir este cnfoquc sc emplea el tórrliuo ¡rrorucrlio (o rur:dia) rnóvil. Entonces, se usa est,e
1-rlon-iedio mór.il p¿rra pronosticr¿u el siguiente pclioclo.
366 Capíttrlo 72. Introducción a Jas Series de Tientpo
doncle
AsÍ, el promedio uróvil para cl periodo ú es i¿r rnedi¿r aritnrírl ic:¿r <lc las r¿ obser\raciones más recientes.
Obserrrcmos que el nittnero de perioclos que iuter\:ienerr clr cl c¿ilculo dc nna media móvil palticuiar
no c¿iurbia al correr del tiernpo. Porésto, es inrportzrltr: cscoger ci nÍrrnero de periodos ??r qlre scl
clenoruina su orden. Para datos trimestrales es frecucnte clue se utilice rrn plomedio móvil de ordeu
4 y para clatos nensuales un promedio mórril <le orclen 12: cs clecir. se ernplea el misrno orden de la
estacionalidad dc la serie.
Ejemplo. (Continuación) Realizar cl pronristico. urercli¿ruttr nrccli¿rs mciviles. cle los clatos del Cuach'cl
72.7.
Solu,ción: Como los datos están clados en forra tlirlestr'¿rl tonralemos una media móvil de or-clcl 11.
720+460+618+855
: 663.3.
Entonccs. para el primer trimestre del año 2006 se espcr'¿r tener urr nivel de ventas igual a it :
663.3. Si comparanlos con las obsenaciones clc los riltimos airos, cl valor del pronóstico es mucho más
lazonable que el anteriormente obtenido, per-o persiste el problema de Ia realización de pronósticos a
mayor plazo.
72.3. Atenuación de series de l,ienrpo 367
Pronostico de
Ventas Plomedio
Año Trimestre t Y, rnovil, ?,
11ó98
22390
33267
44573
2003 15588 457.r
26425 454.5
ñt1
ó I Jf I 463.2
48609 489.3
2004 19777 198.2
2 r0 532 545.5
3 11 433 572.4
4 t2 689 587.7
2005 1 13 855 607.8
2 14 618 U¿T.J
3 15 460 648.8
4 16 720 655.6
2006 117 663.3
Cuadr-o 12.2: Pronóstico mecliante pr:omeclio móvil.
Daclo que NIr:?r+t, se Lrsa esta nueva serie para calcular un segunclo conjunto d.e promedios
móviles:
: AI¿ I A[¡-1 + A'[t 2+ "' + A'I;,,+t (t2.2)
^rl
3. Se calcula Ia diferencia entre los dos promedios rnóviles:
y ttu factor de ajuste adicional, similar a la medición de una pendiente que cambia a través de
la selie:
,
b,: ;t_ tQt, - tt',) . (r2.4)
Y+y,:cr"¡lb1P, (12.5)
Ejernplo. (Continuación) Realizar el pronóstico, con la tócnica de la prornedio móvil doble, de los
:latos del Cuadro 12.1.
-\ continuación se exponen los cálculos para compr-ender el pronóstico del trimestle 17.
368 Capítulo 72. Introducción a las Series de Tiempo
Promedio Pronóstico
Periodo Verrtas Promedio móvil Valor Valor a+ W
t YL móvil doble de o de b (p: t)
598
390
267
tr¿73
457,1
588 454.5
42ó 463.2
37t 489.3 466.0 5t2.5 15.5
609 498.2 476.3 520.1 14.6 528.0
9 777 545.5 499.1 592.0 31.0 534.7
10 532 572,4 526.3 618.4 30.7 623.0
11 433 587.7 550.9 624.4 24.5 649.1
72 689 607.8 578.3 637.3 19.6 648.9
13 855 627.3 598.8 655.8 19.0 656.9
1.4 618 648.8 617.9 679.8 20.6 674.8
15 460 655.6 634.9 676.3 13.8 700.4
16 720 663.3 648.8 677.8 9.7 690.1
17 687.5
Cuadro 12.3: Pronóstico por promedio móvil doble.
2. Una vez que se ha realizado el suavizaniento por promedios móviles simples de toda la serie se
emplea Ia ecuación 12.2para calcular el segundo promedio móvil de cuatro trimestres:
3. Se usa Ia igualdad 12.3 para calcular la diferencia de los dos promedios rnóviles:
El pronóstico para el primer trimestre del año 2007 es d,e?17: 687.5, que puede parecer más razonable
que los dos resultados presentados anteriormente.
72.3. Atenuación de series de tiempo 369
El rnétodo plomediar los rralorcs anteriores de una serie, haciendo esto de forma decreciente,
se basa en
zrsigrrtruclo nlayor peso a las más recientes. Las ponderaciones empleadas se designan cotllo a (0 <
rl < 1) para la observación rnás reciente, a(l - a) para la siguiente más reciente, a(1 - q2 para la
signierrtc, y asÍ sucesiva[rente.
?r*r:aY+(1 -.)?,,
clon<1e
i,*r : rme\¡o valol atenuado o valor del pronóstico para el siguiente periodo;
¿v: colstante de atenuación (0 < a < 1);
Uua mejor interpretación de Ia ecuación que define el suavizamiento exponencial se puede ver en la
siguiente dcscomposición:
error (n - ?r\
r- antelior lfr)
\-'/ '"*" "'"..'^ \-ü -')'
L¿r ¿ttcrrtración exponencial es sirnplemente
"- el
.-^ pronóstico a veces el
"r¿r
ert el prortóstico auterior'.
La coustante de suavizatlieuto a sirve como el factor para ponderar, El valor de cv determina el grado
llast¿r el cual 1a observación más reciente influye err el valor del pronóstico. Cuando rr es cercano a 1,
ett el rruevo pronóstico Ia observación más influyente será Ia rnás reciente. Inversamente, cuando a es
cercallo a 0, en el pronóstico influirárr todas las observaciorres de rranera similar.
IJn rnétodo para estimar cr consiste en encontrar aquel valor que minimiza el error cuadrático medio
(ECM):
17
t
. ',
(r -?,)
ECM: t:I
1
11,
para diferentes valores de a. Para generar pronristicos firturos se clige el valor de a que prodr.rcc el
cr-ror más pequeño.
370 Capítulo 72. Introducción a las Serjes de Tientpo
Err la siguiente tabla se preseutan los cálculos clc los valores dc las ponderaciones para dos valores cle
o, En clla se puede observaL cómo influyen los valorcs pastrdos cr los pronósticos, en dependencia de
a.
a:0.1 a :0.6
Periodo Cálculos Ponderación Cálculos Ponderación
t 0.100 0.600
t-I 0.9x 0.1 0.090 0.4 x 0.6 0.240
L_: 0.9x0.9x0.1 0.081 0.4x0.4x0.6 0.096
!t
l,-L) 0.9x0.9x0.9x0.1 0.073 0.4x0.4x0.4x0.6 0.038
Los lestantes 0.656 0.026
Total 1.000 1.000
Solución: Los resultados se presentan en el Cuadrc 12.4 con r.alores de la constante de ateuuación de
0.1 y 0.6.
La serie atenuacla se calcula asignando iniciahnent r, ?, : 598, que cs el primer valor observildo, a
continnación Los cálculos se re¿rlizan de Ia siguiente ntaDera:
El cllor-de pronóstico es
e2 : Y2 - ?, :3g0 - bg8 : -208.
?n : oY16l (1 - *)ña
: (0.1)720 + (0.9)576.5 : 590.9.
Con sinrilares cálculos, para una constante a:0.6 el pronóstico del periodo 17 es?y:650.2.
Para definil cuál de Ios dos plonósticos es el más aceptable, se puedel comparar los errores cuadráticos
nrcdios cle l¿rs series.
Primero, conviene que tengamos en cuenta que debido a qlle los valores de la serie no son pronósticos
en sí rnismos, Ias ecuaciones de actualización son más comprensibles si se adopta la siguiente notación.
-1. coltinuación se pr-esentan Ios cálculos correspondientes para el pronóstico del periodo 17.
372 Capítulo 72. Introducción a las Series de Tietnpo
2. La ecuación 12.7 se usa para calcular el valor doblemente suavizado exponencialmente (columna
4).
A','u
: .',&;J;; üÍí;,, B:571 0
3. En la colunna 5 se calculan las diferencias entre los valores atennados exponencialmente, me-
di¿rnie Ia igualdad 12.8:
4. Con la ecuación 12.9 se calcula el vaLor ¿rdicional cle a.iuste (columna 6).
brc: ,L (Y
-
=(A,o-Aio)
0.1
(590.9 571.0) :2.2.
U 9
-
5. Finalurente, se empiea Ia igualdad 12.10 para hacer el pronóstico en el futuro:
2 Se estima la tendencia:
Tt : 0 (A, - Ar_t)+ (1 - p)Tr*t. (r2.12)
donde
La primera ecuación es similar a la igualdad original de atenuación exponencial simple, con excepción
de que se incorpora el término ("ú) para la tendencia.
En la segunda ecuación se toman dos valores sucesivos de atenuación exponencial, ya que ellos se
atenuaron con fines de eliminar la aleatoriedad, su diferencia constituye una estimación de la tendencia
local de los datos. Se atenúa esta tendencia con la constante B y se le suma la tendencia anteriormente
calculada multiplicada por 1 - B. EI valor obtenido es una tendencia atenuada que excluye cualquier
aleat oriedad.
La ecuación del pronóstico suma el nivel actual de los datos A¿ y el producto de la tendencia T¡ por
los p periodos.
2. La estilnación de la tendencia:
Tz: 0 @z -
Az_l) + (1 - 0)Tz t
: 0.2(535.5-598) +(1 -0.2)0: -r2.5.
?t*, : AzrPTz
: 535.6 + (1)(-12.5) : 523.1.
1. Actualización de la seric:
Arc aY16 t
(t - r) (Arc-t +
"ro-r)
0.3(720) + (1 - 0.3)(625.8 + B.e) : 660.3.
2. Estimación de la tendencia:
ñu*'
: !;;!?¿{^o)(1): 6T4s
72.3. Atenuación de series de tiernpo 375
La atenr-ración por el método de Winters es apropiada cuando la serie presenta una tendencia lineal
y una variación estacional. Es una extensión del rnodelo de Holt, en la que se utiliza una ecuación
adicional para estimar la cstacionalidad nediante un índice estacional.
2. Se estima la tendencia:
Tt:0(Ar-At_t) +(1 - p)Tt_t. (12.15)
Se estina la estacionalidad:
c,- Y'
^,i*(1 -r)5¿-¿. (12.16)
donde
-L : longitud de la estacionalidad;
)i+p :
?.
prorióstico de p periodos en el futuro.
Ejemplo. (Continuación) Realizar el pronóstico, mediante el rnétodo de Winters, de los datos del
Cuadro 12.1.
Para comenzar los cálculos, verios que la longitud de la estacionalidad es -L : 4 y que se requieren las
estimacioncs inicialcs del valor atenuado, de la tendencia y cuatro estimaciones de la estacionalidad.
Para principiar el proceso de cálculo, usaremos 598 como valor inicial de la actualización, 0 cono el
vak¡r de la estirnación inicial de la tendencia y 1 como la estirnación de la estacionalidad.
Analiceuros los cálculos de los periodos 2 y 17, utilizando los r,'alores de a: 0.3, P:0.2 y ?:0.1.
376 Capítulo 72. Introducción a las Series de Tiernpo
1. Cálculo del valor de la actualización de la serie. Para iniciar el proceso tomamos At : Yt, Tt : 0
Y Sz_,+: I:
A2 :
"3J24 + (1 - o) (Az-t -t Tz-t)
: o tfS + (1 - 0.3)(5e8+o) :53b.6.
2. La estimación de la tendencia:
T2 : 0 @z - Az_t) + (1 _ p)Tz_t
: 0.2(5355-598)+(1 -0.2)0: -t2.5.
3. La estimación de la estacionalidad:
1. Actualización de Ia serie:
2. Estimación de Ia tendencia:
3. La estimación de la estacionalidad:
a) De un periodo en el futuro, p : li
ñu*, : (1ro + Trcp),9ro-¿+r
1614.41 + (-1.6e8)(1)l (1.04) : 637.2.
El método de Winters presenta la ventaja sobre los otros métodos en que podemos realizar pronósticos
por más periodos (por lo menos por un ciclo completo de estacionalidad).
Hemos expuesto varios métodos sencillos de pronosticación de series de tiempo. En este punto surge
la siguiente inquietud: ¿cuál método ernplear?
Primero tengamos en cuenta que no existe un método qtle sea el mejor en toda ocasión. La elección
del método dependerá del conjunto de datos que se disponga y de la finalidad de los mismos.
La comparación de las técnicas de atenuación se realiza rnediante el error cuadrático medio que, como
.va se indicó, se calcula por
n
2 t
t (t'-Y) >,"7 ^r2
t:7
ECM: tl
I
donde e¿ es el error de pronóstico para cada una de las observaciones de la serie. Entonces, podemos
enunciar la siguiente regla:
lAquel método que proporcione el menor ECM será el más apropiado para la serie de tiempo que
lse analiza.
Ejemplo. (Continuación) Para los datos del Cuadro 12.1 veamos cuál es el método más apropiado.
378 Capítulo 72. Introducción a las Series de Tiempo
Solu,ci,ón: En el siguiente cuadro se encuentra el resumerr de ios rnétodos analizados con su ECM.
Método Parárnetros ECM
Promedio móvil simple 20826.2
Promedio móvil doble 24834.8
Suavizamiento exponencial cv: 0.1 27 902.7
Suavizamien to exponencial a:0.6 33 991.3
Suavizamiento exponencial doble a:0.1 29 547.4
Método de Holt a : 0.1, D
t): 0.2 31634.7
NIétodo de Winters a : 0.1, a 0.2, 1 : Q.1 54548.9
De los resultados, aparenternente, el rnejor método es el prornedio rnóvil simple y el pronóstico basado
cn él serÍa el apropiado.l
Respccto a Ios parámetros de suavizamiento debemos indicar que ellos siempre varían entre 0 y 1.
Para cada constante de atenuación, cuanto mayor sea su valor, tanto mayor importancia se le dará
a la obselvación más reciente. Téngase plesente c¡re la mayorÍa de Ios programas estadísticos que
disponcn de estos métodos tienen implenentados algoritmos que escogen automáticamente la combi-
nación de parámetros que dan el ECM mínimo, lo que permite tener una estimación apropiada a las
observaciones disponibles.
Se aconseja al lector que implernente las fórurulas de los dir.ersos métodos en una hoja electrónica, lo
que Ie facilitará la realización de los cálculos.
L2.5. Ejercicios
1. Eu una academia de idiomas se sigue un sisterna trirlestlal. El núrmero de alumnos que estudian
el idioma esperanto en cada trirlestre, durante 4 años, se resume en Ia siguiente tabla:
Las ventas trimestrales de casas que ha lealizado una cornpañía inmobiliaria en Ios últimos años
se presenta a continuación:
Elementos de Muestreo
Pot'un per1ueñ,o ltcrl,o,zo tl,e tn,u.estru. pod,e'nr,os .ju,zqa,r a Lo" piezo, r:otn,'pleto,
Miguel clc Cervantes Saavedra
Clonro sc inclicó en el CapÍtulo 1, en mnchos estrrclios cstadísticos l¿r lccolección cle la infolmaciórr
sc lealiz¿r medi¿intc Ia invcstigación pol nruestLcc.l )/ sc sacan colclr-rsionos con b¿rse cu la <<ilfeleucia
cst¿rclístic¿r>>.
Ilstc ca1>ítulo cst¿i dcdicaclo a cxponel los métoclos básicos cmpleaclos cn l¿rs invcstigaciorlcs pol'
rrrLrcs'iLco. I)elo rlo solo en Io ciue tiele cluc vel con 1a par-te estaclístictr, también se clatr algtttrtrs
inclicaciorres par'¿r la realiz¿rción pr'ácticir cle los sonclcos.
En las irivcstigaciorles cllyo objertivo cs la lecopila<:ión c1e infonn¿rción csl¿rrlÍstic¿ sobrc rrn glullo cle
1 L¿r cncucsta total o censo, cuvo objeto cs cr¿uninar a toclos los eienrcnbos dc la pobiación.
2 La cncuesta palcial () l)or- ruuestreo. cluc tir:nc por objeto examinal uua partc pequcrla rle la
población, e infelil rcsullaclos pala aplicar'los ¿r 1a población conplcta.
Ac¡rrí apaleccn clos conccptos rluc fi'ccucntcncntc rrtilizalernos: la poblaciótr (o univcrr-so rnucstlal) y Ia
rrrlostr t.
Dclinición (de población) Unir 1;oblacirirr cs rulr c:olcc:cióu cornplirlir clc pclsor¿ts. ¿uriuralcs,
plrrrt:rs o cos¿ls de las cn¿rles se rlesea rccolcct¿tl cl¡tos.
Definición (de muestra) Es un grlrpo de rrni<laclcs sclcccriou¿rrlas <lc un grupo nrayor (la
pobltrción).
En ilnchos casos la clccción clc un:i mtLestr'¿r cs f¿icil: pol ejerlplo. p¿rrl conoccl la plopoicicirt r.Ll
<lespclclicio cll llrl s¿rco cle maíz o par¿r colloccr cl nrinrclo cle piczars clcfcctlLr-¡slLs cn un lote clc plodlLtt,.-,s.
381
382 CapÍtulo 73. Elententos de I\[uestreo
etc. Bast¿uá mezclar bien los ploductos )' tourar ttna pcclttetia paltc cle ellos. Lo clue se deduzca de
cstir peclueña polción (o muesir-a) ser-virá pala ,juzgar a la totalidad clel producto.
Par'¿r conocerla preferencia clc Llna rrarca de gaseosa por palhe dc los corrsumiclores, o el tiempo que
Iu población declica a mirar Ia televisión o cl favoritismo por cicrto particlo político entre los votantcs,
cs rnás complicaclo. Los elementos son más hetelogéneos )'serí¿r imposible aplicar el método clesc-.-ito
pala tomal una mnestr-a, como se hace con los plocluctos.
Aunque Ia muestra poclría tonralse corno Lul subcorrjunto cr.ralcluicra cle la población, en una iuvcsti-
gación es necesario que cr-rrnpla cor ciertos requisitos. par¿r c¡.lc rros pro\¡ea de inforrnación colfiable
sobre Ia población. La mlrestla ira de ser Llrla rcproducción cn peqneño cle la poblaciól. AsÍ. ha de
sel' nn Ecuador, un Guayas o un Quito en ruiniattua, si se trat¿r cle ul sondeo relativo al Ecttador, o
l:r. provincia clel Gr-rayas o a la ciudacl cle Qr-rito.
Pcro. ¿cómo hacer para qlrc l¿r mncstra sea una copia. cn pcc¡.rcño, de la población? La respttesta cs
qrrc ln rluestla debe cstal coustituida por uu. núrmelo suficicntc cle elernentos, tomados al azi'tr', clc la
población.
Pala l¿r correcta elección de la muestla, el] plirrel lugal cs necesalio hacel nna lista de los ob.jetos cle
l¿r c:ual se la seleccionar'á, hrego se procederá a sortearlos para incluirlos clr la nruestra.
Definición (de unidad rruestral) Los objetos que se scleccionan dc una poblacióu se llauran
Luricl¿rdes mnestlales.
Definición (de marco muestral) IJn malco muestral es nlla lista courpleta dc todas las uriclades
rnuestrales de la población.
Por ejemplo, se desca conocel las prefer-encias electorales de toclos los rniemblos aclultos de Ia ciudacl
clc Arnbato. La población est¿i constituida por todas 1as persorras cn capacidacl cle r:otal que viven eu
Ambato. El marco uruestlal es una lista complcta con los nolnbres de cada miembro de la población
(cl pachón electoral). Una uuiclad uruestral cs tin residentc cr. Ambato y qnc csté crr capacichcl de
r.otAt.
Obselveuros que IIo siemplc cs posible tener nn lllarco rnuestlal pelfectameutc clcfinido) ya sc¿r polqrle
óst,c es urtty glaude) o l1o cxislc, o rlo se lo pucdc colfcccionar', \{¿1s aúrn, solo cr-ranclo la poblaciórr cs
pcqrtcria o coutt'olablc por cl invcstigador, es posible corrtar con Lrr. rnarco muestral ideal. Preguuté-
nronos: ¿quiéu podría clabolal nna lista de toclos los individuos, o dc toclas las falnilias, que vivcu cri
Grrayac¡ril?
Anl-cs cle telurinal', tcLretnos c¡re t'cferirnos a las convcnicncias y a las liruitacioncs cle las rnneslr'¿rs) con
lcsJrecto a la re¿ilización clc Lut cjenso.
1. Si se necesita ilfornación cle todos los elenentos qrre conforman el ruriverso estadístico.
A corrliurración expondrclllos ios plincipirlcs tipos cle iln'cstig¿rciorrcs pol rnrrcsl-r'co, qilc sorr cl ale¡rtoricr
sirn¡rlc. el cstr¿rtificirdo ¡' ¡l clc conglornelados.
La mar-oría de sondeos tienc uno cle los tr-es ob,jetivos siguientcs: cstinal cl total poblacional r, o
c.stirn¿,r la mcclia de nna poblaciól p, o cstimar la plopot'ción pol-rlacional p.
t:fu¿:N¡t,
r.:1
Pol ejemplo, cn Ltra cncltcsl-l lc¿ilizad¿r los grrstos cri salucl clc los habitantes clc uua
palr,L csbirrr¿rl
cir.iclacl. se investigaría cl gersto mcclio por pcrsona, l¿, que lcalizan cn Lrn arlo; o tzrrnbién, ltucde scl cle
intcr'és cl gasto tobal, r, cluc sc rcaliza en dicho pobiado por corccpto cle salucl.
Donrlc:
7 es el prornedio de la m.uestra.
s es la desviación estándar de la muestra.
Q
zo¡2 eI coeficiente de la ley normal estándar1 para el cual el área en el extrerno superior es igual a-
2
Tamarlo de Ia muestra
La cantidad clue hay que sr.rmalle o restarle a un estimador, en la coufección del intervalo de confianza,
se denomina error. En nuestro caso
De aquí, si se desea tener una estimación al nivel (1 - .) x 100 % dc confianza, con un error E" dado.
a partir de una muestra obtenida de una población de tamaño l/, el núrmero de unidades a incluir en
el sondeo es
(r*¡21{ r)2
n] + (2,,¡z)' Nr'
trjernplo. Una empresa de telefonía celular desea estimar el tiempo total que se emplean sus líneas
errun fin de semana. Se seleccionó al azar una muestra de 420 clientes, de los 62000 que habían
hecho uso de sus teléfonos y se registró el tiempo de uso. El tiempo proneclio y la desviación estándar-
de la muestra fueron z:3.61min y s: 1.2Bmin. A un nivel del 95.5%: a) obtener un iltervalo
de confianza para el tiempo total de uso de ios teléfonos ese fin de semana; b) Considerando una
desviación estándar de 1.25. calcular el tamaño de la muestra para qne el error sea menor o igual a
20 000 minutos.
Soluctót¿:
a) Para este ejemplo, ly' : 62 000, n: 420, T : 3.61, s : 1.28 y zo.ozzs:2. Entonces,
i : Nr: 62000 x 3.61 :223820
El intelvalo es
62 000 x ooo x
(,,,r,, -, 1.28
;223 B2o * ,62
\/ 420
1 '28
4N2 s2
'" E? t 4l\t s2
4(62 oo0)2(7.2q2
:60
(20 000)2 + 4(62 000)(1.25)2
Intervalo de confianza
El intervalo para la rnedia poblacional ¡i, a un nivel de confianza del (1 - CI) x 100% es
Tamaño de la muestra
El tamaño de la muestra necesaria para tener rln error prefijado Er, a un nivel de confianza de nivel
(1 - r) x I00To, a partir de una población de tamaño Iy' es:
( :^.,,\2 N s2
,,_
NEu_\rq2)r"2.
Ejemplo. En un estudio nédico sobre el consumo de tabaco, por la población adulta, en una ciudad
de nn r-nillón de habitantes aclultos, se consultó a 120 personas. Los resultados de Ia investigación
mostralon ttn consumo promcdio diario de 3.8 cigarriilos, por persona, col] una desviación estándar
de 1.1, a) Deterrninar cl intervalo al97% pala el lúrmeLo promedio de cigarrillos que se consumel; b)
¿A cuántos individuos ha de consultarse para que la estimación del núrmero medio de cigarrillos quede
a rnenos de 0.3 del valor verdadero?, si se considera un nivel de confianza del g5 %.
Solución:
I 000000
'--" - 720
--".o o n1n 1.1
-'' 1 120
r 000000 t/tzo
(3.8-0.22;3.8+0.22)
("o¡2)2 N 12
N E'zt, + (r*/r)2
"'
(1.e6)2 (1 ooo ooo) (1. i)2
:51.6
(1 000000)(0.3)2 + (1.e6)2(1.1)2
Este caso es, probablentente, el más empleado en las investigaciones de rnercado y en los sondeos
políticos; así, frecuentemente se encuentra en periódicos y revistas datos como éstos: el 70% de la
población rechaza la decisión del gobiemo de aumentar el precio de los pasajes, o un 45 % de los
consumidores de gaseosas pr-efiere urra marca determinada.
Intervalo de confianza
Donde:
Tamaño de la muestra
El tanrari.o de la r-iruestra necesaria para tener nn error prefij ado Ep, a un nivel de confianza del
(1 -.) x 100%, a partir de una población de tarnaño l/ es:
":ffiffi
Como nuchas veces se desconoce la estimación f, se toma el tamarlo máximo de la muestr-a, que se
obtiene haciendo F: l: 0.5; entonces,
Qot)2 N
"
to:-
4N EB - (rntz)2'
Ejemplos
EI intervalo es
(u - ,^,, lf I z,,,lz
17:
Q^p)'tvlQ
I\r Ei + Q"d2f Q
: 207.6.
Q*t)'l'l
4Iv E3-r Q^t)2
(2.33)220 000
: 370.
4(20 U00)(0.06)2 + (2 33)2
Este segundo caso provee el tamaño máximo de la muestra, igual a 370 hogares.
Una federación de transpot'tistas pelmite clue ciertos gastos de sus afiliados (gasolina, iubric¿rntes
v lavado) se hagan mediaute Ia utilizaciól dc la tarjeta de crédito expcclida para el pago en las
gasolineras locales. La ernpresa ha expedido 10 050 tarjetas.
Para realizar una investigación sobre la utiliz¿rción cle la tarjeta. Se realizó nna encuesta pre-
lim.inar de 90 tarjetas y se encontró que 63 de ellas fueron utilizadas para pagar servicios en el
rrcs en referencia. Se determinó clue el total de gastos canccl¿rdos con las tarjetas fue de 23 900
dólares y Ia desviación estánclar- de 60. Se clesc¿r detelminal el tamaño de la muestra, con un
error del 2Voy una confiauza det 95.5% para estimar': a) la proporción de afiliados que utilizan
Ia tarjeta; b) el gasto promeclio mcnsual cancelaclo con Ia taljcta; c) De los tamaños rluestrales
anter-iores, ¿cuál se aconsejaría?
Solución: Se tiene que ly': 10050 y rz:90.
rr) Calculemos toclos los elementos previos: t: #:0.7, ?:0.3, Ep:0.02. De aquÍ,
, .').,^^
lz..lt)'1\pQ
t{ Ei + Q"p)2fA
4(10 o5o)(0 7)(0.3)
: 1737.
(i0 050)(0.02)2 + 4(0.7)(0.3)
388 Capítulo 73. Elententos de Muestreo
23 900
b) El gasto promedio de las 63 tar,jetas es dc r: : 379.37.
ti3
El error es de -8, : 0.02 x379.37:7.587vs:40" El tamaño de la mllestra, es de
t- rl rv
n¡^2
\ ¿ol: / 5
n:
-\'E? + (:^,"\2 s2
c) El tamaño óptirno cle 1a m,uestra es de 1737 tarjetas, puesto quc es el mavor valor calculado.
13.3. Ejercicios
Se quiere estirnar cuántas balas se gastaron en Llna práctica de combate en la que intervinieron
8000 efectivos. Para tal efccto, se tonó una mucstra de los registros del núrmero de balas
empleadas por 115 militares participantes, resr-rltando un promedio de94.7. Además, en prácticas
sinilares, se ha medido una desviación estándar c1e12.7. Para un rivel del 97%:
t
J. Ura empresa de alquiler de fotocopiadolas desea conocer el total de copias que sus clientes
lealizan en un rnes. De sus registrosr que indican que la enpresa tiene alquiladas 280 máquinas.
se seleccionó 33. En éstas cncontró que en Lrn nes se realizaron un promedio de 1228 copias.
con una desviación estándar de 193.
trl dueño cle un restaurante de$ea €onocer e1 consumo meclio cle los clientes de su negocio. De
entre las 1469 facturas correspondientes a las vcntas que tnvo la úrltima semana seleccionó, al
azar-, a 119. En e1las deterrnirLó un gasto promedio de 4.5 dólarcs y una desviación estándar de
0.93 dólares.
1r) Deternine cl tamarlo clc la mr-restra p¿rla c¡re cl clr-or se¿r. rnorlol' a 270 clólales cn Ia cstilr¿rción
del total;
c) Realice el intelvalo cle confianza, de nivel 99 %, pala el consumo tobal sem¿rnal en el r-estalr-
lante.
0 En urr estudio clc nelcaclo sc tomó nna mncstr'¿r cle 34 pclsol¿ls cle cl¿rsc rneclia. cluiencs inclic¿uon
c¡.re gastaban 48 clól¿rlcs rncnsuales eu clivclsiorres) coll clcsviaciórr cst¿irrclar clc 1.76 clólales. Corr
rur¿r confiabilicl¿rcl clcl 98.5 %, halle:
ir) cl tzrmario mucstlal rnÍnimo para lcalizal el mismo esturlio crl Lln grLlpo sirnilal cltte cttcntar
con 5000 pcrsorlas, si cl límitc palir la estim¿rciól clel cllol cs igual a 0.5 clólar-es;
lr) cl tamaño mucstr-¿rl mínimo para cl tot¿rl clel gasto pol cl glnpo de estuclio, si el líuritc palzr
el error dc cstimación cs cle 1500 dólales;
c) cl intelrralo clc confianza pala la meclia rlcl gasto, si los valoles clel gasto promeclio y cle Ia
clcsviación estánclar se manticnen en 48 S, I.76 clólalcs, r'cspcctivrrmentc, y se encuesta ¿r 67
pelsonas.
7. El gcrcntc de lcculsos hnmanos quiere estimar cl núrmer-o rueciio y el total clc horas anuales cle
cntrcnarniento pala los 280 cmpleados de una división de la compañía. Toma información cle
los lcgistlos del año ¿rntcliol cle 35 empleados y obtiene un promeclio cle 125 y una desviación
cstírnclar-dc 20 horas de cerpacitacióu anual.
rr) CalcLrle los iltelr'¿rlos clc confianza, ttl 99.7ya, perla la nlcclia )/ cl tot¿tl cle hor'¿rs enil>lcirrlirs
cn cntreuanicnto;
b) Corr Los datos ¿urtcliorcs ), si la estimaciórr cle ia mecli¿r h¿r clc cstar ir t4.5 holas clcl r'¿rlor'
tcrclaclclo, o l¿r cstirn¿rción clel iotal h¿r dc cstar a 41700 lror¿ts clcl valor r.crdaclelo, ¿cu:il cs
cl tanarlo mucstr'¿rl rcclueliclo?
n) Si cl rtÍrmelo cle éxitos fr.re de 40, calcule un intervalo cle confianza al 95.5% pala la propor-
ción clc éxitos;
l>) Flallc cl tarnaño cle l¿r nucstla pala clue el crrol máximo sca clel 6 %, cnplcanclo ia ploporción
ruuestl¿rl hallada plcviaruente;
c:) ILillc cl taltairo nr¿ixinro de la muestla, si no se tiene infolrnación plelirninal clc ll pro¡ror
ción.
'.) Err itn cstrLclio sobr-c tncrlios c1c conrunic¿rción sc cluicre cstinr¿rl la ¡llo¡rolción dc los cslucliaut.cs
<.[c urt colcgio sccr-tucl¿rt'ii-r <¡tc rniLau legrrlalnrcrrtc las noLici¿rs. Eutlc los 3100 cstucli¿url"cs clci
t:r>lcgio sc cscogiclon ¿r 250 p¿r.r'¿r. (lue lesponclan Ia plegnnta. De óstcls, 76 irrclicalorr cluo'llLir'¿ur
l¿rs nolici¿rs. Pal¿r un nivcl dc confianz¿r clci 98%:
1r) fi.jc cl tam¡Lricr tle l¿r tlLtcstla ueccsalia p¿u¿l tencl un cllor'rncliol al 5% si, (i.) sc tonr¡r cl
valoi rlc 19cstirrlaclri rrnics. (ii.) si uo sc ticuc iclczr plcvirr clo l¿r ploi)orcitiu.
10. lll Sr. \/¿ug¿rs cst.¿rL Perrsirrrclo Post,ularr ¿r lrr ¿rlt;¿rl<lí¿r clc Pclilco. Alrtcs clc folriralizal srr c¿irLrlicl¿ltlrr'¿r
<lccirlc lcaliz¿rl un¿r crr'',ircstir clc o¡rinión cn l¡ loc¿rlicl¿rcl. Dll c-.1 c;¿rutólr hay 12 000 ¡rolcrrciirlcs
clcc:torcs y sc rcalizó iur¿r L)-imela cousult¿r a 270 pclsonirs, clctocttinciosc un ¿U)oyo clcl 30% clt:
los posibles elcctolcs.
390 Capítulo 73. Elententos cle Mttestreo
ir) EncuentLe un intcLvalo de confianza aI gT 01, pzrrer la plopolción dc votantcs que lpovaríztn
al Sr. Vargas e intelpretc cl lcsultado,
Como el Sr. Valgas no estaba segluo de los lesultados de la pliurer'¿r consulta, decide contratar
a una errrpresa para que reaiice uu segundo estudio. La emprcsa i,rdica que Ia encuesta tienc
u.u costo fijo cle 5000 c1ólales urás nn costo rrariable de 4 dólalcs pol czrda entlcr¡ista. ¿cuánto 1e
costar-á cstc tlaba.jo ¿rl Sr. Var-gas si ól qrrierc r('ner nn clror clc 4(% c'on nna confiabiliclad dei
98 %.
l,) si se iom¿r como polccntaje clc r.otautes favor'¿rbles ¿r l¿r cancliclatur'¿r ¿rl 30%'l:
c) si no sc tienc unl idea previar clc Ia popr-rl¿rliclacl cllel Sr'. Vargas?
11. Urra empr-es¿l clc asesc.r-Ía política ha sicio cr¡ntraf¿Lcla pulir clelclrrinal l¿r. populalidacl
cle uu
candidato ¿L alcalcle clc una ciudad cle 215 000 habitantes ¿rclultos. Eu ttn soudeo realizado cou
215 posibles votantes legistró un nivel de erceptación del 34 % pala el poLítico.
a) Halle un inten'alo de conliartza al 96.5 7o para la proporciórr rlc sinpatizautes del candidato:
b) Si se quisiera lcaiiz¿u otr-¿r cncrrcst¿r utilizando 1a ilfoln¿'rcióu clispolible, eticttertire cl
tamaño máximo dc la muestla a utilizal para c¡rc ci c1'rol sc¿r clc 0.03;
c) Si se collocc c¡rc ci cancliclato, históricarnentc. tenrdo una accptarción de alrededol clcl
h¿r
40 %, encncntlc cl taurario clc Ia rnnestltr a cmplealsc.
12. Pala efectos clc plane:Lción económica en la provincia clc Cotopaxi cs necesalio realizar un estudio
cntlc 2200 hatos ganacleros. Una cncuesta piloto alrojó las siguicntcs estinaciones:
Prorneclio clc vacas por hirto, 46 y clesviaciór estárrclar'. 2[J.
ll.cnclinienbo plonrcclio c1c lcchc por hato: 345 litros y r.ariarrrza rlc 9700.
DI 6A% clc los hatos tienc un r-enciimiento neclio cle iechc supcliol a 250 litros.
Con un errol del 8% ¡r una coufi.arrza ctel 95.5%, cletclrnilLe los t¿trr¿u-ros de l¿rs irlllestr¿IS si se r,¿'t
¿r estimar-:
Los proccdimicntos cxpuestos cr. csta sccción se basan en e1 principio cle cluc las rlnestr-¿rs clebtrri
colstitnirse pol elemenios tomacios al azar'. clc; suclte c¡re cacla.t",,r¡1r1.o cLc la poblaciór, l,ergiL 1lr
r.Iisur¿t plobabiliciaci cie figulal en ia mncstr'¡r. Solo ¿rsí óslzr pnedc lcplcselt ¡rl a l¿r pobl:Lciórr, reploclr.rci r'
fielntcrttc los clirrersos calactelcs y cluedal soureticl¿r rr 1os Proc;ccliruielrlos t:sL¿rclísLicos clesclitos.
Dutonccs. nos plantcamos el signiente ploblerrizr pr'ác;lico ¿'l soir.rcion¿u: hlllal nn rnedio clc rrsegnlarrsc
clc t¡re toclos los elementos cle la rnucstlLr se¿ur tourados al rrz¿u.
l-eór'ic¿rmcntc. no h¿rblía problerla r-rlgnno. En u.na irrvestigación icleal clispolcmos del malco ulLerstr-al,
¿,rsÍ s¿rbr:mos cuántos y cluiénes son t¿rlcs clenrentos. Únicanrclte habr'Ía cprc sor'lear'los y los favolcciclos
scr'Íarr irLcluiclos err iir irntcstla. llasta rrntcs clc 1zr 1-rollrlariz¿rción clc lirs c:outprri-aclorits l¿r selccciól clc
ii..s l'llrcstlas sc realizirbt cc¡n cl crnPlco cl<: tlblas rle uiuneros ¿rlc¿t,oLios. l}r llr acl,Lirrlidacl r-'sia t¿lrc;l
73.4. Mttestreo aleatorio estratifrcado 391
la ayuda de plcigrarl¿rs informáticc-is, eu los cnaies hay cour¿rnclos especiales qlre BerreraII
se lc¿tliz¿r corr
nirrnclos aleatorios y facilitan la selección de la muestra.
Sin embargo, no siemprc se puede realizar la extracción de la ntuestra de Ia nanera descrita, ya sea
porcFre la población es bast¿rnte glande y Ia localización de cada elernento elegido es muy laboriosa
o t)orcLr(.r cl rrr¿rrcr.¡ rrrucstr'¿ri lo cstri brcrr definiclo. Ptrla srtper'¿rt'las clificultacles se han ideado otros
rri(:l,orlc¡s tlc: rnuestlco. (lue ¿r r:r¡ntinrraciórr los velcrri()s.
LIn ploceclimiento adoptado par-a superal estos ploblemtrs es el cle fornal :u:na m'uestra estrat'ificuda
v al ¿rzar'. Segúrn este método, sc subclivide la población en varios grupos, llamados estro,tos, cada
nrro clc los cualcs debe'ser internamentc horlogénco. En c¿rcla cstrato, se cscogen al azal las unidades
rrruest,r'ales a inr-estigar. corfio ya se explicó: es decir'. para cada estrato se aplica tnuestreo aleatolio
sirnl>1e.
Los estlatos pueclen fornrarsc paltiendo dc divisiorres geogr-áficas (provincias, ciudadcs, centros urbanos
Y mr'¿rlcs, etc.) o bicn del sexo clc las personas. su eclad, la profesión, el nivel socioeconómico, etttr-e
ot ros.
Lrr lazón clel crnpleo de estc nótodo reside eu el hecho de clue pelmitc obtencr', gencralnrente, resultados
rrrirs pr-ecisos c¡.re aquellos qucl se colsigucn cou cl método alc¿rtolio simplc. Sin embalgo, es ttecesar-io
couo(icr' 1¿r cserrcia de c¿rcla cstrato p¿rr'¿r ploceder', en cada uuo dc ellos, ¿-L la elecciórr al az¿tr dc los
clerrrr¿rrtos rle la rlnestra.
Al igr-rni clue hicimos en i¿r sccción anteriol, examinar-emos los c¿rsos cle cstim¿rción clel total. la mcclia
'n' Ia 1-rlt.,1-rorciórr pobia.cionales.
Suporrgarnos c¡rc se clivide a lir poblacióu el .Ií est,ratt¡s. c¿rcia uuo clc los crrales const¿t de lü¿ elernerttos
(t:on ri :I,2,...,K), pollo clue ly': l{ri¡/z+".+A/( Dentlo clc cacla estlato elegilettros tt;
clcmentos c¡rc constibuir-ál la rnuestr-a.
(\-.)
l)onclc
,s; es ta valianza cle 1os cl¿rlos cle la muestla en el estrato i, 'i : I,2,. . . ,I(.
') t
ro el:l tian]
trLl atICdo
Cr Ila ñoo llllt,restre I cie: los ?¿¿ es peqnerio con respecbo ¿r1 tan¿rrlo cle los estratos ly'¿, lt-r, fórnrul¿r
SC L'eclluc
Llce a
I i-
lr
.t\ )
"a/2' ? + zo¡2
D¡ri=
\
EjJel
E. llTlrplplo.t. LcOS clilec di
d ectlrtir¡os c1e LIIl. centl'(o edncatir.o desean conocer' el gasto total de los padres cle
Ier.Ini
Ie rili LArenrir tiltles
r ES escol
CS l¿rles. P¿l
el )o1¿rr rla facilita
I r 1¿r investigación se clii'idió ¿r los ¿tlumnos segiur su nivel. err
l)r
l)rc 'ep
rpli iur
I lio
It¿Il' xi nli
,Lil
, I)l 'io
ralio
tla y
))SCtscc :tutcl io.
cl¿u'i Un a tabla resLrrllen cle cómo se cst¿rbleció Ia muestr'¿r v los <latos
ltl
1i¿
r l lacl
1i¿t l1¿ os) f
SC CXrh
:hi be ¿I conti
CO rtin[racciónt.
NIVtrL
Preplimalio Primalio Secunclario
No. cle aluuuros (Ar¿) 1569 832 647
T¿rmario mr.Les ilal (r r.¿
) 767 72r 95
Gasto promedio (dólaLes) (7;) 88.4 131.6 97.0
Varianza mucstral (s]) 525 468 700
A urr nivel clcl 95.5 %: a) Enconbrar el erLor rnrrestlal en la invcs[igacióu; b) Construit' cl inten'rlc., clc
r:orfi¿\rLz¿r perla cl gasto total clc los padres clc farnilia del plrrntcl.
E, : ¡\.
.^,.,1f r't(N;-rr;\ si
\ñ 'v /.
6 910 295 + 2287 008 + 262632¿I: 6880.
lf ntolccs. sc cslima quc cl gasto tobi-il cn ritiles csc:olalcs, clc toclos los pachcs clc famili¿r est¿i
cntrc los 304070 .1,-- 317830 clólalcs.
I t'"'' -
I
\
Cr.r'urcio cl l¿rnraño nrrcsir'¡l<lc los ?¿j cs pccluerio col respeclo al t¿rruaño clc los cstratos A¡¿,la f'órrttul¿r
sc r'cclLrcc lr
zo12
,:ol')
-^/
Ejcrrrplc. Una empresr cllrc rc¿rliza cstudios dc l¿r ¿ru<licnci¿r telerrisir'¿r dcscrt cstiur¿rl el tierrrpo medio
rlc: lroi¡rs cii¡r.r'ias cllrc pasar frcltc al telcvisor'las f¿rrnilias. ori urr carrtí-¡rr cspci:ílrco. Ll errprcsa diviciiir
l¿r zon¡ clc cshuclio en ulllan;r y r:nti-ri y sc cscogi<i urL¿r lnrestr¿r clcl 2 pol rnil; es clecir'. 2 de cacla
rnil f¿unili¿rs clc cacla hlcir pcrtcncccrhrr t i¿r mucstr'¿r. Con los cl¿rtcis lcsumiclos elr la siguiente ttrbla,
circrrerrtrc rur inter-valo clc confialza ¿rl 97.5% pi-lr'a cl tiernpo mcdio cluc cacla f¿rrlilia pasa frcntc a lzr
( c.lcvisiolr.
Jc,r : ¡(AtrJr+-\rrr2)
: |
_____ ,,, :
____ _
r ú,+ 796)(2 93) + (42 188)(1 46)l 2 35
10f; 9s I"
Conrc, cl tarlarlo cle las submucstlas, eu cacla cstrato. cs pcc¡rer1o con lcl¡rción rrl lcspectivo totaI rlc
t lcuIcrr[os. clrrplerremos 1¡r fórurtila apioxirlacla
.- i).l2;ú.
39,1 Capítulo 73. Elententos de -N4tresúr'eo
Por tarrto,
Eutonces. el tienpo urcclio c1r.rc cacltr I¿rmilia girsta fientc ¿r la Lelevisión cstri cnLlc las 2tr 13 miu r,- 2]r
29 rnin, aproxirlaclalncntc.
cle confia nz¿-L ¿tl (t - ct) x l00r/o pirla lil ploporciól poblacional 1., cs
^. J.)
Z ct/
-
"'- lv
Dorrde
fi,"t
I .-^ i
: *(N,
/v it Ntf , +'..+ l/r,'lrr) : *r iiI,,',4,
i,-l
Cttallclo cl tamaito lnttcstriri clc los ?¿i cs pcquerio con tesllccto ¿rl Lanraño clc los csblaios AI,, la fórmtrla
sc tcclr.rcc tl,
f ¿8¡
--'----= rl)cst.
, zol2
tN
'tL¡
- L
Djemplo. Rcfiliórtclonos al cjcmplo rrutelior', en t¿rl estuclio tambión sc plcguntó si las f¿rrnilias nilril¡¿rn
regnlartneutc uua telcttovcl¿r clacla. Las plopolciones uruestr'¿rlcs clc cpricnes tienen prelelcricia poi c.i
cit¿rclo ploglaura sc cl¿rn cr-r la siguicntc tabla:
llstirrr¡r lrt ptoporcióll t[c toc[',s ]its f',rLuilirs crr cl c¿Lnl-ól¡ (lllc rnir'¡u l¿r, tclcrror'<:l¿r. Usc I - cv:0.(t2:5.
73.4. Mttestreo aleatorio estratifr,cado 395
i",t:
1
(; lr.í:.rIl\ t Lpl
\Y(sL Lp\1'¿sl (0 2097 - 0 0625;0 2097 -¡ 0 0625)
(0.12172;0.2722)
i)tt¡¡sto qlrc cn cl móioclo clc csl,irrtificación se folman r'¿rrios gr"l-rposr se acostuntltltr ir fijat'cle anteuratro
,rl rLivcl clcl crlor', clc rcrtcirl.o ¡r í-'slc sc cstablecc cl nrinrelo clc clcniorrl,os quc c:onst,i brrirán la rluestrir v
1r-Lcgo sc cletclrrrina cnirul-os clc clios sc iisignarán r carl¡r cstr¿rLo.
Sclrr , A'2, . . ., A'/i los clcrncriLos ilclLriclos cl c¿rtl¿r cstLirl.o, srr slunt cs igual ii ,l/, cl tolal clc li'L
-\I1
lrolrlirciiirt Sc sclccciorar. j ,'t12, ..,,'n.ti clcnicrtos, torn¿rclos al lzar, clc cacl¿r cst,r'ato. Tcnclicrrios
'/?
tlric cl tot¡rl clc ltnicl¿iclcs clc la trtncstla es '/¿ == ?t1 * 112]_ .. .* rr¡¡. Ntrestro ploltlcura seti c]etetrnirLal
el 1.¿rm¡iro cic Ia urttcstla v ci iir'ulcr'() clc uLriclacles qlre sc consrrlfar'án cl cacla csilabo.
Lrrtt¿'r ia rsiguaciól clc Jn',rrtcsi:'¡, sc rLtilizr nno clc los siguientcs 3 uróloclos'. er1'u,i,tat'iu(L) pt'o'lorc,i,or¿etL s,
1;,: lttúli,,t, inttn! (r! r' -' ,,,
A si gnación cqrritativa
E;l l¿r fblna clc asignirciórr crliiitltivi-, crt c¿tcl¿t utro rlc los cstr¿-itos sc invcstigii cl n¡isnro ntimoli.r ciLr
clcirrcnt os.
,)'I ^t,"i
ii
L -\ -r {: .;: )'-\,'.'
't- I
Capítulo 13. Elernentos de Muestreo
Una vez fijado el tamarlo total de la muestra se seleccionan, al azar) eI mismo nÍlrrero de unidadcs
muestlales en cada estrato. Este núrmero de unidades se calcula por:
,ro:
#, i : r,2,.. ., K.
Observación, En este y en los siguientes casos se debe tener presente qlre en el caso de la estimacritili
cle lar proporción Ia varianza se calcula mediante t? 0). : i¿Í -
Si en una investigación se han generado submuestras de igual tamarlo, podr'ía suceder que los estrat<;s
pequerlos estén sobrereplesentados, mientras aquellos con muchos elementos estén subrepresentados.
En la asignación proporcional, la rluestra está constituida pol Lrn núrmero de elementos, en cada
estlato, proporcional al tarnaño de éstos, con relación al total; es decir, los estratos [rayores serán los
clue tendrán subrnuestras de nayor tamalio.
-- n
rlr' : -A/r
__ ?l
llc' : -Ay'c-.
'N',
-. 'N',
Eri el nuestreo con asignación proporcional el error es mínimo, pero por razones de economía o de
facilidad en la recolección de los datos en el sondeo, pudiera ser mejor no hacerlo de esta nanera.
Supougatlos que la población a cxaminar está dividida en dos grandes estratos. Si el priurero de ellos
agllrp¿l a personas muy homogéneas entre sÍ, con lespecto a la calactei'Ística que se considere, bastar'¿i
con intelrogar a Lrras pocas personas para dedrrcir, con Ia plecisión snlicieute, la magnitucl c¡re str
invesbiga. Si, por cl coutratio, el segr-rnclo estrato está fornaclo por personas hetelogéneas, será pleciso
iltcllogar a un nirmero rraj¡ol' para obtener resultados que snpoilgan la misma exactitud que en cl
primel caso.
/ I{ \2
Q^/)2 (,e nt",)
I(
E2N2*("^/)2Dlr,17
i:L
P¿rr'¡ r'c¿rlizat- Ia zrsignación clc los bamar'ios de las subrluestras sc ploccclc clc la siguiente lnancl'¿l:
73.4. Muestreo aleatorio estratifi.cado 397
1. Si s1, s2 , ..., sK son las desviaciones estándar de cada uno de los estratos. se determina el valor
? definido por
K
? : ly'rsr * l/zsz +'.' + ly'¡<s¡r : INrrl,
i:1
2. Con ésto, Ios tamaños muestrales de los estratos se calcnlan así:
A¡ n
n1 : l/1s17. A¡ lI
nz: NzszT
n.
nI( - NNIKT.
En el siguiente cuadro se expone un esquema de rnuestra estratificada según los criterios de asignación
cquitativa, proporcional y no proporcional.
La rluestra con asignación no proporcional está formada por un núrmero de elementos, en cada estrato)
qne supone dar un mayor peso relativo a los que presentan una mayor variabilidad. Por ello, el estrato
A, annque incluye eI 40% de los elernentos de Ia población, figura en la muestra final con el tnismo
tamaño que el último (el D), que únicarnente comprende el 10 % de la población total. Esto es debido
a que la variabilidad del estrato D es el cuádruplo de la que tiene el estrato A.
tlna vez establecida la cornposición de Ia muestra se procederá al sorteo de Ios individuos a ser
entrevistados) que por lo general se lo hace bajo el criterio de la no reposición; es decir, qtte un
elemento de la muestra no puede ser consuitado más qrle una sola vez.
Ejemplo. Para los datos del ejernplo sobre el tiempo promedio diario que gasta la población viendo
la televisión) que a continuacióu se resllme:
Considerando un error de 0.1 h, a un nivel de confianza del 95.5%, deterrninar los tamaños mlrestrales
v de las snbrnuestras mediante asignación: a) equitativa; b) proporcional; b) no proporcional.
Soltt,ci,ón: Se tiene que N:106984, E:0.1 y zoo22s:2.
K
K(r*/r)t D x?'?
,j: I
K
E2N2i("ul)2DNo"?
i:1
:297 '34.
298
La muestra total es de 298 familias. En cada área se consultará a 149 hogares.
2
398 Capítulo 73. Elernentos de Muestreo
K
N(r,/r)'D N t?
i:l
K
E2N2*("*lz)2DNlt?
i:r
106 984 x x (64796 x 0.77 + 42 1BB x 0,58)
22
:277.3I.
(0.1)2 x (106 984)2 t 22 x (64796 x 0.77 + 42I88 x 0.58)
Qo/il' (á*"')
n: K
E2N2i(r./)2Dru,"7
i:r
z2 x (a+796 x lotl + 42188 ,. u658)' :276.
(0.1)2 x (106 984)2 t 22 x (64796 x 0.77 + 42 188 x 0.58)
Calculemos el denominador T:
7: ly'rsr i N2s2:64796 * t/O¡f + 42188 * r/O¡S : 88988.
u : 1/rsr3
T
: 64796, Jolz " 2
88988
: 176.4,
n2 : Nzsz::
'T', 42188 . r/058 " :2:
88 988
99.7.
Lamuestradeberáestarformadapor177farniliasdeIazon.atrrbanav100delazonaruraI.<
En esta sección solo se presentaron las formas de fijar Los tam.años muestrales basados en infornacióu
estadística. Existen otras forrnas de realizar tal determinación, tomaldo en cuenta los costos de
efectuar la investigación, los costos fijos o el costo unitario de cada toma, éstos no los expondlemos.
El estratificado es el rnétodo más utilizado por Ias empresas y entidades que se ocupan de realizar
sondeos, con adaptaciones prácticas que tienen en cuenta los costos y las posibilidades reales de la
investigación.
Antes de la confección de la muestla conrriene tener en cLrenta, ante todo, los fines de la investi-
gación y las caracterÍsticas de Ia población que interesen de nodo particular, y que pueden tener tttt¿t
impor bancia fundamental en las conclusiones qne se daráu.
Las clasificaciones que más comúnrlente se consideran en la elaboración de ias muestras son:
73.5. F,.iercicios 399
5. El rrivel edncativi-r.
6. El nivel socioeconólnico, cntle otros.
P¿ua files pr'ácticos, el r-eldadelo y adecr-rado sorteo, en cada estrato, es frecnentemente impracticable
o inrplica gastos excesivos v pér:dida de tiempo. Por ello se recllrre aI ntétoclo de las cuotas, c¡te
colsistc en asignar un cierto nÍunero de entrevistas qrie se deberr lealizar en cada estlato (cuotas), pol
c¿rcla entLcvistador.
Compcte, entonces, al encalgaclo de la entrevista elegir al azar las personas clue han de ser interro-
grrclas c1cntro dcl ánbito de cada cuota que Ie ha sido asignada.
Para disminuir, las distolsiones que callsaría la falta dc ale¿rtorieclacl en estc método, las eurprestrs
snelen ¿urnentar la fiabilidad de sus estudios mediante el <sobremuestreo>>, o sea la realización de
ntás encuestas qtle el nirmero oliginalmente planificado, así se collpensaría e1 aumelto del error antes
iutroducido.
13.5. Ejercicios
, Par'¿restablecer rlrl sistema de s¡-rbsidios cn el consnmo de Ia cncrgíer elóctrica se hizo una invcs-
bigación por nrlrestreo cn Ltlta cindad. Se dividió a los hogales scgirn su nivel socioeconómico
(NSE) y se tomó una muestra de\2Va. Los resultados se rcsrlnerl a continuacióu.
Suponga qlle sc clcsea lealiz¿rL otro mnestreo en el clue se lendrá un error en la estimación de la
media de 3 dólares. Determine los tamarLos muestrales en cada estrato si Ia asignacióu se realiza
rnediante:
c) asignación eqr-ritatir':i:
d) asignación ploporcional;
e) asignación no proporciorral.
3 En un sondeo para cieterninar el gasto anual de la población de una cindad en arreglo persontrl.
se clasificó a los consultados segúrn sn sexo. Los datos se rl)uestr-an a continuación:
SEXO
\.{asculino Femenino
T¿im¿rño del estrato 2500 2300
Tamarlo mnestlal 250 150
Gasto promedio 70 740
Valialza rnuestral 25 169
4,. Se realizó Lrna elrclresta par¿r cstimar el total de rrentas scmanales de los locales de productos
naturistas cle Quito. De los 1415 negocios de este tipo, se escogierou al azar 135. A continuación
se resttnen los clatos recogidos, segirn la ubicación geogr'áfica cle 1os locales.
Situacirin
No. de Locales err Venta
Varianza
Iocales la muestra promedio
Nolte 600 ,lr 478 204
Centro 265 45 4r3 358
Sur 550 45 394 513
a) Encuentle un intervalo de confianza al 99.7 % pala el total cle ventas de dichos locales;
Si se quielc lealizar uu cstudio en el crlal el error de estimacióu sea de 5000 dólares, encuentlc
los taulanos muestlales. cn cad¿r estrato, para que la muestla sea r-ealizada nediante:
b) afijacióu ccluitativa;
c) afijación proporcional;
d) afi.jacióu de Neyman.
5. En uua universidad se deciclió llevar a cabo un estudio soble cl aholr-o que mantiererl slrs elr-
pleados pala cr.tando ellos se retirel. Se tomó nna muestr¿r aleatolia estlatificada del 10 % cle I¿r
población, pol gltlpos de cdad, con afijación plopolciolal. Luego de proccsal l¿r inform¿rciórr, sc
obturrieron los siguicltes rcsulbaclos:
Edad nlenos de 40 años 40 a 55 años más de 55 años
No. clc empleacios 280 150 220
N{eclia 800 1400 3200
Desr'. estándar 160 400 750
73.5. Ejercicios 401
Artículo ¡/, r¿ si
Calzado 450 800 200
Ropa 380 560 150
Juguetes 230 940 220
a) Encuentre un intervalo de confi,anza al 95.5 % pala el valor promedio y para el l'alor total
de la compra;
b) trl comerciante tiene un capital de 750 mil dólares para realizar la corlpr-a. ¿de acuerdo con
el resultado anterior, puede decirse que é1 se decida a corlr.pr-ar el lote?;
c) asignación equitativa;
d) asignación proporcional;
e) asignación no proporcional.
Estratos
II III
Tamarlo del estrato 1000 1200 700
Tamaño muestral 100 100 100
Proporción muestral 0.32 0.26 0.29
8 En un sondeo electoral para conocer la aceptación de tur candidato a prefecto de una provincia se
entrcvistó a un grupo de electores, previa clasificación scgírn su zona de residencia. La sigr.riente
tabla da Lln resumen
Area ¡/, rt,i, f¡
Urbana 92 000 250 0.43
Rural 88 000 150 U.5 t
a) Encuentr:e nna estilración, con Lrn intervalo aI 947o, del porceirta.je de votación que obtcn-
dría el candidato'
402 Capítulo 73. Elententos de Muestreo
b) Según el resultado, ¿podrÍa esperarse que el candidato gane las elecciones por una urayoría?:
Si se desea que el error de estinación sea del 5.5ya, encuentre la cornposición de la rnucstra
para que ella sea seleccionada mediante:
c) afijación equitativa;
d) afijación proporcional;
e) afijación no proporcional.
I Se desea establecer el porcentaje de habitantcs, en la provincia del Guayas, que tienen fe en San
Biritute2. Se dividió la zona de estudio en ciuclad y campo y se preguntó si creían o no en tal
deidad. A continuación se resnmen los resultados.
-
-Lona Población Tamario de Proporción
total la muestra muestral
Ciudad 2 800 000 450 0.29
Campo 650 000 350 0.61
10. En una provincia. se realizó Llna encllesta, entre los niños en edad escolar, para couocer la
asistencia a las escuelas, Para el efecto sc seleccionaron 150 niños, 50 en cada estrato, y se
obtuvo los siguientes resultados:
de
Condición Población Propolción
pobreza total muestral
Indigentes 12 000 0.45
Pobres 36 000 0.60
No pobres 27 000 0.74
11. El Sr. Vargas está pensaudo postular a la alcalclía del Pr-ryo. Antes de folrnalizar su candid¿rtura
decide realizar Llna encuesta de opinión err la localiclad. P¿rra ello se zonifrcó el cantón en 3
sectores y se obtuvo los siguientes resultados
a) Encuentre la estimación de intervalo errtle los cuales se podría considerar que se encnentra
la popularidad del precandidato;
:S¿irr Bilitr,rte es ulr santo cle l¿l tradicióu popular clel Guayas a quien se Ie asignzr el podel cle hacer llovcr
1,
Si la encuesta tiene un costo fijo de 5000 dólares más nn costo variable de 4 dólares por cada
entrcvista, ¿cuánto le costará este trabajo al Sr. Vargas si se quiere tener un error de 5.57o y Ia
selccción será
12. En una investigaciór sobre Ia producción de manzanas en Ia Provincia del Tungurahua se desea
cstimar la proporción de agricultores que se dedican al cultivo de la mencionada fruta y la
pr:oducción media, en miles de kg, de cada parcela. Se realizó un sondeo en 3 cantones de Ia
provincia, a continuación se presenta un resulrlen de los datos obtenidos.
La elaboración de uu muestreo aleatorio puede ser costoso y difÍcil de realizar porque la población
cstá clispersa en un área extensa y la localización de cada elerlento de la muestra podrÍa llevar mucho
tieurpo. En estos casos se practica el muestreo por conglomerados.
Definición (de conglomerado) Los conglomerados son subconjuntos de la población que tiencn
la propiedad de ser internamente lo más heterogéneos y entre ellos lo más honogéneos posible.
Por cjemplo) en Ltna inr.estigación se desea conocer la opinión de las arlas de casa de una ciudad. Err
h,rgar cle sortcar a los individttos, se procede a muestrear aleatoriarnente las lttanzanas de Ia ciudad y
clcspués a entrevistar a todas las arlas de casa que viven en cada tura de las nanzanas seleccionadas.
AsÍ, cada manzarla conteudrá ttu conglornerado de elementos y el núrmero de elementos variará de un
conglomerado a otro.
Eu este tipo de mLlestreo Ia construcción del marco muestral es fácil, porque se rlaneja elementos
nayores v los costos de la investigación se rebajan. En cambio, se corre el riesgo de que los elementos
el cacla conglomerado sean rnuy homogéneos; por e.jernplo, si en nna manzana viven úrnicamente
faurilias de un nirrel socioecouórnico alto, Ias respuestas de las amas de casa consultadas pueden ser
mny parecidas. perdiéndose 1a heterogeneidad interna requerida.
404 Capítulo 73. Elernentos de Muestreo
Para compensar estos problemas se necesita escoger el número suficiente de conglomerados para tener
Ia necesaria variación en las respuestas.
Al igual que en las otras secciones, examinaremos los intervalos de confianza para el total, Ia media I'
Ia proporción poblacionales.
Intervalo de confianza
El intervalo de confianza al (1 CS
(^
Doride
I
¡/ es el número de conglomerados en la población
i,,o
i:t
rn es el tamaño promedio del conglomerado en Ia muestra, que se calcula por ñ,: n
N
h[ es el número de elementos en la población, que se calcula por M: D m¿.
i:r
M es el tamaño prornedio del conglomerado para Ia población, que se calcula po, M : +
¡/
ri es la surna de las observaciones correspondientes al i-ésimo conglomerado, con i:1,2....,rt.
i,o
o;t
T cs el promedio muestral, que se calcula por 7 =
D
i-7
nro
rL
L\r¿ - rnr¡)''D
s es Ia desviación estándar, que se calcula por s: i:7
n-l
rL
rD
iI \\r¡ - r,nrl)' -
i,:l
i "? -
2z i "¿m¿
+t2 i m|.
Tarnaño de la muestra
El núrmero de conglomerados a incluir er Llna muestra, obtenida de una población conformad.a por l/
conglomerados, con un 95.5 % de confianza y un error -8, dado es
N
?16 (zo¡)2N2s2
/i ::------;. dutidc /?U: --------;6--.
/r0 -+- lv ,E í
La fórmula de evaluación de r¿ incorpola, en el denomilador, una corrección que se debe a que tratamos
con Llna población finita.
trjemplo. En una ciudad viven 38 300 personas distribuidas en 10 500 farnilias. Se seleccionaron 12
fanilias para estimar el gasto mensual en transporte. Los datos se encuentran en la siguiente tabla:
I nz; : 31,
I"t : 1573.8.
i:T ;_1
\-
1, .,:,
:: 'n, :__;;_:iu.7u7,
1573.8
rr
\ ttt;
i:t
'r : Alt: x :
38 300 50.767 1944376,
?INrL
Corno
15 354.45
t-¿-I 11
: 37.36.
"/' V Júrr
l0 500 - 12
: 2.43 x 10 500 x 37.36 x :275020.
l0 500 x 12
EI intervalo qr.reda:
Así, el gasto mensual total de la población en transpor-te está entlc los 1.67 y 2.22 millones de
clólares.
b) Para el cálculo del tauaño ruuestral usamos E":100000. Prirlero, obtengamos ns:
^^ Qn¡)2y2t2 e.$)2e0b00)2(37.36)2
r¡tr--
AA o,
E'l (100 000)2 -JU.O|.
Entonces,
tz6 ly'
11, :
ru6 f ltr
: 90.87 x 10 500
:90.1.
90.87 + 10 500
El tamaño es de 91 conglomerados.
Intervalo de confianza
s
( a-2^t¡:.,," At V
F- ly'r¿
73.6. Muestreo por conglonterados 407
Tarlaño de la muestr-¿r
El uúttlero de couglomelaclos a incluil erl Lrna lllrestra, obtenida de una población coltfolmacla por lú
conglomerados, con tur 95.5 % de confianza y un errol Ep daclo es
rr¡ l/ t - .^\2.2
(tolt(le l?n: --#
?¿o * ly''
'
( N\'2L-'2
'..., -ll
Ejemplo. Si en el ejemplo antclior', soble el gasto en tr-anspoltc de las f¿llilias clc n¡a ciuclacl, sc
rlctscar'¿t utta estitrr¿tción clel gasl,o mensual pr-omcclio en tlanspolte pol persona. a) Encontr.ar Lln
itttctr'¡tlo cle confianza par¿r l¿r n-rcclia poblacionerl, ¿rl 98.5%; b) \fantenielclo los mismos clatos, fi.jrrr.el
l¿rttr¿rrto clc la rluestr¿r pltl¿I lcrrel ul cllol de 5 clólales en la estimación clc
¡r,.
Sol,tt,r:i.ón:
t
I2 12
\- : :
) rrr¡ J1' t¿ 1573.8,
i:1 i:T
n¿ : 2.583. M : 3.647.
i:50.767, J / .ót).
El clrol clueda:
Ti
.^t)
-'/ - s, IlÑ-.
_
ñ V A/-r¿
2.43 x 37.36
: 7.782.
3.647
Lo cFte siguific:L clttc cl girsto meclio clc Ia población en concepbo cle tlzlnspoltc csl,¿i e¡t1e los 43.59
y los 57.95 clól¿rlcs nlcnsualcs.
lr) El tamaño clc la mrLcstr'¿r pala tcncl Llrl clrol E¡,.:5 se calcul¿l asÍ:
)
zal2 s- (2.43)2(37 36)2
,¡r,I-
" :24.79
ytrt/\lI L¡t
/,r lt'l (3.oaz;z 15;z
rt6 1V
rr¡ * A¡
2J.79 x 10 500
: j-I. / J.
21.79 + 10 500
Intervalo de confianza
/ s.p
,ñU n-" :P^+ zonf;V
s.p tr-"\
\'- '", N" x" 1
Doncle
l¿ r:s cl tarnaño plomeclio clel conglomelado en I¿l muesbra, que se calcula por T7z :
¡Í
,4'ir es el núrmero clc clemcntos cn l¿r población, qlre se calcttla por 11.[ - i:lD rro.
,41 cs el tanraño plor-ncdio clcl conglomerado palir la población, que sc calcula por A.[ : AI
F
/; cs el total de óxitos cn cl i-ósitlo colglomclado, cort 'i: I,2,. ..,tr,.
D'i
f cs la plopolción rnucshral, qric se calcula por t: ;l-
I
;-1
rn'"
7l
s, r)
L\y¡ _ ptrt¿)-
,s,, cs Ia desrriaciórr csl,ánclar, qne sc c¿rlcula por ,sp : i:t
n -7
]L]I?LIL
D(y¿ - f
v ,i.-). nr;)2 : D,L? - 2iD,tJ¡nti * f D rr?.
i-t i:I i:1
Tama.iro de la rluestr¿t
El rlinrelo cle corglorner'¿rcios a inclrril crr Llua rnueslra, obl,enicl¡r de nna población confoltnacla ¡ror lY
c:onglonrer-aclos, cou rrn (1 - cr) x 100% clc corifianzr\ \¡ nn err-or -Eo claclo cs
,, : "o
A' clo'cle ,rn : &ú.
?¿s * Ar (M)2DB'
+
rl
,I
1 :].6. Muestreo por conglornerados 409
Eiemplo. el rtso de Internet por los ahrmnos de un¿l rrniversidad se seleccionó aleato-
P¿rra conocer
ri¿rmente 7 cle los.19E cnrsos de l¿r r:rt,iclircl. A los ahrmnos se les prepiuntó si en la última semana
¿r .l
habían rrtilizado los st:rvi<:ios cle lntelnct. A continrr¿rción se cla l¿r infornación respecto al número de
alumnos t:onsultaclos ert r.:arla (:urso v cl núrnelo clc lcspuestas afirmatirras.
Ctrrso No. cle No. r'esplrestils CrLrso No. cle No. respuestas
(r) consultas (rn¿) alirrnntiv:is (y¿) (i) corsultas (m¿) afirmativas (y¿)
1 2i 13 10 66 45
2 J.1 1ti il7851
3 56 '2t) 12 29 19
4 87 .J
'J 13 35 20
5 2I 11 14 48 22
6 3Ci 2b 15 27 16
7 45 o.)
16 64 39
E
(l
4,1 1E 17 54 48
i1 LI
a) IJallat' el intclr.alo rle t:oufiartza al g7 Vo para la ploporcirjn cle estucliarrtes cle la universidad clue han
utilizar:lo Iuternet: lr) ¿.A los alunlnos cle r:uántos (:illsos hay que consultar para tener un elror del 47a
en la e-qtinra<:irin'/
Solu,ción; l)e los rlatos clc la talrla se olttiene que N : 498, r¿:77 y
1¿ 7L
: 7.697.
Par'¿t cl t'ált:ulo rlcl t'r'r'ol rr,:r sc clislrorur rlcl vlrlol clc 11, por'1o clue cnr¡rl<-.arcmos rrr.;
tr,
r7(r! rt
f,'
l1r'' : ().05216.
¡ .11)8 . t7
4to Capítttlo 73. Elernentos de Muestreo
Entoni:es, cl intervnlcl cs
Es dc<;ir' <1rre entlc <:l 47.4Va y el 64.3 % de los estudi¿rntes h¿rn ¿rccedido a Internet, la última
serIl¿n¿.
t¿( : r
ry::i:
sz
(AtS'z
¡') ')
.06)2 (0.04)',2
rt1.¡ *.\¡
78.73 x 498
: 67.98.
78.73 + 498
L3.7. Ejercicios
trstimación del total y cle la media poblacionales
l. Conrcl lcsrrlt¿rdo dr: rrn rnrrcstrc;o llor conglorner'¿rdos sc obtuvo Ia siguiente inform¿rción:
A: : 10 000. r¿ : 100.
?t¿t : 'ttl.2 : .' . : tl¿100 : 15, .41 : 150 000,
II II
2 Err una r:irrrlarl pcr<¡rcr'rir. rlontlr: ha-v" 3200 lurga,r'es. sc lcalizó ur sonrleo para cstimar cl tiempo
rneciio (l1ro crl los lrt-rgrrlcs sc ve l¿r tclcvisióu <li¿rliarrrenbc, La cnrplesa dividió Ia ciuclacl en 450
rrr¿rnz¿rrr¿is, l)or.'(luo rro tlisponía clc una lista clc los hogarcs y selecciouó 8 manzanas cle casas al
¿tz¿lr. En la sigrricntc t¿rbl¿r se inclicr¿n el nrirnelo cic hogares y el tiempo total (en minutos) clue
Ias famili¿rs. en t:¿rclt rrrirrrziru¿r. rlr,'clicr¿iu ¿r rniL¿u l¿r televisión.
¿r) H¿lle los intt:rr,¿rl<.,s clcl confirrnza ¿tl 94 %, ptLltr el tienr¡lo toterl y el tiempo medio que los
hogarrcs cil: l¿r t:irr<l¡rrl clerlii:¿rn ¿r vr-'L lir tclcvisión;
b) Enc:rrentre cl t¿rn,rno rlc I¿r rrnest,r'¿l pzrra tcner .,r, cle 19 rrrinrrtos en Ia estimación ch.
l¿r nedi¿r.
"rrnri
3. Err rtua acaclemia cletlicatla a la elseñanza tlel iugiés se clesea cstudial el nírmero de años que los
alututros Ilevau aplcntlicnckr cstc icliont¿r. Sc. r'ealizó csta plcgunta cl 5 cle las 68 clases que tienc
l¿ ac:aclemi¿r con los lcsrrltaclos sigrricntr:s:
Clase 1: 5,4.7,,5, 6, 5.
Clase 2: E, 6, 8, 9,6,7,10, E, 6.
Cl¿rse 3: E, 12,10, LI, 72,9, 13, 12.
Clase 4: 12, 9, 11, 10, 10, 8, 12, 10, 73,72
Clase 5: 14, 72,10, 11, 12, 13, 13.
a) Estirrrc t-'l llriutelo ltrcrlio rlc los arios rlrrr; llrrvrur cst,rrtlialrtLl iLrglcs Ios cst,udi¿rnl,cs tlt: llr
rrt:rrrlclttilr. IJstl,r' :,17,;
b) Si sr: clttisicttr cstirtr¿rl cl plorucclio tlc airos <1rre llci'iru cstudi¿rudo t.oclos los cstudiirntes <¡ur
sc cncuentlrtn <)r.r ¿rcrrlcnilrs Llc crrscr'r¿rnzu rlt-'inglés c1r-rc fr-rnciorriltr cll la ciuclacl, col] Lrrr clt'or
rb 0.5 i¡.uos v <;onIi¡rbilicl¿id tlcl g7%,. trtiliz¡lrrlo r:oLlro ulucstlil Piloto l;r r:orrsnltt lcilizaclr
ir krs 5 (:ru'sos lrrrti:r'iolcs, crrc;uclllo cl trnrlriro rlc Irr rlrr-rcsLla, si sc csLiml c¡rc Loclas Iirs
ar;irrlcrtri¿rs l,icucu trLicltr¡s rrri LoLal tl,e 725 cl¿rscs.
10 000, rr : 100,
,Il
II 'ttt'2 : .. . : tit100 : 15, If : 150 000,
t¿
Dut:ttcnirc rur inl tttr,¿tl<) clt-'t:onfirruz¿r ¿rl 95.5% 1,artr la proPort:iól 1.robl¿r:iorri.rl 7.,.
5. Un inr¡rottirtlot tltt Lt.rlrit ttsittlir. rur (:¿llg¿llncrrt.o clc 500 ptrclueLcs, sclcr:r:ic.rrrti
tlcsptr<1s <lc rcr<:ilrir
alc¿ll.otiarnc¡r1,c 10 tlc rtlltts ),c()ntó cl rtriru<tlo rk: ltlcrrrlas rlcl.c<:t,rros¿rs 1.ror'ltirc1rrel,c, Drls¿rclos cl
lc.,s <l¿rtc's rlr: lir sigrricrrtc t¿rbl¡t:
h\<1. rle No, clc plcrrclas . No. <lc Nu. tlc prendas
Pirrlrrct,c
cntlrrs l'lttlttcl.
pt clef'ct:t rros¿rs 1;r'r:nclirs <lcfccIrros¿rs
(¡,) (rrr,) (.y,) (¿) (rr4) (y,)
L E5 'J:] 0ü615
24420 77825
;i 5ti 18 E5919
47723 95527
t-¡ 61 2I 10 68 22
ir) Etrt:rtcrrtli' rttt itrtt'Lr'¿ilt.r rlc r:ortfi¿rrtzii ril gU% l)rlr¿r l¿I lllopolciórr p <lc lrrcud¿rs tlcl'cct:rros¿rs
cn cl t:rtrgztulctrto tlc rt-r1.rar:
b) Estrrblczt¿r rrl 14,,r,,ñ,, nríninrr.r parit tcrrtr lur crlor'<lc l¿t cst,irri¡urióri rLcl .l%,.
4L2 Capítulo 73. Elernentos de Muestreo
(t. Una empresa ¿rgl'oexportador¿r empaca melones en carjas que contienen 8 rrnidades cada una. Por
ploblernas cn el truns¡rorte se estropcó lrn (:¿rrganlento de.1000 ca,ias. Para conocer las pérdidas
or:asionad¿rs se seler:<:ionó ¿rle¿rtorirrnlente 20 cajas y se contó el nrimero de melones golpeados en
r:ada, ca.ja. l,os lesult¡tclos sr-l clan a cc¡ntinu¿rción:
31 130
42 142
50 150
60 160
72 173
85 18 1
93 190
100 204
a) Encrrentre rrn intervalo rle confianz¿r. al 96.5%o para ler ploporción de melones golpeados;
b) Si ei expolt¿rclor pier'<ie 1.7 dóltrr'<:s por caclar fruta est,r'opeada, encuentre el intervalo de
al 96.5% ptu'ir la pérdidar total del cargrr.nrento;
t:onfi¿rnz¿r
t') ¿,Crrtil clebe scr el trrnr¿ritc.r d<l l¿r mrrestr¿l par¿r tcner rrn error de 0.045?
7. Elr rur lralrir¡ de l¿r c:irrcl¿rd viven 200 faniilias. Un¿r muestra de I familias suministró información
n:latir'¿r al nrinrerrl <lc rnienll-rros, ingreso farliliar cluincenal (en dólares), gasto en alimentaciór
(cu tkilarcs) ¡r,si tierrc suscripción zL algún ¡relióclico. Los resultaclos fueron:
c) el inglr:so cluinrrcnal ¡rromeclio cle las familias que tienen suscripción, si se sabe que en el
lr¿ltlio h¿w 75 srrscuitos. Compare con los lesnltaclos de a) ;
d) la proporci<irr cle f¿ulilias suscliptoras a un pelióclico. Compalc con el dato real;
e) Con los d¿rtos de rr), b) y c), deterrninc el tamaño óptimo de I¿r muestra, si se desea tener'
lln cl r'()r' clc cstinra<ritin rlcl 15 %.
Capítulo 14
Respuestas
Capítulo 1
Sección 1.7
4. a) categóricos; c) el2l%.
5. a) tamaño, peso, velocidad y agresividad son datos ordinales; función es nominal.
6. 2.5%.
8. c) 72.5%.
9.26%.
70. 20%.
77. 52.4%.
t2. 70%.
13. n:160.
)4. a) 880; b) 752.
15. n:50.
16. 76.
77.275.
18. 44.64%.
L9. r8%.
20.
lntervalo 0-40 40-80 B0 - 120 -
120 160 160 - 200
Frec. relativa 0.05 0.45 0.10 0.10 0.30
473
4L4 Capítulo 74. Respuesúas
Sección 1.12
1. La mediana.
2. a)T:4.875,b)Me:5; c) s:1.553; d) R:b; e) As:-0.644;f)Ap:0.b92.
3. a) 7: 6;b) Qz: 5; c) s :2;d) R : 5; e) RIQ : 4;f) As :0.362; d Ap: -1.g26.
4. c) r¿: 0.75; Ilfed¿: 0.35; s¿ : 7.789; h :2.33; Med,¿ : L.75; s¿ : 2.002.
5. 2.94%.
6. a) 6; c) 86%; d) 66%.
7. a) Cuantitativos: precio, proporción de malta y tiempo de añe.jamiento, Cualitativos: cate.
goría y nota; c) Precio: r :87.56, Mo :70, Qz: 86, Malta: Í :48.96, Mo : I00, Q2: 49-
Tiempo:7:9.06, Mo:12,Qz:8.5; d) Precio: s:23.166, RIQ:28,CV :0.2646, Malta:
s : 30.114, RIQ :42.5, CV :0.615, Tiempo: s :2.697, RIQ :5, CV : 0.298; e) Precio:
As : 1.339, Ap :2.801, Malta: As : I.092, Ap : -0.542, Tiempo: As : -0.233, Apt : -1.406.
23. 8.
24. 101.
25. 19.
32. 80o/o.
33. 5r¿.
36. 6.27.
Capítulo 2
Sección 2.6
1. a) 6; b) 1; c) 3; d) 3.
2. a) 12; b) 1; c) 6; d) 30.
5. a) 40, b) 700.
8. a) Son 20 parejas sin reposicióny 25 parejas con reposición; b) Son 30 parejas sin reposición y
36 parejas con reposición.
9. De 36 maneras.
10. 1330.
11. r20.
72. 720.
13. 504.
14. 84.
15. 0.5.
22. 84.
24. 77.
7
25. 26D36i:2.096 x 1012.
i:o
26. a) 4 x 75 : 67 228; b) 73 +3x 7a +4x 75 : 74774.
27. 6720.
34. O : {1C, lE,2C,2E,3C, 38, 4C, 48, 5C, 5E, 6C, 6E).
JJ, a) Pr(A) :0.4; b) Pr(AuB) :0.9; c) Pr(B") :0.4; d) Pr(AnB) :0.1; e) Pr(A\B) :0.3;
f) Pr(Á" n B") :0.1; s) Pr[(A n B)"] : 0.9; h) Pr(A U B"): 0.5.
36. a) f): {(I,I,I), (I,I,D), (I,D,I), (D,I,I), (I,D,D), (D,I,D), (D,D,I), (D,D,D)};
b) C : A \ B; c) B' : {(I,I,D), (I,D,I), (D,I,I), (I,D,D), (D,I,D), (D,D,I)};
BUC: {(1, I,I), (I,I,D), (I,D,I), (D,I,I), (D,D,n)}; AOB: {(I,I,I)};
A.ttB.: {(1, D,D), (D,I,D), (D,D,I)}.
37. a) Pr(A) : l; u) Pr(A u B) :3; c) Pr(A') :25.
38. 2:
4ll
39. a)
á'or i
, (i)': $,
36
40. a) o)
64
417
1
47
15
Ctr
42. :- 1
q- I
tJ
3
43
38
44
cB cá3 1-cá c8u
c13.
: 0.e231.
23
45.
t14'
47.
.-
l--.
c?n c?o
cBo
48. ,l't 4,
C%
ul
",
309to, ao93u.
! u/
"l Cuno C?o
t7
49
33'
cá c3, + cB c¿8 + cB c38
bo. ') ¿f ; u)
51
52.
53.
54.
20
55. p- -1 'tT
Sección 2.9
3. a) Pr(A lB) : l; r,) e,(rlA) : ); c) P,(AIB) : ]; a) er(a "lA) : ]; ") P,(,a" lB') : 5
g'
f) Pr(B'lA) : :
1
4. -.
4
11 : c) no son independientes.
5. a) Pr(A): i, b) Pr(B) ,;
7 1 11
6. a) Pr(B\A) : ,r, Pr(BlA): i,, Pr(Au B'):,r;a) Si son independientes.
1
8.
5
.)
9.
28'
10. Envío conjunto: a) 0.9; b) 0.9. Envío por separado: a) 0.81; b) 0.99.
,r. 20
n
72. 0.75
13. a)'
45 b) 99
-'46' ', -.
110
23. a)' *; ¡l j;
15', 5' "; ,ro son ind.ependientes.
24. a) 80 %; b) 0.59; c) 0.8537.
25. 0.3806.
26. ?.
4
32.
y.
47
36. 0.4539.
n7p
DN
d,. Card(A) :
2
Capítulo 3
Sección 3.3
0, si r 10;
0.6, si 0<r<1;
X 0 1 2
a
J 4 0.92, si l1r<2;
p 0.0384 0.6 0.32 0.016 0.0256 0.936, si 2<r<3;
0.9616, si 3( r<4;
1, si r) 4.
X 0 1 2 3
p 0.00001 0.00167 0.07663 0.92169
3600. 1525.
a)k: b) Prrl < x <¿):
'5269',',\-5269
10 a) c:]; u) e.(x < 1) :
f,,Yr{x <2):f , e.{o < x <3) :;
11. b) 0.608e.
14. a) c: u) c: 1; c)
r¡;
a) !,f) c:1.
,rg; ": ]; ") ":
2
15.
'3'-:b )]; ") I' ol
a)
i
16.
X rt o 1
17.
b) Pr(X :0.2): 0, Pr(X < n14) : +,Pr(X > trll) : 0,Pr(trfI2 < X < r) : t.
23.u ü
r)
27.
]; u) i*, "l nosonindependientes; d) ffi
( o, si3r<o;
28. u) :{ \/a,si0(a<I;
ry(y)
( 1, sig>1.
b) P'(+ <x2<á) :
i,r,(* .".;) :osbe
421
(T sr
29. Í(t): { to' si ;
|.0,
1
30 Pr(X2<l):;.
I zrr"'
( f: rr;
31 fu@): 4
-L.
I 0,
aJ¿'
14;
[ rario.
(0. si
Fr@):I;:, s¡ zÉ!!'t];
32. r z\&)
- Íz(*):Io'
- \ t,
rz\n)
I i; ",t
si z e [0,1]'
Sección 3.6
6. a) E(X) :0, Var(Xl:X,b) E(X) :0, Var(Xl:|,c) n(x) :0, Var(Xl : *'
d) E(X) : 0, Var(X) :
;
7. a) e(x) - 2.5, o(x):0.866; b) E(x) :9r2,o(x):
$t OE(x) : '5,".}1:
;fo,
d) E(X) - -4, o(X) :0.556; e) c: #, tt") : #, o(X) : In 4 (ln 2)z
'
8. P:0.2, o : 11.
L Yar(Z): 0.09.
10.
72.
422 Capítulo 74. Respuesúas
22. a)
: i)
Pr(X
100 100 100 100 100 100 100 100 100 100
b) E(X) : 3.85; c) Var(X) : 5.527.
23. a) E(X) : 109.39, Var(X) : 33.19; b) 54.70 dólares.
24. a) E(X) : 3, o(X) : 0.7746; b) E(v) - 5.5, Var(Y) :
+
25. a) E(X) :2;Yar(X) : 0.2; b) 50.225%.
26. a) E(") :4.8h, Var(") :2.56h2; b) E(C) : 48, o(C):t6.
27. a) Pr(X > 60) : 0.334; b) E(X) -- 5r2 : 49.348m; c) Var(X) : 461.3 m2; o(X) :2L.478m.
28. Sugerencia: utilice las propiedades de las series geométricas.
29. Sugerencia: utilice el ejercicio anterior.
30. E(xY +2Y -x) : #.
31. a) 2; b)
Í'"1 f;
32. E(^9,) :0, Var(,S",) :;.
33. E(S") : fret E(?l,.) : tupa, Var(S") : TLo2 ¡ V-(",) : np (o2 * o'O).
1
Capítulo 4
Sección 4.6
2. 25 dólares.
, :
3. .) i; ¡) E(X) : 109.5 110 Palabras.
18. a) 0.05631; b) si es efectiva, pues la probabilidad de que nadie se contagie es muy baja.
100
22. pr(x < 9b) :1- t cf00(0.0b)k(0.9s¡too-r.
k:96
23. Al azar:0.17188; con información: 0.5.
24. 0.0504.
X b) 10 preguntas.
25. a)
-
p 0.1 0.09 0.081 0.1 x 0.
424 Capítulo 74. Respuesúas
26. b) 5 cartuchos.
0.2 0.16 0.128
3 gusanos.
a) 0.04087; b) 0,03564.
0.3188.
a) 0.032; b) 5.
a) 0.14653; b) 0.56653.
0.14288.
700 dólares.
0.14288.
Sección 4"10
,)
t;
..).
i2'
4. L/,U.
B. 0.75.
9. 0.8.
10. 0.15.
!. si r ¿ o. u' B6t'
( sir<o; E(x) I var(x) _-
b) .\:3, l@) :1 o,
i"_*, ;; ;; ó i, ==
n;
1
\
c) ,\:0.5, f(d:Io' ó.r"-o't,, sir<o:
.t; i ó. E(x) :2,Yat(x):4;
t
: f o' si
: :
d) ,\ 0.25, I@) =-
I 0.2b"-r,r,, .t ;; 3" E(x) 4, var(x) 16'
OD
¿rt- 82.28%.
426 Capítulo 74. Respuesúas
27. 0.403.
Sección 4.12
1. 0.023.
2. 0.0985.
3. 0.0003.
5. 0.0227.
6. a) 0.2375; b) 0.6657.
7. 0.04595.
10. 0.0207.
11. a) 0.0E23; b) 0.0446.
t2. a) 20; b) 0.1269; c) 0.8395.
427
Capítulo 5
Sección 5.6
X
D
Y 0 2 J
e) ^9
0 I2
PS 61 lr20 5rlr20 81r20 211120
1 29 cl) 55
3") 89; b)
*,") -:89', ', -:
89',
e)
X -1 01
PX 17 l8s t4189 t7 l8e 4718e PY 15/Be 27 l9e 47 l8e
4. a)
4
b)+ 01 2 X2 T2 c)
:'49
.40
49; 417 217 tl7 I 17 217 417 -.
X
Y 0 2 r) 4
5. -VJ 0.075 0.050 0.025 0.0375 0.0625
0 0.201 0.134 0.067 0.1005 0.1675
6 0.024 0.016 0.008 0.0120
v,) 0.0200
6. a) -3410 b) 0.1965.
Px 0.25 0.43 0.32 pv 0.55 0.45
7. a)
X 10 20 30 40 b) 0.7392.
PX 0.r4 0.42 0.19 0.25 0.7r
8. a) 1, b)
1 2 3
c) No son independientes;
60 115 31L0 215 PY 4lr5 rl3. 2/5
10
.ñ
9. ü +(\Á - 1); b) /¡(r) : "o"
r, fv(ü - coss.
JTa t' : fr
l0 lx\r) : *e '"'-'''; fv(a)
vrt "-'0";
no son indeperrdientes.
428 Capítulo 14. Respuesúas
4
11 4 b) si son indePendientes.
nrr
I2 a) fx@) : r) 0; fs,(y) : y > 0;b) (1 - (f +.lo)e ^") (t -" ^u);
^2tre-\',, ^e-\'!t,
c) 1 - (1 +.\a)e ^".
l3
p 1 o¡50 i3l50 21.150 7150 4150 p 3/50 22150 21150 4150
b)
t2 c)
xlv:o 1 2
rlrs 7 113 5113 213 113
t4. a)
X t2 ¿ 4 5 1 2
0.22 0.25 0.23 0.20 0.10 0.30 0.24 0.t7 0.11 0.08 0.06 0.04
ut Pr(x :
r \ _____________::_ l
t2 45
klY :1) I 1bl30 gllo 4130 7130 rl30
( (20 000)3
20. a)
"f(rr ,rz.rs):1
(rr*100)3trritoólt(rs+Loo)5' rt>.0' rz> 0' 13>0;
[ 0, caso contrario.
1
b) Pr(X1 < 100, X2 < 100, Xs > 200) -
16'
22 .)'256
3; a) fr(t):2t; c) Son independientes.
oa
") *;
¡l IxQ)-+,si 0( r12; Ivfu):+ si2( u<4;c) Cov(x.v) :-*.
,A a) a; b) fx@):2tre-'",ft(y):2!Je-!"; c) E(X) :E(y) :{,d) Soninclependientes.
ox
att a) :t r2r2+l si0(¿(
"fx(r)
. 4 .,
1: h(u):iu(u't *2) si0<y< l:b) Cov(X.V): -2
r--,
209
c)trlX-Y)-' 350.E(X'-Y'\- 2527
429
'l t r\ ) t
26. a)fx(t):1(ur.."Írt+'t\E-F*;),fv|):?(ur".unt+tt/L=P);rr)Noindependientes.
-\
( 2r-r17 ) si úr)o.
' v'
27 a) 8; b) Ix@) 1 6(1 + z)a 'L
: c) No son independientes.
I O, caso contrario.
28. a) k:(n-I)(,n-2);
b) F(r.u\:
' \*,rt {I 0,
\- (r:_r)2-n - (a+r)2-" +(r+ a*r)2-''', si r ) 0; v> 0; n > 0;
caso contrario.
,,
b) f x@) :
f* * r¡r, fv(a): Gi l)s,
no son independientes'
33. a) 10; b) /x(r) -5"4,0 <r<1, fv(y): fr{t _ y3),0<y <1, nosonindependientes;
39. 0.02923.
/a -2 4\
40. I-z u -r)
\a -4 6/
47. Cov(S,,,, T,-) : rpo2.
/t 2 6\
42. Iz 6 18l.
\o 18 60)
430 Capítulo 74. Respuesúas
Capítulo 6
Sección 6.5
9. 0.06802.
11. ¡t e (37.77;40.23).
12. a) 0.0456; b) 0.0228.
t4. 0.0036.
15. 0.923.
16. 0.8132.
17. a) Estadístico; b) 0.00361; c) Si.
18. a) ParámetÍo, P :0.8; b) El valor de cada estadístico, calculado a partir de las muestras, estará
más cercano a 0.8, a medida que aumenta el tamaño de la muestra; c) 0.9846; d) la probabilidad
es mayor.
0.785.
a) 0.9270; b) 2826.
0.0228.
0.0918.
0.09513.
p e (0.333;0.367).
p : 0.3679, Pr(f'> Il3) :0.758.
a) Pr(p'> 0.8) :0.1376; b) Pr(X > 20) :0.1935; c) La probabilidad de ganar debe mantenerse
constante durante el torneo.
43L
29. 0.95.
34. a) Pr(s2 > 150) = 0.9; b) Pr(s2 > 362) = 0.02b; c) E(s2) :225, Var(s2) : 3894.
35. o2 e (49.75;I6a37).
Jt. 0.8361.
39. 0.99.
4t. 0.025.
42. 0.05.
46. 0.0062.
47. 0.0104.
49. T - t(22),0.I.
50. 0.0207.
51. 0.9634.
52. 0.0322.
53. 0.9747.
432 Capítulo 74. Respuestas
Capítulo 7
Sección 7.5
-2
: i-, u-2 Var(73) : o-2
3. a) Si; b) Var(?'1)
'/ 2nz'Var(?z) -
n2', \ u/ 3; Bnz
c) Mejor 73.
8. Es insesgado.
9. b) a:
oi+oi
10. b) c:
---ú-
n\
' nt lnz
11. a) E(X.): g , Var(x ,l : {, b) Tn:x,,, ECM (7'd : *
t2. a)O :, (t - t, A :, (#+), ao,.a" k es el número de veces que aparece et valor 1.
*),
2á
13. L(p) : rttozs (7 - P)2r, f:
74. a) E(x) : 1 * 0,AL:X + t; b) Es insesgado; c) 6, :X; d) d2; e) 1.
Sección 7.8
9. 57.
13. 62.
t4. 43.
15. 31.
16. a) (26.77;30.04); c) El intervalo hubiera sido más estrecho; d) El intervalo hubiera sido más
estrecho; e) El intervalo hubiera sido más estrecho; f) El intervalo hubiera sido de igual longitud,
desplazado hacia Ia izquierda.v
Sección 7.10
1. a) (2.889; 3.a71);b) @5.27; a6.73); c) (-1.33; 6.33); d) (-176.58; -87.a2).
2. (O.ee; 2.30).
5. @0e.23;706.76).
6. (2793a;240.66).
Sección 7.12
5. o e (3.30r8.40). si le conviene.
434 Capítulo 74. Respuesúas
Sección 7.14
4. 2177.
7. a) (0.2475;0.3525); b) 276.
11.97.84%.
12. a) (0.812; 0.928); b) Será más estrecho; c) Será más ancho.
13. a) p: 0.5, n:77;b) Se necesitan más estudiantes; c) Se necesitan más estudiantes.
Sección 7.16
Capítulo 8
Sección 8.6
72. a) 1{6: ¡r : 18, HI F > 18; b) Rechazo Hs si t6t)s > ¿0.0b(10) : 1.812; c) toar:7.976, rechazo
Ho.
13. a) Son estadísticos; b) fIs: p : 26, HI Ir I 261' c) tobs :1.46, se rechaza Hs si t.6, > 2.069;
d) La edad de las novias no es diferente de 26 años.
14. tobs :3.378; cl periodo medio de espera es diferente a ocho días.
27. a) H0:P:0.2, H7:pt0-2;b) cv:0.04;c) zot,":7.75, aun nivelde cv:0.05 se rcchaza Hs.
32. a) zou, - 1.16, a un nivel de a : 0.05 no se puede decir que la mayoría aprueba el endurecimiento
de las penas; b) a:0.123.
33. a) zou" - 2.26, se rechaza llo; b) 0 :0.2655.
34. a) zob": -1.854, Ia diferencia no es significativa, se debe solo al azar;b) 0.30554.
35. a) zour: 3.0; b) Si es significativo alLVo; c) Las observaciones provienen de una ley binomial, son
obtenidas aleatoriamente y el tamaño es lo suficientemente alto. Las hipótesis si se satisfacen.
Sección 8.10
Capítulo g
Sección 9.3
5'
") xZu"6):19.009, xZu"Q):16.238; b) La empresa T dio un mejor resultado.
6' x1a":0.656' los clatos siguen ras probabilidades teóricas.
12. i:2.642, X?0":7.737, no se rechazaque el número de Ilamadas sigue una Iey P(2.642).
13. XZa" :17.88. La temperatura no está uniformemente distribuida.
74. XZa":20257; no se acePta IIs.
15. l: 1/1000, XZa":14.53. La duración no sigue la ley t(1/1000).
Sección 9.6
8. a) rou":6, se acepta flo; b) Dobs:0.324, se acepta Ho;c) gou":1.907, no hay valores atípicos.
12. a) rou": 6, no se rechaza 110; b) Dobs:0.226, no se rechaza Hg; c) Toa": 16, no se rechaza ,F16.
439
14. r<I4lor)183.
15. 2pobr:0.289, los dos laboratorios entregan resultados iguales.
16. Prueba de los signos: 2pot":0.109, se acepta //6, Prueba de Wilcoxon:To¿,":6,'se rechaza Hs.
Capítulo 10
Sección 10.9
1. 0 : 2.852 *3.704r,r : 0.948.
2. a) i:332.11* 0.65r; b) r : 0.993; c) tou": t6.895;
d) E(r) e (33e.63;344.09), f, e (335.e7fia7.75).
Fuente g.l. SC MC F
3. a) ó6 : -90.2, br :9; c) Regresión 1 810.0 810.0 54.24 d) 12 :0.948.
Residual 3 44.8 14.933
Total 4 854.8
4. b) g : -7.489 -10.r44r; c) F,¿" : 17.83; 12 :0.69; e) No.
Fuente s.l. S.C. M.C. F
5. a) Cantidad :18.976 +7.27I Tiempo; b) Regresión 1 37.01 37.01 79.73
Residual 4 1.857 0.464
Total corregido 5 38.686
c) 0o < (15.50;22.45), B1 e (5.01;9.53).
Fuente g.l. SC MC F
Regresión 1 3.210 3.210 73.2I
:
13. a) En los dos casos se rechaza I/o; b) Residual 10 0.439 0.044 c) 12 0.88.
Total 11 3.649
0'0-136.
16. a) ¡:6.66g7¿o.oso7;b) 0:0.0799 - I r]:0.834, r?:0.gro.
17. al ¡:3.0348 - "jou, Lt)12 :0.9614.
" : ------:--:-----
1
'22. 'll t'2 :0.973.
-.
0.0852 -F 0.0375:r:
Capítulo 11
Sección 11.9
i a) A: 742t4
+ * Urr, b) X'X : X¿Y: ( i, ); c) s2:0 602;
TS TSr,
/ -7.6e0 \
4. a) b: ( o.oso I po. (8.a7;8.09), B, e (0.0J2;0.r47),B, e (-0.3t;r.245);h) Ir2 :0.961,
\ 0.607 I
ye e (8.4;20.02).
a) G:1.083+0.011+ 10.749F;ü R2:0.856, RZ:0.76t, s2:303.99; c) (-0.055; 0.07a);
d) Solo el tamaño familiar; e) 3.5; f) Fot":8.945, se acepta Ho, anivelsTo.
6. { f :92.074 - 0.576L r 0.r2A; b) 16.33; c) R2 :0.948, RZ:0.9r4;
Fuente e. l SC MC F
Regresión 2 13.521 6.76 27.438
d) 2 e) Mejor modelo: T :32.337 - 0.529L.
Error 0.739 0.246
Total 5 14.260
7. a) totr,o - 5.05, tobs,t :2.54, to6r,2:2.67, to¡r",3 : 0.90, tobs,4:1.11; b) 0@i : 12.917.
9. { D :
-125.56 - 4.71u i 0.046u2; b) R' : 0.948;
Fuente gl SC MC F
Rcgresión 2 43396.4 21695.2 45.37
c)
Error iJ 2391.1 478.2
f,'t:rl ' : t {..ri17.5
442 Capítulo 74. Re.spuesúas
Capítulo L2
Sección 12.5
1. : 31, ECM : 186.9; d ñr: 30.2, ECM : 19b.b; d) ñ, :297, ECM :279;
u) ?tt
")
lr; : 33.7, ECM :2gg; f) ?t : 34.5, ECM :280.2;
e) ñz: 18.7, ñ, : 42.8, ?1s :55, ?zo :23.g, ECM : 126.3.
2. b) ?zu : 57.5, ECM : 172.5; ü ?zs: 56.8, ECM :153.7; ¿) ?ru: 47, ECM :253.1;
59.7, ECM :243.7; il ?rt :57.4, ECM :224;
") %s -
e) ?2s:75,r, ?ru:54.6, ?27: 50.0, ?rr:71.9, ECM : 124.3.
3. b) ?tu - ll7, ECM : L32.7; ") ?rc - I27, ECM : 63.7; ¿) ?ro : 116.2, ECM -- t43.7;
?ro : 118..2, ECM : 39.8; f) ?tu : t26.6, EcM : 83.8;
")
s) ?ro :125.0, ?rr:L27.5, ñr: 133'4, ECM: 157.5.
Capítulo 13
Sección 13.3
1. a) ¿r € (81.23; 87.r7), r € (32 493; 34 867);
b) 121.
443
Sección 13.5
9. (30.e8 %;3e.08%).
Sección 13.7
1. rr) r€ @756a6;a8$54); b) p€ (3.171;3.229).
2. a) r € (889 546; III9228), p e (277.98;349.76); b) 28.
3. a) (7.31;11.64); b) 98 clases.
4. p e (0.1;0.3).
5. a) (0.2831;0.3733); b) 25.
6. a) (0.0677; 0.2448); b) (115; aI6); c) 79.
7. a) p,¿ e (45.56; 85.12); b) pg e (20.32;37.L2); c) p¡ € (35.38; 106.89); d) p e (0.0272;0.2228);
e) no:26, n6:25, nc: 29. El tamaño óptimo es de 29 familias.
Ta blas Estad ísticas
. Nivel a :0.1.
. Nivel a : 0.05.
. Nivel a : 0.025.
. Nivel a : 0.01.
445
446 Tablas Estadísticas
z .00 .01 .02 .03 .04 .05 .06 .01 .08 .09
-3.5 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002 0.0002
-3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
-3.3 0.0005 0.000s 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
-3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.000s 0.0005 0.000s
-3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
-3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.00r1 0.0011 0.0010 0.0010
_to 0.0019 0.00r8 0.0018 0.0017 0.0016 0.0016 0.001s 0.0015 0.0014 0.0014
-2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
_7',l 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
-2.6 0.0047 0.004s 0.0044 0.0043 0.004r 0.0040 0.0039 0.0038 0.0037 0.0036
_t< 0.0062 0.0060 0.00s9 0.0057 0.00ss 0.0054 0.00s2 0.0051 0.0049 0.0048
-2.4 0.0082 0.0080 0.0078 0.007s 0.0073 0.007r 0.0069 0.0068 0.0066 0.0064
-2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
-2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0r16 0.0113 0.0110
-2.1 0.0179 0.0174 0.0170 0.0r66 0.0162 0.01s8 0.0154 0.0rs0 0.0146 0.0143
-2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
-1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.02s6 0.0250 0.0244 0.0239 0.0233
-1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
-1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.037s 0.0367
-1.6 0.0s48 0.0s37 0.0526 0.0516 0.0505 0.049s 0.0485 0.047s 0.0465 0.04ss
-1.5 0.0668 0.06s5 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.057r 0.0559
-1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.073s 0.0721 0.0708 0.0694 0.0681
-1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
-1.2 0.1151 0.1131 0.tttz 0.1093 0.1075 0.10s6 0.1038 0.r020 0.1003 0.098s
-1.1 0.13s7 0.133s 0.t314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
-1.0 0.1s87 0.1562 0.1s39 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
-0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.t7tt 0.1685 0.1660 0.1635 0.1611
-0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.r867
-0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
-0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2s14 0.2483 0.24s1
-0.5 0.308s 0.3050 0.301s 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
-0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
-0.3 0.3821 0.3783 0.374s 0.3707 0.3669 0.3632 0.3s94 0.35s7 0.3520 0.3483
-0.2 0.4207 0.4168 0.4129 0.4090 0.40s2 0.4013 0.3974 0.3936 0.3897 0.3859
-0.1 0.4602 0.4s62 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
-0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
447
z .00 .01 .02 .03 .04 .05 .06 .0't .08 .09
0.0 0.5000 0.5040 0.5080 0.5120 0.s160 0.5199 0.5239 0.s279 0.s319 0.s3s9
0.1 0.5398 0.5438 0.5478 0.s517 0.5557 0.s596 0.s636 0.5675 0.5714 0.5753
4.2 0.5793 0.s832 0.5871 0.5910 0.s948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.691s 0.69s0 0.6985 0.7019 0.70s4 0.7088 0.7123 0.715'l 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7s57 0.7389 0.7422 0.74s4 0.7486 0.7s17 0.7549
0.7 0.7580 0.7611 0.'t642 0.7673 0.7704 0.7'734 o-7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.799s 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.836s 0.8389
1.0 0.8413 0.8438 0.8461 0.848s 0.8508 0.8531 0.85s4 0.8577 0.8s99 0.8621
1.1 0.8643 0.866s 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.911s 0.9131 0.9147 0.9162 0.9177
74 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.934s 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0"9463 0.9474 0.9484 0.949s 0.9505 0.9s15 0.9525 0.9535 0.9545
1.7 0.9554 0.9s64 0.9573 0.9s82 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.96s6 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
7.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.97s6 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 {1.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.99r3 0.9916
2.4 0.9918 0.9920 0.9922 0.992s 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
1< 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.99s2
2.6 0.9953 0.995s 0.9956 0.99s7 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
,, ,|
0.996s 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.998s 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.999s
3.3 0.999s 0.9995 0.9995 4.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9991 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
í00.0"0 f,BSO'0 TOBB'B r00ü'0 i0$0'0 i000"0 t0ü0's [000'0 f,080-0 itsBB'$ It
r000"CI gB$B'S s$0fl'B r-üfl0'0 ESfl0'fl t-s00"0 b-ü0ü^s 90'0.0'0 f&80'0 f0$s'0 y'ü
f0ü0'0 t&08'0 F000'0 F00$'s F$0ü'B üü00'0 f$ú8'0 s000'0 !=008"0 s0ü010 IL
ss00'0 s8s8'8 ss0g's 900s'0 90üo'$ 9ü00'0 9SSS"0 90s0.0 ¿üB*"0 ¿000"0 rE
¿n00'0 ¿ES0'0 8S0B'S 8000'0 8ü00"$ -"'fl00'0 6CI0CI'0 60$0"s 60üts"0 0{0ü"0 1"r-
sf 00'0 6F80'S IEOE'O +Sü0'0 ügil0'B 590ü"0 ¿s0s'0 6t 0 0'0 09sB'CI [908'S _L-'t
F900'0 9988"0 s900'8 6900'0 rtfl0'g f¿00'0 9i&0'0 8i00'0 BE$F1O rgB0's Tt-
ISÜB'O i.qBB'0 6S0B'ü T6S8'0 9600'0 6608"fl ¡0r0'0 rsTB'0 i0T0'0 tr.
0TI0's T-T T B'O 9II0'0 üT I0'ü ''6Sü'S
i¿rfl'0 6rTS'0 ;gTCI.O I r-10"s 6EIS'tl
-r-íT0"tl
r-tI['ü 9FTg'0 üs1$'8 F918'g üEIfl'$ ísIs'$ 99rü"ü 0f.I0"s F¿{B'D 6¿r0'0 LL'
t8T0'0 8SIfl'B i6I0'0 ¿6rfl'8 isi0'ü iflr0"0 [{i0'fl iIi0'0 crrU U 8iiü'ü 0'r
filo'0 6ürs'0 }F¡C'B BSifl'o 95Eü'S ¡9¡0"0 89iG'0 ilí0"0 TStF'0 i8i0's ó1
F6tü'B TBr-0'0 r0t0'0 FIüO'8 ;Ir-$'ü É¡r-0'cr 9Er-0"0 f f r-0'0 I9t0'CI 6Sr8'CI *'r
¿9t0'0 gif0"0 f8Lfl.B ¿6ts'0 r0?0'0 6üf0"0 BIFO^O ¿[rCI'I 9gFD^ü 9trF8"0 I-I
!EFÜ'O S9FÜ'Ü 9¿Fü'0 EStü'0 96f fl.0 -cfl9fl'0 9rsCI'$ 9iE0'0 Lr-ECI'0 8rE0'8 9"1
6950'D TigB,O iggB'B rÉtü'0 sü9fl'B *T90'0 CI99ü ü E'90"0 s59B"S s99S"ü
T890'S F690'0 s0¿0'B E¿¿O'O sr-¿fl 0 6f;¿0'0 F9¿0'0 8ii0"0 r-6¿B'S 8088"0 t"{
t-t80"0 8r-88'0 r--c8s'B é980'E s88fl'+ I ÜóO'O 8tú0'0 1.960"0 TE681S s9és'ü &L
!8Éfl'0 I]BBT"g OTEI'B 8r:SI'& 9SSr'0 E¿OT"O r"düT'fl [T IT'O IgET"S T9II'O 7'T
0¿T r'0 &6{t'ü 0Tlr'$ 0t-i,r.I'0 TSTT'B Ii;I'S i6rT"$ FTI-T'O sgr-T'0 ¿sr-T'0 T"T
6¿b-I"0 1BFI'0 giFl'(} 9tF{'0 69FilS r6FT'0 sn9z'0 útgr"0 egsT'0 i85r"0 0'{
ITFT'O grl9I'0 099r's E39r'0 II¿T-8 917tr'0 t9¿r's É8rT"0 rlst'0 I'gT'ü 6'S
rssr.0 F68t'ü ;iÉE.B 6F6{'S ¿¿6r'ü sfl0i"0 btní'0 T9üi'0 ü69r"CI 6ETt'$ 8'B
siTi'$ -l-,¡- LL U 90[t'B 9ft['0 99t['0 96'r'.['S ¿f,rrf,'0 8E$iT 68r-9"ü 0¿f'9"ü ¿o
TSf ['0 t-8hí'ü FIgf,'B gtgrg 8¿Ei'S ET9['0 t-'9E"0 919f,'CI 68tt'0 f,t¿i'CI 9'ü
9i¿i'0 8r8t'0 r-F8r'S ¿i8í'0 ¿t6r'B 9t6i's n86¿R sr0f'0 sE$r-'0 s80r-'0 s'B
TTIg'O 9gTt'0 í6rt'0 8t;t'0 F9trg ü0[-9"0 9gEg'o í¿ür-"0 60Fr-'0 9Frr-'0 f.s
[8Fr-'8 0i:l,f'ü t 99f'8 fr651-"g it-9b-"ü 699r-'0 rs¿D'ü 9fl.ü-"$ t-8¿b-10 r[8s'g g"s
6!'8S'ú ¿689'0 9S6!"8 f¿6üg gIÜF'$ iE0t'0 üÉüf'8 6iTf'0 tgTF.ü ¿0f,.ü'r0 r0
itít'B 98ti'ü s¿si'B 19r?'B F0Ft's r*}ti'0 r-stt"0 ¡¡gF'0 [95F'ú i09f "0 {'0
rr9F"g rs9F'0 rt¿t-B T9¿i'0 IOBI'B 0tst'0 0889'ü 0¡6''0 096r'0 00Bg'0 o'0
60' s0 ¿0' 9S' 90' t0' t'8" i0' tB' 08' 7
serr+slPefsg selqeJ 8W
{4v
6 0.265 0.s53 0.906 1.134 1.440 1.943 2.447 3.143 3.707 4.3t7
7 0.263 0.549 0.896 l.l 19 1.415 r.895 2.36s 2.998 3.499 4.029
8 0.262 0.546 0.889 l.108 1.397 r.860 2.306 2.896 3.355 3.ti-l.l
9 0.261 0.s43 0.883 I .100 1.383 1.833 2.262 2.821 3.2s0 3.690
10 0.260 0.542 0.879 1.093 1.372 1.812 2.228 2.764 3.r69 3.581
1'l 0.260 0.540 0.876 1.088 r.363 1.796 2.201 2.718 3.106 3.497
t2 0.259 0.539 0.873 1.083 1.356 1.182 2.179 2.681 3.055 3.428
l3 0.2s9 0.53 8 0.870 1.079 L350 1.77 | 2.t60 2.650 3.012 3.372
t4 0.258 0.537 0.868 1.076 1.345 t.761 2.145 2.624 2.977 3.326
15 0.258 0.536 0.866 1.014 1.341 1.753 2.131 2.602 2.941 3.286
16 0.258 0.535 0.865 I .071 1.337 1.146 2.t20 2.583 2.921 3.252
77 0.251 0.s34 0.863 1.069 L333 1.740 2.t10 2.567 2.898 3.222
18 0.251 0.534 0.862 ll067 r .330 1,734 2.101 2.5s2 2.878 3.19i
t9 0.251 0.533 0.861 1.066 ll328 1.729 2.093 2.539 2.861 3.17 4
20 0.257 0.s33 0.860 1.064 1.325 t.t25 2.086 2.528 2.84s 3.153
21 0.257 0.532 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.1 3-i
)) 0.256 0.532 0.858 r.06r t.321 1.7t7 2.014 2.508 2.819 3.1l9
23 0.256 0.532 0.85 8 1.060 r.3r9 1.114 2.069 2.500 2.80'7 3.104
24 0.256 0.531 0.857 1.059 1.3t8 1.71I 2.064 2.492 2.197 3.091
t< 0.256 0.53 r 0.8s6 1.0s8 1.316 1.708 2.060 2.485 2.787 3.078
26 0.2s6 0.531 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.061
aa 0.256 0.531 0.85s 1.051 1.314 1.703 2.052 2.473 2.711 3.051
28 0.256 0.530 0.855 1.0s6 1.313 I .701 2.048 2.467 2.763 3.041
29 0.256 0.530 0.854 I .055 l.3l I |.699 2.045 2.462 2.756 3.038
30 0.256 0.530 0.854 1.055 I.310 L697 2.042 2.457 2.750 3.030
35 0.255 0.529 0.852 1.052 1.306 r.690 2.030 2.438 2.724 2.996
40 0.255 0.529 0.85 r 1.050 1.303 1.684 2.021 2.423 2.704 2.971
45 0.255 0.528 0.850 1.049 1.30 t 1.619 2.014 2.4t2 2.690 2.952
50 0.255 0.528 0.849 L047 1.299 1.616 2.009 2,403 2.678 2.937
60 0.254 0.527 0.848 1.045 1.296 1 .611 2.000 2.390 2.660 2.915
70 0.254 0.521 0.847 1.044 1.294 1.667 t.994 2.381 2.648 2.899
80 0.254 0.526 0.846 t.043 1.292 t.664 1.990 2.374 2.639 2.881
90 0.254 0.526 0.846 1.042 1.29t t.662 1.987 2.368 2.632 2.878
100 0.254 0.526 0.845 ]l042 1.290 t.660 1.984 2.364 2.626 2.871
oo 0.615 0.525 0.615 1.037 1.282 t.645 1.960 2.327 2.576 2.808
450 Tablas Estadísticas
6 0.68 0.87 1.24 1.64 1.94 2.20 t0.64 11 .41 12.59 14.45 l6.8 I 18.55
7 0.99 1.21 1.69 2.11 2.53 2.83 t2.02 12.88 14.01 I6.01 18.48 20.28
I 1.34 1.65 2.18 2.13 3.14 3.49 13.36 14.21 1 5.5 1 11 .53 20.09 21.95
9 1.13 2.09 2.10 3.33 3.18 4.17 t4.68 15.63 16.92 19.02 21.61 23.59
10 2.16 2.56 3.25 3.94 4.45 4.87 15.99 16 97 18.31 20.48 23.2t 25.19
lt 2.60 3.05 3.82 4.51 5.12 5.58 t].28 18.29 19.68 2t.92 24.73 26.16
12 3.07 3.5'7 4.40 s.23 5.82 6.30 18.55 I 9.60 21.03 23.34 26.22 28.30
l3 3.57 4.t'l 5.01 5.89 6.s2 t.04 19.81 20.90 22.36 24.74 21.69 29.82
t1 4.07 4.66 5.63 6.57 1.24 7.79 21.06 22.t8 23.68 26.12 29.14 31.32
l5 4.60 5.23 6.26 1.26 1.91 8.55 22.31 23.45 25.00 21.49 30.58 32.80
t6 s.l4 5.8 r 6.91 1.96 8.7 r 9.31 23.54 24.72 26.30 28.85 32.00 34.21
l7 5.10 6.41 7.56 8.67 9.45 10.09 24.',71 25.97 21.59 30.19 33.41 35.12
l8 6.26 Ljt 8.23 9.39 10.21 l0 86 25.99 27 22 28.87 3 t .53 34.81 31 .16
l9 6.84 1.63 8.9 r 10.12 10.91 11.65 21.20 28.46 30.14 32.8s 36.19 38.s8
20 7.43 8.26 9.59 0.85
I I 1.73 12.44 28.41 29.69 31 .41 34.t1 31.57 40.00
2l 8.03 8.90 r0.28 I I .59 12.50 13.24 29.62 30.92 32.61 35.48 38.93 41.40
22 8.64 9.54 10.98 t2.34 13.28 14.04 30.8I 32.14 33.92 36.18 40.29 42.80
t1 9.26 r 0.20 I t.69 13.09 14.06 14.85 32.01 33.36 35.11 3 8.08 41.64 44.18
21 9.89 r0.86 t2.40 13.85 r4.85 15.66 33.20 34.57 36.42 39.36 42.98 45.56
25 10.52 1t.52 13.12 t4.61 15.64 16.47 34.38 35.78 37.65 40.6s 44.31 46.93
1A IL l6 12.20 13.84 r 5.3 8 16,44 11.29 35.56 36.98 38.89 41.92 45.64 48.29
27 1l.8l 12.88 14.51 16.ls 11.24 |8.tI 36.14 38.t 8 40.1 1 43.19 46.96 49.6s
28 t2.46 13.56 15.31 16.93 1 8.05 18.94 31.92 39.38 41.34 44.46 43.28 s0.99
29 13 .12 t4.26 I 6.05 t] .11 I 8.85 19.11 39.09 40.57 42.56 45.72 49.s9 52.34
30 13.19 14.95 16.79 I 8 49 19.66 20.60 40.26 4r.76 43.11 46.98 50.89 s3.6'/
35 17 .t9 18.51 20.s7 22.47 23.16 24.80 46.06 47.66 49.80 53.20 51.34 ()0.27
40 20.1t 22.16 24.43 26.51 21.93 29.05 5 I .81 53.50 s5.16 59.34 63.69 66.77
45 24.3t 25.90 28.31 30.61 32.14 33.35 51.51 s9.29 61.66 6s.4r 69.96 73.11
50 21 .99 29.71 32.36 34.76 36.40 37.69 63.17 65.03 67.s0 11.42 16.15 19.49
60 3s.s3 31.48 40.-18 43.t9 4s 02 46.46 14.40 16.41 79.08 83.30 88.38 91.9s
70 43.28 45.44 48.16 5t.14 53.15 55.33 85.53 87.68 90.53 95.02 100.43 104.21
80 51.17 s3.54 s].15 60.39 62.s1 64.28 96.58 98.86 I 01 .88 106.63 t12.33 116.32
90 59.20 61 .7 5 65.65 69.13 '/ t.46 13.29 101 .57 t09.97 113.r5 r18.14 r24.12 128.30
r00 6t.33 70.06 14.22 71.93 80.41 82.36 118.50 t21.02 t24.34 129.56 135.81 140.t1
120 83.8s 86.92 91.51 95.10 98.46 100.62 140.23 t42.96 t46.57 152.21 158.95 163.65
45L
7tt
lt fitel ,{ ¡ 6 a\ I I13
6
€i- .s5 9-5 :-j j-s j-9 fr¡
u+- +- ! ttt i tl
..,-n ltt tr{ f a ,n 1i
^ j-iLf L- t J- 1
: t:a
_r-11 :r-i-l
.
f:
tjf.= Lr u I ¡1 .i 4 to f 1t-t
_1-
tl l i-lt J-t; 4-t.1
I .-,- n ¡1
ü-i t-l
-1-Y
t-q J L} J-
lr _t I ¡ l1-
lr
LO
rx:i] $i l_i -i-; i-9 1- u _!- ! l 3 6-trJ A
_1
''! i l- lo l J I li
++- +
r --r-i J\-i A
L)--Ll ,-,
-' l-i j-l l-g j ti- 3 -. I lÁ 8- A
1.1
úr.= 'J J .t
ñ.-
cr--r
1r 'a
)-> ) l1
-¡" 6- $
L4-,i. J -l r_i 1
{ A .: O rÉ C
I:
iiü= < r¡ i rÉ-l t -+- 1 'rf ú
452 Tablas Estadísticas
-4 .t\ f?t {{' *{ a.,t r-, c¡r !+ !p r.- (r cl¡ \ct r.l crr i.¡ ?,i 19\ r-. ,.r (fr rt L': ür @ r y¡ r¡r (tr r-. rr! rfr .4 ,:.1
.i \.1 1'l r-. .4 r'-. $il . ¡ -.d {¡ 4t\ (tl 'r¡
ñ q u) \t: qJ rt¡ t.t t(t t.t r-r r/1 +t 'i "t $l
f-. r-. !(i w -t ¿fr ..r a.l ..i r.i .'4 r..¡ ir
I
a{ sr af @ rrr rñ Cj} r,t q {¡r1 gtr "rf a
1. er r¡¡ €' {: r.¡ (.i r-- ,., ,., t.. (^ @ u, '-i $l rF! f.l +*d (1r ('1 idl -+ r¡ (5 C¡r at\
c.: "1 r -{ r-. r/1 arr (Í3 fJ @ m r-. r- r-. r- rC E W \O r-r rar ht ra) r¿r t(\ tr¡ rt {:'f tq f¡ f¿r rfl fq f.¡ .*.
* \$
"(
C r'- r.r c:J ,tt r.-' rl r-' l.¡ a1 5:r. r-. .{ r-. (i {tr \¡) .-l - . f)t r- qt \l .- D r- ql '/-¡ qr it *{ @ tf: t-¡ !I:'
É ".r * r.? *, .* tr, r.¡ r.i ü ,tj Al c),i sJ ? 11 T:. rj r-: rq ú rf) \ri frdiI v) Q¡ tn t(t tf\ ."t *i *f ü\
r7r .q (q rrr r¡
a-l a¡,'n f+! f.t -.{ r{ f-.1 -.1 .'l (-l *! !\i sr d d ri ¡.-. d '¡r*¿ ',.-)
s .-1 +d < 4 Fr s.., r./. !4 4 f{¡ !r
@
i4 r" \4) cJ \() tr qrt rQ 'n d4 rñ (^ ef' (¡ '.r .-, @ r.t rt .". ¡-^ rt \{) *:f f' T' c.: ch d r-. * s *l a{ qF +- @ c>
rriht--.@--{r-rñf4r.{r\dÉi)fl\f\@m@r".r-.r1r'..Q\o\6Js\É\clst.ltftttira-l."tq\'l..fcrrfqrrr
rjo',Ári
\É
ri r.iririr..i¡"¡r..¡-i;*.ii^.j...;{*j.i;*i-.;;*; ;ñ*i;;ñJñ**"i -.-
rP \CJ r-..{ r-. <> É @ 'ñ \ó e4.*'\C:.-, ¡-. q *{ É \O s.l .t (1 (¡ r- w '-, *1 .., r.l s{ sl (> 4 q} \l ¡¡'.1 f
rfrr.F'4*,?,nÉ.r.1 *qqülq¡lü4?@.r".r"r:.r-r':\ól\ÓqÉtq!ci{lqtftt.\4r'.er.qih.ftl,/f'
...l('r'riltc.|f'"ff'¡r,lñ'¡.flf'l..|Ne.l4sÑd4+-qÉ.qdÑ!\s..qFl.q*q.{Fjfi4
\C5
*,1 {.t @ r:f N \:t Ür r{ cF üJ r'{ \p,. \o r¡ ú' ró.ef d lh a q} e|f (p! r..¡ -q €1 (!, Éq rf" rq r-."cf* rr'.,q <¡ (¡ rt
r-. rit +{ m llll m rrr s.l .r¡ .,¡ "*r <) c) qlr 'f, ú @ 4 --4 F{- r'-' T-. r'n f- r. r-. r.- \C! !É \tr \tX rrr r¡ rñ In lflr .41' rd
E
f{ --i <¡ '¡,i ri ri r.i ni r-l r.i r't ci r.i ¡j ¡
qJ
*' * "J *i *i *'i *q *i "*i ñ; ;; *i i * i..',i -'; "-"; .- *;... -
.'| rl () r-. 14 ra /rt x) nl \Y r- (2 ¡.r -- r-. ()1 ..1 -., (¡ u:) t¡ rr¡ .* {) fi r' \() '- qf /r! a.l \4J r,1 q'"er r" \e' A 5
a't r.l f l a fl ú. \f) Sl /.r r.l -e :a cf c) a¡, o @ vJ @ 6 @ ú Í- r-' r-. r-- r. r-. r-. \c) \É (, rñ r^ r¡r r.r rt
óqf}lñ¡t\t1?1.'lr{rlr,ll'¡r,'lr-l...|.*r¡!{*l4vdi.!ly4sq
\¿¡
ñ !¿¡
4F
ql c-.frl '.' .F ^l r2 r. \.t f .l C¡, r-. s) r.t fn .q É") q¡ m r- \4) r-r (J \ó ql ..t -ñ 4¡ (J1 r.
cJ *r ,-r r¡ €
c.,..tr.lúa{@0\1 '.' q¡ E
rqr.{ñ..-¡4)cJÉl}cJ\cllcl\úJco€J@q@@r-.r-r..r".r-.r".vJ\()Q\l¡'{Jrñ'r
tsd {¡;,
J
E¡
+'$¡ '\. (':7 r-. {:: r':. 4? tr @ ?.r r¡r .-.) ttt . rf,) 3f ..' ,.
r-. \:l
rl
r¡ a..¡ rt, r-) rrt (.1 .l r-r c¡
. | '5 s 'rr ff1{ nr
ú1 q_tr
r r{ "*' .} f}q E-J r-.
q¿ r-. r-. r'.
..*J @ lrJ -,at fa
r-, v.:¡ l4:l tf,r (l)
.,1 -.,
\ó (c ,'-
ú t-l
rl a! -.{ ..J dr @ @ .n vJ v @ o)
14 \f,
e
& f" <) .t -1 q? .t a rt <j ct rr' I- Ft r" -rl . t @ t.t i¡, -. {) m r' r-, "1 r.t ..1 a <}l t)' { i) @ € '.¡ rrt \.1 r-
E .l 11.r'f n1 rlfr\ ¡t,f|-,-,cicl<>ol(l\¡..n<1 cr, m(tDr- t r-.{JtrqJ\Ó(¡!'r
WA I,¡,..t -@Fp,anioi
!<}
O
,,É qlf.l
Ó,(r1 .frr:.¡()Y{>.rlf4f-lr-rmYl'{}uiJrqc¡4qJ1ta{(í¡(ffir-.{)r,1 .drd¡r-¡-q..rh@r--\()u=.
Á¡\a.l(I..14trÍ-.tat.\1lri-'t?¡{rae{i:)C:\()(r!(}Ci!ftfrrúü@@@4¿bSr-.f-,r'-.r0(Ct¡lrCE
'i& -
\S @ {f Yll t"¡ \J +j.,-¡ r-" rd{ \Ér..t cJr r{J r.r \) @ !!J'¡,.Fr.-t 1d (} 9) r- r-- \df r-¡ qrr !e 3)T f4 -.t r^l ch.-
'E¡
Én r.1 S.J
a trt a.i.t1 ':,.| 4)1 r'-. r-, $1 ¡.t 11. ¡ -'r *i C> (1 t) (J 4h ü cn (r1 q¡ {:r @ @ @ 6 úi cü É- r: r: r-l r- r:. \É \9
Lá
ü
.. r:l f¡f t.t <1 eJ r- cjl r-. @ L-.: 'J C: '.' ri .J ., ,f,i @ (.t (5 f- E r., fl r.r --
r:t r' qf rtr
Q' r') rn tr- r.r +r .n .l ., i)
ñÉ ¿rf rl l¡ ..r u\ r-. t.t t:l .t ¿rr ...| (-1
^{ * ';: q} (}, €r {h úl <.h (ti .-¡ {.}, (Jt <Jr
r¡ o' ,¡i rr¡ ¡rj ¡i -"i ":i ri ¡-j r'¡ rr r.¡ r'i n{ ¡-¡ r.i ri ri ':'i ; '.t . ¡ .-¡ *.,; .,.,, "','¡ ..; .-: -" *.i *i *i *; ; *,j ..'; -
o m ü ú r'-, r'. r-, r.:" r-. I
ftJ
- f, F) = 'ifl \e r- qo':\ xl E 593 Fi F1 Fi ri il Ii H !; frñ ff +ff g F * á 3 ;
R
= = = == l!
D$'E !i'T !í'E SF'' gF'i ll'{ ¡9'i sg'E LL $ -'L ¡ UL *
gs'{ ss t +Á'T Fft';' 8g"i I['¿ ¡t'¿ i9 ¿. $s g n.t'i m
ffi
f it s 6g'¡ 8F'¡ tS'$ ic'¡ s9'í LL 9 VL I i8'¡ q$'1 68'I r-Á.'E ., Á ¡ [*'¿ Et'u 6¡'i f [.i 9f,'í 8i'r 6s'g i6't 0CIt
*t ni'T f*" ¡ A4,'l Ci t 65'X 69'E $¿'I $S'E ts'¡ 98.tr s6'l i;i'¡ F'Á'I ItlL gi L. UiL L¿L ¿F'¿ 3¿ ¡ Ct 5 !6'5 0.6
!i ¡ {t ¡ ;t'c ?g-E s9-i s¿'{ st.c [8'n F8'T $8'E 16'! s6-rr ss'r 9*:¿ t$'t [r.r Ef i 6F'¿ il-¿ ¡ 1't g$'i $E
t5'I 5!'i g!'i ¿f'¡ E9 ¡ 'e¿'E !s.' Fs'i 98'¡ 6s-I [6'I ¿.6'! ¿0'E LU L f 1 L {í'i.. sil[ ss'i F¿'í 5I'5 86'! 0¿
ác'l ef,." ¡ 9q-¡ sg'l sg.t s¿'l F8'¡ S$'T 68'[ t6'{ S6'g 66't fo'e {.'g L L¡ L !{"[ ¿g'e [E'r 9¿'E 5t'[ 0*'F ts
)f ¡ L: t s-E Eg't 69'{ 8L'{ i
LU ¡
o'? aa-
VU
z
¡ ¿5'E !6-n 66'¡ t#"[ ¿s"¿ [$'[ EE í 6Íz Et'í st'[ 6¿T 8g'g t$'f üs
YE: ,69"1*9'I ü$-{ F¿.'T FS'C ffi't !6'g i -É'g
LU t 8S'r [¿'[ 8{'e 5f'[
l-ú¡'7
VV L {rf}'I
?V L t5'¿ sf'¿ ng'E F8-e ff'5 E*F 0t
[9'5 S¿ I 9¿'! 6{.'I FS'I l5.l IU L.
M'!
L 9$"C S"; [I'e 91'fl 3e t ¿e'fl ggT LIL E\t 69'C {.6'[ [t 5 J.;'f B[
ES'C SC'i VI'[ 8f 't r¿"¿ 8¿'¿ s|.e
FI.¡
ñ¡
; F*'¡ i¿'t {¿'tr l$'r s$ r r.6'f t$'[ ss'¿ tÉ'c 5t'[ #¿T 96[ [g'5 8t"F 6t
g9'¡ [¿ l s¿.'I cB'¡ ¿s'i 9'6'I *,s't *s'e s8't {{T 5t't 63't Fe'e 6{'t gtT E?"¿ 9!'{ T¿'C !6'[ F['[ S{'} $E
t\ ¿g'{ F¿'T I8"E F8-t 88't L6'{ 9S.[ S8"{ *1'C gN'E ¿I'E sr'fl E{"[ lf-r i.t'c ,t" L i_! L t¡.'g 9€-i Ef'l {c'F LL
E 69 E 9¿'i l.s'r s8'1 $6'1 66'E ¿s'E 6S.¿ ¿i'[ g¡'fl BI'l .T?-?
T.LL
t.¡ ¡
LCL i5'¿ 6S'e ¿F'f, 6!'t t¿'r 86'¡ ¿5 5 r¿'3 9t
ro
o
Ti-t
¡L S o/'r
DL ¡ fs-c ¿8'r 86.: t{}'U 60't [1'l ?:-í gt"c or'c a--
}.L L
dt'7
OL. L F['T O}T 6t'¿ 89'e 9L'7. 66¿ $['I i.i'] J"
tto
¡q st'1 $8'i gS'E 6S'¡ frÁ'f L-n'i i{-'[ [1.i st't $['¿ w'[ !í'r 0[T ña'a
:'¿L -5'7
L$L $'t t9'¿ B¿-g rs't sF'E gt'f Fi
9¿ l [s'{ 88'I E6'{ gS'C iS'[ ggT t¡'fl 8r'[ 8f? f['[ ¿rr [t'I LN L IS L r!'¿ t9.¿ 88-t 5.S't [t'S 8',['F ¿b
86'i ¿$.[ s['t [{'{ 8f-t 5f.e gx'c !g'¿ s'c ¿s'¿ _fE g fg''g s5'F
¡ie
üll Ea'E 58,'E ?#'8, y6'g E[-r sft st-t 9f i
Ed gs'3 8B'¡ f6'I 96'¡ ¡$.í ETT B¡"e s¿'¿ fll't lÍ'í E['[ '¿rÍ ¿f'¿ T3'T, SF'í r.f'c 89r f8T ¿0'5 ¿r'g ig'F IE
rÉ€ FS'S {6'S .r É't *3's jú'?
AU L
,t't
LI. l. IJLL
^?'?
+-'a
ILL !r[ 8't'E If i 5g'u 6f'e !FL ¡!L tfi L !i L ¿t't 8I'Í 6F't !t'F s¡
o! E:8'Í F6'3 ffi'e ff [ 9i'¿
ts'[ ¿$'E 9E'[ s['E xr-'[ tf'[ 8r-Í ¿F'¿ ü& L NL-? L?''
ts L :T't vi'f ü6'[ f{'f t!'t 8['f 6t
OA ¿s'3 86't s'{ 90'i !1'[ 6!"[ ¿t"e 6ür {E'[ St't LÍ'[ *s' L :rf i!-¿ ¡!r! B'?
L 8E? slT ¿i.¿ 56'f 9$'t !!"5 {F'F $T
O'(ü
?4 s6'T C$'r ss't 0T'i cI.¿ [e't Tg'c [E-i 5ffi 8fi trr !F't 6F e s!'t I9T 81"¿ l8-¿ 96'¿ St't 65'[ ii'! ¿T
IP 3S'[ ¿0'E í¡'e 5I'e 6¡'C 8["[ rr.a r a'? L L{ L
-M't
trl'(
rr', *'t
Lf L tf L 6?T F5'[ 6!'¿ W'T *¿'Í s8'¿ {0'[ tt'g t9'5 6F'f 9I
8¡'fl 0['[ gr[
-!.
Ha t
LU L
&'? ?t'7
L' L fg:i #'7
r-t' L
?&'T
L'' L fF'fl BfT TE'T rs-c 698 f$"e t¿'[ 6¿"¿ E6'¿ 9S'g 6e't 89'[ ]!'F 9I
o", gÍ'[ 6I'[ w-v t7'7
E5'[ 6r'[ 9F'[ ig'E [q'e ¿s'fl s"fl g9-[ st'[ 9¿'E s8'E 96 e {t"F Fg'[ F¿'g ffir FI
E¡ YLL LIL trST
O-
oo r'¿T 9Í'(, Eg't F5'[ Er[ gF'e [5"¿ S!'¿ 85'[ W-[ [9'[ ¿.s'E ¡¿"¿ ¿¿.'[ t8'[ [6'C [S't Bg'[ ¡F'5 f 8'[ ¿9'F EI
A.¿ sE'u E5'e GFT ff"¿ rg't
avL ta',
vtL ¡9't t*'t 99'E#'E LL'z. 5¿'¿ S8'¿ (s-[ [6't B0.f II'5 gt't 6f's 68'6' !¿'F TI
3Z ]v'[ 9]"[ Ig'e sE'l ¿!'[ !9"[ 7l '7
LLL
Si 'Y
TL.L g¿E 6t'[ [S'e gsT 06"¿ gst I8-g 6S'[ Se'F s['5 6!'S 86'g ]8"f II
F!'C 6g'¿ $9't 99-t #¿'{ ¿{.'[ !8t 98-¿ 68"[ ¡6T F6"{ 8S'E eS'[ f
LU
{\'C
!
tY'r-
t I i 7F-f ÍF't sF'f {¡'g $Í'? 96'F NI
tu 1¿¿ 9L;7. s8'E 58"¿ 98-e F6'[ TS'E [8'[ ss't ¿$-5 0I'[ Ft't 8t:E 9Tt á¡'r ¿[-5 8t'f [9'g 98-t 9['t tx's 6
<, f6T ¿6'¿ es't w't 8$'[ E['[ ¿t'g f'.¿-[ 9t'[ $rf t5'[ rf-r Áf'r F9'5 0g-€ ss'E 69't F8-5 ¿*? gf't trs B
d a7'{
üL i
f3'cÉ
LL [5'tr Fg g er-l *'r- !s'5 5!'5 $'g ¿!'5 ffi't F9-[ Sg't L-J l Éí'r- J A-l; t x-l- $'s [t'] *"¿'? 6t't I
rd
¿g',t I¿'f -tL S LL T E8'5 ¿$'[ F6't $6'g ss-t Es'F
9S'[
f^-!
)r\, fr rit '!r
^f !$-F ¡[E 8e''' 6rF $'v 9¿ F üI't 66'9
Er ¿t v ¡F'F }F'F gF-F $i'F 9S'?' ¿9'F Fg'F 99'F 89'S $¿.'S' *:í'* I f'1r [8'F 88'F s6'F 5S S 6T'9 IF'g 6¿'5 n9'9
[9'! 99'5 ü¿-t r¿'5 5¿'E 00't 96'5 r$'! 6$'5 16'! r.6'S g$'t 80'9 FS-g ó09 9['9 9¿'9 6t'9 6t'9 F6'9 [¿'¿
t!'8 5E'8 8!'B 65-8 fl9'8 99'E $i'8 I¿.8 [¿'8 F¿'il gi'S 6¿'8 ;8'B sB'8 68'8 f.6'8 {$'6 '¿{6 8[.6 !i'6 5n'0f t
&! 6C 6F'68 a 9"'AT J +¡'J<?
$v-sÍ Et'úK ¡*'ar
r-t vt
?*'ÉF
L¡ u* ¿.?'6¡ Cü'6i üF'ú{ 8F'6{ c'Ár ai'Át
Bg'67 f tt-61 st'si fi'sE 9{ úr 80'6[ r!'si
t G I UlL V D.¡L s !t¿ F'(Fi
igf fgr B'iEt t'tqr l'na ? 't¡:- n i *:" Jt ff:, tÁ cb¡
o ttL \u''L 6'rtr 8'9[r 8't[f ['sF{ g'Fr[ I'Sir S'66t f']91
ffi ü0I {H úF 0f sE sI rI tI il II 0t 6 I A I S t r- [ I eu
.ropE¡€rurnu F ercd pElJsqll eF soFE¡$ :r ff
A
g\
ü r: Gradss de libertad para el numer¡dar A
tla l ? 3 -t 5 ú 1 8 9 1$ n l: 13 14 15 ?* 3+ dt) 50 1ü0 s
i I á 9l: Lrt 1 *+s l 9.16.t 9ó-i 3 9t8.6 9l].ú 9sr.l 9S.r.9 ggi ! ]{*} lñ!- -r¡¡t,
I ó.11.8 t99 s61 899 S 9.,S.' Yi: ú i ut_,s [LrLt ü i.U,-l -u: ü
_.4
añ -:1 1a ?1 aá1-- an-.ar t^ 11 1a a¿ É4 {1 1a ¡1 -n ¡i a d( 1^1 aa dñ in
_1ü__r ! -^¡ú
_r:t-Lfu .-1:t -.¡ ._tlJ___r ltr-_\tI _1y._!-- _1Jq-_1{.t J:l J i -ly-J-q ,1:r_r iJ ]Y .+ z. _1y -+ I -1t i_ -r:/.+-r _1:t.-(J -ay.+_l 3Y.1v
^ft
-1Y.+ ¡ -l'.+ü -1Y-+ir -r:/.J ú'
! a aa .,¡ñr
4¿¡t.4 j..*.U-¿
3 1t.4{ i6$4 1-- ¡4
:-¡-€
{i !^
--¡.tt/
Gt 6d
¡! üü t4l_; f4.61 i;_ _rd I +.+ _r
\l{-+-
r ¡1
-+_J.¡ 1.{.t8 }4.1¡ :4.i1 !4.S8 l+-lja .t _1.9'll I _1-)u-
:l ¡:.r:l 3$-Si c*a cÁ4 ct6 Y.-.U 5-U r s.-qs s.9+ s.s* s t9 n rr-
ü-J-r
ñ 11
ü-.'- s.6s s.6,6 s.i6 $.{5 s.fl s.38 s.-1: s t6
{0.$l s .{l r,.,9 .¡_-ry I l_l É *8 S.Si 6.ü á Jl ó il s,i9 6.16 6..*_1 6.-il 6.1._1 s ¡8 s.t-¿ 6.{ls 6 0l E
ó ssi "i)6 l] l]ü O
--r -r Y-+ i.st l.ts i6.8 jil i.4S :i.,t I i 1a
/
_¡ -_1 _r .-1_1 i.:r8 l.ll -\.1 I i.C'l i.8: .1.9,8 $.9': :r gI D
7 s.$r 6.i4 _i.g_c 5._11 i ]9 5.11 .r.99 .{,9* ,t.81 4.t6 .r tl + 6t $.6i .$.6$ '{.-Íl 4.41 S_16, +-_i : ^ ü
+_<
añ .! 1! a'!.,
^-
I I {t d.06 \-¡t
).+-
*-^i
-r-L¡J
¡ñ1
+-ü- .t.si .t.il +-+-1 +--i¡ ¡ 1¡
+--1 J {4 Á+
\ t .{ 14
+-:u +.i tl4
lu +-t_r . ¿^ ,
+-tI,J +.Lrd
^^
ót
J-ü:
+ 4 ñ¡
¡-ü+
1ó!
_:-ü-L
4:{
r-:i
1aa
_1 {J.r
-r-+rLf
¡^
f f -1
-
l0 69+ j 96 a Ol
- d-r
-t -4':r
+-+ ' .+1l
---- + u., -\-:l-r i.8-\ -i.ig 3.ll _i_66 J-tl- -1--1ü
j.-il 3.¡l ¡.¡l _1._;i i.t6 -i l: 1.15 3 0'3 5
ll 6.ll r.16 t.6,í 4.:S 4 *1 i 88 1.t6 _;.d5 3._59 3.i_¡ i.'{ l 1..t3 :i.39 _¡.J,6 t¡.3_i 5.t,1 3.tl r-'JD i.V:r r.E6 l.BS -¡+
tl i-i ¡6 t ,n -"{l .{11 lOg _1 _1_t - n 1l nü ., _t-_1_
I an
_1-, ü
14.
l.tt J i$ l $t 196
a
Y:
^4
a ñ-
!-ü J :.s$ I ti J(n
Ox
-- ;.;
_1 - ., _1-_1 -1--: -
I3 C+. -1 tj :-_r _) +_,.fu -l - r j '! f,.J _" :ü
: --1:J --r I
\ ai a 1A
_1.:._! -4,_u
+ *--
I :-,
a t1
:¡ :¡- 3.$S 3.Si l.ti l.${ r
-
to
.ro
a.i
I1 ..-
1 .Ál '1 .á:-1
-1 -r
l.gs I i¡:, l.s4 I li 1 .:Á a t3 ') !
l.t 6.i* 4.$6 .4.t4 i.s9 _t 6é
a
,a
*-^
_ru
-
_1,,1ó
-.ñ 1fA
-1-=.Y
- 1a
-1 - i -\- 1 -!
r ñ-'r
_l-tfi
1n.-_
_a-ú_r
^. ¡t,t
_r.iJ:
\ A1 1 É.¡
a 41
oo;J (!-AP
'u<w
t5 4a¡ _t-"! ¡ ¡ -:
;-;_t
1 nn
_r-Jü
- iñ
_i.+: -i.t,i
r ni
_1,-il
a t1
_-. l 1.86 _;
rJt t.8s :.86 : lú ?64 1 r_&
I S6 l..el a --\- 1 ¡a'
- +! ') -
I S9 I9_i lS'S lSl l.Sl : 19 l.6S l.:'l =.-; ;,-
L'-d + . _a _¡¡]
:t] --;.st {.á6 is6 -ii: _i19 ,i.:f j!_liJl a c: a Q' 1I tll f Á0 I Éi ].fi,s _: 5l I +5 I _i5 .l r'9 I 15 11: I n¡
'lo.{
iJr^r+
il -- ftl_1
_r ü
¿ .1
+-+- 1 ü_ _1_: ü
a lL-^
_r
a ar
-vY :.v . I St 1.8+ tti tés aÉ.r aá4 l.i6 I il l.¡l I il 1 1i a 1: 1l> <l¿ñr
-- f 4 . 1ñ s rñ
_a . ü
R J¡
_1 +:
: 11
_1-;-
1n-: 1^1 1Qt 144
ll+ l6r \A^ aiá :.i_1 I i$ t.-ig I ll )a )'. l.l I 1ña
-.ú>
a ¡-^
= uu
il6'ñ+
1 ,1.( ¡l
1l J- ¡ -r a-f-) _r-,_l _r-Jl -1 -D
_
-r_r-
^1
1 i.^
,-3.i 1ar
;,ü 1
141
:. .'J :.6: I5: I -il l.:i-¡ !-_,d
a1:ñ a+a
_ + l
1:4 1lj 1ñ
- ^ü
1 14
;-r- 1
ñ:
34
\- 11
_l t
-
¿ 11
l-_1_
111
_t-.'-
. -ñ
_\__1¿
- i--
l. 9:a l.Sl f :o
-.iü
't t4
:-JV :áJ I t;! = -l+ -
1--d l aar 1 fr \ tt a ?l 111
lii -l'L' .lt3 ,tÍ1ú_ i^.4
:-t+
-a)
f !-r
25 r.é9 é.19 J fly _1._i-1 _a.:-a
1 ir
-.J '
1n-:
__ü_) 1.i ltQ
r6i :ir 1 -i: 1 .lQ r...¡ a.ii f:'' 11Q '1 40
---'i-i r.Y-
?6 iÁd .l 1l _r tr., _i._a_1 _1 -Ü
a l.
-.j+
1ña
--ü- L :-i 1.6-i :i9 :i4 1 ¡l f .ia
:.¿l l.:3 l.16
:._rg 1 úñ
_ Liy
1¡--
_ u_,
¡
i ilv' I
r.üú
nÍ
{ 4: .{ 1.! - ¿i-
_a t-r,¡
. ^+
_r _1 1
_
- 4ñ
f l¡ r1 :.9t t.s8 1 :1 1c; l.ll I i ::
1 ll
- +l
1rl
: -19 t.i6 l:i l.:_i 1.f,r
i u.'
1na
; U'-r
.
^^
--)¿
a
i-ü-l
n^-
3fl -- <-
-1-_1,
t *ñ
+-iü
! 44
_1 _'v
- 1<
J--_'
- 4:
-1 üi l.$t t.l-i I {:; I -il '\ ii 1 ,{Á 1 t1
,-+ i
1r-
--_1.¡
1..*
--:'i
A_l
-.-rl
A1t
- -u
lrr-
-.U.. :. ri: !.91 ¿88 119
N
{ü i "t1 .+ !1-i
_r-+O _1 -_1 _ :'r
1 ':! r¡ a .Aa t -:1
_-_,_i
n ¡-:
- +_l I l? t._i:i 11C 1ai I l,: 1,.:s I Í11 '_.;!. i.ss :.s,i : ':r.r '!L .'U+
É _{
5fl ,r 1+ Jt,
.a 1A
-1 ,ly
a
_l_l.t_¡
^i
1ñ+
- D_1 I 5t t.55 n :4 a ?Q
l.ll -:16
111 a:Q I t+ 1.1: 1.19 :.Sl iar :1i !.Dtr i _)_1
7ü i tI i.89 _i-_ri.
1d-
:-:rr
a ---
j-.i_r 1 --1
-.-':
1 aa
^.+ |
'1 .-a!
* f ¡
1 an
-__au
11.1 f iQ 1r¿
: -!+
.1 :É
- ttr t.$* l.{Jl :,9i :.ls i.t¡ l.+r
g0 5.tt i s6 + 1ñ
-1.,ü
1ó<
¿-5-¡
a it
^ 1-r
a .-a
r--r I
1 (a-
--q-, ?._ri l.:$ r.t{ I iÉ i.i11r !
'1¡rl
-.u.f l.'J_; :.sú : ss :.r5 1.68 1.ói t__'_¡ i-nu
9ü i.t$ 1.8'{ l16 l.9l lr-j l._i5 :.'á-¡ a ---{ a aa 1.t9 Il.t .ldlo 1¡Í t.$l !.9$ á s6 1.1! -ü¡ :.o I I.ie x Li?
t.f 3 l.sl --vü t.fl* 1.9? 5.Si l.l: !.6=¿ :.59 !.s$
-r .l.l
lf0 i ts 3.t5 t.gl
_r.83 : l$ 1 i* 1 -*'! a ]'\ fro 1 \ {1á
-.Is 1.3i
s i $i -¡.69 i.il :.i9 I i; l4t tt9 ? t9 I ¡t t.s5 [ 99 i.95 1.9$ n.s? [.8,1 1.]] !.i.1 ¡.+5 i .qJ a ¡ñ i ¡+
- -r!ñ
{ ñn
¡ U!
l I J 4 5 6 ? I I l{} ll D 13 14 l5 20 3$ 40 50 l*0 ü
.{05t .1999 14$l _lc__l _l I Oj is-59 _*,913 59gi s8ll 68i6 6&8i 6tji 6t09 616? 61.$ I 63 r\i 6-i l4 6i
<t¡\A Áia; f!.!:
9S.JS 99.0ú 99.Íl 99.1i 99.i0 Yy -i-i )/9-_1s YH.-1 r YY--1Y :l:/.+v :rf -i L qg.,{j s.4i gs..{l 99..{t 99.dS 99.49 8ü5
Y-q.+¿ vt.1¿ yy.:{_1
3.1.il lS.Sl añ a{ an 1{
39..ró -ü J.if -ü.=+ tt.9t 1j.67 t?.49 ll.i5 2t.l-i:1.tr_¡ :l_*i :ó.9s t6.91 t6.s? 16.69 16.5$ t6.,Nr r.6..35 t6.14 16.t
l¡.Ls xs.0$ I6.69 35.9S ji.t: t_5.ii !+.98 I ¡ ir-
t4.8S t4.óú .¡+--rJ I I ¡a
¿+.iJ
i ¡ +a ! ¡ ^l
l"+__1 .r ¡.+._1 ! .:r*.jJ is.?$ t4.01 !3.3.1 i3.15 ii.ús 3_1.58 I
t { 1r- _1_
i6.r6 13.tt il.$6 Á!,i9 10.9t ts.ól !$.46 rs.39 ts.i6 !*.si 9.96 9.SS 9.Sr 9.?? 9.lt 9.J5 9.18 9.t9 9.t4 g.tJ B j
a1.15 9.5i 8.,t5 7.Si 1.46 i l:l g-Y! 6.$4 6.il 6.6] 6_i.1 6..á? 6.4i 6.-TS 6.3Á S.16 5.S j.gt j.S6 _i.t j i.6 p
11.]6 8.65 r'.ig t.*l 6.6_3 ó.-rt 6.1s 6.S3 i.91 i.s! i.l3 i.út 5.61 5.tó I.it 5._16 5.t$ 5.!] 5.+i .$.96 4 P
10.56 s.St ó.99 6.41 6.S.6 i.ss 5-sc 5..*t 5.35 _Í.fs i. f g i.$ ¡ 5.üi 5.s! "{.9{ 4.Str 4.65 á.57 ,1.51. 4.4I !+.J ¡
f s.&{ l.i6 6 j j 5.q9 5 64 5 l* i.ts ,t.7! ,6.ó1 4.6S 4.56 4.4n ,$.:5 a.{r'ttt {.¡¿
i.Sd 4.9,{ +.ü-¡
¡ rr- ¡ -a
+.,¡ I
.{tf .an!
*.u¡ ,1 !/t
9.6-Í l,:t 6 tl _5.61 _i.Jl i.sT s.39 's.14 d.6l '{.i'T 4.46 .*'ts 4.ij .1._:9 4.15 .é.:S ¡.94 3 S5 -1.8S i_11 zb
't 8: ,*.is 4.39 {-JV ,s.¡ó 4 i$ 4.$i .1.*1 i.86 3.lS 3.5? -1.11 l.4l J. a
9.1-i 6 9i 5.9i i..$t i.*6 +.f.t .4 ?fr .{ 1'l
+.¿L
olJ
9.8? 6.?S J.r4 5.tr 4.8d 4.{t) $,.*s .f._iü 4.{9 .{1 1{r ,{ lra 1.96 1.91 1.8ú -r.$l i.6ó 3.5n J.+-1 J.Jü a io - 1a
-1-- r _1 I
?.$8 {.gfi .* ri _1-0_t -1* _r_ _i t: t.gi I Sl f.¡-,r :.Si f.:jd :19 t._ri l ls 2.$3 $.9.* s.ss !.]i
t.i$ l{4
7.Si .{.9: .t.$l ifs 319 J
a ñt
-ü.¡
1^t
L.Y t t.78 l.6l :.i9 :.45 l.-¡$ l. j j 3.-3! r 15 i.9$ 4l-ó:iñn *.:..'5J
r.51
n¡ i 1A
r. ru x
6.!Í6 .4 8E 4_0"{ 5._i6 i.?6 :1.S4 l.Sl r..l.i l_.6.$ t.:,j l,{8 t.41 1.36 2..?: t.tt t.i: i.g.t i.S! 1:-9 C.6,\ il
693 4S1 40i -\-,\t -)-;-r -i $: "t.s4 r.il I éi 1 i'l !_-,
a .{i I 39 l.i3 l 19 1a.* 1né to') t.st 3 t6 1.61. 7a
!,4_ ia il-
I ll i -j: l.f¡- r rl 1..$l i s9 t 8l 1.;-i t.ó.$ I -J-t
't Or
l0{ 6.9* 4.8: 3.98 _!_J: J -¡ 1d-t
i.tY
1 ña
:-ü- r:.69 I i9 1 .:fr -t: ür
ú 64 4.é¡ i.¡-$ -_1- -Ui_r _a
f Q¡. a Á.{ r.ji :.41 t._it. l.li r.t9 rfi t.$s t.{4 tss i70 I )g I 5i 1.3é I
456 ' Tablas Estadísticas
f
f;
tr
i
*
459
n2 z 3 4 s 6 7 8 e r0 li 12 13 t4 ls 16 t7 i8 le z0
2 00 00001111222223333
J 00 01223344556611889
4 00 | 2 3 4 5 5 6 7 8 9 10 11 t2 12 13 14 15
01 2 3 4 6 7 8 9 10 12 13 14 ls 16 r8 19 20 21
6 02 3 4 6 1 9 ll 12 14 15 11 18 20 22 23 25 26 28
7 02 4 6 I 9 ll 13 15 11 19 21 23 25 21 29 31 33 35
8 t3 5 7 9 11 t4 16 18 20 23 25 21 30 32 35 31 39 42
9 l3 5 8 11 13 16 18 2t 24 27 29 32 35 38 40 43 46 49
t0 l4 6 9 12 15 18 2t 24"21 30 34 31 4A $ 46 49 53 s6
ll l4 1 10 14 l7 20 24 21 31 34 38 41 45 48 52 56 59 63
t2 25 8 12 15 19 23 27 30 34 38 42 46 50 54 58 62 66 10
l3 25 9 13 lt 21 25 29 34 38 42 46 51 55 60 64 68 73 17
t4 26 l0 14 18 23 27 32 37 4t 46 sl s6 60 6s 10 ]s 19 84
l5 26 ll 15 20 25 30 3s 40 45 50 55 60 65 7l ',76 Bl 86 91
l6 27 12 16 22 21 32 38 43 48 54 60 65 11 13 82 87 93 99
\7 31 12 18 23 29 35 40 46 52 58 64 10 16 82 88 94 100 06 1
5 9 14 t9 24 29 34 39 45 50 s6 61 67 12 78 83 89 94
.:
t7 I
I
18 I 5 l0 15 20 25 31 37 42 48 54 60 66 71 77 83 89 95 101 rl
l9 2 5 l0 16 21 27 33 39 45 51 51 64 70 16 83 89 95 102 108 f
20 2 6 ll 17 23 29 35 41 48 54 6t 68 t4 81 88 94 101 108 115
ü
&
:j,