Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Libro de Estadistica PDF
Libro de Estadistica PDF
STADISTICAAP
A LA ADMIIMIST
Y A LA EC
".
^"
" v
Leonard J. Kazmier
Tercera edicin
. -"
- /, v , .
17' ."'7-.,-'
-'*"
^i-
SDE:
'
,
Intermedio
Avanzado
^
L*
ESTADSTICA APLICADA
A LA ADMINISTRACIN
Y A LA ECONOMA
>.,
..
,.
. -
.!
ESTADSTICA APLICADA
A LA ADMINISTRACIN
Y A LA ECONOMA
Tercera edicin
Leonard J. Kazmier
Profesor of Decisin and Information Systems
Arizona State University
Revisin Tcnica
ALEJANDRO ALEGRA HERNNDEZ
Maestro en Estadstica
IIMAS, UNAM
Profesor Titular
Departamento de Estadstica
McGRAW-HILL
MXICO * BUENOS AIRES * CARACAS * GUATEMALA * LISBOA MADRID
NUEVA YORK * SAN JUAN SANTAFE DE BOGOT SANTIAGO SAO PAULO
AUCKLAND LONDRES MILN MONTREAL NUEVA DELHI
SAN FRANCISCO SINGAPUR ST. LOUIS SIDNEY TORONJO
0876543219
impreso en Mxico
Printed in Mxico
Prefacio
Este libro cubre los mtodos bsicos de descripcin estadstica, inferencia, control de procesos y anlisis de
decisin que suelen incluirse en cursos introductorios e intermedios.
Los conceptos y mtodos estadsticos se presentan en forma clara y concisa, y las explicaciones se han
reducido al mnimo en favor de la exposicin de ejemplos concretos. Dado que este libro est especficamente
dirigido a quienes se interesan en particular en la aplicacin de tcnicas estadsticas, se han omitido derivaciones
matemticas.
Esta edicin ha sido completamente puesta al da y entre sus novedades incluye un amplio tratamiento del
control estadstico de procesos en el captulo 20 y una introduccin al concepto, an ms general, de la administracin de calidad total (ACT). Todos los resultados en computadora de esta edicin se derivaron haciendo uso de
computadoras personales, no de macrocomputadoras. El contenido de esta nueva edicin ha mejorado en virtud
del software disponible en la actualidad, gracias al cual fue posible perfeccionar en particular la presentacin y
explicacin de los mtodos de pronstico en el captulo 16.
Este volumen sirve de apoyo para la comprensin de libros ms complejos; como manual de referencia para
este propsito, su uso es ms sencillo que el de muchos otros libros de texto. Asimismo, su contenido basta para
que se le emplee como libro de enseanza. Los temas se han agrupado en consonancia con la mayora de los
libros de texto de estadstica aplicada a la administracin y la economa.
Agradezco a Minitab, Inc., la autorizacin para incorporar en este libro resultados de Minitab versin 10 y a
Duxbury Press la autorizacin para emplear resultados de Execustat 3.0. Aunque estos programas de software
estadstico fueron creados para interfaces de Windows, siempre que nos fue posible usamos versiones con comandos para ilustrar la lgica del software. MINITAB es marca registrada de Minitab, Inc. (3081 Enterprise
Drive, State College, Pensilvania 16801-3008, Estados Unidos; Tel. 814-238-3280, fax 814-238-4383).
EXECUSTAT es marca registrada de Strategy Plus, Inc., y es distribuido por Duxbury Press, sello de la Wadsworth
Publishing Company (10 Davis Drive, Belmont, California 94002, Estados Unidos, Tel. 1-800-354-9706). Si
bien no se les us en este libro, tambin las versiones vigentes de los programas de hoja de clculo EXCEL
(copyright Microsoft, Inc.) y LOTUS 1-2-3 (copyright Lotus Development Corporation) incluyen rutinas de
anlisis estadstico.
Finalmente, agradezco al Longman Group UK Ltd., en nombre del ejecutor testamentario del desaparecido
Sir Ronald A. Fisher, F.R.S., y al doctor Frank Yates, F.R.S, la autorizacin para adaptar y reproducir las tablas III
y IV de su libro Statistical Tablesfor Biolgica!, Agricultura!, and Medica! Research, 6a. edicin (1974).
LEONARD J, KAZMIER
Al estudiante
Este libro se escribi con la intencin de eliminar cualquier clase de palabrera y fijar la atencin en los
conceptos y tcnicas bsicos asociados con la aplicacin de mtodos estadsticos a la administracin y la economa. Por lo tanto, puede servirle para dos propsitos diferentes.
Primero, puede servirle como excelente complemento de cursos de estadstica aplicada a la economa. Organizacin de temas y formulaciones se han seleccionado para que correspondan a las de los principales libros de
texto de la materia. De igual modo, los resultados en computadora son representativos del tipo de resultados que
se obtienen con casi cualquier paquete de software. Puede leer los captulos de este libro antes o despus de los
captulos equivalentes de su libro de texto, ya sea para adquirir una visin general del tema o para repasar los
temas ms importantes. Los numerosos ejemplos y problemas resueltos favorecern su comprensin del contenido y le servirn de modelo para la resolucin en casa de problemas de su libro de texto.
Segundo, descubrir que este volumen es un excelente libro de referencia que podr seguir utilizando en el
futuro. El desarrollo modular de los temas facilita la bsqueda de procedimientos en un grado mayor al ofrecido
por muchos otros libros de texto, al tiempo que el contenido es ms amplio que el de la mayora de los textos
introductorios. De cualquier forma, este libro tambin puede ser adoptado como texto de clase.
Contenido
Captulo 1
1
1
1
2
2
2
3
4
*
-
Captulo 2
9
9
10
11
12
13
14
14
15
15
16
17
18
Captulo 3
Captulo 4
4.2
Rango
39
39
39
39
40
40
41
41
42
42
43
43
51
51
51
CONTENIDO
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
Captulo 5
Captulo 6
Captulo 7
Rangos modificados
Diagramas de caja
Desviacin media absoluta (DMA)
Varianza y desviacin estndar
Clculos simplificados de la varianza y la desviacin estndar
Criterio matemtico asociado con la varianza y la desviacin estndar .
Uso de la desviacin estndar en la descripcin de datos
Uso del rango y la desviacin estndar en el control estadstico
de procesos
Coeficiente de variacin
Coeficiente de asimetra de Pearson
Resultados en computadora
PROBABILIDAD
5.1
Definiciones bsicas de probabilidad
5.2
Expresin de la probabilidad
5.3
Eventos mutuamente excluyentes y no excluyentes
5.4
Reglas de la adicin
5.5
Eventos independientes, eventos dependientes y probabilidad
condicional
5.6
Reglas de la multiplicacin
5.7
Teorema de Bayes
5.8
Tablas de probabilidades conjuntas
5.9
Permutaciones
5.10 Combinaciones
51
52
53
53
54
55
56
56
57
58
58
68
68
69
70
70
71
72
74
75
76
77
94
94
94
96
97
98
99
100
101
114
114
114
117
118
119
120
121
CONTENIDO
Captulo 8
Captulo 9
Captulo 10
133
133
133
134
135
136
137
138
139
140
140
150
150
151
152
152
153
154
155
163
163
163
164
167
169
170
171
172
172
173
xn
T T
Captulo 11
Captulo 12
Captulo 13
Captulo 14
CONTENIDO
186
186
1
188
190
191
191
192
193
193
194
195
195
LAPRUEBA JI CUADRADA
12.1 Propsito general de la prueba ji cuadrada
12.2 Pruebas de bondad de ajuste
12.3 Prueba de independencia de dos variables categricas (prueba
con tabla de contingencias)
12.4 Pruebas de hiptesis referentes a proporciones
12.5 Resultados en computadora
206
206
206
ANLISIS DE VARIANZA
13.1 Razonamiento bsico asociado con la prueba de las diferencias entre
varias medias poblacionales
13.2 Diseo completamente aleatorizado de un factor (ANOVA con un
criterio de clasificacin)
13.3 Anlisis de varianza con dos criterios de clasificacin (ANOVA
con dos criterios de clasificacin)
13.4 Diseo aleatorizado en bloques (ANOVA con dos criterios
de clasificacin, una observacin por celda)
13.5 Diseo completamente aleatorizado de dos factores (ANOVA
con dos criterios de clasificacin, n observaciones por celda)
13.6 Consideraciones adicionales
13.7 Aplicaciones de cmputo
228
248
208
210
213
228
229
230
230
231
232
233
248
248
CONTENIDO
14.3
14.4
14.5
14.6
14.7
14.8
<* 14.9
14.10
14.11
14.12
14.13
14.14
14.15
** *
X
249
250
250
251
251
252
252
253
254
255
255
256
256
Captulo 15
Captulo 16
Captulo 17
268
268
268
269
270
270
272
272
273
273
282
282
283
284
284
285
285
286
287
287
288
289
304
304
304
304
CONTENIDO
XIV
17.4
17.5
17.6
17.7
17.8
17.9
17.10
17.11
Captulo 18
Relativos eslabonados
Cambio del periodo base
Fusin de dos series de nmeros ndice
El ndice de precios al consumidor (IPC)
Poder de compra y deflacin de los valores de series de tiempo
ndice de precios al productor (IPP)
Los promedios de precios burstiles de Dow Jones
ndice de produccin industrial
305
305
305
306
306
306
306
307
315
315
316
317
319
320
321
Captulo 19
335
335
336
337
339
342
344
Captulo 20
352
352
352
353
354
355
356
357
358
359
Captulo 21
ESTADSTICA NO PARAMTRICA
21.1 Escalas de medicin
21.2 Mtodos estadsticos paramtricos contra no paramtricos
21.3 Prueba de corridas para aleatoriedad
21.4 Una muestra: prueba de los signos
21.5 Una muestra: prueba de Wilcoxon
372
372
372
373
373
374
CONTENIDO
21.6
21.7
21.8
21.9
xv
374
375
376
376
Apndice 1
387
Apndice 2
PROBABILIDADES BINOMIALES
388
Apndice 3
VALORES DE e~K
391
Apndice 4
PROBABILIDADES DE POISSON
392
Apndice 5
396
Apndice 6
397
Apndice 7
398
Apndice 8
399
Apndice 9
402
Apndice 10
403
Apndice 11
405
NDICE
411
Captulo 1
Anlisis de datos econmicos y administrativos
1.1
La estadstica es el conjunto de tcnicas que se emplean para la recoleccin, organizacin, anlisis e interpretacin de datos. Los datos pueden ser cuantitativos, con valores expresados numricamente, o cualitativos, en
cuyo caso se tabulan las caractersticas de las observaciones. La estadstica sirve en administracin y economa
para tornar mejores decisiones a partir de la comprensin de las fuentes de variacin y de la deteccin de patrones
y relaciones en datos econmicos y administrativos.
1.2
La estadstica descriptiva comprende las tcnicas que se emplean para resumir y describir datos numricos.
Estos mtodos pueden ser grficos o implicar anlisis computacional (vanse captulos 2, 3 y 4).
EJEMPLO 1. El volumen mensual de ventas de un producto durante el ao anterior puede describirse y cobrar significado elaborando un diagrama de barras o una grfica de lneas (tal como se les describe en la seccin 2.11). Las ventas relativas
por mes pueden resaltarse calculando un nmero ndice para cada mes, con lo que la desviacin respecto de 100 de cualquier
mes indicara la desviacin porcentual de ventas de ese mes en comparacin con las ventas mensuales promedio durante todo
el ao.
La estadstica inferencial comprende las tcnicas con las que, con base nicamente en una muestra sometida
a observacin, se toman decisiones sobre una poblacin o proceso estadsticos. Dado que estas decisiones se
toman en condiciones de incertidumbre, suponen el uso de conceptos de probabilidad. Mientras que a las caractersticas medidas de una muestra se les llama estadsticas mustrales, a las caractersticas medidas de una poblacin estadstica, o universo, se les \\amaparametros de la poblacin. El procedimiento para la medicin de las
caractersticas de todos los miembros de una poblacin definida se llama censo. Cuando la inferencia estadstica
se usa en el control de procesos, al muestreo le interesa en particular el descubrimiento y control de las fuentes de
variacin en la calidad de la produccin. Los captulos 5 a 7 se ocupan de conceptos de probabilidad, y la mayora
de los captulos posteriores de la aplicacin de esos conceptos a la inferencia estadstica. El captulo 20 se dedica
exclusivamente al control estadstico de procesos.
EJEMPLO 2. Para estimar el voltaje requerido para provocar fallas en un dispositivo elctrico, una muestra de estos
dispositivos puede someterse a voltajes crecientes hasta que falle cada uno de ellos. Con base en estos resultados mustrales
puede estimarse la probabilidad de falla a varios niveles de voltaje de los dems dispositivos de la poblacin muestreada.
Los mtodos de la estadstica clsica fueron desarrollados para el anlisis de datos muestreados (objetivos),
as como para propsitos de inferencia sobre la poblacin de la que se seleccion la muestra. Esto representa la
exclusin explcita de juicios personales sobre los datos y el supuesto implcito de que el muestreo procede de
una poblacin esttica (estable). Los mtodos del anlisis de decisin se concentran en la incorporacin al anlisis estadstico de juicios administrativos (vanse captulos 18 y 19). Los mtodos del control estadstico de
procesos se emplean sobre la premisa de que el producto de un proceso puede no ser estable. Ms bien, el proceso
puede ser dinmico, con causas atribuibles asociadas con la variacin de la calidad del producto en
el tiempo
[CAP. 1
EJEMPLO 3. Empleando el enfoque clsico de la inferencia estadstica, el incierto nivel de ventas de un nuevo producto
se estimara con base en estudios de mercado realizados en consonancia con los requerimientos del muestreo cientfico. En el
enfoque de anlisis de decisin, los juicios de los administradores se cuantificaran e incorporaran al anlisis. El control
estadstico de procesos se centrara en particular en el patrn de ventas en una secuencia de periodos temporales durante la
comercializacin de prueba del producto.
1.4
Una variable discreta puede tomar valores observados nicamente en puntos aislados a lo largo de una
escala de valores. En la estadstica aplicada a administracin y economa, estos datos ocurren usualmente por
medio del proceso de conteos de ah que por lo general los valores se expresen como nmeros enteros. Una
variable continua puede adoptar un valor en cualquier punto fraccionario a lo largo de un intervalo especificado
de valores. Los datos continuos se generan mediante el proceso de medicin.
EJEMPLO 4. Son ejemplos de datos discretos el nmero de personas por hogar, las unidades de un artculo en inventario
y el nmero de componentes ensamblados descubiertos como defectuosos. Son ejemplos de datos continuos el peso de un
embarque, el tiempo transcurrido antes de la primera falla de un aparato y el nmero promedio de personas por hogar en una
comunidad extensa. Ntese que un nmero promedio de personas puede ser un valor fraccionario, y ser por lo tanto una
variable continua a pesar de que el nmero por hogar sea una variable discreta.
1.5
Uno de los medios para la obtencin de datos es la observacin directa. sta es la base de las acciones que se
emprenden en el control estadstico de procesos, en el cual se evalan sistemticamente muestras de produccin.
Otra forma de observacin directa es el experimento estadstico, en el que se ejerce un control deliberado de
algunos o todos los factores que pueden influir en la variable bajo estudio a fin de identificar posibles causas.
.
EJEMPLO 5. Dos mtodos de ensamble de un componente podran compararse haciendo que un grupo de empleados
aplicara uno de los mtodos y un segundo grupo el otro. Los miembros del primer grupo deben coincidir estrechamente con
los miembros del segundo en trminos de factores como edad y experiencia.
En algunas situaciones no es posible recolectar datos directamente; la informacin debe obtenerse en fuentes individuales. Una encuesta estadstica es el proceso de recoleccin de datos mediante la solicitacin de stos
a individuos. Los datos pueden obtenerse con mtodos como entrevistas personales, entrevistas telefnicas o
cuestionarios por escrito.
EJEMPLO 6. Un analista de un departamento estatal de Seguridad Econmica puede verse precisado a determinar los
incrementos o decrementos en el nivel de empleo planeados por las empresas de la entidad. Un mtodo estndar para la
obtencin de esos datos es la realizacin de una encuesta entre las empresas involucradas.
El muestreo aleatorio es un tipo de muestreo en el que todos los elementos de la poblacin de inters, o
poblacin objetivo, tienen una oportunidad conocida, usualmente igual, de ser elegidos para su inclusin en la
muestra. Disponer de esta muestra garantiza que sus integrantes sean seleccionados sin sesgos de ninguna especie y ofrece la base estadstica para determinar la confianza que puede asociarse con las inferencias (vanse
captulos 8 y 9). A una muestra aleatoria tambin se le denomina muestraprobabilstica o muestra cientfica. Los
cuatro mtodos principales de muestreo aleatorio son los mtodos de muestreo simple, sistemtico, estratificado
y por conglomerados.
Una muestra aleatoria simple es aquella cuyos elementos se seleccionan individualmente de la poblacin
objetivo entera con base en el azar. Esta seleccin al azar es semejante a la extraccin aleatoria de nmeros en un
sorteo. Sin embargo, en el muestreo estadstico suele emplearse una tabla de nmeros aleatorios o un programa
CAP. 1]
de cmputo generador de nmeros aleatorios para identificar los elementos numerados de la poblacin que
sern seleccionados para la muestra.
EJEMPLO 7. El apndice 1 es una tabla abreviada de nmeros aleatorios. Supongamos que nos interesa tomar una
muestra aleatoria simple de 10 cuentas por cobrar de una poblacin de 90 cuentas de este tipo, numeradas del 01 al 90.
Consultaramos "a ciegas" la tabla de nmeros aleatorios, cerrando literalmente los ojos y sealando un punto de partida.
Despus leeramos los dgitos en grupos de dos en cualquier direccin para elegir las cuentas de nuestra muestra. Supongamos que empezamos a leer nmeros (en pares) a partir del que se encuentra en la lnea 6, columna 1. Los 10 nmeros de
cuentas para la muestra seran 66, 06, 59, 94, 78, 70, 08, 67, 12 y 65. Pero como slo hay 90 cuentas, no podemos incluir el
nmero 94. Incluimos entonces en la muestra el nmero siguiente (11). S alguno de los nmeros seleccionados se repitiera,
lo incluiremos en la muestra slo una vez.
Una muestra sistemtica es una muestra aleatoria cuyos elementos se seleccionan de la poblacin a un
intervalo uniforme en una lista ordenada, como sera el caso de la eleccin de cada dcima cuenta por cobrar para
la muestra. La primera de las 10 cuentas por incluir en la muestra se elegira al azar (consultando quiz una tabla
de nmeros aleatorios). Una preocupacin particular del muestreo sistemtico es la existencia de factores peridicos, o cclicos, en el listado de la poblacin que pudiera dar lugar a un error sistemtico en los resultados
mustrales.
EJEMPLO 8. Si en una comunidad, donde cada decimosegunda casa ocupa una esquina se realizara un estudio para
efectos de una adecuada iluminacin pblica, una muestra sistemtica incluira un sesgo sistemtico si en la encuesta se
incluyera cada decimosegundo hogar. En este caso, todos o ninguno de los hogares encuestados se hallara en una esquina.
i
En el muestreo estratificado los elementos de la poblacin son primeramente clasificados por el investigador
en distintos subgrupos, o estratos, sobre la base de una o ms caractersticas importantes. Despus, de cada
estrato se toma por separado una muestra aleatoria simple o sistemtica. Este plan de muestreo puede servir para
garantizar la representacin proporcional en la muestra de varios subgrupos de la poblacin. Adems, el tamao
de muestra requerido para alcanzar un nivel dado de precisin suele ser menor que en el caso del muestreo
aleatorio simple, lo que
reduce los costos del muestreo.
~
EJEMPLO 9. En un estudio sobre las actitudes de los estudiantes respecto de habitar en e! campus, tendramos razones
para creer en la posible existencia de diferencias importantes entre estudiantes an no graduados y graduados y entre estudiantes de gnero masculino y femenino. As, debera considerarse un plan de muestreo estratificado para la toma por separado de una muestra aleatoria simple de los cuatro estratos: hombres no graduados, mujeres no graduadas, hombres graduados
y mujeres graduadas.
El muestreo por conglomerados es un tipo de muestreo aleatorio en el que los elementos de la poblacin
ocurren naturalmente en subgrupos. As pues, se muestrean aleatoriamente subgrupos, o conglomerados, enteros.
EJEMPLO 10. Si un analista de un departamento estatal de Seguridad Econmica debe estudiar los ndices salariales por
hora que se pagan en un rea metropolitana, sera difcil obtener un listado de todos los receptores de salarios en la poblacin
objetivo. En cambio, podra obtenerse ms fcilmente una lista de las empresas de esa zona. De este modo, el analista podra
tomar una muestra aleatoria simple de las empresas identificadas, las cuales representan conglomerados de empleados, y
obtener los ndices salariales que se pagan a los empleados de estas compaas.
1.7
Aunque es posible que una muestra no aleatoria resultara ser representativa de la poblacin, es difcil suponer de antemano que carecer de sesgos o expresar estadsticamente la confianza que podra asociarse con las
inferencias a partir de esa muestra.
Una muestra de juicio es aquella en la que un individuo selecciona los elementos por incluir en la muestra.
El grado de representatividad de la poblacin de esta muestra depende as del juicio de tal individuo y no puede
evaluarse estadsticamente.
[CAP. 1
EJEMPLO 11. En lugar de elegir aleatoriamente las partidas por auditar, un contador las selecciona para una auditora
muestral con base en el juicio de que es probable que esos tipos particulares de partidas sean representativos de las partidas en
general. No hay manera de evaluar estadsticamente la probabilidad de sesgo en esa muestra o el grado en que los resultados
mustrales se aproximan a la poblacin.
Una muestra por conveniencia incluye las medidas, u observaciones, a las que se tiene acceso ms fcilmente, tal como su nombre lo sugiere.
EJEMPLO 12. Una oficina de desarrollo comunitario emprende un estudio de la actitud pblica frente a una nueva plaza
comercial cntrica mediante la realizacin de una encuesta de opinin en una de las entradas de la plaza. Ciertamente es
improbable que los resultados de la encuesta reflejen la actitud de las personas que no se encuentran en la plaza; de aquellas
que, encontrndose en la plaza, decidan no participar en la encuesta, y de aquellas otras que se encuentran en secciones de la
plaza no consideradas en el muestreo.
Una muestra aleatoria estricta no suele ser factible en el control estadstico de procesos, ya que slo es
posible inspeccionar con relativa facilidad los artculos o transacciones ms a la mano. Para poder advertir cambios que estn teniendo lugar en la calidad del producto en proceso, se toman muestras pequeas a intervalos
regulares de tiempo. A este esquema de muestreo se le conoce como mtodo de subgrupos racionales. Estos
datos mustrales son tratados como si en cada punto temporal se hubieran tomado muestras aleatorias, en el
entendido de que hay que estar alertas a cualesquiera razones conocidas de que este esquema de muestreo conduzca a resultados sesgados.
EJEMPLO 13. Grupos de cuatro paquetes de papas fritas son muestreados y pesados a intervalos regulares de tiempo en
un proceso de empacamiento para determinar el cumplimiento de las especificaciones de peso mnimo. Estos subgrupos
racionales ofrecen la base estadstica para determinar si el proceso es estable y est bajo control o si existe una variacin
inusual en la secuencia de pesos mustrales que obligue a la identificacin y correccin de una causa atribuible.
Problemas resueltos
ESTADSTICA DESCRIPTIVA E INFERENCIAL
1.1
Indique cules de los siguientes trminos u operaciones se refieren a una muestra o muestreo (M) y
cules a una poblacin (P): d) medidas grupales llamadas parmetros^ b) uso de estadstica inferencia!, c)
realizar un censo, d) juicio sobre la calidad de un embarque de fruta recin recibido mediante la inspeccin de varios de los huacales del gran nmero de ellos incluidos en el embarque.
y
a) P, b) M, c) P, d) M
1.2
Indique cules de los siguientes tipos de informacin podran usarse ms fcilmente en inferencia estadstica clsica (IC), anlisis de decisin (AD) o control estadstico de procesos (CP): a) juicios administrativos sobre el probable nivel de ventas de un nuevo producto, b) adscripcin de cada quincuagsimo
automvil ensamblado a una exhaustiva evaluacin de calidad, c) resultados de una encuesta para una
CAP. 1 ]
muestra aleatoria simple de personas que compraron un modelo especfico de automvil, d) verificacin
de los saldos de cuentas en un banco para una muestra aleatoria sistemtica de cuentas.
f)AD, 6) CP, c) IC, ) IC
1.3
En los siguientes tipos de valores, designe variables discretas (D) y variables continuas (C): a) peso del
contenido de un paquete de cereal, b) dimetro de un cojinete, c) nmero de artculos defectuosos producidos, d) nmero de individuos en un rea geogrfica que reciben beneficios de desempleo, e) nmero
promedio de clientes prospectivos contactados por representante de ventas durante el mes anterior, J)
monto de ventas en dlares.
a} C, b) C, c] D, d) D, e) C,/) D. (Nota: Aunque los montos monetarios son discretos, cuando son grandes en relacin
con las unidades de cienes discretas por lo general se les trata como datos continuos.)
1.4
Indique cules de los siguientes procedimientos de recoleccin de datos seran considerados como un
experimento (E) y cules como una encuesta (EN): a) un sondeo poltico de intenciones de voto individuales en elecciones prximas, b) clientes de un centro comercial entrevistados acerca del motivo de que
hagan sus compras ah, c) comparacin de dos mtodos para la comercializacin de una pliza anual
mediante la aplicacin de cada mtodo en reas geogrficas comparables.
a) EN, b) EN, c) E
1.5
En el rea de las mediciones estadsticas, como las representadas por cuestionarios, la confiabilidad se
refiere a la consistencia del instrumento de medicin y la validez a su precisin. As, si un cuestionario
ofrece resultados similares tras ser contestado por dos grupos equivalentes de informantes, puede
describrsele como confiable. El hecho de que un instrumento sea confiable garantiza por lo tanto que
sea vlido?
La confiabilidad de un instrumento de medicin no garantiza que sea vlido para un propsito particular. Un
instrumento confiable es consistente en las mediciones repetidas producidas, pero todas las mediciones podran
incluir un componente de error, o sesgo, comn. (Vase el siguiente problema resuelto.)
1.6
Remtase al problema resuelto 1.5. Un instrumento de encuesta no confiable puede tener validez para un
propsito particular?
Un instrumento no confiable no puede ser vlido para ningn propsito particular. En ausencia de confiabilidad,
no habr consistencia en los resultados que se obtengan. Una analoga con un tiro de rifle puede ilustrar este concepto. Orificios de balas estrechamente aglomerados en un blanco seran indicativos de la confiabilidad (consistencia)
de los disparos del rifle. En este caso, la validez (precisin) podra mejorar ajustando la mira para que los orificios de
las balas coincidan subsecuentemente en el centro del blanco. En cambio, orificios de balas ampliamente dispersos
indicaran falta de confiabilidad, condicin en la cual ningn ajuste en la mira podra producir un puntaje alto.
1.7
Para efectos de inferencia estadstica, es de desear una muestra representativa. Sin embargo, los mtodos
de inferencia estadstica slo requieren la obtencin de una muestra aleatoria. Por qu?
Ningn mtodo de muestreo puede garantizar una muestra representativa. Lo ms que podemos hacer es evitar
sesgos consistentes o sistemticos mediante el empleo del muestreo aleatorio (probabilstico). Aunque es raro que
[CAP. 1
una muestra aleatoria sea exactamente representativa de la poblacin objetivo de la que se le obtuvo, el uso de este
procedimiento garantiza que nicamente factores debidos al azar explicaran las diferencias entre la muestra y la
poblacin.
1.8
Una compaa petrolera desea determinar los factores que influyen en la eleccin de gasolineras por
parte de los consumidores en un rea de prueba, motivo por el cual ha obtenido tanto nombres y direcciones como la informacin personal disponible de todos los propietarios de automviles registrados residentes en esa rea. Describa cmo podra obtenerse una muestra de esta lista usando cada uno de los
cuatro mtodos de muestreo aleatorio mencionados en este captulo.
Para una muestra aleatoria simple, los nombres enlistados podran numerarse secuencialmente, y despus podran seleccionarse los individuos por ser muestreados empleando una tabla de nmeros aleatorios. Para una muestra
sistemtica, podra contactarse a cada ensima (cada quinta, por ejemplo) persona de la lista, empezando aleatoriamente
entre los primeros cinco nombres. Para una muestra estratificada, podemos clasificar a los propietarios de acuerdo
con el tipo de automvil, el valor del auto, sexo o edad para tomar despus una muestra aleatoria simple o sistemtica
de cada estrato definido. Para una muestra por conglomerados, podramos optar por entrevistar a todos los propietarios de autos registrados residentes en cuadras aleatoriamente seleccionadas del rea de prueba. Dado que la base de
este tipo de muestra por conglomerados sera geogrfica, tambin podramos llamarla muestra de rea.
1.9
Indique cules de los siguientes tipos de muestras ejemplifican mejor o estn relacionadas con una muestra de juicio (J), una muestra por conveniencia (A) o con el mtodo de subgrupos racionales (R): a)
muestras de cinco focos cada una se toman cada 20 minutos en un proceso de produccin para determinar
su resistencia al alto voltaje, b) una compaa fabricante de bebidas evala la respuesta de los consumidores al sabor de una nueva cerveza sin contenido alcohlico mediante pruebas de preferencia en bares
ubicados en la misma ciudad en la que se encuentran las oficinas generales, c) un investigador de opinin
al servicio de un candidato poltico conversa con personas de varias localidades del distrito con base en la
apreciacin de que tales individuos parecen representativos de los votantes del distrito.
1.10
Un analista econmico gubernamental desea obtener una muestra aleatoria simple de 30 empresas comerciales de una lista de 435 de cierta regin geogrfica. Las empresas son identificadas con nmeros
secuenciales de identificacin del 001 al 435. Use el software de cmputo a su disposicin para obtener
los 30 nmeros de identificacin de las empresas por incluir en el estudio.
En la figura 1-1 aparecen los comandos de software de Minitab y los nmeros de identificacin resultantes de
las 30 empresas para la muestra aleatoria. Si, por azar, cualquiera de estos nmeros hubiera ocurrido ms de una vez,
habran tenido que obtenerse nmeros adicionales para sustituir esos duplicados a- fin de identificar una muestra de
30 compaas diferentes.
MTB
SUBC
MTB
MTB
>
>
>
>
SAMPLE
350
228
288
MTB
234
177
389
313
176
320
125
116
290
240
272
47
120
176
102
251
96
40
> STOP
409
310
12
271
179
33
134
166
52
CAP. 1]
Problemas complementarios
ESTADSTICA DESCRIPTIVA E INFERENCIAL
1.11
Indique cules de los siguientes trminos u operaciones se refieren a una muestra o muestreo (M) y cules a una
poblacin (P): a) universo, b) medidas grupales llamadas estadsticas, c) aplicacin de conceptos de probabilidad, d)
inspeccin de cada artculo ensamblado, e) inspeccin de cada dcimo artculo ensamblado.
Resp.
a} P, b) M, c) M, d) P, e) M
1.12
Indique cules de los siguientes tipos de informacin podran usarse ms fcilmente en inferencia estadstica clsica
(IC), anlisis de decisin (AD) o control estadstico de procesos (CP): a) respuestas a un cuestionario obtenidas de
una muestra de miembros activos de una organizacin profesional, b) calificaciones de consumidores sobre un departamento de servicios automovilsticos recolectadas mensualmente, c) clasificaciones de analistas de inversin de
"compaas nuevas y emergentes", d) datos de salarios y sueldos recolectados de una muestra de empleadores en un
rea metropolitana.
Resp.
En los siguientes tipos de valores, designe variables discretas (D) y variables continuas (C): a) nmero de unidades de
un artculo en existencia, b) razn de activos circulantes contra pasivos circulantes, c) tonelaje total embarcado, d)
cantidad embarcada, en unidades, e) volumen de trfico en una carretera de paga,y) asistencia a la asamblea anual de
una compaa.
Resp.
a) D, b) C, c) C, d) D, e) D,J) D
1.14
Indique cules de los siguentes procedimientos de recoleccin de datos seran considerados como un experimento
(E) y cules como una encuesta (EN): a) comparacin de los resultados de un nuevo mtodo de capacitacin de
agentes de boletos de aerolneas con los del mtodo tradicional, b) evaluacin de dos conjuntos diferentes de instrucciones de armado de un juguete haciendo que dos grupos comparables de nios lo armen siguiendo las distintas
instrucciones, c) envo a los suscriptores de una revista de evaluacin de productos de un cuestionario para la calificacin de los productos que han adquirido recientemente.
Resp.
a) E, b) E, c) EN
1.15
Identifique si en los siguientes casos se usa el mtodo de muestreo aleatorio simple (A) o sistemtico (S): a) empleo
de una tabla de nmeros aleatorios para seleccionar una muestra de personas asistentes a un parque de diversiones y
b) entrevista de cada centsima persona que asiste a un parque de diversiones, comenzando aleatoriamente por la 55a.
persona en entrar al parque.
Resp.
1.16
a) A, >) S
En las siguientes situaciones de muestreo de grupos, identifique si se usara el mtodo de muestreo estratificado (E)
o por conglomerados (C): a) estimacin de las preferencias de voto de personas de distintas localidades y b) estudio
de las actitudes de los consumidores con la sospecha de diferencias importantes segn edad y sexo.
Resp.
a) C, >) E
[CAP. 1
1.17
Indique cules de los siguientes tipos de muestras ejemplifican mejor o estn relacionados con una muestra de juicio
(J), una muestra accesible (A) o con el mtodo de subgrupos racionales (R): a) un valuador de bienes races selecciona una muestra de casas vendidas en una localidad, la cual parece representativa de las casas ubicadas ah, para
deducir una estimacin del nivel del valor de las casas en ese rumbo, b) en una planta fabricante de bateras, el ciclo
de vida de stas se vigila cada media hora para garantizar que el producto satisfaga las especificaciones, c) en un
establecimiento de comida rpida empleados de la compaa evalan un nuevo emparedado de pollo en trminos de
sabor y valor percibido.
Resp,
Un auditor desea tomar una muestra aleatoria simple de tamao 50 de 5 250 cuentas por cobrar de una gran empresa.
Las cuentas se numeran secuencialmente del 0001 al 5 250. Use el software de cmputo a su disposicin para obtener
una lista de los 50 nmeros aleatorios requeridos.
Captulo 2
Representaciones estadsticas y anlisis de grficas
2.1
DISTRIBUCIONES DE FRECUENCIAS
Una distribucin defrecuencias es una tabla en la cual se agrupan en clases valores posibles de una variable
y donde se registra el nmero de valores observados correspondientes a cada clase. Los datos organizados en una
distribucin de frecuencias se llaman datos agrupados. En contraste con ello, en el caso de datos no agrupados
se enlistan todos los valores observados de la variable aleatoria.
EJEMPLO 1. En la tabla 2.1 aparece una distribucin de frecuencias de salarios semanales. Obsrvese que las cantidades
han sido consignadas de acuerdo con el dlar ms cercano. Cuando el residuo por redondear es de "exactamente 0.5" (exactamente $0.50 en este caso), el procedimiento convencional es redondear al nmero par ms cercano. As, un salario semanal
de $259.50 se redondeara a $260 como parte del proceso de agrupamiento de datos.
Tabla 2.1
Salario semanal
7
20
33
25
11
$240-259
260-279
280-299
300-319
320-339
340-359
Total
2.2
1 00
INTERVALOS DE CLASE
En cada una de las clases de una distribucin de frecuencias, los lmites nominales de clase inferior y superior indican los valores incluidos dentro de la clase. (Vase la primera columna de la tabla 2.1.) A diferencia de
ello, los lmites exactos de clase, o fronteras de clase, son los puntos especficos que sirven para separar clases
adyacentes en una escala de medicin de variables continuas. Los lmites exactos de clase pueden determinarse
identificando los puntos intermedios entre los lmites nominales de clase superior e inferior, respectivamente, de
clases adyacentes. El intervalo de clase identifica el rango de valores incluidos dentro de una clase y puede
determinarse restando del lmite exacto de clase superior de la clase el lmite exacto de clase inferior. Cuando no
es posible identificar lmites exactos, el intervalo de clase puede determinarse restando del lmite nominal inferior de la clase el lmite nominal inferior de la clase adyacente inferior. Finalmente, para ciertos propsitos es
comn que los valores de una clase sean representados por el punto medio de clase, el cual puede determinarse
sumando la mitad del intervalo de clase al lmite exacto inferior de la clase.
EJEMPLO 2. En la tabla 2.2 se presentan los lmites exactos de clase y los puntos medios de clase de la distribucin de
frecuencias de la tabla 2.1.
10
Tabla 2.2
[CAP. 2
Salario semanal
(lmites de clase)
Lmites exactos
de clase*
Punto medio
de clase
$240-259
260-279
280-299
300-319
320-339
340-359
$239.50-259.50
259.50-279.50
279.50-299.50
299.50-319.50
319.50-339.50
339.50-359.50
$249.50
269.50
289.50
Nmero de
trabajadores
.309.50
329.50
349.50
Total
7
20
33
25
110
4
100
* En general, en los lmites exactos de clase slo se expresa un dgito adicional significativo,
en comparacin con los lmites nominales de clase. Sin embargo, dado que en el caso de las
unidades monetarias la unidad de medida ms precisa relativa al "dlar ms cercano" suele
definirse como "el centavo ms cercano", conviene expresar dos dgitos adicionales.
EJEMPLO 3. Calculado con los dos mtodos, el intervalo de clase de la primera clase de la tabla 2.2 es $259.50 $239.50 = $20 (resta del lmite exacto de clase inferior al lmite exacto de clase superior de la clase) $260 - $240 = $20 (resta
del lmite nominal de clase inferior de la clase al lmite nominal de ciase inferior de la clase adyacente superior)
Para efectos de clculo, por lo general es deseable que todos los intervalos de clase de una distribucin de
frecuencias dada sean iguales. La siguiente frmula puede emplearse para determinar el intervalo de clase aproximado oor usar:
Intervalo aproximado
(2.1)
EJEMPLO 4. En referencia a los datos originales no agrupados que se agruparon en la tabla 2.1, supongamos que el
salario observado ms alto fue de $358 y el salario observado ms bajo de $242. Dado que el objetivo es disponer de seis
clases con iguales intervalos de clase,
Intervalo aproximado =
358 - 242
-$19.33
En el caso de datos distribuidos en forma notoriamente no uniforme, como los datos del sueldo anual para
una amplia variedad de ocupaciones, pueden ser requeridos intervalos desiguales de clase. En este caso, los
intervalos de clase mayores se utilizan para los rangos de valores con relativamente escasas observaciones.
2.3
Un histograma es una grfica de barras de una distribucin de frecuencias. Tal como se indica en la figura
2-1, se acostumbra colocar los lmites exactos de clase en el eje horizontal de la grfica y los nmeros de observaciones en el eje vertical. Sin embargo, tambin se usan puntos medios de clase en lugar de lmites de clase para
identificar las clases.
CAP. 2]
11
40
O
o
<S
'51
30
es
O
20
e
\HP
10
O
239.50
259.50
279.50
299.50
339.50
319.50
359.50
EJEMPLO 5. En la figura 2-1 se muestra unhistograma de la distribucin de frecuencias de los salarios semanales de la
tabla 2.2.
Un polgono de frecuencias es una grfica de lneas de una distribucin de frecuencias. Tal como se indica
en la figura 2-2, los dos ejes de esta grfica son similares a los del histograma, salvo que en el eje horizontal suele
identificarse el punto medio de cada clase. El nmero de observaciones de cada clase se representa con un punto
por encima del punto medio de la clase, puntos que se unen despus con una serie de segmentos lineales para
formar un polgono o "figura de muchos lados".
EJEMPLO 6.
2.2.
u,
40
es
es' 30
I^B
.0
os
o 20
O
10
'3
229.50
249.50
269.50
289.50
309.50
329.50
349.50
369.50
2.4
CURVAS DE FRECUENCIAS
Una curva de frecuencias es un polgono de frecuencias suavizado.
EJEMPLO 7.
La figura 2-3 es una curva de frecuencias de la distribucin de salarios semanales de la tabla 2.2
En trminos de asimetra, una curva de frecuencias puede ser: 1) asimtrica negativa: no simtrica con la
"cola" a la izquierda; 2) asimtrica positiva: no simtrica con la "cola" a la derecha, o 3) simtrica.
12
Sfl
[CAR 2
40
o
t
^MI
' 30
X)
es
CU
20
O
OJ
10
229.50
249.50
269.50
289.50
309.50
329.50
349.50
369.50
EJEMPLO 8.
En trminos de curtosis, una curva de frecuencias puede ser: 1) platicrtica: plana, con las observaciones
distribuidas en forma relativamente pareja entre las clases; 2) leptocrtica: afilada, con las observaciones concentradas en un estrecho rango de valores, o 3) mesocrtica: ni plana ni afilada en trminos de la distribucin de
los valores observados.
1) Asimtrica negativa
2) Simtrica
3) Asimtrica positiva
Fig. 2-4
EJEMPLO 9.
En la figura 2-5 aparecen los diversos tipos de curvas de frecuencias en trminos de curtosis.
1) Platicurtica
2) Mesocrtica
3) Liptocrtica
Fig. 2-5
2.5
Una distribucin de frecuencias acumuladas identifica el nmero acumulado de observaciones incluidas bajo el lmite exacto superior de cada clase de la distribucin. Las frecuencias acumuladas de una clase
CAP. 2]
13
pueden determinarse sumando las frecuencias observadas de esa clase a las frecuencias acumuladas de la clase
anterior.
EJEMPLO 10.
Tabla 2.3 Clculo de las frecuencias acumuladas de ios datos de salarios semanales
de la tabla 2.2
Salario
semanal
Lmite exacto
de clase superior
$240-259
260-279
280-299
300-319
320-339
340-359
$259.50
279.50
299.50
319.50
339.50
359.50
Nmero de trabajadores
(/)
Frecuencias acumuladas
06)
7
20
33
25
11
4
Total
7
20+ 7 = 27
33 + 27 = 60
25 + 60 = 85
1 1 + 85 = 96
4 + 9 6 = 100
1 00
La grfica de una distribucin de frecuencias acumuladas se llama ojiva. En el caso de distribuciones acumuladas del tipo "y menor que", esta grfica indica las frecuencias acumuladas bajo cada lmite exacto de clase
de la distribucin de frecuencias. Si esa grfica de lneas se suaviza, se obtiene la curva llamada ojiva.
EJEMPLO 11.
100
o
es
80
3
U
60
40
9
20
O
239.50
259.50
279.50
299.50
319.50
339.50
359.50
2.6
Una distribucin de frecuencias relativas es aquella cuyo nmero de observaciones asociadas con cada clase
se ha convertido en una frecuencia relativa dividiendo entre el nmero total de observaciones de toda la distribu-
14
[CAP. 2
cin. De este modo, cada frecuencia relativa es una proporcin, la cual puede convertirse en un porcentaje multiplicndola por 100.
Una de las ventajas de la elaboracin de distribuciones de frecuencias relativas es que su distribucin acumulada y su ojiva indican la proporcin acumulada (o porcentaje) de observaciones hasta los diversos valores
posibles de la variable. Un valorpercentil es el porcentaje acumulado de observaciones hasta un valor designado
de una variable. (Vanse problemas 2.14 y 2.16 a 2.20.)
2.7
Los lmites de clase de las distribuciones de frecuencias obtenidas por computadora suelen ser del tipo "y
menor que". En estos lmites, los lmites nominales de clase son al mismo tiempo los lmites exactos que definen
la clase. Los valores agrupados en cualquier clase son iguales a o mayores que el lmite de clase inferior y hasta
el valor del lmite de clase superior, sin incluir a ste. Un medio descriptivo para la presentacin de estos lmites
de clase es:
5 y menor que 8
8 y menor que 11
Adems de ser ms fcil de aplicar en software de cmputo, este tipo de distribucin tambin suele representar un
modo ms "natural" de recoleccin de datos. Por ejemplo, la edad de las personas se registra por lo general en
correspondencia con su aniversario anterior, no con el prximo. As, un individuo de 24 aos de edad tiene 24
como mnimo, pero menos de 25. En los problemas resueltos 2.21 a 2.24 se presentan varias distribuciones de
frecuencias del tipo "y menor que", incluidos resultados obtenidos por computadora.
2.8
CAP. 2]
Tabla 2.4
58
74
88
69
85
65
91
66
82
98
72
76
94
78
82
83
62
100
Tallo
15
65
62
75
63
81
81
86
72
78
66
59
84
96
88
85
65
80
90
92
100
84
77
76
87
96
71
82
73
74
63
97
99
Hojas
8 9
2 2 3 3 5 5 5 6 6 9
7
2 2 3 4 4 5 6 6 7 8 8
0 1 1 2 2 2 3 4 4 5 5 6 7 8 8
0 1 2 4 6 6 7 8 9
10
O O
Fig. 2-7
2.9
DIAGRAMAS DE PUNTOS
2.10
DIAGRAMAS DE PARETO
Un diagrama de Pareto se asemeja a un histograma, excepto que es una grfica de barras de frecuencias de
una variable cualitativa, no de datos cuantitativos agrupados en clases. Las barras de la grfica, que pueden
representar frecuencias o frecuencias relativas (porcentajes) se organizan en orden descendente de izquierda a
derecha. Esta disposicin da como resultado la ubicacin de las categoras ms importantes de datos, segn su
frecuencia de ocurrencia, en las posiciones iniciales de la grfica. Los diagramas de Pareto se usan en el control
de procesos para tabular las causas asociadas con variaciones de causas atribuibles en la calidad del producto del
proceso. Es comn que solamente unas cuantas categoras de causas se asocien con la mayora de los problemas
16
[CAP. 2
de calidad, de modo que los diagramas de Pareto permiten que tanto equipos de trabajadores como gerentes se
concentren en las reas ms importantes en las que se necesitan acciones correctivas.
EJEMPLO 13. Se encontr que los refrigeradores que no fueron aprobados en la inspeccin final en una planta
ensambladura de aparatos elctricos durante el ltimo mes tenan defectos debidos a las siguientes causas: ensamble, acabado
de laca, fallas elctricas, abolladuras u otras causas. La figura 2-8, obtenida con Minitab, es el diagrama de Pareto para la
representacin grfica tanto de las frecuencias como de las frecuencias relativas de cada causa de falla en inspeccin. Como
puede verse, la gran mayora de fallas en inspeccin se deben a defectos en el ensamble y el acabado de laca.
100
SO
4
60
01
G
O
'e?
*e
100
o
40
"-;.
-:
Defecto
:;;1 . -- _.. ,
-.
; ^
.-
--
20
-..-
" :-:
Ensamble
o.
M^
V',.;;. '
Laca
Elctrico
Abolladuras
Otros
Conteo
98
60
20
12
10
Porcentaje
49.0
30.0
10.0
6.0
5.0
% acumulado
49.0
79.0
89.0
95.0
100.0
Fig. 2-8
2.11
Una serie de tiempo es un conjunto de valores observados, tales como datos de produccin o ventas, durante
una serie de periodos temporales secuencialmente ordenados. En el captulo 16 se describen mtodos especiales
de anlisis de datos de este tipo. Para efectos de representacin grfica, tanto los diagramas de barras como las
grficas de lneas son de gran utilidad. En un diagrama de barras, una serie de barras representa cantidades de
una serie de tiempo.
EJEMPLO 14. En el diagrama de barras de la figura 2-9 se recoge la informacin de ganancias netas (en millones de
dlares) de un importante banco comercial durante una secuencia de aos codificados.
En un diagrama de barras de componentes se marcan subdivisiones en las barras del diagrama. Por ejemplo,
cada barra de la figura 2-9 podra subdividirse en distintas partes (tal vez diferenciadas con colores) para indicar
la contribucin relativa de cada segmento de la empresa a las ganancias netas de cada ao. (Vase problema
resuelto 2.29.)
Una grfica de lneas contiene cantidades de series de tiempo unidas entre s por segmentos lineales.
CAP. 2]
17
170160-
150
J2
*S
140-
"'
130-
120-
110
1001
90-
1
1
1
1
1
2
1
3
Ao
Fig. 2-9 Diagrama de barras.
EJEMPLO 15. Los datos de la figura 2-9 se presentan en forma de grfica de lneas en la figura 2-10.
170-
160150140-
.3
*S
e
a
O
130120110-
100-
90-
I
1
I
2
I
5
I
6
Ao
GRFICAS DE CORRIDAS
Una grfica de corridas es una grfica de valores de datos en el orden secuencial temporal en que fueron
observados. Los valores trazados pueden ser valores observados individuales o valores compendiados, como en
el caso de una serie de medias mustrales. Cuando a una grfica de este tipo se le agregan los lmites inferior y
superior del muestreo de aceptacin, se le llama grfica de control. La determinacin de esos lmites y el uso de
las grficas de control en el control estadstico de calidad se explican e ilustran en el captulo 20.
18
[CAP. 2
EJEMPLO 16. En la figura 2-11 se muestra una grfica de corridas de la secuencia de pesos medios de muestras de
cuatro paquetes de papas fritas tomadas en 15 momentos distintos con el mtodo de muestreo de subgrupos racionales (vase
captulo 1, ejemplo 13). La secuencia de pesos medios de las muestras fue la siguiente: 14.99, 15.08, 15.05, 14.95, 15.04,
14.91, 15.01, 14.84, 14.80, 14.98, 14.96, 15.00, 15.02, 15.07 y 15.02 onzas. La especificacin de peso neto promedio por
empacar en el proceso es de 15.00 onzas. La determinacin de si considerar o no como una desviacin significativa a cualquiera de las desviaciones de estas medias mustrales respecto de la norma de peso especificada se expondr ampliamente en
el captulo 20, problemas resueltos 20.13 y 20.14.
15.1-
15.0-
a
a
^ ^"^^
s
o
en
14.9-
14.8-
Muestra
10
15
2.13
DIAGRAMAS CIRCULARES
Un diagrama circular es una figura en forma de pastel cuyas piezas representan divisiones de una cantidad
total, como podra serlo la distribucin de las ventas en dlares de una compaa.
Un diagrama circular de porcentajes es aquel cuyos valores han sido convertidos a porcentajes para facilitar
su comparacin.
EJEMPLO 17. La figura 2-12 es un diagrama circular en el que se describen los ingresos y el porcentaje de ingresos
totales de Xerox Corporation durante un ao reciente de acuerdo con las categoras actividad principal (que Xerox denomina
"zona de importancia decisiva"), mercados en crecimiento, pases en desarrollo y nichos de oportunidad.
Nichos (1,5.1%)
En desarrollo (1,5.1%)
CAP. 2]
19
Problemas resueltos
DISTRIBUCIONES DE FRECUENCIAS, INTERVALOS DE CLASE
Y MTODOS GRFICOS CORRESPONDIENTES
2.1
Tabla 2.5
Tasa de renta
Nmero de departamentos
$350-379
380-409
410-439
440^69
470-499
500-529
530-559
560-589
590-619
620-649
3
8
10
13
33
40
35
30
16
12
Total
200
$350 y $379
$340.50 y $379.50. (Nota: Como en el ejemplo 2, en este caso se expresan dos dgitos adicionales en lugar de
uno solo, situacin esta ltima que suele ser ms comn en los lmites exactos de clase en comparacin con los
lmites nominales de clase.)
c) Si nos atenemos al intervalo de los valores de la primera clase,
$379.50 - $349.50 = $30 (resta del lmite exacto de clase inferior al lmite exacto de clase superior de la clase)
$380 - $350 = $30 (resta del lmite nominal de clase inferior de la clase al lmite nominal de clase inferior de la
clase adyacente superior)
rf) $349.50 + 30/2 - $349.50 + $15.00 - $364.50
e) $499.50 y $529.50
./) $440 y $469. (Nota: $439.50 se redondea primeramente en $440, el dlar ms cercano, de acuerdo con la regla
de nmeros pares descrita en la seccin 2.1.)
2.2
20
[CAP. 2
40
I
O
20
10
349.50 379.50
409.50 439.50
469.50
499.50
529.50 559.50
589.50 619.50
649.50
2.3
Elabore un polgono de frecuencias y una curva de frecuencias con los datos de la tabla2.5.
La figura 2-14 es una representacin grfica del polgono de frecuencias y la curva de frecuencias de los datos
de la tabla2.5.
ACOTACIONES
W)
40
Polgono de frecuencias
e
o
Curva de frecuencias
30
IM
es
D.
4
20
4*
10
334.50
364.50 394.50
514.50
544.50
574.50
604.50
634.50 664.50
2.4
2.5
Elabore una distribucin de frecuencias acumuladas con los datos de la tabla 2.5.
Vase tabla 2.6.
2.6
Represente grficamente la distribucin de frecuencias acumuladas de la tabla 2.6 por medio de una
ojiva.
La ojiva de los datos de la tabla 2.6 aparece en la figura 2-15.
CAP. 2]
Tabla 2.6
21
Tasa
de renta
Fronteras
de clase
$350-379
38CM09
410-439
440-469
470-499
500-529
530-559
560-589
590-619
620-649
$349.50-379.50
379.50-409.50
409.50-439.50
439.50-469.50
469.50-499.50
499.50-529.50
529.50-559.50
559.50-589.50
589.50-619.50
619.50-649.50
Nmero de
departamentos
Frecuencias acumuladas
3
11
3
8
10
13
33
40
35
30
16
12
Total
21
34
67
107
142
172
188
200
200
fa
200
150
100
50
O
349.50 379.50 409.50 439.50 469.50 499.50 529.50 559.50 589.50 619.50 649.50
2.7
En la tabla 2.7 se enlistan los tiempos requeridos para la conclusin de una tarea de ensamble para una
muestra de 30 empleados que presentaron su solicitud de ascenso a un puesto de ensamble de precisin.
Supongamos que nos interesa organizar estos datos en cinco clases de igual tamao. Determine el tamao
de intervalo correspondiente.
Intervalo aproximado =
= 1.80
10
16
15
9
12
11
14
12
18
15
10
16
15
14
9
11
17
12
13
11
14
13
16
14
17
13
14
11
12
15
22
2.8
[CAP. 2
Elabore una distribucin de frecuencias de los datos de la tabla 2.7 con un intervalo de clase de 2.0 para
todas las clases y fijando en 9 minutos el lmite nominal inferior de la primera clase.
La distribucin requerida aparece en la tabla 2.8.
Nmero de empleados
9-10
11-12
13-14
15-16
17-18
4
8
8
7
3
Total
2.9
Remtase a la clase con el menor nmero de empleados de la tabla 2.8 e identifique a) sus lmites exactos,
b) su intervalo y c) su punto medio.
a)
2.10
30
/
10
8.5
10.5
12.5
14.5
16.5
18.5
Tiempo, en minutos
Fig. 2-16
2.11
Elabore un polgono de frecuencias y una curva de frecuencias con los datos de la tabla 2.8.
El polgono de frecuencias y la tabla de frecuencias aparecen en la figura 2-17.
2.12
CAP. 2]
23
/
10
8
7.5
9.5
11.5
13.5
15.5
17.5
19.5
Tiempo, en minutos
Fig. 2-17
2.13
2.14
Tiempo, en min
fa
% acumulado
8.5-10.5
10.5-12.5
12.5-14.5
14.5-16.5
16.5-18.5
4
12
20
27
30
13.3
40.0
66.7
90.0
100.0
8
8
7
3
24
[CAP. 2
100 -
80 60 -
40 -
8.5
10.5
12.5
14.5
16.5
18.5
Tiempo, en minutos
Fig. 2-18
2.15
Dada la curva de frecuencias d) de la figura 2-19, la cual es simtrica y mesocrtica, describa las curvas
b), c\ d), e) yj) en trminos de asimetra y curtosis.
La curva b) es simtrica y leptocrtica; la curva c\ asimtrica positiva y mesocrtica; la curva d) asimtrica
negativa y mesocrtica; la curva e), simtrica y platicrtica, y la curvay) asimtrica positiva y leptocrtica.
e}
Fig. 2-19
2.16
Siguiendo las instrucciones de la seccin 2.6, determine a) las frecuencias relativas y b) las proporciones
acumuladas de los datos de la tabla 2.10.
Las frecuencias relativas y las proporciones acumuladas de los datos de la tabla 2.10 aparecen en la tabla 2.11.
REPRESENTACIONES ESTADSTICAS\
Nmero
de empresas
1.5-1.7
1.8-2.0
2.1-2.3
2.4-2.6
2.7-2.9
3.0-3.2
12
14
9
7
5
Total
Tabla 2.11
Nmero
de empresas
a) Frecuencias
relativas
b) Proporciones
acumuladas
0.06
0.24
0.28
0.18
0.14
0.10
Total 100
0.06
0.30
3
12
1.5-1.7
1.8-2.0
2.1-2.3
2.4-2.6
2.7-2.9
3.0-3.2
14
9
7
5
Total 50
2.17
50
0.58
0.76
0.90
1.00
30
20
n
.2
U
10
u.
o
1.45
1.75
2.05
2J5
2.65
6)
2.95
3.25
26
[CAP. 2
100 -
1.45
Fig. 2-21
2.18
2.19
a) En referencia a la tabla 2.11, cul es el valor percentil asociado con un promedio de 2.95 (aproximadamente 3.0) accidentes por cada mil horas-hombre? b) Cul es el nmero promedio de accidentes en el
58o. percentil?
a)
2.20
Por interpolacin grfica en una ojiva podemos determinar los percentiles aproximados de diversos valores de la variable y viceversa. En referencia a la figura 2-21, d) Cul es el percentil aproximado asociado
con un promedio de 2.5 accidentes? b) Cul es el nmero promedio aproximado de accidentes en el 50o.
percentil?
d)
b)
65o. percentil. (sta es la altura aproximadade la ojiva correspondiente a 2.50 en el eje horizontal.)
2.25. (ste es el punto aproximado en el eje horizontal que corresponde a la altura de 0.50 de la ojiva.)
Tiempo, en min
Nmero
de pedidos
5 y menor que 8
8 y menor que 11
11 y menor que 14
10
17
12
14 y menor que 17
17 y menor que 20
2
Total
47
CAP. 2]
Tabla 2.13
Tiempo,
enmin
Lmites exactos
de clase
5 y menor que 8
8 y menor que 11
11 y menor que 14
14 y menor que 17
17 y menor que 20
Nmero
de pedidos
5.0- 8.0
8.0-11.0
11.0-14.0
10
17
14.0-17.0
6
2
12
17.0-20.0
Total
2.22
27
47
18
O
o
5
12
O
)H
E
O
3.5
6.5
9.5
12.5
15.5
18.5
21.5
2.23
Use software de cmputo para construir una distribucin de frecuencias y producir un histograma de los
datos de la tabla 2.7, en la que se enlistan los tiempos en minutos para la realizacin de una tarea de
ensamble en una muestra de 30 empleados.
a)
b)
c)
d)
)
Se trata de una distribucin de frecuencias del tipo "y menor que". Esto se ilustra en la solucin del inciso d),
ms adelante.
b) 10.
c) En referencia a los puntos medios de dos clases adyacentes: 12 - 10^2.
d) 9 y menor que 11. (En el caso de los datos reportados, esto incluira a todos los tiempos reportados de 9 y 10
minutos, pero no a los de 11 minutos.)
e) 9.0 y 11.0.
28
[CAR 2
8
7-
6Gfl
3t
5-
4-
u,
-1 _
2 1 -1
0-
I
10
12
I
18
I
16
!
14
Tiempo
2.24
Remtase al problema anterior. Realice de nuevo el anlisis con la especificacin de que el punto medio
de la primera clase debe fijarse en 9.0 y se debe emplear un intervalo de clase de 1.0.
a)
b)
c)
d)
e)
a)
b)
c)
4-
1
a
3-
1
9
1
10
1
11
1
12
1
13
1
14
1
15
1
16
1
17
Tiempo
Fig. 2-24
1
18
CAP. 2]
d)
e)
29
8.5 y menor que 9.5. (En el caso de los datos reportados, esto incluira simplemente a todos los tiempos reportados de 9 minutos.)
8.5 y 9.5.
2.25
En la tabla 2.14 aparece un listado de las temperaturas ms alta y ms baja registradas el 15 de mayo de un
ao reciente en 40 ciudades estadunidenses seleccionadas. Elabore un diagrama de tallo y hojas de las
temperaturas registradas ms altas.
Tabla 2.14 Temperaturas ms alta y ms baja de 40 ciudades estadunidenses
Ms alta
Ms baja
69
60
76
82
76
64
63
58
76
70
74
71
86
71
76
75
84
84
77
72
39
47
46
66
42
53
44
51
45
40
47
40
68
43
37
38
65
67
50
59
Albany, N. Y.
Anchorage
Atlanta
Austin
Birmingham
Boston
Buffalo
Casper
Chicago
Cleveland
Columbia, S.C,
Columbus, Oh.
Dallas
Detroit
Forth Wayne
Green Bay
Honolul
Houston
Jacksonville
Kansas City
Las Vegas
Los ngeles
Memphis
Miami Beach
Milwaukee
Ciudad de Nueva York
Palm Springs
Phoenix
Pittsburgh
Portland, Ore.
Richmond
Roche ster, N. Y
St. Louis
San Antonio
San Diego
San Francisco
Seattle
Syracuse
Tampa
Washington D. C.
Ms alta
Ms baja
94
76
78
82
75
74
93
94
67
70
70
62
76
81
69
78
67
63
85
69
63
61
51
67
48
50
64
74
44
53
46
42
58
69
62
55
50
43
59
52
Tronco
Hojas
6
7 "
0 2 3 3 4 7 7 9 9 9
0 0 0 1 1 2 4 4 5 5 6 6 6 6 6 6 7 8 8
8
9
1 2 2 4 4 5 6
3 4 4
Fig. 2-25
2.26
Use software de cmputo para obtener un diagrama de tallo y hojas de los puntajes incluidos en la tabla
2.4. Compare sus resultados con el diagrama de tallo y hojas de la figura 2-7.
El diagrama de tallo y hojas aparece en la figura 2-26. Adems de valores de tallo y hojas, Minitab incluye entre
sus resultados una columna adicional con informacin de frecuencias acumuladas. Los tres primeros nmeros en
sentido descendente indican que el primer tronco contiene dos puntajes; que, considerados en conjunto, el primero y
segundo troncos contienen un total de 12 puntajes, y que los tres primeros troncos contienen un total de 24 puntajes.
El cuarto nmero, (15), aparece entre parntesis, lo que indica que este tronco contiene el puntaje medio del grupo
tras la ordenacin de los 50 puntajes reportados e incluye 15 puntajes reportados. Los nmeros restantes de la columna se leen en sentido ascendente. El nmero que aparece ms abajo, 2, indica que ese tronco contiene dos puntajes,
mientras que el nmero inmediatamentesuperior, 11, indica que el primero y segundo troncos de abajo hacia arriba
incluyen un total de 11 puntajes.
30
Stem-and-leaf of Scores N - 50
Leaf Unit = 1.0
2
12
24
(15)
11
2
5
6
7
8
9
10
89
2233555669
122344566788
011222344556788
012466789
00
Gnero
Ritmo cardiaco
(0 = no; 1 = s)
(0 = F; 1 = M)
82
68
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
0
0
0
0
78
80
62
60
62
76
74
74
68
68
64
76
88
70
78
80
74
82
80
90
64
74
70
74
84
72
92
64
94
80
78
88
60
68
90
89
68
72
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
[CAP. 2
CAP. 2]
31
DIAGRAMAS DE PUNTOS
2.27
En la tabla 2.15 se presentan los ritmos cardiacos en estado de descanso de una muestra de 40 adultos, la
mitad de los cuales no fuman (cdigo 0) en tanto que la otra mitad la componen fumadores regulares
(cdigo 1). Use software de cmputo para elaborar un diagrama de puntos que facilite la comparacin
entre el ritmo cardiaco de los no fumadores y de los fumadores de esta muestra. Interprete el diagrama de
puntos que obtenga.
En la figura 2-27 se presenta un diagrama de puntos en el que los dos subgrupos de personas aparecen por
separado, aunque con la misma escala a fin de facilitar la comparacin. Tal como se desprende de la concentracin de
las respectivas distribuciones, la muestra de fumadores habituales deja ver que el ritmo cardiaco de stos es ligeramente superior al de los no fumadores. Tal como lo indica a su vez la dispersin de cada subconjunto de datos, los
fumadores presentan mayor variabilidad en su ritmo cardiaco que los no fumadores. La consideracin acerca de si
estas diferencias mustrales pueden interpretarse como indicativas de diferencias reales en la poblacin ser tratada
en los captulos 9 y 11, que se ocupan, respectivamente, de la estimacin de la diferencia entre parmetros de la
poblacin y de la prueba de diferencias en parmetros de la poblacin.
SMOKER
O
PULSE
SMOKER
1
+
63 O
-- -4-
70.0
77.0
_,__
84.0
i ,
91.0
PULSE
98.0
2.28
La tabla 2.16 incluye algunos de los resultados financieros reportados por una compaa generadora de
energa elctrica durante seis aos consecutivos. Elabore un diagrama de barras verticales en la que se
describan las utilidades anuales por accin de esta compaa correspondientes a los aos codificados.
Tabla 2.16
Ao
Utilidades
Dividendos
Utilidades retenidas
1
2
3
4
5
6
$1.61
2.17
2.48
3.09
4.02
4.35
$1.52
1.72
1.92
2.20
2,60
3.00
$0.09
0.45
0.56
0.89
1.42
1.35
2.29
Elabore un diagrama de barras de componentes con los datos de la tabla 2.16 en tal forma que indique la
divisin de utilidades por accin entre dividendos (D) y utilidades retenidas (R) en cada ao.
f
En la figura 2-29 se presenta un diagrama de barras de componentes de los datos de la tabla 2.16.
2.30
Elabore una grfica de lneas de las utilidades por accin reportadas en la tabla 2.16.
La grfica de lneas aparece en la figura 2-30.
CAP. 2]
33
GRFICAS DE CORRIDAS
2.31
Cuando un proceso de canje de cupones se halla bajo control, un mximo de 3% de las deducciones se
realizan incorrectamente, de modo que la proporcin mxima aceptable de errores es de 0.03. En relacin
con 20 muestras secuenciales de 100 canjes de cupones cada una, una auditora revela que el nmero de
errores encontrados en las muestras de subgrupos racionales es: 2, 2, 3, 6, 1,3, 6,4, 7,2, 5, O, 3, 2,4, 5,
3, 8,1 y 4. Convierta en proporciones estos nmeros de errores por muestra de 100 y elabore la grfica de
corridas de las proporciones de los errores observados.
La grfica de corridas aparece en la figura 2-31, tal como se le obtuvo con el empleo del software de cmputo
Minitab.
0.08
0.07 -
0.06 0.05 -
o.
0.04 0.03 -
Muestra
I
15
i
5
I
10
Fig. 2-31
Grfica de corridas.
I
20
DIAGRAMAS CIRCULARES
2.32
En la tabla 2.17 aparecen los montos de portafolios de inversiones en varias zonas geogrficas de un
fondo de inversin de acciones globales. Elabore un diagrama circular de porcentajes con esta informacin.
$231
158
84
53
Total $526
34
[CAP. 2
Inglaterra (53,10.1%)
Extremo Oriente (158,30.0%)
Europa (84,16.0%)
Fig. 2-32
Diagrama circular.
Problemas complementarios
DISTRIBUCIONES DE FRECUENCIAS, INTERVALOS DE CLASE
Y MTODOS GRFICOS CORRESPONDIENTES
2.33
La tabla 2.18 es una distribucin de frecuencias del kilometraje por gasolina obtenida con base en una muestra de 25
viajes de vehculos de una compaa, a) Cules son los lmites nominales inferior y superior de la ltima clase? b)
Cules son los lmites exactos inferior y superior de la ltima clase? c) Qu intervalo de clase se us? d) Cul es
el punto medio de la ltima clase? e) Supongamos que el kilometraje por litro de un viaje especfico fue de 29.9.
Indique los lmites inferior y superior de la clase en la que fue incluido este resultado.
Resp. a) 34.0 y 35. 9, b) 33.95 y 35.95, c) 2.0, d) 34.95, e) 28.0 y 29.9
Nmero de viajes
3
5
10
4
2
1
Total 25
2.34
2.35
Elabore un polgono de frecuencias y una curva de frecuencias con los datos de la tabla 2.18
CAP. 2]
236
35
Describa la curva de frecuencias resultante del problema 2.35 desde el punto de vista de su asimetra.
Resp.
237
Forme una distribucin de frecuencias acumuladas con los datos de la tabla 2.18 y elabore una ojiva para la represen
tacin grfica de esta distribucin.
238
En la tabla 2.19 se presentan las cantidades de 40 prstamos personales utilizados para financiar la compra de muebles y aparatos elctricos. Supongamos que nos interesa ordenar estas cantidades en una distribucin de frecuencias
con un total de siete clases. Partiendo del supuesto de intervalos de clase iguales, cul sera el intervalo de clase ms
conveniente para esta distribucin de frecuencias?
Resp.
$400
1200
1278
2540
586
1 650
1219
$1000
554
973
660
720
1388
851
329
1423
727
$356
1 190
300
1610
1525
1000
1 890
935
$2227
954
2112
445
784
592
655
334
870
630
3000
1590
239
Elabore una distribucin de frecuencias con los datos de la tabla 2.19 iniciando la primera clase con un lmite de clase
inferior de $300 y aplicando un intervalo de clase de $400.
2.40
2.41
2.42
2.43
Elabore una distribucin de frecuencias acumuladas de la distribucin de frecuencias formada en el problema 2.39 y
trace una ojiva con estos datos.
2.44
Describa las siguientes curvas en trminos de asimetra o curtosis, como corresponda: a) una curva de frecuencias
con una cola a la derecha, b) una curva de frecuencias relativamente afilada, c) una curva de frecuencias relativamente plana, d) una curva de frecuencias con cola a la izquierda.
Resp.
2.45
Elabore una tabla de frecuencias relativas a partir de la distribucin de frecuencias presentada en la tabla 2.20,
36
Tabla 2.20
[CAP. 2
Nmero de herramientas
0.0-24.9
25.0-49.9
50.0-74.9
75.0-99.9
100.0-124.9
125.0-149.0
2
4
12
30
18
4
Total
70
2.46
2.47
En referencia a la tabla 2.20, a) Qu porcentaje de herramientas cortantes dur al menos 125 horas? b) Qu
porcentaje de herramientas cortantes tuvo un periodo de vida de al menos 100 horas?
Resp.
a) 6%, b) 31%
2.48
Elabore una tabla de proporciones acumuladas con la distribucin de frecuencias de la tabla 2.20.
2.49
En referencia a la tabla resultante del problema 2.48, a) Qu periodo de vida de las herramientas se asocia con el
26o. percentil de la distribucin? b) Cul percentil se asocia con un periodo de vida de herramientas de aproximadamente 100 horas?
Resp.
2.50
Elabore una ojiva con las proporciones acumuladas determinadas en el problema 2.48.
2.51
Remtase a la ojiva elaborada en el problema 2.50 y determine los siguientes valores, aproximadamente, por medio
de interpolacin grfica: a) el periodo de vida de las herramientas en el 50o. percentil de la distribucin, b) el
percentil asociado con un periodo de vida de herramientas de 60 horas.
Resp.
2.52
En referencia a la distribucin de frecuencias de la tabla 2.21, determine a) el lmite nominal inferior de la primera
clase, ?) el lmite nominal superior de la primera clase, c) el lmite exacto inferior de la primera clase, d) el lmite
exacto superior de la primera clase, e) el punto medio de la primera clase.
Resp.
Nmero de candidatos
5
18
10
6
1 8 y menor que 20
20 y menor que 22
22 y menor que 24
24 y menor que 26
26 y menor que 28
28 y menor que 30
30 y menor que 32
Total
5
4
2
50