Está en la página 1de 649

MAPA PARA SELECCIONAR

UN MTODO ESTADSTICO
TIPO DE DATOS
Tipo de anlisis Numricos Categricos
Descripcin de un grupo o Arreglo ordenado, diagrama de tallo y hoja, Tabla de resumen, grfica de barras,
diversos grupos distribucin de frecuencias, distribucin de grfica de pastel, diagrama de Pareto
frecuencia relativa, distribucin de porcentajes, (Seccin 2.1).
distribucin de porcentajes acumulados,
histograma, polgono, polgono de porcentaje
acumulado (Secciones 2.2 y 2.3).
Media, mediana, moda, cuartiles, media
geomtrica, rango, rango intercuartil, desviacin
estndar, varianza, coeficiente de variacin,
grfica de caja y bigote (Secciones 3.1-3.3).

Inferencia acerca de un Estimacin del intervalo de confianza para la Estimacin de intervalo de confianza
grupo media (Secciones 8.1 y 8.2). para una proporcin (Seccin 8.3).
Prueba Z para la media (Seccin 9.2). Prueba Z de hiptesis para la
proporcin (Seccin 9.5).
Prueba t para la media (Seccin 9.4).

Comparacin de dos Pruebas para la diferencia en las medias de dos Prueba Z para la diferencia entre dos
grupos poblaciones independientes (Seccin 10.1). proporciones (Seccin 10.3).
Prueba t apareada (Seccin 10.2). Prueba de chi cuadrada para la
diferencia entre dos proporciones
Prueba F para la diferencia entre dos varianzas
(Seccin 11.1).
(Seccin 10.4).

Comparacin de ms de Anlisis de varianza de una va (Seccin 10.5). Prueba de chi cuadrada para las
dos grupos diferencias entre ms de dos
proporciones (Seccin 11.2).

Anlisis de la relacin Diagrama de dispersin, grfica de series de Tabla de contingencia, grfica de


entre dos variables tiempo (Seccin 2.5). barras agrupadas (Seccin 2.4).
Covarianza, coeficiente de correlacin Prueba de chi cuadrada de
(Seccin 3.4). independencia (Seccin 11.3).
Regresin lineal simple (Captulo 12).
Prueba t de correlacin (Seccin 12.7).

Anlisis de la relacin Regresin mltiple (Captulo 13).


entre dos o ms variables
La distribucin normal estandarizada acumulativa
Las entradas representan el rea bajo la distribucin normal estandarizada
acumulativa desde hasta Z
Z 0

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
6.0 0.000000001
5.5 0.000000019
5.0 0.000000287
4.5 0.000003398
4.0 0.000031671
3.9 0.00005 0.00005 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00003 0.00003
3.8 0.00007 0.00007 0.00007 0.00006 0.00006 0.00006 0.00006 0.00005 0.00005 0.00005
3.7 0.00011 0.00010 0.00010 0.00010 0.00009 0.00009 0.00008 0.00008 0.00008 0.00008
3.6 0.00016 0.00015 0.00015 0.00014 0.00014 0.00013 0.00013 0.00012 0.00012 0.00011
3.5 0.00023 0.00022 0.00022 0.00021 0.00020 0.00019 0.00019 0.00018 0.00017 0.00017
3.4 0.00034 0.00032 0.00031 0.00030 0.00029 0.00028 0.00027 0.00026 0.00025 0.00024
3.3 0.00048 0.00047 0.00045 0.00043 0.00042 0.00040 0.00039 0.00038 0.00036 0.00035
3.2 0.00069 0.00066 0.00064 0.00062 0.00060 0.00058 0.00056 0.00054 0.00052 0.00050
3.1 0.00097 0.00094 0.00090 0.00087 0.00084 0.00082 0.00079 0.00076 0.00074 0.00071
3.0 0.00135 0.00131 0.00126 0.00122 0.00118 0.00114 0.00111 0.00107 0.00103 0.00100
2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
0.7 0.2420 0.2388 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2482 0.2451
0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
(contina)
La distribucin normal estandarizada acumulativa (continuacin)
Las entradas representan el rea bajo la distribucin normal estandarizada
acumulativa desde hasta Z
0 Z

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7518 0.7549
0.7 0.7580 0.7612 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99897 0.99900
3.1 0.99903 0.99906 0.99910 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929
3.2 0.99931 0.99934 0.99936 0.99938 0.99940 0.99942 0.99944 0.99946 0.99948 0.99950
3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.99960 0.99961 0.99962 0.99964 0.99965
3.4 0.99966 0.99968 0.99969 0.99970 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976
3.5 0.99977 0.99978 0.99978 0.99979 0.99980 0.99981 0.99981 0.99982 0.99983 0.99983
3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989
3.7 0.99989 0.99990 0.99990 0.99990 0.99991 0.99991 0.99992 0.99992 0.99992 0.99992
3.8 0.99993 0.99993 0.99993 0.99994 0.99994 0.99994 0.99994 0.99995 0.99995 0.99995
3.9 0.99995 0.99995 0.99996 0.99996 0.99996 0.99996 0.99996 0.99996 0.99997 0.99997
4.0 0.999968329
4.5 0.999996602
5.0 0.999999713
5.5 0.999999981
6.0 0.999999999
HA PENSADO EN HACER
ESTE LIBRO A SU Medida?

EL PROGRAMA DE PRENTICE HALL JUSTO A TIEMPO


EN CIENCIAS DE LA DECISIN
Usted puede combinar captulos de este libro con captulos de cualquiera de los ttulos listados en la
siguiente pgina para crear un libro de texto hecho a la medida de los requerimientos de su curso.
Puede agregar su propio material o casos provenientes de nuestra extensa coleccin. Tmese unos
minutos para revisar los libros de sus estantes, as como el contenido de nuestro sitio Web, con lo
que podr crear su libro de texto ideal.
a su Medida

El programa Justo a Tiempo le ofrece:


Material de calidad para elegir: Adems de los libros listados, tambin tiene la opcin de in-
cluir cualquiera de los casos de Prentice Hall Custom Business Resources, que le da acceso a
los casos (y notas de enseanza en ocasiones disponibles) de Darden, Harvard, Ivey, NACRA y
Thunderbird. La mayora de los casos pueden revisarse en nuestro sitio Web.

Flexibilidad: Elija nicamente el material que desea, ya sea de un solo ttulo o de varios (ms
los casos) y organice la secuencia que requiere.

Apoyo instruccional: Usted tiene acceso directo al texto especfico del CD-ROM que acompa-
a a este libro, as como copias de escritorio de su libro JIT (Just-In-Time).

Materiales externos: Tambin cuenta con la opcin de incluir hasta 20% del texto provenien-
te de libros y materiales ajenos a Prentice Hall Custom Business Resources.

Ahorros en costos: Los estudiantes pagan slo por el material que usted elija. El precio base
es de USD $6.00, ms $2.00 para material de casos, ms $.09 por pgina. El texto puede reunir-
se con otros libros de texto de Pearson para obtener un descuento del 10%. El material externo
tiene un precio de $.10 por pgina ms las tarifas por permisos.

Calidad del producto final: La portada del libro, as como la pgina del ttulo incluirn su
nombre, escuela, departamento, nombre de la materia y nmero de seccin. El libro quedar
impreso en blanco y negro, y perfectamente encuadernado. La tabla de contenidos estar hecha
a la medida. El nmero de pginas seguir una secuencia a lo largo del texto.

Visite nuestro sitio Web en www.prenhall.com/custombusiness y cree su texto a la medida


en nuestro bookbuildsite o descargue las formas para ordenar por Internet.
EL PROGRAMA DE PRENTICE HALL
Justo a Tiempo

USTED PUEDE HACER SU LIBRO DE TEXTO A LA MEDIDA CON CAPTULOS DE CUALQUIERA


DE LOS SIGUIENTES TTULOS DE PRENTICE HALL:*
Justo a Tiempo

ESTADSTICA PARA ADMINISTRACIN

Berenson/Levine/Krehbiel, BASIC BUSINESS STATISTICS, 10/e


Groebner/Shannon/Fry/Smith, BUSINESS STATISTICS, 6/e
Levine/Stephan/Krehbiel/Berenson, STATISTICS FOR MANAGERS USING
MICROSOFT EXCEL, 4/e
Levine/Krehbiel/Berenson, BUSINESS STATISTICS:A FIRST COURSE, 4/e
Newbold/Carlson/Thorne, STATISTICS FOR BUSINESS AND ECONOMICS, 5/e
Shannon/Groebner/Fry/Smith, A COURSE IN BUSINESS STATISTICS, 3/e

PRODUCCIN/ADMINISTRACIN DE OPERACIN

Anupindi/Chopra/Deshmukh/Van Mieghem/Zemel, MANAGING BUSINESS


PROCESS FLOWS
Handfield/Nichols, Jr., SUPPLY CHAIN MANAGEMENT
Haksever/Render/Russell/Murdick, SERVICE MANAGEMENT AND OPERATIONS, 2/e
Hanna/Newman, INTEGRATED OPERATIONS MANAGEMENT
Heineke/Meile, GAMES AND EXERCISES IN OPERATIONS MANAGEMENT
Heizer/Render, OPERATIONS MANAGEMENT, 7/e
Krajewski/Ritzman, OPERATIONS MANAGEMENT, 7/e
Latona/Nathan, CASES AND READINGS IN POM
Russell/Taylor, OPERATIONS MANAGEMENT, 4/e
Schmenner, PLANT AND SERVICE TOURS IN OPERATIONS MANAGEMENT, 5/e
Nicholas, PROJECT MANAGEMENT, 2/e

CIENCIA DE LA ADMINISTRACIN/MODELACIN DE HOJAS DE TRABAJO

Eppen/Gould, INTRODUCTORY MANAGEMENT SCIENCE, 5/e


Moore/Weatherford, DECISION MODELING WITH MICROSOFT EXCEL, 6/e
Render/Stair/Hanna, QUANTITATIVE ANALYSIS FOR MANAGEMENT, 8/e
Render/Stair/Balakrishnan, MANAGERIAL DECISION MODELING WITHS
PREADSHEETS
Render/Stair, CASES AND READINGS IN MANAGEMENT SCIENCE
Taylor, INTRODUCTION TO MANAGEMENT SCIENCE, 8/e

Para mayor informacin, o para hablar con un representante del servicio a la medida,
llame al 1-800-777-6872.

www.prenhall.com/custombusiness

* La seleccin de ttulos del programa justo a tiempo (JIT) est sujeto a cambios
ESTADSTICA
PARA ADMINISTRACIN
CUAR TA EDICIN

DAVID M. LEVINE
Departamento de Estadstica y Sistemas de Informacin Computacionales
Zicklin School of Business, Baruch College, City University of New York

TIMOTHY C. KREHBIEL
Departamento de Ciencias de la Decisin y Administracin de Sistemas de Informacin
Richard T. Farmer School of Business, Miami University

MARK L. BERENSON
Departamento de Ciencias de la Informacin y Decisin
School of Business, Montclair State University

Traduccin:
MARTHA L. GONZLEZ ACOSTA
SERGIO A. DURN REYES
Traductores profesionales

Revisin tcnica:
DRA. OFELIA VIZCANO DAZ
Profesora del Departamento de Matemticas
Instituto Tecnolgico y de Estudios Superiores
de Monterrey, Campus Ciudad de Mxico
LEVINE, DAVID M., KREHBIEL, TIMOTHY C.
Y MARK L. BERENSON
Estadstica para administracin. Cuarta edicin
PEARSON EDUCACIN, Mxico, 2006
ISBN: 970-26-0802-3
rea: Matemticas

Formato: 21 27 cm Pginas: 648

Authorized translation from the English language edition, entitled Business statistics: a first course, by David M. Levine, Timothy C. Krehbiel and Mark L.
Berenson, published by Pearson Education, Inc., publishing as PRENTICE HALL, INC., Copyright 2006. All rights reserved.

ISBN 013-153689-3

Traduccin autorizada de la edicin en idioma ingls, titulada Business statistics: a first course de David M. Levine, Timothy C. Krehbiel y Mark L. Berenson,
publicada por Pearson Education, Inc., publicada como PRENTICE HALL INC., Copyright 2006. Todos los derechos reservados.

Esta edicin en espaol es la nica autorizada.

Edicin en espaol Edicin en ingls


Editor: Luis Miguel Cruz Castillo Executive Editor: Mark Pfaltzgraff
e-mail: luis.cruz@pearsoned.com Editorial Director: Jeff Shelstad
Supervisor de desarrollo: Felipe Hernndez Carrasco Managing Editor (Editorial): Alana Bradley
Supervisor de produccin: Enrique Trejo Hernndez Supplements Coordinator: Kathryn Sheehan Madara
Senior Editorial Assistant: Jane Avery
Product Development Manager: Nancy Welcher
Executive Marketing Manager: Debbie Clare
Marketing Assistant: Joanna Sabella
Senior Managing Editor (Production): Cynthia Regan
Senior Production Editor: Anne Graydon
Permissions Supervisor: Charles Morris
Production Manager: Arnold Vila
Design Manager: Maria Lange
Designer: Steve Frim
Director, Image Resource Center: Melinda Reo
Manager, Rights and Permissions: Zina Arabia
Manager, Visual Research: Beth Brenzel
Manager, Cover Visual Research & Permissions: Karen Sanatar
Manager, Print Production: Christy Mahon
Composition/Full-Service Project Management: GGS Book
Services, Atlantic Highlands
Printer/Binder: Courier

CUARTA EDICIN, 2006

D.R. 2006 por Pearson Educacin de Mxico, S.A. de C.V.


Atlacomulco Nm. 500-5 piso
Col. Industrial Atoto
53519, Naucalpan de Jurez, Edo. de Mxico
E- mail: editorial.universidades@pearsoned.com

Cmara Nacional de la Industria Editorial Mexicana.


Reg. Nm. 1031.

Prentice Hall es una marca registrada de Pearson Educacin de Mxico. S.A. de C.V.

Reservados todos los derechos. Ni la totalidad ni parte de esta publicacin pueden reproducirse, registrarse o transmitirse, por un sistema de recuperacin
de informacin, en ninguna forma ni por ningn medio, sea electrnico, mecnico, fotoqumico, magntico o electroptico, por fotocopia, grabacin o
cualquier otro, sin permiso previo por escrito del editor.

El prstamo, alquiler o cualquier otra forma de cesin de uso de este ejemplar requerir tambin la autorizacin del editor o
de sus representantes.

ISBN 970-26-0802-3

Impreso en Mxico. Printed in Mexico.


1 2 3 4 5 6 7 8 9 0 - 09 08 07 06
Para nuestras esposas,
Marilyn L., Patti K. y Rhoda B.

y para nuestros hijos,


Sharyn, Ed, Rudy, Rhonda, Kathy y Lori
CONTENIDO BREVE
Prefacio xxiii
1 INTRODUCCIN Y RECOLECCIN DE DATOS 1
2 PRESENTACIN DE DATOS EN TABLAS Y GRFICAS 21
3 MEDIDAS NUMRICAS DESCRIPTIVAS 71
4 PROBABILIDAD BSICA 121
5 ALGUNAS IMPORTANTES DISTRIBUCIONES DE PROBABILIDAD DISCRETA 153
6 LA DISTRIBUCIN NORMAL 177
7 DISTRIBUCIONES MUESTRALES 205
8 ESTIMACIN DE INTERVALOS DE CONFIANZA 237
9 FUNDAMENTOS DE LA PRUEBA DE HIPTESIS: PRUEBAS DE UNA MUESTRA 271
10 PRUEBAS DE DOS MUESTRAS Y ANOVA DE UNA VA 311
11 PRUEBAS DE CHI CUADRADA 377
12 REGRESIN LINEAL SIMPLE 409
13 REGRESIN MLTIPLE 465
14 APLICACIONES ESTADSTICAS EN ADMINISTRACIN DE LA CALIDAD
Y PRODUCTIVIDAD 505

Apndices A - G 537
Soluciones a los autoexmenes y respuestas a problemas pares seleccionados 589
ndice 615

xi
CONTENIDO

Prefacio xxiii

1 INTRODUCCIN Y RECOLECCIN DE DATOS 1


Uso de la estadstica: Good Tunes-Parte I 2
1.1 Conceptos bsicos de la estadstica 2
1.2 El crecimiento de la estadstica y las tecnologas de la informacin 4
1.3 Cmo est organizado este texto 5
1.4 Recoleccin de datosh 7
Identificacin de las fuentes de datos 7
1.5 Tipos de datos 8
Resumen 9
Conceptos clave 10
Problemas de repaso 11
Introduccin a los casos Web 11
A.1 Introduccin del uso de los programas estadsticos 12
A1.1 Uso de Windows 12
A1.2 Introduccin a Excel 13
A1.3 Introduccin a Minitab 17
A1.4 (Tema CD-ROM) Introduccin a SPSS

2 PRESENTACIN DE DATOS EN TABLAS Y GRFICAS 21


Uso de la estadstica: Comparacin de los rendimientos de los fondos de inversin 22
2.1 Tablas y grficas para datos categricos 22
Tabla de resumen 22
Grfica de barras 23
Grfica de pastel 24
Diagrama de Pareto 25
2.2 Organizacin de los datos numricos 29
Arreglo ordenado 30
Diagrama de tallo y hojas 30
2.3 Tablas y grficas para datos numricos 32
Distribucin de frecuencias 32
Distribucin de frecuencias relativas y distribucin de porcentajes 34
Distribucin acumulativa 35
Histograma 37
Polgono 38
Polgono de porcentaje acumulado (ojiva) 40

xiii
xiv Contenido

2.4 Tablas y grficas de datos bivariados 43


Tabla de contingencia 43
Grfica de barras agrupadas 45
2.5 Diagramas de dispersin y series de tiempo 47
Diagrama de dispersin 47
Series de tiempo 48
2.6 Uso inadecuado de grficas y consideraciones ticas 51
Resumen 54
Conceptos clave 55
Problemas de repaso 55
Caso actual: Administracin del Springville Herald 62
Caso Web 62
A.2 Uso del software para tablas y grficas 63
A2.1 Excel 63
A2.2 Minitab 65
A2.3 (Tema CD-ROM) SPSS

3 MEDIDAS NUMRICAS DESCRIPTIVAS 71


Uso de la estadstica: Evaluacin de los rendimientos de los fondos de inversin 72
3.1 Medidas de tendencia central, variacin y forma 72
La media 73
La mediana 75
La moda 76
Cuartiles 77
La media geomtrica 79
Rango 80
Rango intercuartil 81
La varianza y la desviacin estndar 82
Coeficiente de variacin 85
Puntuaciones Z 86
Forma 88
Resultados de la estadstica descriptiva en Excel 88
Exploraciones visuales: Exploracin de la estadstica descriptiva 89
Resultados de la estadstica descriptiva en Minitab 89
3.2 Medidas numricas descriptivas de una poblacin 94
La media poblacional 94
Varianza y desviacin estndar poblacionales 95
La regla emprica 96
La regla de Chebyshev 97
3.3 Anlisis exploratorio de datos 99
Resumen de cinco nmeros 99
Grfica de caja y bigote 100
3.4 La covarianza y el coeficiente de correlacin 103
La covarianza 103
Coeficiente de correlacin 105
Contenido xv

3.5 Errores en las medidas numricas descriptivas y consideraciones ticas 109


Aspectos ticos 110
Resumen 110
Conceptos clave 111
Problemas de repaso 112
Caso actual: Administracin del Springville Herald 118
Caso Web 118
A3 Uso de software para la estadstica descriptiva 118
A3.1 Excel 118
A3.2 Minitab 119
A3.3 SPSS (tema del CD-ROM)

4 PROBABILIDAD BSICA 121


Uso de la estadstica: La empresa Consumer Electronics 122
4.1 Conceptos bsicos de probabilidad 122
Espacios muestrales y eventos 124
Tablas de contingencia y diagramas de Venn 125
Probabilidad simple (marginal) 125
Probabilidad conjunta 127
Regla general de la adicin 128
4.2 Probabilidad condicional 131
Clculo de probabilidades condicionales 131
rboles de decisin 133
Independencia estadstica 134
Reglas de multiplicacin 136
Probabilidad marginal usando la regla general de la multiplicacin 137
4.3 Teorema de bayes 139
4.4 Reglas de conteo 143
4.5 Consideraciones ticas y probabilidad 146
Resumen 147
Conceptos clave 148
Problemas de repaso 148
Caso Web 150
A.4 Uso del software para la probabilidad bsica 151
A4.1 Excel 151

5 ALGUNAS IMPORTANTES DISTRIBUCIONES DE PROBABILIDAD


DISCRETA 153
Uso de la estadstica: El sistema de informacin contable de la empresa de remodelaciones
Saxon 154
5.1 Distribucin de probabilidad de una variable aleatoria discreta 154
Valor esperado de una variable aleatoria discreta 155
Varianza y desviacin estndar de una variable aleatoria discreta 156
5.2 Distribucin binomial 158
5.3 Distribucin de Poisson 166
Resumen 171
xvi Contenido

Conceptos clave 171


Problemas de repaso 172
Caso actual: Administracin del Springville Herald 174
A.5 Uso de software para distribuciones de probabilidad discretas 175
A5.1 Excel 175
A5.2 Minitab 176

6 LA DISTRIBUCIN NORMAL 177


Uso de la estadstica: Tiempo de descarga para la pgina principal de un sitio Web 178
6.1 Distribuciones de probabilidad continua 178
6.2 La distribucin normal 179
6.3 Evaluacin de la normalidad 194
Evaluacin de las propiedades 194
Construccin de un plano de probabilidad normal 195
Resumen 199
Conceptos clave 199
Problemas de repaso 199
Caso actual: Administracin del Springville Herald 201
Caso Web 202
A.6 Uso del software con la distribucin normal 202
A6.1 Excel 202
A6.2 Minitab 202
A6.3 (Tema del CD-ROM) SPSS

7 DISTRIBUCIONES MUESTRALES 205


Uso de la estadstica: Proceso de empaquetado de cajas de cereal 206
7.1 Distribuciones muestrales 206
7.2 Distribucin muestral de la media 207
Propiedad de imparcialidad de la media muestral 207
Error estndar de la media 208
Muestreo de poblaciones con distribucin normal 210
Muestreo de poblaciones sin distribucin normal Teorema del lmite central 213

7.3 Distribuciones muestrales de una proporcin 217


7.4 Tipos de mtodos de muestreo para encuestas 220
Muestra aleatoria simple 221
Muestra sistemtica 223
Muestra estratificada 224
Muestra de conglomerados 224
7.5 Evaluacin de las virtudes de una encuesta 226
Errores de encuesta 226
Consideraciones ticas 228
Resumen 229
Conceptos clave 230
Problemas de repaso 230
Contenido xvii

Caso actual: Administracin del Springville Herald 233


Caso Web 233
A.7 Uso de software para las distribuciones muestrales 234
A7.1 Excel 234
A7.2 Minitab 234

8 ESTIMACIN DE INTERVALOS DE CONFIANZA 237


Uso de la estadstica: Facturas de ventas auditadas en la empresa de remodelaciones
Saxon 238
8.1 conocida)
Estimacin del intervalo de confianza para la media ( 239
8.2 desconocida)
Estimacin del intervalo de confianza para la media ( 243
Distribucin t Student 243
Propiedades de la distribucin t 244
El concepto de grados de libertad 245
El establecimiento del intervalo de confianza 246
8.3 Estimacin del intervalo de confianza de una proporcin 250
8.4 Determinacin del tamao de la muestra 254
Determinacin del tamao de la muestra para la media 254
Determinacin del tamao de la muestra para la proporcin 256
8.5 Estimacin del intervalo de confianza y consideraciones ticas 260
Resumen 260
Conceptos clave 261
Problemas de repaso 261
Caso actual: Administracin del Springville Herald 265
Caso Web 266
A.8 Uso del software para los intervalos de confianza y la determinacin del
tamao de la muestra 267
A8.1 Excel 267
A8.2 Minitab 268
A8.3 (Tema del CD-ROM) SPSS

9 FUNDAMENTOS DE LA PRUEBA DE HIPTESIS:


PRUEBAS DE UNA MUESTRA 271
Uso de la estadstica: Una visita ms a la Oxford Cereal Company 272
9.1 Metodologa de la prueba de hiptesis 272
Hiptesis nula y alternativa 272
Valor crtico del estadstico de prueba 274
Regiones de rechazo y aceptacin 274
Riesgos de la toma de decisiones al utilizar la metodologa de la prueba
de hiptesis 275
9.2 conocida)
Prueba Z de hiptesis para la media ( 278
Mtodo del valor crtico para la prueba de hiptesis 278
Mtodo del valor-p para la prueba de hiptesis 281
Conexin entre la estimacin del intervalo de confianza y la prueba
de hiptesis 284
xviii Contenido

9.3 Pruebas de una cola 286


Mtodo del valor crtico 286
Mtodo del valor-p 287
9.4 desconocida)
Prueba t de hiptesis para la media ( 290
Mtodo del valor crtico 291
Mtodo del valor-p 293
Revisin de suposiciones 293
9.5 Prueba Z de hiptesis para la proporcin 297
Mtodo del valor crtico 298
Mtodo del valor-p 299
9.6 Posibles obstculos en las pruebas de hiptesis y consideraciones ticas 301
Resumen 304
Conceptos clave 305
Problemas de repaso 305
Caso actual: Administracin del Springville Herald 308
Caso Web 308
A.9 Uso de software para las pruebas de hiptesis con una muestra 309
A9.1 Excel 309
A9.2 Minitab 309
A9.3 (Tema de CD-ROM) SPSS

10 PRUEBAS DE DOS MUESTRAS Y ANOVA DE UNA VA 311


Uso de la estadstica: Comparacin de las ventas de los exhibidores al final
del pasillo y los exhibidores normales 312
10.1 Comparacin de medias de dos poblaciones independientes 312
Prueba Z para la diferencia entre dos medias 312
Prueba t de varianza conjunta para diferencias entre dos medias 313
Estimacin del intervalo de confianza para la diferencia entre las medias
de dos poblaciones independientes 318
Prueba t de varianza separada para la diferencia entre dos medias 318
10.2 Comparacin de medias de dos poblaciones relacionadas 322
Prueba t apareada 324
Estimacin del intervalo de confianza para la diferencia de la media 329
10.3 Comparacin de proporciones de dos poblaciones 332
Prueba Z para la diferencia entre dos proporciones 332
Estimacin del intervalo de confianza para la diferencia entre dos proporciones 336
10.4 Prueba F para la diferencia entre dos varianzas 338
Encontrar el valor crtico de la cola inferior 340
Uso de la estadstica: La empresa Perfect Parachute Company 346
10.5 Anova de una va 346
Prueba F para las diferencias entre ms de dos medias 346
Comparaciones mltiples: el procedimiento Tukey-Kramer 353
Suposiciones de ANOVA 355
La prueba de la homogeneidad de la varianza de Levene 356
Contenido xix

Resumen 361
Conceptos clave 363
Problemas de repaso 363
Caso actual: Administracin del Springville Herald 369
Caso Web 370
A.10 Uso del software para pruebas de dos muestras y ANOVA de una va 371
A10.1 Excel 371
A10.2 Minitab 373
A10.3 (Tema del CD-ROM) SPSS

11 PRUEBAS DE CHI CUADRADA 377


Uso de la estadstica: Satisfaccin de los huspedes en T.C. Resort Properties 378
11.1 Prueba de chi cuadrada para la diferencia entre dos proporciones
(muestras independientes) 378
11.2 Prueba de chi cuadrada para las diferencias entre ms de dos proporciones 386
Procedimiento de Marascuilo 389
11.3 Prueba de independencia con chi cuadrada 393
Resumen 399
Conceptos clave 401
Problemas de repaso 401
Caso actual: Administracin del Springville Herald 405
Caso Web 406
A.11 Uso de software para pruebas de chi cuadrada 407
A11.1 Excel 407
A11.2 Minitab 407
A11.3 (Tema de CD-ROM) SPSS

12 REGRESIN LINEAL SIMPLE 409


Uso de la estadstica: Pronstico de ventas para una tienda de ropa 410
12.1 Tipos de modelos de regresin 410
12.2 Cmo determinar la ecuacin de la regresin lineal simple 412
El mtodo de mnimos cuadrados 413
Exploraciones visuales: Explorando los coeficientes de la regresin lineal simple 416
Predicciones en el anlisis de regresin: interpolacin contra extrapolacin 417
Clculo de la interseccin en Y, b0, y de la pendiente b1 417
12.3 Medidas de variacin 421
Clculo de la suma de cuadrados 421
El coeficiente de determinacin 424
Estimacin del error estndar 426
12.4 Suposiciones 428
12.5 Anlisis residual 428
Evaluacin de las suposiciones 428
12.6 Medicin de la autocorrelacin: estadstico de Durbin-Watson 433
Grfica residual para detectar la autocorrelacin 433
El estadstico de Durbin-Watson 435
xx Contenido

12.7 Inferencias sobre la pendiente y el coeficiente de correlacin 438


Prueba t para la pendiente 438
Prueba F para la pendiente 440
Estimacin del intervalo de confianza para la pendiente (1) 441
Prueba t para el coeficiente de correlacin 442
12.8 Estimacin de los valores de la media y prediccin de los valores individuales 445
La estimacin del intervalo de confianza 445
El intervalo de prediccin 447
12.9 Dificultades de la regresin y consideraciones ticas 450
Resumen 453
Conceptos clave 455
Problemas de repaso 455
Caso actual: Administracin del Springville Herald 460
Caso Web 461
A.12 Uso de software para la regresin lineal simple 462
A12.1 Excel 462
A12.2 Minitab 464
A12.3 (Tema de CD-ROM) SPSS

13 REGRESIN MLTIPLE 465


Uso de la estadstica: Pronstico de ventas de OmniPower 466
13.1 Desarrollo del modelo de regresin mltiple 466
Interpretacin de los coeficientes de regresin 467
Pronstico de la variable dependiente Y 470
13.2 r2, r2 ajustada y prueba F global 472
Coeficiente de determinacin mltiple 472
Prueba de la significancia del modelo de regresin mltiple global 473
13.3 Anlisis residual para el modelo de regresin mltiple 476
13.4 Inferencias respecto a los coeficientes de regresin poblacionales 478
Pruebas de hiptesis 478
Estimacin del intervalo de confianza 480
13.5 Uso de variables indicadoras y trminos de interaccin en los modelos
de regresin 482
Interacciones 484
13.6 Modelo de regresin cuadrtica 488
Cmo encontrar los coeficientes de regresin y pronstico de Y 489
Prueba de la significancia del modelo cuadrtico 492
Prueba del efecto cuadrtico 492
Resumen 496
Conceptos clave 498
Problemas de repaso 498
Caso actual: Administracin del Springville Herald 501
Caso Web 501
A.13 Uso de software para la regresin mltiple 502
A13.1 Excel 502
Contenido xxi

A13.2 Minitab 503


A13.3 (Tema de CD-ROM) SPSS

14 APLICACIONES ESTADSTICAS EN ADMINISTRACIN


DE LA CALIDAD Y PRODUCTIVIDAD 505
Uso de la estadstica: Servicio de calidad en el hotel Beachcomber 506
14.1 Administracin de calidad total 506
14.2 Administracin Seis Sigma 509
14.3 La teora de grficas de control 509
14.4 Grfica de control para la proporcin de artculos disconformes: la grfica p 512
14.5 El experimento de la cuenta roja: comprendiendo el proceso de variablidad 518
14.6 Grficas de control para el rango y la media 520
La grfica R 521
La grfica 
X 523
Resumen 527
Conceptos clave 528
Problemas de repaso 528
Caso actual: Administracin del Springville Herald 533
A.14 Uso de software para las grficas de control 535
A14.1 Excel 535
A14.2 Minitab 535
A14.3 (Tema de CD-ROM) SPSS

APNDICES 537
A. Repaso de aritmtica, lgebra y logaritmos 538
B. Notacin de sumatoria 540
C. Smbolos estadsticos y alfabeto griego 543
D. Contenido del CD-ROM 544
E. Tablas 549
F. Uso de Excel con este libro 574
G. Gua del usuario de PHStat2 576
Soluciones a los autoexmenes y repuestas a problemas pares seleccionados 589
ndice 615
PREFACIO
Filosofa educacional
Durante muchos aos de ensear estadstica a estudiantes de administracin, continuamente hemos
buscado formas para mejorar estos cursos. Nuestra activa participacin en las series Haciendo la
estadstica ms efectiva en las escuelas y en la administracin en el Instituto de Ciencias de la De-
cisin y en las conferencias de la American Statistical Association, as como la oportunidad de aten-
der a un diversificado grupo de estudiantes en las grandes universidades, ha moldeado nuestra visin
de la enseanza de estos cursos. A lo largo de los aos, nuestra visin ha llegado a incluir estos prin-
cipios clave:

1. Se necesita mostrar a los estudiantes la importancia de la estadstica.


Los estudiantes necesitan un marco de referencia cuando aprenden estadstica, especial-
mente cuando sta no es su especialidad. Ese marco de referencia para los estudiantes de
administracin debe comprender las reas funcionales de negocios, esto es, contabilidad,
economa y finanzas, sistemas de informacin, administracin y marketing. Cada tema es-
tadstico necesita presentarse en un contexto aplicado relacionado por lo menos con una de
estas reas funcionales.
El enfoque de la enseanza en cada tema debera partir de su aplicacin a la administra-
cin, la interpretacin de resultados, la presentacin de suposiciones, la evaluacin de las
suposiciones y la discusin acerca de lo que debera hacerse si las suposiciones son infrin-
gidas.
2. Los estudiantes deben familiarizarse con el software que se usa en el mundo de los negocios.
Integrar las hojas de trabajo o el software estadstico en todos los aspectos de un curso de
introduccin a la estadstica permite que el curso se enfoque en la interpretacin de los re-
sultados antes que en los clculos.
Los cursos de introduccin a la estadstica en la administracin deben reconocer que en los
negocios el software de hojas de trabajo est disponible en el escritorio de toma de decisio-
nes (en ocasiones tambin hay software estadstico).
3. Los estudiantes requieren de suficiente gua para usar el software.
Los libros de texto deben proporcionar suficientes instrucciones como para que los alum-
nos puedan usar de forma efectiva el software e integrarlo al estudio de la estadstica, sin
permitir que la instruccin del software domine el curso.
4. Los estudiantes requieren de suficiente prctica para comprender cmo se usa la estadstica en
la administracin.
Es recomendable que los ejemplos en clase y los ejercicios de tarea incluyan datos actua-
les o reales tanto como sea posible.
Los alumnos deben trabajar con conjuntos de datos, tanto pequeos como grandes, y ser
animados a ver ms all del anlisis estadstico de los datos para interpretar los resultados
en un contexto administrativo.

Las innovaciones en esta edicin


Esta cuarta edicin de Estadstica para administracin ha mejorado en varias reas importantes.

Es ms accesible para los estudiantes


Cada captulo en este texto ha pasado por una revisin mayor y ahora se utiliza un estilo de es-
critura ms activo y conversacional que los estudiantes apreciarn. Las oraciones se han acor-
tado y simplificado.
El texto se enfoca ahora ms en aquellos temas que se cubren de forma caracterstica en un
primer curso. La cobertura de la regresin mltiple se redujo y se elimin el pronstico de las
series de tiempo.

xxiii
xxiv Prefacio

En el texto se incluyen ahora muchos ms ejemplos de la vida cotidiana. Tales ejemplos inclu-
yen aquellos acerca de las compras on line (captulo 2), el tiempo para estar listo en la maa-
na (captulo 3), y el tiempo de espera en un restaurante de comida rpida (captulo 9).
Hemos simplificado muchos problemas para que no contengan ms de cuatro partes.
Se incluyen frmulas importantes al final de cada captulo.
Al final del texto se proporcionan las soluciones a las preguntas de los autoexmenes.
Se incluye un mapa para seleccionar el mtodo estadstico adecuado al inicio del texto para
ayudar a los estudiantes a seleccionar la tcnica apropiada y para realizar conexiones entre los
temas.
Se han agregado a este texto muchos ejemplos y ejercicios nuevos tomados de The Wall Street
Journal, USA Today y Consumer Reports, as como de otras fuentes.
En casi todos los captulos se incluye al final un caso web. Al visitar sitios Web relacionados
con las empresas e investigar los temas que surgen del escenario Uso de la estadstica al ini-
cio de cada captulo, los estudiantes aprenden a identificar el mal uso que se le da a la infor-
macin estadstica. Los casos Web requieren que los estudiantes examinen cuidadosamente
las afirmaciones y la informacin variada para descubrir qu datos son los ms relevantes pa-
ra el caso. Los alumnos entonces debern determinar si los datos apoyan las conclusiones y
afirmaciones. (En el Manual de soluciones para el instructor se incluyen algunos consejos pa-
ra usar los casos Web.)

Mayor instruccin de software


Los apndices de Excel al final de cada captulo ahora explican cmo utilizar las hojas de
trabajo estndar de Excel para realizar la mayora de los anlisis estadsticos. Instructores y
estudiantes que desean evitar el uso de anexos, encontrarn de inmediato la utilidad de estas
nuevas instrucciones. (Quienes elijan utilizar el apndice referente a PHStat2 de Excel, en-
contrarn que se han colocado juntas todas las explicaciones de los comandos de PHStat2 en
un nuevo apndice G para una fcil referencia.)

Muchas de las hojas de trabajo estndar de Excel examinadas en los apndices Excel estn in-
cluidas como ilustraciones dentro de los captulos. Cada ilustracin (vase el ejemplo de arri-
ba) incluye un listado de todas las frmulas de celda contenidas en la hoja de trabajo. (Los
usuarios de PHStat2 tambin encontrarn informativas estas ilustraciones ya que son consis-
tentes con las hojas de trabajo que el PHStat2 genera.)
Con este texto se incluye gratis una versin actualizada de PHStat2: PHStat2 versin 2.5, la
versin ms nueva de agregados de Prentice Hall para Excel. Esta versin actualizada incluye
elementos como la regresin mltiple con variables independientes en columnas no conti-
guas, diagramas de tallo y hojas y grficas de caja y bigote mejorados, la prueba Z para la
diferencia de dos medias, la prueba de Levene para la homogeneidad de la varianza y el
procedimiento de Marascuilo de mltiples comparaciones para proporciones. (Encontrar
apoyo para el uso de PHStat2, incluyendo actualizaciones gratis cuando estn disponibles, en
www.prenhall.com/phstat.)
Prefacio xxv

Uso Minitab, versin 14, la ms reciente del software estadstico de Minitab. Todos los resul-
tados y todos los apndices de Minitab en este texto provienen de esa versin, la ltima del
software estadstico de Minitab.

Reorganizacin de los captulos acerca de la prueba de hiptesis


Todas las pruebas que implican la distribucin normal y la distribucin t se estudian en los ca-
ptulos 9 y 10 antes de la cobertura de la prueba F.
El anlisis de varianza se estudia en el captulo 10.
Todas las pruebas de chi cuadrada se ven en el captulo 11.

Cambios por captulos en la cuarta edicin


Cada captulo tiene una nueva pgina inicial que indica las secciones y apartados que lo componen.
Captulo 1. Se rescribieron las secciones 1.1, 1.2 y 1.3. Los apartados que tratan acerca del
muestreo de encuestas se cambiaron al captulo 7.
Captulo 2. Contiene nuevos datos acerca de los rendimientos de los fondos de inversin para
el periodo comprendido entre 1999 y 2003. Las grficas para las variables categricas se pre-
sentan antes que las grficas para variables numricas. Todas las grficas para una variable se
exponen antes que las grficas para dos variables. Se agregan ejemplos dentro del captulo
concernientes a las ventas on line y al costo de los alimentos en restaurantes, adems de los re-
ferentes a los fondos de inversin.
Captulo 3. Cuenta con un nuevo conjunto de datos concernientes a los rendimientos entre
1999 y 2003 de los fondos de inversin. Los ejemplos dentro del captulo se refieren al tiem-
po que se requiere para prepararse en la maana as como a los rendimientos de fondos de in-
versin, se incluyen ahora puntuaciones Z para detectar valores extremos incluidos. La cova-
rianza de la muestra se presenta ahora junto con el coeficiente de correlacin.
Captulo 4. Ahora incluye el teorema de Bayes y las reglas de conteo.
Captulo 5. Abarca ahora la distribucin de Poisson. La distribucin normal se pas al captulo 6.
Captulo 6. Se dedica por completo a la distribucin normal e incluye una seccin simplifica-
da de la grfica de probabilidad normal.
Captulo 7. Incluye las distribuciones muestrales y los mtodos de tipos y muestreo de en-
cuesta; se explica el valor de la encuesta.
Captulo 8. Incluye la estimacin del intervalo de confianza y cmo determinar el tamao de
la muestra.
Captulo 9. Utiliza un mtodo ms simple de seis pasos para realizar pruebas de hiptesis
usando el enfoque del valor crtico y un mtodo claro de cinco pasos para realizar la prueba de
hiptesis utilizando el enfoque del valor-p.
Captulo 10. Est reorganizado para que las pruebas de dos muestras para la media y la pro-
porcin precedan a la prueba F de la diferencia entre varianzas. El captulo tambin incluye el
ANOVA de una va.
Captulo 11. Incluye nicamente las pruebas 2.
Captulo 12. Ahora incluye clculos para los coeficientes de regresin y suma de cuadrados
en los ejemplos del captulo.
Captulo 13. Ahora abarca r2, r2 ajustada y la prueba F global antes del anlisis residual. El
captulo tambin incluye la regresin cuadrtica.
Captulo 14. Se incluye la administracin Seis Sigma.

Caractersticas distintivas
Hemos dado continuidad a muchos elementos tradicionales de ediciones anteriores. Hemos resalta-
do algunas de las siguientes caractersticas:

Escenarios de negocios Uso de la estadstica Cada captulo inicia con un ejemplo del
Uso de la estadstica, que muestra cmo la estadstica se utiliza en la contabilidad, las finan-
zas, la administracin o el marketing. Cada escenario se usa a lo largo del captulo para ofre-
cer un contexto aplicado para los conceptos.
xxvi Prefacio

U S O D E L A E S TA D S T I C A
Comparacin de los rendimientos
de los fondos de inversin
Entre las muchas opciones de inversin disponibles en la actualidad, una
eleccin comn para quienes piensan en su retiro son los fondos de inver-
sin. Si usted decide invertir en fondos de inversin su cuenta de retiro, qu
hara para hacer una eleccin razonable de entre todos los fondos disponi-
bles hoy?
Primero debera conocer las diferentes categoras de los fondos de in-
versin. Debera conocer las estrategias de los profesionales que adminis-
tran los fondos. Invierten en valores de alto riesgo o hacen elecciones ms
conservadoras? El fondo se especializa en un determinado tamao de com-
paa, uno cuya reserva principal totaliza un gran capital o uno de capital re-
ducido? Cobra el fondo comisiones por administracin que reducen el por-
centaje de utilidad del inversionista? Y, por supuesto, debera conocer qu
tan bien el fondo ha manejado las inversiones en el pasado.
Todos stos son datos que debe revisar cuando considere varias posibi-
lidades de invertir en fondos de inversin. Cmo poner manos a la obra
con estos datos y explorarlos de manera exhaustiva?

nfasis en el anlisis de datos e interpretacin de los resultados en computadora. Cree-


mos que el uso del software es una parte integral del aprendizaje de la estadstica. Nuestro en-
foque destaca el anlisis de datos interpretando los resultados de Excel y Minitab, al mismo
tiempo que reduce el nfasis en hacer clculos. Por esa razn, hemos incluido ms resultados
de computadora y los hemos integrado al texto. Por ejemplo, en las tablas y grficas del cap-
tulo 2, el enfoque es en la interpretacin, no en su construccin manual. En nuestra exposicin
de la prueba de hiptesis del captulo 9 hasta el 11, se incluyen de forma extensa los resulta-
dos de computadora para que el nfasis se ponga en el mtodo del valor-p. En nuestra expli-
cacin de la regresin lineal simple del captulo 12, suponemos que se utiliza Excel o Minitab.
As que el nfasis est en la interpretacin del resultado y no en los clculos manuales.
Auxiliares pedaggicos. Se incluyen en cada captulo, con un estilo de escritura sencillo,
cuadros de ecuaciones numeradas, una serie de ejemplos para reforzar los conceptos aprendi-
dos, problemas divididos en Aprendizaje bsico y Aplicacin de conceptos, as como concep-
tos clave.
Apndices al final del captulo. Usando Excel y la versin 14 de Minitab con ilustraciones,
se incluyen instrucciones fciles de seguir. Las instrucciones para PHStat2 se incluyen en el
apndice G. Los apndices SPSS se incluyen en el CD-ROM que acompaa este texto.
Respuestas. Se incluyen las respuestas para la mayora de los ejercicios pares al final del li-
bro.
PHStat2. En el CD-ROM para estudiantes se incluye un programa complementario para Excel
que incrementa sus capacidades estadsticas y ejecuta para usted el men de seleccin de bajo
nivel y las entradas de las tareas de hojas de trabajo asociadas con la realizacin de los anli-
sis estadsticos en Excel. Al combinarlo con el Data Analysis ToolPak de Excel, se pueden
ilustrar virtualmente todos los mtodos estadsticos enseados en un curso de introduccin a
la estadstica utilizando Excel.
Estudios de caso y proyectos en equipo. Se incluyen estudios de caso detallados al final de
varios captulos. El caso del Springville Herald se incluye al final de prcticamente todos los
captulos como tema integrador. Al final de muchos captulos se incluye un Proyecto en equi-
po relacionado con los fondos de inversin como tema integrador.
Exploraciones visuales. Se incluye gratuitamente con este texto un libro de trabajo de Excel,
que permite a los estudiantes explorar de forma interactiva conceptos importantes en estads-
tica descriptiva, probabilidad, distribucin normal y anlisis de regresin. Por ejemplo, en la
estadstica descriptiva, los estudiantes observan el efecto que tiene el cambio de datos en
la media, mediana, cuartiles y desviacin estndar. En las distribuciones muestrales, los estu-
diantes utilizan la simulacin para explorar el efecto del tamao de la muestra en la distribu-
cin muestral. Con la distribucin normal, los estudiantes logran ver el efecto que tienen los
cambios en la media y la desviacin estndar sobre las reas bajo la curva normal. En el an-
lisis de regresin, los alumnos tienen la oportunidad de ajustar una lnea y observar cmo
cambia la pendiente y cmo la interseccin afecta el ajuste. (Exploraciones visuales requiere
la instalacin del sistema de seguridad Medio de Excel.)
Prefacio xxvii

Paquete complementario
El paquete complementario que acompaa este texto incluye el siguiente material:

Manual de soluciones para el instructor. Este manual incluye recomendaciones de ensean-


za para cada captulo, detalles extra para la solucin de problemas y muchas soluciones para
Excel y Minitab.
Manual de soluciones para el estudiante. Este manual proporciona soluciones detalladas
para prcticamente todos los ejercicios pares.
Archivo de reactivos de examen. El archivo de reactivos de examen contiene preguntas de
cierto/falso, de opcin mltiple, llenado y solucin de problemas con base en las definiciones,
conceptos e ideas desarrollados en cada captulo del texto.
Software de exmenes TestGen. Este banco de exmenes impreso est diseado para utili-
zarse con el software generador de exmenes TestGen. Este paquete computarizado permite a
los instructores disear, guardar y generar exmenes para el saln de clases. El programa per-
mite a los maestros editar, aumentar o borrar las preguntas del banco de exmenes; editar las
grficas existentes y crear nuevas; analizar los resultados de los exmenes, y organizar una
base de datos de las pruebas y de los resultados de los alumnos. Este software permite una ma-
yor flexibilidad y es fcil de utilizar. Ofrece muchas opciones para organizar y presentar las
pruebas, junto con una caracterstica de buscar y seleccionar. El programa est disponible tan-
to en el CD-ROM del instructor como en el catlogo on line de Prentice Hall para su descarga.
Centro de recursos para el instructor. Este centro de recursos para el instructor contiene los
archivos electrnicos completos para el Manual de soluciones del instructor (en Word), el Ar-
chivo de reactivos de examen (en Word), el Archivo computarizado de reactivos de examen
(Word), TestGen, y presentaciones en PowerPoint.
Herramientas administrativas para el curso y tareas
Prentice Halls OneKey. Ofrece los mejores recursos de enseanza y aprendizaje en un solo lu-
gar. Todo lo que usted necesita para planear y administrar su curso lo encontrar en OneKey pa-
ra Estadstica en la administracin, Un primer curso, 4a. edicin, y es todo lo que sus alumnos
necesitan para tener acceso a los materiales de su curso en cualquier momento y desde cualquier
lugar. La compilacin de recursos est convenientemente organizada siguiendo los captulos del
libro de texto e incluye: vnculos a exmenes, presentaciones en PowerPoint, archivos de datos,
vnculos a los casos Web, descarga de PHStat2, Descarga de Exploraciones visuales, Manual de
soluciones para el estudiante, as como recursos instruccionales adicionales.
WebCT y Pizarrn. Con la instalacin local de algn curso de sistema de administracin,
Prentice Hall brinda contenidos diseados especficamente para este libro de texto con el fin
de crear un juego completo para el curso, integrado estrechamente con las herramientas del
sistema de administracin del curso.
PH Grade Assist. Este sistema on line de tareas y evaluacin permite al instructor asignar
problemas para que los estudiantes practiquen y resuelvan tareas o exmenes. Los problemas,
tomados directamente del texto, son generados algortmicamente, para que cada estudiante re-
ciba un problema ligeramente diferente con una respuesta distinta. Esta caracterstica permite
al alumno realizar intentos mltiples para adquirir ms prctica y mejorar su competencia. El
PH Grade Assist califica los resultados y los traslada a las hojas de trabajo de Excel.
Sitio Web acompaante. Este sitio contiene:
Una gua de estudio en lnea con preguntas de cierto/falso, de opcin mltiple y de ensayo,
diseadas para probar la comprensin del alumno en los temas del captulo.
Archivos con presentaciones en PowerPoint con lo ms importante del captulo y sus
correspondientes frmulas.
Archivos de datos de los alumnos para los problemas del texto en Excel, Minitab y SPSS.
Versin Minitab para el estudiante. Por un costo adicional razonable, se puede incluir una
versin para el alumno de Minitab Versin 14. Por favor, pngase en contacto con su repre-
sentante de ventas de Prentice Hall para informacin sobre cmo hacer un pedido.
Versin SPSS para el alumno. Por un costo adicional razonable, se puede incluir una versin
del SPSS 12 con este texto. Por favor, pngase en contacto con su representante de ventas de
Prentice Hall para informacin sobre cmo hacer un pedido.
Sitio Web del texto. Este texto tiene una pgina en la World Wide Web en www.prenhall.
com/levine. Este sitio ofrece muchos de los recursos tanto para maestros como para alumnos.
PHStat2 tiene una pgina en la World Wide Web en www.prenhall.com/phstat.
xxviii Prefacio

Es posible encontrar una pgina ndice para el material de apoyo para todos los casos Web
incluidos en este texto en www.prenhall.com/Springville/Springvillecc.htm.

Agradecimientos
Estamos especialmente agradecidos con muchas organizaciones y empresas que nos permitieron uti-
lizar sus datos para desarrollar problemas y ejemplos a lo largo del texto. Quisiramos agradecer a
The New York Times, Consumer Union (editores de Consumer Reports), Mergents Investor Service
(editores de Mergents Handbook of Common Stocks) y CEEPress.
Adems, quisiramos dar las gracias a Biometrika Trustees, American Cyanimid Company,
Rand Corporation y la American Society for Testing and Materials (por su amable permiso para pu-
blicar varias tablas en el apndice E), as como a la American Statistical Association (por su permi-
so para publicar diagramas de American Statician).

Una nota de agradecimiento


Deseamos agradecer a Randy Craig, Salem State University; Mark Eakin, University of Texas-Ar-
lington; Kathy Ernstberger, Indiana University-Southeast; Kimberley Killmer Hollister, Montclair
State University; C.P. Kartha, University of Michigan, Flint; Robert Lemke, Lake Forest College; Ram
Misra, Montclair State University; Prashant Palvia, University of North Carolina, Greensboro; Susan
Pariseau, Merrimack College; Brock Williams, Texas Tech University; Frederick Wiseman, Nort-
heastern University; Reginald Worthley, University of Hawaii, Manoa; y Charles Zimmerman, Ro-
bert Morris College, por sus comentarios que contribuyeron a mejorar este libro.
Especialmente agradecemos a Debbie Clare, Mark Pfaltzgraff, Jeff Shelstad, Alana Bradley,
Anne Graydon, Cynthia Regan, Nancy Welcher y Jane Avery de los equipos editoriales, de marke-
ting y produccin de Prentice Hall. Ha sido un privilegio trabajar con Tom Tucker en este proyecto
as como en muchos proyectos previos. Como ahora Tom cambia de profesin, extraaremos mucho
su discernimiento, apoyo y dedicacin. Gracias Tom y buena suerte!
Queremos agradecer a nuestros lectores y revisores especialistas Annie Puciloski, Stonehill Co-
llege y James Zimmer, Chatanooga State University, por su diligencia al revisar nuestro trabajo; a
Robie Grant por su revisin de pruebas; a Julie Kennedy por su trabajo de edicin, y a Sandra Kraus-
man de GGS Book Services, Atlantic Highlands, por su trabajo en la produccin de este texto.
Estamos muy agradecidos por el amor y apoyo de nuestras familias. Nuestros padres Reuben y
Lee Levine, Marvin Krehbiel, Roberta Reed y Nat y Ethel Berenson, nos han bendecido con una vi-
da de apoyo. Por ltimo, quisiramos agradecer a nuestras esposas e hijos por su paciencia, com-
prensin, amor y apoyo para hacer de este libro una realidad. Es a ellos a quienes dedicamos esta
obra.

Comentarios finales
Hemos llegado lejos para hacer este texto slido desde el punto de vista pedaggico y libre de erro-
res. Si tiene cualquier sugerencia o requiere de alguna aclaracin sobre el material, o si encuentra algn
error, por favor enve un mensaje a David_Levine@BARUCH.CUNY.EDU o KREHBITC-
@MUOHIO.EDU. Incluya la frase BSFCversion 4 en el espacio de Asunto de su correo electrni-
co. Para mayor informacin acerca del uso de PHStat2, vase los apndices F y G, y el archivo de
lectura PHStat2 en el CD-ROM que acompaa este libro.
David M. Levine
Timothy C. Krehbiel
Mark L. Berenson
CAPTULO 1
Introduccin y recoleccin de datos

USO DE LA ESTADSTICA: Good Tunes

1.1 CONCEPTOS BSICOS DE LA 1.5 TIPOS DE DATOS


ESTADSTICA
A.1 INTRODUCCIN AL USO DE LOS
1.2 EL CRECIMIENTO DE LA ESTADSTICA PROGRAMAS ESTADSTICOS
Y LAS TECNOLOGAS DE LA A1.1 Uso de Windows
INFORMACIN A1.2 Introduccin a Excel
A1.3 Introduccin a Minitab
1.3 CMO EST ORGANIZADO ESTE TEXTO
A1.4 (Tema CD-ROM) Introduccin a SPSS
1.4 RECOLECCIN DE DATOS
Identificacin de las fuentes de datos

OBJETIVOS DE APRENDIZAJE
En este captulo, aprender:
Cmo se usa la estadstica en los negocios
Cules son las bases de datos que se utilizan en los negocios
Los tipos de datos usados en negocios
2 CAPTULO 1 Introduccin y recoleccin de datos

U S O D E L A E S TA D S T I C A
Good TunesParte I
Good Tunes es un comerciante minorista en lnea de sistemas de entreteni-
miento, que busca expandir su negocio abriendo varias tiendas. Para obtener
el financiamiento que garantice su expansin, Good Tunes requiere solicitar
prstamos a los bancos locales. Los administradores de la firma acuerdan rea-
lizar una presentacin con diapositivas que expliquen su negocio y muestren
su situacin real para convencer a los banqueros de prestarles el dinero que
necesitan. A usted se le pide que ayude en el proceso de preparacin de las
diapositivas. Qu hechos incluira? Cmo los presentara?

odos los das usted hace acopio de noticias e informacin que le sirven de gua en su vida. As,
T escuchar el reporte meteorolgico le ayudar a decidir qu ropa usar, y si vive en una ciudad
grande tal vez deba escuchar el reporte vial que le indique la mejor ruta para llegar al trabajo o a la
escuela.
Sus gustos personales, as como las cosas que no le agradan, tambin rigen algunas de sus deci-
siones. A pesar de las crticas negativas que escucha acerca de alguna pelcula, tal vez decida verla
slo por la admiracin que siente hacia cierto actor.
De igual forma, los administradores de empresas deben tomar decisiones todos los das. Aun-
que en ocasiones evidencian sus impulsos viscerales al tomar decisiones (lo que se conoce formal-
mente como toma de decisin no estructurada), la mayora de las veces deciden a partir de hechos
concretos. Como estudiante de negocios, usted no debe tomar decisiones no estructuradas, ya que
stas requieren de intuicin y discernimiento que se desarrollan tras muchos aos de experiencia.
Sin embargo, puede aprender procedimientos y mtodos que le ayudarn a tomar mejores decisiones
basadas en hechos concretos. Cuando comience a familiarizarse con los procedimientos y mtodos
implicados en la recoleccin, la presentacin y la elaboracin de resmenes de un conjunto de datos,
o a obtener conclusiones acerca de tales datos, entonces habr descubierto la estadstica.
En el escenario de Good Tunes, usted debe partir de la suposicin razonable de que los ban-
queros buscan tomar decisiones basadas en hechos concretos que usted presentar, y no en otros fac-
tores, tales como antojos, gustos o aversiones personales. Presentar informacin errnea o aun
correcta pero de forma inadecuada, podra llevar a los banqueros a tomar decisiones administrativas
equivocadas, lo cual pondra en riesgo el futuro de Good Tunes. Usted necesita saber de estadstica
para presentar los hechos necesarios, y para aprender estadstica lo primero que debe conocer son
sus conceptos bsicos.

1.1 CONCEPTOS BSICOS DE LA ESTADSTICA


La estadstica es la rama de las matemticas que examina las formas de procesar y analizar da-
tos. La estadstica ofrece los procedimientos para recolectar y transformar los datos de manera que
sean tiles a quienes toman decisiones en los negocios. Para comprender la estadstica, primero ne-
cesita conocer la definicin de una variable.
1.1: Conceptos bsicos de la estadstica 3

VARIABLES
Las variables son las caractersticas de los objetos o de los individuos.

Ejemplos de variables son el gnero al que usted pertenece, su especialidad o campo de estudio,
la cantidad de dinero que tiene en su cartera y el tiempo que le toma alistarse por la maana para ir
a la escuela. El aspecto esencial de la palabra variable es la idea de que las cosas difieren y las per-
sonas tambin. Tal vez la persona que est sentada a su lado sea hombre, quiz se est especializan-
do en algn campo de estudio totalmente diferente del suyo, de seguro tendr una cantidad diferen-
te de dinero en su cartera y sin duda ocupar una cantidad de tiempo diferente al suyo para alistarse
e ir al trabajo cada maana. Se debe distinguir entre una variable, como el gnero, y su valor para
una observacin individual (por ejemplo, masculino).
Todas las variables deben tener una definicin operacional, es decir, un significado universal-
mente aceptado que sea claro para todos aquellos que estn relacionados con el anlisis. La falta de
definiciones operacionales genera confusin. Un ejemplo notable de confusin que ilustra la impor-
tancia de las definiciones operacionales es el de las elecciones presidenciales del ao 2000 en Esta-
dos Unidos y las boletas electorales del estado de Florida que estuvieron en disputa (Jackie Calmes
y Edward P. Foldessy, In Election Review, Bus Wins with No Supreme Court Help, The Wall
Street Journal, 12 de noviembre de 2001, A1, A14). Con la ayuda del National Opinion Research
Center de la Universidad de Chicago, se llev a cabo una revisin de 175,010 boletas que fueron re-
chazadas porque no registraban votos presidenciales, o bien, porque contenan votos a favor de dos
o ms candidatos. Se utilizaron nueve estndares o definiciones operacionales para evaluar las bole-
tas. Estos nueve estndares generaron diferentes resultados. Tres de los estndares (incluido uno
propuesto por Al Gore) llevaron a George Bush a tener mrgenes de victoria que iban de 225 a 493
votos. Seis de los estndares (incluido uno propuesto por George Bush) llevaron a Al Gore a tener
mrgenes de victoria que iban de 42 a 171 votos.

POBLACIN
La poblacin consiste en todos los miembros de un grupo acerca de los cuales se desea obtener
una conclusin.

MUESTRA
Una muestra es una parte de la poblacin seleccionada para anlisis.

PARMETRO
Un parmetro es una medida numrica que describe una caracterstica de la poblacin.

ESTADSTICO
Un estadstico es la medida numrica que describe alguna caracterstica de la muestra.

Ahora que se han definido las variables, usted necesita comprender el significado de conceptos
como poblacin, muestra, parmetro y estadstico.
Ejemplos de poblaciones son todos los estudiantes de tiempo completo de una universidad,
todos los votantes registrados en la ciudad de Nueva York, y la gente que fue de compras al centro
comercial de alguna ciudad el pasado fin de semana. Las muestras podran seleccionarse a partir de
cada una de esas tres poblaciones. Los ejemplos incluyen 10 alumnos de tiempo completo seleccio-
nados para participar en una investigacin, 500 votantes registrados en Nueva York con los que se
entabl comunicacin va telefnica para realizar una encuesta poltica, y 30 compradores del cen-
tro comercial encuestados sobre el grado de satisfaccin del consumidor. En cada caso, la gente de
la muestra representa una porcin o subconjunto de la gente comprendida en la poblacin.
La cantidad promedio que gast la gente que fue de compras al centro comercial el fin de se-
mana pasado es un parmetro. Se requiere informacin de todos los compradores para calcular este
parmetro. La cantidad promedio que gastaron los 30 compradores que respondieron a la encuesta
sobre el grado de satisfaccin del consumidor es un estadstico. La informacin de estos 30 compra-
dores se emplea para calcular el estadstico.
4 CAPTULO 1 Introduccin y recoleccin de datos

La estadstica se divide en dos ramas, ambas aplicables a la administracin de negocios. La estads-


tica descriptiva se enfoca en la recoleccin, resumen y presentacin de un conjunto de datos. La esta-
dstica inferencial utiliza datos de las muestras para obtener conclusiones acerca de cierta poblacin.
La estadstica descriptiva tiene sus races en la necesidad de las grandes organizaciones polticas
y sociales de guardar registros. Por ejemplo, cada dcada desde 1790, en Estados Unidos se realiza
un censo que recolecta y resume datos acerca de los ciudadanos. A travs de los aos, el U.S. Cen-
sus Bureau ha sido uno de los grupos que ha mejorado los mtodos de estadstica descriptiva. Los
fundamentos de la estadstica inferencial se basan en las matemticas de la teora de la probabilidad.
Los mtodos inferenciales utilizan los datos de la muestra para calcular los estadsticos que propor-
cionan los estimados de las caractersticas de una poblacin.
En la actualidad, los mtodos estadsticos se aplican en diferentes reas de los negocios. La
contabilidad utiliza mtodos estadsticos para seleccionar muestras con el propsito de auditar y pa-
ra entender los costos de los conductores en la contabilidad de costos. Las finanzas usan mtodos es-
tadsticos para seleccionar entre alternativas de cuentas de inversin y para analizar las mediciones
financieras a travs del tiempo. La administracin utiliza mtodos estadsticos para mejorar la cali-
dad de los productos manufacturados o los servicios que ofrece una organizacin. El marketing em-
plea mtodos estadsticos para estimar el nmero de consumidores que prefieren un producto sobre
otro y para saber por qu lo prefieren, as como para obtener conclusiones que permitan determinar
la mejor estrategia de publicidad que incremente las ventas de un producto.

1.2 EL CRECIMIENTO DE LA ESTADSTICA


Y LAS TECNOLOGAS DE LA INFORMACIN
Durante el siglo pasado, la estadstica jug un papel importante al promover el uso de la tecnologa
de la informacin y sta, por su parte, contribuy a difundir el uso de la estadstica. Al iniciar el si-
glo XX, la expansin de los requerimientos de manejo de datos asociados con el censo federal llev
directamente al desarrollo de mquinas tabuladoras que fueron las antecesoras de los sistemas compu-
tacionales que utilizan los negocios en la actualidad. Especialistas como Pearson, Fisher, Gosset,
Neyman, Wald y Tukey establecieron las tcnicas de la estadstica inferencial moderna, en respuesta
a la necesidad de analizar grandes conjuntos de datos poblacionales que, ya para entonces, implica-
ban costos elevados, consuman mucho tiempo y eran difciles de recopilar. El desarrollo de los pri-
meros sistemas computacionales permiti a otros disear programas de cmputo que facilitaran el
clculo y procesamiento de datos impuestos por tales tcnicas. A la vez, esos programas iniciales
permitieron a los responsables de tomar decisiones hacer un mayor uso de los mtodos estadsticos;
por otra parte, los recientes avances en la tecnologa de la informacin ayudaron a difundir el em-
pleo de mtodos estadsticos ms complejos.
En la actualidad, cuando escuche acerca de comerciantes minoristas que invierten en sistemas
de administracin de relaciones con el cliente, o en un paquete productor de bienes dedicado al
data mining para descubrir las preferencias de los consumidores, se dar cuenta de que las tcni-
cas estadsticas son como los cimientos de esas aplicaciones de la tecnologa de la informacin. Aun
cuando tales aplicaciones pudieran requerir programacin a la medida, durante muchos aos los ne-
gocios han tenido acceso a paquetes estadsticos, tales como Minitab y SPSS, que son programas es-
tandarizados para ayudar a los administradores a usar una amplia gama de tcnicas estadsticas para
automatizar el procesamiento y clculo de datos que requieren esas tcnicas. Mientras que en el pa-
sado esos paquetes estaban disponibles slo en centros computacionales corporativos, el aumento en
el poder y la conectividad de las computadoras personales ha llevado estos paquetes al escritorio,
donde se han reunido con herramientas familiares como los procesadores de palabras, las hojas de
clculo y los programas de la Web.
Los costos de arrendamiento y capacitacin asociados a los paquetes estadsticos han llevado a
muchos a considerar el uso de las funciones de grficos y estadsticos del programa Excel, de Micro-
soft. Sin embargo, es necesario que sea cuidadoso de las preocupaciones que muchos especialistas
en la materia tienen acerca de qu tan completos y precisos son los resultados estadsticos de Excel.
Por desgracia, algunos investigadores han determinado que ciertas herramientas estadsticas del pro-
grama contienen fallas que pueden invalidar los resultados, en especial cuando los conjuntos de datos
usados son muy grandes o tienen propiedades estadsticas poco usuales (vea la referencia 3 al final
del captulo). Est claro que cuando usted utilice Excel, deber ser cuidadoso acerca de los datos y
anlisis que maneje. El hecho de que quiz las complicaciones sobrepasen los beneficios de las
atractivas caractersticas de Excel es todava un enigma sin respuesta para los negocios.
1.3: Cmo est organizado este texto 5

1.3 CMO EST ORGANIZADO ESTE TEXTO


El objetivo principal de este texto es ayudarle a aprender y comprender cmo los mtodos estadsti-
cos resultan tiles en los procesos de toma de decisiones. Para los estudiantes de negocios, esta com-
prensin incluye los siguientes objetivos:
Presentar y describir de forma apropiada los datos e informacin en los negocios.
Llegar a conclusiones sobre grandes poblaciones nicamente a partir de informacin recolecta-
da de las muestras.
Hacer predicciones confiables acerca de las tendencias en los negocios.
Mejorar los procesos de los negocios.
Este texto considera estos cuatro objetivos como principio organizador. La figura 1.1 muestra la
forma en que cada captulo se relaciona con estos objetivos. Usted explorar los mtodos implicados
en la recoleccin, presentacin y descripcin de informacin en lo que resta de este captulo as

Toma
racional
de decisin

Obtencin de conclusiones Realizacin de


Presentacin y
acerca de poblaciones, Mejoramiento pronsticos
descripcin
basadas slo en la de los procesos confiables de las
de la informacin
informacin de una muestra variables de inters

Aplicaciones estadsticas
Introduccin y Regresin
Probabilidad bsica en la administracin de
recoleccin lineal simple
(captulo 4) calidad y productividad
de datos (captulo 1) (captulo 12)
(captulo 14)

Algunas distribuciones
Presentacin Regresin
importantes de
de datos en tablas y mltiple
probabilidad discreta
grficas (captulo 2) (captulo 13)
(captulo 5)

Medidas
descriptivas La distribucin normal
numricas (captulo 6)
(captulo 3)

Distribuciones
de muestras
(captulo 7)

Estimacin del intervalo Fundamentos de la


de confianza prueba de hiptesis
(captulo 8) (captulos 9-11)

FIGURA 1.1 Tabla estructural para este texto.


6 CAPTULO 1 Introduccin y recoleccin de datos

como en los captulos 2 y 3. En los captulos 4 a 7 aprender sobre los conceptos bsicos de proba-
bilidad y de las distribuciones binomial, normal y otras, que comprender mejor en los captulos 8 a
11, donde se estudiar cmo obtener conclusiones acerca de grandes poblaciones a partir de la infor-
macin de las muestras. En los captulos 12 y 13 se enfocar en el anlisis de la regresin que se uti-
liza para hacer pronsticos. En el captulo 14 aprender mtodos para mejorar los procesos en los
negocios.
Como el aprendizaje contextual mejora la comprensin, cada captulo inicia con un escenario
de Uso de la estadstica como el de Good TunesParte I de la pgina 2, que identifica un pro-
blema de negocios en el que se aplica la estadstica para convertir los datos en informacin til para
tomar una decisin racional. Las preguntas que surgen de los escenarios llevan a respuestas en for-
ma de mtodos estadsticos presentados en secciones subsiguientes del texto. Al reflexionar sobre
estas preguntas, ganar en la apreciacin de cmo los administradores de negocios usan la estadsti-
ca en la actualidad para solucionar sus problemas y mejorar la calidad de sus productos y servicios.
Para el escenario de Good TunesParte I, elegir lo que presentar es tan importante como
elegir el mtodo adecuado para la presentacin y el resumen. En este caso, probablemente los ban-
queros pedirn conocer algunos datos, es decir, las finanzas del negocio. Pero, qu otros datos
recolectara y presentara usted para lograr la aprobacin de los crditos? (Vea Good TunesParte
II.) Desde luego, despus de haber presentado sus datos, usted esperara que los banqueros hicieran
las inferencias correctas. Es decir, esperara que los banqueros fueran conocedores de los mtodos
estadsticos apropiados que conduzcan a la decisin de otorgar el crdito!

U S O D E L A E S TA D S T I C A
Good TunesParte II
Los propietarios de Good Tunes han decidido apoyar los datos financieros de su solicitud de prsta-
mo, con los datos referentes a las percepciones de los clientes acerca del negocio Good Tunes. Para
ayudar a evaluar estas percepciones, Good Tunes ha pedido a sus clientes responder y devolver una
encuesta, que se incluye en cada pedido, acerca del grado de satisfaccin con la empresa. La encues-
ta incluye las siguientes preguntas:
Cuntos das pasaron desde el momento en que orden su mercanca hasta que la recibi?
________
Cunto dinero (en dlares estadounidenses) espera gastar en equipo electrnico y de est-
reo en los prximos 12 meses? ________
En general, cmo calificara el servicio que ofrece Good Tunes de acuerdo con su ms re-
ciente compra?
Mucho mejor de lo esperado Peor de lo esperado
Mejor de lo esperado Mucho peor de lo esperado
Como era de esperarse
Cmo calificara la calidad de los artculos que recientemente compr en Good Tunes?
Mucho mejor de lo esperado Peor de lo esperado
Mejor de lo esperado Mucho peor de lo esperado
Como era de esperarse
Es probable que compre mercanca adicional a travs de Good Tunes en los prximos 12
meses? S No
A usted se le pide revisar esta encuesta. Qu tipo de datos pretende recolectar? Qu tipo de
informacin es posible generar a partir de los datos obtenidos por la encuesta? Cmo puede Good
Tunes usar dicha informacin para mejorar la calidad del servicio y la mercanca? Cmo podra
Good Tunes utilizar la informacin para aumentar la probabilidad de obtener el prstamo? Qu
otras preguntas sugiere que se incluyan en la encuesta?
1.4: Recoleccin de datos 7

1.4 RECOLECCIN DE DATOS


Administrar un negocio de forma efectiva requiere la recoleccin de los datos apropiados. En mu-
chas ocasiones, los datos son medidas que se obtienen de los elementos de una muestra, y las mues-
tras se toman de la poblacin, de tal forma que sean lo ms representativas posible. La tcnica ms
comn para asegurar una representacin adecuada es usar una muestra aleatoria. (Vea el captulo 7
para una explicacin ms detallada de las tcnicas de muestreo.)
Existen diversas circunstancias que requieren la recoleccin de datos:

Un analista de investigacin de mercados necesita evaluar la efectividad de una nueva campa-


a publicitaria en televisin.
Un productor farmacutico necesita determinar si un nuevo medicamento es ms efectivo que
los que actualmente se consumen.
Un administrador de operaciones desea monitorear el proceso de produccin para comprobar si
la calidad de cierto producto satisface los estndares de la compaa.
Un auditor desea revisar las transacciones financieras de una empresa para determinar si sta
cumple o no con principios contables aceptables.
Un inversionista potencial desea determinar qu firmas industriales tienen mayor probabilidad
de crecer de forma acelerada en un periodo de recuperacin econmica.

Identificacin de las fuentes de datos


Identificar las fuentes de datos apropiadas es un aspecto importante del anlisis estadstico. Si los
sesgos, ambigedades u otro tipo de errores estropean los datos que son recolectados, ni siquiera
los mtodos estadsticos ms complejos producirn una informacin precisa. Existen cuatro impor-
tantes fuentes de datos:

Los que proporciona una organizacin o un individuo.


Un experimento diseado.
Una encuesta.
Un estudio observacional.

Las fuentes de datos se clasifican en fuentes primarias y fuentes secundarias. Cuando el re-
colector de datos es quien los usa para el anlisis, la fuente es primaria. Cuando una organizacin o
individuo han compilado los datos que utiliza otra organizacin o individuo, la fuente es secundaria.
Las organizaciones e individuos que recolectan y publican datos, generalmente los utilizan co-
mo fuente primaria y despus permiten a otros usarlos como fuente secundaria. Por ejemplo, el go-
bierno federal de Estados Unidos recolecta y distribuye datos tanto para propsitos pblicos como
privados. El Bureau of Labor Statistics recolecta los datos que emplea y tambin distribuye cada
mes el Consumer Price Index. El Census Bureau supervisa una gran variedad de encuestas actuales
referentes a poblacin, vivienda e industria, y lleva a cabo estudios especiales en temas como el cri-
men, los viajes y el cuidado de la salud.
Las empresas de investigacin de mercado y las asociaciones de comercio tambin distribuyen
datos referentes a industrias o mercados especficos. Los servicios de inversin como Mergent pro-
porcionan datos financieros en una base de compaa a compaa. Servicios como los de A.C. Niel-
sen ofrecen a sus clientes datos que permiten la comparacin de los productos del cliente con los de
sus competidores. Todos los das los peridicos estn repletos de informacin numrica referente a
los precios de las acciones, las condiciones del clima y estadsticas deportivas.
Como expresamos antes, conducir un experimento es otra fuente importante de recoleccin de
datos. Por ejemplo, para probar la efectividad de un detergente, un experimentador determina qu
marcas son ms eficientes para dejar limpia la ropa sucia, lavndola directamente, en lugar de pre-
guntar a los clientes qu marca creen que sea ms eficaz. Diseos experimentales adecuados gene-
ralmente son tema de estudio en textos ms avanzados porque a menudo implican procedimientos
estadsticos muy complejos. Sin embargo, consideraremos algunos conceptos fundamentales del di-
seo experimental en el captulo 10.
Realizar una encuesta es la tercera fuente de datos importante. En ella se pregunta a la gente so-
bre sus creencias, actitudes, comportamientos y otras caractersticas. Las respuestas posteriormente
se editan, codifican y tabulan para su anlisis.
8 CAPTULO 1 Introduccin y recoleccin de datos

Dirigir un estudio observacional es la cuarta fuente de datos importante. En este estudio, el in-
vestigador observa el comportamiento de forma directa, generalmente en su ambiente natural. Los
estudios observacionales tienen muchas formas en los negocios. Un ejemplo de ellos es el grupo
focal, una herramienta de investigacin de mercado que se utiliza para provocar respuestas no estruc-
turadas ante preguntas abiertas. En un grupo focal un moderador dirige la discusin y los participantes
responden a las preguntas. Otros tipos de estudios ms estructurados implican dinmicas de grupo y
construccin de consenso y el uso de numerosas herramientas del comportamiento organizacional
como la lluvia de ideas, la tcnica Delphi y el mtodo del grupo nominal. Las tcnicas de los estu-
dios observacionales tambin se utilizan en situaciones en las que el esfuerzo de un grupo de traba-
jo o el mejoramiento en la calidad de los productos son los objetivos o metas de la administracin.

1.5 TIPOS DE DATOS


Los datos son los valores observados de las variables, por ejemplo, las respuestas a una encuesta. Los
especialistas desarrollan encuestas para lidiar con una gran variedad de variables diferentes. Como
se ilustra en la figura 1.2, existen dos tipos de variables: categricas y numricas.

FIGURA 1.2
Tipos de variables.
Tipo de dato Tipo de preguntas Respuestas

Categrico Posee actualmente algunas acciones o bonos? S No

A cuntas revistas est


Discreto
suscrito actualmente? Nmero
Numrico
Continuo Cunto mide? Pulgadas

Las variables categricas producen respuestas categricas, tales como s o no. Un ejemplo es
la respuesta a la pregunta Posee actualmente algunas acciones o bonos?, porque se limita a una
respuesta de s o no. Otro ejemplo es la respuesta a la pregunta de la encuesta de Good Tunes (pre-
sentada en la pgina 6) Es probable que compre mercanca adicional a travs de Good Tunes en
los prximos 12 meses? En ocasiones, las variables categricas tambin generan ms de dos posi-
bles repuestas. Por ejemplo, qu da de la semana es ms probable que coma en un restaurante?.
Las variables numricas producen respuestas tales como la estatura en pulgadas. Otros ejem-
plos son: cunto dinero (en dlares estadounidenses) espera gastar en equipo electrnico y de es-
treo en los prximos 12 meses? (Tomado de la encuesta del grado de satisfaccin del cliente de
Good Tunes), o la respuesta a la pregunta A cuntas revistas est suscrito actualmente? Hay dos
tipos de variables numricas: discretas y continuas.
Las variables discretas producen respuestas numricas que surgen de un proceso de conteo.
El nmero de revistas a las que est suscrito es un ejemplo de una variable numrica discreta, por-
que la respuesta es una de un nmero finito de nmeros enteros. Una persona se suscribe a cero, una,
dos, o ms revistas.
Las variables continuas producen respuestas numricas que surgen de un proceso de medi-
cin. La estatura es un ejemplo de una variable numrica continua, porque la respuesta toma cual-
quier valor dentro de un continuo o intervalo, dependiendo de la precisin del instrumento que se
utilice para medir. Por ejemplo, una persona podra medir 67 pulgadas, 6714 pulgadas, 67372 pulgadas
o 6725580 pulgadas, dependiendo de la precisin de los instrumentos disponibles.
No hay dos personas que midan exactamente lo mismo y cuanto ms precisos sean los disposi-
tivos de medicin, mayor ser la probabilidad de detectar las diferencias entre las estaturas. Sin em-
bargo, la mayora de los dispositivos de medicin no son tan precisos como para detectar pequeas
diferencias. Por lo tanto, a menudo encontramos observaciones enlazadas a los datos experimenta-
les o de encuesta, aun cuando la variable sea verdaderamente continua, y tericamente todos los va-
lores de una variable continua son diferentes.
Resumen 9

PROBLEMAS PARA LA SECCIN 1.5


Aprendizaje bsico 1.7 Para cada una de las siguientes variables, determine si es
1.1 Se venden tres diferentes bebidas en un restaurante de co- categrica o numrica. Si es numrica indique si la variable
mida rpida: refrescos, t y caf. Explique por qu el tipo de be- es discreta o continua.
bida es un ejemplo de variable categrica. a. Cantidad de dinero gastado en ropa en el ltimo mes.
b. Tienda departamental preferida.
1.2 En el restaurante de comida rpida se venden refrescos en c. Periodo de tiempo durante el cual es ms probable que reali-
tres tamaos: chico, mediano y grande. Explique por qu el ta- ce compras de ropa (entre semana durante el da, entre se-
mao de la bebida es una variable categrica. mana durante la noche, fin de semana).
1.3 Suponga que mide el tiempo que le toma bajar de Internet d. Nmero de pares de guantes de invierno que posee.
un archivo de MP3. 1.8 Suponga que la siguiente informacin fue recolectada de
a. Explique por qu el tiempo que le toma bajarlo es una varia- la solicitud de prstamo hipotecario que hizo Robert Keeler al
ble numrica. Metro County Savings and Loan Association:
b. Esta variable es discreta o continua? a. Pagos mensuales: $1,427.
b. Nmero de empleos en los ltimos 10 aos: 1.
Aplicacin de conceptos c. Ingreso salarial familiar anual: $86,000.
1.4 Para cada una de las siguientes variables, deter- d. Estado civil: casado.
AUTO
Examen mine si es categrica o numrica. Si la variable es Clasifique cada una de las respuestas por el tipo de datos.
numrica, determine si es discreta o continua.
a. Nmero de aparatos telefnicos por casa. 1.9 Una de las variables que ms a menudo se incluyen en las
b. Duracin (en minutos) de la llamada de larga distancia ms encuestas es el ingreso. A veces la pregunta es: cul es su
prolongada hecha cada mes. ingreso (en miles de dlares)? En otras encuestas, a quien
c. Si existe en la casa una lnea telefnica conectada a un m- responde se le pide que Coloque una X en el crculo que
dem de computadora. corresponda a su nivel de ingreso y se ofrecen varios rangos
d. Si hay un fax en la casa. para elegir.
a. En el primer formato, explique por qu el ingreso podra
ASISTENCIA 1.5 La siguiente informacin se recolecta de estu- considerarse tanto discreto como continuo.
de PH Grade diantes que salen de la librera del campus durante la
b. Cul de los dos formatos preferira usar al conducir una en-
primera semana de clases: cuesta? Por qu?
a. Cantidad de tiempo que pasan de compras en la librera.
b. Nmero de libros de texto comprados. 1.10 Si dos estudiantes obtienen una puntuacin de 90 en el
c. Especialidad acadmica. mismo examen, qu argumentos podra usar para mostrar que
d. Gnero. la variable subyacente (puntuacin de la prueba) es continua?
Clasifique cada una de estas variables como categricas o nu- 1.11 El director de investigacin de mercados de una gran ca-
mricas. Si la variable es numrica, determine si es discreta o dena de tiendas departamentales desea llevar a cabo una en-
continua. cuesta en el rea metropolitana para determinar la cantidad de
ASISTENCIA 1.6 Para cada una de las siguientes variables, deter- tiempo que las mujeres pasan comprando ropa en un mes.
de PH Grade mine si la variable es categrica o numrica. Si la va- a. Describa tanto la poblacin como la muestra de inters, e in-
riable es numrica, indique si es discreta o continua. dique el tipo de datos que el director deseara recolectar.
a. Nombre del proveedor de Internet. b. Desarrolle un primer borrador del cuestionario requerido,
b. Cantidad de tiempo que navega en Internet por semana. anotando series de tres preguntas categricas y tres pregun-
c. Nmero de correos electrnicos recibidos en una semana. tas numricas que usted considere apropiadas para esta en-
d. Cantidad de compras hechas en lnea durante un mes. cuesta.

RESUMEN
En este captulo ha estudiado la recoleccin y los diferentes tas a la segunda pregunta (cantidad de dinero gastado) son con-
tipos de datos que se usan en los negocios. En el escenario tinuas. Despus de recolectar los datos, deben organizarse y
de Uso de la estadstica se le pidi que revisara la encuesta de prepararse para realizar varios anlisis. En los siguientes dos
clientes diseada por la compaa Good Tunes (vea la pgina captulos se desarrollarn los temas de tablas, grficas y una
6). Las primeras dos preguntas generarn datos numricos y las gran variedad de medidas numricas que son tiles para anali-
ltimas tres producirn datos categricos. Las respuestas a la zar los datos.
primera pregunta (nmero de das) son discretas y las respues-
10 CAPTULO 1 Introduccin y recoleccin de datos

C O N C E P T O S C L AV E
Datos 8 Fuentes primarias 7 Poblacin 3
Definicin operacional 3 Fuentes secundarias 7 Variables 3
Estadstica 2 Grupo focal 8 Variables categricas 8
Estadstica descriptiva 4 Muestra 3 Variables continuas 8
Estadstica inferencial 4 Paquetes estadsticos 4 Variables discretas 8
Estadstico 3 Parmetro 3 Variables numricas 8

P R O B L E M A S D E R E PA S O
Revisin de su comprensin 1.23 El sitio del U.S. Census Bureau (www.census.gov) con-
tiene la informacin de las encuestas sobre poblacin, nego-
1.12 Cul es la diferencia entre una muestra y una pobla- cios, geografa y otros temas. Visite el sitio, d clic en Housing,
cin? en la seccin People. Despus d clic en American Housing
1.13 Cul es la diferencia entre un estadstico y un parme- Survey.
tro? a. Describa brevemente el American Housing Survey.
b. D un ejemplo de una variable categrica que haya encon-
1.14 Cul es la diferencia entre la estadstica inferencial y la trado en la encuesta.
descriptiva? c. D un ejemplo de una variable numrica que haya encontra-
1.15 Cul es la diferencia entre una variable categrica y una do en la encuesta.
numrica? d. La variable que seleccion en c), es discreta o continua?

1.16 Cul es la diferencia entre una variable discreta y una 1.24 En el sitio Web del U.S. Census Bureau (www.census.
continua? gov), d clic en Survey of Business Owners en la seccin Bu-
siness y lea la descripcin The Survey of Business Owners
1.17 Qu es una definicin operacional y por qu es impor- and Self-Employed Persons (SBO). D clic en SBO-1, en la sec-
tante? cin Forms and Instructions para visualizar la forma de en-
Aplicacin de conceptos cuesta usada.
a. D un ejemplo de una variable aleatoria categrica encon-
1.18 La Data and Story Library (lib.stat.cmu.edu/DASL) es trada en esta encuesta.
una librera de archivos de datos e historias en lnea, que ilustra b. D un ejemplo de una variable aleatoria numrica encontra-
el uso de los mtodos estadsticos bsicos. Las historias estn da en esta encuesta.
clasificadas por mtodo y por tema. Visite este sitio y d clic en c. La variable que seleccion en b), es discreta o continua?
List all topics. Seleccione una historia y elabore un resumen de
1.25 En un reporte basado en un estadstico del Departamento
cmo se ha utilizado la estadstica en ella.
del Transporte de Estados Unidos U.S., la empresa JetBlue fue
1.19 Visite el sitio oficial de Microsoft Excel (www.microsoft. la nmero 1 en calidad entre todas las lneas areas de ese pas
com/office/excel). Explique cmo cree que sea til el programa en 2003. JetBlue obtuvo el segundo mejor tiempo de desempe-
Excel en el campo de la estadstica. o, al llegar a tiempo el 86% de las veces. Tambin los clientes
de JetBlue llenaron menos formatos de quejas que los de todas
1.20 Visite el sitio oficial de Minitab Web (www.minitab.
las dems lneas areas, salvo una (JetBlue calificada como la
com). Explique cmo cree que Minitab resulte til en el campo
lnea area nmero 1, dice el reporte, USAToday.com, 5 de
de la estadstica.
abril, 2004).
1.21 Visite el sitio oficial de SPSS (www.spss.com). Explique a. Cul o cules de los cuatro tipos de fuentes de datos lista-
cmo cree que sea til el SPSS en el campo de la estadstica. dos en la seccin 1.4 en la pgina 7 cree que se utilizaron en
este estudio?
1.22 La organizacin Gallup pone a disposicin los resultados
b. Nombre una variable categrica usada en este artculo.
de las elecciones en su sitio Web (www.gallup.com). Vistelo y
c. Nombre una variable numrica usada en este artculo.
d clic en algn artculo que le interese de la seccin Top Sto-
ries. 1.26 De acuerdo con una encuesta de Goldman Sachs, slo
a. D un ejemplo de una variable categrica que se encuentre cerca del 4% de los hogares estadounidenses utilizan los ser-
en el artculo. vicios bancarios on line. Una encuesta realizada por Cyber Dia-
b. D un ejemplo de una variable numrica encontrada en el logue investig las razones por las que la gente abandona el
artculo. banco on line despus de intentarlo. A continuacin se ofrece
c. La variable que seleccion en b), es discreta o continua? un listado parcial de los resultados obtenidos por la encuesta
Introduccin a los casos Web 11

Cyber Dialogue (USA Snapshots, USA Today, 21 de febrero d. El 27% de quienes respondieron indicaron que el banco en
de 2000, A1). lnea era demasiado complicado o tomaba demasiado tiem-
po. Es esto un parmetro o un estadstico?
Por qu abandon el banco on line?
1.27 Un fabricante de comida para gatos planeaba realizar una
Demasiado complicado o se lleva demasiado tiempo 27% encuesta en los hogares estadounidenses para determinar los
hbitos de compra de quienes poseen gatos. Entre las preguntas
No le satisface el servicio al cliente 25%
que se incluiran estaban las relacionadas con la siguiente infor-
No lo necesita/no est interesado 20% macin:
1. Dnde se compra la comida de gato por lo general.
Tiene preocupaciones acerca de la seguridad
2. La comida de gato comprada es seca o hmeda.
o de un fraude 11%
3. El nmero de gatos que viven en el hogar.
Demasiado costoso 11% 4. Si el gato tiene o no pedigree.
a. Describa la poblacin.
Tiene dudas sobre la privacidad 5%
b. Para cada uno de los reactivos listados, indique si la variable
a. Describa la poblacin de la encuesta Goldman Sachs. es categrica o numrica. Si es numrica, es discreta o con-
b. Describa la poblacin de la encuesta Cyber Dialogue. tinua?
c. La respuesta a la pregunta Por qu abandon el banco on c. Plantee cinco preguntas categricas para la encuesta.
line?, es categrica o numrica? d. Plantee cinco preguntas numricas para la encuesta.

INTRODUCCIN A LOS CASOS WEB


APRENDIENDO DE LOS CASOS WEB real, no toda la informacin que encontrar ser relevante
para su tarea; en ocasiones descubrir informacin conflicti-
EN ESTE TEXTO va que tendr que aclarar antes de continuar con los casos.
La gente usa tcnicas estadsticas para ayudar a comunicar Para ayudarle con su aprendizaje, los Casos Web de ca-
y a presentar informacin importante a otros tanto dentro da captulo inician con el objetivo de aprendizaje y la sinop-
como fuera de sus negocios. Sin embargo, cada da, la gen- sis del escenario que est bajo estudio. Se le dirigir hacia
te hace mal uso de esas tcnicas: un sitio o pgina Web especfica y se le har una serie de
preguntas que guiarn su exploracin. Si lo prefiere, tam-
Un administrador de ventas que trabaja con un progra-
bin podr explorar pginas Web para casos enlazados a la
ma de grficas fcil de usar, elige una grfica inapro-
pgina del Springville Chamber of Commerce (www.pren-
piada que oscurece las relaciones de los datos.
hall.com/Springville/SpringvilleCC.htm).
El editor de un reporte anual presenta la grfica de los
Para complementar a los Casos Web, en casi todos lo
ingresos con un eje Y reducido que crea la falsa impre-
captulos encontrar un ejercicio tradicional de estudio de
sin de que ha habido un gran incremento en los in-
caso en el que se le pedir que aplique sus conocimientos so-
gresos.
bre la estadstica en un problema que enfrente el Springville
Un analista genera estadsticos sin significado acerca
Herald.
de un conjunto de datos categricos al usar un tipo de
Para ilustrar el uso de los Casos Web, visite el sitio de
anlisis diseado para datos numricos.
Good Tunes (www.prenhall.com/Springville/Good_Tu-
Aunque la mayora de los casos en que se hace mal uso nes.htm), el minorista en lnea mencionado en los escena-
de la estadstica no son intencionales, usted debe ser capaz de rios de Uso de la estadstica en este captulo. Recuerde
identificar todos esos usos incorrectos para ser un adminis- que la empresa privada Good Tunes busca financiamiento
trador bien informado. El objetivo principal de los Casos para expandir su negocio abriendo otras tiendas. Como el in-
Web a lo largo del texto, es ayudarle a desarrollar este tipo ters del administrador es hacer que los banqueros vean en
de habilidad. Good Tunes un negocio floreciente, no sorprende que utilice
Se le pedir que visite los sitios Web que estn relacio- el argumento de que ste ha sido nuestro mejor ao en ven-
nados con las compaas y los temas tratados en el escenario tas, como ttulo de la pgina Buenos tiempos para Good
de Uso de la estadstica con el que inicia cada captulo, o Tunes.
una pgina Web que apoye la continuacin de la historia del Esta frase tambin es un hipervnculo, as es que d un
Springville Herald, un diario de una pequea ciudad. Revi- clic en ste ha sido nuestro mejor ao en ventas para abrir
sar tambin documentos internos as como demandas p- la pgina que apoya esa afirmacin. Qu tan bien la apoya?
blicas, para identificar y corregir los usos incorrectos de la Con una tabla de nmeros? Con una grfica? Con decla-
estadstica. De forma diferente a como lo hara un libro de raciones atribuidas a fuentes conocedoras? Good Tunes ha
texto tradicional, pero apegado a las situaciones del mundo usado una grfica para presentar los datos de sus ventas por
12 CAPTULO 1 Introduccin y recoleccin de datos

categora hace dos aos y los ltimos 12 meses. Hay Adems estn las curiosas etiquetas de las grficas.
problemas en las elecciones hechas en esta pgina Web? Los ltimos 12 meses es ambiguo podra incluir meses
Absolutamente! del ao en curso as como meses del ao anterior y, por lo
Primero, observe que no hay escalas para los smbolos tanto, no ser equivalente a un periodo de hace dos aos.
usados, por lo que es imposible saber cul es el volumen de Puesto que el negocio se estableci en 1997 y la categora es
ventas real. De hecho, como aprender en la seccin 2.6, las ste ha sido nuestro mejor ao en ventas, por qu la admi-
grficas que incorporan smbolos de esta forma se conside- nistracin no incluy las cifras de ventas de cada ao?
ran como grficas basura, que jams utilizaran los especia- Est la administracin de Good Tunes ocultando algo,
listas. o simplemente no son conscientes del uso adecuado de la es-
Adems de este importante punto, surge otra pregunta tadstica? De cualquier modo, no han logrado comunicar de
acerca de si los datos de venta representan el nmero de uni- forma adecuada un aspecto vital de su historia.
dades vendidas o algo ms. El uso de smbolos da la impre- En los siguientes Casos Web se le pedir realizar este ti-
sin de que se estn presentando datos de unidades vendi- po de anlisis, usando las preguntas abiertas de este texto
das. Si es as, apoyan estos datos el argumento, o tal vez como gua. No todos los casos son tan claros y sinceros co-
otros datos, como el volumen en dlares, seran un mejor in- mo esta muestra, y algunos casos incluyen aplicaciones esta-
dicador de las ventas de Good Tunes? dsticas perfectamente apropiadas.

REFERENCIAS
1. Kendall, M.G. y R.L. Plackett, eds., Studies in the History 5. Minitab Release 14 (State College, PA: Minitab, Inc.,
of Statistics and Probability, vol. 2 (Londres: Charles W. 2004).
Griffin, 1977). 6. Pearson, E. S., ed., The History of Statistics in the Seven-
2. Kirk, R.E., ed., Statistical Issues: A Reader for the Beha- teenth and Eighteenth Centuries (Nueva York: Macmillan,
vioral Sciences (Monterey, CA: Brooks/Cole, 1972). 1978).
3. McCullough, B.D. y B. Wilson, On the accuracy of statis- 7. Pearson, E.S. y M.G. Kendall, eds., Studies in the History
tical procedures in Microsoft Excel 97, Computational of Statistics and Probability (Darien, CT: Hafner, 1970).
Statistics and Data Analysis, 31 (1999), 27-37. 8. SPSS Base 12.0 Brief Guide (Upper Saddle River, NJ:
4. Microsoft Excel 2003 (Redmond, WA: Microsoft Corpora- Prentice Hall, 2003).
tion, 2002).

Apndice 1 Introduccin del uso


de los programas estadsticos
ALGO SOBRE ESTE APNDICE be seleccionar el Archivo en el men de opciones y posterior-
mente la opcin Abrir del submen que aparece.
Seccin A1.1 Lea esta seccin si no se encuentra familiari-
zado con las operaciones bsicas de Windows que se re-
quieren para usar de forma eficiente Excel, Minitab o SPSS. A1.1 USO DE WINDOWS
Seccin A1.2 Lea esta seccin slo si planea usar Excel
con este texto. Uso del ratn
Seccin A1.3 Lea esta seccin slo si est usando Minitab
con este texto. En Windows, con frecuencia usted usa el ratn u otro dispositi-
Seccin A1.4 Lea esta seccin del CD-ROM slo si est vo sealador para seleccionar y activar opciones en la pantalla
usando el SPSS con este texto. al presionar un botn. Por convencin, Windows da por hecho
Nota: A lo largo de este apndice y de los dems que se in- que los dispositivos sealadores poseen dos botones, uno desig-
cluyen en este texto, el smbolo se usa para representar una nado como botn primario y otro como botn secundario. Es
secuencia en el men de selecciones. Por ejemplo, la instruc- posible mover el ratn, presionar y soltar sus botones de las si-
cin seleccionar Archivo Abrir significa que primero de- guientes maneras:
Apndice 13

Hacer clic o seleccionar: Mover el ratn sobre un objeto y Una o ms barras de herramientas con botones que son
presionar el botn primario. comandos de acceso rpido.
Arrastrar: Mover el ratn sobre un objeto. Mientras se La figura A1.1 muestra estos elementos comunes para
presiona el botn primario, mover la flecha del ratn hacia abrir ventanas en Excel 2003, Minitab Release 14, y el SPSS
otro lugar en la pantalla y soltar el botn. Al arrastrar se Student Version 12. Note que las ventanas para estos programas
mueven los objetos hacia otra parte o tambin se pueden adicionalmente tienen un rea destinada a una hoja de trabajo,
seleccionar varios puntos. compuesta por filas y columnas que sirven para introducir
Hacer doble clic: Mover el ratn sobre un objeto y dar dos datos.
clics en el botn primario en una sucesin rpida.
Hacer clic en el botn derecho: Mover el ratn sobre un
objeto y dar un clic en el botn secundario.
Ventanas de dilogo
Por default, Windows define el botn izquierdo del ratn Muchas entradas u opciones disponibles para utilizar el progra-
como botn primario y el derecho como el botn secundario ma muestran ventanas adicionales conocidas como ventanas de
(esto da lugar a la frase clic-derecho), pero es posible invertir dilogo. Las de Excel 2003 permiten abrir o imprimir un archi-
estas definiciones a travs del icono Panel de control. vo (vea la figura A1.2), y contienen los siguientes elementos en
comn:

Programas de apertura Botn de ayuda con el signo de interrogacin: Dar clic


en este botn le permite seleccionar un elemento de la ven-
Usted puede elegir una de dos formas para abrir directamente tana de dilogo y desplegar un mensaje de ayuda en cuan-
programas como Excel, Minitab o SPSS. stas formas son: to a su uso.
Cuadro de lista hacia abajo: Al hacer clic en el botn se
Clic en el icono del programa: Dar doble clic en el icono
despliega hacia abajo una lista de opciones, que aparece en
del escritorio que representa el programa que utilizar (al-
gunas versiones de Windows slo requieren un clic). la esquina derecha de la ventana.
Cuadro de lista: Despliega una lista de opciones. En oca-
Opcin Inicio Men: Presione la tecla con el icono de
siones incluye una barra de desplazamiento o gua si la
Windows (o d clic en el botn Inicio en la pantalla) y elija
la opcin Programa o Todos los programas. De la lista que lista es ms grande de lo que el tamao del cuadro podra
aparece, seleccione el programa que utilizar. Si ste apa- mostrar.
rece en un submen, primero debe seleccionar el submen Cuadro de texto: Ofrece un espacio para escribir una en-
y despus el programa. trada. En ocasiones estos cuadros se combinan con una lista
hacia abajo o con botones (que se observan en las pgina
Los usuarios expertos de Windows conocen otras formas de de la ventana en la figura A1.2), con formas alternativas de
abrir un programa. Usted puede, claro est, usar tambin alguna especificar una entrada.
de esas formas, si as lo prefiere. Cuadro de exploracin: Ofrece una serie de opciones pa-
ra elegir desde cero, una o ms de una opcin (compare
con los botones de opcin).
Iconos: Permiten un acceso directo a otras aplicaciones en
Sistema operativo Windows Windows en las que se pueden almacenar los archivos.
Botones de opcin: Muestra un conjunto de elecciones
Windows debe su nombre al hecho de que cada vez que se abre mutuamente excluyentes en las cuales slo una opcin
un programa, tambin se abre una pantalla rectangular enmar- puede elegirse a la vez.
cada o ventana. En ella se interacta con el programa, lo que Botones de comando: Permite al programa realizar algu-
permite abrir ventanas adicionales en las que es posible entrar y na accin que generalmente cierra la ventana de dilogo
realizar diversas actividades. actual y muestra una adicional. El botn Aceptar hace que
La ventana de apertura de la mayora de los programas el programa acte usando los valores y escenarios en uso
contiene los siguientes elementos comunes: de la ventana de dilogo. El botn Cancelar cierra el cua-
dro de dilogo y cancela la operacin asociada con l.
Una barra de ttulo en la parte superior, que identifica el
programa y cualquier archivo que est en uso.
Los botones para modificar el tamao en el lado derecho
del rea de la barra de ttulo, que afectan el tamao en que
se exhibe la pantalla. A1.2 INTRODUCCIN A EXCEL
El botn de cerrar el programa en el margen superior de-
recho de la barra de ttulo, que permite dar por terminado Visin general de Excel
de forma rpida el uso del programa. Excel es un programa de hoja de trabajo electrnica de Micro-
La barra del men es una lista horizontal de palabras de- soft Office. Aunque no es un programa estadstico especializa-
bajo de la barra de ttulo que contiene el comando de op- do, Excel contiene las funciones estadsticas bsicas e incluye
ciones en uno o ms mens. el paquete de herramientas para anlisis de datos tiles para eje-
14 CAPTULO 1 Introduccin y recoleccin de datos

Botones para cerrar


el programa

Barras de men Botones para


modificar
Barras de el tamao
herramientas

Barras
de ttulo

reas de
hoja
de trabajo

FIGURA A1.1 Ventanas de los programas Microsoft Excel, Minitab y SPSS.

Botn de signo
de interrogacin

Cuadro de lista Cuadro


hacia abajo de lista

Cuadros de texto Cuadros de


exploracin

Iconos
Botones de opcin

Botones de comando

FIGURA A1.2 Elementos comunes a las ventanas de dilogo.


Apndice 15

cutar mtodos estadsticos avanzados. Puede instalar PHStat2 DataB5 suma los contenidos de las celdas B2, B3, B4 y B5 de
add-in de Prentice Hall (incluido en el CD-ROM que acompaa a la hoja de trabajo y muestra la suma como el valor en la celda
este texto), el cual le permitir extender y reforzar el paquete de correspondiente. Tambin se usan las funciones de Excel para
herramientas para anlisis de datos que contiene Microsoft. (No simplificar las frmulas. Por ejemplo, la frmula =SUM(Da-
es necesario usar el PHStat2 para emplear Excel con este texto, ta!B2:B5), que usa la funcin Excel SUM( ), es el equivalente
aunque al hacerlo simplificar el uso de Excel para realizar los ms corto de la frmula de la oracin anterior. Tambin se usan
anlisis estadsticos.) las referencias de las celdas o rangos de celdas que no contie-
Con Excel es posible crear o abrir y guardar archivos que nen la parte Sheetname!, tales como B2 o B2:B5. Estas referen-
se llaman hojas de trabajo. stos son conjuntos de hojas de cias siempre se relacionan con la hoja de trabajo en la que se in-
trabajo y objetos relacionados, tales como grficas que contie- gres la frmula.
nen datos originales, as como clculos y resultados asociados Las frmulas permiten crear soluciones generalizadas y
con uno o ms anlisis. Por la amplia difusin de Excel, resulta darle a Excel su capacidad distintiva de volver a calcular de for-
conveniente usarlo, pero algunos especialistas en estadstica ma automtica los resultados al cambiar los valores. Por lo ge-
han manifestado su preocupacin en relacin con el hecho de neral, al usar una hoja de trabajo slo se ven los resultados de
que arroja resultados que no son totalmente confiables y preci- las frmulas ingresadas, pero no las frmulas en s. Sin em-
sos para algunos procedimientos estadsticos. Aunque Micro- bargo, para su referencia en este texto se han incluido muchas
soft ha mejorado muchas de sus funciones estadsticas a partir ilustraciones de las hojas de trabajo de Excel que muestran las
de Excel 2003, es necesario ser precavidos en su uso para an- frmulas subyacentes junto con los resultados que producen. Al
lisis de datos, adems de los que presenta este texto. (Si piensa usar Excel, es posible seleccionar Herramientas Opciones
instalar el PHStat2, asegrese de leer primero el apndice F y el y en la etiqueta Vista de la ventana de dilogo Opciones que
archivo Lame de PHStat2 que aparecen en el CD-ROM in- aparece enseguida seleccionar el cuadro de exploracin de
cluido.) Frmulas y dar clic en el botn Aceptar para ver en la pantalla
las frmulas y no los resultados. Para restaurar la vista original,
hay que deseleccionar el cuadro de exploracin de Frmulas.
Uso de las hojas de trabajo de Excel
En Excel se introducen los datos en las hojas de trabajo que es-
tn organizadas en columnas tituladas con letras y filas numera-
das. Generalmente se escriben los datos para cada variable en Uso del Asistente para grficos de Excel
columnas separadas, en la celda de la fila uno para la etiqueta El Asistente para Grficos de Excel permite generar una gran
de una variable y cada fila subsiguiente para una observacin variedad de stos. ste es uno de los varios Asistentes de Mi-
singular. Se debe seguir la buena costumbre de introducir slo crosoft Office, a travs del cual un conjunto de ventanas de di-
un conjunto de datos por cada hoja de trabajo. logo interrelacionadas nos guan paso a paso, conforme se crea
Para referirse a una entrada especfica, o celda, se usa una un grfico. Para usarlo, primero seleccione Insertar Grfi-
notacin Sheetname!ColumnRow. Por ejemplo, la notacin Da- co. Despus seleccione la informacin de las propiedades del
ta!A2 se refiere a la celda de la columna A y la fila 2 en la hoja grfico conforme avanza a travs de las ventanas de dilogo
de trabajo. Para referirse a un grupo especfico o rango de cel- dando clic al botn Siguiente. Al dar clic en el botn Finalizar
das, se usa una notacin Sheetname!Upperleftcell:Lowerright- en la ltima ventana de dilogo, se termina con el Asistente y se
cell. Por ejemplo, la notacin Data!A2:B11 se refiere a las 20 crea el grfico. Es posible cancelar la operacin del Asistente
celdas que estn en las filas 2 a 11 en las columnas A y B de la en cualquier punto dando clic en el botn Cancelar o movin-
hoja de trabajo. dose hacia una ventana de dilogo previa dando clic en el botn
Cada hoja de trabajo de Excel tiene su propio nombre. Ex- Atrs.
cel las nombra de forma automtica como Hoja1, Hoja2, etc- Los Asistentes grficos de las diferentes versiones de Ex-
tera. El usuario debera renombrar las hojas de clculo con cel difieren ligeramente. Para Excel 2003 el Asistente de grfi-
nombres ms descriptivos. Esto se hace dando doble clic en las cos de cuatro pasos (vea la figura A1.3) requiere lo siguiente:
pestaas de las hojas que aparecen en la parte baja, se escribe el
nuevo nombre y se presiona la tecla Enter para aceptar.
Paso 1: Elija el tipo de grfico.
Paso 2: Ingrese la ubicacin de los datos, para los valores que
Uso de frmulas en las hojas sern graficados y la fuente de datos para los ttulos
de trabajo de Excel informativos de la grfica (si es que los hay).
Las frmulas son entradas en las celdas de las hojas de trabajo, Paso 3: Especifique el formato y las opciones de las etiquetas
que ejecutan clculos o algunas otras tareas. Se ingresan las para el grfico. (Vea ms comentarios a la derecha.)
frmulas escribiendo el signo igual (=), seguido por una com-
Paso 4: Elija la ubicacin del grfico en la hoja de trabajo.
binacin de operaciones matemticas o de procesamiento de
Usted crear un grfico con una mejor escala si elige
datos.
la opcin en una hoja nueva en lugar de la opcin
Para las frmulas simples se utilizan los smbolos +, , *, /,
como objeto (en la hoja de trabajo).
y ^ para las operaciones de suma, resta, multiplicacin, divisin y
exponente (un nmero elevado a una potencia), respectivamen- Es factible cambiar esta configuracin despus de que se haya
te. Por ejemplo, la frmula =Data!B2 + Data!B3 + Data!B4 + producido el grfico dando un clic con el botn derecho del ra-
16 CAPTULO 1 Introduccin y recoleccin de datos

tn en el grfico y haciendo la seleccin adecuada en el men Seleccione la pestaa Leyenda y deseleccione el cuadro
que aparece. Por ejemplo, para reconsiderar la colocacin aso- de exploracin de Mostrar la leyenda.
ciada con el paso 3 de la ventana de dilogo, debe seleccionar Seleccione la pestaa Rtulos de datos y en esa pestaa
de ese men Opciones de grfico. seleccione el botn de la opcin Ninguno.
La configuracin automtica de la ventana de dilogo del
paso 3 crea grficos diseados de forma imperfecta. Cuando
usted usa el Asistente de grficos para generar aquellos que re- Abrir y guardar hojas de trabajo
quieren los problemas y ejemplos de este texto, debe seleccio-
nar las pestaas que muestran abajo (vea la figura A1.4) y con- Se abren las hojas para usar datos y resultados que usted u otras
tinuar las instrucciones (si una pestaa no aparece en la ventana personas hayan creado antes. Para abrir una hoja de Excel, pri-
de dilogo del paso 3 para un tipo especfico de grfico, ignore mero seleccione Archivo Abrir. En la ventana de dilogo de
la instruccin de la pestaa): Abrir que aparece, debe dar clic en el botn de Aceptar. Si no
encuentra su archivo, tal vez necesitar hacer una o dos cosas
Seleccione la pestaa Ttulos e ingrese etiquetas para ttu- ms como:
lo y ejes, si es apropiado.
Seleccione la pestaa Ejes y despus en la ventana de ex- Utilizar las barras de desplazamiento, si se muestran, para
ploracin tanto el eje (X) como el eje (Y). Tambin selec- deslizarse por la lista completa de archivos.
cione el botn de la opcin Automtico bajo el cuadro de Seleccionar el archivo correcto de la lista Ver en de la par-
exploracin del eje (X). te superior de la ventana de dilogo.
Elija la pestaa Lneas de divisin y deseleccione todas Cambiar el valor de los Tipos de archivos de la lista hacia
las opciones debajo del encabezado del eje (X) y bajo el abajo en la parte inferior de la ventana de dilogo. Selec-
encabezado del eje (Y). cionar la opcin Archivos de texto de la lista para ver

FIGURA A1.3 Ventanas de dilogo del Asistente para grficas de Excel.


Apndice 17

FIGURA A1.4 Asistente de grficos. Paso 3, pestaas de la ventana de dilogo.

vista preliminar de lo que imprimir y hacer los ajustes que


considere necesarios antes de imprimir. Para hacerlo, seleccio-
ne la hoja de trabajo que va a imprimir y despus d clic en Ar-
chivo Vista previa de la impresin. Si la vista preliminar
contiene errores de formato, d clic en el botn Cerrar, haga
los cambios necesarios y vuelva a seleccionar Archivo Vista
previa de la impresin. Cuando est satisfecho de los resultados,
d clic en el botn Imprimir en la ventana de vista preliminar
de la impresin y despus en el botn Aceptar en la ventana de
dilogo de Impresin.
La ventana de dilogo de Impresin (vea la figura A1.2 en
la pgina 14) contiene la configuracin para seleccionar la im-
presora que usar, las partes de la hoja de trabajo que imprimi-
r (la hoja de trabajo activa es por default) y el nmero de co-
FIGURA A1.5 Ventana de dilogo para abrir de pias que har (por default es 1). Si requiere cambiar esta confi-
Excel. guracin, hgalo antes de dar clic en el botn de Aceptar.
Despus de la impresin, tal vez desee verificar los conte-
nidos. La mayora de las fallas de impresin muestran un men-
saje de error que al mismo tiempo le ayudar a corregirlas. Se
personalizan las impresiones en el Archivo Colocacin de
cualquiera de los archivos de texto; para visualizar la lista hoja (o dando clic en el botn de Setup en la ventana Vista pre-
de cada archivo del flder, seleccione Todos los archivos. liminar de la Impresin) y realizando las entradas apropiados
en la ventana de dilogo de Colocacin de hoja (no mostrada),
Para guardar una hoja de trabajo, seleccione Archivo
antes de imprimir las hojas de trabajo.
Guardar como, que le mostrar una ventana de dilogo similar
a la de Abrir. Ingrese (o edite) el nombre del archivo en el cua-
dro Nombre del archivo y d clic en el botn Aceptar. Si es
aplicable, podra hacer algo de lo siguiente: A1.3 INTRODUCCIN A MINITAB
Cambiar a otro flder seleccionando el de la lista hacia
abajo de Guardar en. Vista general de Minitab
Cambiar el valor de Guardar como tipo en lugar de la op- Minitab es un programa que result de los esfuerzos de la
cin que aparece por default, Hojas de trabajo de Excel. Pennsylvania State University para mejorar la enseanza de la es-
Las funciones Texto (etiqueta delimitada) o CSV (co- tadstica. Actualmente, mientras an lo utilizan en muchas
ma delimitada) son dos tipos de archivos que se usan en escuelas, Minitab se ha convertido en un producto comercial
ocasiones para compartir datos de Excel con otros pro- que tambin emplean grandes corporaciones alrededor del
gramas. mundo, como Ford Motor Company, 3M y GE.
Con Minitab se crean y se abren proyectos para guardar
Despus de guardar el trabajo, considere guardar el archi-
los datos y resultados. Los componentes del proyecto son una
vo una segunda vez, con un nombre diferente, para crear una
sesin o bitcora de actividades, un Administrador de proyec-
copia de respaldo. Los archivos de discos en los que no se escri-
to que resume el contenido del proyecto y cualquier hoja de tra-
be, como los del CD-ROM que acompaa este texto, no se pue-
bajo o grficos. Los componentes del trabajo se muestran en
den guardar en sus carpetas originales.
ventanas separadas dentro de la aplicacin de la ventana de Mi-
nitab. (Es posible traer cualquier ventana al frente seleccionn-
dola en el men de Minitab.) Es posible abrir o cerrar un pro-
Impresin de las hojas de trabajo yecto completo o, como se hace en este texto, abrir y guardar
Para imprimir de forma rpida las hojas de trabajo, seleccione hojas de trabajo. La precisin de Minitab, su disponibilidad pa-
Archivo Imprimir y despus d clic en el botn Aceptar de ra diferentes tipos de sistemas computacionales y la aceptacin
la ventana de dilogo de imprimir. Sin embargo, salvo por las comercial hacen de este programa una gran herramienta para el
hojas de clculo ms simples, probablemente desear tener una aprendizaje de la estadstica.
18 CAPTULO 1 Introduccin y recoleccin de datos

Uso de las hojas de clculo de Minitab


Usted ingresa los datos a la hoja de trabajo de Minitab de modo
que cada variable es asignada a una columna. Las hojas de tra-
bajo de Minitab estn organizadas con base en filas y columnas
numeradas en la forma Cn, donde C1 es la primera columna. Se
ingresan los rtulos de las variables en una fila especial sin n-
mero que antecede a la fila 1. A diferencia de las hojas de traba-
jo de otros programas como Excel, las hojas de trabajo de Mini-
tab no aceptan frmulas y no se recalculan de forma automtica
cuando se modifican los valores de los datos.
Por default, Minitab abre las hojas de clculo con nombres
seriados en la forma de Hoja de trabajo1, Hoja de trabajo2, et-
ctera. El mejor nombre ser el que refleje el contenido de la
hoja de trabajo, como Fondos para una hoja de trabajo que con-
tenga datos sobre los fondos mutuos. Para dar a la hoja de tra-
bajo un nombre descriptivo, abra la ventana de Administrador
del proyecto, d un clic con el botn derecho del ratn en el ico-
no de la hoja de trabajo y seleccione Renombrar en el men
pequeo, donde podr escribir el nuevo nombre.
FIGURA A1.6 Abrir la ventana de dilogo de la
hoja de trabajo.
Abrir y guardar las hojas de trabajo y otros
componentes
Las hojas de trabajo se abren para usar datos que usted u otros
usuarios han creado anteriormente. Para abrir una hoja de traba-
Despus de guardar el trabajo, considere guardar el archi-
jo de Minitab, se selecciona primero Archivo Abrir Hoja de
vo una segunda vez, con un nombre diferente, para crear un res-
trabajo. En la ventana de dilogo de Abrir Hoja de trabajo que
paldo de su trabajo. Los archivos que se abren de discos en los
aparece (vea la figura A1.6), seleccione el archivo que debe
que no se puede escribir, como el CD-ROM que acompaa este
abrir y d clic en el botn OK. Si no encuentra su archivo, de-
texto, no se pueden guardar en sus carpetas originales.
ber dar uno o ms de los siguientes pasos:
Para guardar un Proyecto de Minitab, seleccione tambin
Use las barras de desplazamiento, si aparecen, para mos- Archivo Guardar Proyecto como. La ventana de dilogo
trar la lista completa de archivos. de Guardar el Proyecto como incluye el botn Opciones que
Seleccione el flder correcto de la lista hacia abajo Buscar muestra una ventana de dilogo en la que se pueden seleccionar
en que aparece en la parte superior de la ventana de di- partes del proyecto adems de las hojas de clculo que guar-
logo. dar.
Cambie el valor de Tipo de archivos en la lista hacia aba- Los grficos individuales y la sesin tambin se guardan
jo en el botn de la ventana de dilogo. Seleccione Archi- de forma separada seleccionando primero sus ventanas y des-
vos de texto de la lista para ver cualquier archivo de texto; pus nuevamente Archivo Guardar Grfico como o Ar-
para listar cada archivo del flder, seleccione Todos los chivo Guardar sesin como, segn sea apropiado. Los gr-
archivos. ficos de Minitab pueden guardarse en el formato de grficos de
Minitab o en cualquiera de los formatos de grficos comunes, y
Para abrir el Proyecto Minitab que pueda incluir la sesin,
los archivos de Sesiones pueden guardarse como archivos de
hoja de trabajo y grficos, seleccione Archivo Abrir Pro-
texto simples o formateados.
yecto.
Para guardar una hoja de trabajo, seleccione Archivo
Guardar Hoja de trabajo actual como para mostrar la venta-
na de dilogo de Guardar hoja de trabajo como, que es similar a
la ventana de dilogo de Abrir hoja de trabajo como. Ingrese (o
Impresin de hojas de trabajo,
edite) el nombre del archivo en el cuadro Nombre del archivo
grficos y sesiones
y d clic en el botn OK. Si es aplicable, tambin puede hacer
Para imprimir una hoja de trabajo, grfico o sesin especfi-
lo siguiente:
cos, primero seleccione la ventana de la hoja de trabajo, grfico
Cambie a otro flder seleccionndolo de la lista hacia aba- o sesin que va a imprimir. Despus seleccione Archivo Im-
jo Guardar en. primir objeto, donde objeto es una Ventana de hoja de traba-
Cambie el valor de Guardar como escrito a algo ms que jo, Grfico o Sesin, dependiendo de la ventana seleccionada.
la opcin por default de Minitab, Minitab Portable o Si imprime una grfica o una ventana de sesin, podr ver
una versin anterior de Minitab, como Minitab 13, que la ventana de dilogo de Imprimir. Si imprime una hoja de tra-
son opciones que se utilizan comnmente. bajo, primero ver un cuadro de dilogo en la Ventana de Datos
Apndice 19

Opciones de Impresin (figura A1.7), que permite seleccionar


formalmente las opciones para la impresin (las que aparecen
por default funcionan bien para la mayora de las impresiones).
D clic en el botn OK para continuar con la ventana de dilo-
go de Imprimir.
La ventana de dilogo de Imprimir permite seleccionar la
impresora que se va a utilizar, qu pginas se van a imprimir y
el nmero de copias que se desea (1 es por default). Si usted de-
sea modificar estas opciones, hgalo antes de dar clic en el bo-
tn OK para realizar la impresin.
Despus de la impresin, deber verificar su contenido. La
mayora de los errores de impresin generan en la pantalla in-
formacin que permite conocer la razn de la falla. Es posible
cambiar el tamao o la orientacin del papel en la impresin se-
leccionando Archivo Colocacin del papel y hacer las selec-
cin apropiada dando clic en el botn OK.

FIGURA A1.7 Cuadro de dilogo de la ventana


de datos opciones de impresin.
CAPTULO 2
Presentacin de datos
en tablas y grficas
USO DE LA ESTADSTICA: Comparacin de los rendimientos de los fondos de inversin

2.1 TABLAS Y GRFICAS PARA DATOS Polgono


CATEGRICOS Polgono de porcentaje acumulado (ojiva)
Tabla de resumen
2.4 TABLAS Y GRFICAS DE DATOS
Grfica de barras
BIVARIADOS
Grfica de pastel
Tabla de contingencia
Diagrama de Pareto
Grfica de barras agrupadas
2.2 ORGANIZACIN DE LOS DATOS
2.5 DIAGRAMAS DE DISPERSIN Y SERIES
NUMRICOS
DE TIEMPO
Arreglo ordenado
Diagrama de dispersin
Diagrama de tallo y hojas
Series de tiempo
2.3 TABLAS Y GRFICAS PARA DATOS
2.6 USO INADECUADO DE GRFICAS
NUMRICOS
Y CONSIDERACIONES TICAS
Distribucin de frecuencias
Distribucin de frecuencias relativas A.2 USO DEL SOFTWARE PARA TABLAS
y distribucin de porcentajes Y GRFICAS
Distribucin acumulativa A2.1 Excel
Histograma A2.2 Minitab
A2.3 (Tema CD-ROM) SPSS

OBJETIVOS DE APRENDIZAJE
En este captulo, aprender:
A desarrollar tablas y grficas para datos categricos
A desarrollar tablas y grficas para datos numricos
Los principios para presentar grficas de forma adecuada
22 CAPTULO 2 Presentacin de datos en tablas y grficas

U S O D E L A E S TA D S T I C A
Comparacin de los rendimientos
de los fondos de inversin
Entre las muchas opciones de inversin disponibles en la actualidad, una elec-
cin comn para quienes piensan en su retiro son los fondos de inversin. Si
usted decide invertir en fondos de inversin su cuenta de retiro, qu hara pa-
ra hacer una eleccin razonable de entre todos los fondos disponibles hoy?
Primero debera conocer las diferentes categoras de los fondos de inver-
sin. Debera conocer las estrategias de los profesionales que administran los
fondos. Invierten en valores de alto riesgo o hacen elecciones ms conserva-
doras? El fondo se especializa en un determinado tamao de compaa, uno
cuya reserva principal totaliza un gran capital o uno de capital reducido? Co-
bra el fondo comisiones por administracin que reducen el porcentaje de uti-
lidad del inversionista? Y, por supuesto, debera conocer qu tan bien el fondo
ha manejado las inversiones en el pasado.
Todos stos son datos que debe revisar cuando considere varias posibili-
dades de invertir en fondos de inversin. Cmo poner manos a la obra con
estos datos y explorarlos de manera exhaustiva?

U na de las formas en las que podra responder a las preguntas de Uso de la estadstica es estu-
diando los datos de los fondos de inversin. El CD-ROM incluye una muestra de 121 fondos de
inversin en el archivo MUTUALFUNDS2004. Como inversionista, le gustara examinar tanto las varia-
bles categricas como las numricas. Tienen los fondos de inversin como un objetivo de creci-
miento rendimientos menores que los fondos de inversin con un objetivo de valor? Tienden los
fondos de crecimiento a ser inversiones ms riesgosas que los fondos de valor? Este captulo le ayu-
dar a seleccionar y desarrollar tablas y grficas apropiadas para encontrar la respuesta a stas y
otras preguntas.

2.1 TABLAS Y GRFICAS PARA DATOS CATEGRICOS


Cuando dispone de datos categricos usted registra las respuestas en categoras y luego presenta la
frecuencia o porcentaje de cada categora en tablas y grficas.

Tabla de resumen
La tabla de resumen indica la frecuencia, cantidad o porcentaje de objetos en un conjunto de cate-
goras para observar las diferencias que hay entre ellas. Una tabla de resumen lista las categoras en
una columna y la frecuencia, cantidad o porcentaje en una columna o columnas independientes. La
tabla 2.1 ilustra la tabla de resumen basada en una reciente encuesta en la que se pregunt por qu la
gente compra los regalos en lnea durante las temporadas festivas (USA Today Snapshots, Conve-
nience, Shipping Make Online Appealing, USA Today, 24 de diciembre, 2003, A1). En la tabla 2.1
se observa que las razones ms comunes para comprar en lnea son los gastos de envo gratis y la
conveniencia, seguidos por la comparacin de compra. Muy pocos compran en lnea por su variedad
en la seleccin o velocidad.

TABLA 2.1 Razn Porcentaje


Razones por las que Comparacin de compra 23
se compran regalos Conveniencia 33
en lnea durante la Gastos de envo gratis 34
temporada festiva. Variedad en la seleccin 6
Velocidad 4
Total 100
2.1: Tablas y grficas para datos categricos 23

EJEMPLO 2.1 TABLA DE RESUMEN DE LOS NIVELES DE RIESGO DE LOS FONDOS


DE INVERSIN
Los 121 fondos de inversin que forman parte del escenario Uso de la estadstica (vea la pgina
22) estn clasificados segn su nivel de riesgo: bajo, promedio y alto. Construya una tabla de resu-
men de los fondos de inversin categorizados por el nivel de riesgo.
SOLUCIN
La mayora de los fondos de inversin son de riesgo bajo o riesgo promedio (104 o aproximadamen-
te el 86%). Muy pocos de los fondos de inversin son de alto riesgo (14%).

TABLA 2.2 Nivel de riesgo del fondo Nmero de fondos Porcentaje de fondos
Tabla de resumen de Bajo 58 47.93
frecuencia y porcentaje Promedio 46 38.02
perteneciente al nivel Alto 17 14.05
de riesgo para 121 Total 121 100.00
fondos de inversin.

Grfica de barras
En una grfica de barras, cada barra muestra una categora, su longitud representa la cantidad, fre-
cuencia o porcentaje de los valores que caen en cada categora. La figura 2.1 muestra una grfica de
barras para las razones de comprar regalos en lnea durante la temporada festiva, de acuerdo con la
tabla 2.1.

FIGURA 2.1
Grfica de barras de
Excel con las razones
por las cuales se
compran regalos en
lnea durante la
temporada festiva.

Las grficas de barras permiten comparar los porcentajes de diferentes categoras. En la figura
2.1 las razones ms comunes para comprar en lnea son los gastos de envo gratis y la conveniencia,
seguidos por la comparacin de compra. Muy pocos respondieron que compran en lnea por su va-
riedad en la seleccin o velocidad.

EJEMPLO 2.2 GRFICA DE BARRAS PARA LOS NIVELES DE RIESGO DE LOS FONDOS
DE INVERSIN
Construya una grfica de barras para los niveles de riesgo de los fondos de inversin (con base en la
informacin de la tabla 2.2) e interprete los resultados.
24 CAPTULO 2 Presentacin de datos en tablas y grficas

SOLUCIN
La mayora de los fondos de inversin son de bajo riesgo o de riesgo promedio (104 o el 86%). Muy
pocos de los fondos de inversin son de alto nivel de riesgo (17 o el 14%).

FIGURA 2.2
Grfica de barras de
Excel con los niveles
de riesgo de los
fondos de inversin.

Grfica de pastel
La grfica de pastel es un crculo que se divide en partes para representar las categoras. El tamao
de cada rebanada vara de acuerdo con el porcentaje de cada categora. En la tabla 2.1, por ejemplo,
el 33% de los encuestados afirmaron que la conveniencia era la principal razn para comprar en
lnea. As, al construir la grfica de pastel, los 360 que conforman el crculo se multiplican por 0.33,
de lo que resulta una rebanada del pastel que abarca 118.8 de los 360 del crculo. En la figura
2.3 se observa que la grfica permite visualizar la porcin del pastel entero que est en cada catego-
ra. En esta figura, la razn que se refiere a la conveniencia abarca el 33% del pastel y la de la velo-
cidad slo el 4%.

FIGURA 2.3
Grfica de pastel de
Excel con las razones
por las que se compran
regalos en lnea durante
la temporada festiva.
2.1: Tablas y grficas para datos categricos 25

Qu grfica se debe utilizar? La seleccin de una grfica en particular depende de la intencin


de quien la construye. Si la comparacin de categoras es lo ms importante, podra utilizar una gr-
fica de barras. Si lo importante es observar la parte del total que est en una categora en particular,
debera utilizar la grfica de pastel.

EJEMPLO 2.3 GRFICA DE PASTEL DE LOS NIVELES DE RIESGO DE LOS FONDOS


DE INVERSIN
Construya una grfica de pastel para los niveles de riesgo de los fondos de inversin (vea la tabla 2.2
en la pgina 23) e interprete los resultados.
SOLUCIN
(Vea la figura 2.4.) La mayora de los fondos de inversin son de riesgo bajo o de riesgo promedio
(aproximadamente el 86%). Muy pocos son fondos de alto riesgo (aproximadamente el 14%).

FIGURA 2.4
Grfica de pastel
de Excel con los
niveles de riesgo de
los fondos de inversin.

Diagrama de Pareto
En un diagrama de Pareto las respuestas categorizadas se trazan en orden descendente de acuerdo
con sus frecuencias y se combinan con la lnea de porcentaje acumulado en la misma grfica. Este
diagrama permite identificar situaciones en las que se da el principio de Pareto.

PRINCIPIO DE PARETO
El principio de Pareto existe cuando la mayora de los elementos de un conjunto de datos caen
en un pequeo nmero de categoras, y las pocas observaciones restantes se dispersan en un gran
nmero de categoras. A menudo nos referimos a estos dos grupos como lo poco vital y lo mu-
cho trivial.

El diagrama de Pareto permite separar a lo poco vital de lo mucho trivial, lo que nos permi-
te enfocarnos en las categoras importantes. En las situaciones en las que los datos en estudio consis-
ten en informacin defectuosa o incompleta, el diagrama de Pareto se convierte en una herramienta
valiosa para dar prioridad a los esfuerzos de mejoramiento.
La tabla 2.3 presenta datos de una gran compaa de moldeado de inyeccin que produce com-
ponentes moldeados de plstico para teclados de computadora, lavadoras, automviles y televisores.
Los datos presentados en la tabla 2.3 consisten en todos los teclados de computadora defectuosos
producidos durante un periodo de tres meses. TECLADO
26 CAPTULO 2 Presentacin de datos en tablas y grficas

TABLA 2.3 Causa Frecuencia Porcentaje


Tabla de resumen de las Mancha negra 413 6.53
causas de los defectos Dao 1,039 16.43
en los teclados de Embarque 258 4.08
computadora en un Marcas de clavijas 834 13.19
periodo de tres meses. Rasguos 442 6.99
Impacto en el molde 275 4.35
Raya plateada 413 6.53
Marca de hundimiento 371 5.87
Marca de spray 292 4.62
Deformacin 1,987 31.42
Total 6,324 100.01*

*Los resultados difieren ligeramente de los 100.00 por el redondeo.


Fuente: U.H. Acharya y C. Mahesh, Winning Back the Customers
Confidence: A Case Study on the Application of Design of Experiments to
an Injection-Molding Process, Quality Engineering, 11, 1999, 357-363.

La tabla 2.4 presenta un resumen para los defectos de los teclados de computadora, en la que las
categoras estn ordenadas de acuerdo con el porcentaje (y no alfabticamente). Los porcentajes
acumulados para las categoras ordenadas tambin forman parte de la tabla.

TABLA 2.4 Porcentaje


Tabla ordenada de Causa Frecuencia Porcentaje acumulativo
resumen de las causas
de los defectos en Deformacin 1,987 31.42 31.42
los teclados de Dao 1,039 16.43 47.85
computadora en un Marca de clavijas 834 13.19 61.04
periodo de tres meses. Rasguos 442 6.99 68.03
Mancha negra 413 6.53 74.56
Raya plateada 413 6.53 81.09
Marca de hundimiento 371 5.87 86.96
Marca de spray 292 4.62 91.58
Impacto en el molde 275 4.35 95.93
Embarque 258 4.08 100.00
Total 6,324 100.01*

*Los resultados difieren ligeramente de 100.00 por el redondeo.

En la tabla 2.4 la primera categora en la lista es la deformacin (con el 31.42% de los defectos),
seguida por dao (16.43%) y marca de clavijas (13.19%). Las dos categoras ms frecuentes de-
formacin y dao abarcan el 47.85% de los defectos; las tres categoras ms frecuentes deforma-
cin, dao y marcas de clavijas abarcan el 61.04% de los defectos, y as sucesivamente. La figura
2.5 es un diagrama de Pareto basado en los resultados mostrados en forma tabular en la tabla 2.4.
La figura 2.5 presenta las barras de forma vertical a lo largo de la lnea de porcentaje acumu-
1 Lea los porcentajes de lado.1 La lnea acumulativa est trazada en el punto medio de cada barra a una altura semejante al
la barra en la escala porcentaje acumulado. Si sigue la lnea, ver que estas tres primeras categoras abarcan ms del 60% de
vertical izquierda. Lea las correcciones. Como las categoras del diagrama de Pareto estn ordenadas por la frecuencia
los porcentajes de ocurrencia, quienes toman decisiones podrn ver dnde concentrar sus esfuerzos para mejorar el
acumulados en la escala proceso. Los intentos de reducir los defectos por deformacin, dao y marcas de clavijas debern
generar el mayor gasto. Despus podrn hacerse esfuerzos para reducir los rasguos y las manchas
vertical derecha.
negras.
Para que una tabla de resumen incluya todas las categoras, aun aquellas con menos defectos,
en algunos casos se deber agregar la categora de Otros o Miscelnea. Para estos casos, la barra se
coloca a la derecha de las dems.
2.1: Tablas y grficas para datos categricos 27

FIGURA 2.5
Diagrama de Pareto en
Excel para los datos de
los defectos de teclado.

EJEMPLO 2.4 DIAGRAMA DE PARETO DE LAS RAZONES PARA COMPRAR REGALOS EN LNEA
DURANTE LA TEMPORADA FESTIVA
Construya un diagrama de Pareto para las razones de comprar regalos en lnea (vea la tabla 2.1 en la
pgina 22).
SOLUCIN
En la figura 2.6, los gastos de envo gratis y la conveniencia abarcan el 67% de las razones para
comprar en lnea, mientras que los gastos de envo gratis, conveniencia y comparacin de compras
abarcan el 90%.

FIGURA 2.6
Diagrama de Pareto
Minitab, de las razones
para comprar regalos
en lnea durante la
temporada festiva.
28 CAPTULO 2 Presentacin de datos en tablas y grficas

PROBLEMAS PARA LA SECCIN 2.1


Aprendizaje bsico de los buscadores de la Web, entre los usuarios de Internet de
Estados Unidos; el estudio se realiz en mayo de 2003.
ASISTENCIA 2.1 Una variable categrica tiene tres categoras
de PH Grade con las siguientes frecuencias: Fuente Porcentaje
Categora Frecuencia Ask Jeeves 3
AOL Time Warner 19
A 13 Google 32
B 28 MSN-Microsoft 15
C 9 Yahoo 25
a. Calcule el porcentaje de valores en cada categora. Otros 6
b. Construya una grfica de barras.
a. Elabore una grfica de barras, una grfica de pastel y un dia-
c. Construya una grfica de pastel.
grama de Pareto.
d. Construya un diagrama de Pareto.
b. Cul mtodo grfico refleja mejor los datos?
ASISTENCIA 2.2 Una variable categrica tiene cuatro categoras c. Qu conclusiones se obtienen respecto a la participacin de
de PH Grade con los siguientes porcentajes:
mercado de los buscadores Web en mayo de 2003?
Categora Porcentaje Categora Porcentaje 2.5 Los estadounidenses pagaron ms de 50 mil millones de
dlares en transacciones en lnea con tarjetas de crdito en el
A 12 C 35 ao 2000 (Byron Acohido, Microsoft, Banks Battle to Control
B 29 D 24 Your e-info, USA Today, 13 de agosto, 2001, 1B-2B). Estas
transacciones se distribuyeron de la siguiente manera:
a. Construya una grfica de barras.
b. Construya una grfica de pastel.
Cantidad (miles
c. Construya un diagrama de Pareto.
Tarjeta de crdito de millones de $) Porcentaje
Aplicacin de conceptos American Express 8.04 15.6
Discover 1.97 3.8
Puede resolver los problemas 2.3 a 2.10 manual-
MasterCard 15.57 30.2
mente o usando Excel, Minitab o SPSS. Visa 25.96 50.4
AUTO 2.3 En una encuesta se pregunt a 150 ejecutivos
Examen cul crean que era el error ms comn de los candi- a. Construya una grfica de barras, una grfica de pastel y un
datos durante las entrevistas de trabajo. Los resulta- diagrama de Pareto.
dos (USA Today Snapshots, 19 de noviembre, 2001) fueron los b. Cul de los mtodos grficos refleja mejor los datos?
siguientes:
2.6 La siguiente tabla representa las fuentes de energa elctri-
Razn Porcentaje ca utilizadas en Estados Unidos en un ao reciente:

Poco o nulo conocimiento de la compaa 44 Fuente Porcentaje


Sin preparacin para discutir sus planes
profesionales 23 Carbn 51
Escaso entusiasmo 16 Plantas hidroelctricas 6
Falta de contacto visual 5 Gas natural 16
Sin preparacin para discutir sus habilidades/ Nuclear 21
experiencias 3 Petrleo 3
Otras razones 9 Otras 3
Fuente: Departamento de Energa de Estados Unidos.
a. Construya una grfica de barras, una grfica de pastel y un
diagrama de Pareto. a. Elabore un diagrama de Pareto.
b. Cul es el mtodo grfico que mejor refleja los datos? b. Qu porcentaje de electricidad se deriva de cualquiera de
c. Si fuera un candidato en una entrevista de trabajo, qu erro- las siguientes fuentes: carbn, energa nuclear o gas natural?
res tratara de evitar especialmente? c. Construya una grfica de pastel.
d. Qu grfica prefiere usar: el diagrama de Pareto o la grfi-
2.4 Un artculo (M. Mangalindan, N. Wingfield y R. Guth, ca de pastel? Por qu?
Rising Clout of Google Prompts Rush by Internet Rivals to
Adapt, The Wall Street Journal, 16 de julio, 2003, A1, A6) 2.7 Un artculo (P. Kitchen, Retirement Plan: To Keep Wor-
analiz la amplia influencia que Google tuvo en Internet a nivel king, Newsday, 24 de septiembre, 2003) expuso los resultados
mundial. La siguiente tabla indica la participacin de mercado de una muestra de 2,001 estadounidenses de entre 50 y 70 aos
2.2: Organizacin de los datos numricos 29

de edad que tenan empleos de tiempo completo o de medio 2.9 Un analista registr las causas de las cadas de una red du-
tiempo. La siguiente tabla representa sus planes de retiro. rante los pasados seis meses.

Planes Porcentaje Razn de la falla Frecuencia


No tener un trabajo asalariado 29 Conexin fsica 1
Iniciar un negocio propio 10 Falla de energa 3
Trabajar tiempo completo 7 Software del servidor 29
Trabajar medio tiempo 46 Hardware del servidor 2
No sabe 3 Servidor falto de memoria 32
Otros 5 Banda ancha inadecuada 1

a. Elabore una grfica de barras y una grfica de pastel. a. Realice un diagrama de Pareto.
b. Cul mtodo grfico cree que describe mejor los datos? b. Analice las razones poco vital y muy trivial por las que
el sistema de red se cay.
2.8 El correo electrnico basura (spam) se ha convertido en un
2.10 Los siguientes datos representan las quejas acerca de las
problema muy grave para la productividad (J. Hopkins, Spam
habitaciones de un hotel.
Blaster Does Job for Merril, USA Today, 7 de enero, 2004). La
siguiente tabla muestra el uso que una compaa da al software Razn Nmero
antispam con basae en una encuesta realizada a ejecutivos de
tecnologa. Habitacin sucia 32
Habitacin sin equipamiento 17
Porcen- Habitacin que no est lista 12
Uso de software antispam por la compaa taje Habitacin demasiado ruidosa 10
Habitacin que requiere de mantenimiento 17
Tiene software para algunos usuarios 12 Habitacin con pocas camas 9
Tiene software para todos los usuarios 59 Habitacin que no tiene las caractersticas prometidas 7
Planea tener software en los prximos 12 meses 20 No tiene instalaciones especiales 2
No planea tener software 9
a. Elabore un diagrama de Pareto.
a. Construya una grfica de barras y una grfica de pastel. b. En qu se debe enfocar el hotel si desea reducir el nmero
b. Cul mtodo grfico representa mejor estos datos? de quejas? Explique su respuesta.

2.2 ORGANIZACIN DE LOS DATOS NUMRICOS


Cuando el nmero de datos es grande, es conveniente organizar los datos numricos en un arreglo
ordenado o diagrama de tallo y hojas para ayudar a comprender la informacin. Suponga que deci-
de llevar a cabo un estudio comparativo del costo de una comida en un restaurante de una gran ciu-
dad con el de una comida similar en un restaurante fuera de la ciudad. La tabla 2.5 muestra los datos
de 50 restaurantes citadinos y 50 fuera de la ciudad. RESTRATE Los datos no estn ordenados de me-
nor a mayor. Esta organizacin hace difcil obtener conclusiones sobre el precio de las comidas en
las dos reas geogrficas.

TABLA 2.5 Ciudad


Precio por persona 50 38 43 56 51 36 25 33 41 44
en 50 restaurantes 34 39 49 37 40 50 50 35 22 45
citadinos y en 50 44 38 14 44 51 27 44 39 50 35
restaurantes fuera de 31 34 48 48 30 42 26 35 32 63
la ciudad. 36 38 53 23 39 45 37 31 39 53
Fuera de la ciudad
37 37 29 38 37 38 39 29 36 38
44 27 24 34 44 23 30 32 25 29
43 31 26 34 23 41 32 30 28 33
26 51 26 48 39 55 24 38 31 30
51 30 27 38 26 28 33 38 32 25
30 CAPTULO 2 Presentacin de datos en tablas y grficas

Arreglo ordenado
Un arreglo ordenado es una secuencia de datos ordenados del menor al mayor valor. La tabla 2.6
contiene la formacin ordenada para el precio de las comidas en restaurantes citadinos y de los su-
burbios. RESTRATE En la tabla 2.6 se observa que el precio de una comida en los restaurantes citadi-
nos se encuentra entre $14 y $63, y que en los restaurantes fuera de la ciudad se encuentra entre $23
y $55.

TABLA 2.6 Ciudad


Arreglo ordenado 14 22 23 25 26 27 30 31 31 32
del precio por persona 33 34 34 35 35 35 36 36 37 37
en 50 restaurantes 38 38 38 39 39 39 39 40 41 42
de la ciudad y 50 43 44 44 44 44 45 45 48 48 49
restaurantes fuera de 50 50 50 50 51 51 53 53 56 63
la ciudad.
Fuera de la ciudad
23 23 24 24 25 25 26 26 26 26
27 27 28 28 29 29 29 30 30 30
30 31 31 32 32 32 33 33 34 34
36 37 37 37 38 38 38 38 38 38
39 39 41 43 44 44 48 51 51 55

Diagrama de tallo y hojas


El diagrama de tallo y hojas organiza los datos en grupos (llamados tallos), para que los valores
dentro de cada grupo (las hojas) ramifiquen hacia la derecha de cada fila. El diagrama resultante per-
mite ver cmo se distribuyen y dnde estn las concentraciones de datos. Para ver cmo se elabora
un diagrama de tallo y hojas suponga que 15 alumnos de su clase comen en un restaurante de comi-
da rpida. Los siguientes datos son las cantidades que gastaron.
5.35 4.75 4.30 5.47 4.85 6.62 3.54 4.87 6.26 5.48 7.27 8.45 6.05 4.76 5.91
Para formar un diagrama de tallo y hojas se colocan los primeros valores en orden ascendente. Se
utiliza la columna de las unidades como el tallo y se redondean los decimales (las hojas) a un lugar
decimal.
3 5
4 83998
5 4559
6 631
7 3
8 5
El primer valor de 5.35 se redondea a 5.4. Su tallo (fila) es 5 y su hoja es 4. El segundo valor de 4.75
se redondea a 4.8. Su tallo (fila) es 4 y su hoja es 8.

EJEMPLO 2.5 DIAGRAMA DE TALLO Y HOJAS DEL RENDIMIENTO DE FONDOS


DE INVERSIN EN 2003
En el escenario Uso de la estadstica, se le pide estudiar el rendimiento de los fondos de inversin
en 2003 MUTUALFUNDS2004. Elabore un diagrama de tallo y hojas.
SOLUCIN
A partir de la figura 2.7 se concluye que:
El menor rendimiento en 2003 fue del 14%.
El mayor rendimiento en 2003 fue del 78%.
Los rendimientos en 2003 se concentraron entre el 25 y 50%.
Slo cuatro fondos de inversin dieron rendimientos por debajo del 20% y slo dos fondos de
inversin dieron rendimientos por encima del 70%.
2.2: Organizacin de los datos numricos 31

FIGURA 2.7
Pantalla de tallo y hojas
para los rendimientos
en 2003.

PROBLEMAS PARA LA SECCIN 2.2

Aprendizaje bsico
9 147
ASISTENCIA 2.11 Elabore un arreglo ordenado para los siguien-
de PH Grade tes datos obtenidos de una muestra de n = 7 de las 10 02238
puntuaciones parciales de la materia de finanzas:
11 125566777
68 94 63 75 71 88 64
12 223489
ASISTENCIA 2.12 Para los siguientes datos obtenidos de una
de PH Grade muestra de n = 7 de las puntuaciones parciales de la 13 02
materia de sistemas de informacin, realice un dia-
grama de tallo y hojas: a. Coloque los datos en un arreglo ordenado.
b. Cul de los dos diagramas aporta ms informacin? Expli-
80 54 69 98 93 53 74 que su respuesta.
ASISTENCIA 2.13 Elabore un arreglo ordenado para los siguien- c. Cunta gasolina (en galones) es ms probable que se com-
de PH Grade tes datos obtenidos de una muestra de n = 7 de las pre?
puntuaciones parciales de la materia de marketing: d. Existe una concentracin en la compra de cantidades en el
centro de distribucin?
88 78 78 73 91 78 85
ASISTENCIA 2.16 Los siguientes datos representan las cuotas en
ASISTENCIA 2.14 Elabore un arreglo ordenado a partir del dia- de PH Grade dlares de cheques rechazados de una muestra de 23
de PH Grade grama de tallo y hojas con la siguiente muestra de
bancos, firmados por clientes que depositan directa-
n = 7 puntuaciones parciales de la materia de siste- mente y que mantienen un saldo promedio de $100. BANK-
mas de informacin: COST1
5 0
26 28 20 20 21 22 25 25 18 25 15 20
6
18 20 25 25 22 30 30 30 15 20 29
7 446
Fuente: The New Face of Banking, Copyright 2000 by Consumers
8 19 Union of U.S., Inc., Yonkers NY 10703-1057. Adaptado con el permiso de
9 2 Consumer Reports, junio de 2000.
a. Coloque los datos en un arreglo ordenado.
Aplicacin de conceptos b. Elabore un diagrama de tallo y hojas para estos datos.
ASISTENCIA 2.15 El siguiente diagrama de tallo y hojas repre- c. Cul de estos dos diagramas aporta ms informacin? Ex-
de PH Gradesenta la cantidad de gasolina comprada en galones plique su respuesta.
(con hojas en decenas de galones) para una muestra d. Alrededor de qu valor, si lo hay, se encuentran concentra-
de 25 autos que utilizan una estacin de servicio en la autopista de das las cuotas para cheques rechazados? Explique su res-
Nueva Jersey: puesta.
32 CAPTULO 2 Presentacin de datos en tablas y grficas

ASISTENCIA 2.17 Los siguientes datos representan la cuota 2.19 Los siguientes datos representan el costo promedio dia-
de PH Grademensual de servicio que se cobra en dlares a un rio de hotel y de la renta de auto para 20 ciudades de Estados
cliente si su cuenta no alcanza el saldo promedio re- Unidos durante una semana en octubre de 2003. HOTEL-CAR
querido, en una muestra de clientes de 26 bancos que depositan
directamente y que mantienen un saldo promedio de $1,500. Ciudad Hotel Autos
BANKCOST2
San Francisco 205 47
12 8 5 5 6 6 10 10 9 7 10 7 7 Los ngeles 179 41
5 0 10 6 9 12 0 5 10 8 5 5 9 Seattle 185 49
Phoenix 210 38
Fuente: The New Face of Banking, Copyright 2000 by Consumers
Denver 128 32
Union of U.S., Inc., Yonkers NY 10703-1057. Adaptado con el permiso de
Dallas 145 48
Consumer Reports, junio de 2000.
Houston 177 49
a. Coloque los datos en un arreglo ordenado. Minneapolis 117 41
b. Elabore un diagrama de tallo y hojas para estos datos. Chicago 221 56
c. Cul de estos dos diagramas aporta ms informacin? Ex- St. Louis 159 41
plique su respuesta. Nueva Orlens 205 50
d. Alrededor de qu valor, si lo hay, se encuentran concentra- Detroit 128 32
das las cuotas de servicio? Explique su respuesta. Cleveland 165 34
AUTO 2.18 Los siguientes datos representan el total de gra- Atlanta 180 46
Examen sa en las hamburguesas y pollo de una muestra de Orlando 198 41
cadenas de comida rpida. FASTFOOD Miami 158 40
Pittsburg 132 39
HAMBURGUESAS Boston 283 67
19 31 34 35 39 39 43 Nueva York 269 69
Washington, D.C. 204 40
POLLO
7 9 15 16 16 18 22 25 27 33 39 Fuente: The Wall Street Journal, 10 de octubre, 2003, W4.
Fuente: Quick Bites, Copyright 2001 by Consumers Union of U.S.,
Inc., Yonkers, NY 10703-1057. Adaptado con permiso de Consumer Re-
ports, marzo de 2001.
a. Coloque los datos para el costo del hotel y el costo de la ren-
ta de auto en dos arreglos ordenados.
a. Coloque los datos para las hamburguesas y el pollo en dos b. Elabore un diagrama de tallo y hojas para el costo del hotel
arreglos ordenados. y el costo de la renta de auto.
b. Elabore diagramas de tallo y hojas para las hamburguesas y c. Qu aporta mayor informacin: el arreglo ordenado o el
el pollo. diagrama de tallo y hojas? Explique su respuesta.
c. Cul brinda mayor informacin: el arreglo ordenado o el d. Alrededor de qu valor, si lo hay, se concentran los costos
diagrama de tallo y hojas? Explique. del hotel y de la renta de auto? Explique su respuesta.
d. Compare las hamburguesas y el pollo en trminos de su con-
tenido total de grasa. A qu conclusin llega?

2.3 TABLAS Y GRFICAS PARA DATOS NUMRICOS


Cuando tenemos un conjunto de datos muy grande, a menudo se dificulta llegar a conclusiones con
base en un arreglo ordenado o en un diagrama de tallo y hojas. En tales circunstancias es necesario
usar tablas y grficas. Existen diferentes tablas y grficas que permiten presentar visualmente los da-
tos numricos. Entre ellas se incluyen las distribuciones de frecuencia y de porcentaje, el histogra-
ma, el polgono y el polgono de porcentaje acumulado (ojiva).

Distribucin de frecuencias
La distribucin de frecuencias nos ayuda a obtener conclusiones de un conjunto de datos grande.

Una distribucin de frecuencias es una tabla de resumen en la que los datos estn organizados
en clases o grupos numricamente ordenados.
2.3: Tablas y grficas para datos numricos 33

Al construir una distribucin de frecuencia, se debe prestar atencin al seleccionar el nmero


apropiado de agrupaciones o clases para la tabla, determinando una amplitud conveniente de las
clases y estableciendo los lmites de cada una para evitar el traslape.
El nmero de clases usadas depende del nmero de valores. Un mayor nmero de valores per-
mite un mayor nmero de clases. En general, la distribucin de frecuencias debera tener por lo me-
nos cinco clases, pero no ms de 15. Tener muy pocas o muchas clases ofrece poca informacin.
Cuando se elabora una distribucin de frecuencias, se define cada clase con base en intervalos
de clase de la misma amplitud. Para determinar la amplitud de un intervalo de clase, se divide el
rango (el valor mayor menos el valor menor) de los datos entre el nmero de los agrupamientos o
clases que se desea.

DETERMINACIN DE LA AMPLITUD DEL INTERVALO DE CLASE


rango
Amplitud del intervalo =  (2.1)
nmero de clases deseado

Los datos de los restaurantes citadinos constituyen una muestra de 50 establecimientos. Para es-
te tamao de muestra es aceptable tener 10 agrupamientos o clases. En la formacin ordenada de la
tabla 2.6 en la pgina 30, el rango de los datos es $63 $14 = $49. Mediante la ecuacin (2.1), se
aproxima la amplitud del intervalo de clase de la siguiente forma:
49
Amplitud del intervalo =  = 4.9
10
Se debe elegir una amplitud de intervalo que simplifique la lectura e interpretacin. Por tanto,
en lugar de usar una amplitud de intervalo de $4.90, se debera elegir una amplitud de intervalo de
$5.00.
Para construir una tabla de distribucin de frecuencias, se debern establecer lmites de clase
claramente definidos para cada agrupamiento de clase, para que los valores estn clasificados ade-
cuadamente. Cada valor se coloca en una y slo una clase. Se debe evitar el traslape de clases.
Puesto que se ha establecido la amplitud de cada intervalo de clase para el costo de la comida
en $5, es necesario establecer los lmites para los diferentes agrupamientos o clases, para que as se
incluya el rango completo de valores. Siempre que sea posible, uno debera elegir tales lmites para
simplificar la lectura e interpretacin. As, como los costos varan de $14 a $63, para los restauran-
tes de la ciudad, el primer intervalo de clase va de $10 a menos de $15, el segundo va de $15 a me-
nos de $20, y as sucesivamente, hasta que se hayan formado 11 clases. Cada clase tiene una ampli-
tud de intervalo de $5, sin traslaparse. El centro de cada clase, el punto medio de la clase, est a la
mitad del camino entre el lmite inferior y el lmite superior de la clase. Por tanto, el punto medio de
la clase que va de $10 a por debajo de $15 es $12.5, el punto medio de la clase que va de $15 a por
debajo de $20 es $17.5, etctera. La tabla 2.7 es una distribucin de frecuencias para el costo por co-
mida de los 50 restaurantes de la ciudad y para los 50 restaurantes fuera de la ciudad.

TABLA 2.7 Costo por comida ($) Frecuencia de la ciudad Frecuencia de los suburbios
Distribucin de 10 pero menos de $15 1 0
frecuencias del costo 15 pero menos de $20 0 0
por comida para 20 pero menos de $25 2 4
50 restaurantes 25 pero menos de $30 3 13
de la ciudad y 50 30 pero menos de $35 7 13
restaurantes de los 35 pero menos de $40 14 12
suburbios. 40 pero menos de $45 8 4
45 pero menos de $50 5 1
50 pero menos de $55 8 2
55 pero menos de $60 1 1
60 pero menos de $65 1 0
Total 50 50
34 CAPTULO 2 Presentacin de datos en tablas y grficas

La distribucin de frecuencias permite obtener conclusiones acerca de las caractersticas princi-


pales de los datos. Por ejemplo, la tabla 2.7 muestra que el costo de las comidas en los restaurantes
de la ciudad est concentrado entre los $30 y los $55, en comparacin con las comidas en los restau-
rantes de los suburbios, los cuales estn concentrados entre los $25 y los $40.
Si el conjunto de datos no contiene muchos valores, un conjunto de lmites de clase refleja una
imagen diferente de la que da otro conjunto de lmites. Por ejemplo, para los datos del costo del res-
taurante, usar un intervalo de clase de amplitud 4.0 en lugar de 5.0 (como el que se utiliz en la ta-
bla 2.7), provocara cambios en la forma en la que los valores se distribuyen entre las clases.
Usted obtendr cambios en la concentracin de los datos al elegir lmites de clase inferiores y
superiores diferentes. Por fortuna, conforme aumenta el tamao de la muestra, las alteraciones en la
seleccin de los lmites de clase afectan cada vez menos la concentracin de los datos.

EJEMPLO 2.6 DISTRIBUCIN DE FRECUENCIAS DE LOS RENDIMIENTOS EN 2003


DE LOS FONDOS DE INVERSIN DE CRECIMIENTO Y DE VALOR
En el escenario de Uso de la estadstica se le pide comparar el rendimiento en 2003 de los fondos
de inversin de crecimiento y de valor. MUTUALFUNDS2004 Construya una distribucin de frecuen-
cias para los fondos de crecimiento y para los fondos de valor.
SOLUCIN
El porcentaje de rendimientos en 2003 de los fondos de crecimiento est concentrado significativa-
mente entre el 30 y el 50, con una ligera concentracin entre el 20 y el 30 (vea la tabla 2.8). El por-
centaje de rendimientos en 2003 de los fondos de valor est concentrado entre el 30 y el 50, con al-
gunos entre 20 y 30 y entre 50 y 70. No debe comparar directamente las frecuencias de los fondos de
crecimiento y los fondos de valor puesto que en la muestra hay 49 fondos de crecimiento y 72 fon-
dos de valor.

TABLA 2.8 Porcentaje de rendimiento 2003 Frecuencia de crecimiento Frecuencia de valor


Distribucin de 10 pero menos que 20 2 2
frecuencias del 20 pero menos que 30 9 9
rendimiento en 2003 30 pero menos que 40 13 20
de los fondos de 40 pero menos que 50 15 20
inversin de 50 pero menos que 60 5 10
crecimiento y de valor. 60 pero menos que 70 5 9
70 pero menos que 80 0 2
Total 49 72

Distribucin de frecuencias relativas y distribucin de porcentajes


Como generalmente deseamos saber la proporcin o el porcentaje del total en cada grupo, es prefe-
rible usar la distribucin de frecuencias relativa o la distribucin de porcentajes. Cuando compara-
mos dos o ms grupos que difieren en el tamao de su muestra, se debe usar una distribucin de fre-
cuencias relativa o una distribucin de porcentaje.
Se crea una distribucin de frecuencias relativa al dividir las frecuencias de cada clase de la
distribucin de frecuencias (vea la tabla 2.7 en la pgina 33) por el nmero total de valores. Se crea
una distribucin de porcentajes al multiplicar cada frecuencia relativa por 100%. As, la frecuen-
cia relativa de las comidas en los restaurantes de la ciudad que cuestan entre $30 y $35 es 7 dividi-
do por 50 o 0.14, y el porcentaje es del 14%. La tabla 2.9 presenta la distribucin de frecuencias re-
lativa y la distribucin de porcentajes del costo de las comidas en restaurantes de la ciudad y de los
suburbios.
A partir de la tabla 2.9, se concluye que las comidas cuestan ms en los restaurantes de la ciu-
dad que en los de los suburbios: el 16% de las comidas en los restaurantes de la ciudad cuestan en-
tre $50 y $55, en comparacin con el 4% de los restaurantes de los suburbios; mientras que slo el
6% de las comidas en los restaurantes de la ciudad cuestan entre $25 y $30 en comparacin con
el 26% de los restaurantes de los suburbios.
2.3: Tablas y grficas para datos numricos 35

TABLA 2.9 Ciudad Suburbios


Distribucin de Costo por comida ($) Frecuencia relativa Porcentaje Frecuencia relativa Porcentaje
frecuencias relativa
y distribucin de 10 pero menos que $15 0.02 2.0 0.00 0.0
porcentajes del costo 15 pero menos que $20 0.00 0.0 0.00 0.0
de las comidas en 20 pero menos que $25 0.04 4.0 0.08 8.0
restaurantes de la 25 pero menos que $30 0.06 6.0 0.26 26.0
ciudad y de los 30 pero menos que $35 0.14 14.0 0.26 26.0
suburbios. 35 pero menos que $40 0.28 28.0 0.24 24.0
40 pero menos que $45 0.16 16.0 0.08 8.0
45 pero menos que $50 0.10 10.0 0.02 2.0
50 pero menos que $55 0.16 16.0 0.04 4.0
55 pero menos que $60 0.02 2.0 0.02 2.0
60 pero menos que $65 0.02 2.0 0.00 0.0
Total 1.00 100.0 1.00 100.0

EJEMPLO 2.7 DISTRIBUCIN DE FRECUENCIAS RELATIVA Y DISTRIBUCIN


DE PORCENTAJES DEL RENDIMIENTO EN 2003 DE LOS
FONDOS DE INVERSIN DE CRECIMIENTO Y DE VALOR
En el escenario de Uso de la estadstica, se le pide que compare el rendimiento en 2003 de los fon-
dos de inversin de crecimiento y de valor. MUTUALFUNDS2004 Construya una distribucin de fre-
cuencias relativa y una distribucin de porcentajes para los fondos de crecimiento y para los fondos
de valor.
SOLUCIN
Se concluye (vea la tabla 2.10) que el rendimiento en 2003 de los fondos de crecimiento es ligera-
mente inferior a la de los fondos de valor y que el 18.37% de los fondos de crecimiento tienen ren-
dimientos entre 20 y 30 en comparacin con el 12.5% de los fondos de valores. Los fondos de valor
tienen rendimientos ligeramente mayores (entre 50 y 60, y entre 60 y 70) que los fondos de creci-
miento.

TABLA 2.10 Porcentaje anual


Crecimiento Valor
Distribucin de de rendimiento en 2003 Proporcin Porcentaje Proporcin Porcentaje
frecuencias relativa
y distribucin de 10 pero menos que 20 0.0408 4.08 0.0278 2.78
porcentajes del 20 pero menos que 30 0.1837 18.37 0.1250 12.50
rendimiento en 2003 30 pero menos que 40 0.2653 26.53 0.2778 27.78
de los fondos de 40 pero menos que 50 0.3061 30.61 0.2778 27.78
inversin de 50 pero menos que 60 0.1020 10.20 0.1389 13.89
crecimiento y de valor. 60 pero menos que 70 0.1020 10.20 0.1250 12.50
70 pero menos que 80 0.0000 0.00 0.0278 2.78
Total 1.0000 100.0 1.0000 100.0

Distribucin acumulativa
La distribucin de porcentaje acumulado constituye una manera de presentar la informacin del
porcentaje de los valores que estn por debajo de cierto valor. Por ejemplo, tal vez se desea conocer
qu porcentaje de las comidas de los restaurantes de la ciudad cuestan menos que $20, menos que
$30, menos que $50, etctera. La distribucin de porcentaje se usa para formar una distribucin de
porcentaje acumulado. A partir de la tabla 2.12, se sabe que el 0.00% de las comidas cuestan menos
de $10, el 2% cuesta menos de $15, el 2% tambin cuesta menos de $20 (porque ninguna de las co-
midas cuestan entre $15 y $20), el 6% (2 + 4%) cuesta menos de $25, y as sucesivamente, hasta que
el 100% de comidas cuestan menos de $65. La tabla 2.11 ilustra cmo desarrollar la distribucin de
porcentaje acumulado para el costo de las comidas en restaurantes de la ciudad.
36 CAPTULO 2 Presentacin de datos en tablas y grficas

TABLA 2.11 Porcentaje de fondos por debajo del lmite


Desarrollo de la Costo por comida ($) Porcentaje inferior del intervalo de clase
distribucin de 10 pero menos de $15 2 0
porcentaje acumulado 15 pero menos de $20 0 2
del costo de las 20 pero menos de $25 4 2=2+0
comidas en los 25 pero menos de $30 6 6=2+0+4
restaurantes de la 30 pero menos de $35 14 12 = 2 + 0 + 4 + 6
ciudad. 35 pero menos de $40 28 26 = 2 + 0 + 4 + 6 + 14
40 pero menos de $45 16 54 = 2 + 0 + 4 + 6 + 14 + 28
45 pero menos de $50 10 70 = 2 + 0 + 4 + 6 + 14 + 28 + 16
50 pero menos de $55 16 80 = 2 + 0 + 4 + 6 + 14 + 28 + 16 + 10
55 pero menos de $60 2 96 = 2 + 0 + 4 + 6 + 14 + 28 + 16 + 10 + 16
60 pero menos de $65 2 98 = 2 + 0 + 4 + 6 + 14 + 28 + 16 + 10 + 16 + 2
$65 pero menos de $70 0 100 = 2 + 0 + 4 + 6 + 14 + 28 + 16 + 10 + 16 + 2 + 2

La tabla 2.12 resume los porcentajes acumulados del costo de las comidas en restaurantes de la
ciudad y de los suburbios. La distribucin acumulativa muestra claramente que los costos de la co-
mida son inferiores en los restaurantes de los suburbios que en los de la ciudad: en el 34% de los res-
taurantes de los suburbios cuesta menos de $30, en comparacin con slo el 12% de los restaurantes
de la ciudad; en el 60% de los restaurantes de los suburbios cuesta menos de $35 en comparacin
con slo el 26% de los restaurantes de la ciudad; en el 84% de los restaurantes de los suburbios cues-
ta menos de $40 en comparacin con slo el 54% de los restaurantes de la ciudad.

TABLA 2.12 Porcentaje de restaurantes Porcentaje de restaurantes


Distribucin de de la ciudad con valor de los suburbios con valor
porcentajes Costo ($) menor al indicado menor al indicado
acumulados del costo 10 0 0
de las comidas en 15 2 0
restaurantes de la 20 2 0
ciudad y de los 25 6 8
suburbios. 30 12 34
35 26 60
40 54 84
45 70 92
50 80 94
55 96 98
60 98 100
65 100 100

EJEMPLO 2.8 DISTRIBUCIN DE PORCENTAJE ACUMULADO DEL RENDIMIENTO EN 2003


DE LOS FONDOS DE INVERSIN DE CRECIMIENTO Y DE VALOR
En el escenario Uso de la estadstica, se le pide comparar el rendimiento anual en 2003 de los fon-
dos de inversin de crecimiento y de valor. MUTUALFUNDS2004 Construya una distribucin de por-
centaje acumulado para los fondos de crecimiento y para los fondos de valor.
SOLUCIN
La distribucin acumulativa de la tabla 2.13 indica que los fondos de crecimiento tienen un rendi-
miento ligeramente mayor que los fondos de valor: el 22.45% de los fondos de crecimiento tienen
rendimientos por debajo de 30 en comparacin con el 15.28% de los fondos de valor; el 48.98% de
los fondos de crecimiento tienen rendimientos por debajo de 40 en comparacin con el 43.06%
de los fondos de valor; el 79.59% de los fondos de crecimiento tienen rendimientos por debajo de 50
en comparacin con el 70.83% de los fondos de valor.
2.3: Tablas y grficas para datos numricos 37

TABLA 2.13 Porcentaje menor Porcentaje menor


Distribuciones de del valor indicado del del valor indicado del
porcentaje acumulado Rendimiento anual fondo de crecimiento fondo de valor
del rendimiento en 10 0.00 0.00
2003 de los fondos de 20 4.08 2.78
crecimiento y de valor. 30 22.45 15.28
40 48.98 43.06
50 79.59 70.83
60 89.80 84.72
70 100.00 97.22
80 100.00 100.00

Histograma
El histograma es una grfica de barras para datos numricos agrupados en los que las frecuencias o
los porcentajes de cada grupo de datos numricos estn representados por barras individuales. En un
histograma, no hay brechas entre las barras adyacentes como en la grfica de barras de los datos ca-
tegricos. La variable que nos interesa se coloca a lo largo del eje (X) horizontal. El eje (Y) vertical
representa la frecuencia o el porcentaje de los valores por intervalo de clase.
La figura 2.8 muestra un histograma de frecuencia Minitab para el costo de las comidas en los
restaurantes de la ciudad. El histograma indica que el costo de las comidas en los restaurantes de la
ciudad se concentra entre aproximadamente $30 y $55. Muy pocas comidas cuestan menos de $20 o
ms de $55.

FIGURA 2.8
Histograma Minitab
para el costo de
las comidas en
restaurantes de la
ciudad.

EJEMPLO 2.9 HISTOGRAMA PARA EL RENDIMIENTO EN 2003 DE LOS FONDOS


DE INVERSIN DE CRECIMIENTO Y DE VALOR
En el escenario Uso de la estadstica le interesa comparar el rendimiento en 2003 de los fondos de
inversin de crecimiento y de valor. MUTUALFUNDS2004 Construya histogramas para los fondos
de crecimiento y para los fondos de valor.
SOLUCIN
La figura 2.9 muestra que la distribucin de los fondos de crecimiento tiene rendimientos menores
en comparacin con los fondos de valor, los cuales tienen mayores rendimientos.
38 CAPTULO 2 Presentacin de datos en tablas y grficas

FIGURA 2.9A
Histograma del
porcentaje
del rendimiento 2003
(Panel A Fondos de
crecimiento y Panel B
Fondos de valor).

FIGURA 2.9B

Polgono
Es difcil y confuso realizar mltiples histogramas en la misma grfica cuando comparamos dos o
ms conjuntos de datos. Al sobreponer las barras verticales de un histograma en otro se dificulta la
interpretacin. Cuando hay dos o ms grupos, es conveniente utilizar un polgono de porcentaje.
2.3: Tablas y grficas para datos numricos 39

POLGONO DE PORCENTAJE
El polgono de porcentaje se crea al hacer que el punto medio de cada clase represente los datos
de esa clase y despus se conecta la secuencia de puntos medios con sus respectivos porcentajes de
clase.

La figura 2.10 muestra los polgonos de porcentaje para el costo de los alimentos en los restau-
rantes de la ciudad y de los suburbios. El polgono para los restaurantes de los suburbios est con-
centrado a la izquierda (correspondiente al costo menor) del polgono para los restaurantes de la
ciudad. Los porcentajes de los costos ms altos para los restaurantes de los suburbios corresponden
a los puntos medios de clase de $27.50 y $32.50, mientras que los porcentajes de costo mayores para
los restaurantes de la ciudad corresponden a los puntos medios de clase de $37.50.

FIGURA 2.10
Polgonos de
porcentaje del costo
de las comidas para
los restaurantes de
la ciudad y de los
suburbios.

Los polgonos de la figura 2.10 tienen puntos cuyos valores en el eje X representan el punto me-
dio del intervalo de clase. Por ejemplo, observe los puntos trazados en el eje X en 22.5 ($22.50). El
punto para los restaurantes de los suburbios (el ms alto) representa el hecho de que el 8% de estos
restaurantes tienen costos por comida que van de los $20 a los $25. El punto para los restaurantes de
la ciudad (el ms bajo) representa el hecho de que el 4% de estos restaurantes tienen costos de comi-
da entre $20 y $25.
Cuando elabore polgonos o histogramas, el eje vertical (Y) debe mostrar el verdadero cero u
origen, para no distorsionar el carcter de los datos. El eje horizontal (X) no necesita especificar el
punto cero para la variable de inters, aunque el rango de la variable debe constituir la mayor por-
cin del eje.

EJEMPLO 2.10 POLGONO DE PORCENTAJES PARA EL RENDIMIENTO EN 2003


DE LOS FONDOS DE INVERSIN DE CRECIMIENTO Y DE VALOR
En el escenario de Uso de la estadstica, se le pide que compare el rendimiento en 2003 de los fon-
dos de inversin de crecimiento y de valor. MUTUALFUNDS2004 Construya polgonos de porcentaje
para los fondos de crecimiento y para los fondos de valor.
SOLUCIN
La figura 2.11 muestra que la distribucin de los fondos de crecimiento tiene un rendimiento anual
menor en comparacin con los fondos de valor, los cuales tienen mayores rendimientos.
40 CAPTULO 2 Presentacin de datos en tablas y grficas

FIGURA 2.11
Polgonos de
porcentaje para el
rendimiento en 2003.

Polgono de porcentaje acumulado (ojiva)


El polgono de porcentaje acumulado, u ojiva, muestra la variable de inters a lo largo del eje X, y
los porcentajes acumulados a lo largo del eje Y.
La figura 2.12 ilustra los polgonos de porcentaje acumulado de Excel del costo de las comidas
en los restaurantes de la ciudad y de los suburbios. La mayor parte de la curva correspondiente a los
restaurantes de la ciudad est localizada a la derecha de la curva correspondiente a los restaurantes

FIGURA 2.12
Polgonos de
porcentaje acumulado
del costo de las
comidas en
restaurantes de la
ciudad y de los
suburbios.
2.3: Tablas y grficas para datos numricos 41

de los suburbios. Esto indica que los restaurantes de la ciudad tienen menos comidas que cuestan por
debajo de un valor en particular. Por ejemplo, el 12% de las comidas de los restaurantes de la ciudad
cuestan menos de $30 en comparacin con el 34% de las comidas de los restaurantes de los subur-
bios.

EJEMPLO 2.11 POLGONOS DE PORCENTAJE ACUMULADO DE LOS RENDIMIENTOS EN 2003


DE LOS FONDOS DE INVERSIN DE CRECIMIENTO Y DE VALOR
En el escenario Uso de la estadstica, se le pide que compare el rendimiento de los fondos de in-
versin de crecimiento y de valor. MUTUALFUNDS2004 Elabore polgonos de porcentaje acumulado
para los fondos de crecimiento y para los fondos de valor.
SOLUCIN
La figura 2.13 ilustra los polgonos de porcentaje acumulado en Excel del porcentaje de rendimien-
to en 2003 de los fondos de crecimiento y de valor. La curva para los fondos de valor se localiza
ligeramente a la derecha de la curva para los fondos de crecimiento. Esto indica que los fondos de
valor tienen menos rendimientos por debajo de un valor especfico. Por ejemplo, el 70.83% de los
fondos de valor tienen rendimientos menores de 50 en comparacin con el 79.59% de los fondos de
crecimiento.

FIGURA 2.13
Polgonos de
porcentaje acumulado
para el porcentaje de
rendimiento en 2003.

PROBLEMAS PARA LA SECCIN 2.3

ASISTENCIA2.21 Al realizar una ojiva (es decir, un polgono de


Aprendizaje bsico porcentaje acumulado) relacionado con las puntua-
de PH Grade
ASISTENCIA2.20 Los valores para un conjunto de datos varan ciones del GMAT (siglas para Graduate Manage-
de 11.6 a 97.8.
de PH Grade ment Admission Test) de una muestra de 50 solicitantes para un
a. Si estos valores se agrupan en clases, indique los programa de maestra en administracin, los datos previos indi-
lmites de clase. caron que ninguno de los solicitantes obtuvo puntuaciones por
b. Qu amplitud de intervalo de clase eligi? debajo de 450. La distribucin de la frecuencia se form eli-
c. Cules son los puntos medios de cada clase? giendo intervalos de clase 450 a 499, 500 a 549 y as sucesiva-
42 CAPTULO 2 Presentacin de datos en tablas y grficas

mente, hasta que la ltima clase fue 700 a 749. Si dos solicitan- 0.002 0.0005 0.0025 0.0025 0.002
tes obtuvieron puntuaciones en el intervalo 450 a 499, y 16 so-
licitantes obtuvieron puntuaciones en el intervalo 500 a 549: 0 0 0.001 0.001 0
a. Qu porcentaje de solicitantes calific por debajo de 500? 0.001 0.0025 0.0035 0.0005 0.0005
b. Qu porcentaje de solicitantes calific entre 500 y 549?
c. Qu porcentaje de solicitantes calific por debajo de 550? 0.0025 0.003 0 0 0.001
d. Qu porcentaje de solicitantes calific por debajo de 750? 0.003 0.001 0.003 0.002 0
Aplicacin de conceptos 0.001 0.002 0.002 0.0005 0.002
Puede resolver manualmente los problemas 2.22 a 2.27 o
0.0005 0.001 0.001 0.0005 0
usando Excel, Minitab o SPSS.
2.22 Los datos mostrados a continuacin represen- 0 0 0.0015 0.0005 0
ASISTENCIA
de PH Grade tan el costo de la energa elctrica durante julio de 0.003 0.003 0.0015 0 0.002
2004 para una muestra aleatoria de 50 departamen-
tos de una habitacin en una gran ciudad. UTILITY 0.001 0.0015 0.002 0.0005 0.003

Datos brutos de los cargos de utilidades ($) 0.0005 0 0.001 0.002 0.0005

96 171 202 178 147 102 153 197 127 82 0.0025 0 0.0025 0.001 0.002

157 185 90 116 172 111 148 213 130 165 0.0025 0.0025 0.0005 0.0015 0.002

141 149 206 175 123 128 144 168 109 167 a. Realice una distribucin de frecuencias y una distribucin
de porcentaje.
95 163 150 154 130 143 187 166 139 149 b. Trace un histograma y un polgono de porcentaje.
108 119 183 151 114 135 191 137 129 158 c. Trace un polgono de porcentaje acumulado.
d. El molino realiza un buen trabajo, de acuerdo con los re-
a. Forme una distribucin de frecuencia y una distribucin de querimientos de la empresa automovilstica? Explique su
porcentajes que tenga intervalos de clase con los lmites su- respuesta.
periores de clase $99, $119, y as sucesivamente.
2.24 Una compaa productora fabrica bastidores de acero
b. Trace un histograma y un polgono de porcentaje.
para equipos elctricos. El componente principal de los basti-
c. Elabore una distribucin de porcentaje acumulado y trace dores es un canaln de acero enrollado de calibre 14. ste se
una ojiva (polgono de porcentaje acumulado).
produce con una prensa cuyo poder de golpeo progresivo es de
d. Alrededor de cul cantidad parece concentrarse el costo 250 toneladas, con una operacin de limpieza hacia abajo que
mensual de la energa elctrica? pone dos formas de 90 grados en el acero aplanado para hacer
AUTO 2.23 Una de las operaciones que realiza un molino el canaln. La distancia de un lado de la forma al otro es impor-
Examen consiste en cortar piezas de acero en partes que pos- tante por la resistencia a exteriores. La compaa requiere que
teriormente sern usadas como marco para los asien- la amplitud del canaln est entre 8.31 y 8.61 pulgadas. Los si-
tos delanteros de un automvil. El acero se corta con una sierra guientes datos son las longitudes de los canalones en pulgadas
con punta de diamante y se requiere que las partes resultantes para una muestra de n = 49. TROUGH
midan 0.005 pulgadas de longitud, segn las especificaciones
8.312 8.343 8.317 8.383 8.348 8.410 8.351 8.373
de la empresa automovilstica. La siguiente tabla proviene de
una muestra de 100 partes de acero. La medida reportada es la 8.481 8.422 8.476 8.382 8.484 8.403 8.414 8.419
diferencia en pulgadas entre la longitud real de la parte de ace-
ro, medida con un dispositivo lser y la longitud especificada 8.385 8.465 8.498 8.447 8.436 8.413 8.489 8.414
de la parte de acero. Por ejemplo, el primer valor, 0.002, re-
8.481 8.415 8.479 8.429 8.458 8.462 8.460 8.444
presenta una parte de acero que es 0.002 pulgadas ms corta
que la longitud especificada. STEEL 8.429 8.460 8.412 8.420 8.410 8.405 8.323 8.420
0.002 0.002 0.0005 0.0015 0.001 8.396 8.447 8.405 8.439 8.411 8.427 8.420 8.498
0.0005 0.001 0.001 0.0005 0.001 8.409
0.0025 0.001 0.0005 0.0015 0.0005 a. Realice una distribucin de frecuencia y una distribucin de
0.001 0.001 0.001 0.0005 0.0025 porcentajes.
b. Trace un histograma y un polgono de porcentajes.
0.002 0.002 0.0025 0.0005 0.0025 c. Trace un polgono de porcentajes acumulados.
0.001 0.003 0.001 0.001 0.002 d. Qu puede concluir acerca del nmero de canalones que
satisfarn los requerimientos de la compaa, es decir,
0.005 0.0015 0 0.0015 0.0025 que tengan una longitud entre 8.31 y 8.61 pulgadas?
2.4: Tablas y grficas de datos bivariados 43

2.25 La compaa productora del problema 2.24 tambin fa- a. Realice una distribucin de frecuencias y una distribucin
brica aislantes elctricos. Si stos se descomponen cuando es- de porcentajes para cada fabricante usando el siguiente in-
tn en uso, es probable que ocurra un corto circuito. Para pro- tervalo de clase para cada distribucin:
barlos, se efecta una prueba destructiva en laboratorios de alta (1) Fabricante A: 650 pero menos de 750, 750 pero menos
potencia, que determinarn cunta fuerza se requiere para des- de 850, y as sucesivamente.
componer los aislantes. La fuerza se mide observando cuntas (2) Fabricante B: 750 pero menos de 850, 850 pero menos
libras deben aplicarse al aislante antes de que se descomponga.
de 950, y as sucesivamente.
La fuerza de 30 aislantes probados se muestra a continuacin.
b. Trace los histogramas de porcentaje en grficas separadas y
FORCE
trace los polgonos de porcentaje en una grfica.
1,870 1,728 1,656 1,610 1,634 1,784 1,522 1,696 c. Elabore las distribuciones de porcentaje acumulado y trace
1,592 1,662 1,866 1,764 1,734 1,662 1,734 1,774 las ojivas en una grfica.
d. Qu fabricante produce los bulbos con mayor vida: el fa-
1,550 1,756 1,762 1,866 1,820 1,744 1,788 1,688 bricante A o el fabricante B? Explique su respuesta.
1,810 1,752 1,680 1,810 1,652 1,736
2.27 Los siguientes datos representan la cantidad de bebida
a. Construya una distribucin de frecuencias y una distribu- gaseosa en una muestra de 50 botellas de 2 litros. DRINK
cin de porcentajes.
b. Trace un histograma y un polgono de porcentajes. 2.109 2.086 2.066 2.075 2.065 2.057 2.052 2.044
c. Trace un polgono de porcentaje acumulado.
d. Qu puede concluir respecto de la fuerza de los aislantes, si 2.036 2.038 2.031 2.029 2.025 2.029 2.023 2.020
la compaa requiere una medida de fuerza de por lo menos 2.015 2.014 2.013 2.014 2.012 2.012 2.012 2.010
1,500 libras antes de descomponerse?
2.26 Los arreglos ordenados de la tabla corresponden a la vida 2.005 2.003 1.999 1.996 1.997 1.992 1.994 1.986
til (en horas) de una muestra de 40 bulbos de 100 watts produ- 1.984 1.981 1.973 1.975 1.971 1.969 1.966 1.967
cidos por el fabricante A y la muestra B a 40 bulbos de 100
watts producidos por otro fabricante. BULBS 1.963 1.957 1.951 1.951 1.947 1.941 1.941 1.938

Fabricante A Fabricante B 1.908 1.894

684 697 720 773 821 819 836 888 897 903 a. Construya una distribucin de frecuencias y una distribu-
cin de porcentajes.
831 835 848 852 852 907 912 918 942 943
b. Trace un histograma y un polgono de porcentajes.
859 860 868 870 876 952 959 962 986 992 c. Realice una distribucin de porcentaje acumulado y trace un
893 899 905 909 911 994 1,004 1,005 1,007 1,015 polgono de porcentaje acumulado.
d. Con base en los resultados de a) a c), la cantidad de bebida
922 924 926 926 938 1,016 1,018 1,020 1,022 1,034 gaseosa con que se llenan las botellas se concentra alrededor
939 943 946 954 971 1,038 1,072 1,077 1,077 1,082 de valores especficos?
972 977 984 1,005 1,014 1,096 1,100 1,113 1,113 1,116
1,016 1,041 1,052 1,080 1,093 1,153 1,154 1,174 1,188 1,230

2.4 TABLAS Y GRFICAS DE DATOS BIVARIADOS


En negocios es comn el estudio de patrones que pueden existir entre dos o ms variables categ-
ricas.

Tabla de contingencia
Una tabla de clasificacin (o contingencia) cruzada presenta los resultados de dos variables cate-
gricas. Las respuestas en conjunto se clasifican de tal manera que las categoras de una variable se
localizan en las filas, y las categoras de la otra variable se localizan en las columnas. Los valores lo-
calizados en las intersecciones de las filas y las columnas se llaman celdas. La tabla se construye de-
pendiendo del tipo de contingencia, las celdas para cada combinacin de fila-columna contienen la
frecuencia, el porcentaje del total global, el porcentaje del total de las filas o el porcentaje total de las
columnas.
Suponga que en el escenario de Uso de la estadstica se quiere examinar si hay o no un patrn
o relacin entre el nivel de riesgo y el objetivo del fondo de inversin (crecimiento contra valor). La
tabla 2.14 resume esta informacin para los 121 fondos de inversin.
44 CAPTULO 2 Presentacin de datos en tablas y grficas

TABLA 2.14 NIVEL DE RIESGO


Tabla de contingencia OBJETIVO Alto Promedio Bajo Total
que muestra el fondo
objetivo y el fondo de Crecimiento 14 23 12 49
riesgo. Valor 3 23 46 72
Total 17 46 58 121

Se elabor esta tabla de contingencia etiquetando las respuestas en conjunto para cada uno de
los 121 fondos de inversin con respecto al objetivo y al riesgo en una de las seis posibles celdas en
la tabla. As, el primer fondo en la lista (AFBA Five Star USA Global Institutional) est clasificado co-
mo fondo de crecimiento con riesgo promedio. Por tanto, registre la respuesta conjunta dentro de la
celda que forma la interseccin de la primera fila y la segunda columna. Las 120 respuestas conjun-
tas restantes se registran de forma similar. Cada celda contiene la frecuencia para la combinacin fi-
la-columna.
Para explorar cualquier posible patrn o relacin entre fondos objetivos y de riesgo, es conve-
niente realizar tablas de contingencia basadas en porcentajes. Primero convierta en porcentajes estos
resultados con base en los siguientes tres totales:
1. El total global (es decir, los 121 fondos de inversin).
2. El total de las filas (es decir, 49 fondos de crecimiento y 72 fondos de valores).
3. El total de las columnas (es decir, los tres niveles de riesgo).
Las tablas 2.15, 2.16 y 2.17 resumen estos porcentajes.

TABLA 2.15 NIVEL DE RIESGO


Tabla de contingencia OBJETIVO Alto Promedio Bajo Total
que muestra el fondo
objetivo y el fondo de Crecimiento 11.57 19.01 9.92 40.50
riesgo con base en el Valor 2.48 19.01 38.02 59.50
porcentaje del total Total 14.05 38.02 47.93 100.00
global.

TABLA 2.16 NIVEL DE RIESGO


Tabla de contingencia OBJETIVO Alto Promedio Bajo Total
que muestra el fondo
objetivo y el fondo de Crecimiento 28.57 46.94 24.49 100.00
riesgo con base en el Valor 4.17 31.94 63.89 100.00
porcentaje del total de Total 14.05 38.02 47.93 100.00
las filas.

TABLA 2.17 NIVEL DE RIESGO


Tabla de contingencia OBJETIVO Alto Promedio Bajo Total
que muestra el fondo
objetivo y el fondo de Crecimiento 82.35 50.00 20.69 40.50
riesgo con base en el Valor 17.65 50.00 79.31 59.50
porcentaje del total de Total 100.00 100.00 100.00 100.00
las columnas.

La tabla 2.15 muestra que el 14.05% de los fondos de inversin de la muestra son de alto ries-
go, el 40.5% son fondos de crecimiento y el 11.57% son fondos de crecimiento de alto riesgo. La ta-
bla 2.16 muestra que el 28.57% de los fondos de crecimiento son de alto riesgo y el 24.49% son de
bajo riesgo. La tabla 2.17 muestra que el 82.35% de los fondos de alto riesgo y slo el 20.69% de los
fondos de bajo riesgo son fondos de crecimiento. Las tablas revelan que los fondos de crecimiento
tienen mayor probabilidad de ser de alto riesgo, mientras que los fondos de valor tienen mayor pro-
babilidad de ser de bajo riesgo.
2.4: Tablas y grficas de datos bivariados 45

Grfica de barras agrupadas


Una forma til de mostrar los resultados de datos de clasificacin cruzada es realizar una grfica de
barras agrupadas. La figura 2.14, que utiliza datos de la tabla 2.14, es una grfica de barras agru-
padas de Excel que compara los tres niveles de riesgo de los fondos, con base en su objetivo. Al exa-
minar la figura 2.14, se revelan resultados congruentes con aquellos de las tablas 2.15, 2.16 y 2.17.
Los fondos de crecimiento tienen mayor probabilidad de ser de alto riesgo, mientras que los fondos
de valor tienen mayor probabilidad de ser de bajo riesgo.
FIGURA 2.14
Grfica de barras
agrupadas de Excel
para el objetivo y
riesgo de los fondos.

PROBLEMAS PARA LA SECCIN 2.4


Aprendizaje bsico c. Usando los resultados del inciso a), construya una grfica de
barras agrupadas de gnero basada en la especialidad del es-
ASISTENCIA2.28 Los siguientes datos representan las respues- tudiante.
tas a dos preguntas de una encuesta a 40 alumnos
de PH Grade
que estudian la especialidad en negocios: Cul es tu ASISTENCIA 2.29 A partir de la siguiente tabla de contingencia,
de PH Grade elabore una grfica de barras agrupadas, comparan-
gnero? (Masculino = M; Femenino = F) y Cul es tu especia-
lidad? Contadura = A; Sistemas computacionales de la infor- do A y B para cada una de las categoras de tres co-
macin = C; Marketing = M): lumnas en el eje vertical.
Gnero: M M M F M F F M F M F M M M M F F M F F 1 2 3 Total
Especia-
lidad: A C C M A C A A C C A A A M C M A A A C A 20 40 40 100
Gnero: M M M M F M F F M M F M M M M F M F M M B 80 80 40 200
Especia-
lidad: C C A A M M C A A A C C A A A A C C A C
Aplicando los conceptos
a. Registre los datos en una tabla de contingencia, donde las
dos filas representen la categora de gnero y las tres colum- ASISTENCIA AUTO 2.30 Los resultados de un estudio realiza-
nas representen la categora de la especialidad acadmica. de PH Grade Examen do como parte de un esfuerzo por mejorar
b. Elabore tablas de contingencia a partir de los porcentajes de la produccin en una fbrica de semicon-
las respuestas de los 40 estudiantes, con base en los porcen- ductores presentan datos de defectos en una muestra de 450 placas
tajes de las filas y en los porcentajes de las columnas. de silicio. La siguiente tabla presenta un resumen de las respues-
46 CAPTULO 2 Presentacin de datos en tablas y grficas

tas a dos preguntas: Se encontr una partcula en el troquel que c. A qu conclusiones llega a partir de estos anlisis?
produjo la placa de silicio? Y La placa result buena o mala?
2.33 Las ventas al detalle en Estados Unidos para abril de
2002, fueron ligeramente superiores a las de abril de 2001. To-
CONDICIN DEL TROQUEL
das las tiendas de descuento, como Wal Mart, Costco, Target y
CALIDAD DE LA PLACA Sin partculas Partculas Totales Dollar General, incrementaron sus ventas en un 9% o ms. Sin
Buena 320 14 334 embargo, las ventas al detalle en la industria de la ropa fueron
Mala 80 36 116 mixtas. La siguiente tabla presenta el total de las ventas al deta-
Totales 400 50 450 lle en millones de dlares para las compaas de ropa lderes
durante abril de 2001 y abril de 2002.
Fuente: S.W. Hall, Analysis of Defectivity of Semiconductor Wafers by Con-
tingency Table, Proceedings Institute of Environmental Sciences. Vol.1 VENTAS TOTALES EN MILLONES
(1994), 177-183. DE DLARES
a. Construya tablas de contingencia basadas en el total de por- COMPAA DE ROPA Abril 01 Abril 02
centajes, porcentajes de fila y porcentajes de columna.
Gap 1,159.0 962.0
b. Elabore una grfica de barras agrupadas de la calidad de las
TJX 781.7 899.0
placas de silicio basada en la condicin del troquel.
Limited 596.5 620.4
c. A qu conclusiones llega a partir de esos anlisis?
Kohls 544.9 678.9
ASISTENCIA 2.31 En un gran hospital cada da se realizan varios Nordstrom 402.6 418.3
de PH Grade cientos de pruebas de laboratorio. La tasa de pruebas Talbots 139.9 130.1
realizadas de forma impropia (y que deben practicar- AnnTaylor 114.2 124.8
se de nuevo) al parecer es constante y cercana al 4%. En un es-
fuerzo por llegar a la raz del problema (pruebas que requieren Fuente: Ann Zimmerman, Retail Sales Grow Modestly, The Wall Street
volver a hacerse), el director del laboratorio decide guardar los Journal, 10 de mayo, 2002, B4.
registros de una semana. Las pruebas de laboratorio se dividie-
ron entre el turno de empleados que realizan las pruebas de la- a. Realice una tabla de los porcentajes de columnas.
boratorio. Los resultados son los siguientes: b. Elabore una grfica de barras agrupadas para visualizar lo
relevante de la informacin recabada en el inciso a).
PRUEBAS DE TURNO c. Analice los cambios de las compras al detalle para la indus-
LABORATORIO REALIZADAS Da Tarde Total tria de la ropa entre abril de 2001 y abril de 2002.
Insastifactorias 16 24 40 2.34 Con el fin de estimular las ventas de 2003, los fabrican-
Sastifactorias 654 306 960 tes de autos ofrecieron grandes incentivos, en forma de rebajas
Total 670 330 1,000 en efectivo para los compradores de autos nuevos. Por ejem-
plo, los compradores de autos de marca Lincoln recibieron un
a. Elabore tablas de contingencia basadas en los porcenta- promedio de rebajas de $4,086. A pesar de tales rebajas, los fa-
jes totales, los porcentajes de filas y los porcentajes de co- bricantes estadounidenses de autos perdieron una parte del mer-
lumnas. cado global en favor de la competencia internacional.
b. Qu tipo de porcentaje (de fila, de columna o total) consi-
dera que es el ms informativo para estos datos? Explique su REBAJAS DE EFECTIVO (EN DLARES)
respuesta. MARCA 2001 2003
c. A qu conclusiones llegar el director del laboratorio, res-
pecto al patrn de pruebas de laboratorio insatisfactorias? Buick 1,939 3,655
Chevrolet 1,654 3,231
2.32 Se seleccion una muestra de 500 compradores en una Chrysler 1,835 2,832
amplia rea metropolitana, para determinar informacin varia- Ford 1,334 2,752
da con relacin al comportamiento del consumidor. Entre las Lincoln 2,449 4,086
preguntas que se hicieron estaba Disfruta comprando ropa?
Los resultados se resumen en la siguiente tabla de contingencia: Fuente: K. Lundegaard y S. Freeman, Detroits Challenge: Weaning Bu-
yers from Years of Deals, The Wall Street Journal, 6 de enero, 2004, A1.
DISFRUTA GNERO
COMPRANDO ROPA Masculino Femenino Total a. Elabore una grfica de barras agrupadas para las cinco marcas.
b. Analice los cambios en el tamao de las rebajas en efectivo
S 136 224 360
de 2001 a 2003.
No 104 36 140
Total 240 260 500 2.35 La venta de autos en Estados Unidos se increment un
3.3% en enero de 2004 en comparacin con enero de 2003. Los
a. Elabore tablas de contingencia basadas en los porcentajes fabricantes japoneses de automviles experimentaron un incre-
totales, los porcentajes de fila y los porcentajes de columna. mento mucho mayor. La siguiente tabla contiene las ventas de
b. Construya una grfica de barras agrupadas en Disfruta com- autos y camiones ligeros de algunos de los grandes fabricantes
prando ropa basada en el gnero. durante enero de 2003 y 2004.
2.5: Diagramas de dispersin y series de tiempo 47

a. Elabore una grfica de barras agrupadas para las seis marcas.


VENTAS DE AUTOS NUEVOS Y CAMIONES LIGEROS b. Discuta los cambios en las ventas de autos nuevos y camio-
FABRICANTE 2003 2004 nes ligeros en enero de 2004 comparadas con enero de 2003.
Nissan 55,213 72,164
Honda 89,993 90,173
Toyota 119,376 143,729
Chrysler 144,826 162,205
Ford 242,068 229,238
GM 291,254 296,788

Fuente: S. Freeman y J. B. White, U. S. Car Sales Rose 3.3% in January,


The Wall Street Journal, 4 de febrero, 2004, A2.

2.5 DIAGRAMAS DE DISPERSIN Y SERIES DE TIEMPO


Diagrama de dispersin
Al analizar una sola variable numrica, tal como el costo de la comida en un restaurante o el rendi-
miento en 2003, se usa un histograma, un polgono o un polgono de porcentaje acumulado como los
desarrollados en la seccin 2.3. Utilice un diagrama de dispersin para examinar las posibles rela-
ciones entre dos variables numricas. Coloque una variable en el eje horizontal X y la otra variable
en el eje vertical Y. Por ejemplo, un analista de mercado podra estudiar la efectividad de la publici-
dad si compara los volmenes de ventas semanales y el gasto publicitario semanal. O un director de
recursos humanos interesado en la estructura del salario de una empresa podra comparar los aos
de experiencia de los empleados y su salario actual.
Para mostrar el diagrama de dispersin, habra que estudiar la relacin entre la proporcin del
gasto y el rendimiento en 2003. Para cada fondo de inversin, se traza la proporcin de gasto en el
eje horizontal X, y el rendimiento en 2003 en el eje vertical Y. La figura 2.15 representa la salida de
Excel para estas dos variables.

FIGURA 2.15
Diagrama de dispersin
de Excel para la
proporcin de gasto y
el rendimiento en 2003.

Aunque hay una gran variacin en la proporcin del gasto y el rendimiento en 2003 de los fon-
dos de inversin, parece haber una relacin creciente (positiva) entre la proporcin del gasto y el
48 CAPTULO 2 Presentacin de datos en tablas y grficas

rendimiento en 2003. En otras palabras, los fondos que tienen una baja proporcin de gasto tienen
un bajo rendimiento en 2003. Quiz otros pares de variables tengan relaciones decrecientes (negati-
vas) en las que una variable decrece a medida que la otra se incrementa. El diagrama de dispersin
se volver a estudiar en el captulo 13, cuando desarrollemos el anlisis de regresin.

Series de tiempo
El diagrama de series de tiempo se usa para estudiar patrones en las variables a travs del tiempo.
Cada valor se traza como un punto de dos dimensiones. Un diagrama de series de tiempo muestra el
periodo de tiempo en el eje horizontal X y la variable de inters en el eje vertical Y.
La figura 2.16 es un diagrama de series de tiempo para el pago mensual de hipoteca (en dlares
de 2002) de 1988 a 2002. HOUSESNY

FIGURA 2.16
Diagrama de series de
tiempo de Excel del
pago mensual de
hipoteca en dlares
de 2002 (periodo de
1988 a 2002).

Los pagos mensuales de hipoteca (considerados en dlares de 2002) bajaron al final de los 80 y
principios de los 90, slo para nivelarse. Comenzaron a aumentar de nuevo a partir de 1999.

PROBLEMAS PARA LA SECCIN 2.5


Aprendizaje bsico ASISTENCIA 2.37 La siguiente es una serie de ventas anuales
de PH Grade reales (en millones de dlares constantes de 1995)
ASISTENCIA 2.36 El siguiente es un conjunto de datos tomados
en un periodo de 11 aos (1992 a 2002).
de PH Grade de una muestra de n = 11 artculos.
Ao 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
X 7 5 8 3 6 10 12 4 9 15 18
Ventas 13.0 17.0 19.0 20.0 20.5 20.5 20.5 20.0 19.0 17.0 13.0
Y 21 15 24 9 18 30 36 12 27 45 54
a. Realice un diagrama de series de tiempo.
a. Trace un diagrama de dispersin. b. Parece haber algn cambio en las ventas anuales reales a
b. Existe una relacin entre X y Y ? Explique su respuesta. travs del tiempo? Explique su respuesta.
2.5: Diagramas de dispersin y series de tiempo 49

Aplicacin de conceptos Ciudad Volumen de ventas Violaciones


Puede resolver manualmente los problemas 2.38 a
Orlando 100 9.9
2.45 o usando Excel, Minitab o SPSS. WashingtonDulles 90 14.8
2.38 Los siguientes datos representan el precio aproximado Los ngeles 88 25.1
(en dlares) de las ventas al detalle y el costo de la energa por Detroit 79 13.5
ao (en dlares) de 15 refrigeradores. REFRIGERATOR San Juan 70 10.3
Miami 64 13.1
Nueva YorkJFK 53 30.1
WashingtonReagan 47 31.8
Modelo Precio Costo de energa Honolulu 37 14.9
Maytag MTB1956GE 825 36
Fuente: Alan B. Krueger, A Small Dose of Common Sense Would Help
Kenmore7118 750 43 Congress Break the Gridlock over Airport Security, The New York Times,
Maytag MTB2156GE 850 39 15 de noviembre, 2001, C2.
Kenmore Elite 1000 38
Amana ART2107B 800 38
GE GTS18KCM 600 40 a. Elabore un diagrama de dispersin con la proporcin de vo-
Kenmore 7198 750 35 lumen de ventas de las pantallas de preabordaje en el eje X y
Frigidaire Gallery GLHT216TA 680 38 las violaciones de seguridad detectadas en el eje Y.
Kenmore 7285 680 40 b. A qu conclusiones llega acerca de la relacin entre la pro-
Whirlpool Gold GR9SHKXK 940 37 porcin del volumen de ventas de las pantallas de preabor-
Frigidaire Gallery GLRT216TA 680 40 daje y las violaciones de seguridad detectadas?
GE GTS22KCM 650 44
AUTO 2.40 Los siguientes datos CELLPHONE representan
Whirlpool ETF1TTXK 800 43
Examen el tiempo de llamada en horas en el modo digital y la
Whirlpool Gold GR2SHXK 1050 40 capacidad de la batera en horas-miliamperes de los
Frigidaire FRT18P5A 510 40 telfonos celulares.
Fuente: Refrigerators, Copyright 2002 by Consumers Union of U.S.,
Inc., Yonkers, NY 10703-1057, a nonprofit organization. Adaptado con
permiso de Consumer Reports, 26 de agosto, 2002, para propsitos edu- Tiempo de Capacidad de Tiempo de Capacidad de
cativos exclusivamente. No se permite su uso comercial o reproduccin. llamada las bateras llamada las bateras
www.ConsumerReports.org
4.50 800 1.50 450
4.00 1500 2.25 900
a. Elabore un diagrama de dispersin con el costo de energa 3.00 1300 2.25 900
en el eje X y el precio en el eje Y. 2.00 1550 3.25 900
b. Parece haber relacin entre el precio y el costo de la ener- 2.75 900 2.25 700
ga? De ser as, la relacin es positiva o negativa? 1.75 875 2.25 800
c. Esperara que los refrigeradores con un precio ms alto ten- 1.75 750 2.50 800
gan mayor eficiencia de energa? Los datos apoyan esto? 2.25 1100 2.25 900
1.75 850 2.00 900
2.39 Los siguientes datos SECURITY representan la propor-
cin del volumen de ventas de las pantallas de preabordaje en Fuente: Service Shortcomings, Copyright 2002 por Consumers Union of
los aeropuertos en 1998 y 1999 y las violaciones de seguridad U.S., Inc., Yonkers, NY 10703-1057. Adaptado con permiso de Consumer
detectadas por millones de pasajeros. Reports, febrero de 2002, 25.

a. Realice un diagrama de dispersin con la capacidad de las


Ciudad Volumen de ventas Violaciones bateras en el eje X y el modo digital del tiempo de llamada
en el eje Y.
St. Louis 416 11.9
b. A qu conclusiones llega acerca de la relacin entre la
Atlanta 375 7.3
capacidad de la batera y el modo digital del tiempo de lla-
Houston 237 10.6
mada?
Boston 207 22.9
c. Esperara que los telfonos celulares con mayor capacidad
Chicago 200 6.5
de batera tengan un mayor tiempo de llamada? Apoyan es-
Denver 193 15.2
to los datos?
Dallas 156 18.2
Baltimore 155 21.7 2.41 Los siguientes datos BATTERIES2 representan el precio y
Seattle/Tacoma 140 31.5 la corriente inicial que pueden generar las bateras de los auto-
San Francisco 110 20.7 mviles.
50 CAPTULO 2 Presentacin de datos en tablas y grficas

a. Construya un diagrama de series de tiempo para la tasa de


Nombre Precio ($) Ci
desempleo de Estados Unidos.
NAPA Legend Professional Line 7575 60 630 b. Parece haber algn patrn?
Exide Nascar Select 75-84N 80 630
DieHard Weatherhandler 30375 (South) 60 525 2.43 Los siguientes datos DRINK representan la cantidad de
DieHard Weatherhandler 30075 (North) 60 650 bebida gaseosa en una muestra consecutiva de 50 botellas de dos
EverStart 75-5 30 525 litros. Los resultados se enuncian horizontalmente en el orden
Duralast 75-D 50 650 en el que fueron llenados.
Interstate Mega-Tron MT-75 80 650
EverStart 75-2 60 650 2.109 2.086 2.066 2.075 2.065 2.057 2.052 2.044 2.036 2.038
ACDelco Maintenance free 75A-72 80 650 2.031 2.029 2.025 2.029 2.023 2.020 2.015 2.014 2.013 2.014
Motorcraft Premier Silver Series BXT-75 80 700
DieHard Gold 33165 (South) 80 700 2.012 2.012 2.012 2.010 2.005 2.003 1.999 1.996 1.997 1.992
EverStart Extreme 65-2N (North) 60 850
1.994 1.986 1.984 1.981 1.973 1.975 1.971 1.969 1.966 1.967
ACDelco Maintenance Free 65-84 92 850
Exide 65-60 85 850 1.963 1.957 1.951 1.951 1.947 1.941 1.941 1.938 1.908 1.894
EverStart Extreme 65-2 (South) 60 675
DieHard Gold 33065 (North) 80 900 a. Realice un diagrama de series de tiempo para la cantidad de
Duralast Gold 34DT-DGS (South) 70 800 bebida gaseosa en el eje Y y el nmero de botellas (de 1 a 50
Duralast Gold 34DT-DGN (North) 70 900 consecutivamente) en el eje X.
Interstate Mega-Tron Plus MTP-78DT 96 800 b. Qu patrn, si lo hay, se presenta en los datos?
Optima Red Top 34/78-1050 140 750 c. Si tuviera que hacer una prediccin de la cantidad de bebida
ACDelco Professional 78DT-7YR 80 850 gaseosa que llena la siguiente botella, qu dira?
EverStart High Power DT-3 40 630 d. Con base en los resultados del inciso a) al c), explique por
DieHard Weatherhandler 30034 (North) 60 540 qu es importante realizar un diagrama de series de tiempo y
DieHard Weatherhandler 30334 (South) 60 525 no slo un histograma como se hizo en el problema 2.27 en
la pgina 43.
Fuente: Leading the Charge, Copyright 2001 por Consumers Union of
U.S, Inc., Yonkers, NY 10703-1057. Adaptado con permiso de Consumer 2.44 Los datos en la siguiente tabla representan el nmero de
Reports, octubre de 2001, 25.
hogares que utilizaron de forma activa el banco en lnea y/o que
realizaron pagos en lnea de 1995 a 2003. ONLINEBANKING
a. Elabore un diagrama de dispersin con la corriente inicial
en el eje X y el precio en el eje Y.
b. A qu conclusiones llega respecto a la relacin entre la co- Ao Nmero de hogares (millones)
rriente inicial y el precio?
c. Esperara que las bateras con mayor corriente inicial ten- 1995 0.6
gan un mayor precio? Los datos apoyan esto? 1996 2.5
1997 4.5
2.42 El U.S. Bureau of Labor Statistics compila datos de una 1998 7.0
gran variedad de temas sobre la fuerza de trabajo. La siguiente 1999 10.5
tabla muestra la tasa de desempleo ajustada mensualmente por 2000 15.5
temporada para Estados Unidos, desde 1998 hasta 2003. UERATE 2001 22.0
2002 28.0
Tasa de desempleo en E.U. ajustada por temporada 2003 33.0
(en porcentaje)
Fuente: R.J. Dalton, In the Mainstream, Newsday, 8 de febrero, 2004,
Mes 1998 1999 2000 2001 2002 2003 F6-F7.

Enero 4.7 4.3 4.0 4.2 5.6 5.9


Febrero 4.6 4.4 4.1 4.2 5.6 6.0 a. Construya un diagrama de series de tiempo para el nmero
Marzo 4.7 4.2 4.0 4.3 5.7 5.9 de hogares de Estados Unidos que utilizaron activamente el
Abril 4.3 4.3 4.0 4.5 5.9 6.1 banco en lnea y/o pagaron sus cuentas en lnea.
Mayo 4.4 4.2 4.1 4.4 5.8 6.2 b. Qu patrn, si lo hay, est presente en estos datos?
Junio 4.5 4.3 4.0 4.5 5.8 6.4 c. Si tuviera que hacer una prediccin en el nmero de hogares
Julio 4.5 4.3 4.0 4.5 5.8 6.3 de E.U. que activamente usan el banco en lnea y/o hicieron
pagos en lnea en 2004, qu predecira?
Agosto 4.5 4.2 4.1 4.9 5.8 6.2
Septiembre 4.5 4.2 3.9 4.9 5.7 6.2 2.45 Los datos de la siguiente tabla representan el promedio
Octubre 4.5 4.1 3.9 5.4 5.8 6.1 de espectadores de televisin (excluyendo las televisoras loca-
Noviembre 4.4 4.1 4.0 5.6 5.9 6.1 les) por juego (en millones) para la National Football League
Diciembre 4.4 4.1 4.0 5.8 6.0 5.8 (NFL), la National Basketball Association (NBA), la Major Lea-
gue Baseball (MLB) y la National Hockey League (NHL). SPORT-
Fuente: U.S. Bureau of Labor Statistics. STV
2.6: Uso inadecuado de grficas y consideraciones ticas 51

a. Para cada uno de los cuatro deportes realice un diagrama de


Ao NFL NBA MLB NHL
series de tiempo.
1995 19.6 10.6 15.9 3.6 b. Qu patrn, si lo hay, est presente en estos datos?
1996 18.5 10.2 9.8 3.2 c. Si tuviera que hacer una prediccin del nmero de especta-
1997 17.4 10.8 10.4 2.4 dores para cada deporte en 2003, qu dira?
1998 18.1 7.8 9.4 2.6
1999 18.3 7.2 10.0 3.3
2000 17.0 6.7 7.7 2.8
2001 16.9 6.8 9.8 3.1
2002 18.6 5.8 8.9 2.6
Fuente: S. Fatsis, Salaries, Promos, and Flying Solo, The Wall Street
Journal, 9 de febrero, 2004, R.4.

2.6 USO INADECUADO DE GRFICAS Y CONSIDERACIONES


TICAS
Las buenas grficas revelan lo que los datos transmiten. Por desgracia, muchas grficas presentadas
tanto en peridicos como en revistas, as como otras que se desarrollan con el Asistente grfico de
Excel, son incorrectas, engaosas o innecesariamente complicadas, tanto, que nunca deberan utili-
zarse. Para ilustrar esta situacin, la primera grfica presentada se public en la revista Time como
parte de un artculo sobre la creciente exportacin de vino de Australia a Estados Unidos.

FIGURA 2.17
Muestra impropia de Estamos bebiendo ms...
la exportacin de vino Exportaciones de vino a E.U.
australiano a Estados en millones de galones
Unidos en millones de
galones.
Fuente: Adaptado de S.
Watterson, Liquid Gold
Australians Are Changing
the World of Wine. Even the
French Seem Grateful,
Time, 22 de noviembre,
1999, 68.

En la figura 2.17, el icono de la copa de vino que representa los 6.77 millones de galones para
1997 no parece tener casi el doble de tamao del icono de la copa de vino que representa los 3.67
millones de galones para 1995; tampoco el icono de la copa de vino que representa los 2.25 millones
de galones para 1992 parece tener el doble de tamao del icono de copa de vino que representa 1.04
millones de galones para 1989. La razn para esto, en parte, es que el icono tridimensional de la co-
pa de vino se utiliza para representar las dos dimensiones de exportacin y tiempo. Aunque la pre-
sentacin de la copa de vino puede atraer la vista, los datos deberan presentarse en una tabla de re-
sumen o en un diagrama de series de tiempo.
Adems del tipo de distorsin creada por los iconos de la copa de vino en la grfica de la revis-
ta Time que muestra la figura 2.17, el uso impropio de los ejes vertical y horizontal lleva a distorsio-
nes. La figura 2.18 en la pgina 52 presenta otra grfica usada en el mismo artculo de Time.
Existen varios problemas graves en la grfica. Primero, no hay punto cero en el eje vertical. Se-
gundo, la superficie en acres de 135,326 para el periodo de 1949 a 1950 est trazada por arriba de la
superficie en acres de 150,300 para 1969 a 1970. Tercero, no es obvio que la diferencia entre 1979
a 1980 y de 1997 a 1998 (71,569 acres) es aproximadamente tres y media veces la diferencia entre
1979-1980 y 1969-1970 (21,775 acres). Cuarto, no hay valores escalares en el eje horizontal. Los
aos estn trazados junto a los totales de la superficie en acres, no en el eje horizontal. Quinto,
los valores para la dimensin del tiempo no estn espaciados de forma apropiada a lo largo del eje
horizontal. El valor para 1979-1980 es mucho ms cercano al de 1990 que a 1969-1970.
52 CAPTULO 2 Presentacin de datos en tablas y grficas

FIGURA 2.18
...estn creciendo ms... 19971998
Muestra impropia de 243,644
la cantidad de terreno Cantidad de terreno plantado con uvas para la industria vitivincola acres
plantado con uvas para
la industria vitivincola.
Fuente: Adaptado de S.
Watterson. Liquid Gold 19791980
Australians Are Changing 172,075
acres
the World of Wine. Even the 1949 1950
French Seem Grateful, 135,326
Time, 22 de noviembre, acres
1999, 68-69.
19691970
150,300 19891990
acres 146,204
acres
19591960
130,201
acres

Otros tipos de muestras que atraen la vista y que vemos generalmente en las revistas y peridi-
cos, a menudo incluyen informacin innecesaria y slo generan confusin. La figura 2.19 represen-
ta una de estas muestras. La grfica ilustra los productos con la mayor participacin de mercado en
la industria de las bebidas gaseosas en 1999. Esto genera mucha confusin, aunque la grfica est di-
seada para mostrar las diferencias en la participacin de mercado entre las bebidas gaseosas. Las
ilustraciones del burbujeo para cada una de las bebidas ocupa mucho espacio de la grfica respecto
a los datos. La misma informacin podra transmitirse con una grfica de barras o con una grfica de
pastel.

FIGURA 2.19 Coca-Cola todava tiene el mayor burbujeo


Diagrama de la Coca-Cola clsica Bebidas carbonatadas con la mayor participacin
20% de mercado que lleg a los $58 mil millones el ao pasado
participacin de
mercado de las bebidas Pepsi-Cola
gaseosas en 1999. 14% Coca
diettica Mountain
Fuente: Adaptado de Anne 9% Dew Sprite Dr Pepper
B. Carey y Sam Ward, 6%
7% 7%
Coke Still Has Most Fizz,
USA Today, 10 de mayo,
2000, 1B.

Algunas directrices para desarrollar buenas grficas son las siguientes:


La grfica no debe distorsionar los datos.
La grfica no debera contener adornos innecesarios (algunas veces denominados basura gr-
fica).
Cualquier grfica de dos dimensiones debe contener una escala para cada eje.
La escala del eje vertical debe comenzar en cero.
Todos los ejes deben estar adecuadamente rotulados.
La grfica debe tener un ttulo.
Debe usarse una grfica lo ms sencilla posible para un conjunto de datos.
Una de las fuentes ms grandes de grficas impropias es el Asistente grfico de Excel. La figura 2.20
representa la ventana de dilogo del paso 1 del Asistente para grficos. Es posible elegir entre co-
lumna, barra, lnea, pastel y rea de grfica, as como tipos de grficas ms complicadas como ani-
llos, radial, superficie, burbujas, cotizaciones, cilndrico, cnico y piramidal. Estas grficas ms
complejas deben usarse slo ocasionalmente pues son ms difciles de interpretar que las grficas
simples que abarcamos en este captulo.
2.6: Uso inadecuado de grficas y consideraciones ticas 53

FIGURA 2.20
Ventana de dilogo del
paso 1 del Asistente
para grficos de Excel.

La mayora de los ejemplos del uso inadecuado de las grficas son resultado de no poner aten-
cin en las directrices para crear buenas grficas. Sin embargo, surgen problemas ticos cuando las
grficas se construyen para mal informar a propsito al lector. Sea como fuere, uno debe extremar
precauciones al tratar de obtener conclusiones de las grficas que se desvan de las directrices men-
cionadas en este captulo.

PROBLEMAS PARA LA SECCIN 2.6


Aplicacin de conceptos
Decrecen las fatalidades a causa de los relmpagos
2.46 (Proyecto estudiantil) Traiga a clase una grfica de un Nmero de muertes provocadas por relmpagos
peridico o de una revista, que considere que no representa ade-
cuadamente una variable numrica. Presntela a su maestro con
comentarios sobre por qu cree que es inadecuada. Considera 194251
que la intencin de la grfica es engaar a propsito al lector?
195261
Tambin preprese para hacer un comentario al respecto en
clase.
196271

2.47 (Proyecto estudiantil) Traiga a clase una grfica de un 197281


peridico o de una revista, que considere que no representa ade- 1,652
cuadamente una variable categrica. Presntela a su maestro 1,298 198291
874
con comentarios sobre por qu cree que sea inadecuada. Con- 3,048
sidera que la intencin de la grfica es engaar a propsito al 733 1992
2001
lector? Tambin preprese para hacer un comentario al respecto
en clase. 518

2.48 (Proyecto estudiantil) Traiga a clase una grfica de un


peridico o de una revista, que crea que contenga demasiados
adornos innecesarios (por ejemplo, basura grfica) que oscu-
rezcan el mensaje que transmiten los datos. Presntela a su
maestro con comentarios sobre por qu cree que sea inadecua- Fuente: Adaptado de USA Today, 12 de noviembre, 2002.
da. Tambin preprese para hacer un comentario al respecto en a. Describa por lo menos una caracterstica positiva de esta
clase. muestra visual.
b. Describa por lo menos una caracterstica negativa de esta
2.49 La siguiente muestra visual contiene una grfica sobrea- muestra visual.
dornada que apareci en el USA Today y que se refiere a las c. Redisee la grfica usando las directrices mencionadas en la
muertes a causa de los relmpagos en Estados Unidos. pgina 52.
54 CAPTULO 2 Presentacin de datos en tablas y grficas

2.50 La siguiente muestra visual se refiere al tamao relativo a. Describa por lo menos una caracterstica positiva de esta
de los departamentos de polica en las ciudades ms grandes de muestra visual.
Estados Unidos, que apareci en el USA Today: b. Describa por lo menos una caracterstica negativa de esta
muestra visual.
c. Redisee la grfica usando las directrices mencionadas en la
Proporcin ms alta de polica-residentes
pgina 52.
De las fuerzas de polica ms grandes de Estados Unidos,
estas ciudades tienen el mayor nmero de oficiales que 2.52 Un artculo publicado en The New York Times (Donna
trabajan tiempo completo por cada 10,000 residentes:
Rosato, Worried about the Numbers? How about the Charts?
67 The New York Times, 15 de septiembre, 2002, Business 7)
dio cuenta de una investigacin sobre los reportes anuales de
52 52 49 46 46 46 las corporaciones, que realiz la profesora Deanna Oxender
Burgess de la Florida Gulf Coast University. La profesora Bur-
gess encontr que aun la ms mnima distorsin en una grfica
cambia la percepcin que el lector tiene de la informacin. El
artculo mostr informacin sobre el reporte anual de Zale Cor-
poration y expuso la forma en que se exageraron los resultados.
Washington Nueva York Newark, NJ Chicago Filadelfia St. Louis Baltimore
Acuda a Internet o a la biblioteca y estudie el ms reciente
reporte anual de una corporacin. Localice por lo menos una
Fuente: Adaptado de USA Today, febrero de 2000. grfica en el reporte que considere que necesita mejorarse y
elabore la grfica mejorada. Explique por qu cree que su grfi-
a. Indique una caracterstica de esta grfica que viole los prin- ca es mejor que la del reporte anual.
cipios de las grficas bien hechas.
b. Disee una grfica alternativa para los datos proporcionados 2.53 Las figuras 2.1, 2.3 y 2.6, en las pginas 23, 24 y 27,
en esta figura. consisten en una grfica de barras, una grfica de pastel y un
2.51 La siguiente muestra visual indica la fuente de la electri- diagrama de Pareto para describir los datos de las compras en
cidad en Estados Unidos, y apareci en USA Today: lnea.
a. Use el Asistente para grficos de Excel para desarrollar una
grfica de anillo, una grfica cnica y una grfica piramidal
El carbn es la principal fuente de electricidad para los datos de las compras en lnea.
60 De dnde obtiene E.U. su electricidad:
b. Qu grficas prefiere: la grfica de barras, la grfica de
pastel y el diagrama de Pareto, o la grfica de anillo, la gr-
50 fica cnica y la grfica piramidal? Explique su respuesta.

40 2.54 Las figuras 2.2 y 2.4 de las pginas 24 y 25 consisten en


una grfica de barras y una grfica de pastel para el nivel de
riesgo de los datos de fondos de inversin. MUTUALFUNDS2004
30
a. Utilice el Asistente para grficos de Excel para desarrollar
una grfica de anillo, una grfica cnica y una grfica pira-
20 midal para el nivel de riesgo de los fondos de inversin.
b. Qu grficas prefiere: la grfica de barras y la grfica de
10 pastel o la grfica de anillo, la grfica cnica y la grfica pi-
ramidal? Explique su respuesta.
0
n

ar

as

eo

as
ric

lic
b

le

tr
l

E
t
uc

O
r

tr
Ca

Pe
N

el
ro
id
H

Fuente: Adaptado de USA Today, 30 de enero, 2002.

RESUMEN
Como se observa en la tabla 2.18, este captulo trat acerca de sentaron en el escenario de Uso de la estadstica al inicio del
la presentacin de datos. Usted ha usado diferentes tablas y captulo. Ahora que ha estudiado tablas y grficas, en el captu-
grficas para obtener conclusiones acerca de las compras en l- lo 3 aprender acerca de una variedad de medidas descriptivas
nea, el costo de las comidas en restaurantes en la ciudad y en numricas tiles para el anlisis y la interpretacin de los datos.
los suburbios, y del conjunto de fondos de inversin que se pre-
Problemas de repaso 55

TABLA 2.18 Tipe de datos


Mapa para seleccionar Tipo de anlisis Numricos Categricos
tablas y grficas.
Tabular, organizar y Arreglo ordenado, diagrama de Tabla de resumen, grfica de
presentar grficamente tallo y hojas, distribucin barras, grfica de pastel,
los valores de la variable de frecuencias, distribu- diagrama de Pareto (sec-
cin de frecuencias relati- cin 2.1)
vas, distribucin de
porcentaje, distribucin
acumulativa, histograma,
polgono, polgono de
porcentaje acumulado
(secciones 2.2 y 2.3)

Presentar grficamente Diagrama de dispersin, Series Tabla de contingencia, grfica


la relacin entre dos de tiempo (seccin 2.5) de barras agrupadas (sec-
variables cin 2.4)

C O N C E P T O S C L AV E
Agrupaciones o clases 33 Distribucin de porcentaje acumulado Diagrama de series de tiempo 48
Amplitud de un intervalo de clase 33 35 Polgono de porcentaje 39
Arreglo ordenado 30 Distribucin de porcentajes 34 Polgono de porcentaje acumulado 40
Basura grfica 52 Grfica de barras 23 Principio de Pareto 25
Celdas 43 Grfica de barras agrupadas 45 Punto medio de la clase 33
Diagrama de tallo y hoja 30 Grfica de pastel 24 Rango 33
Diagrama de dispersin 47 Histograma 37 Tabla de datos bivariados 43
Diagrama de Pareto 25 Lmites de clase 33 Tabla de contingencia 43
Distribucin de frecuencia relativa 34 Ojiva (polgono de porcentaje Tabla de resumen 22
Distribucin de frecuencias 32 acumulado) 40

PROBLEMAS DE REPASO
Revisin de su comprensin 2.60 Por qu se dice que la caracterstica principal del dia-
grama de Pareto es que permite separar a lo poco vital de lo
2.55 Cmo es que los histogramas y los polgonos difieren mucho trivial?
con respecto a su construccin y uso? 2.61 Qu porcentaje de fracasos pueden ayudar a interpretar
2.56 Cundo realizara una tabla de resumen? los resultados encontrados en una tabla de contingencia?

2.57 Cules son las ventajas y/o desventajas del uso de la Aplicacin de conceptos
grfica de barras, la grfica de pastel o el diagrama de Pareto?
Puede resolver manualmente los problemas 2.62 a
2.58 Compare y contraste la grfica de barras para datos cate- 2.74 o usando Excel, Minitab o SPSS. Le recomenda-
gricos contra el histograma para datos numricos. mos usar Excel, Minitab o SPSS para resolver los pro-
blemas 2.75 a 2.85.
2.59 Cul es la diferencia entre el diagrama de series de 2.62 Los datos en la parte superior de la pgina 56 representan
tiempo y el diagrama de dispersin? el desglose del precio de un nuevo libro de texto.
56 CAPTULO 2 Presentacin de datos en tablas y grficas

Categoras de ingresos Porcentaje Tipo de 1999 2001 2003


de pago Porcentaje Porcentaje Porcentaje
Editor 64.8
Costos de produccin 32.3 Efectivo 39 33 32
Marketing y promocin 15.4 Cheque 18 18 15
Costos administrativos e impuestos 10.0 Dbito 21 26 31
Ganancia despus de impuestos 7.1 Crdito 22 21 21
Librera 22.4 Otros 0 2 1
Salarios y prestaciones de empleados 11.3
Fuente: M. Ingebretsen y M. Ballinger, Charge It, The Wall Street Jour-
Operaciones 6.6 nal, 9 de febrero, 2004, R2.
Ganancias antes de impuestos 4.5
Autor 11.6
Flete 1.2
a. Construya una grfica de barras agrupadas para las formas
Fuente: T. Lewin, When Books Break the Bank, The New York Times, de pago en 1999, 2001 y 2003.
16 de septiembre, 2003, B1, B4. b. Con base en los resultados del inciso a), qu cambios en las
formas de pago ocurrieron en 1999, 2001 y 2003?

a. Realice una grfica de barras, una grfica de pastel y un dia- 2.65 Los siguientes datos representan el consumo per cpita
grama de Pareto para las cuatro categoras de editor, librera, de bebidas (en galones) vendidas en tiendas minoristas durante
autor y flete. 1998, 2000 y 2002.
b. Elabore un diagrama de Pareto usando las cuatro subcatego-
ras de editor y las tres subcategoras de librera junto con las
categoras de autor y flete.
c. Con base en los resultados de los incisos a) y b), a qu con- Tipo de 1998 2000 2002
clusiones se llega con relacin a quin obtiene las ganancias bebida Consumo Consumo Consumo
por la venta de los nuevos libros de texto? Le sorprenden
estos resultados? Explique su respuesta. Agua embotellada 2.5 4.1 6.7
Lcteo/otros 0.3 0.3 0.3
2.63 Los siguientes datos representan la participacin de mer- Jugos 3.1 3.7 4.0
cado para la reparacin de automviles y de camiones ligeros Refrescos 54.0 53.0 52.5
en 1992 y 2002. Bebidas energticas 1.9 2.2 2.5
T 1.9 2.0 1.9
Total 63.7 65.3 67.9
1992 2002 Fuente: T. Howard, Coke, Pepsi Sales Up, but Core Colas Flat, USA To-
Fuente Porcentaje Porcentaje day, 21 de julio, 2003, 3B.

Especialistas forneos 3.9 6.0


Tiendas de refacciones
con espacios de servicio 7.3 6.4
Especialistas en reparacin 12.7 16.2 a. Elabore una tabla de resumen de porcentajes para los tipos
Estaciones de servicio, talleres 39.1 29.5 de bebida por ao.
Tiendas de neumticos 8.1 8.9 b. Para cada ao, elabore una grfica de barras, una grfica de
Distribuidor de vehculos 21.6 26.6 pastel y un diagrama de Pareto.
Otros 7.3 6.4 c. Elabore una grfica de barras agrupadas de la participacin
de mercado de los tipos de bebidas en 1998, 2000 y 2002.
Fuente: A. Frangos, Corner Garages Battle Dealers to Fix Your Car, d. Con base en los resultados de los incisos a) a c), qu cam-
The Wall Street Journal, 3 de junio, 2003, B1, B4. bios ocurrieron en el mercado entre 1998 y 2002?

2.66 Brasil es el segundo pas consumidor de caf en el mun-


a. Elabore una grfica de barras, una grfica de pastel y un dia- do. A diferencia de la mayora de los mercados donde unas
grama de Pareto para cada ao. cuantas corporaciones dominan el tostado y la venta del caf,
b. Realice una grfica de barras agrupada para la participacin en ese pas estn activos ms de 2,000 pequeos tostadores de
de mercado en 1992 y 2002. caf. La corporacin Sara Lee se ha convertido en el vendedor
c. Con base en los resultados de los incisos a) y b), qu cam- de caf al detalle lder en Brasil, al adquirir varios tostadores de
bios en la participacin de mercado ocurrieron entre 1992 y caf (Miriam Jordan, Sara Lee Wants to Percolate through all
2002? Brasil, The Wall Street Journal, 8 de mayo, 2002, A14). En la
pgina 57 se presentan los datos de las siete naciones ms con-
2.64 Los siguientes datos representan cmo realizaron sus pa- sumidoras de caf y el desglose de los lderes del mercado en
gos los consumidores en las tiendas en 1999, 2001 y 2003. Brasil.
Problemas de repaso 57

Principales pases consumidores de caf en 2000 Reservas conven-


cionales probadas
Pas Consumo (en millones de bolsas de 60 kg)
(en miles de millones
Estados Unidos 18.6 Regin y pas de barriles) Reservas
Brasil 12.8
Medio Oriente 683.6
Alemania 9.2
Arabia Saudita 259.2
Japn 6.7
Irak 112.5
Francia 5.4
Emiratos rabes Unidos 97.8
Holanda 1.8
Kuwait 94.0
Finlandia 0.9
Irn 89.7
Fuente: The Wall Street Journal. Qatar 13.2
Omn 5.5
Otros en Medio Oriente 11.7
Marcas lderes de caf en Brasil Lejano Oriente y Oceana 44.0
China 24.0
Marca Participacin de mercado
Indonesia 5.0
Marcas pertenecientes a Sara Lee 27.6% India 4.7
Nescaf 6.1% Otros en Lejano Oriente y Oceana 10.3
Tres Coracoes 4.8% Europa Oriental y ex URSS 59.0
Melitta 4.0% Rusia 48.6
Todas las dems 57.5% Kazajstn 5.4
Otros en Europa Oriental y ex URSS 5.0
Fuente: The Wall Street Journal.
Fuente: Departamento de Energa de Estados Unidos.

a. Construya una grfica para los datos relacionados con los Usando el conjunto de pases:
pases que consumen ms caf. Qu tipo de grfica es la a. Construya una grfica de barras, una grfica de pastel y un
ms apropiada? Explique por qu. diagrama de Pareto.
b. Construya una grfica para los datos referentes a la partici- Usando el conjunto de regiones:
pacin de mercado en Brasil. Qu tipo de grfica es la ms b. Realice una grfica de barras, una grfica de pastel y un dia-
adecuada? Explique por qu. grama de Pareto.
2.67 Los siguientes datos representan las reservas convencio- c. Qu mtodo grfico cree que refleja mejor estos datos?
nales probadas de petrleo en miles de millones de barriles, d. Con base en los resultados de los incisos a) y b), a qu con-
subdivididos por regin y pas. clusiones se llega respecto a las reservas convencionales de
petrleo probadas para los diferentes pases y regiones?
2.68 Al analizar las repercusiones de los ataques del 11 de
Reservas septiembre de 2001, los especialistas del National Center for
convencionales probadas Health Statistics, se enfocaron en su habilidad de localizar y
(en miles de millones clasificar a las vctimas del terrorismo (E. Weinstein, Tracking
Regin y pas de barriles) Reservas Terrors Rising Toll, The Wall Street Journal, 25 de enero, 2002,
Norteamrica 54.8 A13). Los siguientes datos representan las muertes provocadas
Mxico 28.3 por el terrorismo en Estados Unidos entre 1990 y 2001 y tambin
E.U. 21.8 las muertes en Estados Unidos provocadas por diversas causas.
Canad 4.7
Centro y Sudamrica 95.2 Muertes provocadas por el terrorismo
Venezuela 76.9 Ao en Estados Unidos
Brasil 8.1 1990 0
Otros en Centro y Sudamrica 10.2 1991 0
Europa Occidental 17.2 1992 0
Noruega 9.5 1993 6
Inglaterra 5.0 1994 1
Otros en Europa Occidental 2.7 1995 169
frica 74.9 1996 2
Libia 29.5 1997 0
Nigeria 22.5 1998 1
Argelia 9.2 1999 3
Angola 5.4 2000 0
Otros en frica 8.3 2001 2,717
58 CAPTULO 2 Presentacin de datos en tablas y grficas

b. Elabore una grfica de barras, una grfica de pastel y un dia-


Causa Muertes en miles
grama de Pareto para los tipos de platillos ordenados.
Humo y fuego 3.3 c. Prefiere un diagrama de Pareto o una grfica de pastel para
Ahogamiento accidental 3.3 estos datos? Por qu?
Muertes inducidas por el alcohol 18.5 d. A qu conclusiones llegar el dueo del restaurante en rela-
Enfermedad de Alzheimer 49.0 cin con la demanda de los diferentes tipos de platillos?
Asalto con armas de fuego 10.4
Asalto sin armas de fuego 5.7 2.70 Suponga que el dueo del restaurante del problema 2.69
Asma 4.4 tambin estaba interesado en estudiar la demanda de postres pa-
Cncer 551.8 ra el mismo periodo. Decidi que otras dos variables, junto con
Embolia y enfermedades relacionadas 166.0 la variable de si se ordena o no el postre, deban estudiarse: el
Enfisema 16.9 gnero del individuo y si ordenaba el platillo de res. Los resul-
Diabetes 68.7 tados fueron los siguientes:
Enfermedades cardiacas 710.0
Cadas 12.0
VIH 14.4 GNERO
Influenza y neumona 67.0
Lesiones en el trabajo 5.3 ORDEN POSTRE Masculino Femenino Total
Accidentes en vehculos 41.8 S 96 40 136
Suicidio 28.3 No 224 240 464
Muertes relacionadas con las drogas 15.9 Total 320 280 600
Fuente: Federal Bureau of Criminal Justice Statistics, National Center for
Health Statistics, National Highway Transportation, Safety Administration, PLATILLO DE RES
Departmento de Defensa de Estados Unidos. ORDEN POSTRE S No Total
S 71 65 136
a. Disee un diagrama de series de tiempo para las muertes No 116 348 464
provocadas por el terrorismo en territorio estadounidense. Total 187 413 600
Hay algn patrn en las muertes provocadas por el terroris-
mo en territorio estadounidense entre 1990 y 2001?
Para cada una de las dos tablas de contingencia:
Para las muertes en miles de personas por diferentes causas:
a. Realice una tabla de porcentajes de fila, de porcentajes de
b. Elabore una grfica de barra, una grfica de pastel y un dia-
columna y de porcentajes totales.
grama de Pareto.
b. Qu tipo de porcentaje (fila, columna o total) cree que es el
c. Qu mtodo grfico es el mejor para describir estos datos?
ms informativo para cada gnero? Para el platillo de res?
d. Con base en los resultados del inciso c), a qu conclusiones
Explique por qu.
se llega respecto a las muertes en Estados Unidos provoca-
c. Qu conclusiones obtendr el dueo del restaurante respec-
das por diversas causas?
to al patrn de postres ordenados?
2.69 El dueo de un restaurante que sirve platillos estilo Con-
2.71 Un artculo publicado en The New York Times (William
tinental estaba interesado en estudiar los patrones de demanda
McNulty y Hugh K. Truslow, How it Looked Inside the
para el periodo de viernes a domingo (fin de semana). Guard
Booth, The New York Times, 6 de noviembre, 2002) aport los
registros que indicaban el nmero de rdenes para cada tipo de
siguientes datos para el mtodo de registro de votos en 1980,
platillo. Los datos son los siguientes:
2000 y 2002, divididos en los porcentajes de ciudades en Esta-
dos Unidos que emplearon cada mtodo y los porcentaje de vo-
tantes registrados que utilizaron cada uno. Los resultados son
los siguientes:
Tipo de platillo Nmero servido
Res 187
Pollo 103 PORCENTAJE DE CIUDADES
Pato 25 QUE LO USARON
Pescado 122 MTODO 1980 2000 2002
Pasta 63
Mariscos 74 Tarjetas perforadas 18.5 18.5 15.5
Ternera 26 Mquinas con palanca 36.7 14.4 10.6
Papeletas 40.7 11.9 10.5
Escaneo ptico 0.8 41.5 43.0
Electrnico 0.2 9.3 16.3
a. Elabore una tabla de resumen para los tipos de platillos or- Mixto 3.1 4.4 4.1
denados.
Problemas de repaso 59

a. Elabore un diagrama de Pareto para el nmero de quejas de


PORCENTAJE DE VOTANTES
garanta por la rodada del neumtico. Qu rodada de neu-
REGISTRADOS QUE LO USARON
mtico recibi el mayor nmero de quejas?
MTODO 1980 2000 2002 b. Elabore una grfica de pastel que muestre el porcentaje del
Tarjetas perforadas 31.7 31.4 22.6 nmero total de quejas de garanta para los neumticos
Mquinas con palanca 42.9 17.4 15.5 23575R15 que vienen en el modelo ATX y en el modelo Wil-
Papeletas 10.5 1.5 1.3 derness. Interprete la grfica.
Escaneo ptico 2.1 30.8 31.8 c. Realice un diagrama de Pareto para el tipo de incidente cau-
Electrnico 0.7 12.2 19.6 sado en la reclamacin de garanta para el modelo ATX.
Mixto 12.0 6.7 9.3 Existe un cierto tipo de incidente que cause la mayora de
las quejas?
a. Realice grficas de pastel para cada ao para los porcentajes d. Disee un diagrama de Pareto para el tipo de incidente que
de las ciudades y los porcentajes de los votantes registrados causa la queja de garanta para el modelo Wilderness. Exis-
que usaron los diversos mtodos. te un cierto tipo de incidente que cause la mayora de las
b. Realice grficas de barras agrupadas por ao para los por- quejas?
centajes de ciudades y los porcentajes de votantes registra-
dos que usaron los diferentes mtodos. 2.73 Una de las principales medidas de calidad del servicio
c. Qu tipo de muestra grfica es ms til para representar los que brinda cualquier organizacin es la velocidad con la que
datos? Explique por qu. responde a las quejas del consumidor. Una gran tienda, depar-
d. Qu diferencias existen en los resultados para las ciudades tamental que vende muebles, pisos y alfombras, ha tenido
y para los votantes registrados? una gran expansin en los ltimos aos. El departamento de pi-
2.72 En el verano del ao 2000, se registr un mayor nmero sos, en especial, ha crecido de 2 cuadrillas de instalacin a un
de reclamaciones sobre la garanta de los neumticos Firestone supervisor de instalacin, un medidor y 15 cuadrillas de instala-
vendidos en la Ford SUV, lo que provoc que tanto la Firesto- cin. Durante un ao reciente, la empresa recibi 50 quejas re-
ne como la Ford emitieran un importante comunicado. Un an- ferentes a la instalacin de alfombras. Los siguientes datos
lisis de los datos de quejas sobre la garanta ayud a identificar representan el nmero de das entre la recepcin de la queja y
qu modelos deban atender. El desglose de 2,504 quejas de ga- su solucin. FURNITURE
ranta basadas en el tamao del neumtico se presenta en la si-
guiente tabla: 54 5 35 137 31 27 152 2 123 81 74 27
11 19 126 110 110 29 61 35 94 31 26 5
Rodada del neumtico Quejas de garanta 12 4 165 32 29 28 29 26 25 1 14 13
23575R15 2,030 13 10 5 27 4 52 30 22 36 26 20 23
311050R15 137 33 68
30950R15 82
23570R16 81 a. Elabore una distribucin de frecuencia y una distribucin de
331250R15 58 porcentaje.
25570R16 54 b. Trace un histograma y un polgono de porcentaje.
Otros 62 c. Construya una distribucin de porcentaje acumulado y trace
una ojiva (polgono de porcentaje acumulado).
Fuente: Robert L., Simison, Ford Steps Up Recall without Firestone, The
Wall Street Journal, 14 de agosto, 2000, A3. d. Con base en los resultados de los incisos a) a c), si tuviera
que informar al presidente de la empresa cunto tiene que
Las 2,030 quejas de garanta para los neumticos 23575R15 esperar el cliente para que su queja se resuelva, qu le di-
pueden clasificarse en los modelos ATX y Wilderness. El tipo de ra? Explique su respuesta.
incidente que llev a la queja de garanta, por tipo de modelo,
se resume en la siguiente tabla. 2.74 Los datos del archivo PIZZA representan el costo por re-
banada en dlares, el nmero de caloras por rebanada y la can-
Quejas de Quejas de tidad de grasa en gramos por rebanada para una muestra de 36
garanta para garanta para el productos de pizza.
Incidente el modelo ATX modelo Wilderness
Fuente: Frozen Pizza on the Rise, Copyright 2002 por Consumer
Separacin de la Union of U.S., Inc., Yonkers, NY 10703-1057. Adaptado con permiso de
banda de rodadura 1,365 59 Consumer Reports, enero de 2002, 40-41.
Ponchadura 77 41
Otro/desconocido 422 66
a. Elabore distribuciones de frecuencias y distribuciones de
Total 1,864 166 porcentaje para grasa, costo y caloras.
Fuente: Robert L. Simison, Ford Steps Up Recall without Firestone, The b. Construya histogramas y polgonos de porcentaje para gra-
Wall Street Journal, 14 de agosto, 2000, A3. sa, costo y caloras.
60 CAPTULO 2 Presentacin de datos en tablas y grficas

c. Elabore distribuciones de porcentaje acumulado y trace oji- keting Quarterly report sobre el efecto de las promociones
vas (polgonos de porcentaje acumulado) para grasa, costo y mercadolgicas [T.C. Boyd y T.C. Krehbiel, Promotion Ti-
caloras. ming un Major League Baseball and the Stacking Effects of
d. Elabore diagramas de dispersin para el costo y las caloras, Factors that Increase Game Attractiveness, Sport Marketing
costo y grasa, y caloras y grasa. Quarterly, vol. 12 (2003), 173-184]. El archivo de datos RO-
e. Con base en el inciso a) al d), a qu conclusiones llega YALS incluye las siguientes variables para el equipo Kansas
acerca del costo, grasas y caloras de estos productos de City Royals durante la temporada de bisbol del ao 2002:
pizza? GAME = Juegos en casa en el orden en el que se jugaron.
2.75 Un artculo en Quality Engineering examin la viscosi- ATTENDANCE = Asistencia pagada al juego.
dad (resistencia al flujo) de un producto qumico producido en PROMOTION 1 = Si se realiz una promocin; 0 = si no se
partidas. Tome en cuenta que la viscosidad del qumico necesi- realiz ninguna promocin.
ta estar entre 13 y 18 para cumplir con las especificaciones de la a. Elabore un histograma de porcentaje para la variable de
empresa. Los datos para las 120 partidas estn en los datos del asistencia. Interprete el histograma.
archivo. CHEMICAL b. Elabore un polgono de porcentaje para la variable de asis-
tencia. Interprete el polgono.
Fuente: D.S: Holmes y A.E. Mergen, Parabolic Control Limits for the Ex-
ponentially Weighted Moving Average Control Charts, Quality Enginee- c. Qu grfica prefiere: la del inciso a) o la del inciso b)? Ex-
ring, vol. 4 (1992), 487-495. plique.
d. Elabore una grfica que contenga dos polgonos de porcen-
taje para la asistencia: uno para los 43 juegos con promocin
a. Elabore un arreglo ordenado. y uno para los 37 juegos sin promocin. Compare las distri-
b. Construya una distribucin de frecuencia y una distribucin buciones de las dos asistencias.
de porcentaje.
c. Elabore un histograma de porcentaje. 2.78 Los datos para el archivo PROTEIN indican las caloras,
d. Qu porcentaje de las partidas est dentro de las especifica- protenas, caloras de grasa, caloras de grasa saturada y coles-
ciones de la empresa? terol para comidas protenicas populares (carnes rojas frescas,
pollo y pescado).
2.76 Estudios que realiz un fabricante de tablillas de asfalto
Fuente: Departamento de Agricultura de Estados Unidos.
Boston y Vermont demuestran que el peso del producto es
el factor principal en la percepcin que el consumidor tiene de Para los datos referentes al nmero de caloras, protenas,
la calidad. Ms an, el peso representa la cantidad de material caloras de la grasa, caloras de grasa saturada y cantidad de co-
usado, por lo que es muy importante para la empresa desde el lesterol para las comidas protenicas populares:
punto de vista del costo. La ltima etapa de la lnea de ensam- a. Elabore una distribucin de frecuencias y una distribucin
blaje empaca las tablillas antes de que los paquetes se coloquen de porcentajes.
en paletas de madera. Una vez que la paleta est llena (las pale- b. Elabore un histograma y un polgono de porcentaje.
tas de casi todas las marcas tienen capacidad para sostener 16 c. Construya una distribucin de porcentaje acumulado, y ela-
cuadros de tablillas), se pesa y se registra este dato. La empresa bore un polgono de porcentaje acumulado.
espera que las paletas de tablillas de su marca Boston pesen d. A qu conclusiones llega a partir de estos anlisis?
por lo menos 3,050 libras pero menos de 3,260. Para las tabli- 2.79 Suponga que desea estudiar las caractersticas de los mo-
llas de la marca Vermont, las paletas deben pesar por lo delos de automviles del ao 2002 en trminos de las siguientes
menos 3,600 libras pero menos de 3,800. El archivo de datos variables: caballos de potencia, millas por galn, longitud, an-
PALLET contiene los pesos (en libras) de una muestra de 368
chura, requerimiento de ngulo de giro, peso y volumen de car-
paletas de tablillas Boston y 330 paletas de tablillas Ver- ga. AUTO2002
mont.
a. Para las tablillas Boston, construya una distribucin de Fuente: The 2002 Cars, Copyright 2002 por Consumers Union of
frecuencias y una distribucin de porcentaje con ocho inter- U.S., Inc., Yonkers, NY 10703-1057. Adaptado con permiso de Consumer
Reports, abril de 2002, 22-71.
valos de clase usando como lmites de clase: 3,015, 3,050,
3,085, 3,120, 3,155, 3,190, 3,225, 3,260 y 3,295. Para cada una de estas variables:
b. Para las tablillas Vermont, construya una distribucin de a. Elabore una distribucin de frecuencias y una distribucin
frecuencias y una distribucin de porcentaje con siete inter- de porcentajes.
valos de clase, usando como lmites de clase: 3,550, 3,600, b. Construya un histograma y un polgono de porcentajes.
3,650, 3,700, 3,750, 3,800, 3,850 y 3,900. c. Elabore una distribucin de porcentaje acumulado y trace un
c. Elabore histogramas para las tablillas Boston y para las ta- polgono de frecuencia acumulada.
blillas Vermont. d. A qu conclusiones llega respecto a los automviles 2002?
d. Comente acerca de la distribucin del peso de las paletas pa-
2.80 En relacin con las caractersticas de los modelos de au-
ra las tablillas Boston y Vermont. Asegrese de identifi-
tomviles del ao 2002 AUTO2002 del problema 2.79,
car el porcentaje de paletas que se encuentran por debajo y
a. Construya una tabla de contingencia del tipo de traccin con
por encima del peso.
el tipo de gasolina.
2.77 Regalar artculos promocionales incrementa la asisten- b. Elabore una grfica de barras agrupadas del tipo de traccin
cia a los juegos de la liga de bisbol? Un artculo en Sport Mar- con el tipo de gasolina.
Problemas de repaso 61

c. Con base en los resultados de los incisos a) y b), parece 2.84 Los datos del archivo PRINTERS representan el precio, la
haber relacin entre el tipo de transmisin y el tipo de ga- velocidad del texto, costo del texto, tiempo de las fotografas de
solina? color y costo de las impresiones de las fotografas a color.
a. Elabore un diagrama de dispersin con el precio y la velo-
2.81 Los datos del archivo STATES representan los resultados
cidad del texto, precio y costo del texto, precio y tiempo de
de la encuesta American Community, una muestra de hogares
las fotografas a color, y precio y costo de las fotografas a
tomados de todos los estados durante el Censo de 2000 de Esta-
color.
dos Unidos. Para cada una de las variables de promedio del
b. Con base en los resultados del inciso a), cree usted que al-
tiempo en minutos del trayecto al trabajo, porcentaje de casa
guna de las otras variables seran tiles para predecir el pre-
con ocho o ms habitaciones, ingreso promedio del hogar y
cio de la impresora? Explique su respuesta.
porcentaje de pagos hipotecarios que realizan los propietarios
cuyos costos de casa exceden el 30% de su ingreso: Fuente: Printers, Copyright 2002 por Consumers Union of U.S., Inc.,
a. Elabore una distribucin de frecuencias y una distribucin Yonkers, NY 10703-1057. Adaptado con permiso de Consumer Reports,
marzo de 2002, 51.
de porcentajes.
b. Construya un histograma y un polgono de porcentaje. 2.85 El ndice S&P 500 rastrea el movimiento general del
c. Construya una distribucin de porcentaje acumulado y trace mercado burstil de acuerdo con el precio de las acciones de
un polgono de porcentaje acumulado. 500 grandes corporaciones. El archivo STOCKS2003 contiene los
d. Qu conclusiones se obtienen de estas cuatro variables con datos semanales para este ndice, as como el precio semanal
base en los resultados de los incisos a) al c)? del cierre de las acciones para tres compaas durante 2003. Las
variables incluidas son:
2.82 La economa del bisbol ha causado una gran controver- WEEK Semana que termina en una fecha dada.
sia desde que los propietarios de los equipos se quejaron de sus S & P Cierre del valor semanal para el ndice S&P 500.
prdidas econmicas; los jugadores argumentan que los propie- SEARS Cierre semanal del precio de las acciones de
tarios estn ganando dinero y los fanticos se quejan de lo caro Sears.
que resulta asistir a un juego, por lo que prefieren quedarse en TARGET Cierre semanal del precio de las acciones de
casa y ver los partidos por televisin. Adems de los datos rela- Target.
cionados con las estadsticas de los equipos para la temporada SARA LEE Cierre semanal del precio de las acciones de
2001, el archivo BB2001 contiene las estadsticas del precio de Sara Lee.
los boletos de cada equipo; el ndice del costo por fantico;
ingresos por entrada en una temporada regular; ingresos por te- Fuente: finance.yahoo.com
levisin, radio y cable local; todos los dems ingresos operati- a. Elabore un diagrama de series de tiempo para los valores de
vos; la compensacin y los beneficios de los jugadores; otros cierre semanal del ndice S&P 500 Sears, Roebuck and
gastos locales y nacionales, as como el ingreso de las operacio- Company, Target Corporation y Sara Lee.
nes derivadas del bisbol. Para cada una de estas variables, b. Explique cualquier patrn que detecte en la grfica.
a. Construya una distribucin de frecuencias y una distribu- c. Escriba un resumen de sus hallazgos.
cin de porcentaje.
2.86 (Proyecto de clase) Permita que cada alumno de su cla-
b. Elabore un histograma y un polgono de porcentaje.
se responda a la pregunta Qu bebida refrescante prefiere?,
c. Elabore una distribucin de porcentaje acumulado y cons- para que el maestro registre los resultados en una tabla de re-
truya un polgono de porcentaje acumulado. sumen.
d. Elabore un diagrama de dispersin para predecir el nmero a. Convierta los datos a porcentajes para construir un diagrama
de juegos ganados en el eje Y, y la compensacin y benefi- de Pareto.
cios del jugador en el eje X. Qu conclusiones obtiene a b. Analice sus hallazgos.
partir de este diagrama de dispersin?
e. Qu conclusiones acerca de estas variables se obtienen con 2.87 (Proyecto de clase) Permita que cada alumno de su cla-
base en los resultados de los incisos a) al c)? se sea clasificado con base en su gnero (masculino, femenino)
y estado de empleo actual (s, no) para que el maestro registre
2.83 Los datos en el archivo AIRCLEANERS representan el pre- los resultados.
cio, el costo anual de energa y el costo anual de los filtros para a. Construya una tabla con porcentajes de fila o de columna,
los limpiadores de aire de las habitaciones. dependiendo de cul considere que es ms informativo.
a. Construya un diagrama de dispersin con el precio en el eje b. Qu concluira de este estudio?
Y, y el costo de energa en el eje X. c. Qu otras variables deseara conocer respecto al empleo
b. Elabore un diagrama de dispersin con el precio en el eje Y, con la finalidad de enriquecer sus hallazgos?
y el costo de los filtros en el eje X.
c. A qu conclusiones se llega sobre el costo de la energa y el Reportes escritos de los ejercicios
costo de los filtros en relacin con el de los limpiadores de 2.88 De acuerdo con los resultados del problema 2.76 en la
aire? pgina 60 respecto al peso de las tablillas Boston y Ver-
Fuente: Portable Room Air Cleaners, Copyright 2002 por Consumers mont, escriba un reporte que evale si el peso de las paletas de
Union of U.S., Inc., Yonkers, NY 10703-1057. Adaptado con permiso de los dos tipos de tablillas es congruente con las expectativas de la
Consumer Reports, febrero de 2002, 47. empresa. Asegrese de incluir tablas y grficas en el reporte.
62 CAPTULO 2 Presentacin de datos en tablas y grficas

2.89 De acuerdo con los resultados del problema 2.72 en la 2.90 Para la variable de relacin de gasto:
pgina 59 respecto a las quejas de la garanta de los neumticos a. Elabore un histograma.
Firestone, escriba un reporte que evale las quejas de garanta b. Construya polgonos de frecuencia para la proporcin de
de los neumticos Firestone vendidos en los modelos Ford SUV. gasto para los fondos de inversin que tengan tarifas y para
Asegrese de incluir tablas y grficas en el reporte. los que no tengan tarifas en la misma grfica.
c. Qu conclusiones acerca de la proporcin de gasto se ob-
tienen con base en los resultados de los incisos a) y b)?
PROYECTO EN EQUIPO
2.91 Para la variable que contiene el rendimiento anualizado
de cinco aos de 1999 a 2003:
Los datos del archivo MUTUALFUNDS2004 contienen informa-
a. Elabore un histograma.
cin respecto a 12 variables de una muestra de 121 fondos de
b. Construya polgonos de frecuencia del rendimiento anuali-
inversin. Las variables son:
zado de cinco aos de 1999 a 2003 para los fondos de inver-
Fund El nombre del fondo de inversin. sin de crecimiento y para los fondos de inversin de valor
Category Tipo de acciones que comprende el fondo de in- en la misma grfica.
versin: de gran capital, capital medio, capital reducido. c. A que conclusiones llega acerca del rendimiento anuali-
Objective Objetivo de las acciones que comprenden el zado de cinco aos entre 1999 y 2003, con base en los resul-
fondo de inversin: crecimiento o valor. tados de los incisos a) y b)?
Assets Activos en millones de dlares.
Fees Cargos por ventas (s o no). 2.91 Para la variable que contiene el rendimiento anualizado
Expense ratio Relacin entre gastos y activos netos en de tres aos de 2001 a 2003:
porcentaje. a. Elabore un histograma.
2003 Return Rendimiento de 12 meses en 2003. b. Construya polgonos de frecuencia del rendimiento anuali-
Three-year return Rendimiento anualizado de 2001 a 2003. zado de tres aos entre 2001 y 2003 para los fondos de in-
Five-year return Rendimiento anualizado de 1999 a 2003. versin de crecimiento y para los fondos de inversin de va-
Risk Factor de riesgo de prdida de los fondos de inver- lor en la misma grfica.
sin clasificado como bajo, promedio o alto. c. A que conclusiones llega acerca del rendimiento anualiza-
Best quarter Mejor resultado trimestral 1999 a 2003. do de tres aos entre 2001 y 2003, con base en los resultados
Worst quarter Peor resultado trimestral 1999 a 2003. de los incisos a) y b)?

CASO ACTUAL
ADMINISTRACIN DEL SPRINGVILLE HERALD
Las tarifas de publicidad son una importante fuente de ingresos se/Ad_Errors.htm) e identifique los datos que son importantes
para cualquier peridico. En un intento de incrementar estos in- para describir los problemas del servicio al consumidor. Para
gresos y de minimizar errores costosos, la administracin del cada conjunto de datos que identifique, elabore la grfica que
Herald form un equipo de trabajo encargado de mejorar el ser- considere ms adecuada para los datos y explique su eleccin.
vicio al consumidor en el departamento de publicidad. Revise la Tambin sugiera qu otra informacin respecto a los diferentes
coleccin de datos de la fuerza de trabajo (abra Ad_ Errors.htm tipos de errores sera til examinar. Ofrezca posibles cursos de
en la carpeta Springville HeraldCase del CD-ROM que acompaa accin que el equipo de trabajo o la administracin puedan to-
a este texto o visite el sitio www.prenhall.com/Herald Ca- mar para mejorar el servicio al consumidor.

CASO WEB
En el escenario de Uso de la estadstica se le pidi que conocimientos sobre el uso correcto de las tablas y grficas
recabara informacin que ayudara a elegir buenas opcio- en este Caso Web sobre las afirmaciones de previsin y ex-
nes de inversin. Las fuentes para tal informacin incluyen celencia de un servicio de inversin de Springville.
firmas de corredura y consejeros de inversin. Aplique sus
Apndice 63

Visite el sitio en Internet de StockTout Investing Service en 3. Los fondos de inversin de StockTout Big Eight son
www.prenhall.com/Springville/StockToutHome.htm. Re- parte de la muestra encontrada en el archivo MUTUAL-
vise sus afirmaciones sobre inversin y los datos que las apo- FUNDS2004. Hay otros datos relevantes en ese archivo
yan, y responda a lo siguiente: que pudieran incluirse en la tabla Big Eight? Cmo alte-
1. Cmo afecta la percepcin que usted tiene de sus nego- raran estos nuevos datos su percepcin de las afirmacio-
cios la presentacin de la informacin general acerca de nes de StockTout?
StockTout en esta pgina? 4. StockTout se enorgullece de que los fondos Big Eight
2. La afirmacin de tener ms ganadores que perdedores es han ganado valor en los ltimos cinco aos. Est de
una reflexin justa y precisa sobre la calidad de su servi- acuerdo en que deben estar orgullosos de sus elecciones?
cio de inversin? Si no lo cree as, ofrezca una presenta- Por qu s o por qu no?
cin alternativa que considere justa y precisa.

REFERENCIAS
1. Huff, D., How to Lie with Statistics (Nueva York: Norton, 6. Tufte, E.R., The Visual Display of Quantitative Information,
1954). 2a. ed. (Cheshire, CT: Graphics Press, 2002).
2. Microsoft Excel 2003 (Redmond, WA: Microsoft Corpora- 7. Tufte, E.R., Visual Explanations (Cheshire, CT: Graphics
tion, 2002). Press, 1997).
3. Minitab for Windows Version 14 (State College; PA: Mi- 8. Wainer, H., Visual Revelations: Graphical Tales of Fate
nitab Inc., 2004). and Deception from Napoleon Bonaparte to Ross Perot
4. SPSS Base 12.0 Brief Guide (Upper Saddle River, NJ: (Nueva York: Copernicus/Springer-Verlag, 1997).
Prentice Hall, 2003).
5. Tufte, E.R., Envisioning Information (Cheshire, CT:
Graphics Press, 1990).

Apndice 2 Uso del software


para tablas y grficas
A2.1 EXCEL trabajo MUTUALFUNDS2004.xls en Datos. Seleccione Datos
Informe de tablas y grficos dinmicos (Datos Informe
Puede usar Excel para crear muchas de las tablas y grficas ex-
de tablas dinmicas en Excel 97) y haga estas elecciones en
plicadas en este captulo. Si no ha ledo an el apndice 1.2 In-
las ventanas de dilogo del Asistente de tablas y grficos din-
troduccin a Excel, en la pgina 13, debe hacerlo ahora.
micos:

Tablas de resumen
Paso 1: Seleccione la lista Excel o la opcin Datos y la op-
Use el Asistente para tablas y grficos dinmicos para generar cin Informe de tablas y grficos dinmicos (si apa-
una tabla de resumen. Si no est familiarizado con las Tablas rece) y d clic en Siguiente.
dinmicas, primero lea Uso del Asistente para tablas y grfi- Paso 2: Ingrese J1:J122 como Rango y d clic en Siguiente.
cos dinmicos (vea el apndice F). Para generar una tabla Paso 3: Seleccione la opcin Hoja de clculo nueva y d clic
de resumen similar a la tabla 2.2 en la pgina 23, abra la hoja de en el botn de Diseo.
64 CAPTULO 2 Presentacin de datos en tablas y grficas

En la ventana de dilogo de Diseo, primero mue- Paso 3: Seleccione las opciones de formato y rtulos de grfico
va una copia de la pestaa Riesgo al rea de FILA. para la grfica. (Vea Uso del Asistente para grficos
Despus mueva la segunda copia de la pestaa Riesgo de Excel en la pgina 15 para sugerencias.) D clic
al rea de DATOS, lo que cambia la pestaa a Conteo en Siguiente.
de riesgo. D clic en Aceptar para regresar a la ven-
Paso 4: Seleccione En una hoja nueva y d clic en Finalizar.
tana de dilogo principal del paso 3 y d clic en el bo-
Si aparecen botones de campo en la grfica, d un clic
tn de Opciones para continuar.
derecho en cualquier botn del campo y seleccione
En la ventana de dilogo de Opciones para la tabla
Ocultar botones de campo grfico dinmico del
dinmica, ingrese un nombre autodescriptivo para la
men corto.
tabla en el cuadro de edicin Nombre y 0 en el cua-
dro de edicin Mostrar para celdas vacas. D clic O Vea la seccin G.1 (Grficos y tablas de una variable) si
en Aceptar para regresar a la ventana de dilogo prin- desea que PHStat2 genere para usted un diagrama de Pareto co-
cipal del paso 3. mo una grfica de Excel. (No hay comandos en Excel que gene-
D clic en Finalizar en la ventana de dilogo ren directamente un diagrama de Pareto.)
principal del paso 3 para producir la tabla dinmica.
Arreglo ordenado
Renombre la nueva hoja de trabajo con un nombre autodescrip- Organice su hoja de trabajo para que cada variable aparezca en
tivo. (Puede cerrar cualquier barra de herramientas o ventanas su propia columna, ingrese un ttulo de la variable columna
que aparezcan sobre la tabla dinmica para mejorar la visuali- en la fila 1 y los valores para la variable iniciando en la fila 2.
zacin.) (ste es el formato de los archivos Excel incluidos en el CD-
Para agregar una columna de porcentaje, ingrese Porcen- ROM que acompaa este texto.) Seleccione Datos Ordenar.
taje en la celda C4 de la nueva hoja de trabajo e ingrese la En la ventana de dilogo de Ordenar, seleccione la variable a
frmula =B5/B$8 en la celda C5. Copie esta frmula hacia aba- ordenar de la lista hacia abajo Ordenar por. Seleccione el pri-
jo hasta la celda C7. Formatee el rango de celda C5:C7 para mer botn de la opcin Ascendente o Descendente, deje selec-
mostrar el porcentaje. Ajuste el nmero de decimales mostra- cionado el botn Encabeza fila y d clic en Aceptar.
dos y el ancho de la columna C si desea generar una tabla simi-
lar a la de la figura A2.1. Diagrama de tallo y hojas
Vea la seccin G2 (Diagrama de tallo y hojas) si desea que
PHStat2 genere un diagrama de tallo y hojas como grfica de
Excel. (No hay comandos en Excel que generen directamente
estos diagramas.)
Distribuciones de frecuencias e histogramas
Use el Data Analysis Toolpak para crear distribuciones de fre-
cuencias e histogramas. Abra la hoja de trabajo que contenga los
datos que desee resumir. Seleccione Herramientas Anlisis
FIGURA A2.1 Tabla de resumen completa. de datos. De la lista que aparece en la ventana de dilogo de
Anlisis de datos, seleccione Histograma y d clic en Aceptar.
En la ventana de dilogo de Histograma (vea la figura A2.2) in-
O Vea la seccin G.1 (Tablas y grficas de una variable) si
desea que el PHStat2 genere una tabla de resumen para usted.

Grfica de barras o de pastel


Use el Asistente para grficos de Excel para generar una grfi-
ca de barra o de pastel. Si no est familiarizado con este asisten-
te, lea antes Uso del Asistente para grficos de Excel (pgina
15). Primero cree una tabla de resumen de la tabla dinmica.
Con la tabla en pantalla, d clic en una celda fuera de la tabla,
seleccione Insertar Grfica y haga las siguientes entradas
en las ventanas de dilogo del Asistente grfico:
Paso 1: D clic en Barra (para una grfica de barra) o en Pas-
tel en la ventana Tipos estndar Tipo de grfico y
deje seleccionado el primerSubtipo de grfico. D
clic en Siguiente.
Paso 2: Con el cursor parpadeante en la ventana Rango de
datos, d clic en la tabla dinmica para que Excel lle-
ne la direccin de la tabla dinmica por usted. D clic FIGURA A2.2 Ventana de dilogo del histograma
en Siguiente. anlisis de datos.
Apndice 65

grese el rango de celda de los datos en Rango de entrada. Des- Paso 1: D clic en Barra en la ventana de Grficos de tipo
pus seleccione Rtulos si est utilizando datos que estn orde- estndar y deje el primer Subtipo de grfico selec-
nados como los datos en los archivos Excel del CD-ROM que cionado. D clic en Siguiente.
acompaa a este texto. Por ltimo, seleccione Resultado de la
Paso 2: Con el cursor parpadeando en la ventana de Rango de
grfica y d clic en Aceptar. (Vea la seccin G.3 [Histogra-
datos, d clic en Tabla dinmica para que Excel llene
mas y polgonos] para una explicacin sobre el Bin Range.)
la direccin de la Tabla dinmica por usted. D clic en
La distribucin de frecuencias y el histograma aparecern
Siguiente.
juntos o en una hoja de trabajo separada.
Paso 3: Seleccione las opciones de formato y rtulo de grfica
O Vea la seccin G.3 (Histograma y polgonos) si desea que
para la grfica. (Vea Uso del Asistente para grficos
PHStat2 genere una distribucin de frecuencia y un histograma.
de Excel en la pgina 15 para sugerencias.) D clic
en Siguiente.
Polgonos de porcentaje y de porcentaje Paso 4: Seleccione Como una hoja nueva y d clic en Fina-
acumulado lizar. Si aparecen botones de campo en la grfica, d
Vea la seccin G.3 (Histograma y polgonos) si desea que un clic derecho en cualquier botn y elija Ocultar bo-
PHStat2 genere polgonos de porcentaje y de porcentajes acumu- tones de campo grfico dinmico del men corto.
lados como grficas de Excel. (No hay comandos de Excel que
produzcan directamente polgonos de porcentaje y de porcenta- O Vea la seccin G.4 (Tablas y grficas bivariadas) si desea
je acumulado.) que PHStat2 genere una tabla de resumen de dos variables y
una grfica agrupada.

Tablas de contingencia y grficas


de barras agrupadas Diagrama de dispersin
Use los Asistentes de grficos dinmicos y de Grficos para Use el Asistente para grficos para generar un diagrama de dis-
crear tablas de contingencia y una grfica de barras agrupadas. persin. Para crear un diagrama de dispersin similar al de la fi-
Para crear una tabla de contingencia similar a la tabla 2.14 de la gura 2.15 de la pgina 47, abra la hoja de trabajo de MUTUAL-
pgina 44, abra la hoja de trabajo MUTUALFUNDS2004.XLS en FUNDS2004.XLS en Datos. Seleccione Insertar Grfico, y
Datos. Seleccione Datos Informe de tablas y grficos di- haga las siguientes entradas en las ventanas de dilogo del Asis-
nmicos (Datos Informe de tabla dinmica en Excel 97) y tente grfico:
realice las siguientes entradas en la ventana de dilogo del Asis-
tente de tablas y grficos dinmicos: Paso 1: D clic en XY (Dispersin) de la ventana de Grfi-
cos tipo estndar y deje seleccionado el primer Sub-
Paso 1: Seleccione la opcin lista de Excel o base de datos y tipo grfico. D clic en Siguiente.
la opcin (si aparece) Tabla dinmica, y d clic en
Siguiente. Paso 2: Ingrese F1:G122 en la ventana de Rango de da-
tos, seleccione la opcin Columnas y d clic en Si-
Paso 2: Ingrese C1:J122 como Rango y d clic en Siguiente. guiente.
Paso 3: Seleccione la opcin Hoja de trabajo nueva y d clic Paso 3: Seleccione las opciones de formato y rtulo de grfico
en el botn Diseo. para la grfica. (Vea Uso del Asistente para grficos de
En la ventana de dilogo de Diseo, primero mue- Excel en la pgina 15 para sugerencias.) D clic en
va una copia del rtulo Objetivo hacia el rea de FI- Siguiente.
LA. Despus mueva una segunda copia del rtulo
Objetivo al rea de DATOS, lo que cambiar el rtu- Paso 4: Seleccione Como una hoja nueva y d clic en Fina-
lo a Cuenta de objetivo. Mueva una copia del rtulo lizar.
Riesgo al rea de COLUMNA. D clic en Aceptar Est al tanto de que el Asistente grfico siempre supone que la
para regresar al men principal de la ventana de dilo- primera columna de rango de datos (columna F en este ejem-
go del Paso 3 y d clic en el botn de Opciones para plo) contiene los datos de la variable X. Si tiene una hoja en la
continuar. que los datos de la variable Y aparecen primero, entonces nece-
En la ventana de dilogo de las Opciones de tabla sitar reordenar las columnas (o copiarlas en orden en una nue-
dinmica, ingrese un nombre autodescriptivo para la va hoja) antes de usar el Asistente grfico.
tabla en el cuadro de edicin Nombre y 0 en el cuadro
de edicin Mostrar para celdas vacas. D clic en
Aceptar para regresar a la ventana de dilogo princi-
pal del paso 3 para generar la tabla dinmica. A2.2 MINITAB
Para crear una grfica de barras agrupadas, d clic en la celda Minitab se utiliza para crear muchas de las tablas y grficas de
fuera de la tabla bivariada, seleccione Insertar Grfica, y las que hablamos en este captulo. Si an no ha ledo el apndi-
realice las siguientes entradas en las ventanas de dilogo del ce 1.3, Introduccin al Minitab, en la pgina 17, debe hacerlo
Asistente grfico: ahora.
66 CAPTULO 2 Presentacin de datos en tablas y grficas

Reclasificar datos Grfica de barras


Los datos a menudo se ordenan para que los valores de las va- Para producir la grfica de barras en la figura 2.1, de la pgina
riables se apilen verticalmente hacia abajo en una columna. En 23, abra la hoja de trabajo ONLINESHOPPING.MTW. Seleccione
muchos casos se requiere analizar de forma separada los dife- Graph Bar Chart (Grfica Grfica de barras) y despus
rentes subgrupos en trminos de una variable numrica de inte- haga lo siguiente:
rs. Por ejemplo, en los datos de los fondos de inversin, tal vez
Paso 1: En la ventana de dilogo de Bar charts (vea la figura
usted quiera analizar de forma separada el porcentaje del rendi-
A2.4), en Bars represent: despliegue hacia abajo la
miento en 2003 de los fondos de crecimiento y de los fondos
lista, seleccione Values from a table (Valores de una
de valor. Esto se logra reclasificando la variable del porcentaje de
tabla) ya que se dan las frecuencias en cada categora.
rendimiento 2003, para que, en una columna, estn localizados
[Si est usando datos brutos como los de la hoja de
los porcentajes de rendimiento en 2003 de los fondos de creci-
trabajo MUTUALFUNDS2004.MTW, seleccione Counts
miento y, en otra, los porcentajes de rendimiento en 2003 de los
of unique values (Conteo de valores nicos) en la ven-
fondos de valor.
tana de dilogo de bars represent.] Seleccione Simple
Para lograr esto, abra la hoja de trabajo MUTUALFUNDS
(Sencilla) en la ventana de grficos. D clic en el bo-
2004.MTW. Select Data Unstack Columns (Seleccionar Da-
tn OK.
tos Reclasificar columnas). Despus haga lo siguiente:
Paso 1: En la ventana de dilogo con el ttulo Unstack Co-
lumns (vea la figura A2.3), ingrese C7 o Return 2003
(Rendimiento 2003) en el cuadro de edicin Unstack
the data in (Reclasificar los datos en).

FIGURA A2.3 Ventana de dilogo para reclasificar


columnas de Minitab.

FIGURA A2.4 Ventana de dilogo grficas de barras


Paso 2: Ingrese C3 u Objective (Objetivo) en el cuadro de de Minitab.
edicin Using Subscripts in: (Usar subndices en:)
Paso 3: Seleccione el botn de opcin After last column in
use (Despus de la ltima columna en uso). Seleccio- Paso 2: En la ventana con el ttulo Values from a table, One
ne el cuadro de exploracin Name the columns con- column of values, Simple (Valores de una tabla, una co-
taining the unstacked data (Nombre las columnas lumna de valores, Ventana de dilogo sencilla), como
que contienen los datos reclasificados). D clic en el la que aparece en la figura A2.5, ingrese C2 o Percen-
botn OK. Las nuevas variables Return2003_Growth tage (%) en el cuadro de edicin Graph Variables
y Return2003_Value estn ahora en las columnas C13 y (Variables de grfica). Ingrese C1 o Razn en el cua-
C14. Cambie los nombres de estas variables como lo dro de edicin de Categorical Variable (Variable cate-
desee. grica). D clic en el botn OK.
Apndice 67

tos de una hoja de trabajo. (Si utiliza las frecuencias


de cada categora como en la hoja de trabajo de ONLI-
NE SHOPPING.MTW, seleccione la opcin Chart va-
lues from a table (Valores para la grfica de una
tabla.) Ingrese C10 o Risk (Riesgo) en el cuadro de
edicin Categorical variables.
Paso 2: Seleccione el botn Labels (Rtulos). En la ventana
de dilogo con el ttulo Pie ChartLabels (vea la fi-
gura A2.7), seleccione la pestaa Slice Labels (Rtu-
los para rebanadas). Despus seleccione las ventanas
de dilogo Category name y Percent (Nombre de la
categora y Porcentaje). D clic en el botn OK para
regresar a la ventana de dilogo de Grfica de pastel.
D clic en el botn OK.
FIGURA A2.5 Grfica de barras Minitab: valores
de una tabla, una columna de valores, ventana de
dilogo sencilla.

Para seleccionar los colores de las barras y los lmites en la gr-


fica de barras:
Paso 1: D clic derecho en cualquiera de las barras de la grfi-
ca de barras.
Paso 2: Seleccione Edit bars (Editar barras).
Paso 3: En la pestaa Attributes (Atributos) de la ventana de
dilogo Edit Bars, ingrese las selecciones para Fill
Pattern, Border y Fill Lines (Llenar el patrn, Lmite
y Llenar lneas).

Grfica de pastel
Para generar una grfica de pastel similar a la de la figura 2.4 en
la pgina 25, abra la hoja de clculo MUTUALFUNDS 2004.MTW. FIGURA A2.7 Ventana de dilogo grfica de pastel
Seleccione Graph Pie Chart (Grfica Grfica de pastel). rtulos en Minitab.
Despus haga lo siguiente:
Paso 1: En la ventana de dilogo con el ttulo Pie Chart (vea la
figura A2.6), seleccione la opcin Chart raw data
(Grfica datos brutos), ya que est usando datos bru- Diagrama de Pareto
Para generar el diagrama de Pareto de la figura 2.6 en la pgina
27, abra la hoja de trabajo KEYBOARD.MTW. Este conjunto de
datos contiene las causas de los defectos en la columna C1 y la
frecuencia de los defectos en la columna C2. Seleccione Stat
Quality Tools Pareto Chart (Stat Herramientas de Cali-
dad Diagrama de Pareto). En la ventana de dilogo del dia-
grama de Pareto (vea la figura A2.8).
Paso 1: Seleccione la opcin Chart defects table (Tabla de
defectos de grfica).
Paso 2: En el cuadro de edicin Labels in, ingrese C1 o Cau-
se (Causa).
Paso 3: En el cuadro de edicin Frequencies in, ingrese C2 o
Frequency (Frecuencia).
Paso 4: En la ventana Combine defects after the first (Combi-
nar defectos despus de), ingrese 99.9.
FIGURA A2.6 Ventana de dilogo para grficas
de pastel de Minitab. Paso 5: D clic en el botn OK.
68 CAPTULO 2 Presentacin de datos en tablas y grficas

FIGURA A2.8 Ventana de dilogo para el diagrama


de Pareto en Minitab.

Si la variable de inters estaba localizada en una nica columna FIGURA A2.10 Ventana de dilogo para histogramas
y est en forma bruta con cada fila indicando un tipo de error, de- en Minitab.
ber seleccionar la opcin Chart defects data in (Datos de
defectos de grfica en), e ingresar el nmero de columna apro- Paso 2: En la ventana de dilogo Histogram-Simple (vea la fi-
piado o el nombre de la variable en la ventana correspondiente. gura A2.11), ingrese C7 o Return 2003 en el cuadro
de edicin Graph Variables. D clic en el botn OK.
Diagrama de tallo y hojas
Para generar un diagrama de tallo y hojas del rendimiento en
2003 de todos los fondos de inversin, abra la hoja de trabajo
MUTUALFUNDS2004.MTW. Seleccione Graph Stem-and-
Leaf (Grfica Tallo y hojas). En la ventana de dilogo Stem-
and-Leaf (vea la figura A2.9), ingrese C7 o Return 2003 en el
cuadro de edicin Graph Variables. D clic en el botn OK.

FIGURA A2.11 Ventana de dilogo histograma-


simple de Minitab.

Para seleccionar los colores para las barras y los bordes en los
histogramas,
Paso 1: D un clic derecho en cualquiera de las barras del his-
tograma.
FIGURA A2.9 Ventana de dilogo para diagrama
Paso 2: Seleccione Edit bars.
de tallo y hojas en Minitab.
Paso 3: En la pestaa de Attributes de la ventana de dilogo
Histograma de Edit Bars, ingrese las selecciones para llenar patro-
nes, bordes y rellenar filas.
Para generar el histograma de los rendimientos en 2003 de to-
Paso 4: Para definir sus propios agrupamientos de clase, se-
dos los fondos de inversin, abra la hoja de trabajo MUTUAL-
leccione la pestaa Binning. Seleccione la opcin
FUNDS2004.MTW. Seleccione Graph Histogram (Grfica
Midpoint (Punto medio) para especificar los puntos
Histograma).
medios o la opcin Cutpoints (Puntos lmite) para es-
Paso 1: En la ventana de dilogo de Histograms (vea la figura pecificar los lmites de clase. Seleccione la opcin
A2.10) seleccione Simple. D clic en el botn OK. Midpoint/Cutpoint positions. Ingrese el conjunto de
valores en el cuadro de edicin.
Apndice 69

Si desea crear histogramas separados para los fondos de creci-


miento y de valor similares a los de la figura 2.9, en la pgina
38, primero debe reclasificar los datos (vea la pgina 66) y
crear variables separadas para el rendimiento en el ao 2003 de
los fondos de crecimiento y de valor. Entonces podr crear his-
togramas separados para cada uno de los dos grupos.

Tabla de contingencia
Para generar tablas de contingencia similares a las tablas 2.14 a
2.17 de la pgina 44, abra la hoja de trabajo MUTUALFUNDS
2004.MTW. Seleccione Stat Tables Cross Tabulation (Ta-
blas de contingencia) y Chi-Square (Chi-cuadrada).
Paso 1: En la ventana de dilogo Cross Tabulation y Chi-
Square (vea la figura A2.12), ingrese C3 u Objective FIGURA A2.13 Ventana de dilogo para grficas de
en la ventana de editar For rows (para las filas). Ingre- barra Minitab: conteo de valores nicos, agrupar.
se C10 o Risk en el cuadro de edicin For columns
(para las columnas).
Paso 2: Seleccione los cuadros de exploracin de Counts, Diagrama de dispersin y diagrama
Row percents, Column percents y Total percents. de series de tiempo
D clic en el botn OK.
Para generar un diagrama de dispersin de la proporcin de
gasto del rendimiento en 2003 de los fondos de inversin (vea
la figura 2.15 en la pgina 47), abra la hoja de trabajo MUTUAL-
FUNDS2004.MTW. Seleccione Graph Scatterplot (Diagrama
de dispersin).
Paso 1: En la ventana de dilogo Scatterplots (vea la figura
A2.14), seleccione Simple. D clic en el botn OK.

FIGURA A2.12 Ventana de dilogo Minitab


de tablas de contingencia y chi-cuadrada.

Grfica de barras agrupadas


Para generar una grfica de barras agrupadas similar a la de la
figura 2.14 en la pgina 45, abra la hoja de trabajo MUTUAL-
FUNDS2004.MTW. Seleccione Graph Bar Chart.

Paso 1: En la ventana de dilogo de Bar Charts (vea la figura FIGURA A2.14 Ventana de dilogo para diagramas
A2.4 en la pgina 66), en Bars represent, despliegue de dispersin en Minitab.
la lista hacia abajo, seleccione Counts of unique va-
lues puesto que est usando valores brutos. Seleccio-
ne la grfica Cluster (Agrupada). D clic en el botn
Paso 2: En la ventana de dilogo con el ttulo Scatterplot-
OK.
Simple (vea la figura A2.15), ingrese C7 o Return
Paso 2: En la ventana con el ttulo Bar chart-Counts of unique 2003 en el cuadro de edicin de las variables Y en la
values, Cluster (vea la figura A2.13), ingrese C3 u fila 1. Ingrese C6 o Expense ratio (Proporcin de
Objective y C10 o Risk en el cuadro de edicin Cate- gastos) en el cuadro de edicin de las variables X en
gorical variables. D clic en el botn OK. la fila 1. D clic en el botn OK.
70 CAPTULO 2 Presentacin de datos en tablas y grficas

Para crear un diagrama de series de tiempo, utilice el eje X para


el tiempo y el eje Y para la variable de inters.

FIGURA A2.15 Ventana de dilogo diagrama


de dispersin-simple de Minitab.
CAPTULO 3
Medidas numricas descriptivas

USO DE LA ESTADSTICA: Evaluacin de los rendimientos de los fondos de inversin

3.1 MEDIDAS DE TENDENCIA CENTRAL, Varianza y desviacin estndar


VARIACIN Y FORMA poblacionales
La media La regla emprica
La mediana La regla de Chebyshev
La moda
3.3 ANLISIS EXPLORATORIO DE DATOS
Cuartiles
Resumen de cinco nmeros
La media geomtrica
Grfica de caja y bigote
Rango
Rango intercuartil 3.4 LA COVARIANZA Y EL COEFICIENTE
La varianza y la desviacin estndar DE CORRELACIN
Coeficiente de variacin La covarianza
Puntuaciones Z Coeficiente de correlacin
Forma 3.5 ERRORES EN LAS MEDIDAS NUMRICAS
Exploraciones visuales: Exploracin de la DESCRIPTIVAS Y CONSIDERACIONES
estadstica descriptiva TICAS
Resultado de la estadstica descriptiva en Excel
Resultado de la estadstica descriptiva en Minitab A.3 USO DE SOFTWARE PARA LA
ESTADSTICA DESCRIPTIVA
3.2 MEDIDAS NUMRICAS DESCRIPTIVAS A3.1 Excel
DE UNA POBLACIN A3.2 Minitab
La media poblacional A3.3 SPSS (tema del CD-ROM)

OBJETIVOS DE APRENDIZAJE
En este captulo, aprender:
A describir las propiedades de tendencia central, variacin y
forma de los datos numricos
A calcular las medidas descriptivas de una poblacin
A construir e interpretar una grfica de caja y bigote
A describir la covarianza y el coeficiente de correlacin
72 CAPTULO 3 Medidas numricas descriptivas

U S O D E L A E S TA D S T I C A
Evaluacin de los rendimientos de los fondos
de inversin
Retomemos el estudio de los fondos de inversin presentado en el captulo 2.
Usted debe decidir en qu clases de fondos invertir. En el captulo anterior se
estudi cmo presentar datos en tablas y grficas. Sin embargo, al ocuparse
de datos numricos como el rendimiento de las inversiones en los fondos de
inversin durante 2003, tambin necesita resumir los datos y plantear pregun-
tas estadsticas. Cul es la tendencia central del rendimiento de los diversos
fondos? Por ejemplo, cul fue el rendimiento promedio de los fondos de in-
versin con riesgo bajo, medio y alto durante 2003? Qu tanta variabilidad
hay en los rendimientos? El rendimiento de los fondos de alto riesgo vara
ms que el correspondiente a los de riesgo promedio o bajo? Cmo puede
utilizar esta informacin al decidir en cules fondos invertir?

ara las variables numricas, usted necesita ms que la simple imagen visual de una variable
P obtenida a partir de las grficas analizadas en el captulo 2. Por ejemplo, a usted le gustara de-
terminar no slo si durante 2003 los fondos ms riesgosos tuvieron un rendimiento superior, sino
tambin si tuvieron ms variacin y cmo se distribuyeron en cada grupo de riesgo. Tambin desea
examinar si existe alguna relacin entre el coeficiente de gastos y los rendimientos de 2003. La lec-
tura de este captulo le permitir aprender sobre algunos mtodos de medicin:

Tendencia central, es la medida que describe cmo todos los valores de los datos se agrupan
en torno a un valor central.
Variacin, es la cantidad de disgregacin o dispersin de los valores con respecto a un valor
central.
Forma, es el patrn de distribucin de los valores desde el menor hasta el mayor.

Tambin aprender sobre la covarianza y el coeficiente de correlacin, que ayudan a medir la fuerza
de asociacin entre dos variables numricas.

3.1 MEDIDAS DE TENDENCIA CENTRAL,


VARIACIN Y FORMA
Es posible caracterizar cualquier conjunto de datos numricos por la medicin de su tendencia cen-
tral, variacin y forma. La mayora de los conjuntos de datos presentan una tendencia central a agru-
parse en torno a un valor central. Cuando la gente habla de un promedio, o valor medio, o del
valor ms comn o frecuente, se refiere de manera informal a la media, la mediana y la moda, tres
medidas de tendencia central.
La variacin mide la distribucin o dispersin de valores que conforman el conjunto de datos.
Una medida simple de la variacin es el rango, que es la diferencia entre los valores mximo y m-
nimo. En la estadstica, son de uso ms comn la desviacin estndar y la varianza, dos medidas que
se explican ms adelante en esta seccin. La forma de un conjunto de datos representa un patrn pa-
ra todos los valores, desde el mnimo hasta el mximo. Como se observar ms adelante en esta sec-
cin, muchos conjuntos de datos tienen un patrn semejante a una campana, cuya cima de valores
est en alguna parte del centro.
3.1: Medidas de tendencia central, variacin y forma 73

La media
La media aritmtica (por lo general llamada la media) es la medida ms comn de la tendencia
central. La media es la medida ms comn en la que todos los valores desempean el mismo papel.
La media sirve como punto de equilibrio del conjunto de datos (como el punto de apoyo de un ba-
lancn). La media se calcula sumando todos los valores del conjunto de datos y dividiendo el resul-
tado por el nmero de valores considerados.
, llamado X testada. Si se con-
Para representar a la media de una muestra, utilice el smbolo X
sidera una muestra que contiene n valores, la ecuacin de su media se escribe como:

suma de los valores


X =
nmero de valores

Al utilizar la serie X1, X2, . . . , Xn para representar al conjunto de n valores y n para representar al
nmero de valores, la ecuacin se convierte en:

X1 + X 2 + L + X n
X =
n

Al utilizar la notacin de sumatoria (que se explica en el apndice B), reemplace el numerador


n
Xx + X2 + + Xn por el trmino X i , que significa la suma de todos los valores Xi desde el pri-
i =1
mer valor de X, que es Xl, hasta el ltimo valor de X, que es Xn , para formar la ecuacin (3.1), una
definicin formal de la media de una muestra.

MEDIA DE UNA MUESTRA


La media de una muestra es la suma de los valores dividida por el nmero de valores.
n
Xi
i =1
X = (3.1)
n
donde

X = media de la muestra
n = nmero de valores o tamao de la muestra
Xi = i-simo valor de la variable X
n
X i = sumatoria de todos los valores Xi de la muestra
i =1

Como todos los valores desempean un papel semejante, una media se ver muy afectada por
cualquier valor que difiera mucho de los dems en el conjunto de datos. Cuando tenga tales valores
extremos, debe evitar el uso de la media.
La media sugiere cul es un valor tpico o central del conjunto de datos. Por ejemplo, si usted
conoce el tiempo que le lleva arreglarse por las maanas, podr planear mejor su inicio del da y
reducir al mnimo cualquier retraso (o adelanto) para llegar a su destino. Suponga que define en mi-
nutos (redondeando al minuto ms cercano) el tiempo que le lleva arreglarse, desde que se levanta
hasta que sale de casa. A lo largo de 10 das hbiles consecutivos, usted recaba los tiempos que se
muestran a continuacin: TIMES

Da: 1 2 3 4 5 6 7 8 9 10
Tiempo (minutos): 39 29 43 52 39 44 40 31 44 35
74 CAPTULO 3 Medidas numricas descriptivas

El tiempo medio es 39.6 minutos, que se calcul como sigue:


suma de los valores
X =
nmero de valores
n
Xi
i =1
X =
n
39 + 29 + 43 + 52 + 39 + 44 + 40 + 31 + 44 + 35
X =
10
396
X = = 39.6
10
A pesar de que ni un solo da de la muestra tuvo en realidad el valor de 39.6 minutos, asignar 40 mi-
nutos a su arreglo personal sera un buen criterio para planear su inicio del da, pero slo porque esos
10 das no contienen ningn valor extremo.
Compare lo anterior con el caso en que el valor del cuatro da fue de 102 minutos en lugar de
52. Este valor extremo provocara que la media aumentara a 44.6 minutos, como se observa a conti-
nuacin:
suma de los valores
X =
nmero de valores
n
Xi
i =1
X =
n
446
X = = 44.6
10
Un valor extremo elev la media en ms del 10%, de 39.6 a 44.6 minutos. En contraste con la media
original, que estaba en medio, mayor que cinco de los tiempos (y menor que los otros cinco), la
nueva media es mayor que 9 de los 10 tiempos de arreglo. El valor extremo provoc que la media
sea una mala medida de tendencia central.

EJEMPLO 3.1 EL RENDIMIENTO MEDIO EN 2003 DE LOS FONDOS DE INVERSIN


PARA PEQUEOS CAPITALES
Los 121 fondos de inversin que forman parte del escenario Uso de la estadstica (vea la pgina
72), se clasifican de acuerdo con el nivel de riesgo (bajo, medio y alto) y el tamao del capital inver-
tido (pequeo, mediano y gran capital). Calcule el rendimiento medio en 2003 de los fondos de in-
versin de alto riesgo para capitales reducidos.
SOLUCIN
El rendimiento medio en 2003 de los fondos de inversin para capitales reducidos (MUTUAL-
FUNDS2004) es 51.53 calculados de la siguiente manera:

suma de los valores


X =
nmero de valores
n
Xi
i =1
=
n
463.8
= = 51.53
9
El arreglo ordenado de los nueve fondos de inversin de alto riesgo para pequeos capitales es:
37.3 39.2 44.2 44.5 53.8 56.6 59.3 62.4 66.5
Cuatro de estos rendimientos estn por debajo de la media de 51.53, y cinco estn por encima de ella.
3.1: Medidas de tendencia central, variacin y forma 75

La mediana
La mediana es el valor que divide en dos partes iguales a un conjunto de datos ya ordenado. La me-
diana no se ve afectada por los valores extremos, de manera que puede utilizarse cuando estn pre-
sentes.

La mediana es el valor medio de un conjunto de datos ordenado de menor a mayor.

Para calcular la mediana del conjunto de datos, primero ordene los valores de menor a mayor.
Utilice la ecuacin (3.2) para calcular la clasificacin del valor que corresponde a la mediana.

MEDIANA
El 50% de los valores son menores que la mediana y el otro 50% son mayores.
n +1
Mediana = valor clasificado (3.2)
2

Calcule el valor de la mediana siguiendo una de las dos reglas siguientes:


Regla 1 Si en el conjunto de datos hay un nmero impar de valores, la mediana es el valor co-
locado en medio.
Regla 2 Si en el conjunto de datos hay un nmero par de valores, entonces la mediana es el
promedio de los dos valores colocados en medio.
Para calcular la mediana de la muestra de los 10 tiempos para arreglarse en las maanas, los tiempos
diarios se ordenan de la siguiente manera:

Valores ordenados:
29 31 35 39 39 40 43 44 44 52
Clasificacin:
1 2 3 4 5 6 7 8 9 10

Mediana = 39.5

Puesto que para esta muestra de 10 elementos el resultado de dividir n + 1 por 2 es (10 + l)/2 = 5.5,
debe utilizarse la regla 2 y promediar los valores clasificados quinto y sexto, 39 y 40. Por lo tanto, la
mediana es 39.5. Una mediana de 39.5 significa que la mitad de los das, el tiempo necesario para
arreglarse es menor o igual que 39.5 minutos, y la otra mitad de los das es mayor o igual que 39.5
minutos. Esta mediana de 39.5 minutos es muy cercana a la media del tiempo para arreglarse de
39.6 minutos.

EJEMPLO 3.2 CLCULO DE LA MEDIANA DE UNA MUESTRA CON UN NMERO IMPAR


DE ELEMENTOS
Los 121 fondos de inversin que forman parte del escenario Uso de la estadstica (vea la pgina
72), se clasifican de acuerdo con el nivel de riesgo (bajo, medio y alto) y con el tamao del capital
invertido (pequeo, mediano y gran capital). Calcule la mediana del rendimiento en 2003 de los nue-
ve fondos de inversin de alto riesgo para pequeos capitales. MUTUALFUNDS2004
SOLUCIN
Puesto que para esta muestra de nueve elementos el resultado de dividir n + 1 por 2 es (9 + l)/2 = 5,
al utilizar la regla 1, la mediana es el valor clasificado como quinto. Ordene el porcentaje del rendi-
miento en 2003 de los nueve fondos de inversin de alto riesgo para pequeos capitales de menor a
mayor:
76 CAPTULO 3 Medidas numricas descriptivas

Valores ordenados:
37.3 39.2 44.2 44.5 53.8 56.6 59.3 62.4 66.5
Clasificacin:
1 2 3 4 5 6 7 8 9

Mediana

La mediana del rendimiento es 53.8. La mitad de estos fondos de inversin tienen rendimientos
iguales o menores que 53.8 y la otra mitad tiene rendimientos iguales o superiores.

La moda
La moda es el valor del conjunto de datos que aparece con mayor frecuencia. Al igual que en la me-
diana y a diferencia de la media, los valores extremos no afectan a la moda. Usted slo debe utilizar
la media con propsitos descriptivos, ya que vara ms de una muestra a otra que la media o la me-
diana. Con frecuencia, en un conjunto de datos no existe moda, o bien, hay varias modas. Por ejem-
plo, considere los datos de tiempo para arreglarse que se muestran a continuacin.

29 31 35 39 39 40 43 44 44 52

Existen dos modas, 39 y 44 minutos, ya que cada uno de estos valores aparece dos veces.

EJEMPLO 3.3 CLCULO DE LA MODA


El gerente de sistemas encargado de la red de una empresa lleva un registro del nmero de fallas del
servidor que se presentan por da. Calcule la moda de los siguientes datos, que representan el nme-
ro de fallas diarias del servidor durante las ltimas dos semanas.

1 3 0 3 26 2 7 4 0 2 3 3 6 3
SOLUCIN
El arreglo ordenado de estos datos es:

0 0 1 2 2 3 3 3 3 3 4 6 7 26

Como el 3 aparece cinco veces, ms que ningn otro valor, la moda es 3. De esta forma, el gerente
de sistemas se dar cuenta de que la situacin ms comn es la presencia de tres fallas del servidor
al da. Para este conjunto de datos, la mediana tambin es igual a 3, mientras que la media es de 4.5.
El valor extremo de 26 es atpico. Con estos datos, la mediana y la moda miden la tendencia central
mejor que la moda.

Un conjunto de datos no tiene moda cuando ninguno de los valores es ms frecuente. En el ejem-
plo 3.4 aparece un conjunto de datos sin moda.

EJEMPLO 3.4 DATOS SIN MODA


Calcule la moda del rendimiento medio en 2003 de los fondos de inversin de alto riesgo para pe-
queos capitales. MUTUALFUNDS2004
SOLUCIN
El arreglo ordenado para estos datos es:

37.3 39.2 44.2 44.5 53.8 56.6 59.3 62.4 66.5

Estos datos no tienen moda. Ninguno de sus valores aparece con mayor frecuencia; cada uno apare-
ce slo una vez.
3.1: Medidas de tendencia central, variacin y forma 77

Cuartiles
Los cuartiles dividen a un conjunto de datos en cuatro partes iguales: el primer cuartil Q1 separa al
25.0%, que abarca a los valores ms pequeos, del 75.0% restante, constituido por los que son ma-
yores. El segundo cuartil Q2 es la mediana: 50.0% de sus valores son menores que la mediana y
50.0% son mayores. El tercer cuartil Q3 separa al 25.0%, que abarca a los valores ms grandes, del
1El Q1, la mediana y el Q3 75.0% restante constituido por los que son menores. Las ecuaciones (3.3) y (3.4) definen a los cuar-
tambin son el 25, 50 y 75 tiles primero y tercero.1
percentil, respectivamente.
Por lo general, las
ecuaciones (3.2), (3.3) y (3.4) PRIMER CUARTIL Q1
se expresan en trminos de El 25.0% de los valores son menores que el primer cuartil Q1, y el 75.0% son mayores que el pri-
clculo de percentiles: mer cuartil Q1.
percentil (p * 100) = valor
clasificado p * (n + 1). n+1
Q1 =  valor clasificado (3.3)
4

TERCER CUARTIL Q3
El 75.0% de los valores son menores que el tercer cuartil Q3, y el 25.0% son mayores que el ter-
cer cuartil Q3.

3(n + 1)
Q3 =  valor clasificado (3.4)
4

Para calcular los cuartiles, se utilizan las siguientes reglas:


Regla 1 Si el resultado es un nmero entero, entonces el cuartil es igual al valor clasificado.
Por ejemplo, si el tamao de la muestra es n = 7, el primer cuartil Q1 es igual a (7 + l)/4 = se-
gundo valor clasificado.
Regla 2 Si el resultado es una fraccin de mitad (2.5, 4.5, etctera), entonces el cuartil es igual
al promedio de los valores clasificados correspondientes. Por ejemplo, si el tamao de la mues-
tra es n = 9, el primer cuartil Q1 es igual al valor clasificado como (9 + l)/4 = 2.5, la mitad en-
tre los valores clasificados como segundo y tercero.
Regla 3 Si el resultado no es un nmero entero ni una fraccin de mitad, se redondea al entero
ms cercano y se selecciona ese valor clasificado. Por ejemplo, si el tamao de la muestra es n =
10, el primer cuartil Q1 es igual a (10 + l)/4 = valor clasificado como 2.75. Se redondea el 2.75
a 3 y se utiliza en valor clasificado como tercero.
Con el fin de ilustrar el clculo de los cuartiles para los datos referentes a los tiempos para arreglar-
se, se ordenan de menor a mayor.

Valores ordenados:
29 31 35 39 39 40 43 44 44 52
Clasificacin:
1 2 3 4 5 6 7 8 9 10

El primer cuartil es el valor clasificado como (n + l)/4 = (10 + 1)/4 = 2.75. Al emplear la tercera re-
gla de los cuartiles, redondeamos al tercer valor clasificado. Para los datos sobre el tiempo necesa-
rio para arreglarse, el valor clasificado como tercero es 35 minutos. Interprete el primer cuartil de 35
como que el 25% de los das el tiempo necesario para arreglarse es menor o igual a 35 minutos, y
que el 75% de los das ese tiempo es mayor o igual a 35 minutos.
El tercer cuartil es el valor clasificado como 3(n + l)/4 = 3(10 + l)/4 = 8.25. Empleando la ter-
cera regla de los cuartiles, redondeamos al valor clasificado como octavo. El valor clasificado como
octavo en los datos del tiempo necesario para arreglarse es de 44 minutos. Interprete esto como que
el 75% de los das, el tiempo necesario para arreglarse es menor o igual que 44 minutos, y que el
25% de los das ese tiempo es mayor o igual que 44 minutos.
78 CAPTULO 3 Medidas numricas descriptivas

EJEMPLO 3.5 CLCULO DE LOS CUARTILES


Los 121 fondos de inversin que forman parte del escenario Uso de la estadstica (vea la pgina
72), se clasifican de acuerdo con el nivel de riesgo (bajo, medio y alto) y el tamao de capital inver-
tido (pequeo, mediano y gran capital). Calcule el primer cuartil (Q1) y el tercer cuartil (Q3) del ren-
dimiento en 2003 de los fondos de inversin de alto riesgo para pequeos capitales. MUTUAL-
FUNDS2004

SOLUCIN
Ordenados de menor a mayor, los porcentajes de rendimiento de los nueve fondos de inversin de
alto riesgo para pequeos capitales durante 2003 son:

Valor clasificado:
37.3 39.2 44.2 44.5 53.8 56.6 59.3 62.4 66.5
Clasificacin:
1 2 3 4 5 6 7 8 9

Para estos datos:

(n + 1)
Q1 = valor clasificado
4
9 +1
= = 2.5 valor clasificado
4

Por lo tanto, al utilizar la segunda regla, resulta que Ql es el valor clasificado como 2.5, que es-
t justo a la mitad entre los valores clasificados como segundo y tercero. Como el valor clasificado
como segundo es 39.2 y el tercero es 44.2, el primer cuartil Q1 es el que est justo en medio de 39.2
y 44.2. De esta forma,

39.2 + 44.2
Q1 = = 41.7
2

Para encontrar el tercer cuartil Q3:

3(n + 1)
Q3 = valor clasificado
4
3(9 + 1)
= = 7.5 valor clasificado
4

As, al utilizar la segunda regla, Q3 es el valor clasificado entre los valores sptimo y octavo. Como
el valor clasificado como sptimo es 59.3 y el octavo es 62.4, el tercer cuartil Q3 es el que est justo
en medio de 59.3 y 62.4. De esta forma,

59.3 + 62.4
Q3 = = 60.85
2

Un primer cuartil de 41.7 seala que el 25% de los rendimientos obtenidos durante 2003 por los
fondos de alto riesgo para pequeos capitales fueron menores o iguales que 41.7, mientras que el
75% de ellos fueron mayores o iguales que 41.7. El tercer cuartil de 60.85 indica que el 75% de los
rendimientos obtenidos durante el mismo ao por los fondos de alto riesgo para pequeos capita-
les fueron menores o iguales que 60.85 y que el 25% fueron mayores o iguales que 60.85.
3.1: Medidas de tendencia central, variacin y forma 79

La media geomtrica
La media geomtrica y la razn geomtrica de rendimiento miden el estado de una inversin en el
tiempo. La media geomtrica mide la razn de cambio de una variable en el tiempo. La ecuacin
3.5 define a la media geomtrica.

MEDIA GEOMTRICA
La media geomtrica es la raz n-sima del producto de n valores
(3.5)

La ecuacin 3.6 define a la media geomtrica de la tasa de rendimiento.

MEDIA GEOMTRICA DE LA TASA DE RENDIMIENTO


RG = [(1 + R1 ) (1 + R2 ) L (1 + Rn )]1/ n 1 (3.6)

donde Ri es la tasa de rendimiento durante el periodo i

Para ilustrar el uso de estas medidas, considere una inversin de $100,000 que se reduce hasta tener
un valor de $50,000 al final del ao 1 y luego recupera su valor original de $100,000 al finalizar el
ao 2. La tasa de rendimiento de esta inversin en el periodo de dos aos es 0, porque los valores ini-
cial y final permanecen sin cambio. Sin embargo, la media aritmtica de las tasas de rendimiento
anuales de esta inversin es

( 0.50 ) + (1.00 )
X = = 0.25 o 25%
2

ya que la tasa de rendimiento del ao 1 es

50, 000 100, 000


R1 = = 0 5 0
100, 000

y la tasa de rendimiento del ao 2 es

100, 000 50, 000


R2 = = 1 00
50, 000

Al utilizar la ecuacin (3.6), se sabe que la media geomtrica de la tasa de rendimiento para los dos
aos es

RG = [(1 + R1 ) (1 + R2 )]1/ n 1
= [(1 + ( 0.50 )) (1 + (1.0 ))]1/ 2 1
= [(0.50 ) ( 2.0 )]1/ 2 1
= [1.0 ]1/ 2 1
= 11 = 0

Por lo tanto, la media geomtrica de la tasa de rendimiento refleja con mayor exactitud el cambio
(cero) del valor de la inversin durante el periodo de dos aos de la media aritmtica.
80 CAPTULO 3 Medidas numricas descriptivas

EJEMPLO 3.6 CALCULE LA MEDIA GEOMTRICA DE LA TASA DE RENDIMIENTO


El porcentaje de cambio del ndice compuesto NASDAQ fue del 31.53% en 2002 y del +50.01% en
2003. Calcule la tasa geomtrica de rendimiento.
SOLUCIN
Al utilizar la ecuacin (3.6), se sabe que la media geomtrica de la tasa de rendimiento del ndice
NASDAQ para los dos aos es

RG = [(1 + R1 ) (1 + R2 )]1/ n 1
= [(1 + ( 0.3153)) (1 + (0.5001))]1/ 2 1
= [(0.6847) (1.5001)]1/ 2 1
= [1.0271]1/ 2 1
= 1.0135 1 = 0.0135

La media geomtrica de la tasa de rendimiento del ndice NASDAQ para los dos aos es del 1.35%.

Rango
El rango es la medida numrica descriptiva ms sencilla de la variacin en un conjunto de datos.

RANGO
El rango es igual al valor mayor menos el valor menor.
Rango = Xmayor Xmenor (3.7)

Para determinar el rango de los tiempos necesarios para arreglarse, los datos se ordenan de menor a
mayor:

29 31 35 39 39 40 43 44 44 52

Al emplear la ecuacin (3.7), se sabe que el rango es de 52 29 = 23 minutos. Un rango de 23 mi-


nutos seala que la mayor diferencia del tiempo necesario para arreglarse por la maana entre dos
das cualesquiera es de 23 minutos.

EJEMPLO 3.7 CALCULE EL RANGO DEL RENDIMIENTO EN 2003 DE LOS FONDOS


DE INVERSIN DE ALTO RIESGO PARA PEQUEOS CAPITALES
Los 121 fondos de inversin que forman parte del escenario Uso de la estadstica (vea la pgina
72), se clasifican de acuerdo con el nivel de riesgo (bajo, medio y alto) y el tamao del capital inver-
tido (pequeo, mediano y gran capital). Calcule el rango del rendimiento en 2003 de los nueve fon-
dos de inversin de alto riesgo para pequeos capitales. MUTUALFUNDS2004
SOLUCIN
Ordenados de menor a mayor, los rendimientos en 2003 de los nueve fondos de inversin de alto
riesgo para pequeos capitales son:

37.3 39.2 44.2 44.5 53.8 56.6 59.3 62.4 66.5

Por lo tanto, al utilizar la ecuacin 3.7, se sabe que el rango = 66.5 37.3 = 29.2.
La mayor diferencia entre dos rendimientos cualesquiera de los fondos de inversin de alto
riesgo para pequeos capitales es de 29.2.
3.1: Medidas de tendencia central, variacin y forma 81

El rango mide la distribucin total del conjunto de datos. Aunque el rango es una medida sim-
ple de la variacin total de los datos, no toma en cuenta cmo se distribuyen los datos entre los valo-
res menor y mayor. En otras palabras, el rango no indica si los valores estn distribuidos de manera
uniforme a todo lo largo del conjunto de datos, agrupados cerca de la parte media, o agrupados cer-
ca de uno o ambos extremos. De esta manera, resulta engaoso utilizar el rango como medida de la
variacin cuando al menos uno de los valores es extremo.

Rango intercuartil
El rango intercuartil (tambin llamado dispersin media) es la diferencia entre el tercer y primer
cuartil de un conjunto de datos.

RANGO INTERCUARTIL
El rango intercuartil es la diferencia entre los cuartiles tercero y primero.
Rango intercuartil = Q3 Ql (3.8)

El rango intercuartil mide la dispersin en la mitad (parte central) de los datos, as que no se ve
influido por los valores extremos. Para determinar el rango intercuartil de los tiempos necesarios pa-
ra arreglarse

29 31 35 39 39 40 43 44 44 52

utilice la ecuacin (3.8) y los resultados obtenidos en la pgina 77, Ql = 35 y Q3 = 44.

Rango intercuartil = 44 35 = 9 minutos

Por lo tanto, el rango intercuartil del tiempo necesario para arreglarse es de 9 minutos. Por lo gene-
ral, al intervalo de 35 a 44 se le denomina la mitad media.

EJEMPLO 3.8 CALCULE EL RANGO INTERCUARTIL DEL RENDIMIENTO EN 2003 DE LOS


FONDOS DE INVERSIN DE ALTO RIESGO PARA PEQUEOS CAPITALES
Los 121 fondos de inversin que forman parte del escenario Uso de la estadstica (vea la pgina
72), se clasifican de acuerdo con el nivel de riesgo (bajo, medio y alto) y el tamao del capital inver-
tido (pequeo, mediano y gran capital). Calcule el rango intercuartil del rendimiento en 2003 de los
fondos de inversin de alto riesgo para pequeos capitales. MUTUALFUNDS2004
SOLUCIN
Ordenados de menor a mayor, los rendimientos de los nueve fondos de inversin de alto riesgo para
pequeos capitales durante 2003 son:

37.3 39.2 44.2 44.5 53.8 56.6 59.3 62.4 66.5

Utilice la ecuacin 3.8 y los resultados obtenidos en la pgina 78, Ql = 41.7 y Q3 = 60.85.

Rango intercuartil = 60.85 41.7 = 19.15

As, el rango intercuartil de los rendimientos en 2003 es de 19.15.

Como el rango intercuartil no toma en cuenta ningn valor menor que Q1 ni mayor que Q3, no
se ve afectado por los valores extremos. Las medidas de resumen como la mediana, Q1, Q3, y el ran-
go intercuartil, que no reciben la influencia de valores extremos, se denominan medidas resistentes.
82 CAPTULO 3 Medidas numricas descriptivas

La varianza y la desviacin estndar


A pesar de que el rango y el rango intercuartil son medidas de la variacin, no contemplan cmo se
distribuyen o se agrupan los valores que estn entre los extremos. La varianza y la desviacin es-
tndar son dos medidas de la variacin muy utilizadas para tomar en cuenta cmo se distribuyen los
datos. Estos estadsticos miden la dispersin promedio alrededor de la media, es decir, qu tanto
varan los valores ms grandes que estn por encima de ella y cmo se distribuyen los valores me-
nores que estn por debajo de ella.
Una medida simple de la variacin alrededor de la media considerara la diferencia entre cada
uno de los valores y la media, y luego las sumara. Sin embargo, si usted hiciera eso, podra descu-
brir que la media es el punto de equilibrio de un conjunto de datos y que tales diferencias sumaran
cero en todo conjunto de datos. Una medida de la variacin que sera distinta de un conjunto de da-
tos a otro consistira en elevar al cuadrado la diferencia entre cada uno de los valores y la media, y
despus sumarlas. En estadstica, esta cantidad se denomina suma de cuadrados (o SS). Esta suma
luego se divide entre el nmero de valores menos 1 (para datos de la muestra), con el fin de obtener
una varianza de la muestra (S2). La raz cuadrada de la varianza de la muestra es la desviacin estn-
dar de la muestra (S).
Puesto que la suma de cuadrados es una suma de diferencias elevadas al cuadrado que, por las
reglas aritmticas siempre ser no negativa, ni la varianza ni la desviacin estndar podrn ser ne-
gativas. En casi todos los conjuntos de datos, la varianza y la desviacin estndar tendrn un valor
positivo, aunque si no existe variacin en todo el conjunto de datos y todos los valores de la muestra
son los mismos, ambos estadsticos sern igual a cero.
En una muestra que contiene n valores, X1, X2, X3, . . . , Xn, la varianza de la muestra (represen-
tada por el smbolo S2) es

( X1 X )2 + ( X 2 X )2 + L + ( X n X )2
S2 =
n 1

La ecuacin 3.9 expresa esta ecuacin utilizando la notacin de sumatoria.

VARIANZA PARA UNA MUESTRA


La varianza para una muestra es la suma de las diferencias con respecto a la media elevada al
cuadrado y dividida por el tamao de la muestra menos uno.
n
( X i X )2
i =1
S2 = (3.9)
n 1
donde
 = media
X
n = tamao de la muestra
Xi = i-simo valor de la variable X
n
( X i X )2 = sumatoria de los cuadrados de todas las diferencias entre los valores de Xi y X.
i =1

DESVIACIN ESTNDAR DE LA MUESTRA


La desviacin estndar de una muestra es la raz cuadrada de la suma de los cuadrados de las
diferencias con respecto a la media dividida por el tamao de la muestra menos uno.

n
( X i X )2
i =1
S = S2 = (3.10)
n 1
3.1: Medidas de tendencia central, variacin y forma 83

Si el denominador fuese n en vez de n 1, la ecuacin (3.9) [y el trmino interno de la ecuacin


(3.10)] calculara el promedio de las diferencias con respecto a la media elevadas al cuadrado.
Sin embargo, se utiliza n 1 porque ciertas propiedades matemticas convenientes del estadstico
S 2 lo hacen apropiado para la inferencia estadstica (que analizaremos en el captulo 7). Conforme
aumenta el tamao de la muestra, se hace cada vez ms pequea la diferencia entre dividir por n o
por n 1.
Es ms probable que usted utilice la desviacin estndar de la muestra como medida de la va-
riacin [definida en la ecuacin (3.10)]. A diferencia de la varianza de la muestra, que es una canti-
dad elevada al cuadrado, la desviacin estndar siempre es un nmero con las mismas unidades que
los datos de muestra originales. La desviacin estndar le ayuda a conocer de qu manera se agrupan
o distribuyen un conjunto de datos con respecto a su media. En casi todos los conjuntos de datos, la
mayora de los valores observados quedan dentro de un intervalo de ms menos una desviacin es-
tndar por encima y por debajo de la media. Por esa razn, conocer la media y la desviacin estn-
dar ayuda a definir por lo menos dnde se agrupa la mayora de los valores de los datos.
Para calcular a mano la varianza S 2 y la desviacin estndar S de una muestra:

Paso 1: Calcule la diferencia entre cada uno de los valores y la media.

Paso 2: Eleve al cuadrado cada una de esas diferencias.

Paso 3: Sume las diferencias elevadas al cuadrado.

Paso 4: Divida el total entre n 1, para obtener la varianza de la muestra.

Paso 5: Extraiga la raz cuadrada de la varianza de la muestra, para obtener la desviacin estndar
de la muestra.

La tabla 3.1 muestra los cuatro primeros pasos para calcular la varianza de los datos referen-
tes al tiempo necesario para arreglarse, con una media (X  ) = 39.6 (vea el clculo de la media en la
pgina 74). En la segunda columna se muestra el paso 1. En la tercera columna se muestra el paso 2.
En la parte inferior se muestra la suma de la diferencias elevadas al cuadrado (paso 3). Luego, este
total se divide entre 10 1 = 9, para calcular la varianza (paso 4).

TABLA 3.1  = 39.6


X
Clculo de la varianza Tiempo Paso 1: Paso 2:
del tiempo necesario (X) (Xi 
X) (Xi 
X )2
para arreglarse.
39 0.60 0.36
29 10.60 112.36
43 3.40 11.56
52 12.40 153.76
39 0.60 0.36
44 4.40 19.36
40 0.40 0.16
31 8.60 73.96
44 4.40 19.36
35 4.60 21.16

Paso 3: Paso 4:
Suma: Dividido por (n 1):
412.40 45.82
84 CAPTULO 3 Medidas numricas descriptivas

Tambin es posible calcular la varianza si se sustituyen los valores de los trminos en la ecua-
cin 3.9:
n
( X i X )2
i =1
S2 =
n 1
( 39 39.6 ) 2 + ( 29 39.6 ) 2 + L + ( 35 39.6 ) 2
=
10 1
412.4
=
9
= 45.82

Puesto que la varianza est en unidades cuadradas (en minutos cuadrados en este caso), para
calcular la desviacin estndar se calcula la raz cuadrada de la varianza. Al utilizar la ecuacin
(3.10) de la pgina 82, la desviacin estndar S de la muestra es:
n
( X i X )2
i =1
S = S2 = = 45.82 = 6.77
n 1

Esto indica que los tiempos necesarios para arreglarse en esta muestra se agrupan dentro de los 6.77
minutos que circundan a la media de 39.6 minutos (es decir, se agrupan entre  X 1S = 32.83 y X +
1S = 46.37). De hecho, 7 de los 10 quedan dentro de este intervalo.
Al utilizar la segunda columna de la tabla 3.1, tambin es posible calcular que la suma de las di-
ferencias entre cada uno de los valores y la media es cero. Para todo conjunto de datos, esta suma
siempre ser igual a cero:
n
( X i X ) = 0 para todos los conjuntos de datos
i =1

Esta propiedad es una de las razones por las que la media se utiliza como la medida ms comn de
tendencia central.

EJEMPLO 3.9 CLCULO DE LA VARIANZA Y LA DESVIACIN ESTNDAR DEL RENDIMIENTO


EN 2003 DE LOS FONDOS DE INVERSIN PARA PEQUEOS CAPITALES
Los 121 fondos de inversin que forman parte del escenario Uso de la estadstica (vea la pgina
72), se clasifican de acuerdo con el nivel de riesgo (bajo, medio y alto) y el tamao del capital inver-
tido (pequeo, mediano y gran capital). Calcule la varianza y la desviacin estndar del rendimien-
to en 2003 de los fondos de inversin de alto riesgo para pequeos capitales. MUTUALFUNDS2004
SOLUCIN
La tabla 3.2 ilustra el clculo de la varianza y la desviacin estndar del rendimiento en 2003 para
los fondos de inversin de alto riesgo para pequeos capitales. Utilice la ecuacin (3.9) de la pgi-
na 82:
n
( X i X )2
i =1
S2 =
n 1
( 44.5 51.53) 2 + ( 39.2 51.53) 2 + L + ( 66.5 51.53) 2
=
9 1
891.16
=
8
= 111.395
3.1: Medidas de tendencia central, variacin y forma 85

TABLA 3.2  = 51.5333


X
Clculo de la varianza Rendimiento Paso 1: Paso 2:
del rendimiento en 2003 (Xi 
X) (Xi 
X )2
2003 para los fondos
de inversin de alto 44.5 7.0333 49.4678
riesgo para pequeos 39.2 12.3333 152.1111
capitales. 62.4 10.8667 118.0844
59.3 7.7667 60.3211
56.6 5.0667 25.6711
53.8 2.2667 5.1378
37.3 14.2333 202.5878
44.2 7.3333 53.7778
66.5 14.9667 224.0011

Paso 3: Paso 4:
Suma: Dividido por (n 1):
891.16 111.395

Al utilizar la ecuacin (3.10) de la pgina 82, se sabe que la desviacin estndar S de la mues-
tra es:

n
( X i X )2
i =1
S = S2 = = 111.395 = 10.55
n 1

La desviacin estndar de 10.55 indica que los rendimientos en 2003 de los fondos de inversin
de alto riesgo para pequeos capitales se agrupan dentro de los 10.55 que rodean a la media de 51.53
(es decir, se agrupan entre X 1S = 40.98 y X + 1S = 62.08). De hecho, el 55.6% (5 de 9) de los
rendimientos en 2003 quedan dentro de este intervalo.

A continuacin se resumen las caractersticas del rango, del rango intercuartil, de la varianza y
de la desviacin estndar.

Cuanto ms esparcidos o dispersos estn los datos, son mayores el rango, el rango intercuartil,
la varianza y la desviacin estndar.
Cuanto ms concentrados u homogneos son los datos, son menores el rango, el rango inter-
cuartil, la varianza y la desviacin estndar.
Si todos los valores son los mismos (de tal manera que no hay variacin de los datos), el rango,
el rango intercuartil, la varianza y la desviacin estndar son iguales a cero.
Ninguna de las medidas de la variacin (rango, rango intercuartil, desviacin estndar y varian-
za) puede ser negativa.

Coeficiente de variacin
A diferencia de las medidas de la variacin antes expuestas, el coeficiente de variacin es una me-
dida relativa de la variacin que siempre se expresa como porcentaje, ms que en trminos de las
unidades de los datos en particular. El coeficiente de variacin, que se denota mediante el smbolo
CV, mide de dispersin de los datos con respecto a la media.
86 CAPTULO 3 Medidas numricas descriptivas

COEFICIENTE DE VARIACIN
El coeficiente de variacin es igual a la desviacin estndar dividida por la media, multiplicada
por 100%.

S
CV = 100% (3.11)
X
donde S = desviacin estndar de la muestra
X = media de la muestra

Para la muestra de los 10 tiempos para arreglarse, como X = 39.6 y S = 6.77, el coeficiente de va-
riacin es

S 6.77
CV = 100% = 100% = 17.10%
X 39.6

Para estos datos, la desviacin estndar es el 17.1% del tamao de la media.


El coeficiente de variacin es muy til al comparar dos o ms conjuntos de datos medidos con
unidades distintas, como ilustra el ejemplo 3.10.

EJEMPLO 3.10 COMPARACIN DE DOS COEFICIENTES DE VARIACIN CUANDO


DOS VARIABLES TIENEN DISTINTAS UNIDADES DE MEDIDA
El gerente de operaciones de un servicio de entrega de paquetera est pensando si es conveniente
adquirir una nueva flota de camiones. Al guardar los paquetes en los camiones para su entrega, se
deben tomar en cuenta dos caractersticas principales: el peso (en libras) y el volumen (en pies cbi-
cos) de cada artculo.
El gerente de operaciones toma una muestra de 200 paquetes, y encuentra que la media del pe-
so es 26.0 libras, con una desviacin estndar de 3.9 libras, mientras que la media en volumen es de
8.8 pies cbicos, con una desviacin estndar de 2.2 pies cbicos. Cmo puede el gerente de ope-
raciones comparar la variacin de peso y volumen?
SOLUCIN
Como las unidades difieren para el peso y volumen, el gerente de operaciones debe comparar la va-
riabilidad relativa en ambos tipos de medidas.
Para el peso, el coeficiente de variacin es

3.9
CVW = 100% = 15.0%
26.0

para el volumen, el coeficiente de variacin es

2.2
CVV = 100% = 25.0%
8.8

De esta forma, en relacin con la media el volumen del paquete es mucho ms variable que su peso.

Puntuaciones Z
Un valor extremo o atpico es un valor ubicado muy lejos de la media. Las puntuaciones Z son ti-
les para identificar atpicos. Cuanto mayor es la puntuacin Z, mayor es la distancia entre tal valor y
la media. La puntuacin Z es igual a la diferencia entre ese valor y la media, dividida por la desvia-
cin estndar.
3.1: Medidas de tendencia central, variacin y forma 87

PUNTUACIONES Z
X X
Z = (3.12)
S

Si se consideran los tiempos necesarios para arreglarse por la maana, se observa que la media es de
39.6 minutos y la desviacin estndar de 6.77 minutos. El tiempo necesario para arreglarse el primer
da es de 39.0 minutos. La puntuacin Z para el da 1 se calcula a partir de

X X
Z =
S
39.0 39.6
=
6.77
= 0.09

La tabla 3.3 muestra las puntuaciones Z de los 10 das. La mayor es de 1.83 para el da 4, cuando el tiem-
po necesario para arreglarse fue de 52 minutos. La menor fue 1.57 para el da 2, cuando el tiempo
necesario para arreglarse fue de 29 minutos. Como regla general, una puntuacin Z se considera at-
pica si es menor que 3.0 o mayor que +3.0. Ninguno de los tiempos satisface este criterio.

TABLA 3.3 Tiempo (X ) Puntuacin Z


Puntuaciones Z para los 39 0.09
10 tiempos necesarios 29 1.57
para arreglarse. 43 0.50
52 1.83
39 0.09
44 0.65
40 0.06
31 1.27
44 0.65
35 0.68
Media 39.6
Desviacin estndar 6.77

EJEMPLO 3.11 CLCULO DE LAS PUNTUACIONES Z DEL RENDIMIENTO EN 2003 DE LOS FONDOS
DE INVERSIN DE ALTO RIESGO PARA PEQUEOS CAPITALES
Los 121 fondos de inversin que forman parte del escenario Uso de la estadstica (vea la pgina
72), se clasifican de acuerdo con el nivel de riesgo (bajo, medio y alto) y el tamao del capital inver-
tido (pequeo, mediano y gran capital). Calcule las puntuaciones Z del rendimiento en 2003 de los
fondos de inversin de alto riesgo para pequeos capitales. MUTUALFUNDS2004
SOLUCIN
La tabla 3.4 ilustra las puntuaciones Z de los rendimientos en 2003 de los fondos de inversin de al-
to riesgo para pequeos capitales. La puntuacin Z ms grande es 1.42, correspondiente a un rendi-
miento porcentual de 66.5. La puntuacin Z ms baja es 1.35, correspondiente a un rendimiento
porcentual de 37.3. Como regla general, se considera que una puntuacin Z es atpica si es menor
que 3.0 o mayor que +3.0. Ninguno de los rendimientos porcentuales satisface el criterio para con-
siderarlo atpico.
88 CAPTULO 3 Medidas numricas descriptivas

TABLA 3.4 Rendimiento 2003 Puntuaciones Z


Puntuacin Z del 44.5 0.67
rendimiento en 2003 de 39.2 1.17
los fondos de inversin 62.4 1.03
de alto riesgo para 59.3 0.74
pequeos capitales. 56.6 0.48
53.8 0.21
37.3 1.35
44.2 0.69
66.5 1.42
Media 51.53
Desviacin estndar 10.55

Forma
Una tercera e importante propiedad que describe a un conjunto de datos numricos es la forma. For-
ma es el patrn de distribucin de los valores de los datos a travs del rango de todos los valores. La
distribucin puede ser simtrica cuando los valores pequeos y grandes se equilibran entre s, o asi-
mtrica, cuando muestra desequilibrio de los valores pequeos o grandes.
La forma influye en la relacin de la media con la mediana de las siguientes maneras:

Media < mediana; asimtrica negativa o sesgo izquierdo.


Media = mediana; simtrica o asimetra cero.
Media > mediana; asimtrica positiva o sesgo derecho.

La figura 3.1 describe tres conjuntos de datos, cada uno con distinta forma.

FIGURA 3.1
Comparacin de tres
conjuntos de datos con
distinta forma.

Panel A Panel B Panel C


Asimtricos negativos Simtrico Asimtrico positivo
o sesgo izquierdo o sesgo derecho

Los datos del panel A son negativos, o sesgados a la izquierda. En este panel, la mayora de los
valores estn en la parte superior de la distribucin. Existe una cola larga y la distorsin hacia la iz-
quierda es provocada por algunos valores muy pequeos. Estos valores extremadamente pequeos
empujan la media hacia abajo, de manera que la media es menor que la mediana.
Los datos del panel B son simtricos. Cada mitad de la curva es una imagen al espejo del otro.
Los valores bajos y altos de la escala se equilibran, y la media es igual a la mediana.
Los datos del panel C son asimtricos positivos o sesgados a la derecha. En este panel, la ma-
yora de los valores estn en la parte inferior de la distribucin. Existe una larga cola a la derecha de
la distribucin y cierta distorsin hacia la derecha provocada por algunos valores muy grandes. Es-
tos valores sumamente grandes empujan a la media hacia arriba, de manera que la media resulta ma-
yor que la mediana.

Resultados de la estadstica descriptiva en Excel


El juego de herramientas de anlisis de datos de Excel genera la media, mediana, moda, desviacin
estndar, varianza, rango, mnimo, mximo y cuenta (tamao de la muestra) en una sola hoja de tra-
bajo, todos ellos analizados en esta seccin. Adems, Excel calcula el error estndar, lo mismo que
estadsticos para la curtosis y la asimetra. El error estndar es igual a la desviacin estndar dividi-
da por la raz cuadrada del tamao de la muestra, y se estudiar en el captulo 7. La asimetra mide
la falta de simetra en los datos, y se basa en un estadstico que est en funcin de las diferencias con
3.1: Medidas de tendencia central, variacin y forma 89

EXPLORACIONES VISUALES Exploracin de la estadstica descriptiva


Utilice el procedimiento Exploraciones Visuales de la necesarios para arreglarse que utilizar a lo largo
Estadstica Descriptiva para observar el efecto que de este captulo.
tiene el cambio de valores en los datos sobre las Experimente introduciendo un valor extremo
medidas de tendencia central, variacin y forma. Abra como 10 minutos en una de las celdas de la
la macro de trabajo Visual Explorations.xla y columna A. Qu medidas se ven afectadas por
seleccione Visual Explorations Descriptive este cambio? Cules no? Puede alternar entre los
Statistics en la barra de herramientas de Excel. Lea diagramas previo y posterior presionando
las instrucciones del cuadro que aparece (vea la repetidamente Ctrl+Z (deshacer) seguido de
ilustracin que se muestra a continuacin) y d clic en Ctrl+Y (rehacer) como ayuda para observar los
OK para examinar el diagrama de puntos cambios provocados por un valor extremo en el
correspondiente a la muestra de 10 tiempos diagrama.

respecto a la media elevadas al cubo. Un valor de asimetra de cero indica una distribucin simtri-
ca. La curtosis mide la concentracin relativa de valores en el centro de la distribucin al comparar-
los con las colas y se basa en las diferencias con respecto a la media elevadas a la cuarta potencia.
Esta medida no se analiza en el presente texto (vea la referencia 2).
A partir de la figura 3.2 de la pgina 90, los resultados de estadstica descriptiva en Excel para
el rendimiento de los fondos en 2003, con base en su nivel de riesgo, parecen mostrar ligeras dife-
rencias para los tres niveles de riesgo en su rendimiento porcentual de 2003. Los fondos de alto ries-
go tienen una media y una mediana ligeramente mayores que los de riesgo bajo y medio. Existe muy
poca diferencia entre las desviaciones estndar de los tres grupos.

Resultados de la estadstica descriptiva en Minitab


Para la estadstica descriptiva, Minitab calcula el tamao de la muestra (etiquetado como N), media,
mediana, desviacin estndar (etiquetada StDev), mnimo, mximo, coeficiente de variacin (eti-
quetado CoefVar), primer y tercer cuartiles, rango y rango intercuartil (etiquetado IQR), todos ana-
lizados en esta seccin.
A partir de la figura 3.3 de la pgina 90, los resultados de estadstica descriptiva en Minitab pa-
ra el rendimiento de los fondos en 2003, con base en su riesgo, parecen registrar ligeras diferencias
del rendimiento porcentual en 2003 para los tres niveles de riesgo. Los fondos de alto riesgo tienen
media, mediana y cuartiles ligeramente superiores a los de riesgo bajo y medio. Existe muy poca di-
ferencia en las desviaciones estndar o el rango intercuartil de los tres grupos.
90 CAPTULO 3 Medidas numricas descriptivas

FIGURA 3.2
Estadstica descriptiva
en Excel para el
rendimiento de los
fondos en 2003 con
base en su nivel de
riesgo.

FIGURA 3.3
Estadstica descriptiva
en Minitab para el
rendimiento de los
fondos en 2003 con
base en su nivel de
riesgo.

PROBLEMAS PARA LA SECCIN 3.1


Aprendizaje bsico c. Calcule las puntuaciones Z. Existe algn valor extremo?
d. Describa la forma del conjunto de datos.
ASISTENCIA 3.1 A continuacin se encuentra un conjunto de da-
ASISTENCIA 3.3 A continuacin aparece un conjunto de datos
de PH Grade tos procedente de una muestra de n = 5:
de PH Grade procedente de una muestra de n = 7:
7 4 9 8 2
12 7 4 9 0 7 3
a. Calcule la media, la mediana y la moda. a. Calcule la media, la mediana y la moda.
b. Calcule el rango, el rango intercuartil, la varianza, la desvia- b. Calcule el rango, el rango intercuartil, la varianza, la desvia-
cin estndar y el coeficiente de variacin. cin estndar y el coeficiente de variacin.
c. Calcule las puntuaciones Z. Existe algn valor extremo? c. Describa la forma del conjunto de datos.
d. Describa la forma del conjunto de datos.
ASISTENCIA 3.4 A continuacin aparece un conjunto de datos
ASISTENCIA 3.2 A continuacin aparece un conjunto de datos de PH Grade procedente de una muestra de n = 5:
de PH Grade procedente de una muestra de n = 6:
7 5 8 7 9
7 4 9 7 3 12
a. Calcule la media, la mediana y la moda.
a. Calcule la media, la mediana y la moda. b. Calcule el rango, el rango intercuartil, la varianza, la desvia-
b. Calcule el rango, el rango intercuartil, la varianza, la desvia- cin estndar y el coeficiente de variacin.
cin estndar y el coeficiente de variacin. c. Describa la forma del conjunto de datos.
3.1: Medidas de tendencia central, variacin y forma 91

ASISTENCIA 3.5 Suponga que la tasa de rendimiento de una ac- 3.9 En el ciclo escolar 2002-2003, muchas universidades
de PH Gradecin en particular durante los dos ltimos aos fue pblicas de Estados Unidos elevaron sus cuotas y tarifas de ma-
del 10 y del 30%. Calcule la media geomtrica de la nutencin, como resultado de la reduccin de los subsidios
tasa de rendimiento (Nota: Una tasa de rendimiento del 10% se estatales (Mary Beth Marklein, Public Universities Raise Tui-
registra como 0.10 y una del 30% como 0.30). tion, Fees-and Ire, USA Today, 8 de agosto, 2002, 1A-2A). A
continuacin se representa el cambio del costo de inscripcin,
Aplicacin de conceptos un dormitorio compartido y el plan de alimentacin ms solici-
tado entre los ciclos escolares 2001-2002 y 2002-2003 en una
Puede resolver los problemas 3.6 a 3.20 manualmen- muestra de 10 universidades pblicas. COLLEGECOST
te o en Excel, Minitab o SPSS.
ASISTENCIA 3.6 El gerente de operaciones de una fbrica de
de PH Gradellantas quiere comparar el dimetro interno real Universidad Cambio en el costo ($)
de dos tipos de neumticos, que se espera sean de
University of California, Berkeley 1,589
575 milmetros en ambos casos. Se seleccion una muestra
University of Georgia, Athens 593
de cinco llantas de cada tipo y se ordenaron de menor a mayor,
University of Illinois, Urbana-Champaign 1,223
como se aprecia a continuacin:
Kansas State University, Manhattan 869
Tipo X Tipo Y University of Maine, Orono 423
University of Mississippi, Oxford 1,720
568 570 575 578 584 573 574 575 577 578
University of New Hampshire, Durham 708
a. Calcule la media, la mediana y la desviacin estndar de Ohio State University, Columbus 1,425
ambos tipos de llantas. University of South Carolina, Columbia 922
b. Cul tipo de llanta es de mejor calidad? Explique por qu. Utah State University, Logan 308
c. Qu efecto tendra en sus respuestas a los incisos a) y b) si
el ltimo valor del tipo Y fuese 588 en lugar de 578? Expli-
que su respuesta. a. Calcule la media, la mediana, primero y tercer cuartiles.
b. Calcule la varianza, la desviacin estndar, el rango, el ran-
ASISTENCIA 3.7 Los siguientes datos representan el total de gra- go intercuartil, el coeficiente de variacin y las puntuacio-
de PH Grade sas en las hamburguesas y productos de pollo de una nes Z.
muestra tomada de cadenas de comida rpida. FAST- c. Los datos son asimtricos? De ser as, cmo?
FOOD
d. Con base en los resultados de los incisos a) a c), qu con-
Hamburguesas clusiones se obtienen en relacin con el cambio de los cos-
tos entre los ciclos escolares 2001-2002 y 2002-2003?
19 31 34 35 39 39 43
3.10 Los siguientes datos COFFEDRINK representan las calo-
Pollo ras y la grasa (en gramos), que contienen las raciones con 16
7 9 15 16 16 18 22 25 27 33 39 onzas de bebidas a base de caf servidas en Dunkin Donuts y
Starbucks.
Fuente: Quick bites, Derechos reservados 2000 por Consumers Union
of U.S., Inc., Yonkers, NY 10703-1057. Adoptado con autorizacin de Con-
sumer Reports, marzo de 2001, 46.
Producto Caloras Grasa
Para las hamburguesas y los productos de pollo realice lo si-
Batido de moka helado de Dunkin
guiente por separado:
Donuts (pura leche) 240 8.0
a. Calcule la media, la mediana, primero y tercer cuartiles. Capuchino frap de Starbucks 260 3.5
b. Calcule la varianza, la desviacin estndar, el rango, el ran- Raspado de caf Coolata (crema) de
go intercuartil y el coeficiente de variacin. Dunkin Donuts 350 22.0
c. Los datos son asimtricos? De ser as, cmo? Caf moka exprs helado de Starbucks
d. Con base en los resultados de los incisos a) a c), qu con- (pura leche y crema batida) 350 20.0
clusiones se obtienen en relacin con las diferencias en la Caf moka batido helado de Starbucks
grasa total de las hamburguesas y los productos de pollo? (con crema batida) 420 16.0
3.8 La mediana del precio de una casa en diciembre de 2003 Capuchino helado de Brownie de chocolate,
alcanza $173,200, un incremento del 6.7% respecto a diciem- de Starbucks (con crema batida) 510 22.0
bre de 2002. En todo el ao, las ventas alcanzaron un rcord de Crema de chocolate batido helado
6.1 millones de casas (James R. Hagerty, Housing Prices Con- de Starbucks (con crema batida) 530 19.0
tinue to Rise, The Wall Street Journal, 27 de enero, 2004, D1). Fuente: Coffee as Candy at Dunkin Donuts and Starbucks, Derechos
a. Describa la forma de la distribucin correspondiente al pre- Reservados 2004 por Consumers Union of U.S., Inc., Yonkers, NY
cio de las casas vendidas. 10703-1057, organizacin sin fines de lucro. Adaptado con autorizacin de
b. Por qu cree usted que el artculo informa sobre la mediana Consumer Reports, junio de 2004, 9, slo con propsitos educativos. No se
de los precios y no sobre la media? autoriza su reproduccin o uso comercial. www.ConsumerReports.org
92 CAPTULO 3 Medidas numricas descriptivas

Para cada una de las variables (caloras y grasa): a. Calcule la media, la mediana, primero y tercer cuartiles.
a. Calcule la media, la mediana, primero y tercer cuartiles. b. Calcule la varianza, la desviacin estndar, el rango, el ran-
b. Calcule la varianza, la desviacin estndar, el rango, el ran- go intercuartil, el coeficiente de variacin y las puntuaciones
go intercuartil, el coeficiente de variacin y las puntuaciones Z. Existe un valor atpico? Explique su respuesta.
Z. Existe un valor atpico? Explique su respuesta. c. Los datos son asimtricos? De ser as, cmo?
c. Los datos son asimtricos? De ser as, cmo? d. Con base en los resultados de los incisos a) a c), qu con-
d. A partir de los resultados de los incisos a) a c), qu conclu- clusiones se obtienen en relacin con el precio de las cma-
siones se obtienen en relacin con las caloras y la grasa de ras digitales de 3 megapixeles en una tienda especializada
las bebidas heladas a base de caf servidas en Dunkin Do- durante 2003?
nuts y en Starbucks?
3.13 Una empresa dedicada a la consultora y desarrollo de
3.11 Los siguientes datos representan el costo diario de una software, ubicada en el rea metropolitana de Phoenix, desarro-
habitacin de hotel y la renta de un automvil en 20 ciudades lla programas para sistemas administrativos de cadenas de
estadounidenses durante una semana en octubre de 2003. HO- suministro, con base en la reutilizacin sistemtica de software.
TEL-CAR En lugar de comenzar desde cero al elaborar y desarrollar nue-
vos sistemas de software personalizados, utiliza una base de da-
tos que contiene componentes reutilizables que suman ms de
2,000,000 de lneas de cdigo, recopilados a lo largo de 10 aos
de labores continuas. Se pide a 8 analistas de la empresa que
Ciudad Hotel Automviles
calculen la tasa de reutilizacin cuando se desarrolla un nuevo
San Francisco 205 47 sistema de software. Los siguientes datos corresponden al por-
Los ngeles 179 41 centaje total de cdigo que procede de la base de datos de reuti-
Seattle 185 49 lizacin y forma parte del sistema de software. REUSE
Phoenix 210 38 50.0 62.5 37.5 75.0 45.0 47.5 15.0 25.0
Denver 128 32
Fuente: M. A. Rothenberger y K. J. Dooley, A Performance Measure for
Dallas 145 48 Software Reuse Projects, Decision Sciences, 30 (otoo de 1999), 1131-
Houston 177 49 1153.
Minneapolis 117 41
Chicago 221 56
a. Calcule la media, la mediana y la moda.
St. Louis 159 41
b. Calcule el rango, la varianza y la desviacin estndar.
Nueva Orlens 205 50
c. Interprete las medidas sintetizadas que se calculan en los in-
Detroit 128 32
cisos a) y b).
Cleveland 165 34
Atlanta 180 46 3.14 Un fabricante de bateras para flashes toma una muestra
Orlando 198 41 de 13 bateras de la produccin del da y las utiliza de manera
Miami 158 40 continua hasta que se agotan. El nmero de horas que se utiliza-
Pittsburg 132 39 ron hasta el momento de fallar fue: BATTERIES
Boston 283 67
Nueva York 269 69 342 426 317 545 264 451
Washington, D.C. 204 40 1,049 631 512 266 492 562 298
a. Calcule la media, la mediana y la moda. Al observar la dis-
Fuente: The Wall Street Journal, 10 de octubre, 2003, W4.
tribucin de los tiempos transcurridos hasta la falla, cules
medidas de ubicacin le parecen ms apropiadas y cu-
les menos adecuadas para utilizarlas con estos datos? Por
qu?
Para cada una de las variables (costo de hotel y costo del auto): b. Calcule el rango, la varianza y la desviacin estndar.
a. Calcule la media, la mediana, primero y tercer cuartiles. c. Qu le recomendara a un fabricante si quisiera anunciar
b. Calcule la varianza, la desviacin estndar, el rango, el ran- que sus bateras duran 400 horas? (Nota: No existe una
go intercuartil, el coeficiente de variacin y las puntuaciones respuesta exacta para esta pregunta; se trata de decir cmo
Z. Existe un valor extremo? Explique su respuesta. hacer precisa tal afirmacin.)
c. Los datos son asimtricos? De ser as, cmo? d. Suponga que, en lugar de 342, el primer valor fue de 1,342.
d. Con base en los resultados de los incisos a) a c), qu con- Repita los incisos a) a c) utilizando este valor. Elabore un
clusiones se obtienen en relacin con el costo diario de una comentario sobre la diferencia de los resultados.
habitacin de hotel y la renta de un automvil?
3.15 Una sucursal bancaria ubicada en una zona comercial de
3.12 A continuacin se indica el costo de 14 modelos de c-
la ciudad, desarroll un proceso mejorado para atender a sus
mara digital de 3 megapixeles en una tienda especializada. CA-
clientes desde la hora del almuerzo al medioda, hasta la 1:00
MERA
PM. Se registra el tiempo de espera en minutos (definido como
340 450 450 280 220 340 290 el tiempo transcurrido desde que el cliente se forma en la fila
370 400 310 340 430 270 380 hasta que llega a la ventanilla del cajero) de todos los clientes
3.1: Medidas de tendencia central, variacin y forma 93

durante ese horario por una semana. Se selecciona una muestra


Ao DJIA SP500 Russell2000 Wilshire5000
aleatoria de 15 clientes y se tienen los siguientes resultados:
BANK1 2003 25.30 26.40 45.40 29.40
2002 15.01 22.10 21.58 20.90
4.21 5.55 3.02 5.13 4.77 2.34 3.54 2001 5.44 11.90 1.03 10.97
3.20 4.50 6.10 0.38 5.12 6.46 6.19 3.79 2000 6.20 9.10 3.02 10.89
a. Calcule la media, la mediana, primero y tercer cuartiles. Fuente: The Wall Street Journal, 2 de enero, 2004.
b. Calcule la varianza, la desviacin estndar, el rango, el ran- a. Calcule la tasa de rendimiento geomtrica de los ndices
go intercuartil, el coeficiente de variacin y las puntuaciones Dow Jones, Standard & Poors 500, Russell 2000 y Wilshire
Z. Existe algn valor atpico? Explique su respuesta. 5000.
c. Los datos son asimtricos? De ser as, cmo? b. Qu conclusiones se obtienen en relacin con las tasas de
d. Un cliente llega a la sucursal durante la hora del almuerzo y rendimiento geomtricas de los cuatro ndices burstiles?
pregunta al gerente cunto tendr que esperar, ste le res- c. Compare los resultados del inciso b) con los de los proble-
ponde Menos de cinco minutos, con toda seguridad. Con mas 3.19b) y 3.20b).
base en sus resultados de los incisos a) y b), evale la exac- 3.19 Durante el periodo de 2000 a 2003, se observ una gran
titud de tal afirmacin. volatilidad en el valor de las inversiones. Los datos que se pre-
sentan en la siguiente tabla BANKRETURN representan la tasa de
3.16 Suponga que otra sucursal, ubicada en una zona residen- rendimiento total de un certificado de depsito a un ao, de un
cial, tambin se preocupa por el tiempo de espera desde de la certificado de depsito a 30 meses y de un depsito en el mer-
hora del almuerzo hasta la 1:00 PM. Se registra el tiempo de es- cado de dinero de 2000 a 2003.
pera en minutos (definido como el tiempo transcurrido desde
que el cliente se forma en la fila hasta que llega a la ventanilla Ao A 1 ao A 30 meses Mercado de dinero
del cajero) de todos los clientes durante ese horario por una se-
mana. Se selecciona una muestra aleatoria de 15 clientes y se 2003 1.20 1.76 0.61
tienen los siguientes resultados: BANK2 2002 1.98 2.74 1.02
2001 3.60 3.97 1.73
9.66 5.90 8.02 5.79 8.73 3.82 8.01 2000 5.46 5.64 2.09
8.35 10.49 6.68 5.64 4.08 6.17 9.91 5.47
Fuente: The Wall Street Journal, 2 de enero, 2004.
a. Calcule la media, la mediana, primero y tercer cuartiles.
a. Calcule la tasa de rendimiento geomtrica de los certifi-
b. Calcule la varianza, la desviacin estndar, el rango, el ran- cados de depsito a un ao, 30 meses y en el mercado de di-
go intercuartil y el coeficiente de variacin. Existe algn nero.
valor atpico? Explique su respuesta. b. Qu conclusiones se obtienen en relacin con las tasas de
c. Los datos son asimtricos? De ser as, cmo? rendimiento geomtricas de los tres depsitos?
d. Un cliente llega a la sucursal durante la hora del almuerzo y c. Compare los resultados del inciso b) con los de los proble-
pregunta al gerente cunto tendr que esperar, ste le res- mas 3.18b) y 3.20b).
ponde: Menos de cinco minutos, con toda seguridad. Con 3.20 Durante el periodo de 2000 a 2003, se observ una gran
base en sus resultados de los incisos a) y b), evale la exac- volatilidad en el valor de los metales. Los datos que se presen-
titud de tal afirmacin. tan en la siguiente tabla METALRETURN representan la tasa de
rendimiento total de platino, oro y plata de 2000 a 2003.
AUTO 3.17 China tiene el mercado con crecimiento ms
Examen rpido en ventas de automviles de pasajeros y es el Ao Platino Oro Plata
cuarto mercado ms grande, detrs de Estados Uni-
dos, Japn y Alemania. Las ventas aumentaron un 61% en 2002 2003 34.2 19.5 24.0
y un 55% en 2003 (Peter Wonacott, A Fear Amid Chinas Car 2002 24.5 24.5 5.5
Boom, The Wall Street Journal, 2 de febrero, 2004, A17). 2001 21.3 1.2 3.0
Calcule la media geomtrica de la tasa de incremento. (Suge- 2000 23.3 1.8 5.9
rencia: Denote el crecimiento del 61% como R1 = 0.61.) Fuente: The Wall Street Journal, 2 de enero, 2004.

3.18 Durante el periodo transcurrido desde 2000 hasta 2003, a. Calcule la tasa de rendimiento geomtrica de platino, oro y
se observ una gran volatilidad en el valor de las acciones. Los plata.
datos que se presentan en la siguiente tabla STOCKRETURN re- b. Qu conclusiones se obtienen en relacin con las tasas de
presentan las tasas de rendimiento total del ndice industrial rendimiento geomtricas de los tres metales?
Dow Jones, del ndice Standard & Poors 500, del ndice Rus- c. Compare los resultados del inciso b) con los de los proble-
sell 2000, y del ndice Wilshire 5000 de 2000 a 2003. mas 3.18b) y 3.19b).
94 CAPTULO 3 Medidas numricas descriptivas

3.2 MEDIDAS NUMRICAS DESCRIPTIVAS DE UNA POBLACIN


En la seccin 3.1 se expusieron varios estadsticos que describen las propiedades de la tendencia
central, la variacin y la forma de una muestra. Si su conjunto de datos representa medidas numri-
cas de toda una poblacin, necesita calcular e interpretar los parmetros, medidas sintetizadas para
una poblacin. En esta seccin, aprender sobre tres parmetros descriptivos de la poblacin, la me-
dia poblacional, la varianza poblacional y la desviacin estndar poblacional.
Como ayuda para ilustrar estos parmetros, vea primero la tabla 3.5, que contiene los cinco ma-
yores bonos de capital (en trminos de activos totales) para el primero de marzo de 2004. Tambin
se indica el rendimiento a 52 semanas de cada uno de ellos. LARGEST BONDS

TABLA 3.5 Rendimiento a


Rendimiento en 2003 52 semanas
de la poblacin Fondo de capital (en porcentaje)
compuesta por los Vanguard GNMA 3.8
cinco mayores bonos Vanguard Total Bond Index 6.5
de capital. Pimco Total Return Admin 7.0
Pimco Total Return Instl 7.3
America Bond Fund 12.9
Fuente: The Wall Street Journal, 25 de marzo, 2004, C2.

La media poblacional
La media poblacional se representa por medio del smbolo , la letra griega mu minscula. La
ecuacin (3.13) define a la media poblacional.

MEDIA POBLACIONAL
La media poblacional es la suma de los valores de la poblacin dividida por el tamao de la po-
blacin N.

N
Xi
i =1
= (3.13)
N
donde = media poblacional
Xi = i-simo valor de la variable X
N
XXi = sumatoria de todos los valores Xi de la poblacin
i =1

Para calcular el rendimiento medio de la poblacin de bonos de capital listados en la tabla 3.5, se uti-
liza la ecuacin (3.13),

N
Xi 3.8 + 6.5 + 7.0 + 7.3 + 12.9 37.5
i =1
= = = = 7.5
N 5 5

De esta manera, el rendimiento medio en 2003 de tales bonos de capital es del 7.5%.
3.2: Medidas numricas descriptivas de una poblacin 95

Varianza y desviacin estndar poblacionales


La varianza poblacional y la desviacin estndar poblacional miden la variacin en una pobla-
cin. Al igual que los estadsticos muestrales relacionados, la desviacin estndar poblacional es
igual a la raz cuadrada de la varianza poblacional. El smbolo 2, que es la letra griega sigma
minscula elevada al cuadrado, representa la varianza poblacional y el smbolo , la misma letra
griega minscula pero sin elevar al cuadrado, representa la desviacin estndar poblacional. Las
ecuaciones (3.14) y (3.15) definen esos parmetros. Los denominadores de los trminos de la dere-
cha de estas ecuaciones utilizan N y no el trmino (n 1) que se emplea para la varianza y la desvia-
cin estndar de las muestras [vea las ecuaciones (3.9) y (3.10) de la pgina 82].

VARIANZA POBLACIONAL

La varianza poblacional es la suma de las diferencias con respecto a la media de la poblacin ele-
vada al cuadrado y dividida por el tamao de la poblacin N.

N
( X i )2
i =1
2 = (3.14)
N

donde = media poblacional

Xi = i-simo valor de la variable X

N
( X i )2 = sumatoria de todas las diferencias entre los valores Xi y ,
i =1 elevadas al cuadrado

DESVIACIN ESTNDAR POBLACIONAL

N
( X i )2
i =1
= (3.15)
N

Para calcular la varianza poblacional correspondiente a los datos de la tabla 3.5 de la pgina 94,
se utiliza la ecuacin (3.14),

N
( X i )2
i =1
2 =
N
( 3.8 7.5) 2 + (6.5 7.5) 2 + ( 7.0 7.5) 2 + ( 7.3 7.5) 2 + (12.9 7.5) 2
=
5
13.69 + 1.00 + 0.25 + 0.04 + 29.16
=
5
44.14
= = 8.828
5
96 CAPTULO 3 Medidas numricas descriptivas

De esta forma, la varianza de los rendimientos es de 8.828 unidades porcentuales de rendimien-


to al cuadrado. Las unidades cuadradas hacen que la varianza sea difcil de interpretar. Debe utilizar-
se la desviacin estndar, que emplea las unidades originales de los datos (rendimiento porcentual).
A partir de la ecuacin (3.15),

N
( X i )2
i =1
= 2 = = 8.828 = 2.97
N

Por lo tanto, el rendimiento tpico en 2003 difiere de la media de 7.5 en aproximadamente 2.97. Es-
ta enorme variacin sugiere que los grandes bonos de capital tienen resultados muy distintos.

La regla emprica
En la mayora de los conjuntos de datos, una gran parte de los valores tienden a agruparse en algn
lugar cercano a la mediana. En los conjuntos de datos asimtricos a la derecha, el agrupamiento se
presenta a la izquierda de la media, es decir en un valor menor que la media. En los conjuntos de da-
tos asimtricos a la izquierda, el agrupamiento se presenta a la derecha de la media, es decir en un
valor mayor que la media. En los conjuntos de datos simtricos, donde la mediana y la media son
iguales, con frecuencia los valores tienden a agruparse alrededor de la media y la mediana, generan-
do una distribucin con forma de campana. En las distribuciones de esta clase, utilizar la regla em-
prica permite examinar la variabilidad:

Aproximadamente el 68% de los valores se encuentran a una distancia de 1 desviacin estn-


dar de la media.
Aproximadamente el 95% de los valores se encuentran a una distancia de 2 desviaciones es-
tndar de la media.
Aproximadamente el 99.7% se encuentran a una distancia de 3 desviaciones estndar de la
media.

La regla emprica ayuda a medir cmo se distribuyen los valores por encima y debajo de la
media. Esto permite identificar los valores atpicos cuando se analiza un conjunto de datos numri-
cos. La regla emprica implica que, en las distribuciones con forma de campana, aproximadamente
slo uno de cada 20 valores estar alejado de la media ms all de dos desviaciones estndar en cual-
quier direccin. Por regla general, los valores que no se encuentran en el intervalo 2 se consi-
deran como posibles atpicos. Esta regla tambin implica que slo alrededor de tres de cada 1,000
estarn alejados de la media ms all de tres desviaciones estndar. Por lo tanto, casi siempre se con-
sideran como extremos los valores que no se encuentran en el intervalo 3. En los conjuntos de
datos con mucha asimetra, o en los que por alguna otra razn no tienen forma de campana, en lugar
de la regla emprica se debe aplicar la regla de Chebyshev, que se explica en la pgina 97.

EJEMPLO 3.12 USO DE LA REGLA EMPRICA


La cantidad media de llenado de una poblacin integrada por 12 latas de gaseosa es de 12.06 onzas,
con una desviacin estndar de 0.02. Tambin se sabe que esta poblacin tiene forma de campana.
Describa la distribucin de la cantidad de llenado de las latas. Existe una gran probabilidad de que
una lata tenga menos de 12 onzas de gaseosa?
SOLUCIN = 12.06 0.02 = (12.04, 12.08 )
2 = 12.06 2(0.02 ) = (12.02, 12.10 )
3 = 12.06 3(0.02 ) = (12.00, 12.12 )

Utilizando la regla emprica, aproximadamente el 68% de las latas tendrn entre 12.04 y 12.08 on-
zas, aproximadamente el 95% tendr entre 12.02 y 12.10 onzas, y aproximadamente el 99.7% tendr
entre 12.00 y 12.12 onzas. As que es muy poco probable que una lata tenga menos de 12 onzas.
3.2: Medidas numricas descriptivas de una poblacin 97

La regla de Chebyshev
La regla de Chebyshev (referencia 1) establece que para todo conjunto de datos, independiente-
mente de su forma, el porcentaje de valores que se encuentran a una distancia de k desviaciones es-
tndar o menos de la media, debe ser por lo menos igual a

(1 1/k2) 100%

Puede usar esta regla para todo valor de k mayor que 1. Considere una k = 2. La regla de Chebyshev
establece que al menos [1 (1/2)2] 100% = 75% de los valores deben estar dentro de 2 desvia-
ciones estndar de la media.
La regla de Chebyshev es muy general y se aplica a cualquier tipo de distribucin. La regla se-
ala por lo menos el porcentaje de valores que quedan dentro de una distancia dada de la media. Sin
embargo, si el conjunto de datos tiene una forma que se aproxima a la de campana, la regla empri-
ca reflejar con mayor precisin la mayor concentracin de datos cerca de la media. En la tabla 3.6
se comparan la regla emprica y la de Chebyshev.

TABLA 3.6 Porcentaje de valores encontrados en intervalos alrededor de la media


Variacin de los datos Chebyshev Regla emprica
con respecto a la Intervalo (para toda distribucin) (distribucin con forma de campana)
media.
( , + ) Al menos 0% Aproximadamente 68%
( 2, + 2) Al menos 75% Aproximadamente 95%
( 3, + 3) Al menos 88.89% Aproximadamente 99.7%

EJEMPLO 3.13 USO DE LA REGLA DE CHEBYSHEV


Como en el ejemplo 3.12, la media de la cantidad de llenado de una poblacin integrada por 12 latas
de gaseosa es de 12.06 onzas y una desviacin estndar de 0.02. Sin embargo, no se conoce la forma de
la poblacin y no es posible suponer que tiene forma de campana. Describa la distribucin de la can-
tidad de llenado de las latas. Existe una gran probabilidad de que una lata tenga menos de 12 onzas
de gaseosa?
SOLUCIN = 12.06 0.02 = (12.04, 12.08 )
2 = 12.06 2(0.02 ) = (12.02, 12.10 )
3 = 12.06 3(0.02 ) = (12.00, 12.12 )

Como la distribucin posiblemente sea asimtrica, no es pertinente utilizar la regla emprica. Usan-
do la regla de Chebyshev no se puede decir algo sobre el porcentaje de latas que tienen entre 12.04
y 12.08 onzas. Es posible determinar que al menos el 75% de las latas tendrn entre 12.02 y 12.10
onzas, y que por lo menos el 88.89% tendrn entre 12.00 y 12.12 onzas. Por lo tanto, entre 0 y
11.11% de las latas tienen menos de 12 onzas.

Cuando se tienen datos muestrales, estas dos reglas permiten entender cmo se distribuyen los
datos alrededor de la media. En todo caso, use el valor de X  que calcul, en lugar de y el que
calcul para S en lugar de . Los resultados calculados empleando los estadsticos muestrales son
, S) y no parmetros poblacionales (, ).
aproximaciones, ya que utiliz estadsticos muestrales (X
98 CAPTULO 3 Medidas numricas descriptivas

PROBLEMAS PARA LA SECCIN 3.2


Aprendizaje bsico c. De acuerdo con la regla de Chebyshev, qu porcentaje de
estos fondos se espera que estn dentro de 1, 2 o 3 des-
ASISTENCIA3.21 A continuacin se presenta un conjunto de da- viaciones estndar de la media?
tos para una poblacin con N = 10:
de PH Grade
d. De acuerdo con la regla de Chebyshev, se espera que al me-
7 5 11 8 3 6 2 1 9 8 nos el 93.75% de estos fondos tengan rendimientos totales
a. Calcule la media poblacional. anuales entre cules dos cantidades?
b. Calcule la desviacin estndar poblacional. 3.25 En la siguiente tabla ASSETS se representan los activos de
ASISTENCIA 3.22 A continuacin se presenta un conjunto de da-
cinco grandes fondos de capital, en miles de millones de d-
de PH Grade tos para una poblacin con N = 10: lares.
7 5 6 6 6 4 8 6 9 3
a. Calcule la media poblacional. Activos
b. Calcule la desviacin estndar poblacional. (miles de millones
Fondo de capital de dlares)
Aplicacin de conceptos Vanguard GNMA 19.5
AUTO 3.23 Los siguientes datos representan las declara- Vanguard Total Bond Mkt. Index 16.8
Examen ciones trimestrales de impuestos por ventas (en mi- Bond Fund of America A 13.7
les de dlares), correspondientes al periodo que fina- Franklin Calif. Tax-Free Inc. A 12.8
liz en marzo de 2004, enviados al contralor del poblado Fair Vanguard Short-Term Corp. 10.9
Lake por los 50 negocios establecidos en dicha localidad: TAX

10.3 11.1 9.6 9.0 14.5


a. Calcule la media de esta poblacin constituida por los cinco
13.0 6.7 11.0 8.4 10.3 bonos de capital ms grandes. Interprete este parmetro.
13.0 11.2 7.3 5.3 12.5 b. Calcule la varianza y la desviacin estndar de esta pobla-
8.0 11.8 8.7 10.6 9.5 cin. Interprete estos parmetros.
c. Existe mucha variabilidad en los activos de los fondos de
11.1 10.2 11.1 9.9 9.8
capital?
11.6 15.1 12.5 6.5 7.5
3.26 Los datos del archivo ENERGY contienen el consumo de
10.0 12.9 9.2 10.0 12.8
energa per cpita en kilowatts-hora de cada uno de los 50 esta-
12.5 9.3 10.4 12.7 10.5 dos y el distrito de Columbia, que constituyen a Estados Unidos,
9.3 11.5 10.7 11.6 7.8 durante 1999.
10.5 7.6 10.1 8.9 8.6 a. Calcule la media, la varianza y desviacin estndar de la po-
blacin.
a. Calcule la media, la varianza y la desviacin estndar de es- b. Qu proporcin de estos estados tienen un consumo de
ta poblacin. energa promedio per cpita dentro de 1 desviacin estn-
b. Qu proporcin de estos negocios tienen declaraciones tri- dar de la media, dentro de 2 desviaciones estndar de la
mestrales de impuestos sobre ventas dentro de 1, 2 o 3 media, y dentro de 3 desviaciones estndar de la media?
desviaciones estndar de la media? c. Compare y encuentre las diferencias entre sus hallazgos
c. Compare y encuentre las diferencias entre sus hallazgos con contra lo que cabra esperar de acuerdo con la regla empri-
lo que cabra esperar de acuerdo con la regla emprica. Le ca. Le sorprenden los resultados obtenidos en b)?
sorprenden los resultados obtenidos en b)? d. Eliminando los datos correspondientes al distrito de Colum-
bia en los incisos a) a c), cmo cambian los resultados?
ASISTENCIA 3.24 Considere una poblacin de 1,024 fondos de 3.27 Los datos en el archivo DOWRETURN muestran el rendi-
de PH Gradeinversin que invierten principalmente en empresas miento anualizado de 10 aos (1994-2003) correspondiente a
grandes. Usted determin que , la media del por- 30 empresas incluidas en el Dow Jones Industrials.
centaje total anual de rendimientos obtenidos por todos los fon- a. Calcule la media de esta poblacin. Interprete este nmero.
dos es 8.20 y que , la desviacin estndar, es 2.75. Suponga b. Calcule la varianza y la desviacin estndar de esta pobla-
adems que determin que el rango del porcentaje total anual cin. Interprete la desviacin estndar.
va de 2.0 a 17.1 y que los cuartiles son 5.5 (Q1) y 10.5(Q3), c. Utilice la regla emprica o la de Chebyshev, la que resulte
respectivamente. De acuerdo con la regla emprica, qu por- apropiada, para explicar an ms la variacin de este con-
centaje de estos fondos se espera que estn junto de datos.
a. dentro de 1 desviaciones estndar de la media? d. Utilizando los resultados de c), existen algunos datos atpi-
b. dentro de 2 desviaciones estndar de la media? cos? Explique su respuesta.
3.3: Anlisis exploratorio de datos 99

3.3 ANLISIS EXPLORATORIO DE DATOS


En la seccin 3.1 se analizaron estadsticos muestrales para datos numricos como son las medidas
de tendencia central, variacin y forma. Otra manera de describir datos numricos es mediante el
anlisis exploratorio de datos, que incluye el resumen de cinco nmeros y la grfica de caja y bigo-
te (referencias 5 y 6).

Resumen de cinco nmeros


Un resumen de cinco nmeros compuesto por:

Xmenor Q1 Mediana Q3 Xmayor

permite determinar la forma de la distribucin. En la tabla 3.7 se explica cmo las relaciones entre
los cinco nmeros le permiten reconocer la forma del conjunto de datos.

TABLA 3.7 Tipo de distribucin


Relaciones entre el Asimtrico a Asimtrico
resumen de cinco Comparacin la izquierda Simtrico a la derecha
nmeros y el tipo de
distribucin La distancia de La distancia de Xmenor Ambas distancias La distancia de Xmenor
Xmenor a la mediana a la mediana es son iguales. a la mediana es
contra la distancia mayor que menor que
de la mediana a la distancia de la la distancia de la
Xmayor. mediana a Xmayor. mediana a Xmayor.

La distancia de La distancia de Ambas distancias La distancia de


Xmenor a Q1 contra Xmenor a Q1 es mayor son iguales. Xmenor a Q1 es menor
la distancia de Q3 a que la distancia de que la distancia de
Xmayor. Q3 a Xmayor. Q3 a Xmayor.

La distancia de Ql La distancia de Q1 a Ambas distancias La distancia de Q1 a


a la mediana contra la mediana es mayor son iguales. la mediana es menor
la distancia de la que la distancia de la que la distancia de la
mediana a Q3 mediana a Q3 mediana a Q3.

Para la muestra de 10 tiempos necesarios para arreglarse, el menor valor es 29 minutos y el ma-
yor es 52 minutos (vea las pginas 75 y 77). Los clculos ya realizados en la seccin 3.1 indican que
la mediana = 39.5, el primer cuartil = 35, y el tercer cuartil = 44. Por lo tanto, el resumen de cinco
puntos es:
29 35 39.5 44 52
La distancia de Xmenor a la mediana (39.5 29 = 10.5) es ligeramente menor que la distancia de
la mediana a Xmayor (52 39.5 = 12.5). La distancia de Xmenor a Q1 (35 29 = 6) es ligeramente me-
nor que la distancia de Q3 a Xmayor (52  44 = 8). De esta forma, los tiempos para arreglarse son li-
geramente asimtricos a la derecha.

EJEMPLO 3.14 CLCULO DEL RESUMEN DE LOS CINCO NMEROS DEL PORCENTAJE
DE RENDIMIENTO EN 2003 DE LOS FONDOS DE INVERSIN DE ALTO
RIESGO PARA PEQUEOS CAPITALES
Los 121 fondos de inversin que forman parte del escenario Uso de la estadstica (vea la pgina
72), se clasifican de acuerdo con el nivel de riesgo (bajo, medio y alto) y el tamao del capital inver-
tido (pequeo, mediano y gran capital). Calcule el resumen de cinco puntos del rendimiento en 2003
de los nueve fondos de inversin de alto riesgo para pequeos capitales. MUTUALFUNDS2004
100 CAPTULO 3 Medidas numricas descriptivas

SOLUCIN
De los clculos previos realizados a los rendimientos en 2003 de los fondos de alto riesgo para pe-
queos capitales (vea las pginas 76 y 78), la mediana = 53.8, el primer cuartil = 41.7, y el tercer
cuartil = 60.85. Adems, el menor valor del conjunto de datos es 37.3 y el mayor es 66.5. Por lo tan-
to, el resumen de cinco puntos es:

37.3 41.7 53.8 60.85 66.5

La distancia de Xmenor a la mediana (53.8 37.3 = 16.5) es mayor que la distancia de la media-
na a Xmayor (66.5 53.8 = 12.7). Esto indica asimetra a la izquierda. La distancia de Xmenor a Q1
(41.7 37.3 = 4.4) es ligeramente menor que la distancia de Q3 a Xmayor (66.5 60.85 = 5.65). Esto
indica una ligera asimetra a la derecha. Por lo tanto, los resultados son incongruentes.

Grfica de caja y bigote


La grfica de caja y bigote ofrece una representacin visual de los datos basada en el resumen de
cinco nmeros. En la figura 3.4 se ilustra la grfica de caja y bigote de los tiempos necesarios para
arreglarse.

FIGURA 3.4
Grfica de caja y bigote
del tiempo necesario
para arreglarse.

Xmenor Xmayor
Q1 Mediana Q3

20 25 30 35 40 45 50 55
Tiempo (minutos)

La lnea vertical dibujada dentro de la caja representa a la mediana. La lnea vertical a la iz-
quierda de la caja representa la ubicacin de Q1 y la lnea vertical a la derecha de la caja representa
la ubicacin de Q3. De esta forma, la caja contiene al 50% de los valores de la distribucin. El 25%
inferior de los datos se representa mediante una lnea (es decir, un bigote) que une el lado izquierdo
de la caja con la ubicacin del menor valor, Xmenor. De la misma manera, el 25% superior de los da-
tos se representa mediante un bigote que une el lado derecho de la caja con la ubicacin del valor
mayor, Xmayor.
La grfica de caja y bigote de los tiempos necesarios para arreglarse que aparece en la figura
3.4 muestra una muy ligera asimetra a la derecha, ya que la distancia entre la mediana y el valor ma-
yor es levemente mayor que la distancia entre el menor valor y la mediana. El bigote derecho es un
poco ms largo que el izquierdo.

EJEMPLO 3.15 GRFICA DE CAJA Y BIGOTE DEL RENDIMIENTO PORCENTUAL EN 2003


DE LOS FONDOS DE INVERSIN DE RIESGO BAJO, PROMEDIO Y ALTO
Los 121 fondos de inversin que forman parte del escenario Uso de la estadstica (vea la pgina
72) se clasifican de acuerdo con su nivel de riesgo (bajo, medio y alto) y tamao del capital inverti-
do (pequeo, mediano y gran capital). Construya la grfica de caja y bigote para los rendimientos en
2003 para los fondos de inversin de riesgo bajo, promedio y alto. MUTUALFUNDS2004
3.3: Anlisis exploratorio de datos 101

SOLUCIN
En la figura 3.5 aparece la grfica de caja y bigote de los rendimientos en 2003 para los fondos de
inversin de riesgo bajo, promedio, y alto, elaborada en Minitab. Este programa muestra la grfica
de manera vertical, de inferior (bajo) a superior (alto). El asterisco (*) de los fondos de riesgo pro-
2Si existen valores atpicos, medio representa la presencia de valores atpicos.2 La media del porcentaje de rendimiento y los
los bigotes de la grfica de cuartiles de los fondos de alto riesgo son mayores que los correspondientes a los fondos de riesgo
caja y bigote de Minitab se bajo o promedio. Los fondos de riesgo promedio son asimtricos a la derecha, a causa del rendi-
extienden 1.5 veces el rango miento extremadamente alto de uno de ellos (78). Los fondos de alto riesgo aparecen asimtricos a
intercuartil ms all de los la izquierda por el largo bigote inferior, pero la mediana del rendimiento est ms cerca del primer
cuartiles o hasta el valor ms cuartil que del tercero. Los fondos de bajo riesgo aparecen ligeramente asimtricos a la derecha por-
alto. que el bigote superior es ms largo que el interior.

FIGURA 3.5
Grfica de caja y bigote Cuadro-grfica de rendimiento en 2003 vs. riesgo
de los rendimientos en
2003, en Minitab, para
los fondos de inversin
de riesgo bajo,
Rendimiento en 2003

promedio y alto.

promedio alto bajo


Riesgo

En la figura 3.6 se comprueba la relacin que existe entre la grfica de caja y bigote y el polgo-
no de cuatro tipos distintos de distribucin. (Nota: El rea bajo cada polgono se divide en cuartiles
que corresponden al resumen de cinco nmeros de la grfica de caja y bigote.)

FIGURA 3.6
Grficas de caja y
bigote, y sus polgonos
correspondientes, de
cuatro distribuciones. .

Panel A Panel B
Distribucin en forma de campana Distribucin asimtrica a la izquierda

Panel C Panel D
Distribucin asimtrica a la derecha Distribucin rectangular
102 CAPTULO 3 Medidas numricas descriptivas

Los paneles A y D de la figura 3.6 son simtricos. En estas distribuciones, la media y la media-
na son iguales. Adems, la longitud del bigote izquierdo es igual a la del derecho, y la lnea que re-
presenta a la mediana divide la caja por la mitad.
El panel B de la figura 3.6 es asimtrico a la izquierda. Los pocos valores pequeos inclinan a
la media hacia la punta izquierda. Para esta distribucin asimtrica a la izquierda, la asimetra indi-
ca que existe un marcado agrupamiento de los valores en el extremo superior de la escala (es decir,
el lado derecho); el 75% de todos los valores se encuentran entre el extremo izquierdo de la caja
(Q1) y el extremo del bigote derecho (Xmayor). Por lo tanto, el largo bigote izquierdo contiene al 25%
ms pequeo de los valores, lo que demuestra distorsin de la simetra de este conjunto de datos.
El panel C de la figura 3.6 es asimtrico a la derecha. La concentracin de valores est en el ex-
tremo inferior de la escala (es decir, en el lado izquierdo de la grfica de caja y bigote). Aqu, el
75% de todos los valores se encuentran entre el principio del bigote izquierdo (Xmenor) y el extremo
derecho de la caja (Q3), y el 25% restante de los valores se encuentran dispersos a lo largo del bigo-
te derecho, en el extremo superior de la escala.

PROBLEMAS PARA LA SECCIN 3.3

Aprendizaje bsico de manera continua hasta agotarlas. El nmero de horas que


funcionaron est en el archivo. BATTERIES
ASISTENCIA 3.28 A continuacin se presenta un conjunto de da-
de PH Grade tos para una muestra con n = 6: 342 426 317 545 264 451
7 4 9 7 3 12 1,049 631 512 266 492 562 298

a. Elabore el resumen de cinco nmeros. a. Elabore el resumen de cinco nmeros.


b. Construya su grfica de caja y bigote, y describa la forma. b. Construya su grfica de caja y bigote, y describa la forma.
c. Compare su respuesta del inciso b) con la del problema 3.2d) 3.32 Durante el ciclo escolar 2002-2003, muchas universi-
de la pgina 90. Analcela. dades estadounidenses elevaron sus cuotas y tarifas de manu-
ASISTENCIA 3.29 A continuacin se presenta un conjunto de da- tencin, como consecuencia de la reduccin de los subsidios
de PH Grade tos para una muestra con n = 7: estatales (Mary Beth Marklein, Public Universities Raise Tui-
tion, Fees -and Ire, USA Today, 8 de agosto, 2002, 1A-2A). A
12 7 4 9 0 7 3 continuacin se representa el cambio del costo de inscripcin,
a. Elabore el resumen de cinco nmeros. un dormitorio compartido y el plan de alimentacin ms solici-
b. Realice su grfica de caja y bigote, y describa la forma. tado entre los ciclos escolares 2001-2002 y 2002-2003, para
c. Compare su respuesta del inciso b) con la del problema 3.3c) una muestra de 10 universidades pblicas. COLLEGECOST
de la pgina 90. Analcela.
3.30 A continuacin se presenta un conjunto de datos para una Cambio en
muestra con n = 5: Universidad el costo ($)
7 5 8 7 9 University of California, Berkeley 1,589
a. Elabore el resumen de cinco nmeros. University of Georgia, Athens 593
b. Construya su grfica de caja y bigote, y describa la forma. University of Illinois, Urbana-Champaign 1,223
c. Compare su respuesta del inciso b) con la del problema 3.4c) Kansas State University, Manhattan 869
de la pgina 90. Analcela. University of Maine, Orono 423
University of Mississippi, Oxford 1,720
University of New Hampshire, Durham 708
Aplicacin de conceptos
Ohio State University, Columbus 1,425
Puede resolver los problemas 3.31 a 3.36 manual- University of South Carolina, Columbia 922
mente o en Excel, Minitab o SPSS. Utah State University, Logan 308

ASISTENCIA AUTO 3.31 Un fabricante de bateras para flash


de PH Grade Examen fotogrfico tom una muestra de 13 bate- a. Elabore el resumen de cinco nmeros.
ras de la produccin diaria y las utiliz b. Construya su grfica de caja y bigote, y describa la forma.
3.4: La covarianza y el coeficiente de correlacin 103

3.33 Una empresa dedicada a la consultora y al desarrollo de Hamburguesas


software, ubicada en el rea metropolitana de Phoenix, desarro- 19 31 34 35 39 39 43
lla software para sistemas administrativos de cadenas de sumi-
nistro y se vale de la reutilizacin sistemtica de software. En Pollo
lugar de comenzar desde cero para elaborar y desarrollar nue- 7 9 15 16 16 18 22 25 27 33 39
vos sistemas personalizados de software, utiliza una base de da-
tos que contiene componentes reutilizables que suman ms de Fuente: Quick Bites, Copyright 2001 por Consumers Union of US.,
Inc., Yonkers, NY 10703-1057. Adaptado con autorizacin de Consumer
2,000,000 de lneas de cdigo, recopilados a lo largo de 10 aos
Reports, marzo de 2001, 46.
de actividades continuas. Se pide a ocho analistas de la empre-
sa que calculen la tasa de reutilizacin cuando se desarrolla un
a. Elabore el resumen de cinco puntos para las hamburguesas y
nuevo sistema de software. Los siguientes datos corresponden
para los productos de pollo.
al porcentaje total de cdigo que procede de la base de datos de
b. Construya la grfica de caja y bigote para las hamburguesas
reutilizacin y forma parte del sistema de software. REUSE
y los productos de pollo, y describa la forma de la distribu-
50.0 62.5 37.5 75.0 45.0 47.5 15.0 25.0 cin de cada una.
c. Qu similitudes y diferencias existen en la distribucin de
Fuente: M. A. Rothenberger y K. J. Dooley, A Performance Measure for hamburguesas y de productos de pollo?
Software Reuse Projects, Decision Sciences, 30 (Otoo de 1999), 1131-
1153. 3.36 Una sucursal bancaria ubicada en una zona comercial de
a. Elabore el resumen de cinco nmeros. la ciudad desarroll un proceso mejorado para atender a sus
b. Realice su grfica de caja y bigote, y describa la forma de clientes durante la hora del almuerzo a medioda, hasta la 1:00
los datos. PM. Durante una semana se registra el tiempo de espera en mi-
nutos (definido de manera operacional como el tiempo transcu-
3.34 Los siguientes datos representan la tarifa (en dlares) por rrido desde que el cliente se forma en la fila hasta que llega a la
cheque devuelto de una muestra de 23 bancos, para los clientes ventanilla del cajero) de todos los clientes en ese horario. Se se-
de depsito directo que conservan un saldo de $100 y la cuota lecciona una muestra aleatoria de 15 clientes, y los resultados
(en dlares) mensual por manejo de cuenta, si sus cuentas no son los siguientes: BANK1
conservan el saldo mnimo requerido de $1,500, de una muestra
de 26 bancos. BANKCOST1 BANKCOST2 4.21 5.55 3.02 5.13 4.77 2.34 3.54
Tarifa por cheque devuelto 3.20 4.50 6.10 0.38 5.12 6.46 6.19 3.79

26 28 20 20 21 22 25 25 18 25 15 20 18 20 25 25 22 30 30 30 15 20 29 Otra sucursal, ubicada en una zona residencial, tambin est


Cuota mensual por manejo de cuenta preocupada por el horario del almuerzo de medioda hasta la
1:00 PM. Durante una semana, se registra el tiempo de espera en
12 8 5 5 6 6 10 10 9 7 10 7 7 5 0 10 6 9 12 0 5 10 8 5 5 9 minutos (definido como el tiempo transcurrido desde que el
Fuente: The New Face of Banking, Copyright 2000 por Consumers
cliente se forma en la fila hasta que llega a la ventanilla del ca-
Union of U.S., Inc., Yonkers, NY 10703-1057. Adaptado con autorizacin jero) de todos los clientes en ese horario. Se selecciona una
de Consumer Reports, junio de 2000. muestra aleatoria de 15 clientes, y los resultados son los si-
guientes: BANK2
a. Elabore el resumen de cinco nmeros de la tarifa por cheque
devuelto y de la cuota mensual por manejo de cuenta. 9.66 5.90 8.02 5.79 8.73 3.82 8.01
b. Realice la grfica de caja y bigote de la tarifa por cheque de- 8.35 10.49 6.68 5.64 4.08 6.17 9.91 5.47
vuelto y de la cuota mensual por manejo de cuenta.
c. Qu similitudes y diferencias existen en la distribucin de a. Elabore el resumen de cinco nmeros para tiempo de espera
la tarifa por cheque devuelto y de la cuota mensual por ma- en ambas sucursales bancarias.
nejo de cuenta? b. Construya la grfica de caja y bigote, y describa la forma de
3.35 Los siguientes datos representan el total de grasas en la distribucin de las dos sucursales.
hamburguesas y artculos de pollo tomados de una muestra de c. Qu similitudes y diferencias existen en la distribucin de
cadenas de comida rpida. FASTFOOD los tiempos de espera en ambas sucursales bancarias?

3.4 LA COVARIANZA Y EL COEFICIENTE DE CORRELACIN


En la seccin 2.5, usted utiliz los diagramas de dispersin para examinar de forma visual la rela-
cin que existe entre dos variables numricas. En esta seccin, se analizan la covarianza y el coefi-
ciente de correlacin, que miden la fortaleza de la relacin entre dos variables numricas.

La covarianza
La covarianza mide la fortaleza de la relacin lineal entre dos variables numricas (X y Y). La ecua-
cin 3.16 define la covarianza de una muestra y el ejemplo 3.16 ilustra su uso.
104 CAPTULO 3 Medidas numricas descriptivas

LA COVARIANZA MUESTRAL
n
( X i X )(Yi Y )
i =1
cov( X , Y ) = (3.16)
n 1

EJEMPLO 3.16 CLCULO DE LA COVARIANZA DE UNA MUESTRA


Considere el coeficiente de gastos y los rendimientos en 2003 de los fondos de inversin de alto ries-
go para pequeos capitales. Calcule la covarianza de la muestra.
SOLUCIN
La tabla 3.8 presenta el coeficiente de gastos y los rendimientos de los fondos de inversin de alto
riesgo para pequeos capitales, y en la figura 3.7 aparece una hoja de Excel que calcula la covarian-
za de esos datos. El rea de clculos de la figura 3.7 descompone la ecuacin (3.16) en un conjunto
de clculos ms pequeos. A partir de la celda C17, o directamente por la ecuacin (3.16), se sabe
que la covarianza es 1.19738.

9.579
cov( X , Y ) =
9 1
= 1.19738

TABLA 3.8 Coeficiente de gastos Rendimiento en 2003


Coeficiente de gastos y 1.25 37.3
rendimientos en 2003 0.72 39.2
de los fondos de 1.57 44.2
inversin de alto riesgo 1.40 44.5
para pequeos 1.33 53.8
capitales. 1.61 56.6
1.68 59.3
1.42 62.4
1.20 66.5

FIGURA 3.7
Hoja de Excel que
calcula la covarianza
entre el coeficiente
de gastos y los
rendimientos en 2003
de los fondos de alto
riesgo para pequeos
capitales.
3.4: La covarianza y el coeficiente de correlacin 105

La covarianza tiene un defecto importante como medida de la relacin lineal entre dos variables
numricas. Como la covarianza puede tener cualquier valor, es imposible determinar la fortaleza re-
lativa de la relacin. Para ello, es necesario calcular el coeficiente de correlacin.

Coeficiente de correlacin
El coeficiente de correlacin mide la fortaleza relativa de una relacin lineal entre dos variables nu-
mricas. Los valores del coeficiente de correlacin varan desde 1 para una correlacin negativa
perfecta, hasta +1 para una correlacin positiva perfecta. Perfecta quiere decir que si se trazaran los
puntos en un diagrama de dispersin, todos ellos se podran unir por medio de una lnea recta. Al tra-
tar con datos poblacionales para variables numricas, se utiliza la letra griega como smbolo del
coeficiente de correlacin. En la figura 3.8 se ilustran tres tipos diferentes de asociacin entre dos
variables.

FIGURA 3.8
Tipos de asociacin Y Y Y
entre variables.

X X X
Panel A Panel B Panel C
Correlacin negativa Sin correlacin Correlacin positiva
perfecta (r = 1) (r = 0) perfecta (r = +1)

En el panel A de la figura 3.8 hay una relacin lineal negativa perfecta entre X y Y. De esta ma-
nera, el coeficiente de relacin es igual a 1, y al aumentar X, Y disminuye de una manera perfec-
tamente predecible. El panel B ilustra una situacin en la que no existe relacin entre X y Y. En este
caso, el coeficiente de correlacin es igual a 0, y al aumentar X no existe tendencia de Y a aumen-
tar ni disminuir. El panel C ilustra una relacin positiva perfecta en la que es igual a +1. En este ca-
so, Y aumenta de una manera perfectamente predecible cuando lo hace X.
Cuando se tienen datos muestrales, se calcula el coeficiente muestral de correlacin r. Al utilizar
los datos de una muestra, es difcil que se tenga un coeficiente muestral de exactamente +1 o 1. En
la figura 3.9 de la pgina 106 se presentan diagramas de dispersin, con sus respectivos coeficientes
muestrales de correlacin r para seis conjuntos de datos, cada uno de los cuales contiene 100 valo-
res de X y Y.
En el panel A, el coeficiente de correlacin r es 0.9. Como se observa, donde los valores de X
son ms pequeos existe una fuerte tendencia a que los valores de Y sean grandes. De la misma for-
ma, los valores pequeos de X tienden a hermanarse con valores pequeos en Y. No todos los datos
quedan sobre una lnea recta, por lo que la asociacin entre X y Y no se describe como perfecta. Los
datos del panel B tienen un coeficiente de correlacin igual a 0.6, y los valores pequeos de X tien-
den a hermanarse con los valores grandes de Y. La relacin lineal entre X y Y en el panel B no es tan
fuerte como en el panel A. As, el coeficiente de correlacin en el panel B no es tan negativo como
en el panel A. En el panel C, la relacin lineal entre X y Y es muy dbil, r = 0.3, y slo existe una
ligera tendencia de los valores pequeos de X a hermanarse con los ms grandes de Y. En los pane-
les D a F se describen conjuntos de datos con coeficientes de correlacin positivos, porque los valo-
res pequeos de X tienden a hermanarse con los valores pequeos de Y, y los valores grandes de X
tienden a asociarse con los valores grandes de Y.
En el anlisis de la figura 3.9, las relaciones se describieron deliberadamente como tendencias
y no como causa-efecto. Ese trmino se utiliz con un propsito. La sola correlacin no prueba que
106 CAPTULO 3 Medidas numricas descriptivas

FIGURA 3.9 Seis diagramas de dispersin creados con Minitab y sus respectivos
coeficientes de correlacin r.

existe un efecto de causalidad, es decir, que el cambio en el valor de una variable caus el cambio en
la otra variable. Una correlacin fuerte puede producirse por simple coincidencia, por el efecto de
una tercera variable que no se tom en cuenta en el clculo, o por una relacin de causa-efecto. Se-
ra necesario realizar un anlisis adicional para determinar cul de estas tres situaciones produce
verdaderamente la correlacin. Por tanto, se afirma que la causalidad implica correlacin, pero la so-
la correlacin no implica causalidad.
La ecuacin (3.17) define el coeficiente muestral de correlacin r y el ejemplo 3.17 ilustra
su uso.
3.4: La covarianza y el coeficiente de correlacin 107

COEFICIENTE MUESTRAL DE CORRELACIN


cov( X , Y )
r = (3.17)
S X SY

n
( X i X )(Yi Y )
i =1
donde cov(X, Y) =
n 1

n
( X i X )2
i =1
SX =
n 1

n
(Yi Y )2
i =1
SY = n 1

El ejemplo 3.17 ilustra el clculo del coeficiente muestral de correlacin r mediante la ecuacin
(3.17).

EJEMPLO 3.17 CLCULO DEL COEFICIENTE MUESTRAL DE CORRELACIN


Considere el coeficiente de gastos y los rendimientos en 2003 de los fondos de inversin de alto ries-
go para pequeos capitales. A partir de la figura 3.10 y de la ecuacin (3.17), calcule el coeficiente
muestral de correlacin.
SOLUCIN cov( X , Y )
r =
S X SY
1.19738
=
( 0.287663)(10.554383)
= 0.3943786
FIGURA 3.10
Hoja de Excel que
calcula el coeficiente
de correlacin entre
los gastos y los
rendimientos en 2003
de los fondos de alto
riesgo para pequeos
capitales.
108 CAPTULO 3 Medidas numricas descriptivas

El coeficiente de gastos y los rendimientos en 2003 de los fondos de inversin de alto riesgo pa-
ra pequeos capitales estn correlacionados de forma positiva. Los fondos de inversin con menores
coeficientes de gastos tienden a relacionarse con los menores rendimientos en 2003. Los fondos de
inversin con mayores coeficientes de gastos tienden a relacionarse con los mayores rendimientos
en 2003. Esta relacin es muy dbil, como lo indica el coeficiente de correlacin, r = 0.394.
No es posible suponer que tener un bajo coeficiente de gastos provoc los bajos rendimientos
en 2003. Slo se puede decir que eso es lo que tiende a ocurrir en la muestra. Como con todas las in-
versiones, los resultados del pasado no avalan los del futuro.

En resumen, el coeficiente de correlacin seala la relacin, o asociacin, lineal entre dos varia-
bles numricas. Cuando el coeficiente de correlacin se acerca a +1 o 1, es ms fuerte la relacin
lineal entre las dos variables. Cuando el coeficiente de correlacin se acerca a 0, existe poca o nin-
guna relacin lineal. El signo del coeficiente de correlacin seala si los datos se correlacionan de
manera positiva (es decir, los valores ms grandes de X se suelen hermanar con los valores ms
grandes de Y) o negativa (es decir, los valores ms grandes de X se suelen hermanar con los valores
ms pequeos de Y). La existencia de una correlacin fuerte no implica un efecto causal. Slo sea-
la las tendencias presentes en los datos.

PROBLEMAS PARA LA SECCIN 3.4

Aprendizaje bsico que: el coeficiente de relacin entre el rendimiento de la inver-


sin en bonos estadounidenses y acciones internacionales de
3.37 A continuacin se presenta un conjunto de datos para una
gran capital fue de 0.13; entre bonos estadounidenses y accio-
muestra con n = 11 elementos:
nes internacionales de pequeo capital fue de 0.18; entre bo-
X 7 5 8 3 6 10 12 4 9 15 18 nos estadounidenses y bonos internacionales fue de 0.48; entre
bonos estadounidenses y acciones de mercados emergentes fue
Y 21 15 24 9 18 30 36 12 27 45 54 de 0.20; y entre bonos estadounidenses y deuda de mercados
a. Calcule la covarianza. emergentes fue de 0.10.
b. Calcule el coeficiente de correlacin. a. Qu conclusiones se obtienen sobre la fortaleza de la rela-
c. Qu tan fuerte es la relacin entre X y Y? Explique su res- cin entre el rendimiento de las inversiones en bonos esta-
puesta. dounidenses y los otros cinco tipos de inversiones?
b. Compare los resultados de a) con los del problema 3.38a).
Aplicacin de conceptos 3.40 Los siguientes datos COFFEEDRINK representan las calo-
Puede resolver los problemas 3.38 a 3.43 manual- ras y la grasa (en gramos) que contienen las raciones con 16
onzas de bebidas a base de caf servidas en Dunkin Donuts y
mente o en Excel, Minitab o SPSS.
en Starbucks.
3.38 En un artculo publicado recientemente (J. Clements,
Why Investors Should Put up to 30% of Their Stock Portfolio Producto Caloras Grasa
in Foreign Funds, The Wall Street Journal, 26 de noviembre, Batido de moka helado de Dunkin
2003, D1) que analiza las inversiones en acciones extranjeras Donuts (pura leche) 240 8.0
asegura que: el coeficiente de correlacin entre el rendimiento Capuchino frap de Starbucks 260 3.5
de inversiones en acciones estadounidenses y acciones interna- Raspado de caf Coolata (crema) de
cionales de gran capital fue de 0.80; entre acciones estadouni- Dunkin Donuts 350 22.0
denses y acciones internacionales de pequeo capital fue de Caf moka exprs helado de Starbucks
0.53; entre acciones estadounidenses y bonos internacionales (pura leche y con crema batida) 350 20.0
fue de 0.03; entre acciones estadounidenses y acciones de mer- Caf moka batido helado de Starbucks
cados emergentes fue de 0.71; y entre acciones estadounidenses (con crema batida) 420 16.0
y deuda de mercados emergentes fue de 0.58. Capuchino helado de Brownie de chocolate,
a. Qu conclusiones se obtienen sobre la fortaleza de la rela- de Starbucks (con crema batida) 510 22.0
cin entre el rendimiento de inversiones en acciones esta- 77Crema de chocolate helado de Starbucks
dounidenses y los otros cinco tipos de inversiones? (con crema batida) 530 19.0
b. Compare los resultados de a) con los del problema 3.39a).
Fuente: Coffee as Candy at Dunkin Donuts and Starbucks, Derechos
3.39 Un artculo publicado recientemente (J. Clements, Why Reservados 2004 por Consumers Union of U.S., Inc., Yonkers, NY
Investors Should Put up to 30% of Their Stock Portfolio in Fo- 10703-1057, organizacin sin fines de lucro. Adaptado de Consumer Re-
reign Funds, The Wall Street Journal, 26 de noviembre, 2003, ports, junio de 2004, 9, slo con propsitos educativos. No se autoriza su
D1) que analiza las inversiones en bonos extranjeros asegura reproduccin o uso comercial. www.ConsumerReports.org
3.5: Errores en las medidas numricas descriptivas y consideraciones ticas 109

a. Calcule la covarianza de la muestra. Ciudad Traspaso Infracciones


b. Calcule el coeficiente de correlacin.
c. Qu le parece ms til para expresar la relacin que existe San Francisco 110 20.7
entre caloras y grasa: la covarianza o el coeficiente de co- Orlando 100 9.9
rrelacin? Explique por qu. Washington-Dulles 90 14.8
d. Qu conclusiones deduce acerca de la relacin entre calo- Los ngeles 88 25.1
ras y grasa? Detroit 79 13.5
San Juan 70 10.3
3.41 Los siguientes datos representan el valor de exportacio- Miami 64 13.1
nes e importaciones de varios pases en 2001: EXPIMP Nueva York-JFK 53 30.1
Washington-Reagan 47 31.8
Pas Exportaciones Importaciones Honolulu 37 14.9
Unin Europea 874.1 912.8
Fuente: Alan B. Krueger, A Small Dose of Common Sense Would Help
Estados Unidos 730.8 1180.2
Congress Break the Gridlock over Airport Security, The New York Times,
Japn 403.5 349.1 15 de noviembre, 2001, C2.
China 266.2 243.6
Canad 259.9 227.2 a. Calcule la covarianza.
Hong Kong 191.1 202.0 b. Calcule el coeficiente de correlacin.
Mxico 158.5 176.2 c. Qu conclusiones obtiene sobre la relacin que existe entre
Corea del Sur 150.4 141.1 la tasa de traspaso de los dispositivos y las infracciones de
Taiwn 122.5 107.3 seguridad detectadas?
Singapur 121.8 116.0
3.43 Los siguientes datos CELLPHONE representan el tiempo
Fuente: N. King y S. Miller, Post-Iraq Influence of U.S. Faces Test at New en horas de uso de telfonos mviles en modo digital y la capa-
Trade Talks, The Wall Street Journal, 9 de septiembre, 2003, A1. cidad de la batera en miliamperios.
a. Calcule la covarianza.
Tiempo Capacidad Tiempo Capacidad
b. Calcule el coeficiente de correlacin.
de uso de la batera de uso de la batera
c. Qu le parece ms til para expresar la relacin que existe
entre exportaciones e importaciones: la covarianza o el coe- 4.50 800 1.50 450
ficiente de correlacin? Explique por qu. 4.00 1500 2.25 900
d. Qu conclusiones puede deducir acerca de la relacin entre 3.00 1300 2.25 900
exportaciones e importaciones? 2.00 1550 3.25 900
2.75 900 2.25 700
AUTO 3.42 Los siguientes datos SECURITY representan el 1.75 875 2.25 800
Examen porcentaje de traspaso durante 1998-1999 de los dis- 1.75 750 2.50 800
positivos de vigilancia utilizados antes de abordar en 2.25 1100 2.25 900
los aeropuertos, y las infracciones de seguridad detectadas por 1.75 850 2.00 900
milln de pasajeros.
Fuente: Service Shortcomings, Copyright 2002 por Consumers Union of
Ciudad Traspaso Infracciones U.S., Inc., Yonkers, NY 10703-1057. Adaptado con autorizacin de Consu-
mer Reports, febrero de 2002, 25.
St. Louis 416 11.9
Atlanta 375 7.3
Houston 237 10.6 a. Calcule la covarianza.
Boston 207 22.9 b. Calcule el coeficiente de correlacin.
Chicago 200 6.5 c. Qu conclusiones se obtienen sobre la relacin entre la ca-
Denver 193 15.2 pacidad de la batera y el tiempo de uso en modo digital?
Dallas 156 18.2 d. Usted espera que los telfonos con batera de mayor capa-
Baltimore 155 21.7 cidad tengan un tiempo de uso superior.Lo sustentan los
Seattle/Tacoma 140 31.5 datos?

3.5 ERRORES EN LAS MEDIDAS NUMRICAS DESCRIPTIVAS


Y CONSIDERACIONES TICAS
En este captulo estudi cmo se definen las caractersticas de un conjunto de datos numricos me-
diante varios estadsticos que miden las propiedades de su tendencia central, variacin y forma. El
siguiente paso es el anlisis e interpretacin de los estadsticos calculados. Su anlisis es objetivo; su
interpretacin es subjetiva. Usted debe evitar los errores que surjan en la objetividad de su anlisis o
en la subjetividad de su interpretacin.
110 CAPTULO 3 Medidas numricas descriptivas

El anlisis de los fondos de inversin con base en el nivel de riesgo es objetivo y revela varios
descubrimientos imparciales. Objetividad al analizar datos significa reportar las medidas numricas
descriptivas ms apropiadas para un conjunto de datos determinado. Ahora que ha ledo el captulo
y se ha familiarizado con varias medidas numricas descriptivas y sus fortalezas y debilidades, c-
mo continuar con el anlisis objetivo? Como los datos se distribuyen de una manera ligeramente
asimtrica, no debera reportar la mediana adems de la media? La desviacin estndar no ofrece
ms informacin sobre la propiedad de variacin que el rango? Debe describir al conjunto de datos
como asimtrico a la derecha?
Por otra parte, la interpretacin de datos es subjetiva. Al interpretar los descubrimientos anal-
ticos, las personas elaboran conclusiones distintas. Todos vemos el mundo desde perspectivas dife-
rentes. De esta manera, puesto que la interpretacin de datos es subjetiva, usted debe hacerla de ma-
nera imparcial, neutral y clara.

Aspectos ticos
En todos los anlisis de datos, los aspectos ticos son de vital importancia. Como consumidor coti-
diano de informacin, usted debe cuestionar lo que lee en peridicos y revistas, lo que escucha en la
radio y la televisin, as como lo que ve en Internet. A lo largo del tiempo, se ha manifestado mucho
escepticismo sobre el propsito, el enfoque y la objetividad de los estudios que se publican. Quiz
ningn comentario al respecto es ms representativo que la frase atribuida al famoso estadista brit-
nico del siglo XIX, Benjamin Disraeli: Existen tres clases de mentiras: las mentiras, las mentiras de-
testables y la estadstica.
Las consideraciones ticas aparecen al decidir cules resultados incluir en un reporte. Usted de-
be documentar los resultados tanto buenos como malos. Adems, al hacer exposiciones orales y pre-
sentar reportes escritos, debe comunicar los resultados de manera imparcial, objetiva y neutral. El
comportamiento falto de tica se presenta al seleccionar de forma deliberada una medida resumida
inapropiada (por ejemplo, la media de un conjunto de datos muy asimtrico), para distorsionar los
hechos con el fin de respaldar una posicin en particular. Tambin es tico dejar de reportar de ma-
nera selectiva descubrimientos pertinentes, cuando stos no respaldan una posicin en particular.

RESUMEN
Este captulo trat sobre las medidas descriptivas. En ste y el la media, la mediana, los cuartiles, el rango, la desviacin es-
captulo anterior, estudi la estadstica descriptiva: cmo se pre- tndar y el coeficiente de correlacin. En la tabla 3.9 se presen-
sentan los datos en tablas y grficas y luego su resumen, descrip- ta una lista de las medidas descriptivas numricas incluidas en
cin, anlisis e interpretacin. Al manejar los datos relacionados este captulo.
con los fondos de inversin, usted tuvo la oportunidad de presentar En el captulo siguiente, se estudiarn los principios bsi-
informacin til mediante el uso de diagramas circulares, histo- cos de la probabilidad, con el fin de eliminar la brecha entre el
gramas y otros mtodos grficos. Explor las caractersticas del tema de la estadstica descriptiva y el de la estadstica infe-
desempeo en el pasado, como la tendencia central, variabili- rencial.
dad y forma, utilizando medidas descriptivas numricas como

TABLA 3.9 Tipo de anlisis Datos numricos


Resumen de las Describir la tendencia central, variacin y Media, mediana, moda, cuartiles, media
medidas numricas forma de una variable numrica geomtrica, rango, rango intercuartil,
descriptivas. desviacin estndar, varianza, coeficiente de
variacin, puntuaciones Z, grfica de caja y
bigote (secciones 3.1-3.3)

Describir la relacin entre dos variables numricas Covarianza, coeficiente de correlacin


(seccin 3.4)
Conceptos clave 111

F R M U L A S I M P O R TA N T E S
Media de una muestra Coeficiente de variacin
n
Xi S
CV = 100% (3.11)
X = i =1 X
n (3.1)
Puntuaciones Z
Mediana X X
Z = (3.12)
n +1 S
Mediana = valor clasificado (3.2)
2 Media poblacional
Primer cuartil Q1 N

Q1 =
n +1
valor clasificado
Xi
(3.3) = i =1
4 (3.13)
N
Tercer cuartil Q3
Varianza poblacional
3( n + 1) N
Q3 = valor clasificado (3.4)
4 ( X i )2
i =1
Media geomtrica 2 = (3.14)
1/ n
N
X G = ( X1 X 2 L X n ) (3.5)
Desviacin estndar poblacional
Media geomtrica de la tasa de rendimiento
N
RG = [(1 + R1 ) (1 + R2 ) L (1 + R n )]1/ n 1
( X i )2
(3.6)
Rango i =1
= (3.15)
Rango = Xmayor Xmenor (3.7) N
Rango intercuartil La covarianza muestral
Rango intercuartil = Q3 Q1 (3.8) n
Varianza para una muestra ( X i X )(Yi Y )
i =1
n cov( X , Y ) = (3.16)
n 1
(Xi X ) 2

i =1 Coeficiente muestral de correlacin


S2 = (3.9)
n 1 cov( X , Y )
r = (3.17)
Desviacin estndar de la muestra S X SY
n
( X i X )2
i =1
S = S2 = (3.10)
n 1

C O N C E P T O S C L AV E
Atpico 86 Cuartiles 77 Grfica de caja y bigote 100
Asimetra 88 Desviacin estndar 82 Media 73
Asimtricos positivos 88 Desviacin estndar de una muestra Media aritmtica 73
Coeficiente de correlacin 105 82 Media de una muestra 73
Coeficiente muestral de Desviacin estndar poblacional 95 Media geomtrica 79
correlacin 106 Dispersin 72 Media poblacional 94
Coeficiente de variacin 85 Dispersin media 81 Mediana 75
Covarianza 103 Distribucin 72 Medidas resistentes 81
Covarianza de una muestra 103 Forma 72 Moda 76
112 CAPTULO 3 Medidas numricas descriptivas

Puntuaciones Z 86 Regla emprica 96 Valor extremo 86


Q1: primer cuartil 77 Resumen de cinco nmeros 99 Variacin 72
Q2: segundo cuartil 77 Sesgados a la derecha 88 Varianza 82
Q3: tercer cuartil 77 Sesgados a la izquierda 88 Varianza para una muestra 82
Rango 80 Simtrica 88 Varianza poblacional 95
Rango intercuartil 81 Suma de cuadrados 82
Regla de Chebyshev 97 Tendencia central 72

P R O B L E M A S D E R E PA S O
Revisin de su comprensin Resulta complicado introducir la cantidad exacta de t en cada
3.44 Cules son las propiedades de un conjunto de datos nu- bolsa, puesto que la variacin en las condiciones de temperatu-
mricos? ra y humedad dentro de la fbrica, las diferencias en la densidad
del t y la rpida operacin de llenado que realiza la mquina
3.45 Qu expresa la propiedad tendencia central? (aproximadamente 170 bolsas por minuto). La siguiente tabla
3.46 Cules son las diferencias entre media, mediana y mo- muestra el peso, en gramos, de una muestra compuesta por 50
da, y cules son las ventajas y desventajas de cada una de ellas? bolsas de t elaboradas en una hora por una sola mquina. TEA-
BAGS
3.47 Cmo interpreta el primer cuartil, la mediana y el tercer
cuartil? 5.65 5.44 5.42 5.40 5.53 5.34 5.54 5.45 5.52 5.41
5.57 5.40 5.53 5.54 5.55 5.62 5.56 5.46 5.44 5.51
3.48 Qu expresa la propiedad variacin?
5.47 5.40 5.47 5.61 5.53 5.32 5.67 5.29 5.49 5.55
3.49 Qu mide la puntuacin Z? 5.77 5.57 5.42 5.58 5.58 5.50 5.32 5.50 5.53 5.58
3.50 Cules son las diferencias entre las diversas medidas de 5.61 5.45 5.44 5.25 5.56 5.63 5.50 5.57 5.67 5.36
la variacin como rango, rango intercuartil, varianza, desvia-
a. Calcule la media, la mediana, primero y tercer cuartiles.
cin estndar y coeficiente de variacin, y cules son las venta-
b. Calcule el rango, el rango intercuartil, la varianza, la desvia-
jas y desventajas de cada una?
cin estndar y el coeficiente de variacin.
3.51 Cmo nos ayuda la regla emprica a explicar de qu ma- c. Interprete las medidas de tendencia central y variacin den-
neras se agrupan y distribuyen los valores de un conjunto de da- tro del contexto de este problema. Por qu debera preocu-
tos numricos? parse la compaa por la tendencia central y la variacin?
d. Realice una grfica de caja y bigote. Los datos son asim-
3.52 En qu difieren la regla emprica y la regla de Chebys-
tricos? De ser as, cmo?
hev?
e. La empresa satisface el requisito dispuesto en la etiqueta de
3.53 Qu expresa la propiedad forma? que, en promedio, hay 5.5 gramos de t por bolsa? Si usted
estuviera a cargo de este proceso, qu cambios, en caso ne-
3.54 En qu difieren la covarianza y el coeficiente de corre-
cesario, tratara de hacer con respecto a la distribucin de los
lacin?
pesos de las bolsas individuales?
3.56 En el estado de Nueva York las cajas de ahorro tienen
Aplicacin de conceptos permitido vender cierta clase de seguro de vida, llamado Segu-
ro de Vida de Caja de Ahorro (SBLI, siglas en ingls para Sa-
Puede resolver los problemas 3.55 a 3.61 manual- vings Bank Life Insurance). El proceso de aprobacin se com-
mente o en Excel, Minitab, o SPSS. Le recomendamos pone de cada etapa de suscripcin, la cual incluye una revisin
resolver los problemas 3.62 a 3.80 con Excel, Mini- de la solicitud, una consulta a la oficina de informacin mdica,
tab, o SPSS. posibles peticiones de informacin mdica adicional y exme-
nes mdicos, as como la etapa de consolidacin durante la cual
3.55 Una caracterstica de calidad que resulta de inters en el se generan las plizas y se envan al banco para su entrega. La
proceso de llenado de bolsitas de t es el peso que contienen. Si capacidad de entregar a los clientes de manera oportuna las p-
las bolsas quedan semivacas, se presentan dos problemas. Pri- lizas aprobadas resulta vital para que este servicio sea rentable
mero, los clientes no podran prepararse el t tan cargado como para el banco. En el transcurso de un mes, se seleccion una
lo desean. Segundo, la empresa podra infringir las leyes de ve- muestra aleatoria de 27 plizas aprobadas, y se registr el si-
racidad en lo descrito en la etiqueta. En este producto, el peso guiente tiempo de procesamiento total, en das: INSURANCE
impreso en la etiqueta del paquete seala que, en promedio, hay
5.5 gramos de t en cada bolsa. Si la cantidad media de t en 73 19 16 64 28 28 31 90 60 56 31 56 22 18
una bolsa supera ese peso, la empresa est regalando producto. 45 48 17 17 17 91 92 63 50 51 69 16 17
Problemas de repaso 113

a. Calcule la media, la mediana, primero y tercer cuartiles. a. Calcule la media, la mediana, el rango y la desviacin estn-
b. Calcule el rango, el rango intercuartil, la varianza, la desvia- dar de la anchura. Interprete estas medidas de tendencia cen-
cin estndar y el coeficiente de variacin. tral y variabilidad.
b. Elabore el resumen de cinco nmeros.
c. Elabore una grfica de caja y bigote. Los datos son asim-
c. Realice su grfica de caja y bigote y describa la forma.
tricos? De ser as, cmo?
d. Qu concluye sobre el nmero de canaletas que satisfacen
d. Qu le respondera usted a un cliente que entra al banco las necesidades de la empresa, al medir entre 8.31 y 8.61
con el fin de comprar este tipo de pliza de seguros y le pre- pulgadas de ancho?
gunta cunto dura el proceso de aprobacin?
3.59 La empresa del problema 3.58 tambin fabrica aislantes
3.57 Una de las principales medidas de la calidad del servicio elctricos. Si los aislantes se rompen al estar en uso, es proba-
que brinda cualquier organizacin es la velocidad con la que ble que ocurra un cortocircuito. Para poner a prueba la fuerza
responde a las quejas del cliente. Una gran tienda departamen- de los aislantes, se efecta una prueba de destruccin con la fi-
tal, propiedad de una familia que vende muebles y pisos, inclu- nalidad de determinar cunta fuerza se necesita para romperlos.
yendo alfombras, emprendi una importante expansin durante La fuerza se mide al observar cuntas libras se aplican al aislan-
los ltimos aos. En particular el departamento de pisos se am- te antes de que se rompa. A continuacin se presentan los datos
pli de dos equipos de instalacin a un supervisor de instala- de 30 aislantes en este experimento: FORCE
cin, un medidor, y 15 equipos de instalacin. Se seleccion
una muestra de 50 quejas relacionadas con la instalacin de al- 1,870 1,728 1,656 1,610 1,634 1,784 1,522 1,696 1,592 1,662
fombras, recibidas durante uno de los ltimos aos. Los si- 1,866 1,764 1,734 1,662 1,734 1,774 1,550 1,756 1,762 1,866
guientes datos representan el nmero de das transcurridos des-
de que se recibi la queja hasta su solucin. FURNITURE 1,820 1,744 1,788 1,688 1,810 1,752 1,680 1,810 1,652 1,736
a. Calcule la media, la mediana, el rango y la desviacin estn-
54 5 35 137 31 27 152 2 123 81 74 27
dar de la variable fuerza.
11 19 126 110 110 29 61 35 94 31 26 5 b. Interprete las medidas de tendencia central y de variabilidad
del inciso a).
12 4 165 32 29 28 29 26 25 1 14 13
c. Construya su grfica de caja y bigote y describa la forma.
13 10 5 27 4 52 30 22 36 26 20 23 d. Qu concluye sobre la resistencia de los aislantes, si la em-
33 68 presa necesita una medicin de al menos 1,500 libras de
fuerza?
a. Calcule la media, la mediana, primero y tercer cuartiles.
3.60 Los problemas de una lnea telefnica que impiden hacer
b. Calcule el rango, el rango intercuartil, la varianza, la desvia- o recibir llamadas desconciertan tanto al cliente como a la em-
cin estndar y el coeficiente de variacin. presa telefnica. Los siguientes datos representan muestras de
c. Elabore una grfica de caja y bigote. Los datos son asim- 20 problemas reportados a dos oficinas distintas de una empre-
tricos? De ser as, cmo? sa telefnica, y el tiempo transcurrido para resolverlos (en mi-
nutos) desde la lnea del cliente: PHONE
d. Con base en los resultados de los incisos a) a c), si usted tu-
viera que informar al presidente de la empresa cunto tendr Central telefnica I Tiempo para resolver problemas
que esperar un cliente para ver su queja resuelta, qu le di- (minutos)
ra? Explique su respuesta.
1.48 1.75 0.78 2.85 0.52 1.60 4.15 3.97 1.48 3.10
3.58 Una empresa de manufactura produce gabinetes de acero
para equipo elctrico. El principal componente del gabinete es 1.02 0.53 0.93 1.60 0.80 1.05 6.32 3.93 5.45 0.97
una canaleta que se elabora con lmina de acero calibre 14. Se Central telefnica II Tiempo para resolver problemas
produce utilizando una troqueladora de deslizamiento progresi- (minutos)
vo de 250 toneladas, que genera dos formaciones de 90 grados
en el acero plano, haciendo el canal. La distancia de un lado al 7.55 3.75 0.10 1.10 0.60 0.52 3.30 2.10 0.58 4.02
otro de estas formaciones resulta de especial importancia, por 3.75 0.65 1.92 0.60 1.53 4.23 0.08 1.48 1.65 0.72
la impermeabilizacin para aplicaciones a la intemperie. La
empresa necesita que la canaleta tenga una anchura de entre
Para ambas centrales telefnicas:
8.31 y 8.61 pulgadas. A continuacin encuentran las anchuras,
a. Calcule la media, la mediana, primero y tercer cuartiles.
en pulgadas, de una muestra de n = 49 canaletas. TROUGH
b. Calcule el rango, rango intercuartil, varianza, desviacin es-
8.312 8.343 8.317 8.383 8.348 8.410 8.351 8.373 8.481 8.422 tndar y coeficiente de variacin.
c. Elabore una grfica de barras de lado a lado y una grfica
8.476 8.382 8.484 8.403 8.414 8.419 8.385 8.465 8.498 8.447
de caja y bigote. Los datos son asimtricos? De ser as,
8.436 8.413 8.489 8.414 8.481 8.415 8.479 8.429 8.458 8.462 cmo?
d. Con base en los resultados de los incisos a) a c), existen al-
8.460 8.444 8.429 8.460 8.412 8.420 8.410 8.405 8.323 8.420
gunas diferencias entre ambas centrales? Explique su res-
8.396 8.447 8.405 8.439 8.411 8.427 8.420 8.498 8.409 puesta.
114 CAPTULO 3 Medidas numricas descriptivas

3.61 En muchos procesos de manufactura se utiliza el trmino b. Calcule el rango, el rango intercuartil, la varianza, la desvia-
trabajo-en-proceso (con frecuencia abreviado WIP, por las si- cin estndar y el coeficiente de variacin de la diferencia
glas en ingls para work-in-process). En una planta que pro- en los costos de manutencin entre los ciclos 2002-2003 y
duce libros, el WIP representa el tiempo que transcurre para que 2003-2004 para los alumnos procedentes del mismo estado
se doblen, junten, cosan, peguen por un extremo y encuadernen donde se encuentra la institucin y los procedentes de otros
las hojas procedentes de la prensa. Los siguientes datos repre- estados.
sentan muestras de 20 libros en dos plantas de produccin y el c. Elabore la grfica de caja y bigote de la diferencia en los
tiempo de procesamiento (definido de forma operacional como costos de manutencin entre los ciclos 2002-2003 y 2003-
el tiempo, en das, transcurrido desde que las hojas salen de la 2004 para los alumnos procedentes del mismo estado donde
prensa hasta que los libros se empacan en cajas) para estos tra- se encuentra la institucin y los procedentes de otros esta-
bajos. WIP dos. Los datos son asimtricos? De ser as, cmo?
Planta A d. Qu conclusiones obtendra en relacin con la diferencia
en los costos de manutencin entre los ciclos 2002-2003 y
5.62 5.29 16.25 10.92 11.46 21.62 8.45 8.58 5.41 11.42 2003-2004 para los alumnos procedentes del mismo estado
11.62 7.29 7.50 7.96 4.42 10.50 7.58 9.29 7.54 8.92 donde se encuentra la institucin y los procedentes de otros
estados?
Planta B
3.64 Las promociones de marketing, como la entrada gratis a
9.54 11.46 16.62 12.62 25.75 15.41 14.29 13.13 13.71 10.04 las personas con gorra, aumentan la asistencia a los juegos de
5.75 12.46 9.17 13.21 6.00 2.33 14.25 5.37 6.25 9.71 la Liga Mayor de Bisbol? Un artculo publicado en Sport Mar-
keting Quarterly informa sobre la efectividad de las promocio-
Para ambas plantas: nes de marketing [T. C. Boyd y T. C. Krehbiel, Promotion Ti-
ming in Major League Baseball and the Stacking Effects of
a. Calcule la media, la mediana, primero y tercer cuartiles.
Factors that Increase Game Attractiveness, Sport Marketing
b. Calcule el rango, el rango intercuartil, la varianza, la desvia-
Quarterly, 12(2003), 173-183]. El archivo de datos ROYALS in-
cin estndar y el coeficiente de variacin.
cluye las siguientes variables para los Reales de Kansas City
c. Elabore las grficas de barra de lado a lado y de caja y bigo-
durante la temporada 2002:
te. Los datos son asimtricos? De ser as, cmo?
GAME = juegos como local en el orden en que se jugaron.
d. Con base en los resultados de los incisos a) a c), existen al-
gunas diferencias entre ambas plantas? Explique su res- ATTENDANCE = espectadores con boleto pagado en ese
puesta. juego.
PROMOTION-Y = hubo promocin; N = no hubo promo-
3.62 Los datos incluidos en el archivo CEREALS se componen cin.
del costo monetario por onza, caloras, fibra en gramos y azcar a. Calcule la media y la desviacin estndar de los espectado-
en gramos, de 33 cereales para desayunar. res con boleto pagado para los 43 juegos en los que hubo
Fuente: Obtenido de Copyrigh 1999 por Consumers Union of U.S., Inc., promocin y para los 37 juegos sin promocin.
Yonkers, NY 10703-1057. Adaptado con autorizacin de Consumer Re- b. Elabore un resumen de cinco nmeros para los 43 juegos en
ports, octubre de 1999, 33-34. los que hubo promocin y para los 37 juegos sin promocin.
Para cada una de las variables: c. Realice una representacin que contenga dos grficas de ca-
ja y bigote; una de los 43 juegos en los que hubo promocin
a. Calcule la media, la mediana, primero y tercer cuartiles.
y otra de los 37 juegos sin promocin.
b. Calcule el rango, el rango intercuartil, la varianza, la desvia-
cin estndar y el coeficiente de variacin. d. Analice los resultados de los incisos a) a c) y comente sobre
la eficacia de las promociones en los juegos de los Reales
c. Elabore una grfica de caja y bigote. Los datos son asim-
durante la temporada 2002.
tricos? De ser as, cmo?
d. Qu concluye en relacin con el costo por onza en centa- 3.65 Los datos incluidos en el archivo PETFOOD2 se compo-
vos, caloras, fibra en gramos y azcar en gramos, de los 33 nen del costo por racin, tasas por lata, protena en gramos y
cereales para desayunar? grasa en gramos de 97 variedades de comida seca y enlatada
3.63 Los recortes presupuestales estatales forzaron el aumen- para perro y para gato.
to en los costos de manutencin para las universidades pblicas Fuente: Obtenido de Copyright 1998 por Consumers Union of U.S., Inc.,
durante el ciclo escolar 2003-2004. Los datos que se encuen- Yonkers, NY 10703-1057. Adaptado con autorizacin de Consumer Re-
tran en el archivo TUITION incluyen la diferencia en los costos ports, febrero de 1998, 18-19.
de manutencin entre los ciclos 2002-2003 y 2003-2004 para
los alumnos procedentes del mismo estado donde se encuentra Realice lo siguiente para los cuatro tipos de comida (comida se-
la institucin y los procedentes de otros estados. ca para perro, comida enlatada para perro, comida seca para ga-
a. Calcule la media, la mediana, primero y tercer cuartiles de la to y comida enlatada para gato), y para las variables costo por
diferencia en los costos de manutencin entre los ciclos servicio, protena en gramos y grasa en gramos:
2002-2003 y 2003-2004 para los alumnos procedentes del a. Calcule la media, la mediana, primero y tercer cuartiles.
mismo estado donde se encuentra la institucin y los proce- b. Calcule el rango, el rango intercuartil, la varianza, la desvia-
dentes de otros estados. cin estndar y el coeficiente de variacin.
Problemas de repaso 115

c. Elabore las grficas de barras de lado a lado y la de caja y bi- el archivo BB2001 contiene las estadsticas de todos los equipos
gote, de los cuatro tipos (comida seca para perro, comida en- sobre precios de las entradas, ndice de costo por aficionado, in-
latada para perro, comida seca para gato y comida enlatada gresos por entradas en temporada regular, ingresos por televi-
para gato). Son asimtricos los datos de alguno de los tipos sin local, radio y cable; todos los dems ingresos de opera-
de comida? De ser as, cmo? cin, compensacin y beneficios del jugador; datos locales y
d. Qu conclusiones obtiene en relacin con las diferencias nacionales e ingresos por operaciones de bisbol. Para cada una
entre los cuatro tipos (comida seca para perro, comida enla- de estas variables:
tada para perro, comida seca para gato y comida enlatada a. Calcule la media, la mediana, primero y tercer cuartiles.
para gato)? b. Calcule el rango, el rango intercuartil, la varianza, la desvia-
3.66 Un fabricante de tejas de asfalto de Boston y Vermont cin estndar y el coeficiente de variacin.
ofrece a sus clientes una garanta de 20 aos en la mayora de c. Elabore una grfica de caja y bigote. Los datos son asim-
sus productos. Para determinar si una teja dura tanto como el tricos? De ser as, cmo?
periodo de garanta, se realiza una prueba de vida acelerada en d. Calcule la correlacin que existe entre el nmero de victo-
la planta. En la prueba, realizada en un laboratorio, la teja se ex- rias y las compensaciones y beneficios del jugador. Qu tan
pone a las tensiones que recibira en toda su vida til de uso fuerte es la relacin entre estas dos variables?
normal, mediante un experimento que lleva tan slo unos minu- e. Qu conclusiones obtiene en relacin con los ingresos por
tos. En esta prueba, se cepilla repetidamente una teja durante un entradas en temporada regular, ingresos por televisin local,
breve lapso, y se pesa la cantidad de grnulos (en gramos) des- radio y cable; todos los dems ingresos de operacin, com-
prendidos por el cepillado. Se espera que las tejas con menor pensacin y beneficios del jugador; datos locales y naciona-
desprendimiento duren ms en uso normal que las que experi- les e ingresos por operaciones de bisbol?
mentan gran cantidad de desprendimiento. Ante esta situacin,
si se espera que dure tanto como el periodo de garanta, una te- 3.69 Los datos incluidos en el archivo AIRCLEANERS repre-
ja no debe tener un desprendimiento superior a 0.8 gramos. El sentan el precio, el costo anual de energa y el costo anual del
archivo GRANULE contiene los datos de una muestra compues- filtro de unos limpiadores de aire.
ta por 170 medidas realizadas en las tejas de la empresa en Bos- a. Calcule el coeficiente de correlacin entre el precio y el cos-
ton y 140 medidas realizadas en las tejas de Vermont. to de energa.
a. Elabore el resumen de cinco puntos para las tejas de Boston b. Calcule el coeficiente de correlacin entre el precio y el cos-
y las tejas de Vermont. to del filtro.
b. Realice las grficas barras de lado a lado y de caja y bigote c. Qu conclusiones obtiene sobre la relacin del costo de
para ambos tipos de teja, y describa la forma de las distribu- energa y del costo del filtro con el precio de los limpiadores
ciones. de aire?
c. Comente sobre la capacidad de las tejas para conseguir un
desprendimiento de 0.8 gramos o menos. Fuente: Portable Room Air Cleaners, Copyright 2002 por Consumers
Union of U.S., Inc., Yonkers, NY 10703-1057. Adaptado con autorizacin
3.67 Los datos del archivo STATES representan los resultados de Consumer Reports, febrero de 2002, 47.
de la Encuesta de la Comunidad Estadounidense (American
Community Survey), con una muestra de 700,000 hogares em- 3.70 Los datos incluidos en el archivo PRINTERS representan
prendida en todos los estados durante el censo de EUA del ao el precio, la velocidad de texto, el costo de texto, el tiempo de
2000. Realice lo siguiente para las variables tiempo promedio fotografa a color y el costo de la fotografa color de unas im-
de traslado al trabajo en minutos, porcentaje de hogares con presoras de computadora.
ocho o ms habitaciones, ingreso medio y porcentaje de propie- a. Calcule el coeficiente de correlacin entre el precio y cada
tarios con hipoteca, cuyos costos de vivienda superan el 30% de una de las siguientes caractersticas: velocidad de texto, cos-
sus ingresos: to de texto, tiempo de fotografa a color y costo de fotogra-
a. Calcule la media, la mediana, primero y tercer cuartiles. fa a color.
b. Calcule el rango, el rango intercuartil, la varianza, la desvia- b. Con base en los resultados del inciso a), cree usted que al-
cin estndar y el coeficiente de variacin. guna de las dems variables podra ser til para pronosticar
c. Realice una grfica de caja y bigote. Los datos son asim- el precio de la impresora? Explique su respuesta.
tricos? De ser as, cmo?
Fuente: Printers, Copyright 2002 por Consumers Union of U.S., Inc.,
d. Qu conclusiones obtiene en relacin con el tiempo prome-
Yonkers, NY 10703-1057. Adaptado con autorizacin de Consumer Re-
dio de traslado al trabajo en minutos, porcentaje de hogares ports, marzo de 2002, 51.
con ocho o ms habitaciones, ingreso medio y porcentaje de
propietarios con hipoteca cuyos costos de vivienda superan 3.71 Usted quiere estudiar las caractersticas de los automvi-
el 30% de sus ingresos? les modelo 2002, en trminos de las siguientes variables: millas
por galn, longitud, anchura, necesidades de circunferencia de
3.68 Las finanzas del bisbol han provocado mucha contro-
viraje, peso y capacidad del compartimiento de equipaje. AU-
versia, pues los propietarios aseguran que pierden dinero, los
TO2002
jugadores afirman que los propietarios ganan dinero, y los afi-
cionados se quejan por lo costoso que resulta asistir a los juegos Fuente: The 2002 Cars, Copyright 2002 por Consumers Union of
o verlos por televisin de paga. Adems de los datos relaciona- U.S., Inc., Yonkers, NY 10703-1057. Adaptado con autorizacin de Consu-
dos con las estadsticas del equipo durante la temporada 2001, mer Reports, abril de 2002.
116 CAPTULO 3 Medidas numricas descriptivas

Para cada una de esas variables: b. Calcule el rango, el rango intercuartil, la varianza, la
a. Calcule la media, la mediana, primero y tercer cuartiles. desviacin estndar y el coeficiente de variacin.
b. Calcule el rango, el rango intercuartil, la varianza, la desvia- c. Elabore una grfica de caja y bigote y una de barras de
cin estndar y el coeficiente de variacin. lado a lado de Nueva York y Long Island. Son asim-
c. Elabore una grfica de caja y bigote. Los datos son asim- tricos los datos de alguna de las variables? De ser as,
tricos? De ser as, cmo? cmo?
d. Qu conclusiones obtiene en relacin con los automviles d. Qu conclusiones obtiene en relacin con las diferen-
2002? cias que existen entre los restaurantes de Nueva York y
Long Island?
3.72 Consulte los datos del problema 3.71. Usted quiere com-
parar los vehculos utilitarios (o SUV, siglas en ingls para 3.74 Como un ejemplo del mal uso de la estadstica, un
sports utility vehicles) con los que no son de ese tipo, en trmi- artculo de Glenn Kramon (Coaxing the Stanford Elep-
nos de millas por galn, longitud, anchura, necesidades de cir- hant to Dance, The New York Times Sunday Business
cunferencia de viraje, peso y capacidad del compartimiento de Section, 11 de noviembre, 1990) describe que los costos
carga. Para cada una de esas variables, y considerando dos tipos del Stanford Medical Center se haban elevado ms que los
de vehculos: de la competencia ya que era ms probable que brindara
a. Calcule la media, la mediana, primero y tercer cuartiles. atencin a personas indigentes, ms enfermas, beneficia-
b. Calcule el rango, el rango intercuartil, la varianza, la desvia- rios de Medicare y Medicaid, y pacientes con problemas
cin estndar y el coeficiente de variacin. ms complejos. Se utiliz la grfica que aparece ms ade-
c. Elabore las grficas de barras de lado a lado y de caja y bi- lante para comparar los precios promedio en 1989 y 1990
gote. Los datos son asimtricos? De ser as, cmo? de tres procedimientos mdicos (bypass de arterias corona-
d. Qu conclusiones obtiene en relacin con las diferencias rias, alumbramiento normal y trasplante de cadera) en tres
entre los SUV y los vehculos de otra clase? instituciones competidoras (El Camino, Sequoia y Stan-
ford).
3.73 Zagats publica las calificaciones de restaurantes en varias
Suponga que trabaja en un centro de salud. La direc-
ciudades de Estados Unidos. El archivo RESTRATE contiene los
tora general sabe que usted est tomando un curso de esta-
datos de la calificacin para la comida, decorado, servicio y
dstica y le llama para analizar esto. Le dice que anoche se
precio por persona de una muestra compuesta por 50 restauran-
present ese artculo en el marco de una discusin de gru-
tes localizados en la ciudad de Nueva York, y 50 localizados en
po, como parte de una reunin de directores generales de
Long Island.
los centros de salud de la zona, y que uno de ellos mencio-
Fuente: Zagat Survey 2002 New York City Restaurants and Zagat Survey n que la grfica era totalmente irrelevante y le pidi su
2002 Long Island Restaurants. opinin. Ahora ella le pide que prepare la respuesta. Usted
sonre, respira profundo y responde...
Para los restaurantes de Nueva York y Long Island, las varia-
bles calificacin de la comida, calificacin del decorado, califi- 3.75 Usted planea estudiar para su examen de estadstica
cacin del servicio y calificacin del precio por persona: con un grupo de compaeros, uno de los cuales est espe-
a. Calcule la media, la mediana, primero y tercer cuartiles. cialmente interesado en impresionarlo. Este individuo se

Cunto cuestan los servicios de salud


Comparacin de los precios hospitalarios promedio de varias
operaciones durante 1989-90 en California. Los hospitales Sequoia
y El Camino son los principales competidores locales del Stanford
Medical Center.
50,000
El Camino
40,000
Sequoia
Dlares

30,000 Stanford

20,000

10,000
N/D
0
Bypass de arterias Alumbramiento Trasplante
coronarias normal de cadera
Para el alumbramiento normal con una estancia de dos das y para el
trasplante de cadera con una estancia de nueve das, los costos de
El Camino son el promedio de los precios alto y bajo.
En todas las operaciones, los costos del Sequoia son los promedios
del 50% medio de todos los precios.
Los datos de Stanford son el costo promedio de todas las operaciones.
Fuente: Stanford Medical Center, Sequoia Hospital y Hospital El Camino.
Problemas de repaso 117

ofreci a trabajar voluntariamente con Excel, Minitab o SPSS pa- Expense ratio Relacin entre gastos y activos netos, en
ra obtener informacin resumida, tablas y grficas necesarias porcentaje.
para el conjunto de datos que contiene diversas variables num- 2003 Return Rendimiento en los 12 meses de 2003.
ricas y categricas estipulado por el maestro como objeto de es- Three-year return Rendimiento anualizado 2001 a 2003.
tudio. Se le acerca con los resultados impresos y exclama: Lo Five-year return Rendimiento anualizado 1999 a 2003.
tengo todo: las medias, las medianas, las desviaciones estn- Risk Factor de riesgo de prdida del fondo de inversin,
dar, las grficas de caja y bigote, y los diagramas de pastel de clasificado como bajo, medio o alto.
todas nuestras variables. El problema es que algunos de los Best quarter Mejor resultado trimestral 1999 a 2003.
resultados parecen extraos, como las grficas de caja y bigote Worst quarter Peor resultado trimestral 1999 a 2003.
para gnero y mayores de edad, y los diagramas de pastel del n-
dice de nivel de estudios y de la estatura. Tampoco entiendo por 3.77 Para la relacin de gastos en porcentaje, el rendimiento
qu el profesor Krehbiel dice que no podemos obtener la esta- en 2003, el rendimiento trianual y el rendimiento quinquenal:
dstica descriptiva de algunas de las variables; las tengo para a. Calcule la media, la mediana, primero y tercer cuartiles.
todo! Mira, la media de la estatura es 68.23, la media del ndice b. Calcule el rango, el rango intercuartil, la varianza, la des-
de nivel de estudios es 2.76, la media del gnero es 1.50, la me- viacin estndar y el coeficiente de variacin.
dia para los mayores de edad es 4.33. Cul sera su respuesta? c. Elabore la grfica de caja y bigote. Los datos son asim-
tricos? De ser as, cmo?
Ejercicios de reporte por escrito d. Qu conclusiones obtiene en relacin con estas varia-
bles?
3.76 Los datos que aparecen en el archivo BEER representan
3.78 Usted quiere comparar los fondos de inversin que
el precio de un paquete de cerveza con 6 botellas de 12 onzas
tienen cuotas o cargos con los que no los tienen. Realice lo si-
cada una, las caloras en 12 onzas lquidas, el porcentaje de
guiente con cada uno de los dos grupos, para las variables
contenido alcohlico en 12 onzas lquidas, el tipo de cerveza
relacin de gastos en porcentaje, rendimiento en 2003, rendi-
(artesanales de baja fermentacin, artesanales de alta fermenta-
miento trianual y rendimiento quinquenal:
cin, importadas de baja fermentacin, regulares y fras, y cer-
a. Calcule la media, la mediana, primero y tercer cuartiles.
vezas light y sin alcohol), y el pas de origen (estadounidenses
b. Calcule el rango, el rango intercuartil, la varianza, la des-
y del resto del mundo) de cada una de las 69 cervezas incluidas
viacin estndar y el coeficiente de variacin.
en la muestra.
Su tarea consiste en escribir un reporte con base en una c. Elabore la grfica de caja y bigote. Los datos son asim-
evaluacin descriptiva completa de las variables numricas tricos? De ser as, cmo?
(precio, caloras y contenido alcohlico) independientemente d. Qu conclusiones obtiene en cuanto a las diferencias que
del tipo u origen del producto. Luego realice una evaluacin si- existen entre los fondos de inversin con y sin cuotas?
milar, comparando cada una de esas variables numricas con 3.79 Usted quiere comparar los fondos de inversin que tie-
base en el tipo de producto (artesanales de baja fermentacin, nen un objetivo de crecimiento con los que tienen un objetivo
artesanales de alta fermentacin, importadas de baja fermenta- de valor. Realice lo siguiente con cada uno de los dos grupos,
cin, regulares y fras, y cervezas light y sin alcohol). Efecte para las variables coeficiente de gastos en porcentaje, ren-
tambin una evaluacin similar, para comparar y establecer las dimiento en 2003, rendimiento trianual y rendimiento quin-
diferencias de cada una de esas variables numricas, con base quenal:
en el origen de las cervezas: las preparadas en Estados Unidos a. Calcule la media, la mediana, primero y tercer cuartiles.
contra las del resto del mundo. Junto con su reporte debe anexar b. Calcule el rango, el rango intercuartil, la varianza, la des-
todas las tablas, los diagramas y las medidas numricas des- viacin estndar y el coeficiente de variacin.
criptivas apropiadas. c. Elabore la grfica de caja y bigote. Los datos son asim-
Fuente: Beers, Copyright 1996 por Consumers Union of U.S., Inc., tricos? De ser as, cmo?
Yonkers, NY 10703-1057. Adaptado con autorizacin de Consumer Re- d. Qu conclusiones obtiene en cuanto a las diferencias que
ports, junio de 1996. existen entre los fondos con objetivo de crecimiento y los
fondos con objetivo de valor?
3.80 Usted quiere comparar los fondos de inversin para pe-
PROYECTO EN EQUIPO queo, mediano y gran capital. Realice lo siguiente con cada
uno de los tres grupos, para las variables coeficiente de gastos
El archivo MUTUALFUNDS2004 contiene informacin relaciona- en porcentaje, rendimiento en 2003, rendimiento trianual y
da con 12 variables a partir de una muestra de 121 fondos de in- rendimiento quinquenal:
versin. Las variables son: a. Calcule la media, la mediana, primero y tercer cuartiles.
Fund Nombre del fondo de inversin. b. Calcule el rango, el rango intercuartil, la varianza, la des-
Category Tipo de acciones que abarca el fondo de inver- viacin estndar y el coeficiente de variacin.
sin: pequeo, mediano o gran capital. c. Elabore la grfica de caja y bigote. Los datos son asim-
Objective Objetivo de las acciones que abarca el fondo de tricos? De ser as, cmo?
inversin: crecimiento o valor. d. Qu conclusiones obtiene con respecto a las diferencias
Assets Activos en millones de dlares. que existen entre los fondos de inversin para pequeo,
Fees Cargos por venta (no o s). mediano y gran capital?
118 CAPTULO 3 Medidas numricas descriptivas

CASO ACTUAL
ADMINISTRACIN DEL SPRINGVILLE HERALD
Para qu variable del caso Administracin del Springville He- 2. Identifique otra representacin grfica que resulte til y
rald del captulo 2 (vea la pgina 62) son necesarias las medi- constryala. Qu conclusiones obtiene del hecho de que la
das numricas descriptivas? Para la variable que identifique: representacin no se puede hacer a partir de la grfica de ca-
1. Calcule las medidas descriptivas numricas apropiadas y ja y bigote?
elabore un diagrama de caja y bigote. Sintetice sus hallazgos en un reporte que incluya con el estudio
de la fortaleza de la tarea.

CASO WEB
Aplique sus conocimientos sobre el uso de las medidas nu- cas resumidas las demandas de StockTout? Cmo influ-
mricas descriptivas a este Caso Web que es continuacin yen esas estadsticas resumidas en su percepcin del re-
del captulo 2. gistro StockTout?
Visite de nuevo el sitio web de servicio de inversin 2. Evale los mtodos utilizados por StockTout para resumir
StockTout www.prenhall.com/Springville/StockToutHo- los resultados de su encuesta a los clientes www.pren-
me.htm, reexamine su datos de respaldo y luego responda lo hall.com/Springville/ST_Survey.htm. Hay algo que
siguiente: usted hara de otra manera para resumir estos resultados?
1. Reexamine los datos que explor al resolver el Caso Web 3. Observe que la ltima pregunta de la encuesta tiene me-
del captulo 2. Es posible calcular medidas descriptivas nos respuestas. Qu factores pueden haber limitado el
de todas las variables? Cmo respaldaran estas estadsti- nmero de respuestas a esa pregunta?

REFERENCIAS
1. Kendall, M. G. y A. Stuart, The Advanced Theory of Statis- 5. Tukey, J., Exploratory Data Analysis (Reading, MA: Addi-
tics, vol. 1 (Londres: Charles W. Griffin, 1958). son-Wesley, 1977).
2. Microsoft Excel 2003 (Redmond, WA: Microsoft Corpora- 6. Velleman, P. F. y D. C. Hoaglin, Applications, Basics, and
tion, 2002). Computing of Exploratory Data Analysis (Boston, MA:
3. Minitab Version 14 (State College, PA: Minitab Inc., 2004). Duxbury Press, 1981).
4. SPSS Base 12.0 Brief Guide (Upper Saddle River, NJ: Pren-
tice Hall, 2003).

Apndice 3 Uso de software


para la estadstica descriptiva
A3.1 EXCEL clic en Aceptar. En el cuadro de dilogo Estadstica descriptiva
(vea la figura A3.1), introduzca el rango de celdas de los datos
Para la estadstica descriptiva en el cuadro Rango de entrada. Seleccione la opcin Colum-
Use el Data Analysis ToolPak. Abra la hoja de trabajo que con- nas y, si est utilizando datos ordenados como los de los ar-
tiene los datos que desea resumir. Seleccione Herramientas chivos de Excel incluidos en el disco compacto que acompaa
Anlisis de datos. En la lista que aparece en la ventana de di- este libro, Rtulos en la primera fila. Seleccione En una hoja
logo Anlisis de datos, seleccione Estadstica descriptiva y d nueva, Resumen de estadsticas, K-simo mayor y K-simo
Apndice 119

menor, y d clic en Aceptar. Los resultados aparecen en otra Para el coeficiente de correlacin
hoja de trabajo. Abra el archivo de Excel Correlation.xls, que se ilustra en la
O puede usar cualquiera de esas funciones de estadsticas figura 3.10 de la pgina 107. Si desea utilizar esta hoja con
muestrales de la hoja de trabajo con sus propias frmulas, in- otros pares de variables, siga las instrucciones en pantalla para
cluyendo PROMEDIO (para la media), MEDIANA, MODA, modificar el rea de la tabla. Observe en la figura 3.10 que la
CUARTIL, DESVEST, VAR, MIN, MAX, SUMA, CONTAR, celda E16 contiene una frmula que usa la funcin CONT. sta
MAYOR o MENOR. permite que Excel actualice de forma automtica el valor de n
cuando se modifica el tamao del rea de la tabla, y garantiza
que el trmino n 1 siempre sea el correcto.
Esta hoja utiliza la funcin CORREL para calcular el coe-
ficiente de correlacin. Como se muestra en la figura 3.10, la
frmula =E17/(E18 * E19) tambin se puede emplear en esta
hoja para calcular el estadstico, entonces la covarianza SX y SY
ya aparece en la hoja.

A3.2 MINITAB
Clculo de estadstica descriptiva
Para generar la estadstica descriptiva de los rendimientos en
2003 correspondientes a los distintos niveles de riesgo que apa-
recen en la figura 3.3 de la pgina 90, abra la hoja de trabajo
MUTUALFUNDS2004.MTW. Seleccione Stat Basic Statistics
Display Descriptive Statistics.

Paso 1: En la ventana de dilogo Display Descriptive Statis-


tics (vea la figura A3.2), introduzca C7 o Return
2003 en el cuadro de edicin Variables. Escriba C10 o
FIGURA A3.1 Ventana de dilogo estadstica Risk en la ventana de editar By variables (optional):
descriptiva para el anlisis de datos.

Para introducir una de esas funciones en la hoja de trabajo, se-


leccione una celda vaca y luego Insertar Funcin. En el
cuadro de dilogo Funcin, seleccione Estadstica en la lista
desplegable y luego desplcese hasta encontrar y seleccionar la
funcin que desea utilizar. D clic en Aceptar. En la ventana de
dilogo Argumentos de la funcin, introduzca el rango de cel-
das de los datos a resumir, y d clic en Aceptar. (Para MAYOR
y MENOR, introduzca 1 como valor de K; y para CUARTIL,
introduzca 1 o 3 como valor de Cuart, segn se trate del prime-
ro o tercer cuartil.) En las versiones de Excel previas a Excel
2003, puede encontrar errores en los resultados al utilizar la
funcin CUARTIL.

Para la grfica de caja y bigote


Consulte la seccin G.5 (Grfica de caja y bigote) si desea que
PHStat2 genere una grfica de caja y bigote como diagrama de
Excel. (No existen comandos de Excel que generen de manera
directa grficas de caja y bigote.)
FIGURA A3.2 Ventana de dilogo de pantalla
Para la covarianza de estadstica descriptiva de Minitab.
Abra el archivo de Excel Covariance.xls, que se muestra en la
figura 3.7 de la pgina 104. Si desea utilizar esta hoja con otros Paso 2: Seleccione el botn Statistics. En la ventana de dilo-
pares de variables, siga las instrucciones en pantalla para modi- go Display Descriptive Statistics-Statistics (vea la fi-
ficar el rea de la tabla. Observe en la figura 3.7 que la celda gura A3.3), seleccione las casillas Mean, Standard
C15 contiene una frmula que usa la funcin CONT. sta per- deviation, Coefficient of variation, First quartile,
mite que Excel actualice de forma automtica el valor de n Median, Third quartile, Interquartile range, Mini-
cuando se modifica el tamao del rea de la tabla, y garantiza mum, Maximum, Range y N total (tamao de la
que el trmino n 1 siempre sea el correcto. muestra). D clic en el botn OK para volver a la ven-
120 CAPTULO 3 Medidas numricas descriptivas

tana de dilogo Display Descriptive Statistics. D clic


de nuevo en el botn Aceptar para calcular la estads-
tica descriptiva.

FIGURA A3.5 Ventana de dilogo Boxplots-One


FIGURA A3.3 Ventana de dilogo de estadstica Y, With Groups de Minitab.
descriptiva de de Minitab.

Uso de Minitab para elaborar una grfica


de caja y bigote El resultado ser semejante al de la figura 3.5 de la pgina 101.
Para crear una grfica de caja y bigote de los rendimientos en
2003 correspondientes a los distintos niveles de riesgo que apa- Clculo del coeficiente de correlacin
recen en la figura 3.5 de la pgina 101, abra la hoja de trabajo Para calcular el coeficiente de correlacin del coeficiente de
MUTUALFUNDS2004.MTW. Seleccione Graph Box- gastos y los rendimientos en 2003 de todos los fondos de inver-
plot. sin, abra la hoja de trabajo MUTUALFUNDS2004.MTW.
Paso 1: En la ventana de dilogo Boxplot (vea la figura A3.4) Seleccione Stat Basic Statistics Correlation. En el cua-
seleccione la opcin One Y With Groups (si desea dro de dilogo Correlation (vea la figura A3.6), introduzca C6 o
generar una grfica de caja y bigote para un grupo, se- Expense ratio y C7 o Return 2003. D clic en el botn OK.
leccione la opcin One Y Simple). D clic en el botn
OK.

FIGURA A3.4 Ventana de dilogo Boxplots


de Minitab.

Paso 2: En la ventana de dilogo Boxplot-One Y, With Groups


(vea la figura A3.5), introduzca C7 o Return 2003 en
el cuadro de edicin Graph variables. Escriba C10 o
Risk en la ventana de editar Categorical variables. D FIGURA A3.6 Ventana de dilogo Correlation
clic en el botn OK. de Minitab.
CAPTULO 4
Probabilidad bsica

USO DE LA ESTADSTICA: La empresa Consumer Electronics

4.1 CONCEPTOS BSICOS Reglas de multiplicacin


DE PROBABILIDAD Probabilidad marginal usando la regla
Espacios muestrales y eventos general de la multiplicacin
Tablas de contingencia y diagramas de Venn
4.3 TEOREMA DE BAYES
Probabilidad simple (marginal)
Probabilidad conjunta 4.4 REGLAS DE CONTEO
Regla general de la adicin 4.5 CONSIDERACIONES TICAS
4.2 PROBABILIDAD CONDICIONAL Y PROBABILIDAD
Clculo de probabilidades condicionales A.4 USO DEL SOFTWARE PARA
rboles de decisin LA PROBABILIDAD BSICA
Independencia estadstica A4.1 Excel

OBJETIVOS DE APRENDIZAJE
En este captulo, aprender:
Conceptos de probabilidad bsica
Probabilidad condicional
El uso del teorema de Bayes para revisar probabilidades
Varias reglas de conteo
122 CAPTULO 4 Probabilidad bsica

U S O D E L A E S TA D S T I C A
La empresa Consumer Electronics
Usted es gerente de marketing de la empresa Consumer Electronics. Analiza
los resultados de una encuesta realizada en 1,000 hogares concerniente a sus
intenciones de comprar un equipo de televisin de pantalla grande (definido
como de 31 pulgadas o ms) en los siguientes 12 meses. Investigaciones de
este tipo reciben el nombre de estudios de intencin de compra. Como se-
guimiento encuestar los mismos hogares 12 meses despus para ver si real-
mente compraron el equipo. Adems, a usted le interesa saber si quienes
compraron la televisin de pantalla grande tambin compraron una televi-
sin de alta definicin (HDTV), si adquirieron un equipo reproductor de DVD
en los ltimos 12 meses, y si estuvieron satisfechos con la compra del equipo
de televisin de pantalla grande. Algunas de las preguntas que le gustara
plantear son:

Cul es la probabilidad de que en un hogar se planee comprar un televi-


sor de pantalla grande el ao prximo?
Cul es la probabilidad de que en ese hogar se compre realmente un televisor de pantalla
grande?
Cul es la probabilidad de que en un hogar en el que se planea comprar un televisor de panta-
lla grande ste realmente se adquiera?
Si en un hogar se planea comprar una televisin de pantalla grande, cul es la probabilidad de
que la compra se realice?
El conocimiento de que en ese hogar se planea comprar un televisor cambia la posibilidad de
predecir si ah se comprar el equipo de televisin?
Cul es la probabilidad de que el hogar donde se compra un televisor de pantalla grande se
comprar un HDTV?
Cul es la probabilidad de que en un hogar donde se compra un televisor de pantalla grande
tambin se compre un equipo reproductor de DVD?
Cul es la probabilidad de que un hogar donde se compra un televisor de pantalla grande esta-
r satisfecho de su compra?

Las respuestas a estas y otras preguntas le ayudarn a desarrollar futuras estrategias de ventas y
de marketing. Por ejemplo, las campaas de venta para los equipos de televisin de pantalla grande
deberan enfocarse en aquellos clientes que manifiestan su intencin de comprar? Se persuade con
mayor facilidad a los individuos dispuestos a comprar un televisores de pantalla grande de comprar
uno de alta definicin y/o un DVD?

os principios de la probabilidad ayudan a unir los mundos de la estadstica descriptiva y de la


L estadstica inferencial. Leer este captulo le ayudar a aprender sobre los diferentes tipos de pro-
babilidades y a revisarlos a la luz de nueva informacin. Estos temas son fundamentales para la dis-
tribucin de la probabilidad, el concepto de la esperanza matemtica y las distribuciones binomiales
y de Poisson (temas que se estudiarn en el captulo 5).

4.1 CONCEPTOS BSICOS DE PROBABILIDAD


Qu entendemos por la palabra probabilidad? Una probabilidad es un valor numrico que repre-
senta la oportunidad o posibilidad de que un evento en particular ocurra, tal como el aumento en el
precio de una accin, un da lluvioso, una unidad de produccin no conformada, o que caiga el cin-
co al lanzar un dado. En todos estos casos, la probabilidad es una proporcin o fraccin cuyo valor
4.1: Conceptos bsicos de probabilidad 123

vara entre 0 y 1 inclusive. Un evento que no tiene oportunidad de ocurrir (por ejemplo, un evento
imposible) tiene una probabilidad de 0. Un evento que ocurrir con toda seguridad (es decir, un
evento seguro) tiene una probabilidad de 1. Existen tres aproximaciones sujetas a la probabilidad:

probabilidad clsica a priori


probabilidad clsica emprica
probabilidad subjetiva

En una probabilidad clsica a priori, la probabilidad de xito se basa en el conocimiento pre-


vio del proceso implicado. En el caso ms simple, en el que cada resultado es igualmente probable,
la oportunidad de ocurrencia de un evento se define en la ecuacin 4.1.

PROBABILIDAD DE OCURRENCIA

X
Probabilidad de ocurrencia =  (4.1)
T
donde X = nmero de formas en las que el evento ocurre
T = nmero total de resultados posibles

Considere un mazo de cartas estndar con 26 cartas rojas y 26 cartas negras. La probabilidad de
seleccionar una carta negra es de 26/52 = 0.50, puesto que hay X = 26 cartas negras y T = 52 cartas
en total. Qu indica esta probabilidad? Si se reemplaza cada carta despus de haberla seleccionado,
significa que una de las dos siguientes cartas ser negra? No, porque usted no puede decir con cer-
teza lo que suceder en las selecciones posteriores. Sin embargo, puede decir que a la larga, si este
proceso de seleccin se repite continuamente, la proporcin de cartas negras seleccionadas se apro-
ximar a 0.50.

EJEMPLO 4.1 ENCONTRAR PROBABILIDADES A PRIORI


Un dado estndar tiene seis caras. Cada cara contiene uno, dos, tres, cuatro, cinco o seis puntos. Si
usted tira el dado, cul es la probabilidad de que caiga la cara de cinco puntos?
SOLUCIN Cada cara tiene la misma posibilidad de ocurrir. Como hay seis caras, la probabili-
dad de obtener la cara con cinco puntos es de 16.

Los ejemplos descritos usan el punto de vista de la probabilidad clsica a priori porque el n-
mero de formas en las que un evento puede ocurrir y el nmero total de resultados posibles se cono-
cen por la composicin del mazo de cartas o de las caras del dado.
En el punto de vista de la probabilidad clsica emprica, los resultados se basan en datos ob-
servados, no en un conocimiento previo del proceso. Ejemplos de este tipo de probabilidad son la
proporcin de individuos en el escenario Uso de la estadstica que realmente compren la televi-
sin, la proporcin de votantes registrados que optan por un determinado candidato poltico, o la
proporcin de alumnos que tienen un empleo de medio tiempo. Por ejemplo, si usted realiza una en-
cuesta a alumnos, y el 60% de ellos afirman que tienen un trabajo de medio tiempo, entonces hay
una probabilidad de 0.60 de que un alumno en particular tenga un trabajo de medio tiempo.
El tercer punto de vista de la probabilidad, la probabilidad subjetiva, se distingue de los otros
dos en que la probabilidad subjetiva difiere de persona a persona. Por ejemplo, tal vez el equipo de
desarrollo para un nuevo producto asigne una probabilidad de 0.6 a la oportunidad de xito para el
producto, mientras que el presidente de la empresa es menos optimista y asigna una probabilidad de
0.3. La asignacin de probabilidades subjetivas a diferentes resultados generalmente se basa en una
combinacin de las experiencias pasadas del individuo, la opinin personal y el anlisis de una si-
tuacin particular. La probabilidad subjetiva es particularmente til al tomar decisiones en situacio-
nes en las que no es posible usar la probabilidad clsica a priori o la probabilidad clsica emprica.
124 CAPTULO 4 Probabilidad bsica

Espacios muestrales y eventos


Los elementos bsicos de la teora de probabilidad son los resultados individuales de una variable
que se somete a estudio. Para entender las probabilidades es necesario que comprenda las siguientes
definiciones.

Cada posible resultado de una variable es un evento.

Un evento simple se describe por sus caractersticas singulares.

Por ejemplo, cuando lanza una moneda al aire, los dos posibles resultados son cara o cruz. Cada uno
de stos representa un evento sencillo. Cuando tira un dado estndar de seis lados, en el que las seis
caras del dado contienen uno, dos, tres, cuatro, cinco o seis puntos, hay seis eventos sencillos posi-
bles. Un evento puede ser uno de estos eventos simples, un conjunto de ellos o un subconjunto de to-
dos ellos. Por ejemplo, el evento de un nmero par de puntos consiste en tres eventos sencillos (por
ejemplo, dos, cuatro o seis puntos).

Un evento conjunto es un evento que tiene dos o ms caractersticas.

Sacar dos caras al lanzar al aire dos monedas es un ejemplo de evento conjunto, pues consiste en ob-
tener cara al lanzar al aire la primera moneda y cara al lanzar la segunda moneda.

El complemento del evento A (al que se le asigna el smbolo A) incluye todos los eventos que
no son parte de A.

El complemento de una cara es una cruz, puesto que es el nico evento que no es una cara. El com-
plemento de una cara de cinco puntos es no tener una cara de cinco puntos. No obtener un lado de
cinco puntos consiste en obtener un lado uno, dos, tres, cuatro o seis.

La coleccin de todos los eventos posibles se llama espacio muestral.

El espacio muestral de lanzar una moneda al aire consiste en cara y cruz. El espacio muestral cuan-
do tiramos un dado consiste en uno, dos, tres, cuatro, cinco y seis puntos.

EJEMPLO 4.2 ESPACIOS MUESTRALES Y EVENTOS


El escenario del recuadro Uso de la estadstica en la pgina 122 se refiere a la empresa Consumer
Electronics. La tabla 4.1 presenta los resultados de una muestra de 1,000 hogares en trminos de
comportamiento de compras de equipos de televisin de pantalla grande.

TABLA 4.1 REALMENTE LO COMPR


Comportamiento de PLANEA COMPRARLO S No Total
compras para equipos
de televisin de S 200 50 250
pantalla grande. No 100 650 750
Total 300 700 1,000

Qu es un espacio muestral? D ejemplos de eventos simples y eventos conjuntos.


SOLUCIN El espacio muestral consiste en las 1,000 personas encuestadas. Los eventos simples
son planea comprarlo, no planea comprarlo, compra y no compra. El complemento del
evento planea comprarlo es no planea comprarlo. El evento planea comprarlo y realmente lo
compra es un evento conjunto porque quien responde debe planear comprar la televisin y real-
mente comprarla.
4.1: Conceptos bsicos de probabilidad 125

Tablas de contingencia y diagramas de Venn


Existen diferentes formas de presentar un espacio muestral. La tabla 4.1 usa una tabla de clasifica-
ciones cruzadas para presentar un espacio muestral. La tabla tambin se llama tabla de contingen-
cia (vea la seccin 2.4). Se obtienen los valores en las celdas de la tabla al subdividir el espacio
muestral de los 1,000 hogares de acuerdo a si alguien plane comprar y realmente compr un equi-
po de televisin de pantalla grande. Por ejemplo, 200 de quienes respondieron planearon comprar un
equipo de televisin de pantalla grande y posteriormente lo compraron.
Un diagrama de Venn es una segunda forma de presentar un espacio muestral. Este diagrama
representa grficamente los diferentes eventos como uniones e intersecciones de crculos. La fi-
gura 4.1 presenta un diagrama de Venn tpico para una situacin de dos variables, en la que cada va-
riable tiene slo dos eventos (A y A, B y B). El crculo de la izquierda (de gris oscuro) representa
todos los eventos que son parte de A. El crculo de la derecha (de gris claro) representa todos los
eventos que son parte de B. El rea contenida dentro del crculo A y el crculo B (rea central), es la
interseccin de A y B (se escribe A B), porque es parte de A y tambin de B. El rea total de los
dos crculos es la unin de A y B (se escribe A B) y contiene todos los resultados que son slo par-
te del evento A, slo parte del evento B, o parte de ambos A y B. El rea en el diagrama fuera de A
B contiene los resultados que no son parte ni de A ni de B.
Usted debe definir A y B para desarrollar un diagrama de Venn. Se puede definir a un evento co-
mo A o como B, siempre y cuando sea congruente al evaluar los diversos eventos. Para el ejemplo de
Consumer Electronics, se pueden definir los eventos de la siguiente manera:
A = planea comprar B = realmente compr
A = no planea comprar B = no lo compr
Al disear un diagrama de Venn (vea la figura 4.2), usted debe determinar el valor de la inter-
seccin de A y B para dividir el espacio muestral en sus partes. A B consiste en los 200 hogares en
los que se plane comprar y realmente se compr el equipo de televisin de pantalla grande. El
evento remanente A (planean comprar), consiste en 50 hogares en los que se plane comprar el tele-
visor de pantalla grande pero que finalmente no lo compraron. El remanente del evento B (realmen-
te compraron) consiste en 100 hogares en los que no se plane comprar un equipo de televisin de
pantalla grande, pero en los que finalmente se compr uno. El resto de los 650 hogares representa a
aquellos que ni planearon ni compraron un equipo de televisin de pantalla grande.

B A B A B = 650
A B

A B
50 200 100
A

A B
A B = 350

FIGURA 4.1
Diagrama de Venn para los eventos FIGURA 4.2
A y B. Diagrama de Venn para el ejemplo
de Consumer Electronics.

Probabilidad simple (marginal)


Ahora usted est en condiciones de responder a algunas de las preguntas formuladas en el escenario
Uso de la estadstica. Como los resultados se basan en los datos recolectados en una encuesta (vea
la tabla 4.1 en la pgina 124), puede usar el punto de vista de la probabilidad clsica emprica.
Como se estableci antes, la ley bsica para las probabilidades es que varan en valor del 0 al 1.
Un evento imposible tiene una probabilidad de 0 y un evento seguro de ocurrir tiene una probabili-
dad de 1.
126 CAPTULO 4 Probabilidad bsica

Probabilidad simple se refiere a la probabilidad de ocurrencia de un evento simple, P(A).En el


escenario de Uso de la estadstica, una probabilidad simple es la probabilidad de planear la com-
pra de un equipo de televisin de pantalla grande. Cmo se determina la probabilidad de seleccio-
nar un hogar en el que se planee comprar un equipo de televisin de pantalla grande? Al utilizar la
ecuacin (4.1) en la pgina 123:

X
Probabilidad de ocurrencia = 
T

nmero de quienes planean comprar


P(planear comprar) = 
nmero total de hogares
250
=  = 0.25
1,000

Por lo tanto, hay un 0.25 (o un 25%) de probabilidad de que en un hogar se planee comprar un equi-
po de televisin de pantalla grande.
A la probabilidad simple tambin se le llama probabilidad marginal, porque es posible calcu-
lar el nmero total de los xitos (el nmero total de quienes planearon comprar) a partir del margen
apropiado de la tabla de contingencia (vea la tabla 4.1 en la pgina 124). El ejemplo 4.3 ilustra otra
aplicacin de la probabilidad simple.

EJEMPLO 4.3 CLCULO DE LA PROBABILIDAD DE QUE EL EQUIPO DE TELEVISIN


DE PANTALLA GRANDE QUE SE COMPRE SEA UN HDTV
En la encuesta de seguimiento del escenario de Uso de la estadstica, se hicieron preguntas adicio-
nales a 300 de los hogares en los que realmente se compr el equipo de televisin de pantalla gran-
de. La tabla 4.2 indica las respuestas del consumidor a si el equipo comprado era un HDTV y si tam-
bin compr un DVD en los ltimos 12 meses.

TABLA 4.2 COMPR DVD


Comportamiento de COMPR HDTV S No Total
compra respecto a
los HDTV y los DVD. HDTV 38 42 80
No HDTV 70 150 220
Total 108 192 300

Encuentre la probabilidad de que si en el hogar seleccionado al azar adquirieron un equipo de


televisin de pantalla grande, el equipo comprado sea un HDTV.
SOLUCIN Usando las siguientes definiciones:

A = compr un HDTV B = compr un DVD


A = no compr un HDTV B = no compr un DVD

nmero de equipos de televisin HDTV


P(HDTV) = 
nmero total de equipos de televisin

80
=  = 0.267
300
Hay una probabilidad del 26.7% de que el equipo de televisin de pantalla grande seleccionado al
azar comprado sea un HDTV.
4.1: Conceptos bsicos de probabilidad 127

Probabilidad conjunta
La probabilidad marginal se refiere a la probabilidad de ocurrencia de eventos simples. La probabi-
lidad conjunta se refiere a la probabilidad de ocurrencia que implica a dos o ms eventos. Un ejem-
plo de probabilidad conjunta es la probabilidad de que se obtenga cara al lanzar la primera vez la
moneda al aire y cara al lanzar por segunda vez la moneda.
En relacin con la tabla 4.1 en la pgina 124, aquellos individuos que planearon comprar y
realmente compraron el televisor de pantalla grande se identifican con los resultados de una celda
singular splanearon comprar y srealmente lo compraron. Como el grupo est formado por
200 hogares, la probabilidad de elegir un hogar que planee comprar y realmente lo compre es

planea comprar y realmente compra


P(planea comprar y realmente lo compra) = 
nmero total de quienes responden

200
=  = 0.20
1,000

El ejemplo 4.4 tambin demuestra cmo se determina la probabilidad conjunta.

EJEMPLO 4.4 DETERMINAR LA PROBABILIDAD CONJUNTA DE COMPRAR UN TELEVISOR DE


PANTALLA GRANDE Y DE COMPRAR UN HDTV Y UN DVD
En la tabla 4.2 de la pgina 126, los compradores aparecen en una clasificacin cruzada como HDTV
o no HDTV y si en esos hogares se adquiri o no un equipo reproductor de DVD. Encuentre la proba-
bilidad de que en los hogares seleccionados al azar, los compradores de un televisor de pantalla ad-
quirieron un equipo HDTV y un DVD.
SOLUCIN Se emplea la ecuacin (4.1) de la pgina 123,

nmero de compradores de un televisor HDTV y un DVD


P (televisor HDTV y DVD) = 
nmero total de compradores de un televisor de pantalla grande

38
=  = 0.127
300

Por lo tanto, tenemos una probabilidad del 12.7% de que el hogar seleccionado al azar en el que
se adquiri un equipo de televisin de pantalla grande, haya comprado un HDTV y un DVD.

Se puede ver la probabilidad marginal de un evento en particular usando el concepto de proba-


bilidad conjunta que se explic antes. La probabilidad marginal de un evento consiste en un conjun-
to de probabilidades conjuntas. Por ejemplo, si B consiste en dos eventos, B1 y B2, entonces P(A), la
probabilidad del evento A, consiste en la probabilidad conjunta de que el evento A ocurra con el
evento B1 y la probabilidad conjunta de que el evento A ocurra con el evento B2. Use la ecuacin
(4.2) para calcular las probabilidades marginales.

PROBABILIDAD MARGINAL

P(A) = P(A y B1) + P(A y B2) + + P(A y Bk) (4.2)

donde B1, B2, . . . , Bk son k eventos mutuamente excluyentes y colectivamente exhaustivos.


128 CAPTULO 4 Probabilidad bsica

Los eventos mutuamente excluyentes y colectivamente exhaustivos se definen as.

Dos eventos son mutuamente excluyentes si ambos eventos no pueden ocurrir de manera simul-
tnea.

Al tirar una moneda al aire, cara y cruz son eventos mutuamente excluyentes. El resultado de tirar
una moneda al aire no puede ser al mismo tiempo cara y cruz.

Un conjunto de eventos es colectivamente exhaustivo si uno de los eventos debe ocurrir.

Cara y cruz en una moneda son eventos colectivamente exhaustivos. Uno de ellos debe ocurrir.
Si no ocurre cara, entonces debe ocurrir cruz. Si cruz no ocurre, entonces debe ocurrir cara.
Ser masculino y ser femenino son eventos mutuamente excluyentes y colectivamente exhausti-
vos. Ninguna persona es de ambos sexos (son mutuamente excluyentes), y todos son uno u otro (son
colectivamente exhaustivos).
La ecuacin (4.2) sirve para calcular la probabilidad marginal de planear la compra de un equi-
po de televisin de pantalla grande.

P (planear la compra) = P (planear comprar y comprar)


+ P (planear comprar y no comprar)
200 50
=  + 
1,000 1,000
250
=  = 0.25
1,000

Usted obtendr el mismo resultado si suma el nmero de resultados que conforman el evento simple
planear la compra.

Regla general de la adicin


La regla general de la adicin nos permite encontrar la probabilidad del evento A o B. Esta regla
considera la ocurrencia de cualquiera de los eventos, evento A o evento B o ambos A y B. Cmo se
determina la probabilidad de que en un hogar se planee comprar o se compre realmente un equipo de
televisin de pantalla grande? El evento planear la compra o comprar realmente incluye a todos
los hogares en los que se planea comprar y todos los hogares en los que realmente se compr el equi-
po de televisin de pantalla grande. Revise cada celda de la tabla de contingencia (tabla 4.1, en la p-
gina 124) para determinar si es o no parte del evento. De la tabla 4.1, la celda planea comprar y no
la compr es parte del evento porque incluye a los encuestados que planeaban comprar. La celda
no plane comprar y realmente compr est incluida porque contiene a los encuestados que de
verdad compraron. Por ltimo, la celda planearon comprar y realmente compraron tiene ambas ca-
ractersticas de inters. Por lo tanto, la probabilidad de planear comprar o realmente comprar es:

P(planear comprar o realmente compr) = P(plane comprar y no compr realmente)


+ P(no plane comprar y realmente compr)
+ P(plane comprar y realmente compr)

50 100 200 350


=  +  +  =  = 0.35
1,000 1,000 1,000 1,000

A menudo encontrar ms fcil determinar P(A o B), la probabilidad del evento A o B, median-
te la regla general de la adicin definida en la ecuacin (4.3).
4.1: Conceptos bsicos de probabilidad 129

REGLA GENERAL DE LA ADICIN


La probabilidad de A o B es igual a la probabilidad de A ms la probabilidad de B menos la
probabilidad de A y B.

P(A o B) = P(A) + P(B) P(A y B) (4.3)

Aplicar esta ecuacin al ejemplo anterior produce el siguiente resultado:

P(planea comprar o realmente compr) = P(planea comprar) + P(realmente compr)


P(planea comprar y compr)
250 300 200
=   +  
1,000 1,000 1,000
350
=  = 0.35
1,000

La regla general de la adicin consiste en tomar la probabilidad de A y sumarla a la probabili-


dad de B, y despus sustraer el evento conjunto de A y B de este total, porque el evento conjunto ya
se incluy tanto en el clculo de la probabilidad de A y en la probabilidad de B. En relacin con la
tabla 4.1 en la pgina 124, si los resultados del evento planean comprar se suman a aquellos del
evento realmente compraron, el evento conjunto planearon comprar y realmente compraron se
incluye en cada uno de estos eventos simples. Por lo tanto, como este evento conjunto se ha contado
dos veces, debe restarse para obtener el resultado correcto. El ejemplo 4.5 ilustra otra aplicacin de
la regla general de la adicin.

EJEMPLO 4.5 USO DE LA REGLA GENERAL DE LA ADICIN PARA LOS HOGARES EN LOS QUE
SE COMPRARON EQUIPOS DE TELEVISIN DE PANTALLA GRANDE
En el ejemplo 4.3 de la pgina 126, las compras se clasificaron de forma cruzada como HDTV o no
HDTV y si en el hogar se compr o no un DVD. Encuentre la probabilidad de que entre los hogares en
los que se adquiri un equipo de televisin de pantalla grande, se haya comprado un HDTV o un DVD.
SOLUCIN Mediante la ecuacin (4.3),

P(HDTV o DVD) = P(HDTV) + P(DVD) P(HDTV y DVD)


80 108 38
=  +  
300 300 300
150
=  = 0.50
300
Por lo tanto, se tiene el 50.0% de probabilidad de que el hogar seleccionado al azar en el que se ad-
quiri un equipo de televisin de pantalla grande, se haya comprado un HDTV o un DVD.

PROBLEMAS PARA LA SECCIN 4.1


Aprendizaje bsico
ASISTENCIA4.1 Se lanzan dos monedas al aire. 4.2 Una urna contiene 12 pelotas rojas y 8 pelotas blancas. Se
a. D un ejemplo de un evento simple.
de PH Grade seleccionar una pelota de la urna.
b. D un ejemplo de un evento conjunto. a. D un ejemplo de un evento simple.
c. Cul es el complemento de una cara en el primer lanza- b. Cul es el complemento de una pelota roja?
miento?
130 CAPTULO 4 Probabilidad bsica

ASISTENCIA 4.3 A partir de la siguiente tabla de contingencia: AUTO 4.8 En Estados Unidos una encuesta sobre vivienda
de PH Grade Examenestudi cmo llegan al trabajo los propietarios de
B B una casa (How People Get to Work, USA Today
A 10 20 Snapshots, 25 de febrero, 2003, 1A). Suponga que la encuesta
A 20 40 const de una muestra de 1,000 propietarios de casa y 1,000 in-
quilinos.
Cul es la probabilidad del
a. evento A?
b. evento A? Maneja hacia Propietario
c. evento A y B? el trabajo de casa Inquilino Total
d. evento A o B? S 824 681 1,505
4.4 A partir de la siguiente tabla de contingencia: No 176 319 495
ASISTENCIA
de PH Grade
Total 1,000 1,000 2,000
B B
A 10 30 a. D un ejemplo de un evento simple.
A 25 35 b. D un ejemplo de un evento conjunto.
c. Cul es el complemento de maneja hacia el trabajo?
Cul es la probabilidad del d. Por qu maneja hacia el trabajo y es un propietario de ca-
a. evento A? sa es un evento conjunto?
b. evento A y B? 4.9 En relacin con la tabla de contingencia del problema 4.8,
c. evento A y B? si quien responde es seleccionado al azar, cul es la probabili-
d. evento A o B? dad de que ella o l
a. maneje hacia el trabajo?
b. maneje hacia el trabajo y sea propietario de casa?
c. maneje hacia el trabajo o sea propietario de casa?
Aplicacin de conceptos d. Explique la diferencia en los resultados de los incisos b)
4.5 Para cada uno de los siguientes enunciados, in- y c).
ASISTENCIA
de PH Grade dique si el tipo de probabilidad implicada es un 4.10 Un estudio sobre el mejoramiento de la produccin en
ejemplo de probabilidad clsica a priori, probabili- una fbrica de semiconductores proporcion datos de los defec-
dad clsica emprica o probabilidad subjetiva. tos para una muestra de 450 placas de silicio. La siguiente tabla
a. El siguiente lanzamiento de una moneda caer cara. presenta un resumen de las respuestas a dos preguntas: Se en-
b. Italia ganar la Copa Mundial la prxima vez que se realice contraron partculas en el troquel que produjo la placa?, y
esa competencia. La placa era buena o mala?
c. La suma de las caras de dos dados ser 7.
d. El tren que toma un viajero para llegar al trabajo llegar con
ms de 10 minutos de retraso. CONDICIN DEL TROQUEL
CALIDAD DE Sin Con
4.6 Para cada uno de los siguientes enunciados, establezca si
LA PLACA partculas partculas Total
los eventos son mutuamente excluyentes y colectivamente ex-
haustivos. Si no es as, renombre las categoras para hacerlos Buena 320 14 334
mutuamente excluyentes y colectivamente exhaustivos o expli- Mala 80 36 116
que por qu no sera til hacerlo. Total 400 50 450
a. A los votantes registrados de Estados Unidos se les pre-
Fuente: S.W. Hall, Analysis of Defectivity of semiconductor Wafers by Con-
gunt si estn registrados como republicanos o como dem-
tingency Table, Proceedings of Institute of Environmental Sciences, vol. 1
cratas.
(1994), 177-183.
b. Quienes respondieron fueron clasificados por el tipo de
automvil que l o ella manejan: estadounidense, europeo,
japons o ninguno. a. D un ejemplo de evento simple.
c. Se les pregunt: Actualmente vive en i) un apartamento o b. D un ejemplo de evento conjunto.
ii) en una casa? c. Cul es el complemento de una placa de silicio es buena?
d. Un producto fue clasificado como defectuoso o no defec- d. Por qu una placa buena y un troquel con partculas es
tuoso. un evento conjunto?
4.7 La probabilidad de cada uno de los siguientes eventos es 4.11 En relacin con la tabla de contingencia del problema
cero. Para cada uno de ellos establezca por qu. 4.10, si la placa de silicio se seleccion al azar, cul es la pro-
a. Un votante en Estados Unidos que est registrado como re- babilidad de que
publicano y como demcrata. a. fuera producida con un troquel sin partculas?
b. Un producto que es defectuoso y no defectuoso. b. sea una placa mala y fuera producida con un troquel sin par-
c. Un automvil es de marca Ford y Toyota. tculas?
4.2: Probabilidad condicional 131

c. Sea una placa mala o fuera producida con un troquel con b. sea negro y no demande por prejuicios?
partculas? c. sea negro o demande por prejuicios?
d. Explique la diferencia en los resultados de los incisos b) d. Explique la diferencia en los resultados de los incisos b)
y c). y c).
ASISTENCIA 4.12 Es menos probable que las grandes empresas 4.14 Una muestra de 500 personas fue seleccionada en una
de PH Gradeofrezcan acciones a los miembros de su junta directi- gran rea metropolitana para estudiar el comportamiento del
va que las empresas pequeas o medianas? Una en- consumidor. Entre las preguntas estaban Disfruta comprando
cuesta que realiz la Segal Company de Nueva York encontr ropa? De 240 hombres, 136 contestaron que s. De 260 muje-
que en una muestra de 189 empresas grandes, 40 les ofrecieron res 224 contestaron que s. Realice una tabla de contingencia o
opciones de acciones a los miembros de su consejo directivo un diagrama de Venn para evaluar las probabilidades. Cul es
como parte de sus paquetes de compensacin que no implica- la probabilidad de que un encuestado elegido al azar
ban efectivo. De las empresas pequeas y medianas, 43 de las a. disfrute comprando ropa?
180 encuestadas indicaron que ofrecieron las acciones como b. sea mujer y disfrute comprando ropa?
parte de sus paquetes de compensacin que no implicaban efec- c. sea mujer o disfrute comprando ropa?
tivo a los miembros de su consejo directivo (Kemba J. Dun- d. sea hombre o mujer?
ham, The Jungle: Focus on Recruitment, Pay and Getting
4.15 Cada ao se compilan las clasificaciones respecto al
Ahead, The Wall Street Journal, 21 de agosto, 2001, B6).
desempeo de los autos nuevos durante los primeros 90 das de
Construya una tabla de contingencia o un diagrama de Venn pa-
uso. Suponga que los autos se han clasificado de acuerdo a si
ra evaluar las probabilidades. Si la empresa es seleccionada al
necesitan una garanta relacionada con reparacin (s o no) y el
azar, cul es la probabilidad de que la compaa
pas en el que la empresa manufacturera tiene su sede (Estados
a. ofrezca opciones de acciones a los miembros de su consejo
Unidos o fuera de Estados Unidos). Con base en los datos reca-
directivo?
bados, la probabilidad de que un auto nuevo necesite de una ga-
b. sea una empresa pequea o mediana y no ofrezca opciones
ranta de reparacin es de 0.04, la probabilidad de que el auto
de acciones a los miembros de su consejo directivo?
sea manufacturado por una empresa con sede en Estados Uni-
c. sea una empresa pequea a mediana u ofrezca opciones de
dos es de 0.60, y la probabilidad de que el auto nuevo necesite
acciones a los miembros de su consejo directivo?
una garanta de reparacin y haya sido manufacturado por una
d. Explique la diferencia en los resultados de los incisos b)
empresa con sede en Estados Unidos es de 0.025. Elabore
y c).
una tabla de contingencia o un diagrama de Venn para evaluar
4.13 Es ms probable que los blancos presenten demandas la probabilidad de una garanta relacionada con la reparacin.
por prejuicios? Una encuesta que realiz Barry Goldman Cul es la probabilidad de que un auto nuevo seleccionado al
(White Fight: A Researcher Finds Whites Are More Likely to azar
Claim Bias, The Wall Street Journal, Work Week, 10 de abril, a. necesite una garanta relacionada con reparaciones?
2001, A1) encontr que de 56 trabajadores despedidos, 29 pre- b. necesite una garanta relacionada con reparaciones y sea
sentaron demandas por prejuicios. De 407 trabajadores negros manufacturado por una empresa con sede en estados Uni-
despedidos, 126 demandaron por prejuicios. Elabore una tabla dos?
de contingencia o un diagrama de Venn para evaluar las proba- c. necesite una garanta de reparacin o fue manufacturado por
bilidades. Si un trabajador es seleccionado al azar, cul es la una empresa con sede en Estados Unidos?
probabilidad de que l o ella d. necesite una garanta de reparacin o no fue manufacturado
a. presente una demanda por prejuicios? por una empresa con sede en Estados Unidos?

4.2 PROBABILIDAD CONDICIONAL


Clculo de probabilidades condicionales
Cada ejemplo en la seccin 4.1 implic encontrar la probabilidad de un evento muestreado del espa-
cio muestral completo. Cmo se determina la probabilidad de un evento si cierta informacin acer-
ca de los eventos implicados es ya conocida?
La probabilidad condicional se refiere a la probabilidad del evento A, dada informacin acer-
ca de la ocurrencia de otro evento B.

PROBABILIDAD CONDICIONAL
La probabilidad de A dado B es igual a la probabilidad de A y B dividida por la probabilidad de B

P(A y B)
P(A | B) =  (4.4a)
P(B )
132 CAPTULO 4 Probabilidad bsica

La probabilidad de B dado A es igual a la probabilidad de A y B dividida por la probabilidad


de A
P(A y B)
P(B | A) =  (4.4b)
P(A)

donde P(A y B) = probabilidad conjunta de A y B


P(A) = probabilidad marginal de A
P(B) = probabilidad marginal de B

En relacin con el escenario de Uso de la estadstica que se refiere a la compra de un equipo de te-
levisin de pantalla grande, suponga que en cierto hogar se planea comprar un equipo de televisin
de pantalla grande. Ahora, cul es la probabilidad de que en ese hogar se compre realmente el equi-
po de televisin? En este ejemplo el objetivo es encontrar P(compra real planea comprar). Aqu se
le proporciona la informacin de que el hogar planea comprar el equipo de televisin de pantalla
grande. Por lo tanto, el espacio muestral no consiste en todos los 1,000 hogares de la encuesta. Con-
siste slo en aquellos que realmente compraron el equipo de televisin de pantalla grande. De 250
de esos hogares, 200 compraron realmente el equipo de televisin de pantalla grande. Por lo tanto
(vea la tabla 4.1 en la pgina 124 o la figura 4.2 en la pgina 125), la probabilidad de que en un ho-
gar realmente se compre un equipo de televisin de pantalla grande dado que lo plane comprar es

plane comprar y realmente compr


P(realmente compr | plane comprar) = 
plane comprar

200
=  = 0.80
250

Tambin es posible usar la ecuacin (4.4b) para calcular este resultado.

P(A y B)
P(B | A) = 
P(A)

donde evento A = plane comprar

evento B = realmente compr

Entonces

200/1,000
P(realmente compr | plane comprar) = 
250/1,000

200
=  = 0.80
250

El ejemplo 4.6 ilustra an ms la probabilidad condicional.

EJEMPLO 4.6 ENCONTRAR LA PROBABILIDAD CODICIONAL REFERENTE A LOS HOGARES


QUE REALMENTE COMPRARON UN EQUIPO DE TELEVISIN DE PANTALLA
GRANDE
La tabla 4.3 en la pgina 126 es una tabla de contingencia que se refiere a si el hogar compr un
HDTV y un DVD. De los hogares que compraron un HDTV, cul es la probabilidad de que tambin
hayan comprado un DVD?
4.2: Probabilidad condicional 133

SOLUCIN Como se sabe en qu hogares compraron un HDTV, el espacio muestral se reduce a


80 hogares. De estos 80, 38 tambin compraron un DVD. Por lo tanto, la probabilidad de que un ho-
gar comprara un DVD, dado que el hogar compr un HDTV es:

nmero que compr HDTV y DVD


P(compr DVD | compr HDTV) = 
nmero que compr HDTV

38
=  = 0.475
80

Si se usa la ecuacin (4.4a) de la pgina 131:

A = compr DVD B = compr HDTV

entonces

P(A y B) 38/300
P(A | B) =  =  = 0.475
P(B) 80/300

Entonces, dado que en un hogar se compr un HDTV, hay un 47.5% de posibilidades de que tambin
haya comprado un DVD. Se puede comparar esta probabilidad condicional con la probabilidad mar-
ginal de comprar un DVD, la cual es de 108/300 = 0.36, o del 36%. Estos resultados indican que los
hogares en los que se compr un HDTV tienen ms probabilidades de comprar un DVD que los hoga-
res que compraron un equipo de televisin de pantalla grande que no es un HDTV.

rboles de decisin
En la tabla 4.1 en la pgina 124, los hogares se clasifican de acuerdo con sus planes de comprar o de
si realmente compraron el equipo de televisin de pantalla grande. Un rbol de decisin es una
alternativa para la tabla de contingencia. La figura 4.3 representa el rbol de decisin para este
ejemplo.

FIGURA 4.3
rbol de decisin nte
para el ejemplo de lme P(A y B) = 200
250 Rea raron
p 1,000
Consumer Electronics. P(A) = com
1,000

an
eab No co
Plan prar mpra 50
com ron P(A y B ) =
Conjunto 1,000
total de
hogares
No
pla
com neaba ompra
ron
pra n ente c P(A y B) = 100
r Realm 1,000

750
P(A)
1,000 No
com
pra
ron P(A y B ) = 650
1,000

En la figura 4.3 iniciando a la izquierda con el conjunto total de hogares, se abren dos ramas
para indicar si planearon o no comprar el equipo de televisin de pantalla grande. Cada una de estas
ramas tiene dos subramas, correspondientes a si el hogar realmente compr o no el equipo de televi-
sin de pantalla grande. Las probabilidades al final de las ramas iniciales representan la probabilidad
134 CAPTULO 4 Probabilidad bsica

marginal de A y A. La probabilidad al final de cada una de la cuatro subramas representa la proba-


bilidad conjunta de cada combinacin de eventos A y B. Calcule la probabilidad condicional divi-
diendo la probabilidad conjunta por la probabilidad marginal apropiada.
Por ejemplo, para calcular la probabilidad de que cierto hogar realmente compr luego de que
plane comprar el equipo de televisin de pantalla grande, tome P(plane comprar y realmente com-
pr) y divdalo por P(plane comprar). A partir de la figura 4.3

200/1,000
P(realmente compr | plane comprar) = 
250/1,000

200
=  = 0.80
250

El ejemplo 4.7 ilustra cmo construir un rbol de decisin.

EJEMPLO 4.7 CREACIN DEL RBOL DE DECISIN PARA LOS HOGARES EN LOS QUE
SE COMPR UN EQUIPO DE TELEVISIN DE PANTALLA GRANDE
Utilice los datos cruzados clasificados de la tabla 4.2 en la pgina 126 y realice el rbol de decisin.
Use el rbol de decisin para encontrar la probabilidad de que en un hogar se haya comprado un
DVD, dado que el hogar compr un HDTV.

SOLUCIN El rbol de decisin para haber comprado un DVD y un HDTV se muestra en la figura
4.4. Emplee la ecuacin (4.4b) en la pgina 132 y las siguientes definiciones:

A = compr HDTV B = compr un DVD

P(A y B) 38/300
P(B | A) =  =  = 0.475
P(A) 80/300

FIGURA 4.4
rbol de decisin para
haber comprado un DVD D 38
y un HDTV. 80 pr DV P(A y B) =
300
P(A) =
300 Com

TV No co
pr HD mpr
DVD P(A y B) = 42
Conjunto Com 300
completo
de hogares N
o com
pr
HD
TV r DVD P(A y B) = 70
Comp 300

220
P(A) = No
300 com
pr
DVD P(A y B) = 150
300

Independencia estadstica
En el ejemplo relacionado con la compra de equipos de televisin de pantalla grande, la probabili-
dad condicional es de 200/250 = 0.80 de que en el hogar seleccionado realmente se haya comprado
un equipo de televisin de pantalla grande, luego de que se plane comprarlo. La probabilidad sim-
4.2: Probabilidad condicional 135

ple de seleccionar un hogar que realmente hizo la compra es de 300/1,000 = 0.30. Estos resultados
muestran que el conocimiento previo de que en el hogar se plane comprar afect la probabilidad de
que el hogar realmente comprara el equipo de televisin. En otras palabras, el resultado de un even-
to es dependiente del resultado de un segundo evento.
Cuando el resultado de un evento no afecta la probabilidad de ocurrencia de otro evento, se di-
ce que los eventos son estadsticamente independientes. La independencia estadstica se determina
mediante la ecuacin (4.5).

INDEPENDENCIA ESTADSTICA
Dos eventos A y B son estadsticamente independientes si y slo si

P(A | B) = P(A) (4.5)

donde P(A | B) = probabilidad condicional de A dado B

P(A) = probabilidad marginal de A

El ejemplo 4.8 demuestra el uso de la ecuacin (4.5).

EJEMPLO 4.8 DETERMINACIN DE LA INDEPENDENCIA ESTADSTICA


En el estudio de seguimiento de 300 hogares que realmente compraron un equipo de televisin de
pantalla grande, se pregunt a los encuestados si estaban satisfechos con sus compras. La tabla 4.3
de respuestas cruzadas clasifica las respuestas a la pregunta sobre la satisfaccin dependiendo de si
el equipo de televisin era un HDTV.

TABLA 4.3 SATISFECHO CON LA COMPRA?


Satisfaccin con la TIPO DE TELEVISIN S No Total
compra de equipos de
televisin de pantalla HDTV 64 16 80
grande. No HDTV 176 44 220
Total 240 60 300

Determine si estar satisfecho con la compra y el tipo de televisor comprado son estadsticamen-
te independientes.

SOLUCIN Para estos datos,

64/300 64
P(satisfecho | HDTV) =  =  = 0.80
80/300 80

lo que es igual a

240
P(satisfecho) =  = 0.80
300

As que estar satisfecho con la compra y el tipo de equipo de televisin comprado son estadstica-
mente independientes. El conocimiento de un evento no afecta la probabilidad del otro evento.
136 CAPTULO 4 Probabilidad bsica

Reglas de multiplicacin
Al manipular la frmula de la probabilidad condicional, es posible determinar la probabilidad con-
junta P(A y B) de la probabilidad condicional de un evento. La regla general de la multiplicacin
se obtiene con la ayuda de la ecuacin (4.4a) en la pgina 131.

P(A y B)
P(A | B) = 
P(B)

y se resuelve la probabilidad conjunta P (A y B).

REGLA GENERAL DE LA MULTIPLICACIN


La probabilidad de A y B es igual a la probabilidad de A dado B por la probabilidad de B.

P(A y B) = P(A | B)P(B) (4.6)

El ejemplo 4.9 demuestra el uso de la regla general de la multiplicacin.

EJEMPLO 4.9 USO DE LA REGLA DE MULTIPLICACIN


Considere los 80 hogares en los que se compr un HDTV. En la tabla 4.3 en la pgina 135 se observa
que en 64 hogares estn satisfechos con su compra y en 16 hogares no estn satisfechos. Suponga que
se seleccionan al azar dos hogares de los 80 que realizaron la compra. Encuentre la probabilidad de
que ambos hogares estn satisfechos con su adquisicin.
SOLUCIN Aqu se emplea la regla de la siguiente manera. Si:

A = segundo hogar seleccionado est satisfecho


B = primer hogar seleccionado est satisfecho

entonces, mediante la ecuacin (4.6)

P(A y B)  P(A | B)P(B)

La probabilidad de que el primer hogar est satisfecho con la compra es de 64/80. Sin embargo, la
probabilidad de que el segundo hogar tambin est satisfecho con la compra depende del resultado
de la primera seleccin. Si el primer hogar no se devuelve a la muestra despus de determinar el ni-
vel de satisfaccin (muestreo sin sustitucin), entonces el nmero de hogares restantes ser de 79. Si
el primer hogar est satisfecho, la probabilidad de que el segundo hogar tambin est satisfecho es
63/79, porque en la muestra permanecen 63 hogares satisfechos. Por lo tanto,

  
63 64
P(A y B) =   = 0.6380
79 80

Hay 63.80% de posibilidades de que ambos hogares muestreados estn satisfechos con sus compras.

La regla de multiplicacin para eventos independientes se obtiene al sustituir P(A) por P(A | B)
en la ecuacin (4.6).

REGLA DE MULTIPLICACIN PARA EVENTOS INDEPENDIENTES


Si A y B son estadsticamente independientes, la probabilidad de A y B es igual a la probabilidad
de A por la probabilidad de B.

P(A y B) = P(A)P(B) (4.7)


4.2: Probabilidad condicional 137

Si esta regla sirve para dos eventos, A y B, entonces A y B son estadsticamente independientes.
Por lo tanto, existen dos maneras de determinar la independencia estadstica.
1. Los eventos A y B son estadsticamente independientes si y slo si P(A | B) = P(A).
2. Los eventos A y B son estadsticamente independientes si y slo si P(A y B) = P(A)P(B).

Probabilidad marginal usando la regla general


de la multiplicacin
En la seccin 4.1 se defini la probabilidad marginal con la ayuda de la ecuacin (4.2) de la pgina
127. Es factible expresar la frmula para la probabilidad marginal mediante la regla general de la
multiplicacin. Si

P(A) = P(A y B1) + P(A y B2) + . . . + P(A y Bk)

entonces, al usar la regla general de la multiplicacin, la ecuacin (4.8) define la probabilidad mar-
ginal.

PROBABILIDAD MARGINAL USANDO LA REGLA GENERAL


DE LA MULTIPLICACIN

P(A)  P(A | B1)P(B1) P(A | B2)P(B2)    P(A | Bk)P(Bk) (4.8)

donde B1, B2, . . . , Bk son los eventos k mutuamente excluyentes y colectivamente exhaustivos.

Para ilustrar esta ecuacin, consulte la tabla 4.1 en la pgina 124. Al utilizar la ecuacin (4.8),
la probabilidad de planear una compra es:

P(A) = P(A | B1)P(B1) + P(A | B2)P(B2)

donde P(A) = probabilidad de planea comprar


P(B1) = probabilidad de realmente compr
P(B2) = probabilidad de no compr
200 300 50 700
P(A) = +
300 1,000 700 1,000
200 50 250
= + = = 0.25
1,000 1,000 1,000

PROBLEMAS PARA LA SECCIN 4.2


Aprendizaje bsico
ASISTENCIA 4.16 A partir de la siguiente tabla de contingencia: 4.17 A partir de la siguiente tabla de contingencia:
de PH Grade
B B B B
A 10 20 A 10 30
A 20 40 A 25 35

Cul es la probabilidad de Cul es la probabilidad de


a. A | B? a. A | B?
b. A | B? b. A | B?
c. A | B? c. A | B?
d. Los eventos A y B son estadsticamente independientes? d. Los eventos A y B son estadsticamente independientes?
138 CAPTULO 4 Probabilidad bsica

ASISTENCIA 4.18 Si P(A y B) = 0.4 y P(B) = 0.8, encuentre ASISTENCIA 4.23 Es menos probable que las grandes empresas
de PH Grade P(A | B). de PH Grade ofrezcan acciones a los miembros de su consejo di-
rectivo que las empresas pequeas o medianas? Una
ASISTENCIA 4.19 Si P(A) = 0.7 y P(B) = 0.6, y si A y B son esta-
encuesta que realiz Segal Company de Nueva York encontr
de PH Grade dsticamente independientes, encuentre P(A y B).
que en una muestra de 189 empresas grandes, 40 ofrecieron op-
ASISTENCIA 4.20 Si P(A) = 0.3 y P(B) = 0.4, y si P(A y B) = 0.2, ciones de acciones a los miembros de su consejo directivo co-
de PH Grade A y B son estadsticamente independientes? mo parte de sus paquetes de compensacin sin efectivo. Entre
las compaas pequeas y medianas, 43 de las 180 encuestadas
Aplicacin de conceptos indicaron que ofrecieron las opciones de acciones como parte
de sus paquetes de compensacin que no implicaban efectivo a
AUTO 4.21 En Estados Unidos una encuesta sobre vivien-
los miembros de su consejo directivo (Kemba J. Dunham, The
Examen da estudi cmo llegan al trabajo los propietarios de
Jungle: Focus on Recruitment, Pay and Getting Ahead, The
casa (How People Get to Work, USA Today
Wall Street Journal, 21 de agosto, 2001, B6).
Snapshots, 25 de febrero, 2003, 1A). Suponga que la encuesta
consisti en una muestra de 1,000 propietarios de casa y 1,000 a. Si una empresa es grande, cul es la probabilidad de que
inquilinos. ofrezca opciones de acciones a los miembros de su consejo
directivo?
b. Si la empresa es de pequea a mediana, cul es la probabi-
Maneja al trabajo Propietario Inquilino Total lidad de que ofrezca opciones de acciones a los miembros de
S 824 681 1,505 su consejo directivo?
No 176 319 495 c. Es el tamao de la empresa estadsticamente independiente
Total 1,000 1,000 2,000 de si se ofrecen opciones de acciones a los miembros del
consejo directivo? Explique su respuesta.
a. Si una persona responde que maneja hacia su trabajo, cul 4.24 Es ms probable que los blancos presenten demandas
es la probabilidad de que l o ella sea propietario de su casa? por prejuicios? Una encuesta conducida por Barry Goldman
b. Si quien responde es un propietario, cul es la probabilidad (White Fight: A Researcher Finds Whites Are More Likely to
de que l o ella maneje hacia el trabajo? Claim Bias, The Wall Street Journal, Work Week, 10 de abril,
c. Explique la diferencia en los resultados de los incisos a) 2001, A1) encontr que de 56 trabajadores despedidos, 29 pre-
y b). sentaron demandas por prejuicios. De 407 trabajadores negros
d. Son estos dos eventos, manejar hacia el trabajo y si quien despedidos, 126 demandaron por prejuicios.
responde renta la casa o es propietario de ella, estadstica- a. Si un trabajador es blanco, cul es la probabilidad de que
mente independientes? haya presentado una demanda por prejuicios?
4.22 Un estudio de mejoramiento de la produccin de un fabri- b. Si un trabajador present una demanda por prejuicios, cul
cante de semiconductores proporcion datos de defectos para es la probabilidad de que sea blanco?
una muestra de 450 placas de silicio. La siguiente tabla presen- c. Explique las diferencias en los resultados de los incisos a)
ta un resumen de las respuestas a dos preguntas: Se encontra- y b).
ron partculas en el troquel que produjo la placa de silicio?, y d. Son los dos eventos ser blanco y demandar por pre-
La placa era buena o mala? juicios estadsticamente independientes? Explique su res-
puesta.
CONDICIN DEL TROQUEL 4.25 Se seleccion una muestra de 500 encuestados en un rea
CALIDAD DE Sin metropolitana grande para estudiar el comportamiento del con-
LA PLACA partculas Partculas Total sumidor. Los resultados fueron los siguientes:
Buena 320 14 334
Mala 80 36 116 GNERO
Total 400 50 450 DISFRUTA COMPRANDO
ROPA Masculino Femenino Total
Fuente: S.W. Hall, Analysis of Defectivity of Semiconductor Wafers by Con-
tingency Table, Proceedings Institute of Environmental Sciences, Vol. 1 S 136 224 360
(1994), 177-183.
No 104 36 140
Total 240 260 500
a. Suponga que sabe que una placa de silicio es mala. Cul es
la probabilidad de que fuera producida con un troquel que
tena partculas? a. Suponga que el encuestado elegido es mujer. Cul es la
b. Suponga que sabe que una placa de silicio es buena. Cul probabilidad de que ella no disfrute de comprar ropa?
es la probabilidad de que fuera producida con un troquel que b. Suponga que el encuestado elegido disfruta de comprar ro-
tena partculas? pa. Cul es la probabilidad de que el individuo sea hombre?
c. Son estos dos eventos, una placa buena y un troquel sin c. Disfrutar comprando ropa y el gnero del individuo son
partculas, estadsticamente independientes? Explique su eventos estadsticamente independientes? Explique su res-
respuesta. puesta.
4.3: Teorema de Bayes 139

4.26 Cada ao se compilan las clasificaciones respecto al de- b. Si S&P 500 termin ms alto despus de los primeros cinco
sempeo de los autos nuevos durante los primeros 90 das de das de transacciones, cul es la probabilidad de que haya
uso. Suponga que los autos se han clasificado de acuerdo a si el terminado alto en el ao?
auto necesita una garanta relacionada con reparacin (s o no) c. Los dos eventos, desempeo en la primera semana y de-
y el pas en el que la empresa manufacturera tiene su sede (Es- sempeo anual, son estadsticamente independientes? Expli-
tados Unidos o fuera de Estados Unidos). Con base en los datos que su respuesta.
recabados, la probabilidad de que un auto nuevo necesite de d. En 2004, S&P 500 estuvo arriba un 0.9% despus de los pri-
una garanta de reparacin es de 0.04, la probabilidad de que el meros cinco das. Vea el desempeo anual del 2004 de S&P
auto sea manufacturado por una empresa con sede en Estados 500 en finance.yahoo.com. Comente los resultados.
Unidos es de 0.60, y la probabilidad de que el auto nuevo nece-
4.28 Se usa un mazo de cartas tradicional para organizar un
site una garanta de reparacin y haya sido manufacturado por
juego. Hay cuatro palos (corazones, diamantes, trboles y espa-
una empresa con sede en Estados Unidos es de 0.025.
das), cada uno tiene 13 cartas (as, 2, 3, 4, 5, 6, 7, 8, 9, 10, jack,
a. Suponga que usted sabe que una empresa asentada en los
reina y rey), que hacen un total de 52 cartas. Este mazo comple-
Estados Unidos manufactur el auto. Cul es la probabili-
to se baraja perfectamente y usted recibir dos cartas del mazo
dad de que el auto necesite una garanta de reparacin?
sin reemplazo.
b. Suponga que sabe que una empresa con sede en Estados
a. Cul es la probabilidad de que ambas cartas sean reinas?
Unidos no manufactur el auto. Cul es la probabilidad de
b. Cul es la probabilidad de que la primera carta sea un 10 y
que el auto necesite una garanta de reparacin?
la segunda carta sea un 5 o un 6?
c. La necesidad de una garanta de reparacin y la sede de la
c. Si la muestra fuera con reemplazo, cul sera la respuesta al
empresa que manufactura autos son estadsticamente inde-
inciso a)?
pendientes?
d. En el juego de blackjack, las cartas con figura (jack, reina,
4.27 En 34 de los 54 aos que van desde 1950 a 2003, S&P rey) valen 10 puntos y el as vale 1 u 11 puntos. Todas las de-
500 termin muy alto despus de los primeros cinco das de ms cartas cuentan por su valor. Usted logra hacer blackjack
transacciones. En 29 de esos 34 aos S&P termin alto durante si sus dos cartas totalizan 21 puntos. Cul es la probabili-
el ao. Iniciar bien la primera semana es buen presagio para el dad de obtener un blackjack en este problema?
ao que vendr? La siguiente tabla muestra el desempeo de la
ASISTENCIA 4.29 Una caja de nueve guantes de golf contiene
primera semana y el desempeo anual en este periodo de 54 de PH Grade dos guantes para la mano izquierda y siete guantes
aos.
para la mano derecha.
a. Si dos guantes de la caja se seleccionan al azar sin reempla-
DESEMPEO ANUAL DE S&P 500 zo, cul es la probabilidad de que ambos guantes seleccio-
PRIMERA SEMANA Alto Bajo nados sean para la mano derecha?
b. Si dos guantes de la caja se seleccionan al azar sin reempla-
Alto 29 5 zo, cul es la probabilidad de que uno de los guantes selec-
Bajo 10 10 cionados sea para la mano derecha y uno para la mano iz-
Fuente: Adaptado de Aaron Luchetti, Stocks Enjoy a Good First Week,
quierda?
The Wall Street Journal, 12 de enero, 2004, C1. c. Si se seleccionan con reemplazo tres guantes, cul es la
probabilidad de que los tres guantes sean para la mano iz-
quierda?
a. Si el ao se selecciona al azar, cul es la probabilidad de d. Si la muestra fuera con reemplazo, cules seran las res-
que S&P haya terminado alto ese ao? puestas para los incisos a) y b)?

4.3 TEOREMA DE BAYES


El teorema de Bayes se utiliza para revisar probabilidades previamente calculadas cuando se posee
nueva informacin. Desarrollado por el Reverendo Thomas Bayes en el siglo XVIII (vea la referen-
cia 1), el teorema de Bayes es una extensin de lo que ha aprendido hasta ahora acerca de la proba-
bilidad condicional.
El teorema de Bayes se aplica a la siguiente situacin. La empresa Consumer Electronics est
considerando comercializar un nuevo modelo de televisor. En el pasado, el 40% de los equipos de
televisin que la empresa lanz al mercado tuvieron xito y el 60% no fueron exitosos. Antes de lan-
zar al mercado el equipo de televisin, el departamento de investigacin de mercados realiza un exten-
so estudio y entrega un reporte, ya sea favorable o desfavorable. En el pasado, el 80% de los equipos
de televisin exitosos haban recibido un reporte de investigacin favorable y el 30% de los equi-
pos de televisin no exitosos haban recibido un reporte de investigacin favorable. Para los nuevos
modelos de televisin bajo consideracin, el departamento de investigacin de mercado ha entrega-
do un reporte favorable. Cul es la probabilidad de que el equipo de televisin tenga xito en el
mercado?
140 CAPTULO 4 Probabilidad bsica

El teorema de Bayes se desarrolla a partir de la definicin de la probabilidad condicional. Para


encontrar la probabilidad condicional de B dado A, considere la ecuacin (4.4b) [que se present en
la pgina 132 y que de nuevo se reproduce]:

P( A y B) P( A B) P( B)
P( B A)
P( A) P( A)

El teorema de Bayes se obtiene por sustitucin de la ecuacin (4.8) en la pgina 137 para P(A) en la
ecuacin de arriba.

TEOREMA DE BAYES

P ( A Bi ) P ( Bi )
P ( Bi A ) = (4.9)
P ( A B1 ) P ( B1 ) + P ( A B2 )P ( B2 ) + L + P ( A Bk )P ( Bk )

donde Bi es el i-simo evento de los k eventos mutuamente excluyentes y colectivamente exhaus-


tivos.

Para usar la ecuacin (4.9) para el ejemplo del televisor comercializado, sea

evento S = equipo de televisin exitoso evento F = reporte favorable


evento S = equipo de televisin no exitoso evento F = reporte desfavorable

P( S ) = 0.40 P( F S ) = 0.80
P( S ) = 0.60 P( F S ) = 0.30

Entonces, al utilizar la ecuacin (4.9),

P( F S ) P( S )
P(S F) =
P( F S ) P( S ) + P( F S ) P( S )
(0.80)(0.40)
=
(0.80)(0.40) + (0.30)(0.60)
0.32 0.32
= =
0.32 + 0.18 0.50
= 0.64

La probabilidad de un equipo de televisin exitoso, dado que se recibi un reporte favorable, es


de 0.64. As pues, la probabilidad de un equipo de televisin no exitoso, dado que se recibi un re-
porte favorable, es de 1 0.64 = 0.36. La tabla 4.4 resume el clculo de las probabilidades y la figu-
ra 4.5 presenta el rbol de decisin.

TABLA 4.4 Clculo del teorema de Bayes para el ejemplo de la comercializacin del televisor

Probabilidad Probabilidad Probabilidad Probabilidad


previa condicional conjunta revisada
Evento Si P(Si) P(F | Si) P(F | Si)P(Si) P(Si | F)
S = equipo de televisin exitoso 0.40 0.80 0.32 0.32/0.50 = 0.64 = P(S | F)
S = equipo de televisin no exitoso 0.60 0.30 0.18 0.18/0.50 = 0.36 = P(S | F)
0.50
4.3: Teorema de Bayes 141

FIGURA 4.5
rbol de decisin
para la comercializacin P(S y F ) = P(F|S ) P(S)
= (0.80) (0.40) = 0.32
del nuevo equipo de
televisin. P(S ) = 0.40

P(S y F ) = P(F|S) P(S)


= (0.20) (0.40) = 0.08

P(S y F ) = P(F|S) P(S)


= (0.30) (0.60) = 0.18

P(S) = 0.60

P(S y F ) = P(F|S) P(S)


= (0.70) (0.60) = 0.42

El ejemplo 4.10 aplica el teorema de Bayes a un problema de diagnstico mdico.

EJEMPLO 4.10 USO DEL TEOREMA DE BAYES EN UN PROBLEMA DE DIAGNSTICO MDICO


La probabilidad de que una persona tenga una determinada enfermedad es de 0.03. Existen pruebas
de diagnstico mdico disponibles para determinar si una persona tiene realmente la enfermedad. Si
la enfermedad realmente est presente, la probabilidad de que la prueba de diagnstico mdico d un
resultado positivo (indicando la presencia de la enfermedad) es de 0.90. Si la enfermedad no est
presente, la probabilidad de obtener un resultado positivo (indicando la presencia de la enfermedad)
es de 0.02. Suponga que la prueba de diagnstico mdico dio un resultado positivo (indicando la
presencia de la enfermedad). Cul es la probabilidad de que la enfermedad est realmente presen-
te? Cul es la probabilidad de un resultado positivo?
SOLUCIN
Sea evento D = tiene la enfermedad evento T = la prueba es positiva
evento D = no tiene la enfermedad evento T = la prueba es negativa
y

P(D) = 0.03 P(T | D) = 0.90


P(D) = 0.97 P(T | D) = 0.02

Al emplear la ecuacin (4.9) de la pgina 140,

P (T D )P ( D )
P( D T ) =
P (T D )P ( D ) + P (T D )P ( D )
( 0.90 )(0.03)
=
( 0.90 )(0.03) + ( 0.02 )(0.97 )
0.0270 0.0270
= =
0.0270 + 0.0194 0.0464
= 0.582

La probabilidad de que la enfermedad est realmente presente dado que un resultado positivo ha
ocurrido (indicando la presencia de la enfermedad) es de 0.582. La tabla 4.5 resume el clculo de las
probabilidades y la figura 4.6 presenta el rbol de decisin.
142 CAPTULO 4 Probabilidad bsica

TABLA 4.5 Clculos del teorema de Bayes para el problema de diagnstico mdico

Probabilidad Probabilidad Probabilidad Probabilidad


previa condicional conjunta revisada
Evento Di P(Di) P(T | Di) P(T | Di)P(Di) P(Di | T)
D = tiene la enfermedad 0.03 0.90 0.0270 0.0270/0.0464 = 0.582 = P(D | T)
D = no tiene la enfermedad 0.97 0.02 0.0194 0.0194/0.0464 = 0.418 = P(D | T)
0.0464

FIGURA 4.6
rbol de decisin para
el problema de P(D y T ) = P(T |D) P(D)
= (0.90) (0.03) = 0.0270
diagnstico mdico.
P(D) = 0.03

P(D y T ) = P(T |D) P(D)


(0.10) (0.03) = 0.0030

P(D y T ) = P(T |D) P(D)


(0.02) (0.97) = 0.0194
P(D) = 0.97

P(D y T ) = P(T |D) P(D)


(0.98) (0.97) = 0.9506

El denominador en el teorema de Bayes representa P(T), la probabilidad de un resultado positi-


vo en la prueba, el cual en este caso es de 0.0464 o un 4.64%.

PROBLEMAS PARA LA SECCIN 4.3


Aprendizaje bsico ASISTENCIA AUTO 4.33 Un directivo de publicidad estudia
4.30 Si P(B) = 0.05, P(A | B) = 0.80, P(B) = 0.95, de PH Grade Examen los hbitos de ver televisin de hombres y
ASISTENCIA
de PH Grade y P(A | B) = 0.40, encuentre P(B | A). mujeres casados durante las horas de ma-
yor audiencia. Con base en los registros anteriores, el directivo
ASISTENCIA 4.31 Si P(B) = 0.30, P(A | B) = 0.60, P(B) = 0.70, ha determinado que durante las horas de mayor audiencia los
de PH Grade y P(A | B) = 0.50, encuentre P(B | A). maridos ven televisin el 60% del tiempo. Cuando el marido ve
televisin, la esposa tambin lo hace el 40% del tiempo. Cuan-
Aplicacin de conceptos do el marido no ve televisin, la esposa ve televisin el 30% del
4.32 En el ejemplo 4.10 de la pgina 141, suponga que la pro- tiempo. Encuentre la probabilidad de que
babilidad de que la prueba de diagnstico mdico d un resultado a. si la esposa ve televisin, el esposo tambin lo haga.
positivo si la enfermedad no est presente se reduce de 0.02 a b. la esposa vea televisin durante las horas de mayor au-
0.01. A partir de esta informacin, diencia.
a. Si la prueba de diagnstico mdico ha resultada positiva (in- ASISTENCIA 4.34 La empresa Olive Construction est determi-
dicando la presencia de la enfermedad), cul es la probabi- de PH Gradenando si debera presentar una oferta para un nuevo
lidad de que la enfermedad est realmente presente? centro comercial. En el pasado, el principal competi-
b. Si la prueba de diagnstico mdico ha dado un resultado ne- dor de Olive, la empresa Base Construction, ha propuesto ofer-
gativo (indicando que la enfermedad no est presente), cul tas el 70% del tiempo. Si Base Construction no presenta ofertas
es la probabilidad de que la enfermedad no est presente? para un trabajo, la probabilidad de que Olive Construction ob-
4.4: Reglas de conteo 143

tenga el trabajo es de 0.50. Si Base Construction propone una tadstica en los negocios. Informacin sobre los libros de texto
oferta para el trabajo, la probabilidad de que Olive Construc- previamente publicados indica que el 10% tiene un enorme xi-
tion obtenga el trabajo es de 0.25. to, el 20% tiene un xito moderado, el 40% ni gana ni pierde y
a. Si la empresa Olive Construction obtiene el trabajo, cul es el 30% fracasa. Sin embargo, antes de tomar la decisin de pu-
la probabilidad de que la empresa Base Construction no ha- blicar, el libro se revisa. En el pasado, el 99% de los libros exi-
ya propuesto una oferta? tosos recibieron revisiones favorables, el 70% de los de xito
b. Cul es la probabilidad de que la empresa Olive Construc- moderado recibieron revisiones favorables, el 40% de los que
tion obtenga el trabajo? ni ganaron ni perdieron recibieron revisiones favorables, y el
20% de los que fracasaron recibieron revisiones favorables.
4.35 Los trabajadores despedidos que se volvieron empresa-
a. Si el texto propuesto recibi revisiones favorables, cmo
rios porque no encontraron empleo en otra empresa se conocen
debe revisar el editor las probabilidades de los diferentes re-
como empresarios por necesidad. El Wall Street Journal reporta
sultados para tomar en cuenta esta informacin?
que estos empresarios tienen menos posibilidad de crecimiento
b. Qu proporcin de libros de texto reciben revisiones favo-
en los grandes negocios que los empresarios por eleccin (Jeff
rables?
Bailey, DesireMore Than NeedBuilds a Business, The
Wall Street Journal, 21 de mayo, 2001, B4). Este artculo esta-
4.37 Un servicio municipal de ttulos tiene tres categoras de
blece que el 89% de los empresarios en Estados Unidos lo son
clasificacin (A, B y C ). Suponga que el ao pasado, de los ttu-
por eleccin y que el 11% son empresarios por necesidad. Slo
los municipales distribuidos a lo largo de Estados Unidos, el
el 2% de los empresarios por necesidad esperan que su nuevo
70% entr en la categora A, el 20% entr en la categora B, y
negocio d empleo a 20 o ms personas dentro de los siguientes
el 10% se consider como C. De los ttulos municipales clasifi-
cinco aos, mientras que el 14% de los empresarios por elec-
cados en A, el 50% se distribuy en ciudades, el 40% en subur-
cin esperan emplear por lo menos a 20 personas dentro de los
bios y el 10% en reas rurales. De los ttulos municipales clasi-
siguientes cinco aos.
ficados como B, el 60% se distribuy en ciudades, el 20% en
a. Si se selecciona al azar a un empresario y ste espera que su
suburbios y el 20% en reas rurales. De los ttulos municipales
nuevo negocio emplee a 20 o ms personas dentro de los si-
clasificados como C, el 90% se distribuy en ciudades, el 5%
guientes cinco aos, cul es la probabilidad de que este in-
en suburbios y el 5% en reas rurales.
dividuo sea un empresario por eleccin?
a. Si un nuevo ttulo municipal va a distribuirse en una ciudad,
b. Discuta las posibles razones por las que los empresarios por
cul es la probabilidad de que reciba una clasificacin A?
eleccin tienen ms posibilidades de creer que sus negocios
b. Qu proporcin de ttulos municipales se distribuye en ciu-
crecern.
dades?
4.36 El editor de una empresa editorial de libros de texto est c. Qu proporcin de ttulos municipales se distribuye en su-
tratando de decidir si publicar un libro de texto propuesto de es- burbios?

4.4 REGLAS DE CONTEO


En la ecuacin (4.1) de la pgina 123, la probabilidad de ocurrencia de un resultado se defini como
el nmero de formas en las que el resultado ocurre, dividido por el nmero total de resultados posi-
bles. En muchos casos, hay un gran nmero de posibles resultados y es difcil determinar el nmero
exacto. En estas circunstancias se han desarrollado las reglas para contar el nmero posible de resul-
tados. En este apartado se presentan cinco diferentes reglas de conteo.

REGLA DE CONTEO 1
Si cualquiera de los eventos k mutuamente excluyentes y colectivamente exhaustivos pueden
ocurrir en cada uno de los ensayos n, el nmero de posibles resultados es igual a

kn (4.10)

EJEMPLO 4.11 REGLA DE CONTEO 1


Suponga que se lanza una moneda al aire cinco veces. Cul es el nmero de diferentes resultados
posibles (la secuencia de caras y cruces)?
SOLUCIN Si se lanza al aire una moneda (que tiene dos lados) cinco veces, con la ecuacin
(4.10), el nmero de resultados es 25 = 2 2 2 2 2 = 32.
144 CAPTULO 4 Probabilidad bsica

EJEMPLO 4.12 LANZAR UN DADO DOS VECES


Suponga que se lanza un dado dos veces. Cuntos posibles resultados diferentes pueden ocurrir?
SOLUCIN Si un dado (con seis caras) se lanza dos veces, con la ecuacin (4.10), el nmero de
resultados diferentes es 62 = 36.

La segunda regla de conteo es una versin ms general que la primera y permite al nmero po-
sible de eventos de diferir de ensayo a ensayo.

REGLA DE CONTEO 2
Si hay k1 eventos en el primer ensayo, k2 eventos en el segundo ensayo, . . . y kn eventos en el
n-simo ensayo, entonces el nmero posible de resultados es

(k1)(k2) . . . (kn) (4.11)

EJEMPLO 4.13 REGLA DE CONTEO 2


Un departamento estatal de vehculos automotores desea saber cuntos nmeros para las placas es-
tn disponibles si las placas incluyen tres letras seguidas por tres nmeros.
SOLUCIN Mediante la ecuacin (4.11), se sabe que si una placa incluye tres letras seguidas por
tres nmeros (0 hasta 9), el nmero total de resultados posibles es (26)(26)(26)(10)(10)(10) =
17,576,000.

EJEMPLO 4.14 DETERMINAR EL NMERO DE DIFERENTES CENAS


El men de un restaurante tiene un precio fijo para las cenas completas que consisten en un aperiti-
vo, un platillo principal, una bebida y un postre. Se tiene la posibilidad de elegir entre cinco ape-
ritivos, 10 platillos, tres bebidas y seis postres. Determine el nmero total de cenas posibles.
SOLUCIN Mediante la ecuacin (4.11), se sabe que el nmero total de cenas posibles es
(5)(10)(3)(6) = 900.

La tercera regla de conteo est relacionada con el clculo del nmero de maneras en las que un
conjunto de cosas puede arreglarse en orden.

REGLA DE CONTEO 3
El nmero de maneras en el que las n cosas pueden arreglarse en orden es

n! = (n)(n 1) . . . (1) (4.12)

donde n! se llama el factorial de n y 0! se define como 1.

EJEMPLO 4.15 REGLA DE CONTEO 3


Si un conjunto de seis libros de texto se colocan en una repisa, de cuntas formas es posible orde-
nar estos seis libros de texto?
SOLUCIN Para empezar, hay que precisar que cualquiera de los seis libros podra ocupar la pri-
mera posicin en la repisa. Una vez que se llene la primera posicin, hay cinco libros a elegir para
4.4: Reglas de conteo 145

llenar la segunda. Se contina con este procedimiento de asignacin hasta que todas las posiciones
estn ocupadas. El nmero de formas en las que es posible acomodar los seis libros es

n! = 6! = (6)(5)(4)(3)(2)(1) = 720

En muchos casos se necesita saber el nmero de formas en las que un subconjunto de un grupo com-
pleto de cosas puede arreglarse en orden. Cada posible arreglo es llamado permutacin.

REGLA DE CONTEO 4
Permutaciones: El nmero de maneras para arreglar X objetos seleccionados de n objetos en or-
den es

n!
n PX = (4.13)
( n X )!

EJEMPLO 4.16 REGLA DE CONTEO 4


Si se modifica el ejemplo 4.15, y entonces tenemos seis libros de texto pero slo hay espacio para
cuatro libros en la repisa, de cuntas maneras es posible acomodar estos libros en la repisa?
SOLUCIN Con la ecuacin (4.13), se sabe que el nmero de arreglos ordenados de cuatro libros
seleccionados de seis libros es igual a

n! 6! (6 )(5)( 4 )(3)(2 )(1)


n PX = = = = 360
(n X )! (6 4)! ( 2 )(1)

En muchas situaciones no interesa el orden de los resultados, sino slo el nmero de maneras en
las que X objetos pueden seleccionarse a partir de n cosas, sin consideracin de orden. Esta regla se
llama la regla de las combinaciones.

REGLA DE CONTEO 5
Combinaciones: El nmero de maneras de seleccionar X objetos a partir de n objetos, sin consi-
derar el orden, es igual a

n!
nC X = (4.14)
X !(n X )!

Al comparar esta regla con la anterior, se observa que difiere slo en la inclusin del trmino X!
en el denominador. Cuando se usan las permutaciones, todos los arreglos de los X objetos son distin-
guibles. Con las combinaciones, los X! posibles arreglos de objetos son irrelevantes.

EJEMPLO 4.17 REGLA DE CONTEO 5


Se modifican el ejemplo 4.16, de manera que el orden de los libros en la repisa sea irrelevante, de
cuntas maneras es posible arreglar estos libros en la repisa?
SOLUCIN Al utilizar la ecuacin (4.14), se sabe que el nmero de combinaciones de cuatro li-
bros seleccionados de seis libros es igual a

n! 6! (6)(5)( 4 )(3)(2)(1)
nC X = = = = 15
X !(n X )! 4!(6 4)! ( 4 )(3)(2 )(1)(2 )(1)
146 CAPTULO 4 Probabilidad bsica

PROBLEMAS PARA LA SECCIN 4.4


Aplicacin de conceptos 4.44 En la Liga Mayor de Bisbol hay cinco equipos en la
Divisin Occidental de la Liga Nacional: Arizona, Los nge-
AUTO 4.38 Si hay 10 preguntas de opcin mltiple en un les, San Francisco, San Diego y Colorado. Cuntos diferentes
Examen examen, cada una con tres posibles respuestas, rdenes de terminar hay para estos cinco equipos? Piensa que
cuntas diferentes secuencias de respuestas hay? todos estos rdenes son igualmente posibles? Discuta su res-
4.39 La cerradura de la bveda de un banco consta de tres dis- puesta.
cos, cada uno con 30 posiciones. Para que la bveda abra, cada 4.45 En relacin con el problema 4.44, cuntos diferentes
uno de los tres discos debe de estar en la posicin correcta. rdenes de terminar son posibles para las primeras cuatro posi-
a. Cuntas posibles combinaciones de disco diferentes hay ciones?
para esta cerradura?
b. Cul es la probabilidad de que, si se selecciona al azar la 4.46 Un jardinero tiene seis filas disponibles en su jardn para
posicin de cada disco, se abra la bveda del banco? colocar tomates, berenjena, pimientos, pepinos, frijoles y le-
c. Explique por qu las combinaciones de disco no son com- chuga. A cada vegetal le asignar una y slo una fila. Cuntas
binaciones matemticas que se expresen con la ecuacin formas hay de ordenar los vegetales en este jardn?
(4.14).
AUTO 4.47 El gran premio Big Triple, en la pista de ca-
4.40 a. Si se lanza al aire una moneda siete veces, cuntos Examen rreras local, consiste en elegir el orden correcto de
resultados diferentes son posibles? llegada para los tres primeros caballos de la novena
b. Si se lanza un dado siete veces, cuntos resultados diferen- carrera. Si hay 12 caballos inscritos en la novena carrera de hoy,
tes son posibles? cuntos resultados Big Triple habr?
c. Discuta las diferencias en sus respuestas a los incisos a)
y b). 4.48 La Quiniela, en la pista local de carreras, consiste en ele-
gir los caballos que llegarn en primero y segundo lugares en
AUTO 4.41 Una marca de jeans para dama est disponible una carrera sin consideracin del orden. Si ocho caballos estn
Examen en siete tallas, tres diferentes colores y tres diferen- inscritos en la carrera, cuntas combinaciones de quiniela
tes estilos. Cuntos diferentes pares de jeans debe habr?
ordenar el administrador para tener un par de cada tipo?
AUTO 4.49 Un estudiante tiene siete libros que quisiera
4.42 A usted le gustara hacer una ensalada que contenga le- Examen colocar en un estuche. Sin embargo, en l slo caben
chuga, jitomate, pepino y germinados. Se dirige hacia el su- cuatro libros. Sin importar el orden, cuntas formas
permercado con el fin de comprar un tipo de cada uno de estos hay de colocar los cuatro libros en el estuche?
ingredientes. Ah descubre que existen ocho tipos de lechuga,
cuatro tipos de jitomates, tres tipos de pepinos y tres tipos de 4.50 En una lotera diaria los dos nmeros ganadores se selec-
germinados en venta. Cuntos tipos diferentes de ensaladas cionan de entre 100 nmeros. Cuntas posibles combinaciones
tiene para elegir? de nmeros ganadores son posibles?

AUTO 4.43 Si cada letra se utiliza una vez, cuntas pa- 4.51 Una lista de lecturas para un curso contiene 20 artculos.
Examen labras diferentes de cuatro letras es posible formar Cuntas formas diferentes hay para elegir tres artculos de esta
con las letras E, L, O y V? lista?

4.5 CONSIDERACIONES TICAS Y PROBABILIDAD


Los problemas ticos surgen cuando cualquier afirmacin acerca de la probabilidad se presenta ante
el pblico, particularmente cuando estas afirmaciones forman parte de una campaa de publicidad
para un producto o servicio. Por desgracia, mucha gente no se siente a gusto con los conceptos nu-
mricos (vea la referencia 3 al final del captulo) y tiende a malinterpretar el significado de la proba-
bilidad. En algunos casos, la mala interpretacin no es intencional, pero en otros, la publicidad trata
de engaar al cliente potencial, lo que constituye una falta de tica.
Un ejemplo de la aplicacin potencialmente no tica de la publicidad se relaciona con la publi-
cidad para las loteras estatales. Cuando una persona compra un billete de lotera, selecciona un con-
junto de nmeros (por ejemplo, 6) de una lista mayor de nmeros (como 54). Aunque virtualmente
todos los participantes saben que tienen muy pocas posibilidades de ganar la lotera, tambin tienen
muy poca idea de qu tan improbable es que ellos seleccionen los 6 nmeros ganadores de la lista de
54 nmeros. Tienen una idea an mucho menor de la probabilidad de ganar un premio de consola-
cin si aciertan a 4 o 5 de los nmeros ganadores.
Frmulas importantes 147

Con estos antecedentes, podra detenerse a considerar como engaoso y posiblemente no tico
el reciente comercial de una lotera estatal que afirmaba: No pararemos hasta que hagamos de cada
uno un millonario. Como la lotera aporta millones de dlares a la tesorera estatal, el Estado nun-
ca dejar de permitirla, aunque en la vida nadie podr estar seguro de volverse millonario al ganar la
lotera.
Otro ejemplo de una aplicacin potencialmente no tica de la publicidad se relaciona con una
carta de inversin que promete un 90% de probabilidad de obtener una ganancia del 20% anual
sobre la inversin. Para que el reclamo de la carta fuera tico, el servicio de inversin necesita a) ex-
plicar la base de esta estimacin de probabilidad, b) hacer la afirmacin de probabilidad en otro
formato, tal como 9 oportunidades en 10, y c) explicar qu sucede a la inversin en el 10% de los ca-
sos en los que no se logra una ganancia del 20% (por ejemplo, se pierde la inversin?).

PROBLEMAS PARA LA SECCIN 4.5

Aplicacin de conceptos 4.53 Escriba un mensaje publicitario para la carta de inver-


4.52 Escriba un mensaje publicitario para la lotera estatal que sin, que afirme ticamente la probabilidad de obtener una ga-
describa de forma tica la probabilidad de ganar. nancia del 20%.

RESUMEN
En este captulo se desarrollaron conceptos concernientes a la rrollarn importantes distribuciones de probabilidad discreta,
probabilidad bsica, la probabilidad condicional, el teorema de como la distribucin binomial y la distribucin de Poisson.
Bayes y las reglas de conteo. En el siguiente captulo se desa-

F R M U L A S I M P O R TA N T E S
Probabilidad de ocurrencia Probabilidad marginal usando la regla general de la multi-
X plicacin
Probabilidad de ocurrencia = (4.1)
T P(A) = P(A | B1)P(B1) + P(A | B2)P(B2)
(4.8)
Probabilidad marginal + + P(A | Bk)P(Bk)
P(A) = P(A y B1) + P(A y B2) + + P(A y Bk) (4.2) Teorema de Bayes
P( Bi A) =
Regla general de la adicin
P( A Bi ) P( Bi )
P(A o B) = P(A) + P(B) P(A y B) (4.3) (4.9)
P( A B1) P( B1) + P( A B2 ) P( B2 ) + L + P( A Bk ) P( Bk )
Probabilidad condicional
P( A y B ) Regla de conteo 1
P( A B) = (4.4a)
P( B) kn (4.10)
P ( A y B ) (4.4b)
P( B A) = Regla de conteo 2
P( A)
(k1)(k2) . . . (kn) (4.11)
Independencia estadstica
P(A | B) = P(A) (4.5) Factoriales
n! = (n)(n 1) (1) (4.12)
Regla general de la multiplicacin
Permutaciones
P(A y B) = P(A | B)P(B) (4.6)
n!
n PX = (4.13)
Regla de la multiplicacin para eventos independientes (n X )!
P(A y B) = P(A)P(B) (4.7) Combinaciones
n!
nC X = (4.14)
X !(n X )!
148 CAPTULO 4 Probabilidad bsica

C O N C E P T O S C L AV E
rbol de decisin 133 Independencia estadstica 135 Probabilidad subjetiva 123
Colectivamente exhaustivo 128 Interseccin 125 Regla de multiplicacin para eventos
Combinaciones 149 Mutuamente excluyentes 128 independientes 136
Complemento 124 Permutacin 145 Regla general de la adicin 128
Diagrama de Venn 125 Probabilidad 122 Regla general de la multiplicacin 136
Espacio muestral 124 Probabilidad clsica a priori 123 Tabla de clasificaciones cruzadas 125
Evento 124 Probabilidad clsica emprica 123 Tabla de contingencia 125
Evento conjunto 124 Probabilidad condicional 131 Teorema de Bayes 139
Evento imposible 123 Probabilidad conjunta 127 Unin 125
Evento seguro 123 Probabilidad marginal 126
Evento simple 124 Probabilidad simple 126

P R O B L E M A S D E R E PA S O
Revisin de su comprensin c. haya sido llenada en la mquina I o sea una botella acep-
table?
4.54 Cules son las diferencias entre la probabilidad clsica d. Suponga que sabe que la botella fue llenada en la mquina I.
a priori, la probabilidad clsica emprica y la probabilidad sub- Cul es la probabilidad de que sea no aceptable?
jetiva? e. Suponga que sabe que la botella es no aceptable.Cul es la
4.55 Cul es la diferencia entre un evento simple y un evento probabilidad de que haya sido llenada en la mquina I?
conjunto? f. Explique la diferencia en las respuestas de los incisos d)
y e).
4.56 Cmo se utiliza la regla de la adicin para encontrar la (Sugerencia: Realice una tabla de contingencia 2 2 o un dia-
probabilidad de ocurrencia de un evento A o B? grama de Venn para evaluar las probabilidades.)
4.57 Cul es la diferencia entre los eventos mutuamente ex- 4.63 Una encuesta pregunt a trabajadores qu aspectos de su
cluyentes y los eventos colectivamente exhaustivos? actividad laboral eran extremadamente importantes. Los resul-
4.58 Cmo es que se relaciona la probabilidad condicional tados en porcentajes son los siguientes:
con el concepto de independencia estadstica?
Es el aspecto excesivamente importante?
4.59 Cmo difiere la regla de la multiplicacin para eventos
que son independientes y para aquellos que no lo son? Aspecto del trabajo Hombres Mujeres

4.60 Cmo se utiliza el teorema de Bayes para revisar las Buena relacin con el jefe 63% 77%
probabilidades a la luz de una nueva informacin? Equipo actualizado 59 69
Recursos para hacer el trabajo 55 74
4.61 Cul es la diferencia entre una permutacin y una com- Facilidad para llegar 48 60
binacin? Horario flexible 40 53
Posibilidad de trabajar en casa 21 34
Aplicacin de conceptos
Fuente: Snapshot, USA Today, l5 de mayo, 2000.
4.62 Una compaa embotelladora de bebidas refrescantes
mantiene registros concernientes al nmero de botellas inacep- Suponga que la encuesta se basa en las respuestas de 500
tables de las mquinas de llenado y sellado. Con base en datos hombres y 500 mujeres. Elabore una tabla de contingencia para
anteriores, la probabilidad de que una botella provenga de la las diferentes respuestas concernientes a cada aspecto del traba-
mquina I y sea no aceptable es de 0.01, y la probabilidad de jo. Si quien responde es elegido al azar, cul es la probabilidad
que una botella provenga de la mquina II y sea no aceptable es de que
de 0.025. La mitad de las botellas se llenan en la mquina I y la a. l o ella sientan que tener una buena relacin con el jefe es
otra mitad se llena en la mquina II. Si se selecciona al azar una un aspecto importante del trabajo?
botella, cul es la probabilidad de que b. l o ella sientan que llegar fcilmente es un aspecto impor-
a. sea una botella no aceptable? tante del trabajo?
b. haya sido llenada en la mquina I y sea una botella acep- c. la persona sea hombre y sienta que una buena relacin con el
table? jefe es un aspecto importante del trabajo?
Problemas de repaso 149

d. la persona sea mujer y sienta que tener flexibilidad en las Un mesero se aproxima a una mesa para tomar la orden. Cul
horas es un aspecto importante del trabajo? es la probabilidad de que el primer cliente que ordene en la
e. Dado que la persona siente que tener una buena relacin con mesa
el jefe es un aspecto importante del trabajo, cul es la pro- a. ordene un postre?
babilidad de que la persona sea hombre? b. ordene un postre o una entrada de res?
f. Las cosas que los trabajadores dicen que son extremada- c. sea mujer y no ordene postre?
mente importantes del trabajo son estadsticamente indepen- d. sea mujer o no ordene postre?
dientes del gnero de quien responde? Explique por qu. e. Suponga que la primera persona a la que el mesero toma la
orden de postre es mujer. Cul es la probabilidad de que
4.64 Muchas empresas usan sitios Web para llevar a cabo
ella no ordene postre?
transacciones de negocios, tales como tomar rdenes o realizar
f. El gnero y ordenar postre son eventos estadsticamente in-
intercambios financieros. Estos sitios se llaman sitios Web de
dependientes?
transacciones pblicas. Un anlisis de 490 firmas listadas en el
g. Ordenar un platillo de res es un evento estadsticamente in-
Fortune 500 identifica a las firmas con base en su nivel de ventas
dependiente de si la persona ordena o no postre?
y en funcin de si la firma tiene o no un sitio Web de transaccio-
nes pblicas (D. Young, y J. Benamati, A Cross-Industry
4.66 Correos electrnicos que contienen publicidad comercial
Analysis of Large Firm Transactional Public Web Sites, Mid
no solicitada, llamados spam, son borrados de forma rutinaria
American Journal of Business, 19(2994), 37-46). Los resulta-
por el 80% de los usuarios antes de leerlos. Adems, un peque-
dos de este anlisis se muestran en la siguiente tabla.
o porcentaje de quienes leen los spam continan con el proce-
SITIO WEB DE so y compran artculos. Sin embargo, muchas empresas usan
TRANSACCIONES PBLICAS esta publicidad no solicitada porque el costo es extremadamen-
te bajo. Movies Unlimited es una empresa de Filadelfia que tra-
VENTAS (EN MILLONES DE DLARES) S No baja en la venta de videos y DVD va correo electrnico, y es
Mayores a $10 mil millones 71 88 una de las que tienen ms xito generando ventas a travs de es-
Hasta $10 mil millones 99 232 ta forma de mercadeo. Ed Weiss, gerente general de Movies
Unlimited, estima que entre el 15 y 20% de sus receptores de
a. D un ejemplo de un evento simple y de un evento conjunto. correos electrnicos leen la publicidad. Ms an, aproximada-
b. Cul es la probabilidad de que una firma en el Fortune 500 mente el 15% de quienes leen la publicidad hacen un pedido
tenga un sitio Web de transacciones pblicas? (Stacy Forster, E-Marketers Look to Polish Spams Rusty
c. Cul es la probabilidad de que una firma en el Fortune 500 Image, The Wall Street Journal, 22 de mayo, 2002, D2).
tenga ventas que superen los 10,000 millones de dlares y a. De acuerdo con la estimacin ms baja de Weiss referente a
un sitio Web de transacciones pblicas? que la probabilidad de que un receptor lea la publicidad es
d. Los eventos ventas que superan los 10,000 millones de d- de 0.15, cul es la probabilidad de que el receptor lea la pu-
lares y tiene un sitio Web de transacciones pblicas son in- blicidad y haga un pedido?
dependientes? Explique por qu. b. La empresa Movies Unlimited usa una base de datos de
175,000 clientes para enviar publicidad por correo electrni-
4.65 El dueo de un restaurante que sirve platillos estilo Con- co. Si se enva publicidad por esta va a cada cliente de la
tinental, est interesado en estudiar los patrones de rdenes de base de datos, cuntos clientes se espera que lean la publi-
los clientes para el periodo de fin de semana que va de viernes cidad y hagan un pedido?
a domingo. Se llevaron registros que indican la demanda de c. Si la probabilidad de que un receptor lea la publicidad es de
postre durante el mismo periodo de tiempo. El dueo decidi 0.20, cul es la probabilidad de que el receptor lea la publi-
estudiar otras dos variables junto con si ordenan o no un postre: cidad y haga un pedido?
el gnero del individuo y si orden o no el platillo de res. Los d. Cul sera su respuesta al inciso b) si se supone que la pro-
resultados son los siguientes: babilidad de que un receptor lea la publicidad es de 0.20?

GNERO ASISTENCIA 4.67 En febrero de 2002, el peso argentino perdi


ORDEN POSTRE Masculino Femenino Total de PH Gradeel 70% de su valor en relacin con el dlar de Esta-
dos Unidos. Esta devaluacin increment drstica-
S 96 40 136 mente el precio de los productos de importacin. De acuerdo
No 224 240 464 con una encuesta conducida por AC Nielsen en abril de 2002, el
Total 320 280 600 68% de los clientes en Argentina compraban menos productos
que antes de la devaluacin, el 24% compraba el mismo nme-
PLATILLO DE RES ro de productos y el 8% compraba ms productos. Adems, en
ORDEN POSTRE S No Total una tendencia hacia la compra de marcas menos caras, el 88%
indic que haban cambiado las marcas que compraban. (Mi-
S 71 65 136 chelle Wallin, Argentines Hone Art of Shopping in a Crisis,
No 116 348 464 The Wall Street Journal, 28 de mayo, 2002, A15.) Suponga que
Total 187 413 600 se report el siguiente conjunto de resultados.
150 CAPTULO 4 Probabilidad bsica

A = Una SUV, camioneta o pick-up que participan en accidentes.


NMERO DE PRODUCTOS COMPRADOS
B = Un accidente que implic una volcadura.
MARCAS COMPRADAS Menos Igual Ms Total
a. Utilice el teorema de Bayes para encontrar la probabilidad
La misma 10 14 24 48 de que el accidente haya implicado una volcadura, dado que
Cambi 262 82 8 352 particip una SUV, camioneta o pick-up.
Total 272 96 32 400 b. Compare los resultados del inciso a) con la probabilidad de
que el accidente haya implicado una volcadura, y comente si
Cul es la probabilidad de que un cliente seleccionado al azar: las SUV, camionetas y pick-ups son ms propensas a sufrir
a. compre menos productos que antes? accidentes por volcadura.
b. compre el mismo nmero o ms productos que antes?
ASISTENCIA 4.69 La prueba de ELISA (prueba de enzimas liga-
c. compre menos productos y cambie de marca? de PH Grade das al inmunosorbente es el tipo ms comn de prue-
d. Si el cliente cambi las marcas que compraba, cul es la
ba de monitoreo para detectar el VIH. Un resultado
probabilidad de que compre menos productos que antes?
positivo de una prueba ELISA indica la presencia del VIH. La
e. Compare los resultados del inciso a) con los del d).
prueba de ELISA tiene un alto grado de sensibilidad (para de-
ASISTENCIA 4.68 Los vehculos utilitarios deportivos (SUV), tectar la infeccin) y de especificidad (para detectar la no in-
de PH Gradecamionetas y pick-ups son generalmente ms pro- feccin). (Visite el sitio HIVInsite, en HIVInsite.ucsf.edu/.) Su-
pensos a volcarse que otros autos. En 1997, el 24.0% ponga que la probabilidad de que una persona est infectada
de los accidentes en carretera implicaron una volcadura; en el con el VIH para una determinada poblacin es de 0.015. Si el
15.8% de todos los accidentes en ese ao estuvieron implica- VIH est realmente presente, la probabilidad de que la prueba de
das SUV, camionetas y pick-ups. Cuando los accidentes no im- ELISA d un resultado positivo es de 0.995. Si el VIH no est
plicaban volcaduras, en el 5.6% de todos ellos participaron realmente presente, la probabilidad de un resultado positivo en
SUV, camionetas y pick-ups (Anna Wilde Mathews, Ford Ran- la prueba de ELISA es de 0.01. Use el teorema de Bayes para en-
ger, Chevy Tracker Tilt in Test, The Wall Street Journal, l4 de contrar la probabilidad de que el VIH est realmente presente si
julio, 1999, A2). Considere las siguientes definiciones: la prueba de ELISA da un resultado positivo.

CASO WEB
Aplique sus conocimientos acerca de las tablas de contin- ge? De qu formas es engaosa esta afirmacin? Cmo
gencia y de la aplicacin apropiada de las probabilidades podra calcular y establecer la probabilidad de tener una
simple y conjunta en la continuacin del Caso Web del cap- ganancia anual no menor al 15%?
tulo 3. 2. Qu error se cometi al reportar la afirmacin del 7% de
probabilidad? Usando la tabla que se encuentra en la pgi-
Visite la pgina Web StockTout Guaranteed Investment
na Web Winning Probabilities ST_Guaranteed3.htm,
Package en www.prenhall.com/Springville/ST_Guaran-
calcule la probabilidad adecuada para el grupo de inver-
teed.htm. Lea las quejas y examine los datos que las apoyan.
sionistas.
Despus responda a las siguientes preguntas:
3. Existe algn tipo de clculo de probabilidades que sea
1. Qu tan precisa es la afirmacin de la probabilidad de apropiado para el nivel en el servicio de inversin? Por
xito para el SockTouts Guaranteed Investment Packa- qu?

REFERENCIAS
1. Kirk, R. L. (ed.), Statistical Issues: A Reader for the Beha- 3. Paulos, J. A., Innumeracry (Nueva York: Hill and Wang,
vioral Sciences (Belmont, CA: Wadsworth, 1972). 1988).
2. Microsoft Excel 2003 (Redmond, WA: Microsoft Corp.,
2002).
Apndice 151

Apndice 4 Uso del software


para la probabilidad bsica
A4.1 EXCEL Para el teorema de Bayes
Para probabilidades bsicas Abra el archivo Bayes.xls. Esta hoja de trabajo ya contiene las
entradas para la tabla 4.4 de la pgina 140. Para adaptar esta ho-
Abra el archivo Probabilidades.xls. Esta hoja de trabajo ya
ja de trabajo a otros problemas, cambie las entradas para las
contiene las entradas para la tabla 4.2 de la pgina 126. Para
probabilidades previa y condicional en la celda sombreada cla-
adaptar esta hoja de trabajo a otros problemas, cambie las entra-
sificada B5:C6.
das en las celdas sombreadas de las filas 3 hasta la 6.
O si est usando el PHStat2, seleccione PHStat Proba-
bilidad y Distribuciones de probabilidad Probabilidades
simple y conjunta para generar una hoja de trabajo en la que
pueda ingresar sus datos de probabilidad en las celdas vacas y
sombreadas de las filas 3 hasta la 6.
CAPTULO 5
Algunas importantes distribuciones
de probabilidad discreta
USO DE LA ESTADSTICA: El sistema de informacin contable de la empresa de remodelaciones Saxon

5.1 DISTRIBUCIN DE PROBABILIDAD DE 5.3 DISTRIBUCIN DE POISSON


UNA VARIABLE ALEATORIA DISCRETA
A.5 USO DE SOFTWARE PARA
Valor esperado de una variable aleatoria discreta
DISTRIBUCIONES DE PROBABILIDAD
Varianza y desviacin estndar de una variable
DISCRETAS
aleatoria discreta
A5.1 Excel
5.2 DISTRIBUCIN BINOMIAL A5.2 Minitab

OBJETIVOS DE APRENDIZAJE
En este captulo, aprender:
Las propiedades de una distribucin de probabilidad
A calcular el valor esperado, la varianza y la desviacin
estndar de una distribucin de probabilidad
A calcular las probabilidades de las distribuciones binomial y
de Poisson
Cmo utilizar las distribuciones binomial y de Poisson para
resolver problemas financieros
154 CAPTULO 5 Algunas importantes distribuciones de probabilidad discreta

U S O D E L A E S TA D S T I C A
El sistema de informacin contable de la
empresa de remodelaciones Saxon
Adems de recabar, procesar, almacenar y transformar la informacin finan-
ciera, los sistemas de informacin contable la distribuyen entre los responsa-
bles de tomar decisiones, tanto internos como externos, de una organizacin
de negocios (vea la referencia 5). Estos sistemas auditan continuamente la
informacin contable en busca de errores y de informacin incompleta o in-
verosmil. Por ejemplo, cuando los clientes de la empresa de remodelaciones
Saxon hacen un pedido en lnea, el sistema de informacin contable revisa
los formatos de pedido en busca de posibles errores. Se marcan todas las fac-
turas cuestionables y se les incluye en el reporte diario de excepciones. Los
datos recabados ltimamente por la empresa muestran que la posibilidad de
que un formato resulte marcado es de 0.10. En Saxon quieren determinar la
posibilidad de encontrar cierto nmero de formatos marcados en una muestra
de tamao especfico. Por ejemplo, en una muestra compuesta por cuatro for-
matos, cul sera la posibilidad de que ninguno de ellos resulte marcado? Y de que uno lo sea?

C mo puede la empresa de remodelaciones Saxon encontrar la solucin a este problema de


probabilidad? Una tctica consiste en emplear un modelo, o representacin a pequea esca-
la, que se aproxime al proceso. Mediante el uso de esa aproximacin, los directivos de Saxon podrn
obtener inferencias sobre el procesamiento real de los pedidos. A pesar de que para algunos analis-
tas la elaboracin de modelos es una tarea complicada, en este caso los directivos de Saxon tienen a
su disposicin las distribuciones de probabilidad, que son modelos matemticos apropiados para re-
solver el problema de probabilidad que enfrentan. La lectura de este captulo le ayudar a aprender
las caractersticas de una distribucin de probabilidad y cmo aplicar especficamente las distribu-
ciones binomial y de Poisson a los problemas financieros.

5.1 DISTRIBUCIN DE PROBABILIDAD DE UNA VARIABLE


ALEATORIA DISCRETA
En la seccin 1.5, variable numrica se defini como una variable que produce respuestas numri-
cas tales como la cantidad de revistas a las que se suscribe o su estatura en pulgadas. Las variables
numricas se clasifican en discretas y continuas. Las variables numricas continuas producen resul-
tados a partir de procesos de medicin; por ejemplo, su estatura. Las variables numricas discretas
producen resultados a partir de un proceso de conteo, como el nmero de revistas a las que se suscri-
be. Este captulo trata de las distribuciones de probabilidad que representan variables numricas dis-
cretas.

La distribucin de probabilidad para una variable aleatoria discreta es una lista mutuamen-
te excluyente de todos los posibles resultados numricos para una variable aleatoria tal que una
probabilidad de ocurrencia especfica se asocia con cada resultado.

Por ejemplo, la tabla 5.1 ofrece la distribucin de la cantidad de crditos aprobados por semana
en la oficina de una sucursal bancaria local. La lista de la tabla 5.1 es colectivamente exhaustiva por-
que se han incluido todos los posibles resultados. Entonces, las probabilidades deben sumar 1. En la
figura 5.1 aparece la representacin grfica de la tabla 5.1.
5.1: Distribucin de probabilidad de una variable aleatoria discreta 155

TABLA 5.1 Hipotecas aprobadas por semana Probabilidad


Distribucin de 0 0.10
probabilidad del 1 0.10
nmero de hipotecas 2 0.20
aprobadas por semana. 3 0.30
4 0.15
5 0.10
6 0.05

FIGURA 5.1
Distribucin de proba- P (X )
bilidad del nmero de
hipotecas aprobadas .3
por semana.
.2

.1

0 1 2 3 4 5 6 X
Hipotecas aprobadas por semana

Valor esperado de una variable aleatoria discreta


La media de una distribucin de probabilidad es el valor esperado de su variable aleatoria. Para
calcular el valor esperado, se multiplica cada resultado posible X por su probabilidad correspondien-
te P(X) y luego se suman estos productos.

VALOR ESPERADO DE UNA VARIABLE ALEATORIA DISCRETA

N
= E( X ) = X i P( X i ) (5.1)
i =1

donde Xi = i-simo resultado de la variable aleatoria discreta X


P(Xi ) = probabilidad de ocurrencia del i-simo resultado de X

En la tabla 5.2 se calcula el valor esperado de la distribucin de probabilidad del nmero de hipote-
cas aprobadas por semana (tabla 5.1), utilizando la ecuacin (5.1).

TABLA 5.2 Hipotecas aprobadas


Probabilidad
Clculo del valor por semana (Xi) P(Xi) XiP(Xi)
esperado para el
nmero de hipotecas 0 0.10 (0)(0.10) = 0.0
aprobadas por semana. 1 0.10 (1)(0.10) = 0.1
2 0.20 (2)(0.20) = 0.4
3 0.30 (3)(0.30) = 0.9
4 0.15 (4)(0.15) = 0.6
5 0.10 (5)(0.10) = 0.5
6 0.05 (6)(0.05) = 0.3
1.00 = E(X) = 2.8
156 CAPTULO 5 Algunas importantes distribuciones de probabilidad discreta

N
= E( X ) = X i P( X i )
i =1
= ( 0 )(0.1) + (1)(0.1) + ( 2 )(0.2 ) + (3)(0.3) + ( 4 )(0.15) + (5)(0.1) + ( 6 )(0.05)
= 0 + 0.1 + 0.4 + 0.9 + 0.6 + 0.5 + 0.3
= 2.8

La cifra de 2.8 obtenida para el valor esperado del nmero de hipotecas aprobadas no es sig-
nificativa literalmente, porque el nmero real de hipotecas aprobadas durante una semana deter-
minada debe ser un valor entero. El valor esperado representa la media de hipotecas aprobadas por
semana.

Varianza y desviacin estndar de una variable aleatoria discreta


La varianza de una distribucin de probabilidad se calcula multiplicando cada posible diferencia
cuadrada [Xi E(X )]2 por su probabilidad correspondiente P(Xi ) y sumando luego los productos re-
sultantes. La ecuacin (5.2) define la varianza de una variable aleatoria discreta.

VARIANZA DE UNA VARIABLE ALEATORIA DISCRETA

N
2 = [ X i E ( X )] 2P( X i ) (5.2)
i =1

donde Xi = i-simo resultado de la variable aleatoria discreta X


P(Xi ) = probabilidad de ocurrencia del i-simo resultado de X

La ecuacin (5.3) define la desviacin estndar de una variable aleatoria discreta.

DESVIACIN ESTNDAR DE UNA VARIABLE ALEATORIA DISCRETA

N
= 2 = [ X i E ( X )] 2 P( X i ) (5.3)
i =1

En la tabla 5.3 se calculan la varianza y la desviacin estndar del nmero de hipotecas aproba-
das por semana, mediante las ecuaciones (5.2) y (5.3).

N
2 = [ X i E ( X )] 2 P( X i )
i =1

= (0 2.8 ) 2 (0.10 ) + (1 2.8 ) 2 ( 0.10 ) + ( 2 2.8 ) 2 ( 0.20 ) + ( 3 2.8 ) 2 ( 0.30 )


+ ( 4 2.8 ) 2 ( 0.15) + (5 2.8 ) 2 ( 0.10 ) + ( 6 2.8 ) 2 ( 0.05)
= 0.784 + 0.324 + 0.128 + 0.012 + 0.216 + 0.484 + 0.512
= 2.46

= 2 = 2.46 = 1.57

As, la media de hipotecas aprobadas por semana es 2.8, la varianza es 2.46 y la desviacin es-
tndar es 1.57.
5.1: Distribucin de probabilidad de una variable aleatoria discreta 157

TABLA 5.3 Hipotecas aprobadas


Probabilidad
Clculo de la varianza y por semana (Xi) P(Xi) XiP(Xi) [Xi E(X)]2P(Xi)
la desviacin estndar
del nmero de 0 0.10 (0)(0.10) = 0.0 (0 2.8)2(0.10) = 0.784
hipotecas aprobadas 1 0.10 (1)(0.10) = 0.1 (1 2.8)2(0.10) = 0.324
por semana. 2 0.20 (2)(0.20) = 0.4 (2 2.8)2(0.20) = 0.128
3 0.30 (3)(0.30) = 0.9 (3 2.8)2(0.30) = 0.012
4 0.15 (4)(0.15) = 0.6 (4 2.8)2(0.15) = 0.216
5 0.10 (5)(0.10) = 0.5 (5 2.8)2(0.10) = 0.484
6 0.05 (6)(0.05) = 0.3 (6 2.8)2(0.05) = 0.512
N
2 = [ X i E ( X )]2 P( X i ) = 2.46
i =1
= 1.57

PROBLEMAS PARA LA SECCIN 5.1

Aprendizaje bsico de Konig Motors, concesionario automotriz suburbano, sinte-


5.1 Dadas las siguientes distribuciones de probabi- tiz el nmero de automviles vendidos al da en la siguiente
ASISTENCIA
de PH Grade lidad: tabla:

Nmero de automviles Frecuencia


Distribucin A Distribucin B vendidos al da de ocurrencia
X P(X) X P(X) 0 40
0 0.50 0 0.05 1 100
1 0.20 1 0.10 2 142
2 0.15 2 0.15 3 66
3 0.10 3 0.20 4 36
4 0.05 4 0.50 5 30
6 26
a. Calcule el valor esperado de cada distribucin. 7 20
b. Calcule la desviacin estndar de cada distribucin. 8 16
c. Compare e identifique las diferencias entre los resultados de 9 14
las distribuciones A y B. 10 8
5.2 Dadas las siguientes distribuciones de probabi- 11 2
ASISTENCIA
de PH Grade lidad: Total 500

a. Construya la distribucin de probabilidad para el nmero de


Distribucin C Distribucin D automviles vendidos al da.
X P(X) X P(X) b. Calcule la media o el nmero esperado de automviles ven-
didos al da.
0 0.20 0 0.10 c. Calcule la desviacin estndar.
1 0.20 1 0.20 5.4 En la siguiente tabla se encuentra la distribucin de proba-
2 0.20 2 0.40 bilidad para el nmero diario de accidentes de trfico ocurridos
3 0.20 3 0.20 en una ciudad pequea.
4 0.20 4 0.10
Nmero diario
a. Calcule el valor esperado de cada distribucin.
de accidentes (X) P(X)
b. Calcule la desviacin estndar de cada distribucin.
c. Compare e identifique las diferencias entre los resultados de 0 0.10
las distribuciones C y D. 1 0.20
2 0.45
Aplicacin de conceptos 3 0.15
5.3 Utilizando los registros de la empresa corres- 4 0.05
ASISTENCIA
de PH Grade pondientes a los ltimos 500 das hbiles, el gerente 5 0.05
158 CAPTULO 5 Algunas importantes distribuciones de probabilidad discreta

a. Calcule la media o el nmero esperado de accidentes ocurri- gana o pierde su apuesta. Por ejemplo, el jugador puede apostar
dos al da. $1.00 a que la suma ser menor a 7, es decir, 2, 3, 4, 5 o 6. En
b. Calcule la desviacin estndar. este caso, el jugador perder $1.00 si el resultado es igual o ma-
yor que 7, o lo ganar si el resultado es menor que 7. Del mis-
AUTO 5.5 El gerente de un sistema de redes de computa-
mo modo, puede apostar $1.00 a que la suma ser mayor que 7,
Examen doras desarroll la siguiente distribucin de probabi-
es decir, 8, 9, 10, 11 o 12. Aqu, gana $1.00 si el resultado es
lidad para el nmero de interrupciones al da:
mayor que 7, pero lo pierde si el resultado es 7 o menos. Una
tercera opcin del juego consiste en apostar $1.00 a que el re-
Interrupciones (X) P(X) sultado es 7. En esta apuesta, el jugador ganar $4.00 si el
0 0.32 resultado del tiro es 7 y perder $1.00 si es cualquier otro.
1 0.35 a. Elabore la distribucin de probabilidad que representa los
2 0.18 distintos resultados posibles para una apuesta de $1.00 a que
3 0.08 el tiro ser menor que 7.
4 0.04 b. Elabore la distribucin de probabilidad que representa los
5 0.02 distintos resultados posibles para una apuesta de $1.00 a que
6 0.01 el tiro ser mayor que 7.
c. Elabore la distribucin de probabilidad que representa a los
a. Calcule la media o el nmero esperado de interrupciones por distintos resultados posibles para una apuesta de $1.00 a que
da. el tiro ser de 7.
b. Calcule la desviacin estndar.
d. Demuestre que las ganancias (o prdidas) a largo plazo es-
5.6 En el juego de feria Ms o menos de siete, se tira un par de peradas del jugador son iguales, independientemente del
dados sin cargar, y la suma resultante determina si el jugador mtodo de juego que utilice.

5.2 DISTRIBUCIN BINOMIAL


En los siguientes dos apartados se utilizan modelos matemticos para resolver problemas financieros.

Un modelo matemtico es una expresin matemtica que se utiliza para representar una variable
de inters.

Cuando se dispone de una expresin matemtica, es factible calcular la probabilidad de ocu-


rrencia exacta correspondiente a cualquier resultado especfico para la variable aleatoria.
La distribucin de probabilidad binomial es uno de los modelos matemticos ms tiles. La
distribucin binomial se utiliza cuando la variable aleatoria discreta de inters es el nmero de xi-
tos en una muestra compuesta por n observaciones. La distribucin binomial tiene cuatro propieda-
des fundamentales:

La muestra se compone de un nmero fijo de observaciones, n.


Cada observacin se clasifica en una de dos categoras mutuamente excluyentes y colectiva-
mente exhaustivas, normalmente denominadas xito y fracaso.
La probabilidad de que una observacin se clasifique como xito, p, es constante de una obser-
vacin a otra. De la misma forma, la probabilidad de que una observacin se clasifique como
fracaso, 1 p, es constante en todas las observaciones.
El resultado (es decir, el xito o el fracaso) de cualquier observacin es independiente del resul-
tado de cualquier otra observacin. Para garantizar la independencia, las observaciones se de-
ben seleccionar de manera aleatoria, ya sea de una poblacin infinita sin reemplazo o de una
poblacin finita con reemplazo.

Volviendo al escenario Uso de la estadstica expuesto en la pgina 154 referente al sistema de


informacin contable, supongamos que xito se define como un formato de pedido marcado y fraca-
so es cualquier otro resultado. Usted se interesa por el nmero de formatos marcados dentro de una
muestra de pedidos determinada.
Qu resultados se pueden presentar? Si la muestra se compone de cuatro pedidos, puede haber
ninguna, una, dos, tres o cuatro formatos marcados. La variable aleatoria binomial, que es el nme-
ro de formatos de pedido marcados, no puede asumir ningn otro valor porque el nmero de forma-
tos de pedido marcados no podr ser superior al tamao n de la muestra ni podr ser menor que ce-
ro. Por lo tanto, la variable aleatoria binomial tiene un rango de 0 a n.
5.2: Distribucin binomial 159

Suponga que en una muestra de cuatro pedidos, usted observa el siguiente resultado:

Primer pedido Segundo pedido Tercer pedido Cuarto pedido

Marcado Marcado Sin marcar Marcado


Cul es la probabilidad de tener tres xitos (formatos de pedido marcados) con esta secuencia en
particular, en una muestra compuesta por cuatro pedidos? Puesto que la probabilidad histrica de un
pedido marcado es de 0.10, la probabilidad de que cada pedido se presente con dicha secuencia es
Primer pedido Segundo pedido Tercer pedido Cuarto pedido

p = 0.10 p = 0.10 1 p = 0.90 p = 0.10


Cada uno de los resultados es independiente de los dems, ya que los formatos de pedido se se-
leccionaron de una poblacin extremadamente grande o prcticamente infinita y sin reemplazarlos.
Por tanto, la probabilidad de tener esta secuencia en particular es

pp(1 p) p = p 3 (1 p)1
= (0.10)(0.10)(0.10)(0.90)
= (0.10)3 (0.90)1
= 0.0009
Este resultado slo seala la probabilidad de que aparezcan tres formatos de pedido marcados
(xitos) extrados de una muestra de cuatro con una secuencia especfica. Para encontrar cuntas
maneras hay de seleccionar X objetos de entre n objetos, independientemente de la secuencia, se uti-
liza la regla de las combinaciones dada en la ecuacin (5.4).

COMBINACIONES
El nmero de combinaciones para seleccionar X objetos de entre n objetos est dado por:
n!
nCX = (5.4)
X !( n X )!
donde n! = (n)(n 1) . . . . (1) se llama n factorial. Por definicin, 0! = 1.

Con n = 4 y X = 3, hay

n! 4! 4 32 1
nCX = = = = 4
X !(n X )! 3!( 4 3)! (3 2 1)(1)
de tales secuencias. Las cuatro secuencias posibles son:

Secuencia 1 = marcada, marcada, marcada, sin marcar con una probabilidad


ppp(1 p) = p3(1 p)1 = 0.0009
Secuencia 2 = marcada, marcada, sin marcar, marcada con una probabilidad
pp (1 p)p = p3(1 p)1 = 0.0009
Secuencia 3 = marcada, sin marcar, marcada, marcada con una probabilidad
p (1 p)pp = p3(1 p)1 = 0.0009
Secuencia 4 = sin marcar, marcada, marcada, marcada con una probabilidad
(1 p)ppp = p3(1 p)1 = 0.0009
Por tanto, la probabilidad de que haya tres formatos de pedido marcados es igual a
(nmero de secuencias posibles) (probabilidad de una secuencia en particular) = (4)
(0.0009) = 0.0036
160 CAPTULO 5 Algunas importantes distribuciones de probabilidad discreta

Usted puede hacer una deduccin intuitiva similar para los dems resultados posibles de la va-
riable aleatoria: cero, uno, dos y cuatro formatos de pedido marcados. Sin embargo, a medida que n,
el tamao de la muestra, es mayor, los clculos implicados para este mtodo intuitivo requieren de
ms tiempo. Existe un modelo matemtico que brinda una frmula general para calcular cualquier
probabilidad binomial. La ecuacin (5.5) es el modelo matemtico que se utiliza para representar la
distribucin de probabilidad binomial y calcular el nmero de xitos (X), dados los valores n y p.

DISTRIBUCIN DE PROBABILIDAD BINOMIAL


n!
P( X ) = p X (1 p ) n X (5.5)
X !( n X )!
donde P(X) = probabilidad de X xitos, dadas n y p
n = nmero de observaciones
p = probabilidad de xitos
1 p = probabilidad de fracasos
X = nmero de xitos en la muestra (X = 0, 1, 2, . . . , n)

La ecuacin (5.5) replantea lo que usted dedujo de manera intuitiva. La variable aleatoria bino-
mial X puede tener cualquier valor entero X desde 0 hasta n. En la ecuacin (5.5) el producto
p X(1 p)nX
indica la probabilidad de obtener exactamente X xitos de entre n observaciones en una secuencia
especfica. El trmino:
n!
X !( n X )!
indica cuntas combinaciones de esos X xitos de entre n observaciones son posibles. As, dado el
nmero de observaciones n y la probabilidad de xito p, la probabilidad de obtener X xitos es:

P(X ) = (nmero de secuencias posibles) (probabilidad de una secuencia especfica)


n!
= p X (1 p ) n X
X !(n X )!
En el ejemplo 5.1 se ilustra el uso de la ecuacin (5.5).

EJEMPLO 5.1 DETERMINAR P(X = 3), DADAS n = 4 Y p = 0.1


Si la posibilidad de que un formato de pedido sea marcado es de 0.1, qu probabilidad existe de que
haya tres formatos marcados en una muestra de cuatro?
SOLUCIN Al utilizar la ecuacin (5.5), se sabe que la probabilidad de obtener tres formatos
marcados de una muestra compuesta por cuatro es
4!
P ( X = 3) = ( 0.1)3 (1 0.1)4 3
3!( 4 3)!
4!
= ( 0.1)3 ( 0.9 )1
3!( 4 3)!
= 4( 0.1)(0.1)( 0.1)( 0.9 ) = 0.0036

En los ejemplos 5.2 y 5.3 se muestran los clculos para otros valores de X.
5.2: Distribucin binomial 161

EJEMPLO 5.2 DETERMINAR P(X  3), DADAS n = 4 Y p = 0.1


Si la posibilidad de que un formato de pedido sea marcado es de 0.1, qu probabilidad existe de que
haya tres o ms formatos marcados (es decir, por lo menos tres) en una muestra de cuatro?
SOLUCIN En el ejemplo 5.1 usted encontr que la probabilidad de obtener exactamente tres
formatos marcados a partir de una muestra de cuatro es 0.0036. Para calcular la probabilidad de ob-
tener por lo menos tres formatos marcados, es necesario sumar la probabilidad de los tres formatos
marcados y la probabilidad de cuatro formatos marcados. La probabilidad de obtener cuatro forma-
tos marcados es:

4!
P( X = 4 ) = (0.1)4 (1 0.1)4 4
4!( 4 4 )!
4!
= (0.1)4 (0.9 )0
4!(0 )!
= 1(0.1)(0.1)(0.1)(0.1) = 0.0001

As, la probabilidad de obtener al menos tres formatos de pedido marcados es:

P ( X 3) = P ( X = 3) + P ( X = 4 )
= 0.0036 + 0.0001
= 0.0037

Existe un 0.37% de posibilidad de tener al menos tres formatos de pedido marcados en una muestra
compuesta por cuatro formatos.

EJEMPLO 5.3 DETERMINAR P(X < 3), DADAS n = 4 Y p = 0.1


Si la posibilidad de que un formato de pedido sea marcado es de 0.1, qu probabilidad existe de que
haya menos de tres formatos marcados en una muestra compuesta por cuatro?
SOLUCIN La probabilidad de obtener menos de tres formatos de pedido marcados es:

P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2)

Se utiliza la ecuacin (5.5) de la pgina 160 para calcular cada una de las probabilidades:

4!
P( X = 0 ) = ( 0.1)0 (1 0.1)4 0 = 0.6561
0!( 4 0 )!
4!
P ( X = 1) = ( 0.1)1(1 0.1)4 1 = 0.2916
1!( 4 1)!
4!
P( X = 2 ) = ( 0.1) 2 (1 0.1)4 2 = 0.0486
2!( 4 2 )!

Por tanto, P(X < 3) = 0.6561 + 0.2916 + 0.0486 = 0.9963.


P(X < 3) tambin se puede calcular a partir de su complemento P(X 3), como sigue:

P ( X < 3) = 1 P ( X 3)
= 1 0.0037 = 0.9963

Tal vez los clculos realizados en el ejemplo 5.3 resulten tediosos, sobre todo conforme n aumenta.
Para evitar la monotona que implica efectuar los clculos, es factible encontrar muchas probabilida-
des binomiales directamente en la tabla E.6, que se reproduce parcialmente en la tabla 5.4. La tabla
162 CAPTULO 5 Algunas importantes distribuciones de probabilidad discreta

E.6 proporciona las probabilidades binomiales correspondientes a X = 0, 1, 2, . . . , n, para una selec-


cin de varias combinaciones de n y p. Por ejemplo, para encontrar la probabilidad de obtener exac-
tamente dos xitos en una muestra de cuatro, cuando la probabilidad de xito es 0.1, vea primero
n = 4 y luego busque en la fila X = 2 y en la columna p = 0.10. El resultado es 0.0486.

TABLA 5.4 p
Cmo encontrar la n X 0.01 0.02 .... 0.10
probabilidad binomial 4 0 0.9606 0.9224 .... 0.6561
para n = 4, X = 2 y
p = 0.1. 1 0.0388 0.0753 .... 0.2916
2 0.0006 0.0023 .... 0.0486
3 0.0000 0.0000 .... 0.0036
4 0.0000 0.0000 .... 0.0001

Fuente: Tabla E.6.

Tambin es posible calcular las probabilidades binomiales que aparecen en la tabla E.6 utilizan-
do Excel o Minitab. En la figura 5.2 aparece una hoja de trabajo de Excel para calcular probabilida-
des binomiales, y en la figura 5.3 se ilustra el resultado en Minitab.

FIGURA 5.2
Hoja de trabajo de
Excel para calcular
probabilidades
binomiales.

FIGURA 5.3
Clculo de la
distribucin binomial
para n = 4 y p = 0.1
en Minitab.

La forma de probabilidad binomial depende de los valores de n y p. Siempre que p = 0.5, la dis-
tribucin binomial es simtrica, independientemente de lo grande o pequeo del valor de n. Cuando
p 0.5, la distribucin es asimtrica. Cuanto ms se acerca p a 0.5 y el nmero de observaciones n
es mayor, menos asimtrica se vuelve la distribucin. Por ejemplo, la distribucin del nmero de
formatos marcados es muy asimtrica a la derecha, porque p = 0.1 y n = 4 (vea la figura 5.4).
5.2: Distribucin binomial 163

FIGURA 5.4
Grfica de barras de
Excel de la distribucin
de probabilidad
binomial con n = 4 y
p = 0.1.

La media de la distribucin binomial es igual al producto de n por p. En lugar de calcular la me-


dia de la distribucin de probabilidad utilizando la ecuacin (5.1) de la pgina 155, utilice la ecua-
cin (5.6) para calcular la media de las variables que siguen a la distribucin binomial.

MEDIA DE LA DISTRIBUCIN BINOMIAL


La media de la distribucin binomial es igual a la multiplicacin del tamao n de la muestra
por la probabilidad de xito p.

= E(X) = np (5.6)

En promedio, y a la larga, tericamente usted esperara = E(X) = np = (4)(0.1) = 0.4 formatos de


pedido marcados en una muestra compuesta por cuatro formatos.
La desviacin estndar de la distribucin binomial se calcula mediante la ecuacin (5.7).

DESVIACIN ESTNDAR DE LA DISTRIBUCIN BINOMIAL

= 2 = Var( X ) = np(1 p ) (5.7)

La desviacin estndar del nmero de formatos marcados es:

= 4(0.1)(0.9) = 0.6

Este resultado es el mismo que calculara si utilizara la ecuacin (5.3) de la pgina 156.

EJEMPLO 5.4 CLCULO DE PROBABILIDADES BINOMIALES


La exactitud al tomar los pedidos en la ventanilla de servicio a los automovilistas es una caracters-
tica muy importante de las cadenas de comida rpida. Todos los meses, QSR Magazine www.
qsrmagazine.com publica los resultados de sus encuestas. La exactitud se evala como el porcenta-
je de pedidos compuestos por un artculo principal, uno secundario y una bebida (pero solicitando
164 CAPTULO 5 Algunas importantes distribuciones de probabilidad discreta

que se elimine algn ingrediente normal como los pepinillos) que se sirven correctamente. Hace po-
co, el porcentaje de pedidos de este tipo servidos correctamente en Burger King fue del 88%. Supon-
ga que usted y dos de sus amigos van en su automvil a la ventanilla de servicio de Burger King y
cada uno hace un pedido como el descrito antes. Cul es la probabilidad de que los tres pedidos se
sirvan con exactitud? Ninguno de los tres? Al menos dos de los tres? Cules son el promedio y la
desviacin estndar del nmero de pedidos servidos con exactitud?

SOLUCIN Puesto que se trata de tres pedidos y la probabilidad de tener un pedido servido con
exactitud es del 88%, n = 3 y p = 0.88. Mediante las ecuaciones (5.5), (5.6) y (5.7)

3!
P ( X = 3) = ( 0.88 )3 (1 0.88 )3 3
3!( 3 3)!
3!
= ( 0.88 )3 ( 0.12 )0
3!( 3 3)!
= 1( 0.88 )(0.88 )(0.88 )(1) = 0.6815

3!
P ( X = 0) = (0.88)0 (1 0.88)3 0
0!(3 0)!
3!
= (0.88)0 (0.12 )3
0!(3 0)!
= 1(1)(0.12)(0.12 )(0.12 ) = 0.0017

3!
P( X = 2 ) = (0.88 ) 2 (1 0.88 )3 2
2!(3 2 )!
3!
= (0.88 ) 2 (0.12 )1
2!(3 2 )!
= 3(0.88 )(0.88 )(0.12 ) = 0.2788

P ( X 2 ) = P ( X = 2 ) + P ( X = 3)
= 0.2788 + 0.6815
= 0.9603

= E(X) = np = 3(0.88) = 2.64

= 2 = Var( X ) = np(1 p )
= 3(0.88 )(0.12 )
= 0.3168 = 0.563

La probabilidad de que los tres pedidos se sirvan con exactitud es de 0.6815 o del 68.15%. La
probabilidad de que ninguno de los pedidos se sirva con exactitud es de 0.0017 o del 0.17%. La pro-
babilidad de que por lo menos dos pedidos se sirvan con exactitud es de 0.9603 o del 96.03%. La
media de pedidos servidos con exactitud en una muestra de tres pedidos es 2.64 y la desviacin es-
tndar es 0.563.

En este apartado se explic la distribucin binomial, la cual desempea un papel an ms im-


portante cuando se utiliza en problemas de inferencia estadstica que implican la estimacin o prue-
ba de hiptesis sobre proporciones (como analizaremos en los captulos 8 y 9).
5.2: Distribucin binomial 165

PROBLEMAS PARA LA SECCIN 5.2


Puede resolver manualmente los problemas 5.7 a AUTO 5.12 En el ejemplo 5.4 de la pgina 163, usted y
5.14 o usando Excel o Minitab. Le recomendamos Examen dos amigos decidieron ir a Burger King. En lugar de
usar Excel o Minitab para resolver los problemas eso, suponga que acuden a McDonalds, donde du-
5.15 a 5.17. rante el mes pasado sirvieron el 90% de los pedidos con exacti-
tud. Cul es la probabilidad de que
a. los tres pedidos se sirvan con exactitud?
Aprendizaje bsico b. ninguno de los tres pedidos se sirva con exactitud?
5.7 Si n = 5 y p = 0.40, encuentre cul es la probabilidad de c. al menos dos de los tres pedidos se sirva con exactitud?
que d. Cules son la media y la desviacin estndar del nmero de
a. X = 4 pedidos servidos con exactitud?
b. X 3 5.13 Durante varios aos se ha reducido el porcentaje de co-
c. X < 2 misin que las lneas areas comerciales pagan a los agentes de
d. X > l viajes. Muchas agencias, en busca de mejorar sus ingresos, co-
bran ahora a sus clientes una cuota por boleto, generalmente de
ASISTENCIA5.8 Determine lo siguiente: entre 10 y 25 dlares. De acuerdo con la sociedad estadouni-
de PH Grade
a. Para n = 4 y p = 0.12, cunto es P(X = 0)? dense de agentes boleteros, cerca del 90% de los agentes de via-
b. Para n = 10 y p = 0.40, cunto es P(X = 9)? jes cobra cuotas a sus clientes cuando stos adquieren boletos
c. Para n = 10 y p = 0.50, cunto es P(X = 8)? de avin (Kortney Stringer, American Air Fees for Travel
d. Para n = 6 y p = 0.83, cunto es P(X = 5)? Agents to Be Cut Again, The Wall Street Journal, 20 de agos-
to, 2001, B2).
a. La cifra del 90% citada por la sociedad estadounidense de
Aplicacin de conceptos agentes boleteros, quedara mejor clasificada como proba-
5.9 Se supone que el aumento o la disminucin del precio de bilidad clsica a priori, probabilidad clsica emprica o pro-
una accin durante el transcurso de un da hbil es un evento babilidad subjetiva?
aleatorio igualmente posible. Cul es la probabilidad de que b. Usted selecciona una muestra aleatoria de 10 agencias de
una accin muestre un aumento en su precio al cierre durante viajes. Suponga que el nmero de 10 agencias de viajes que
cinco das consecutivos? cobran una cuota por boleto se distribuye como variable
aleatoria binomial. Cules son la media y la desviacin es-
5.10 El 60% de los estadounidenses leen su contrato de traba- tndar de esta distribucin?
jo, incluyendo las letras pequeas (Snapshots, usatoday.
c. Qu suposiciones es necesario hacer en el inciso b)?
com, 20 de enero, 2004). Suponga que el nmero de empleados
que leen cada una de las palabras de su contrato se puede mode- 5.14 Consulte el problema 5.13 y calcule la probabilidad de
lar utilizando la distribucin binomial. Considerando un grupo que de 10 agencias de viajes:
de cinco empleados, encuentre cul es la probabilidad de que: a. ninguna cobre cuota por boleto.
a. Los cinco lean cada una de las palabras de su contrato. b. exactamente una cobre cuota por boleto.
b. Al menos tres lean cada una de las palabras de su contrato. c. dos o menos cobren cuota por boleto.
c. Menos de dos lean cada una de las palabras de su contrato. d. tres o ms cobren cuota por boleto.
d. Cules seran sus respuestas para los incisos a) a c), si la ASISTENCIA 5.15 Cuando un cliente hace un pedido a la Pa-
probabilidad de que un empleado lea cada una de las pala- de PH Grade pelera en Lnea de Rudy, un sistema contable
bras de su contrato es de 0.80? computarizado (AIS, por sus siglas en ingls) verifica
automticamente si el cliente ha excedido o no su lmite de cr-
ASISTENCIA 5.11 Una estudiante presenta un examen de opcin
dito. Los registros sealan que la probabilidad de que los clien-
de PH Grademltiple, en el que cada pregunta tiene cuatro opcio-
tes exceden su lmite de crdito es de 0.05. Suponga que duran-
nes. Suponga que ella no conoce la respuesta correcta
te un da determinado, 20 clientes hicieron un pedido. Suponga
de ninguna de las preguntas, y que decidi utilizar una estrate-
tambin que el nmero de clientes que segn el sistema AIS ex-
gia en la que colocar cuatro pelotas (marcadas como A, B, C y
cedieron su lmite de crdito est distribuido como variable
D) dentro de una caja. Ahora, para responder cada pregunta, se-
aleatoria binomial.
lecciona una pelota de manera aleatoria y la devuelve a la caja.
a. Cules son la media y la desviacin estndar del nmero de
La letra de la pelota determinar su respuesta a la pregunta. El
clientes que excedieron su lmite de crdito?
examen se compone de cinco preguntas de opcin mltiple.
b. Cul es la probabilidad de que ningn cliente exceda su l-
Cul es la probabilidad de que ella obtenga
mite de crdito?
a. cinco respuestas correctas? c. Cul es la probabilidad de que slo un cliente exceda su l-
b. al menos cuatro respuestas correctas? mite de crdito?
c. ninguna respuesta correcta? d. Cul es la probabilidad de que dos o ms clientes excedan
d. no ms de dos respuestas correctas? su lmite de crdito?
166 CAPTULO 5 Algunas importantes distribuciones de probabilidad discreta

5.16 Cada otoo las televisoras presentan nuevos programas. Suponga que selecciona una muestra de 20 espectadores con
Con la idea de atraer el inters de los espectadores, durante el edades de 18 a 49 aos. Cul es la probabilidad de que:
verano se transmiten anuncios como parte de una campaa b. menos de cinco espectadores vean Criminal Intent?
publicitaria previa a su aparicin en otoo. Despus, las televi- c. 10 o ms espectadores vean Criminal Intent?
soras realizan encuestas para ver qu porcentaje de los especta- d. los 20 vean Criminal Intent?
dores est al corriente de los estrenos. De acuerdo con datos
5.17 De acuerdo con los datos del problema 5.16, se obtiene
procedentes de las televisoras, durante el otoo de 2001, el 68%
otra muestra de 20 espectadores y se considera al nuevo progra-
de los espectadores de entre 18 y 49 aos supieron de la nueva
ma Inside Schwartz. Cul es la probabilidad de que:
serie Criminal Intent, mientras que slo el 24% de ellos escu-
a. menos de cinco espectadores vean Inside Schwartz?
charon de Inside Schwartz (Joe Flint, Viewers Awareness of
b. 10 o ms espectadores vean Inside Schwartz?
New Shows Rises, The Wall Street Journal, 20 de agosto,
c. los 20 vean Inside Schwartz?
2001, B7).
d. Compare los resultados de los inciso a) a c) con los de Cri-
a. Las cifras del 68% y del 24% citadas por las televisoras,
minal Intent del problema 5.16, incisos b) a d).
quedaran mejor clasificadas como probabilidades clsicas
a priori, probabilidades clsicas empricas o probabilidades
subjetivas?

5.3 DISTRIBUCIN DE POISSON

Muchos estudios se basan en el conteo de las veces que se presenta un evento dentro de un rea de
oportunidad dada. El rea de oportunidad es una unidad continua o intervalo de tiempo, volumen,
o rea en donde se puede presentar ms de un evento. Algunos ejemplos seran los defectos en la su-
perficie de un refrigerador, el nmero de fallas de la red en un da, o el nmero de pulgas que tiene
un perro. Cuando se tiene un rea de oportunidad como stas, se utiliza la distribucin de Poisson
para calcular las probabilidades si:

Le interesa contar las veces que se presenta un evento en particular dentro de un rea de opor-
tunidad determinada. El rea de oportunidad se define por tiempo, extensin, rea, etctera.

La probabilidad de que un evento se presente en un rea de oportunidad dada es igual para to-
das las reas de oportunidad.

El nmero de eventos que ocurren en un rea de oportunidad es independiente del nmero de


eventos que se presentan en cualquier otra rea de oportunidad.

La probabilidad de que dos o ms eventos se presenten en un rea de oportunidad tiende a cero


conforme esa rea se vuelve menor.

Considere el nmero de clientes que llegan a un banco ubicado en la zona central de negocios
de una gran ciudad, durante la hora del almuerzo. A usted le interesa conocer el nmero de clientes
que llegan cada minuto. Esta situacin concuerda con las cuatro propiedades de la distribucin de
Poisson mencionadas anteriormente? Primero, el evento de inters es un cliente y el rea de oportu-
nidad est definida como un intervalo de 1 minuto. Llegarn cero clientes, un cliente, dos clientes,
etctera? Segundo, es razonable suponer que la probabilidad de que llegue un cliente durante un
intervalo especfico de 1 minuto es igual a la probabilidad correspondiente a todos los dems inter-
valos de 1 minuto. Tercero, la llegada de un cliente durante cualquier intervalo de 1 minuto no influ-
ye en (es decir, es estadsticamente independiente de) la llegada de cualquier otro cliente durante
cualquier otro intervalo de 1 minuto. Por ltimo, la probabilidad de que lleguen dos o ms clien-
tes durante un periodo de tiempo dado tiende a cero a medida que dicho intervalo de tiempo es me-
nor. Por ejemplo, la probabilidad de que dos clientes lleguen durante un intervalo de tiempo con una
amplitud de 1/100 de segundo es virtualmente cero. As, es factible utilizar la distribucin de Pois-
son para determinar las probabilidades correspondientes al nmero de clientes que llegan al banco
durante un intervalo de tiempo de 1 minuto mientras es la hora del almuerzo.
5.3: Distribucin de Poisson 167

La distribucin de Poisson tiene un parmetro, llamado (la letra griega lambda minscula),
que es la media o el nmero esperado de eventos por unidad. La varianza de la distribucin de Pois-
son tambin es igual a , y su desviacin estndar es igual a . El nmero de eventos X de la va-
riable aleatoria de Poisson flucta desde 0 hasta infinito.
En la ecuacin (5.8) se presenta la expresin matemtica de la distribucin de Poisson para el
clculo de la probabilidad de X eventos, dado que se esperan eventos.

DISTRIBUCIN DE LA PROBABILIDAD DE POISSON


e X
P( X ) = (5.8)
X!
donde P(X) = la probabilidad de X eventos en un rea de oportunidad
= nmero de eventos esperado
e = constante matemtica aproximadamente igual a 2.71828
X = nmero de eventos

Para demostrar la distribucin de Poisson, suponga que la media de clientes que llega al banco
por minuto durante la hora que va del medioda a la 1 PM es igual a 3.0. Cul es la probabilidad de
que lleguen exactamente dos clientes durante un minuto dado? Y cul es la probabilidad de que lle-
guen ms de dos clientes durante un minuto dado?
Al utilizar la ecuacin (5.8) y = 3, se sabe que la probabilidad de que lleguen exactamente dos
clientes durante el transcurso de un minuto dado es

e 3.0 (3.0 ) 2 9
P( X = 2 ) = = = 0.2240
2! ( 2.71828 )3 ( 2 )

Para determinar la probabilidad de que lleguen ms de dos clientes durante un minuto dado

P(X > 2) = P(X = 3) + P(X = 4) + + P(X = )

Puesto que la suma de todas las probabilidades de una distribucin de probabilidad debe ser igual a
1, los trminos del lado derecho de la ecuacin P(X > 2) tambin representan al complemento de la