Documentos de Académico
Documentos de Profesional
Documentos de Cultura
.;' . '
OBJETIVOS DEL CAPíTULO
.1 Presentar una visión amplia sobre el campo de estudio de la estadística y sus aplicaciones
.1 Distinguir entre estadística descriptiva e inferencia estadística
.1 Estudiar las fuentes de datos
.1 Estudiar los tipos de datos
.1 Proporcionar una introducción a los métodos de selección de muestras
.1 Estudiar cómo se puede evaluar el valor de la encuesta
Hace un siglo H. G. WeUs comentó: "Algún día el pensamiento estadístico será tan nece-
sario co mo la habilidad para leer y escribir". Al comienzo del nuevo milenio, el problema
que enfrentan los gerentes no es la escasez de informaci ón, sino cómo utilizar la informa-
ción disponible para tomar las decisiones más adecuadas.
Desde la perspectiva de una toma de deci siones informada, cabe preguntarse por qué un
admini strador nece sita saber estadística. Los admi nistradores deben com prender la estadís-
tica por cuatro razones fundamentales:
t , Para saber có mo presentar y describir la info rmac i ón en fonna adecua da
2. Para saber cómo obtener co nclusio nes sobre poblaciones grandes basándose solamen-
te en la información obtenida de las muestras
3. Para saber cómo mejorar los procesos
4. Para saber cómo obtener pronósticos confiables
En la siguiente página se presenta un esquema de este libro desde la perspec tiva de estas
cuatro razones para aprender estadística. En este esquema se observa que los tres primeros
capítu los abo rdan los m étodos referent es a la recopilación, descripción y presentación de [a
información. El capítulo 4 presenta los concepto s básicos de probabilidad, y [as distribu-
ciones binomial, normal y otras, de tal maner a, que en los capítulos 5 a 8 el lector podrá
aprender cómo obtener conclusiones sobre poblaciones grandes basándose solamente en la
información que obtuvo de las muestras. Los capítulos 9 a 11 se enfocan al análisis de re-
gresión, regresión múlt iple, modelado y análi sis de series de tiempo que proporcionan mé-
todos para realizar pronósticos. El capítulo 12 aborda lo relati vo a las aplicacio nes estad ís-
ticas en la administración de la calidad y la productividad, co mo elementos esenciales para
mejorar los procesos.
Es común emplear los métodos estadísticos en las áreas funcionales de negocios: co nta-
bilidad , finanzas, administración y mercadotecnia. En contabilidad se utilizan los métodos
estadísticos para seleccionar muestras con fines de auditoría y para comprender los deter-
minantes del costo en la contabilidad de costos. En finanzas se utilizan los método s esta-
dísticos para elegir entre cartera s alternativas de inversión y para detectar las tenden cias en
las medidas financiera s a través del tiem po. En la administración se recurre a los métodos
estad ísticos para mejorar la calidad de los productos manufacturados o de los servicios que
presta alguna organi zación. En mercadote cn ia se aplican los métodos estadísticos para esti-
mar la proporción de clientes que prefieren un producto en lugar de otro. ade más, para saber
el porqué de su preferen cia. También se utiliza para obtener conclu siones y determinar la es-
trategia publicitaria que resultará más útil para aumentar las ventas de un producto.
H ~
Presentar y Cómo mejorar
de las poblaciones. besándose
~ ... describir la confiables sobre
. soierreo t e en la iflformac iOn los procesos
iriformad6il z de las mueStras .
'"!
varetses de interés
I I
lm roduccó o y Aplicaciones estadíst icas
recopilación de t-- en la admi nist ración de
M odelo de regresión
datos {capit ulo 11 la calidad y product ividad
lineal simp le y
(capít ulo 121
I co rrelación
Probabilidad bésice (capít ulo 91
Tablas y
gráficas y distr ibuciones de
(capítulo 2) probabilidad (capítulo 4)
I I I
Estadíst ica Con strucció n Anallsis de
descriptiva t-- de mod elos de senes
(capítulo 31 regresión múlt iple de tiempo
I I (cap itulo 101 (capitu lo 11J
Distribucione s Pruebas de
m uestraíes y est imación hipótesis
{capít ulo 51 (capítulos 6--8)
Mapa de rutas
(véanse las referencias 12, 19, 20, 24 Y 25), el desarro llo en las matemá ticas de las teorías
de probabilidad, y el surgimiento de la computad ora.
Se han recopilado datos a travé s de los registros históricos. Durante las civilizaciones
egipci a. griega y romana se obtuvieron datos co n el propósito primordial de cobrar impue s-
tos y reclutar soldados. En la Edad Media era frecuente que las instituciones ecle siásticas
llevaran registros de nacimientos, muertes y matrimonio s. En Estados Unidos se mantuvie-
ron diversos registros du rante la época colonial (véase la referencia 25), y a part ir de 1790
la Constituci ón Federal (de Estados Unidos) requirió el levantamiento de un censo cada 10
años. De hecho. las necesidades cada vez mayore s del cens o estimularon la invención de
máquina s tabuladoras a principios del siglo xx. Este hecho llevó al desarrollo de las compu-
tadoras de gran capacidad y después, al de las computadoras persona les.
La incursión de la tecnología de comp utadoras ha transformado radicalmente el campo de
la estadística durante los último s 30 años. Paquete s para computadoras centrales como SAS
y SPSS se popu larizaron en los años 60 y 70. Durante la década de los 80, el so ftware es-
tadístico experimentó una amplia revolución tecnológica. Adem ás de las mejo ras usuales
que se realizaron en las actualiza ciones peri ódicas . la disponibilidad de las computadoras
pe rsonales conduj o al desarrollo de nue vos paquetes. Por otra parte. las versi ones para
computadoras personales de paquetes ya existentes, tales como SAS , SPSS y Min itab (véan-
se las referencias 16, 18 Y 23) se desarro llaron con rapidez, y el creciente uso de las hojas
de cálcu lo como Lotus 1-2-3 y Microsoft Exce l (véanse las referencias 14 y 15) llevaron a
la incorpora ción de eleme ntos estadísticos en tales paq uetes.
En este libro se ilustrará la informació n de salida del paquete estadístico Minitab, y la
salida de las hojas de cálculo de Microsoft Excel . Ademá s, los apénd ices al final del libro
contienen exp licacione s sobre el uso de Minitab y Microsoft Excel para los tema s que se
presentan en cada capítulo,
A pesar de que el software estadístico y las hojas de cálculo han permitido la realiza-
ción de los análisi s más elaborados, no debemos perder de vista que pueden surgir proble-
mas cuando los usuario s ---que no comprenden las suposiciones o las limitaciones de los
procedimientos estad ísticos- obt ienen conclusiones erróneas a partir de los resultado s que
se obtuvieron gracias a la computadora . Por ello. y por fines pedagógicos, creemos que es
importante que las aplicaciones de los métodos que se presen tan en el libro se ilustre n con
ejemplos resueltos,
~ PENSAMIENTO ESTADíSTICO Y ADMINISTRACiÓN MODERNA
Durante la década de 1990, el nacimiento de una economía global generó un énfasis crecien-
te en la calidad de los productos manufactura dos y los servicios prestados. De hecho, fue el
trabajo de un experto en estadística, W. Edwards Deming, más que el de cualquier otra per-
sona, el que desarrolló este cambio en el ambiente de negocios. Una parte integra l del en-
foque administrativo que contiene este énfasis creciente en la calidad (también conocido co-
mo administración de la calidad total) es la aplicación de ciertos métodos estadísticos y
el uso del pensamiento estadístico por parte de los administradores de una compañía.
FIGURA 1.1
Filosofía
Modelo del proceso de administrativa
mejoram iento de la ca lidad
Métodos Herramientas
estadísticos de comportamiento
• ESTADíSTICA DESCRIPTIVA VERSUS INFERENCIA ESTADíSTICA
La necesi dad de recopilar da tos co n alcanc e nacional tuvo una relación estrecha con el desa-
rrollo de la estadística descriptiva .
La estadística deseriptíva puede definirse como Jos método; que involuc;"" la rece-
pilaci én, carnetcrización, 't presentación de un conjunto de datos. con el fin de descri-
. b ír Vanas de sus carncterfsticas. ,... -, --- ' . '" :/ , ~ilL,_
Aunque los métod os de la estadística descriptiva son importantes para caracteriza r y presen-
tar los datos (véase los capítulos 2 y 3). el desarrollo de los métodos de inferencia estadística
-basado en las teorías de proba bilidad- es lo que llevó a la aplicación amplia de la esta -
dí stica e n todos los ca mpos de la investigación en la é poca actual.
El ímpet u inicial del desa rro llo en las matemátic as de la teoría de la probabili dad sur-
gió de la investigación de los juegos de azar dura nte el Ren acimiento. Los funda mentos de
la teoría de probabilidad pueden rastrearse hacia mediados del siglo XV II en la co munica-
ción entre el matemático Pascal y el j ugador Chevalier de Mere (véas e las referencia s 12
y 13). Éstos y otros desarroll os. de matemá ticos co mo Bemoull i, DeMo ivre y Ga uss, fue-
ron los primeros fundamentos teóricos de la estadística infere ncia1. Sin embargo. no fue
hasta principios del siglo xx cuando especialistas en estadística como Pearson, Fisher, Gos-
seto Ncyrnan, Wald y Tukey iniciaron el desarrollo de los mét odos de inferenci a estadística .
que en la época actua l tienen una amplia aplicac ión en muchos campos.
Suponga que el rector de su universidad quiere realizar una encuesta y recabar la opi nión
de los estudiantes con relación a la calidad de vida en el campus. En este caso la pobla-
ción, o universo, serían todos los estudiantes que están inscrito s actualmente, mientras que
la muestra estaría integrada solamente por los estudiantes que fueron seleccionados para
partici par en el estudio. El objetivo sería describ ir las diferent es actitudes o característic as
de toda la población (los parám et ros). Esto se lograría mediante e l uso de los métodos es-
tadísticos obtenidos, a partir de la muestra de estudiantes para estimar las diferentes actitu-
des o características de interés en la población. Por tanto. un aspec to importante de la infe-
rencia estadística es usar métodos estadísticos muestrales para obtener conclusiones respecto
a los pará metros de la población.
La necesidad de uso de los métodos de inferencia esta dística se de riva de la necesidad
del muestreo. A medida que una población crece . por lo general resulta demasiado costo-
so, tardado y tedioso obtener información de toda la población. Las decision es respecto a
las carac terísticas de la población deben basarse en la información que está contenida en
una muestra de esa población. La teoría de probabilidad proporciona el vínculo al determi-
nar la posibilidad de que los resultados de la muestra reflejen los resultados de la población.
• Indique cuántos días transcurrieron desde que ordenó su mercancía hasta que la reci-
bió.
• ¿Cuánto dinero (en dólares) planea gastar en equipo estereofónico en los próximos 12
meses?
• ¿Cómo califica el servicio que ofrece Good Tunes respecto a su última compra?
O Mucho mejor de lo esperado O Peor de lo esperado
O Mejor de lo esperado O Mucho peor de lo esperado
O Tal como lo esperaba
• ¿Cómo califica la calidad del equipo estereofónico que acaba de adquirir en Good
Tunes?
O Mucho mejor de lo esperado o Peor de lo esperado
O Mejor de lo esperado O Mucho peor de lo esperado
O Tal como lo esperaba
• ¿Planea adquirir más mercancía en Good Tunes durante los próximos 12 meses?
Sí_No_ •
La encuesta de satisfacción para el cliente de Good Tu nes (en el ejemplo del uso de la
estadística) muestra las razones 1, 3,4 Y 5; por ejemplo, esta empresa recopila datos como
resultado de una encuesta; luego los analiza para medir el des empeño, evalúa los estánda-
res y ayuda a formular cursos de acció n alternativos si es necesario.
Es en extremo impo rtante empezar el análisis estadístico co n la identificación de las fuen-
tes de datos más adecuadas , Si los datos presentan sesgos , ambigüedades u otros tipos de
errores, no bastarán las metodologías más imagi nativas y elaboradas de análisis para com-
pensar tale s deficiencias.
• FUENTES DE DATOS
Existen cuatro fuentes para la recopilación de datos. seg ún se ilustra en el cuadro 1.2.
Los recopiladores de datos son fuentes primarias; los compiladores de datos se llaman
fuentes secundarias. Como se ve en el cuadro 1.2, el prim er método para obtener dato s es
consultar las fuentes gubernamentales. industriales o indi viduales . De estas tres fuentes. el
gobierno federal es el principal recopilador de datos, ya sea para fines públ icos o privados.
Mucha s oficinas gubernamentales facilitan este trabajo . El Bureau of Labo r Stat istics, en
Estados Unidos, es el responsable de la reco pilación de datos sobre empleo, así como del
estab lecimiento mensual del conocido ílld ice de Precios al Consumidor. Además del reque-
rimi ento constitucio nal para realizar un censo cada 10 años. el Bureau of the Census (ofi-
cina de censos) monitorea una amplia variedad de encuestas sobre població n, vivie nda y
manufactura. También , lleva a cabo estudios especiales sobre ciertos tema s: criminalidad,
viaj es y cuid ado de la salud.
Aparte del gobierno federal, vari as publicaciones comerciales presentan datos acerca de
grupos indu striales es pecíficos. Algunos servicio s de inve rsión como Moody' s proporcionan
datos financieros sobre compañía s. Servicios sindicalizados. como A.C. Nielscn, proporcio-
nan a sus clientes información que les permite comparar sus productos con la competencia.
Los periód icos ofrecen una amplia información numéric a respecto a estadísticas de precios.
condiciones climatológicas y de portes.
La segunda fuente para recopilar datos es la experim entación. En un experimento se ejer-
ce un control estricto sobre los tratamientos; por ejemplo, en un estudio para verificar la
efectividad de un deter gente para ropa, el investigador determinará qué marcas son más
efect ivas para limp iar ropa manchada al lavar las prend as en lugar de preguntar a los con-
sumidores cuál marca es la mej or. En general. los diseños experimentales adecuados son
temas de estudio a niveles más avan zados , pues con frecuencia involucran procedim ientos
estadísticos elaborados. Sin embargo, con el fin de desarrollar la sensibilidad para la prue-
ba y experimentaci ón, los conceptos fundamentales del diseño de experimentos se estudia-
rán en los capítulos 6 a 8.
La lercera fuente de dalas se obtiene al reali zar una encuesta. En ella no se ejerce con-
trol sobre el comportamiento de las personas que se investigan. Sólo se hacen preguntas
sobre sus creencias , actitudes, comportamiento y otras características. Las respuestas se edi-
tan, codi fican y tabulan para su análisis.
E l cuarto métod o para recop ilar datos con siste en realizar un estudio observacio nal. Un
investigador observa el co mportamie nto. de manera directa. casi siempre en el ento rno na-
tural. La mayor parte del conocimiento sobre la conduc ta de los animales se ha desa rrolla-
do de esta manera. al igual que los co nocimientos científicos en muchos campos. co mo en
astronomía y geología, donde la experi mentació n y las encue stas son impracti cables o im -
posibles.
Los estudio s observaciona les se presentan en formas muy variadas en las empresas; to-
dos están diseñados para recop ilar informació n en un medio gru pal. y ayudar en el proce-
so de toma de decisiones. Como eje mplo. el grupo focal es una herramienta bastante co-
nocida en la investigaci ón de mercado, se aplica para obtener respuestas no estructuradas
a partir de pregunt as abiertas : un moderador conduce la discu sión y todos los participantes
responden a las preguntas . Otros formatos más estruc turados . que involu cran dinámicas de
grupo para obten er información (y llegar a un consenso) incluyen varios método, de psi-
cología industrial y del comportamiento organizacional, co mo son la lluvia de ideas. la t éc-
nica Del phi y el método de grupo nomin al (véase la referencia 22). Estas herramienta s se
han popul arizado en los últimos años debido al impacto de la fi losofía de administración
de la calidad total (TQM, toral qual ítv management) en las em presas. TQM hace hincap ié
en la importancia del trabajo en equipo y el empowerment de los empleados. en un inten-
to por mejorar cada produ cto o serv icio.
Para diseñar un expe rimento. aplicar una encuesta o realizar un estudio por observaci ón, se
deben comprender los distintos tipos de datos y niveles de medició n. Para demostrar algu-
nos aspectos de la obtención de datos, analizaremos la obtención de datos en una encues-
ta. aunque muchos de ellos aparecen en otros tipos de investigación.
• TIPOS DE DATOS
Los especialistas en estadística desarrollan encuestas para manejar una amplia variedad de
fenómenos o características. llamados variables aleatorias. Los datos. que son los resulta-
dos observados de estas variables aleatorias, indudablemente serán distintos de una respues-
ta a otra.
Como se ilustra en la fi gura 1.2, existen dos tipos de variables aleatorias que se obtie-
nen con los resultados observados o datos: categóricas y numéricas.
Aplicación de conceptos
• 1A Para cada una de las siguientes variables aleatorias determine si es ca tegórica o numéri ca. Si
es numérica, determi ne si el fenómeno de interés es discreto o co ntinuo.
( a) Número de teléfonos por vivienda (g) Posesión de un teléfono celular
(b) Tipo de teléfono princip al en uso (h) Número de llamadas locales por mes
(e) Número de llamadas de larga distan cia (i) Duración (en minutos) de la llamada
por mes local m ás larga por mes
(d) Duración (en minutos) de la llamada (j ) Si hay una línea telefónica co nectada a
de larga distancia más larga por mes un módem en la vivienda
(e) Color del teléfono principal en uso (k) Si hay un fax en la vivienda
(O Costo mensual (en pesos y centavos)
de las llamadas de larga distanc ia
1.5 Suponga que se ha obtenido la siguiente información en tre los est udia ntes que salían de
la librería del campus durant e la primera semana de clases:
(a) Cantidad de dinero que se utiliza para (f) Posesión de una computador a personal
adquirir libros (g) Posesión de una videocaserera
(b) Número de libros de texto que se ad- (h) Número de materias en las que se ins-
quieren cribió en el semestre actual
(c) Tiempo empleado para co mprar en la (i) Si adquirió o no. alguna prenda de
librería vestir en la librería.
(d) Especialidad académica (j) Forma de pago
(e) Hombre o mujer
Clasifique cada variable como categórica o numér ica. Si es numérica. determine si es dis-
creta o continua.
1.6 Para cada una de las variables aleatorias siguientes. determin e si es categórica o numéri-
ca. Si es numé rica. indique si el fenómeno de interés es discreto o continuo.
(a) Marca de la comp utadora (que utiliza (e) Número de perso nas que usan la
con mayo r frecuencia. en caso que computadora en la vivienda
tenga varias) ( f) Número de suscripciones a revistas de
(b) Cos to de la computadora personal comp utación
(e) Tiempo de uso de la computadora por (g) Paquete de procesador de textos que
semana usa principalmente
(d) Uso principal de la computadora (h) Indicar si la co mputadora está conecta-
da a Internet
1.7 Para cada una de las variab les aleatorias siguientes. determine si es categórica o numéri-
ca. Si es numérica. indique si el fenómeno de interés es discreto o co ntinuo.
(a) Cantidad de dinero que destinó a com- (e) Periodo más probable para la co mpra
pras de ropa dura nte el último mes de ropa (entre semana, por la noche .
(b) Número de abrigos de invierno que se en fin de semana)
tienen (f) Número de pares de guantes de invier-
(e) Tienda de depart amentos favorita no que se tiene n
(d) Tiempo que invirtió en ir de compras (g) Medio principal de transpone que se
para adquirir rop-d durante el último mes utilizó para ir a comprar ropa
1.8 Suponga que la siguiente informació n se obtuvo de la solicitud de un préstamo hipoteca-
rio que Robert Keeler entregó a la Metro County Sav ings and Loan Association:
(a) Lugar de residencia: Stony Brook. (i) Ingreso familiar anual: 66.000 dólares
Nueva York (j) Otro... ingresos: 16.000 dólares
{b) Tipo de vivienda: unifamiliar (k ) Estado civil: casado
(e) Fecha de nacimiento: 9 de abril de 1962 (1) Número de hijos: 2
(d) Pagos mensuales: 1.427 dólares (m ) Préstamo hipotecario solicitado:
(e ) Ocupación: reportero y redactor en un 120,000 dólares
periódico en) Plazo para el pago del préstamo:
(O Empresa donde labora: Dailv 30 años
Newspaper (o) Otros préstamo!'> : automóvil
(g) Antigüedad en el empleo: 14 años (p) Importe de otros préstamos:
(h) Número de empleos en los últimos JO 8.000 dólares
años: 1
Clasifique cada una de las respuestas por tipo de datos.
1.9 Una de las variables que se incluye con mayor frecuencia en las encuestas es el ingreso.
A veces la pregunta se enuncia: "¿cuál es su ingreso (en miles de dólares)?" En otras en-
cuestas, se pide lo siguiente: "marque con una X el círculo que corresponde a su nivel de
ingresos". -
O Menos de $20,000 USO O Entre $20,000 y $39,999 USO O $40,000 USO o más
(a) Explique por qué en el caso de la primera pregunta el ingreso puede considerarse dis-
creto o co ntinuo.
(b) ¿Qué tipo de pregunta usaría si realizara una encuesta? ¿Por qué?
(e) ¿Qué pregunta tiene más probabilidades de ofrecer una tasa más alta de respuesta..?
¿Por qué?
1.10 Si dos estudiantes obtienen una calificación de 90 en el mismo examen, ¿qué argumentos se
pueden usar para mostrar que la variable aleatoria --calificación de la prueba- es continua?
1.11 Suponga que el director de investigación de mercado de una gran cadena de tiendas de-
partamentales desea realizar una encuesta en el área metropolitana para determinar el
tiempo mensual que invierten en adquirir ropa las mujeres que trabajan.
(a) Describa la poblac ión y la muestra de interés, e indique el tipo de datos que el direc-
tor está interesado en recolectar.
(b ) Desarrolle un primer borrador del cuestionario requerido en el inciso (a); escriba una se-
rie de tres preguntas categóricas y tres numéricas que sean apropiadas para esta encuesta.
Como se mencionó en la sección 1.4, una muestra es la porción de la pobl ación que se selec-
ciona para el análi sis, En lugar de hacer el censo completo de una población, los proce-
dimientos de muestreo estadístico se ce ntran en un pequeño grupo representativo de la pobla-
ción más gra nde. La mu estra o btenida pro po rci o na informaci ón que se pu ed e usar para
estimar características de toda la población .
El proceso de mu estreo co mie nza co n la loc alización de las fuente s ad ecuadas de d atos.
como listados de población, directorios, planos y otras fuentes llamadas marcos. Las mues-
tras se extr aen de estos marcos. Si el marco es inadecuado debido a que ciertos grupos de
individuos o de objetos en la población no se incluyeron de manera apropiada, entonces las
muestras serán inex ac tas y sesgad as . Utilizar d iferen tes marco s pa ra gene rar d atos pu ed e
llevar a conclusiones opuestas. como se ilustra en el ej emplo 1.1.
Considere el siguiente titular de un periódico que circuló en los suburbios de Nueva York
en la década de los ochenta: "Error en el conteo de habitantes: ¿Es Suffolk más populoso
que Nassau? LILC O y la Oficina de Censos están en desacuerdo" (Newsday , 25 de abril de
1988). Según los datos de la encuesta en Suffolk, el jefe de estado del condado de S uffolk
consideró que su poblado era el más habitado mientras que su homólogo del condado de
Nassau no estuvo de acuerdo y citó sus propios datos de encues ta. ¿Quién tenía la razón?
SOL UCIÓN
Las diferencias entre ambas estimaciones provienen del hecho de que la Oficina de Censos
(Bureau of Census) y la Long Island Lighting Co mpany (LILCO) utilizaron marcos y fórmu-
las diferente s para calcular la población de ambo s condados. La Bureau of Census utilizó
las tasas de nacimientos y decesos, los patrones de migración que muestran las decl aracio-
nes del impuesto sobre la renta, y una fórmula demográfica que estim a que el número pro-
medio de personas por vivienda ha disminuido en los últimos años. Para su encuesta. la
empresa LILCO usó el número anual de medidores de electricidad y gas, los perm isos de
construcción y un factor para calcular el número de habitantes en cada casa.
Hay tres razones principales para obte ner una mue stra, como se describe en el cuadro 1.3.
-~~~~~.~
Como se describe en la figura 1.3, existen dos tipos básicos de muestras: la no probabi-
lística y la probabilística.
. ,-~, , . ~;;'~ ,~ " ,'_ : . ~ ~I ).; -- ~;" ,,,-;~ ,x::,~,>-, > .'': " "',:. " ':' - :-;:", .,;- ' .Óc. , '-
Como las muestras no probabilísticas eligen a sus participantes sin co noce r sus probabili-
dades de selección (y en algunos casos los participantes se autoseleccionan ), no se puede
aplicar la teoría que se desarrolló para el mue streo probabilístico. Muchas comp añías rea-
lizan encue stas dando a los visitantes de su página de Internet la oportunidad de llenar for-
mas de e ncuestas y entregarlas en forma de una respuesta electrónica. La respuesta a estas
encuestas puede proporcionar grandes cantidade s de datos en poco tiempo, pero la muestra
se co mpone de usuarios de Internet que son seleccionados en forma automática. Para mu-
chos estudios sólo se dispone de una muestra no probabilística como una muestra subjeti-
va. En estos casos . la opinión de un e xperto en la materia es crucial para poder usar los re-
sultados obtenidos y realizar cambios en un proceso. Otros procedimientos co munes de
muestreo no probabilístico son el muestreo por cuotas y el muestreo por grupos naturales;
éstos se analizan co n detalle en libros especializados en métodos de muestreo (vé ase las re-
ferencias 1, 3 y 9).
Las muestras no probabilísticas tienen algunas ventajas co mo son co nveniencia. rapidez
y bajo costo. Por otro lado. dos desventajas important es falta de precisión debido al sesgo
en la selección y falta de capacidad para generalizar los resultados superan con mucho a
las ventajas. En consec uencia. el uso de los métodos de mues treo no probabilístico se res-
tringirá a situaciones en las que sólo se dese a obtener aproximaciones de bajo cos to para
satisfacer la curiosidad acerca de un terna específico. o en estudios iniciales de pequeña es-
cala o estudios piloto que precederán a inves tigaciones más rigurosas.
El muestreo probabilístico deberá usarse siempre que sea posible. porque es el único mé-
todo que permite hacer inferencias estadísticas correctas a partir de una muestra.
,~,;~( , ,~ "=,,¡,:. >:.:: ' ~::- ;, ~ ~ '~E· , ..·.. '~ ~ ~,,:~t<:- ';...,o ~~ ·-J'i;~;~ · '':li~;''';';'~L~ ,: tt:;;;
,_ _ 1
.--¡----,.
M uestra
subjetiva
M uestra
por cuota
Mu estra
por grupos
Mu estra
aleatoria
Mu estra Muestra Muestra
siste mática estratificada conglomerada
naturales simple
Los cuatro tipos de muestras probabilísticas que se utilizan co n mayor frec uencia son las
muestras aleatoria simple, sistemática , estratificada y conglomerada. Estos métodos de mues-
treo varían en tre sí por su costo, precisión y complejid ad. A con tinuación se analizan estos
tipos de muestras.
Suponga que una co mpañía desea seleccio nar un tamaño de muestra de 31 trabaj adores de
tiempo co mpleto entre una població n de 800 empleados de tiempo completo. para obtener
información sobre los gastos del plan de cuidados dentales que patrocin a la compañía. Se
supone que no todos los empleados estará n dispuestos a respond er la encuesta. por lo que
deben enviarse más de 32 cue stionarios para obtener las 32 respuestas deseadas. Asumien-
do que 8 de \O trabaj adores de tiempo completo responderán la encuesta <es decir. una ta-
sa de respuesta de 80%) . se requ iere un total de 40 empleados para obtener las 32 respues-
tas. Por consiguiente, se enviará la encuesta a 40 empleados de tiempo completo. elegidos
de los archivos de personal de la compañía. ¿Cómo se obtendrá. de hecho, la muestra alea-
tori a simple?
SOL UCIÓN
Para seleccionar la muestra al azar. se usa una tabla de números aleatorios. El marco de po-
blación consiste en una lista de los nombre s y su número de buzón en la compañía (de los
N = 800 empl ead os de tiempo completo) que se obtienen de los ex pedientes de personal.
Como el tamaño de la població n (800) es un número con tres dígitos. cada número de có-
digo asignado tambi én debe co ntener tres dígitos. para que todos los empl eados de tiempo
completo tengan la misma probabilidad de ser seleccionados. Entonces, se asigna el códi-
go 00 1 al primer empl eado de tiempo completo en la lista de población. el código 002 al
segundo empleado de tiempo completo. etc .. hasta asignar el código 800 al enésimo em-
pleado en la lista de población . Debid o a que N = 800 es el valor de código más grande
posible. se descartan todos los cód igos de Ires dígitos mayores que N <es decir. 80 1 a 999
y 000).
Para seleccio nar la muestra aleatoria simple. se elige al azar un punto de partida en la
labia de núme ros aleatorios. Un método con siste en cerrar los ojos y señalar números de
la tabla en forma aleatoria con un lápiz. Suponga que con este procedimiento el punto de
partida seleccionado es el renglón 06 y la columna 05 de la tabla 1.1 en la página 16 (que
es una réplica de la tabla E.l). Aunque la tabl a se puede leer en cualquier dire cción. su-
pong a que se toman secuencias de tres dígitos de derecha a izquierda sin saltarse números.
La persona que tiene el número de código 003 es el primer empleado de tiempo com-
pleto en la muestra (renglón 06 y columnas 05 a 07), el segundo individuo corresponde al
código 364 (renglón 06 y columnas 08 a 10), y el tercero al código 884. Como el número
de código más alto para cualquier empleado es 800, éste se descarta. Del tercer al décimo
miembro de la muestra serán los empleados con números de código respectivos 720, 433 ,
463, 363. 109, 592, 470 Y 705.
El proceso de selección continúa en fonna similar hasta obtener la muestra requerida de
40 empleados de tiempo compl eto. Durante este proceso, si se rep ite cualquier secuencia
de código de tres dígitos. el empleado que corresponde a esa secuencia de código se inclu-
ye de nuevo como parte de la muestra si se trata de un muestreo con reemplazo; sin em-
bargo. la secuencia de códigos repetidos se descarta si se tiene un muestreo sin ree mplazo.
,;~, ;. ~: "" :(;~-~ 1:'"" ...,.,..~,r~~Xt';i~ ,\;~"':' ''~ (' ~,,) -.:~ : :~J;:;r:~' , ,. .>" '~' f:.:' :; ')_ ; ~- ,,:,,~ - -
Fuente: Rep roducción parcia! de The Rand Corporation. A Million Random Digits with 100 ,000 Normal Deviates (G íencoe, JL: The Free Press,
1955 ); presentada en la tabla E./ del apéndice E al final del libro.
Aplicación de conceptos
1.15 Para un estudio q ue inclu ye entrevistas personales a los participant es (en lugar de enc ues-
tas por correo o por teléfo no) explique por qué una mues tra alea toria simple puede ser
menos prácti ca que otros mé todos.
1.16 Supong a que se desea selecc io nar una mue stra aleatori a simple de tamaño I de una po-
blación de tres art ícu los (A, B Y e). La regla para ext raer la mues tra es: se lanz a una
moneda ; si sale cara , se elige el artíc ulo A; si sale cruz. se lanza la moneda de nuevo:
esta vez, si es ca ra. se elige B; si es cruz. se elige C. Explique por qué se trata de una
muestra alea toria. pero no de una muestra aleato ria simple.
e
t. t 1 Suponga que una població n tiene cuatro elementos (A , S, y D ). Se desea obtener una
mue stra aleatoria de tamaño 2 y se decid e hacerlo de la siguiente manera; se lanza
una moneda ; si sale cara. la muestra serán los elementos A y B; si sale cruz, la muestra
serán los eleme ntos C y D . Aunque se trata de una muestra alea toria. no es una
muestra aleatoria simple. Expl ique por qué. (Si real izó el prob lema 1.16. compare el pro-
cedim ient o descri to en él con el procedimiento que se describe en este problema.)
• 1.18 Suponga que se pide al secretari o administrativo de una universidad con una pob lación
de N = 4.000 estudiantes (de tiempo completo) que rea lice una encuesta pa ra med ir la
satisfacción respecto a la calidad de vida en el cam pus. La siguiente tabla con tiene una
clasificación de los 4.000 estudiantes de tiempo co mpleto insc ritos po r sexo y año q ue
cursan.
Aso C UR SADO
l ER 20 3ER 40
SEXO A ÑO AÑ O AÑO AÑO T OTAL
El secretario adm inistrativo se propone lomar una mue stra probabilística de n == 200 estu -
diantes y proyec tar los result ados a tod a la poblac ión de es tud iantes de tiempo co mpleto.
(a) Si el marco de po blación d ispon ible en los expediente s escolares es un listado
alfabé tico de los nombres los N = 4,00 0 estudiantes de tiem po com pleto inscritos,
¿qué tipo de muestra podría extraerse? Justifique su respuesta.
(b) ¿C uál seria la ventaj a de seleccionar una mue stra aleatoria simp le en el inciso (a)?
(c) ¿C uál sería la ventaja de se leccionar una muestra sistemática en el inciso (a )?
(d ) Si el marco de pob lación disponible en los expedien tes es un listado de no mbre s de
los N = 4.000 estudiantes de tiempo com pleto inscritos. recop ilados en ocho listas
alfabéticas separadas. segú n el sexo y año que cu rsan, como se muestra en la labia
ante rior. ¿q ué tipo de muestra deberá em plearse? Justifique su respu esta .
(e) Suponga que los N = 4,000 estudiantes de tiempo completo inscritos viven en uno
de los 20 dormitorios del campus. Cada dormitorio consta de cuatro pisos con 50
camas por piso. lo que significa 200 estudiantes. La política del colegio es integrar a
los estudiantes por sexo y año que cursan en cada piso de dormitorios. Si el director
administrativo pudiera recopilar un marco de población con los listados de los estu-
diantes que ocupan cada piso de dormitorio, ¿qué tipo de muestra deberá emplear?
Justifique su respuesta.
1.19 Una bitácora de ventas contiene copias foliadas de las facturas. Los folios van de 000 I a
5000.
(a) Inicie en el renglón 16, columna l. y proceda por renglón en la tabla E.I, para se-
leccionar una muestra aleatoria simple de 50 folios de facturas.
(b) Seleccione una muestra sistemática de 50 números de facturas. Use los números alea-
torios en el renglón 20. columnas cinco a siete, como punto inicial de su selección.
(e) ¿Las facturas elegidas en el inciso (a) son las mismas que las elegidas en el inciso
(b)? ¿Por qué sí o por qué no?
1.20 Suponga que 5,000 facturas de ventas están separadas en cuatro estratos. El estrato 1
contiene 50 facturas; el estrato 2, 500 facturas; el 3, 1,000 Y el 4, 3,450 facturas. Deben
seleccionarse todas las facturas del estrato 1, y 50 de cada uno de los demás estratos.
(a) ¿Qué tipo de muestreo deberá realizarse? ¿Por qué?
(b) Explique cómo realizaría el muestreo de acuerdo con el método descrito en el inciso (a).
(e) ¿Por qué el tipo de muestreo en el inciso (a) no es una muestra aleatoria simple?
Se le ha dado mucha atención al error de medición que oc urre por fallas de redacció n en
el enunciado de las pregun tas (referencia 7). Una preg unta debe ser clara. no ambigua. De-
be presentarse en forma objetiva y neutral; se deben evitar las "preguntas guiadas".
Existen tres fuentes de errores en la medición: redacció n ambigua de las preguntas. efec-
to de halo y errores de la persona que contesta. Co mo ej emplo de ambigüedad en la redac-
ción. en noviem bre de 1993 el Departamento de Trabajo [Labor Depanmen ú de estados
Unidos informó que la tasa de dese mpleo se había subestimado durante más de una déca-
da debido a fallas en la redacción de las preguntas en la Encuesta de Población Actual [Cu-
rrent Population Survey) . En particular. esta falla provocó que se minimizara la prese ncia
de las mujeres en la fuerza laboral. Como la tasa de desempleo está ligada a los programas
de beneficio social, como los sistemas estatales de compen sación por desem pleo. era impe-
rativo que los investigadores del gobierno rectificaran la situación con ajustes a) co ntenido
de las preguntas.
El "efecto de halo" se presenta cuando la persona que responde se siente obligada a com-
placer al entrevi stador. Este tipo de error puede minimizarse con la capacitación adecuada
en la realización de entrevistas.
El error que proviene de la perso na que responde se produce cuando ésta reali za un es-
fuerzo dema siado grand e o demasiad o pequeño. Existen dos form as para minimi zar esta
clase de error: (1) mediante una revisión cuidadosa de los datos y un nuevo llamado a aque-
llos individuo s cuyas respuestas parecen raras y (2) al establ ecer un programa de llamada s
aleatorias para verificar la con fiabilid ad de las respue stas.
Aspectos éticos
Respecto a la proliferación de investigaciones que se apoyan en encuestas (referencia 2),
Eric Miller , editor del boletín de noticias Research Alert, afirmó que " ha habido una lenta
pérdida de ética. Lo que preocupa es que las person as toman decisiones con base a lo que
se publica. Puede que se trate de un crimen invisible. pero si existen víctimas". No todas
las investigaciones so n buenas, significativas o important es, y no todas so n éticas . Debe in-
tentarse distingui r entre un diseño de encuesta deficiente y un diseño carente de ética.
Las consideraciones éticas surgen con relaci ón a cuatro tipos de errores poten ciales que
pueden ocurrir cuando se diseñan encue stas que utilizan mue stras probabilísticas aleatoria s:
error de cobert ura o sesgo de selecció n. error o sesgo de no respuesta, error de mue streo
y error de medición. El error de cobertura o sesgo de selección se convierte en un proble-
ma ético sólo si se excluyen a propósito grupos específicos de individuos del marco de po-
blación, para obtener resultados sesgados, que indican una posición más favorable para el
patrocinador de la encuesta.
De igual manera, el error o sesgo de no respuesta se convi erte en un problema ético so-
lo si es menos probabl e que grupos o individuos específicos respond an a un formato de en-
cuesta dado y si e) patr ocinador diseña a propósito la encuesta, con el fin de excluir a eso
grupos o individuos. El error de muestreo se convierte en un problema ét ico sólo cuando
los resultados se presentan, a propó sito, sin referencia al tamaño de muestra o al margen
de error, de modo que el patrocinador puede promov er un punto de vista que de otra ma-
nera sería insignificante. El error de medici ón se con vierte en un problema ético en cual-
quiera de las tres formas: (1 ) un patrocinador puede elegir. en form a delibe rada , preguntas
orientadas que guían las respuestas hacia dirección específica; (2) un entrev istador, median -
te actitudes y tono de voz, puede crear un efecto deliberad o de halo o puede guiar las res-
puestas en ciert a direc ción; (3) alguien que respond e, pero no está de acuerdo con la en-
cuesta. puede proporcio nar informaci ón falsa, a propósi to.
Como puede observarse en la gráfica de resumen en la página 23, este capítulo presenté
una introducción a la estadística y analizó la recolección de datos. Se estudiaron diferente,
modos de respuesta a una encuesta, varios tipos de datos y diversas maneras de seleccio-
nar muestras aleatorias. Además, se examinaron varios aspecto s que están relacionados COI
el valor de una encuesta.
Una vez recopilados, los datos deben organizarse y prepararse para facilitar su análisis
En los dos capítulos siguientes. se mostrarán diferentes métodos para presentar los datos el
tablas y gráficas, se describirán varias técnicas de "análisis exploratorio de datos" y se de
sarrollarán mediciones descripti vas resumida s que son muy útiles para el análisis y la in
terpretaci ón de datos.
nos clave
-ación de la calidad total 4 inferencia estadística 5 pensamiento estadístico 4
marcos 11 población 5
cobertura 19 muestra 5 sesgo de no respuesta 20
medición 20 muestra aleatoria simple 13 sesgo de selección 19
muestreo 20 muestra conglomerada 16 tabla de números aleatorios 14
no respuesta 20 muestra estratificada 15 universo 5
'o 5 muestra no probabilística 12 variables aleatorias 9
'a descriptiva 5 muestra probabilística 12 variables aleatorias categóricas 9
15 muestra sistemática 15 variables aleatorias continuas 9
irirnarias 7 muestreo con reemplazo 13 variables aleatorias discretas 9
;ecundarias 7 muestreo sin reemplazo 13 variables aleatorias numéricas 9
cal 8 parámetro 5
Catecórice A de
variable
Numérica
I
Discreta Continua
I I
I
Fuent e
de datos
1
Usar los Diseñar Realizar Realizar un
datos publicados un experim ento una encuesta estudio obse rvacional
I
Tipo de Aspec tos
muestra ét icos
I
Problemas de repaso
t .4 2 La Data and Story Library ¡DASL) (h tt p://li b.sta Lcmu.ed uIDASL) e, una bibliotec a en
línea de archivos de datos y artículos que muestran el uso de métodos estadísticos bási-
cos. Cada conj unto de datos tiene uno o más artículos asociados. Éslos se clasifican por
método y tema. Visite este sitio en la red y, después de leer un artículo . resuma la forma
en que se usó la estadística en una de las áreas.
1.43 Visite el siguiente sitio en la red, patrocinado por Microsoft Corporation para Microsoft
Excel: (htt p://www.m icro soft.comfoffice/excel). Explique la forma en que Microsoft
Excel puede ser útil en el campo de la estadística. ~
1.44 Visite el sitio de Minitab en la red (htt p ://www.mi nitab.com). Explique cómo puede ser
útil en un negocio el uso de un paquete estadístico de software.
• .45 La organización Gallup presenta el resultado de esc rutinios recientes en su dirección de ~
~
lntemct;
hllp:l/gallup.com
VIsite este sino y elija Hustness ano me bconomy. Para la encuesta mrncaca,
(a) proporcione un ejemp lo de variable aleato ria categórica que se encuentre en esta en-
cuesta.
(b) proporcione un ejemplo de variabl e aleatoria numérica que se encuent re en esta en-
cuesta .
(e) desarro lle tres preguntas que se puedan utilizar en esta encuesta.
1.46 El sitio de British Airway s (http :// www.b ri tisha ír wa ys.comlfeed ba cklfeedba ck.shtml)
proporciona un cuestionario que se puede con testar en forma electrónica .
Entre las preguntas enumeradas en e l pasado están las siguientes:
1. ¿Có mo se enteró de la exi stencia del sitio de British Airway s en Internet?
2. ¿Qué edad alcanzó en su úhi mo cumpleaño s?
3. ¿Cuál es la ve locidad de su con exión a Internet?
(a) La encuesta en el sitio de British Airways. ¿represe nta una muestra aleatoria? Exp li-
que.
(b) ¿Cómo se puede obtener una muestra aleatoria?
(c) Defina el marco para British Airways.
(d) Si no lo hace la encuesta. escriba una pregunta donde la edad sea una variable nu-
mérica.
(e) Diga si la pregunt a "¿cómo se ente ró de la existencia de l sitio de British Airways en
Internet'?" es una variable categórica o numérica . Expl ique.
(O Dé tres preguntas que no figuren en la encuesta de British Airw ays y que piense que
debe rían incluirse.
1A7 Por tradición el sondeo político se ha realizado med iante en trevistas telefónicas. Los inves-
tigadore s de la finn a Harris Black Intemational LId. aseguran que e l sondeo por Internet es
menos cos toso. más rápido, y ofrece una tasa de respuestas más alta que las encue stas por
teléfono . Los crú íccs están preocupados por la confiabilidad científica de este enfoque (Wall
St reet Jouma í, 19 de abril de 1999 ). A pesar de fuertes críti cas. el sondeo por Internet se
usa cada vez más. ¿Qué preoc upaciones tendría usted acerca del escrutinio por Intern et?
1.48 Un estudio realizado por Raj esh Mirani y Albert Lederer ("An lnstrument for Accessi ng
the Organiz ationa l Benefits of IS Projects ", Decision Sciences, vol. 29. 1998, págs . 803-
838) analiza los beneficios organizacionales de los proyect os de sistemas de información
(lS ). Los investigadore s enviaron por correo 936 cuestionarios al azar entre miembro s de
una organización grande de sistemas de informaci ón en el ámbito nacional. Se recibieron
200 respuestas válidas. o una tasa de respuesta de 21 %. De las 200 respuestas, 190 contes-
taron preguntas sobre un proyecto IS recién terminado . El presupuesto promedio para estos
proyectos fue de 3.8 millones de dólares en un interv alo de 4,000 a 100,000.000 dólares.
De estas 190, 45% indicó que se reque ría la aprobación del CEO antes de iniciar los pro-
yectos.
(a) ¿Qué fuente de datos se utilizó en este estudio?
(b) Indique una variable aleatoria categórica que se mencion a en este art ículo.
(e) Indique una varia ble aleatoria numérica que se menciona en este articulo.
(d ) Analice el método de muestreo que se utiliza en este estudio.
(e) ¡.Qué tipos de errores de encues ta que puede n encontrar los investigadores?
L49 The U.S. Census Bureau (Ofic ina de Censos de Estados Unidos] (h ttp://,,,ww.census.gov/)
mantiene un amplio sitio en la red que tiene víncu los co n muchos tipos de datos. El sitio
co ntiene información sobre personas, negoc ios. geografía y otras categorías. Visite el sitio y
localice la descripci ón del Ame rican Housing Survey en la sección People.
(a) Resuma brevemente la descripci ón del Ameri can Housing Survey.
(b) ¿Qué tan grande es la muestra , y qué tipo de método de muestreo se usa?
(e) Dé un ejemp lo de variable aleatoria categórica en esta encue sta.
(d) Dé un ejem plo de var iable aleatoria numérica en esta encuesta.
(e) ¿Qué tipo de negocio puede beneficiarse con la informa ción reunida por la American
Housing Surve y? Explique.
(f) Visite el enl ace de Business. y localice la sección ded icada al sector de manufa ctura .
Describa el Annual Survey of Manufacturers.
(g) ¿Qué tan gra nde es la muestra. y qué tipo de método de muestreo se usa?
(h) Propo rcione un ejemplo de variab le alea toria categórica en esta encuesta.
(i ) Dé un ejemplo de variable aleatoria numéric a en esta encuesta.
(j ) ¿Cómo se beneficia un ejecutivo de una compañía de manufactura con la informa-
ción reunida por la Annual Survey of Manufacturers ?
t .50 Suponga que el gerente de la div isión de servicio a clientes de una compañía que fabrica
aparatos electrónicos desea determin ar si los clientes que han adqu irido una videocasetera
en los últimos 12 meses están satisfechos con sus productos. El gerente planeaba anexar
la encues ta a las pólizas de garantía.
(a) Describa la población.
(b) Describa el marco de población.
(e) ¿Qué diferencia s hay entre la población y el marco? ¿Có mo pueden afectar los resul-
tado s?
(d! Desarrolle tres preguntas categóricas apropiadas para esta encue sta .
(e) Desarrolle tres preguntas numéri cas apropiadas para esta encuesta .
(f) ¿Cómo puede seleccionarse una muestra aleatoria simple entre las pólizas de garantía?
(g) Si el gerente desea seleccionar una muestra de pólizas de garantía para cada marca
de videocaseteras. ¿cómo debe seleccionar la muestra? Exp lique.
t .51 Los sondees políticos se realizan para predecir los resultados de una elección . Por rutina
esto s resu ltados se prese ntan en los periódicos y la televisión durante las semanas y los
meses previos a las eleccione s. Para una elección específica, como la del presidente de
Estados Unidos,
(a) ¿cuál es la población a la que se qu iere generalizar?
(b) ¿,cómo se obtiene una muestr a aleatoria de esa población?
(e) según lo que sabe acerca de có mo se llevan a cabo esos sondeos , ¿qué problemas
podrían presentars e con el muestreo en ellos?
1.52 El siguiente cuestionario se encuent ra en cada habitación de un hotel con ocido y respet a-
do . La intención de la admin istración es eva luar la satisfacción de l huésped.
Limp ieza
Restaurante
(a) ¿Cree que este diseño con cuatro categorías de "caras" proporciona a la admin istra-
ció n información suficiente sob re cada uno de los servicios mencionados? Analice .
(b) ¿Mejoraría este cuestionario con otra "cara fruncida" para balancear las dos "caras
sonrientes"? Explique .
(e) ¿Cuál es el valor de las encues tas de autoselecci6n com o ésta ? ¿Se pueden usar para
proyectar las opiniones de todos los huéspedes durante un intervalo dado (como una
se mana o un mes) ? Exp lique.
(d) ¿Cómo se puede seleccion ar una muestra aleatoria de huésped es?
(e) ¿Qué pregunta categórica agregaría a la encuesta ?
(f) ¿Qué preg unta numérica agregaría a la encuesta ?
1.53 Suponga que un fabrican te de alime ntos para gatos planea realizar una encuesta entre las
familias de Estados Unidos para determ inar los hábitos de compra de los dueños de ga·
tos. Entre las pregunta s a incluir se encuentran las relac ionadas con
l . dónde suele comprarse la comida para gatos .
2. si se compra com ida seca o blanda.
3. número de gatos que hay en la casa .
4. si se trata de un gato con ped igrí o no .
(a) Describa la pobl ación.
(b) Defina el marco.
(e) Indique el tipo de muestreo que usar ía y por qué.
(d) Para cada una de las preguntas anteri ore s. indique si la variable es categórica o nu-
mérica.
(e) Desarrolle cinco pregu ntas categóricas para la encuesta.
(O Desarrolle cinco pregunta s numéric as para la encuesta.
11------
PEI.1
PROYECTO DE EQUIPO
Suponga que se obtuv o la siguiente inform ación sobre F. Jay Mari cuand o fue admitido en
la enfermería de la Universid ad de Brandwein.
(a) Sexo: masculino (g) Tipo de sa ngre: B positivo
(b ) Residencia o dormit orio: Mogelever Hall (h) Alergias conocidas a medicame ntos : nin-
(e) Año que cursa: seg undo año guna
(d) Te mpera tura: 102. 2" F (o ral) (i) Diagnóstico prel iminar: gripe
(e ) Pulso: 70 latidos por minuto G) Duración estimada de es tancia: 3 días
(f) Presión sanguínea: 130/80 mgimm(g)
Cla sifique cada una de las 10 respuestas por tipo de da tos. (Sugerencia: cuidado co n la presión san-
guínea: puede ser engañosa.)
Suponga que el presidente de la asociación de 3. un borrador del cuestionario (con una secuen
exalumncs de una universidad estatal desea rea- cia organ izada de preguntas categóricas y nu
lizar una encuesta entre sus miembros de las ge- mérica s).
neraciones de 1988 y 1989 para detenninar sus 4. un borrador de la carta de presentación de
logros anteri ores, actividades actuales y aspira- cuestionario.
c iones futu ras. Para es to. se necesita obten er in- 5. un borrador de instrucciones especiales par.
formación en las siguientes áreas: sexo del alum- quienes. responden, para ayudarlos a llenar e
no; área de especializac ión; promedio general de cues tionario.
licenciatura; metas educativas adicionales (maes- 6. una explicación de cómo planea probar la vaH
tría o doctorado); estado actual de empleo; sala- dez o ambigüedad del cuestionario.
rio anual actual; núm ero de puestos de tiempo 7. una explicación del tipo de muestreo que utili
co mpleto que ha ocupado desde su grad uaci6n; zará para la encuesta.
salari o anual esperado en 5 años ; afiliación a un S. una descripción que muestre que tomó e:
partido político, Y estado civil. cuenta aspect os como los costos de realizació
Usted. co mo director de investigación institu- de la encuesta. el personal necesario y el tiem
cional debe escribir una propuesta que indique po requerido panl iniciarla y terminarla.
cómo planea realizar la encuesta. Incluya en ella: 9. una comparación de la población meta d
miembros la asociación de exajumnos contra 1
1. objetivos (es dec ir. qué desea conocer y por poblaci6n real de graduados de ambas genera
qué ). cienes, 1988 y 1989, indique adem ás si los re
2. una explicación de cómo y cuándo se realizará sultados de la encuesta se pueden proyectar
la encuesta (es decir, sus planes para obtener la todos los graduados de estas generacione s.
muestra de 300 exaJumnos de la lista de 3,000
miembros de la asociación, consideran do am-
bas gen eraciones).
Referencias
1. Cccbran, W. G., Samp ling Techniq ues, 3d ed . (New York : 13. Kirk, R. E.. OO.• Statist ical Issues: A Reader f o r the Behav-
Wiley. 1977 ). tora l Sciences (Monterey. CA: Rroo kslCole, 1972 ).
2. Crc ssen . e., "Margin of Error: Studies and Surveys Prolif- 14. Lo tus J·2 -3 R elease 5 (Cambridge, MA : Lotu s Devel op-
erare, bUI Poor Methodology Makes Man y Unrellable" , The men t Corporation , 1994 ).
Wall Street Joum al, Nove mber 14, 1991. A l and A9 . 15. Microsoft Exce í 2000 (Re dmond, WA : Microsoft Co rpora-
3. Dem ing, W. E., Sample Design in Bus iness Research (New tion, 199 9).
Yo rk: Wiley. 1960 ). 16 . M ínítab Version 12 (State College. PA: Minitab, Inc.• 199 5).
4 . Deming , W. E.• Out 01 the Crisi s (Ca mbridge: Ma ssachu- 17. Mostell er, F., et al., The Pre-Election Polls 0/ 19-18 (New
setts Institute of Technology Center for Advanced Engi- York: Social Science Research Council, 1949).
neering Study, 1986). 18. Norusis. M., SPSS Guide to Data Analy sís Jo, SPSS·X:
5. Deming, W. R . The New Econom ics for Indust ry, Govem- Wilh Additional ln structions 101' SPSSlPC + (C hicago:
mem, Education (Cambridge: Massachusetts Institute of SP SS lnc., 1986).
Techno1ogy Cenler for Advanced Engineering Study. 1993). 19. Pearson , E. S.• ed., TI~ Hístory 01 Statistics in the Seven-
6. Gallup, G. H., The Sophisticated Po ít-wa tcher's Guide teeruh and Ei ghteent h Cen turíes (New York: Macm illan,
(Princeton , NJ : Princeton Üpinion Pre ss, 1972). 1978).
7. Gol eman, D.• "P ollsters Enlist Psychcl ogists in Ques t for 20. Pearson, E. S., and M. G. Kendall, OOs.• Srudies in the History
Unblased Results", The New York Times , Sept ember 7. of Statistics and Probability (Darien. Cf: Hafner. 197 0).
199 3. C1 andC lI . 2 1. Rand Corporation , A M illioll Random Dígits with 100. 000
S. Grcves, R. M., Survey Er rors and Survey Costs (New York: No rma l Deviates (Ne w York: Th e Free Press, 1955 ).
W i1cy, 1989). 22. Robb ins, S. P.. Management, 5th ed. (U pper Saddle River,
9. Hansen. M. R . W . N. Hurwitz , and W . G . Madc w. Samp le NJ: Prent ice Hall , 1997 ).
Survev Methods and Theory, vols. 1 and 2 (New York: Wi- 23 . SAS Longuage and Proced eres Usage. Venio" 6 (Rale igh,
ley, 1953). NC : SAS Institute, 1988).
O. Juran. J . M.. Juran on Leadership fo r Qua/U}' (New Yo rk: 24. Walke r, H. M ., Stud ies in the History of the Sta tistica l
Th e Free Press. 1989 ). Meth od t Bald more: WilJiams & Witkin s. 19 29 ).
1. Juran, J. M.• and F. M. Gryna, Qua liry Pla nning and Analy - 25. Wattenberg, B. E., ed ., Statistica l H ístory of the United
sls. 2d ed . (New York : McGrJ w-H ill, 1980) . Sta tes : Fro m Colonial Tim es lo the Presen t (Ne w York :
2. Kendall , M. G.. and R. L. Ptacketr. eds ., S tudies in che His- Ras ic Boo ks. 1976 ).
lOry of Sunistics and Probability. vol. 2 (London: Charles
W. Gri rfin, 1977 ).
.ste apéndice proporc iona una orientació n acerca de los conceptos bá sicos qu e se necesitan par a utili-
ar Microsoft Excel O Minitab, que corren en una interfaz de usuario de Windows. que a su vez utiliza
entanas o marcos para dividir la pantalla. En es ta interfaz de usuario. a pesar de que la com unica-
ión se puede lograr oprimiendo una co mbinación de teclas, la selección de tare as es más sencilla si
e utiliza un señalado r, como un ratón o un puntero de esfera o de pantalla de tacto. Al move r e l dis-
ositivo señalador (mo use o ratón) se mueve el puntero o curso r, que es una image n gráfica en la
antalla que suele apare cer como una flecha. Al mover el pun tero del ratón sobre otro obj eto y pre-
o nar uno de los botones se define una ope ración co n el ratón. En el cuad ro A 1.1.1 se presentan cua-
o tipos de ope raciones con el ratón que se utilizan en Microsoft Excel o Minitab.
En un ambiente de ventanas, las operaciones de ratón se aplican a una amplia variedad de obje tos
en la pantalla. En primer lugar se tienen las venta nas , marcos que sirven para contener otras venta-
nas o los objetos que se describen en este apéndice. Se pueden seleccionar y arrastrar muchas ven-
tanas desde una posición en la pantalla a orra. y a veces se puede modifica r su tamañ o. es decir.
modificar sus dimensiones.
Otros objetos comunes en el ambiente de ventanas incluyen íconos flotantes. barras de tareas o de
herramientas. barras de menú y cuadros de diálogo.
íconos flotantes
Los íconos flotantes son gráficos que representan una aplicación o un documento específicos. pue-
den seleccionarse y arrastrarse a otra posición. El hecho de activar un ícono que representa Micro-
soft Excel es una forma típica de iniciar el programa de ExceI.
Barras de menú
Las barras d e menú son listas horizontales de palabras que representan un conjunto de opciones. Al
seleccionar una opción aparece un men ú desplegable [pull-down] o una lista con más palabras pa-
ra elegir.
Cuadros de diálogo
Al hacer una selección en un menú o una barra de herramientas. a menudo aparece un tipo especial
de ventana llamada cuadro de diálogo. Los cuadros de diálogo se usan para desplegar mensajes o
para pedir al usuario que elija o proporcione información adicional. Los obje tos comunes en muchos
cuadros de diálogo se enumeran en el cuadro A1.1.2.
COM ENTARIO: Notación abreviada para seleccionar UIl men ú
En este texto. los autores abreviarán las selecciones de menú con una raya vertical para
separar las opciones. Por ejemplo, se usará Archivo I Abrir en vez de la expresión "se-
leccione el menú de Archivo. y luego la opción Abrir". Además, tal como se escribió Ar-
chivo 1 Abrir . las selecciones aparecerán en negritas.
~ ..
?_" ñ' --'''' • -.-,.• "-
- . :.
'ihe et t
La hoja de cálculo que se presenta en el área de trabajo está maximizada. y la cubre completamen-
te. Los botones para cambiar tamaño y cerrar la ventana aparecen en la barra de título y en la de me-
nú. Las barras de desplazamiento, horizontal y vertical, permiten desplegar las partes de la hoja de
cálculo que están fuera de la pantalla. Las etiquetas de hojas, que identifican el nombre de cada una,
se utilizan para ir de una hoja a otra (del cuaderno de trabajo). Una barra de estado puede proporcio-
nar inform ación acerca de la operación actual y el estado de algunas teclas.
AHen 125
Barry 250
Diane 72
Kim 105
Susan 48
Ahora se usará Microsoft Excel para realizar un análisis estadístico de estos dalas. Según la tabla
A 1.2.1. se decide que el encabezado de la primera columna, "Nombre", debe aparecer en la celda A l.
Con el mismo razonamie nto, el encabezado de "C antidad" debe aparecer en la celda B1, Y los valo-
res de cada variable para los cinco clientes, en las cinco filas siguientes (de la 2 a la 6). Una vez es-
pecificadas las direcc iones de las celdas para las pan es de la hoja de cálculo, se capturan los valores
en las celdas de una hoja de cálculo que se identifica con el nombre "Datos". Para hacer esto. acti-
ve Microsoft Excel, y seleccione Ar chivo I Nue vo para crear una nueva hoja de cálculo. Camb ie el
nombre de la Hoja l por Datos,
Seleccione la celda Al haciendo clic en su interior. Un borde especial que resalta la celda. apa-
rece alrededor de ella e indica que la celda A I es ahora la celda activa donde se introducirá el si-
guiente valor. (También observe que A l. la dirección de la celda activa, aparece en el cuadro de re-
ferencia de celdas.) Escriba el encabezado de columna. "Nom bre". Al hacerlo. observe que las letras
aparecen en el cuadro de edición de la barra de fónnu las al igual que en la celda A l . Presione la te-
cla Enter (o haga e1ie en la marca de correcto a la izquierda del cuadro de edición) para terminar.
(Si su teclado no tiene la tecla Enter entonce s debe presionar la tecla Retum .) Continúe con la selec-
ción de la celda B l y escriba el encabezado de colu mna "Cantidad" .
Una vez escritos los encabezados. puede iniciar la ca ptura de los valores en cada columna. Se es-
cribirán los valores por columna. utilizando la tecla Enter (Retum) , que da el avance automático de
la celda activa un renglón hacia abajo. después de cada dato. (Si desea ingresar valores por renglón.
debe presionarse la tecla Tab [tabulador] después de cada dato para desplazarse a la celda activa, que
está una columna a la dcrecha.)
Seleccione la celda A2. escrib a el nombre Allen, y oprima la tecla Enter (Retum ). Escriba el res-
to de los nombres en las celdas A3 a A6. oprimiendo Enter después de cada nombre. Seleccione la
celda B2. y escriba la cantidad J25 de la tabla A l. 1. Después siga con las cantidades 250. 72. 105 Y
48 en las celdas B3 a 86. Una vez introducidos todos los valores de la tabla fuente en la boja de tra-
bajo "Datos", debe guardar una copia del trabajo en el disco con Arc hivo I Guardar o Arch ivo I
Gu ardar como , antes de continuar.
Asistentes (Wiz:ards)
Los asistent es son conjuntos de cuadros de diálogo entrelazados que guían al usuario en la tarea de
crear cienos obje tos en libros de trabajo. Los usuarios proporcio nan informació n y eleccio nes en los
cuadros enlazados y avanzan haciendo clic en un botón "Siguiente" (y al final en "Terminar" para
crear el objeto; un e1ic en "Cancelar" suspende la tarea). Como ejemplo, considere el Asistente pa·
ra importar texto de Microsoft Excel que ayuda a importar o transferir datos de un archivo de tex-
to a una hoja de cálculo. (Un archivo de texto contiene valores no etiquetados y sin formato que es-
tán separados por delimitadores como espacios, comas o tabuladores .)
Para ilustrar este asistente, suponga que el archivo de texto MUTUAL.TXT con tiene un conjun to
de dates sobre fondos mutuos (este archivo se proporciona en el CD-ROM que acompaña al libro).
Para importar los datos de este archivo a una hoja de cálculo Excel: seleccio ne Archivo r Abrir. En
el cuadro de diálogo. seleccione la carpeta que contie ne el archivo MUTIJAL.TXT de la lista desple-
gable "Buscar en" . Seleccione la opción Archivos de texto (* .pr n; ...!xt; ...csv) de la lista "Ti po de
Archivo". También se puede seleccionar la opción Todos los archivos (* .*) . Introduzca el nombre
MUTUAL TXT en el cuadro " Nombre de archivo " o selecciónelo en la lista de archivos. (Si el ar-
chivo no aparece en [a lista de archivos, verifique que [os dos pasos anteriore s sean correctos.) Haga
elic en el botón Abrir.
Esto inicia el "Asistente para importar texto en tres pasos". En el cuadro de diálogo del Asisten-
te para importar texto -paso 1-, seleccione la opción De ancho fijo (porque los valores de datos
para las variables en este archivo se colocaron en columnas de ancho fijo). Observe que 10 que el tex-
to llama "variables" son "campos" en el cuadro de diálogo. Haga clic en el botón Siguiente. En el
cuadro de diálogo del Asistente para importar texto - paso 2- haga die en el botón Siguiente para
aceptar la colocación de los datos de cada línea del archivo de texto en columnas. (Arrastre la línea
vertical que separa columnas para alterar la colocación. si fuera necesario.) En el cuadro de diálogo
de Asistente para importar texto -paso 3- . seleccione el botón de opción General debajo del enca-
bezado de formato de datos de columna. Haga clíc en el botón Terminar. Los datos del archivo de tex-
lo se transfieren a una hoja de cálculo nueva. con el mismo nombre del archivo de texto (MlITUAL.
en este caso), en un nuevo libro de trabajo. Guarde este libro con formato Microsoft Excel (.XLS).
Recuerde que debe revisar los objetos que se crearon con los asistentes en busca de errores. Si los
objetos 'contienen errores se pueden modificar, ya sea oprimiendo el botón derecho en el objeto y se-
leccionando la opción apropiada del menú resumido, o bien borrándolos y creándolos de nuevo con
ayuda del asistente. (En este ejemplo, un buen procedimiento sería revisar los datos que se transfirie-
ron y, quizá. insertar encabezados de columna ; para ello seleccione cualquier celda de la fila l. lue-
go Insertar I Filas. por último, escriba los encabezado s deseados para las columnas.)
Complementos
Los com plementos son procedimientos preprogramad os y opcionales que amplían la funcionalidad
de Microsoft Excel. Algunos de ellos. como las herramientas para análisis de datos. se incluyen en
los archivos de Microsoft Excel; se instalan con el programa de Instalación de Microsoft Excel y es-
tán disponibles para los usuarios en forma permanente. Otros, llamados complementos de "terceras
personas", como PHStat de Prentice Hall (que se incluye en el CO-ROM que acompaña a esta edi-
ción en español) se instalan por separado.
Los complementos modifican la barra de menú de Microsoft Excel insertando ya sea un nuevo
menú de opciones a un menú preexistente, o un nuevo menú de opciones. Una vez seleccionados. al-
gunos suplementos de opciones conducen a recuadros de diálogo que le piden al usuario ingresar in-
formación y realizar selecciones, mientras que otros generan nuevos objetos o resultados en forma
directa.
Por ejemplo el suplemento de herramien tas para análisis de datos inserta la opción "Análisis de
datos" en el menú de herramie ntas. mientras que el complemento PHSIaI inserta el menú desplega-
ble PHStat en la barra de menú (véase la figura A1.2.1). La selección de Her r am ienta s I Análisis
fIGURA A 1.2.2
eHStat VllIt- t ,,¡
Menú PHSta t
DIIi:" ~aral:kln '
..
~.
oec-.-MaI<h;J ~ ,
~ Distrb1ens
de datos hace que el complemento de herramientas muestre el cuadro de diálogo Análisis de datos
donde se puede seleccionar el análisis estadístico de interés. Si se elige PHStat en la barra de menú
aparece un menú de opciones (véase la figura A 1.2.2) para elegir la operación de interés. Estas op-
ciones llevan a uno o más cuadros de diálogo o generan algún objeto del libro de trabajo.
Se pueden cargar muchos suplementos separados, incl uso PBSta t, en fonna tempora l. Se hace do-
ble ene en el ícono de PHStat for Exeel 97/2000 o PHStat Ior Exeel 9S en el escritorio (véase las
instrucciones para la instalación de PHStat en el apéndice F) o se usan los procedimi entos para abrir
un archivo de un cuaderno de trabajo Excel (al seleccionar PHStat en el menú Start de Prentice Hall
Add- Ins se carga el complemento). Al cargarlos en forma temporal, los complementos pueden accio-
nar el cuadro de diálogo de control de virus en macros que advierte la posible existencia de virus. Si
se presenta este cuadro de diálogo, presione el botón Activar macros para permitir la carga del com-
plemento sin virus (como PHStat). Tenga cuidado de no cargar como temporal un complemento que
está instalado como permanente. para evitar resultados impredecibles.
Recuerde que para utilizar Microsoft Excel y el comp lemento PHStat de este libro, se deben ins-
talar los complementos herramientas de análisis de datos y herramientas de análisis de datos - VBA-
que proporciona Microsoft Excel e instalar (o cargar como temporal) el complemento PHStat de Pren-
tice Hall que se incluye en el CO-ROM que acompañ a el libro . Se deben instalar los complementos
de herramientas de análisis para poder utilizar PHStat, ya que éste no funciona si detecta que no se
instalaron las herramientas.
Resumen
En este apéndice se presentó una introducción a las características básicas de Microsoft Excel. En el
resto de los apéndices de Excel se verán muchos aspectos adic ionales de Excel en el conte xto de aná-
lisis estadísticos específicos.
, ; _ _ 1 --1- - j _ - - l - - - - _ . :, _ _ ,_ _....
2
J
...-+- - -_.- . - , --- ~
.
~
,
,• ;- -
~~--'- .- .... - _.- -. ' - -'- - ,--
~ ~_ _l_~._'_~·_·- ! t--
" ~ o
Enter, y se mueve a la derecha al presionar Enter cuando la flecha apunta hacia la derecha. Al ha-
cer die en la flecha ca mbia la dirección en que se insertan los datos.
Por ejemplo, supo nga que se tienen datos sobre la ca ntidad de dinero que gastaron cinco clientes
en una tienda departamental. Los resultados se muestran en la tabla A1.3.l.
AHen 125
Barry 250
Diane 72
Kim 105
Susan 48
Empiece en la fila de la flecha. Esta fila se usa para escribir los nombres de cada variable. En la
primera col umna (con etiquet a el ), escriba la etiqueta de la primera variable (Nombre) y oprima En-
ter. Esto mueve el curso r a la prim era fila de esta columna . Escriba Allen en la fila l. Barry en la
fila 2. Diane e n la 3. Kim en la 4 y Susan en la fila 5. Mue va e l cursor al área de encabezados en
la parte superior de la co lumna 2 (abajo de C2), escriba Can tidad co mo etiqueta de esta co lumna.
Después de presionar Enter para moverse a la fila I en la columna e 2, inserte 125, la canti dad que
gastó Allen. Continúe con las cantidades que gasta ron Jos otros clientes en la" filas respe ctivas, fila
2 a fila 5.
Al realizar los análisis estadísticos en este libro. a men udo se enco ntrará n conjuntos de da tos con
un gran número de obse rvaciones . Si este tipo de conjuntos de dato s se cap turan y guardan en un ar-
chivo de datos. parece sensato tratar de importar el contenido de l archivo a una hoja de datos, para
evitar volver a introd ucir cada una de las observacione s. Los co njuntos de datos que se usaron aquí
se e ncuentran almacenados en difere ntes formato s, incluyendo el formato Minitab (.MTW ). Para im-
portar los conten idos de una hoja de cálcu lo Minit ab, abra el archivo de interés (de Min itab ) a par-
tir del directorio apropiado. Para esto se elige File I Open Worsheet en la barra de menú y después se
selecciona el archivo adecuado del directorio.
Aunque el programa Minitab puede importar datos almacenados en varios tipos de archivos espe-
ciales (como Microsoft Excelj, es posible que en otras situaciones encuentre datos guardados como
archivos de texto. archivos que contienen valores sin nombres y sin formato, datos separados por es-
pacios, comas o tabuladores. Para abrir datos de un archivo se usa el comando File I Open work-
sheet . Esto proporciona el cuadro de diálogo Open Worksheet. En este cuadro de diálogo se pueden
abrir muchos archivos diferentes, que incluyen archivos Minitab (.MTW), Microsoft Excel (.XLS).
de datos (.DAn y de texto (.TXn. Para asegurar que aparece el tipo de archivo adecuado en el cua-
dro de Files, seleccione el archivo que desea abrir. Para verlo en la hoja de trabajo, haga cl¡c en el
botón Preview.
Si la primera fila empieza con datos y no contiene los nombres de las variables (como es el caso
de los archivos con terminación .TXT que se incluyen en el CD-ROM que acompaña al libro), haga
die en el cuadro Optlons. Seleccione Nane entre las opciones del cuadro de Variable Names. Se-
leccione Free Fonnat de las opciones del cuadro Field Definitions. Haga d ie en el botón OK. Cuan.
do esté listo para abrir el archivo seleccionado. haga clic en Open para abrir el archivo selecciona-
do que aparecerá en la ventana Data. Inse-rte los nombres de cada variable. y salve el archivo como
una hoja de cálculo Minitab.