Está en la página 1de 38

Resumen 22 ,·

M.l Aspectos básicos de la tnterfazjíer usuar¡o'lI&:WíDdóws 27


"Ó: . ..~" ~.

Al,'~. Introducci,6n a Microsoft Ex~ ,: .2~1t .~~ , " """


~:;~~" ' . ~~ncciÓD a Minitab
.,... -r-
36 ,.l"''l' ,;;-::~'J.Sc, :~, : " "' ~~~ ~::" "
. :.'1-

.;' . '
OBJETIVOS DEL CAPíTULO
.1 Presentar una visión amplia sobre el campo de estudio de la estadística y sus aplicaciones
.1 Distinguir entre estadística descriptiva e inferencia estadística
.1 Estudiar las fuentes de datos
.1 Estudiar los tipos de datos
.1 Proporcionar una introducción a los métodos de selección de muestras
.1 Estudiar cómo se puede evaluar el valor de la encuesta

• ¿POR QUÉ UN ADMINISTRADOR NECESITA CONOCER ESTADíSTICA?

Hace un siglo H. G. WeUs comentó: "Algún día el pensamiento estadístico será tan nece-
sario co mo la habilidad para leer y escribir". Al comienzo del nuevo milenio, el problema
que enfrentan los gerentes no es la escasez de informaci ón, sino cómo utilizar la informa-
ción disponible para tomar las decisiones más adecuadas.
Desde la perspectiva de una toma de deci siones informada, cabe preguntarse por qué un
admini strador nece sita saber estadística. Los admi nistradores deben com prender la estadís-
tica por cuatro razones fundamentales:
t , Para saber có mo presentar y describir la info rmac i ón en fonna adecua da
2. Para saber cómo obtener co nclusio nes sobre poblaciones grandes basándose solamen-
te en la información obtenida de las muestras
3. Para saber cómo mejorar los procesos
4. Para saber cómo obtener pronósticos confiables
En la siguiente página se presenta un esquema de este libro desde la perspec tiva de estas
cuatro razones para aprender estadística. En este esquema se observa que los tres primeros
capítu los abo rdan los m étodos referent es a la recopilación, descripción y presentación de [a
información. El capítulo 4 presenta los concepto s básicos de probabilidad, y [as distribu-
ciones binomial, normal y otras, de tal maner a, que en los capítulos 5 a 8 el lector podrá
aprender cómo obtener conclusiones sobre poblaciones grandes basándose solamente en la
información que obtuvo de las muestras. Los capítulos 9 a 11 se enfocan al análisis de re-
gresión, regresión múlt iple, modelado y análi sis de series de tiempo que proporcionan mé-
todos para realizar pronósticos. El capítulo 12 aborda lo relati vo a las aplicacio nes estad ís-
ticas en la administración de la calidad y la productividad, co mo elementos esenciales para
mejorar los procesos.
Es común emplear los métodos estadísticos en las áreas funcionales de negocios: co nta-
bilidad , finanzas, administración y mercadotecnia. En contabilidad se utilizan los métodos
estadísticos para seleccionar muestras con fines de auditoría y para comprender los deter-
minantes del costo en la contabilidad de costos. En finanzas se utilizan los método s esta-
dísticos para elegir entre cartera s alternativas de inversión y para detectar las tenden cias en
las medidas financiera s a través del tiem po. En la administración se recurre a los métodos
estad ísticos para mejorar la calidad de los productos manufacturados o de los servicios que
presta alguna organi zación. En mercadote cn ia se aplican los métodos estadísticos para esti-
mar la proporción de clientes que prefieren un producto en lugar de otro. ade más, para saber
el porqué de su preferen cia. También se utiliza para obtener conclu siones y determinar la es-
trategia publicitaria que resultará más útil para aumentar las ventas de un producto.

• CRECIMIENTO y DESARROLLO DE LA ESTADíSTICA MODERNA

Históricamente el crecimiento y desarrollo de la estadística moderna se remonta a tres fe-


nóme nos: las necesidades de los gobiernos de recopilar datos acerca de sus ciudadanos
Obtéóef,,~nctusioriés ecerce"
Obte ner pr~~tk:os

H ~
Presentar y Cómo mejorar
de las poblaciones. besándose
~ ... describir la confiables sobre
. soierreo t e en la iflformac iOn los procesos
iriformad6il z de las mueStras .
'"!
varetses de interés
I I
lm roduccó o y Aplicaciones estadíst icas
recopilación de t-- en la admi nist ración de
M odelo de regresión
datos {capit ulo 11 la calidad y product ividad
lineal simp le y
(capít ulo 121
I co rrelación
Probabilidad bésice (capít ulo 91
Tablas y
gráficas y distr ibuciones de
(capítulo 2) probabilidad (capítulo 4)

I I I
Estadíst ica Con strucció n Anallsis de
descriptiva t-- de mod elos de senes
(capítulo 31 regresión múlt iple de tiempo
I I (cap itulo 101 (capitu lo 11J
Distribucione s Pruebas de
m uestraíes y est imación hipótesis
{capít ulo 51 (capítulos 6--8)

Mapa de rutas

(véanse las referencias 12, 19, 20, 24 Y 25), el desarro llo en las matemá ticas de las teorías
de probabilidad, y el surgimiento de la computad ora.
Se han recopilado datos a travé s de los registros históricos. Durante las civilizaciones
egipci a. griega y romana se obtuvieron datos co n el propósito primordial de cobrar impue s-
tos y reclutar soldados. En la Edad Media era frecuente que las instituciones ecle siásticas
llevaran registros de nacimientos, muertes y matrimonio s. En Estados Unidos se mantuvie-
ron diversos registros du rante la época colonial (véase la referencia 25), y a part ir de 1790
la Constituci ón Federal (de Estados Unidos) requirió el levantamiento de un censo cada 10
años. De hecho. las necesidades cada vez mayore s del cens o estimularon la invención de
máquina s tabuladoras a principios del siglo xx. Este hecho llevó al desarrollo de las compu-
tadoras de gran capacidad y después, al de las computadoras persona les.
La incursión de la tecnología de comp utadoras ha transformado radicalmente el campo de
la estadística durante los último s 30 años. Paquete s para computadoras centrales como SAS
y SPSS se popu larizaron en los años 60 y 70. Durante la década de los 80, el so ftware es-
tadístico experimentó una amplia revolución tecnológica. Adem ás de las mejo ras usuales
que se realizaron en las actualiza ciones peri ódicas . la disponibilidad de las computadoras
pe rsonales conduj o al desarrollo de nue vos paquetes. Por otra parte. las versi ones para
computadoras personales de paquetes ya existentes, tales como SAS , SPSS y Min itab (véan-
se las referencias 16, 18 Y 23) se desarro llaron con rapidez, y el creciente uso de las hojas
de cálcu lo como Lotus 1-2-3 y Microsoft Exce l (véanse las referencias 14 y 15) llevaron a
la incorpora ción de eleme ntos estadísticos en tales paq uetes.
En este libro se ilustrará la informació n de salida del paquete estadístico Minitab, y la
salida de las hojas de cálculo de Microsoft Excel . Ademá s, los apénd ices al final del libro
contienen exp licacione s sobre el uso de Minitab y Microsoft Excel para los tema s que se
presentan en cada capítulo,
A pesar de que el software estadístico y las hojas de cálculo han permitido la realiza-
ción de los análisi s más elaborados, no debemos perder de vista que pueden surgir proble-
mas cuando los usuario s ---que no comprenden las suposiciones o las limitaciones de los
procedimientos estad ísticos- obt ienen conclusiones erróneas a partir de los resultado s que
se obtuvieron gracias a la computadora . Por ello. y por fines pedagógicos, creemos que es
importante que las aplicaciones de los métodos que se presen tan en el libro se ilustre n con
ejemplos resueltos,
~ PENSAMIENTO ESTADíSTICO Y ADMINISTRACiÓN MODERNA

Durante la década de 1990, el nacimiento de una economía global generó un énfasis crecien-
te en la calidad de los productos manufactura dos y los servicios prestados. De hecho, fue el
trabajo de un experto en estadística, W. Edwards Deming, más que el de cualquier otra per-
sona, el que desarrolló este cambio en el ambiente de negocios. Una parte integra l del en-
foque administrativo que contiene este énfasis creciente en la calidad (también conocido co-
mo administración de la calidad total) es la aplicación de ciertos métodos estadísticos y
el uso del pensamiento estadístico por parte de los administradores de una compañía.

El pensamiento' estadístic:o se pu."fudefinii romo el 'Conjtl:,to de procesos del'jíeri--


samiento que se onen/in'á- I" forma de entender, administrar y reducir la variaci6n:

El pensamiento estadístico incluye el reconocimiento de que los datos son intrínsecamente


variables (no hay dos cosas o dos personas exactament e iguales en todos los sentidos) y
que la identificación , medición, control y reducción de la variación propor cionan oportuni-
dades para mejorar la calidad. Los métodos estadísticos pueden ser el medio que permite
aprovechar esas oportun idades.
El papel de los métodos estadísticos -en el contexto del mejoramiento de la calidad-
puede comprenderse mejor si se analiza el modelo de mejoramien to de la calidad que se
presenta en la figura L L En esta figura se ve que el triángulo está integrado por tres par-
tes: en el vértice superior se encuentra la filosofía administrativa, y en los otros vértices es-
tán los métodos estadísticos y las herramientas de comportamiento. Cada aspecto es indis-
pensab le para mejorar la calidad a largo plazo, tanto de los productos manufacturados como
de los servicios que presta .una organización. Una filosofía sólida de la administración pro-
porciona una base co nstante para los esfuerzos dedicados a mejorar la calidad. Entre los
enfoques disponibles se encuentra n los que se atribuyen a W. Edwards Deming (véase las
referencias 4 y 5 Y la sección 12.2) y a Joseph Juran (véase las referencias 10 y 11).
Co n el tin de implantar el enfoque de mejoramiento de la calidad en una organización,
se deben utilizar las herramientas de comportamiento y los métodos estadísticos. Cada uno
ayuda a comprender y mejorar los procesos. Entre las herramientas útiles de comportamiento
están los diagramas de flujo del proceso y los diagramas de esqueleto de pescado, la lluvia
de ideas, la toma de decisiones en grupos focale s y la integración de equipos. (Una discu-
sión más amplia se encuentra en las referencias 4 y 22.) Las numerosas tablas, gráficas y
la esta dística descripti va que se estudian en los capítulos 2 y 3; y las gráticas de control
que se desarrollan en el capítulo 12 figuran entre los métodos estadísticos más útiles para
mejorar la calidad.

FIGURA 1.1
Filosofía
Modelo del proceso de administrativa
mejoram iento de la ca lidad

Métodos Herramientas
estadísticos de comportamiento
• ESTADíSTICA DESCRIPTIVA VERSUS INFERENCIA ESTADíSTICA

La necesi dad de recopilar da tos co n alcanc e nacional tuvo una relación estrecha con el desa-
rrollo de la estadística descriptiva .

La estadística deseriptíva puede definirse como Jos método; que involuc;"" la rece-
pilaci én, carnetcrización, 't presentación de un conjunto de datos. con el fin de descri-
. b ír Vanas de sus carncterfsticas. ,... -, --- ' . '" :/ , ~ilL,_

Aunque los métod os de la estadística descriptiva son importantes para caracteriza r y presen-
tar los datos (véase los capítulos 2 y 3). el desarrollo de los métodos de inferencia estadística
-basado en las teorías de proba bilidad- es lo que llevó a la aplicación amplia de la esta -
dí stica e n todos los ca mpos de la investigación en la é poca actual.
El ímpet u inicial del desa rro llo en las matemátic as de la teoría de la probabili dad sur-
gió de la investigación de los juegos de azar dura nte el Ren acimiento. Los funda mentos de
la teoría de probabilidad pueden rastrearse hacia mediados del siglo XV II en la co munica-
ción entre el matemático Pascal y el j ugador Chevalier de Mere (véas e las referencia s 12
y 13). Éstos y otros desarroll os. de matemá ticos co mo Bemoull i, DeMo ivre y Ga uss, fue-
ron los primeros fundamentos teóricos de la estadística infere ncia1. Sin embargo. no fue
hasta principios del siglo xx cuando especialistas en estadística como Pearson, Fisher, Gos-
seto Ncyrnan, Wald y Tukey iniciaron el desarrollo de los mét odos de inferenci a estadística .
que en la época actua l tienen una amplia aplicac ión en muchos campos.

La ln1ereDda ~cá;'Se define corno aquellos métodos que hacen ~bl~),tésti­


maci ón de una canÍcterística de una población. o la toma de una decisi ón con 'respec -
to a una población basada sólo en resultados muestrales. :' '

Para aclarar este concepto se requieren otras definiciones.

Un a población (o universo) e~: la totalidad de elementos o cosa,('quese loman en


consideración. ' ,',
.,.....',
Una muestra es la porción de la población que se, selecciona para su análisis.
Unjw'ámetro es una rriedida de resumen q~e describe una caracte rística de toda una
pobl ación . ~.•
Un estadístico es una medida de reswnen qu e se calcula para describir una caracte-
rística a partirde una soiiCmuestra de la Pob~ción: ,

Suponga que el rector de su universidad quiere realizar una encuesta y recabar la opi nión
de los estudiantes con relación a la calidad de vida en el campus. En este caso la pobla-
ción, o universo, serían todos los estudiantes que están inscrito s actualmente, mientras que
la muestra estaría integrada solamente por los estudiantes que fueron seleccionados para
partici par en el estudio. El objetivo sería describ ir las diferent es actitudes o característic as
de toda la población (los parám et ros). Esto se lograría mediante e l uso de los métodos es-
tadísticos obtenidos, a partir de la muestra de estudiantes para estimar las diferentes actitu-
des o características de interés en la población. Por tanto. un aspec to importante de la infe-
rencia estadística es usar métodos estadísticos muestrales para obtener conclusiones respecto
a los pará metros de la población.
La necesidad de uso de los métodos de inferencia esta dística se de riva de la necesidad
del muestreo. A medida que una población crece . por lo general resulta demasiado costo-
so, tardado y tedioso obtener información de toda la población. Las decision es respecto a
las carac terísticas de la población deben basarse en la información que está contenida en
una muestra de esa población. La teoría de probabilidad proporciona el vínculo al determi-
nar la posibilidad de que los resultados de la muestra reflejen los resultados de la población.

~ ¿POR QUÉ SE NECESITAN DATOS?

~ CÓMO UTILIZAR LA ESTADíSTICA: Encuesta sobre la satisfacción


de los clientes de Good Tunes
Good Tunes es una compañía de pedidos por catálogo que vende equipos de audio de alta
calidad a través de su página en Internet. Good Tunes sabe que, para tener éxito, los clientes
deben estar convencidos de que ella les proporciona un servicio excepcional y que la mer-
cancía adquirida es de la más alta calidad. Para ayudar a evaluar la percepción de los clien-
tes, en cada pedido se incluye un cuestionario sobre su satisfacción. Se pide que los clientes
regresen el cuestionario lo más pronto posible, y Good Tunes ofrece mercancía gratis o con
descuento a quienes lo hacen en menos de un mes después de efectuar su compra. Se pre-
senta un resumen de la encuesta.

• Indique cuántos días transcurrieron desde que ordenó su mercancía hasta que la reci-
bió.
• ¿Cuánto dinero (en dólares) planea gastar en equipo estereofónico en los próximos 12
meses?
• ¿Cómo califica el servicio que ofrece Good Tunes respecto a su última compra?
O Mucho mejor de lo esperado O Peor de lo esperado
O Mejor de lo esperado O Mucho peor de lo esperado
O Tal como lo esperaba
• ¿Cómo califica la calidad del equipo estereofónico que acaba de adquirir en Good
Tunes?
O Mucho mejor de lo esperado o Peor de lo esperado
O Mejor de lo esperado O Mucho peor de lo esperado
O Tal como lo esperaba
• ¿Planea adquirir más mercancía en Good Tunes durante los próximos 12 meses?
Sí_No_ •

La obtención de información apropiada es esencial para manejar un negocio. Puede pensar


que los datos son la información que le permitirá tomar una mejor decisión en una situa-
ción específica. Existen muchas situaciones en que los datos son necesarios:

• Un investigador de mercado necesita evaluar las características de los productos para


distinguir entre varios de ellos.
• Un fabricante de productos farmacéuticos debe determinar si un nuevo medicamento
es más efectivo que los medicamentos de uso común.
• Un administrador desea vigilar un proceso en forma periódica para saber si la calidad
del servicio que proporciona -o la calidad de los productos que fabrica- cumple
con los estándares de la compañía.
• Un auditor desea revisar las transacciones financieras de una compañía a fin de ave-
riguar si ésta cumple o no con los principios vigentes de contabilidad.
• Un inversionista potencial desea determinar qué compañías y cuáles industrias tienen
posibilidades de crecimiento acelerado en un periodo de recuperación económica.
• Un estudiante quiere obtener datos sobre los grupos de rack favoritos de sus compa-
ñeros para satisfacer su curiosidad.
Existen seis razone s para recopilar datos , co mo se ilu stra en el cuadro 1.1.

La encuesta de satisfacción para el cliente de Good Tu nes (en el ejemplo del uso de la
estadística) muestra las razones 1, 3,4 Y 5; por ejemplo, esta empresa recopila datos como
resultado de una encuesta; luego los analiza para medir el des empeño, evalúa los estánda-
res y ayuda a formular cursos de acció n alternativos si es necesario.
Es en extremo impo rtante empezar el análisis estadístico co n la identificación de las fuen-
tes de datos más adecuadas , Si los datos presentan sesgos , ambigüedades u otros tipos de
errores, no bastarán las metodologías más imagi nativas y elaboradas de análisis para com-
pensar tale s deficiencias.

• FUENTES DE DATOS

Existen cuatro fuentes para la recopilación de datos. seg ún se ilustra en el cuadro 1.2.
Los recopiladores de datos son fuentes primarias; los compiladores de datos se llaman
fuentes secundarias. Como se ve en el cuadro 1.2, el prim er método para obtener dato s es
consultar las fuentes gubernamentales. industriales o indi viduales . De estas tres fuentes. el
gobierno federal es el principal recopilador de datos, ya sea para fines públ icos o privados.

Mucha s oficinas gubernamentales facilitan este trabajo . El Bureau of Labo r Stat istics, en
Estados Unidos, es el responsable de la reco pilación de datos sobre empleo, así como del
estab lecimiento mensual del conocido ílld ice de Precios al Consumidor. Además del reque-
rimi ento constitucio nal para realizar un censo cada 10 años. el Bureau of the Census (ofi-
cina de censos) monitorea una amplia variedad de encuestas sobre població n, vivie nda y
manufactura. También , lleva a cabo estudios especiales sobre ciertos tema s: criminalidad,
viaj es y cuid ado de la salud.
Aparte del gobierno federal, vari as publicaciones comerciales presentan datos acerca de
grupos indu striales es pecíficos. Algunos servicio s de inve rsión como Moody' s proporcionan
datos financieros sobre compañía s. Servicios sindicalizados. como A.C. Nielscn, proporcio-
nan a sus clientes información que les permite comparar sus productos con la competencia.
Los periód icos ofrecen una amplia información numéric a respecto a estadísticas de precios.
condiciones climatológicas y de portes.
La segunda fuente para recopilar datos es la experim entación. En un experimento se ejer-
ce un control estricto sobre los tratamientos; por ejemplo, en un estudio para verificar la
efectividad de un deter gente para ropa, el investigador determinará qué marcas son más
efect ivas para limp iar ropa manchada al lavar las prend as en lugar de preguntar a los con-
sumidores cuál marca es la mej or. En general. los diseños experimentales adecuados son
temas de estudio a niveles más avan zados , pues con frecuencia involucran procedim ientos
estadísticos elaborados. Sin embargo, con el fin de desarrollar la sensibilidad para la prue-
ba y experimentaci ón, los conceptos fundamentales del diseño de experimentos se estudia-
rán en los capítulos 6 a 8.
La lercera fuente de dalas se obtiene al reali zar una encuesta. En ella no se ejerce con-
trol sobre el comportamiento de las personas que se investigan. Sólo se hacen preguntas
sobre sus creencias , actitudes, comportamiento y otras características. Las respuestas se edi-
tan, codi fican y tabulan para su análisis.
E l cuarto métod o para recop ilar datos con siste en realizar un estudio observacio nal. Un
investigador observa el co mportamie nto. de manera directa. casi siempre en el ento rno na-
tural. La mayor parte del conocimiento sobre la conduc ta de los animales se ha desa rrolla-
do de esta manera. al igual que los co nocimientos científicos en muchos campos. co mo en
astronomía y geología, donde la experi mentació n y las encue stas son impracti cables o im -
posibles.
Los estudio s observaciona les se presentan en formas muy variadas en las empresas; to-
dos están diseñados para recop ilar informació n en un medio gru pal. y ayudar en el proce-
so de toma de decisiones. Como eje mplo. el grupo focal es una herramienta bastante co-
nocida en la investigaci ón de mercado, se aplica para obtener respuestas no estructuradas
a partir de pregunt as abiertas : un moderador conduce la discu sión y todos los participantes
responden a las preguntas . Otros formatos más estruc turados . que involu cran dinámicas de
grupo para obten er información (y llegar a un consenso) incluyen varios método, de psi-
cología industrial y del comportamiento organizacional, co mo son la lluvia de ideas. la t éc-
nica Del phi y el método de grupo nomin al (véase la referencia 22). Estas herramienta s se
han popul arizado en los últimos años debido al impacto de la fi losofía de administración
de la calidad total (TQM, toral qual ítv management) en las em presas. TQM hace hincap ié
en la importancia del trabajo en equipo y el empowerment de los empleados. en un inten-
to por mejorar cada produ cto o serv icio.

COM E NTARIO: Fuentes de datos y la era de la tecnología


Gracias al amplio uso de las tecnologías de la inform aci ón, en la actualidad se tiene una gran
cantidad de infon nación y datos oport unos y precisos --que proceden de innumerables fuen-
tes- o Los códigos de barras registran, de manera automática. la información de inventario
cuando se adquieren productos en los supermercados. tiendas departamentales y otros medios.
Los cajeros automáticos hacen posibles transacciones bancarias que se reflejan de inmediato
en los saldos de las cuentas. Las oficinas de venta de boletos de avión y las agencias de via-
jes tienen información actualizada al minuto sobre el espacio disponible en vuelos y hoteles.
Tran sacciones que hace una década tomaban horas, e incluso días. hoy se realizan en cuestió n
de segundos.
El uso de la biblioteca para la investigación ha adquirido un nuevo significado. Ya no se
limita al uso de medios impresos como libros, periódicos. revistas, folletos y diarios. Con los
sistemas de información en computadoras es posible buscar y recuperar datos en forma elec-
trónica usando bases de datos en CO-RüM: navegar en la red o intercambiar mensajes por co-
rreo electrónico con otros usuarios de Internet. La expresión " visita la biblioteca" ahora incluye
las visitas electrónicas desde la casa u oficina. con la ayuda del equipo de cómputo adecuado.

Para diseñar un expe rimento. aplicar una encuesta o realizar un estudio por observaci ón, se
deben comprender los distintos tipos de datos y niveles de medició n. Para demostrar algu-
nos aspectos de la obtención de datos, analizaremos la obtención de datos en una encues-
ta. aunque muchos de ellos aparecen en otros tipos de investigación.

• TIPOS DE DATOS

Los especialistas en estadística desarrollan encuestas para manejar una amplia variedad de
fenómenos o características. llamados variables aleatorias. Los datos. que son los resulta-
dos observados de estas variables aleatorias, indudablemente serán distintos de una respues-
ta a otra.
Como se ilustra en la fi gura 1.2, existen dos tipos de variables aleatorias que se obtie-
nen con los resultados observados o datos: categóricas y numéricas.

Tipo de datos Tipo de pregunta Respue stas

Categóricas - - - - - ....~ ¿Posee actualmente Bonos de Ahorro


del Gobierno de Est ados Unidos ? Si O No O
__ _ _ ¿Cuántas suscripciones a
~ Discretas ~ revistas tiene actualmente? Número
Numé r icas~
Conti nuas -----o.~ ¿Cuál es su estat ura? Pulgadas

f,GURA 1.2 Tipos de dote s

Las variables aleatorias categóricas producen respuestas categóricas, como sí o no. Un


ejemplo es la respuesta a la pregunta: "¿ Posee actualmente Bonos de Ahorro del Gobierno
de Estados Unidos?", porque se limita a un simple sí o no. Otro eje mplo es la respuesta a
la pregunta en la encuesta de Good Tunes: "¿Planea adquirir más mercancía en Good Tu-
nes durante los próximos 12 meses?"
Las variables aleatorias numéricas producen respuestas numéricas. como la estatura en
pulgadas. Otros ejemplos son: ¿cuánto dinero planea gastar en equipo estereofónico en los
próximos 12 meses", en la encuesta de Good Tunes sobre satisfacción del cliente, o la res-
puesta a la pregunta: "¿cuántas suscripciones a revistas tiene actualmente?" Las variables
numéricas son de dos tipos: discretas y continuas.
Las variables aleatorias discretas producen respuestas numéricas que surgen de un con-
teo. "EI número de suscripciones a revistas" es un eje mplo de variable numérica discreta.
porque la respuesta es una entre un número finito de enteros. Se tienen cero, una, dos o más
suscripciones a revistas.
Las variables aleatorias continuas producen respuestas numéricas que surgen de pro-
cesos de medició n. La estatura de una persona es ejemplo de variable numérica continua
porque la respuesta toma cualquier valor en un continuo o intervalo, según la precisión del
instrumento de medición. Por ejemplo, la estatura de una persona puede ser 67 pulgadas,
67 '1. pulgadas, 67'/32 pulgadas o 67 51112,° pulgadas, dependiendo de la precisión de los ins-
trumentos que están disponibles.
En teoría, dos personas no podrían tener exactamente la misma estatura, porque cuanto
más refinado es el instrumento de medición que se utiliza, aumenta la posibilidad de detec-
tar la diferencia entre las mediciones. Sin embargo, la mayor parte de los dispositivos de
medición no tienen la precisión suficiente para detectar pequeñas diferencias. Por tan 10 , mu-
chas veces se obtienen observaciones empatadas en los datos experimentales o en encues-
tas. aun cuando la variable aleatoria es en realidad continua .
AprendizaJe de conceptos básicos
• 1.1 Suponga que en un establecimiento de co mida rápida se venden tres tipos de bebida: re-
frescos. té y café. Explique por qué el tipo de bebida que se expende es un ejem plo de
variable categórica.
1.2 Suponga que los refrescos se venden en tres tamaños en el mismo establecimiento: chico.
mediano y grande. Explique por qué el tamaño del refresco es una variable categórica.
1.3 Suponga que se quiere medir el tiempo de vuelo de un avión ---que se desplaza en tre
Nueva York y Los Ángeles- desde el despegue hasta el aterriz aje. Explique por qué el
tiempo de vuelo del avión es un ejemplo de variable numérica.

Aplicación de conceptos
• 1A Para cada una de las siguientes variables aleatorias determine si es ca tegórica o numéri ca. Si
es numérica, determi ne si el fenómeno de interés es discreto o co ntinuo.
( a) Número de teléfonos por vivienda (g) Posesión de un teléfono celular
(b) Tipo de teléfono princip al en uso (h) Número de llamadas locales por mes
(e) Número de llamadas de larga distan cia (i) Duración (en minutos) de la llamada
por mes local m ás larga por mes
(d) Duración (en minutos) de la llamada (j ) Si hay una línea telefónica co nectada a
de larga distancia más larga por mes un módem en la vivienda
(e) Color del teléfono principal en uso (k) Si hay un fax en la vivienda
(O Costo mensual (en pesos y centavos)
de las llamadas de larga distanc ia
1.5 Suponga que se ha obtenido la siguiente información en tre los est udia ntes que salían de
la librería del campus durant e la primera semana de clases:
(a) Cantidad de dinero que se utiliza para (f) Posesión de una computador a personal
adquirir libros (g) Posesión de una videocaserera
(b) Número de libros de texto que se ad- (h) Número de materias en las que se ins-
quieren cribió en el semestre actual
(c) Tiempo empleado para co mprar en la (i) Si adquirió o no. alguna prenda de
librería vestir en la librería.
(d) Especialidad académica (j) Forma de pago
(e) Hombre o mujer
Clasifique cada variable como categórica o numér ica. Si es numérica. determine si es dis-
creta o continua.
1.6 Para cada una de las variables aleatorias siguientes. determin e si es categórica o numéri-
ca. Si es numé rica. indique si el fenómeno de interés es discreto o continuo.
(a) Marca de la comp utadora (que utiliza (e) Número de perso nas que usan la
con mayo r frecuencia. en caso que computadora en la vivienda
tenga varias) ( f) Número de suscripciones a revistas de
(b) Cos to de la computadora personal comp utación
(e) Tiempo de uso de la computadora por (g) Paquete de procesador de textos que
semana usa principalmente
(d) Uso principal de la computadora (h) Indicar si la co mputadora está conecta-
da a Internet
1.7 Para cada una de las variab les aleatorias siguientes. determine si es categórica o numéri-
ca. Si es numérica. indique si el fenómeno de interés es discreto o co ntinuo.
(a) Cantidad de dinero que destinó a com- (e) Periodo más probable para la co mpra
pras de ropa dura nte el último mes de ropa (entre semana, por la noche .
(b) Número de abrigos de invierno que se en fin de semana)
tienen (f) Número de pares de guantes de invier-
(e) Tienda de depart amentos favorita no que se tiene n
(d) Tiempo que invirtió en ir de compras (g) Medio principal de transpone que se
para adquirir rop-d durante el último mes utilizó para ir a comprar ropa
1.8 Suponga que la siguiente informació n se obtuvo de la solicitud de un préstamo hipoteca-
rio que Robert Keeler entregó a la Metro County Sav ings and Loan Association:
(a) Lugar de residencia: Stony Brook. (i) Ingreso familiar anual: 66.000 dólares
Nueva York (j) Otro... ingresos: 16.000 dólares
{b) Tipo de vivienda: unifamiliar (k ) Estado civil: casado
(e) Fecha de nacimiento: 9 de abril de 1962 (1) Número de hijos: 2
(d) Pagos mensuales: 1.427 dólares (m ) Préstamo hipotecario solicitado:
(e ) Ocupación: reportero y redactor en un 120,000 dólares
periódico en) Plazo para el pago del préstamo:
(O Empresa donde labora: Dailv 30 años
Newspaper (o) Otros préstamo!'> : automóvil
(g) Antigüedad en el empleo: 14 años (p) Importe de otros préstamos:
(h) Número de empleos en los últimos JO 8.000 dólares
años: 1
Clasifique cada una de las respuestas por tipo de datos.
1.9 Una de las variables que se incluye con mayor frecuencia en las encuestas es el ingreso.
A veces la pregunta se enuncia: "¿cuál es su ingreso (en miles de dólares)?" En otras en-
cuestas, se pide lo siguiente: "marque con una X el círculo que corresponde a su nivel de
ingresos". -
O Menos de $20,000 USO O Entre $20,000 y $39,999 USO O $40,000 USO o más
(a) Explique por qué en el caso de la primera pregunta el ingreso puede considerarse dis-
creto o co ntinuo.
(b) ¿Qué tipo de pregunta usaría si realizara una encuesta? ¿Por qué?
(e) ¿Qué pregunta tiene más probabilidades de ofrecer una tasa más alta de respuesta..?
¿Por qué?
1.10 Si dos estudiantes obtienen una calificación de 90 en el mismo examen, ¿qué argumentos se
pueden usar para mostrar que la variable aleatoria --calificación de la prueba- es continua?
1.11 Suponga que el director de investigación de mercado de una gran cadena de tiendas de-
partamentales desea realizar una encuesta en el área metropolitana para determinar el
tiempo mensual que invierten en adquirir ropa las mujeres que trabajan.
(a) Describa la poblac ión y la muestra de interés, e indique el tipo de datos que el direc-
tor está interesado en recolectar.
(b ) Desarrolle un primer borrador del cuestionario requerido en el inciso (a); escriba una se-
rie de tres preguntas categóricas y tres numéricas que sean apropiadas para esta encuesta.

• TIPOS DE MÉTODOS DE MUESTREO

Como se mencionó en la sección 1.4, una muestra es la porción de la pobl ación que se selec-
ciona para el análi sis, En lugar de hacer el censo completo de una población, los proce-
dimientos de muestreo estadístico se ce ntran en un pequeño grupo representativo de la pobla-
ción más gra nde. La mu estra o btenida pro po rci o na informaci ón que se pu ed e usar para
estimar características de toda la población .
El proceso de mu estreo co mie nza co n la loc alización de las fuente s ad ecuadas de d atos.
como listados de población, directorios, planos y otras fuentes llamadas marcos. Las mues-
tras se extr aen de estos marcos. Si el marco es inadecuado debido a que ciertos grupos de
individuos o de objetos en la población no se incluyeron de manera apropiada, entonces las
muestras serán inex ac tas y sesgad as . Utilizar d iferen tes marco s pa ra gene rar d atos pu ed e
llevar a conclusiones opuestas. como se ilustra en el ej emplo 1.1.

gémp(,:f:" ~l~ tIir~;fk;lt':liiJ~lil'tiolr7i¡'Ó~fies ttW~f,{lit~" (::;i~~,.::.


~ ,_" ". ~.', ," "' " ~) ' iWIII<;;¡;:"" :;;" ' '' ' ~'l.!' ;'''>' . "í!7;''' ~:. ,,,,,; ,,,,, 'f,< ;,kO.~ . ~~c;;¡,(¡:;'"t:!lo: ,~ , "';¡;;, ; : ; ; ' , ' ~ " . '· " r± .;. ~" , ~ 0&0,:j¡i ~ , . :~::;:" : ' . ): : J;; ' ':' - "j i '

Considere el siguiente titular de un periódico que circuló en los suburbios de Nueva York
en la década de los ochenta: "Error en el conteo de habitantes: ¿Es Suffolk más populoso
que Nassau? LILC O y la Oficina de Censos están en desacuerdo" (Newsday , 25 de abril de
1988). Según los datos de la encuesta en Suffolk, el jefe de estado del condado de S uffolk
consideró que su poblado era el más habitado mientras que su homólogo del condado de
Nassau no estuvo de acuerdo y citó sus propios datos de encues ta. ¿Quién tenía la razón?
SOL UCIÓN
Las diferencias entre ambas estimaciones provienen del hecho de que la Oficina de Censos
(Bureau of Census) y la Long Island Lighting Co mpany (LILCO) utilizaron marcos y fórmu-
las diferente s para calcular la población de ambo s condados. La Bureau of Census utilizó
las tasas de nacimientos y decesos, los patrones de migración que muestran las decl aracio-
nes del impuesto sobre la renta, y una fórmula demográfica que estim a que el número pro-
medio de personas por vivienda ha disminuido en los últimos años. Para su encuesta. la
empresa LILCO usó el número anual de medidores de electricidad y gas, los perm isos de
construcción y un factor para calcular el número de habitantes en cada casa.

Hay tres razones principales para obte ner una mue stra, como se describe en el cuadro 1.3.

'-'¡. . . .--.., ============================---,


_,' ;,' ,.. :'" ' ~ ~j;:~ ",' :: : ~ ' ~~ :' I ' ~: : S:'~ : k : ,': t~:r';';:: ,'1, , : "I,t:I':;\~~' :
. '.i ' Cu~'Í:'f ;3 ,c ·i tiZOll l . panr ' .

-~~~~~.~
Como se describe en la figura 1.3, existen dos tipos básicos de muestras: la no probabi-
lística y la probabilística.
. ,-~, , . ~;;'~ ,~ " ,'_ : . ~ ~I ).; -- ~;" ,,,-;~ ,x::,~,>-, > .'': " "',:. " ':' - :-;:", .,;- ' .Óc. , '-

En una muestrallQ,pro6ilbilístlca los elementos o los .individuosincluidtlS se eligen


sin lOtllaf en ,roelítasu probabilidad de oC~ncia.. . . . , c ' . :[';: ..

Como las muestras no probabilísticas eligen a sus participantes sin co noce r sus probabili-
dades de selección (y en algunos casos los participantes se autoseleccionan ), no se puede
aplicar la teoría que se desarrolló para el mue streo probabilístico. Muchas comp añías rea-
lizan encue stas dando a los visitantes de su página de Internet la oportunidad de llenar for-
mas de e ncuestas y entregarlas en forma de una respuesta electrónica. La respuesta a estas
encuestas puede proporcionar grandes cantidade s de datos en poco tiempo, pero la muestra
se co mpone de usuarios de Internet que son seleccionados en forma automática. Para mu-
chos estudios sólo se dispone de una muestra no probabilística como una muestra subjeti-
va. En estos casos . la opinión de un e xperto en la materia es crucial para poder usar los re-
sultados obtenidos y realizar cambios en un proceso. Otros procedimientos co munes de
muestreo no probabilístico son el muestreo por cuotas y el muestreo por grupos naturales;
éstos se analizan co n detalle en libros especializados en métodos de muestreo (vé ase las re-
ferencias 1, 3 y 9).
Las muestras no probabilísticas tienen algunas ventajas co mo son co nveniencia. rapidez
y bajo costo. Por otro lado. dos desventajas important es falta de precisión debido al sesgo
en la selección y falta de capacidad para generalizar los resultados superan con mucho a
las ventajas. En consec uencia. el uso de los métodos de mues treo no probabilístico se res-
tringirá a situaciones en las que sólo se dese a obtener aproximaciones de bajo cos to para
satisfacer la curiosidad acerca de un terna específico. o en estudios iniciales de pequeña es-
cala o estudios piloto que precederán a inves tigaciones más rigurosas.
El muestreo probabilístico deberá usarse siempre que sea posible. porque es el único mé-
todo que permite hacer inferencias estadísticas correctas a partir de una muestra.
,~,;~( , ,~ "=,,¡,:. >:.:: ' ~::- ;, ~ ~ '~E· , ..·.. '~ ~ ~,,:~t<:- ';...,o ~~ ·-J'i;~;~ · '':li~;''';';'~L~ ,: tt:;;;

.~III\!!. ~~ P~~ suJe~~·, . 13... .~ ~ijJ¡;~fE~~ ~,P


;:~': ~l~!'!M,,:~'~.~ ' ~ " ~ .-.~.~ ~',:~~~~~, ~!'"j--,-~": ~(;~4:r h_fi ~~~~}~~!i·., ~}1 ¡~~~· .' ;:i~~~>
Tipos de muestras utilizadas

,_ _ 1

Muestras no probabilísticas M uestras probabilíst icas

.--¡----,.
M uestra
subjetiva
M uestra
por cuota
Mu estra
por grupos
Mu estra
aleatoria
Mu estra Muestra Muestra
siste mática estratificada conglomerada
naturales simple

FIGUIlA '.3 Tipos de muestra.

Los cuatro tipos de muestras probabilísticas que se utilizan co n mayor frec uencia son las
muestras aleatoria simple, sistemática , estratificada y conglomerada. Estos métodos de mues-
treo varían en tre sí por su costo, precisión y complejid ad. A con tinuación se analizan estos
tipos de muestras.

Muestra aleatoria simple


Una muestra alea tor ia simple es aquella e n la cual cada individuo o elemen to de una po-
blación tiene la misma oportunidad de ser ele gido. Además, cada muestra de un tamaño fi-
jo tiene la misma probabilid ad de ser elegida que cualquier otra muestra del mismo tama-
ño . El muestreo aleato rio simple es la técn ica de muestreo aleato rio más ele me ntal y
co nstituye la base para las otras técn icas.
En el muestreo aleatorio simple se usa 11 para represen tar el tamaño de la muestra y N pa-
ra el tamaño de la pob lación . Cada persona o elemento en el marco se numera de I a N.
La pro babilida d de seleccionar a cualqu ier miembro en panicular de la pob lación la prime-
ra vez es 11N.
Existe n dos métodos básicos para seleccionar muestras: con reem plazo y sin reemplazo .
El mu estreo con reemplazo implica que una vez seleccionada una persona o elemento.
se regresa al marco, don de tiene la mism a probabilidad de ser elegida de nue vo. Imagine
una urna con 100 tarjeta s de presentación . Suponga que en el primer sorteo se selecc iona
el nomb re de Jud y Craven. La informac i ón pert inente se registra y se regresa la tarjeta a la
urna. Después se mezclan bien las tarj etas y se saca la segunda. En est a segunda extrac-
ción, Jud y Craven tiene la misma probabilid ad, l /N, de se r ele gida de nue vo . Se repite el
procedimiento hasta alcanzar el tamaño muestral n deseado. Si n embargo. suele co nsiderar-
se más adec uado tener una muestra de personas o eleme ntos diferentes en lugar de per mi-
tir la repe tición de med iciones de la misma persona o elemento.
En el muestreo sin reemplazo no se regresa la persona o elemento al marco un a vez
seleccionado y. por 10 tanto , no pued e elegirse otra vez. Como antes, en el muestreo sin
ree mplazo la prob abilida d que algún miembro específico de la pob lación. por ejemplo Judy
Craven, sea elegido en el primer sorteo es l/N. La probabilidad de que cualquier ind ividuo,
no seleccionado , salga en la segunda extracción es ahora 1 entre N - 1. Este proceso con -
tinúa hasta alc anza r el tamaño rl deseado de la muestra.
Si n importar si el muestreo es con O sin ree mplazo , los métodos " de urna" para elegir
una muestra tienen un gran inconveniente: la habilidad para revolver perfectamente las tar-
jetas y elegir la muestra en forma aleatoria. Com o resultado, los métodos de urna no son
muy útiles. Son preferible s otros métodos de selección co n menos problemas y mejor ba-
se cien tífica.
Uno de estos métodos utiliza una tabla de números aleatorios (véase la tabla E.l en el
apénd ice E) para obtener la muestra. Una tabla de números aleatorios está formada por una
serie de dígitos que se generan en fonna aleatoria y se colocan en la sec uencia en que se
generaro n (véase las refe rencias 9 y 21). Como el sistema numérico usa \O dígi tos (O. 1.
2. . . .. 9). la probabilid ad de generar aleatoria mente un dígit o es igual a la proba bilidad de
generar cualquier otro. Esta probabil idad es 1 de 10. Por lo tanto. si se genera una secuen-
cia de 800 dígitos. se espera qoe ce rca de 80 de ellos sean el dígito O. 80 el d ígito l . etc.
De hecho, lo normal es que los investigad ores que utilizan tablas de números aleatorios ve-
rifiquen la aleatoriedad de los dígi tos generad os antes de emplearlos. La tabla E. l cumple
con los criterios de aleatoriedad. Debido a qoe cada dígito o secuencia de dígitos en la ta-
bla es aleatorio. se poede leer en sentido boriz ontal o vertical. Los márgen es de la tabla
muestran núme ros de renglón y columna. Los dígitos se agrupan en secuen cias de cinc o
para facilitar la lectu ra.
Para usar una tabla como esta en lugar de una urna para seleccio nar una muestra. prime-
ro se asignan los números de código a los miembros individu ales de la población. Entonces
se obtiene la muestra aleatoria leyendo la tabla y seleccionando los elementos del marco de
població n cuyos números de código co inciden con los dígitos encontrados en la labia . Para
comprender mejor el proceso de selecció n de una muestra. co nsidere el ejemplo 1.2.

Suponga que una co mpañía desea seleccio nar un tamaño de muestra de 31 trabaj adores de
tiempo co mpleto entre una població n de 800 empleados de tiempo completo. para obtener
información sobre los gastos del plan de cuidados dentales que patrocin a la compañía. Se
supone que no todos los empleados estará n dispuestos a respond er la encuesta. por lo que
deben enviarse más de 32 cue stionarios para obtener las 32 respuestas deseadas. Asumien-
do que 8 de \O trabaj adores de tiempo completo responderán la encuesta <es decir. una ta-
sa de respuesta de 80%) . se requ iere un total de 40 empleados para obtener las 32 respues-
tas. Por consiguiente, se enviará la encuesta a 40 empleados de tiempo completo. elegidos
de los archivos de personal de la compañía. ¿Cómo se obtendrá. de hecho, la muestra alea-
tori a simple?

SOL UCIÓN
Para seleccionar la muestra al azar. se usa una tabla de números aleatorios. El marco de po-
blación consiste en una lista de los nombre s y su número de buzón en la compañía (de los
N = 800 empl ead os de tiempo completo) que se obtienen de los ex pedientes de personal.
Como el tamaño de la població n (800) es un número con tres dígitos. cada número de có-
digo asignado tambi én debe co ntener tres dígitos. para que todos los empl eados de tiempo
completo tengan la misma probabilidad de ser seleccionados. Entonces, se asigna el códi-
go 00 1 al primer empl eado de tiempo completo en la lista de población. el código 002 al
segundo empleado de tiempo completo. etc .. hasta asignar el código 800 al enésimo em-
pleado en la lista de población . Debid o a que N = 800 es el valor de código más grande
posible. se descartan todos los cód igos de Ires dígitos mayores que N <es decir. 80 1 a 999
y 000).
Para seleccio nar la muestra aleatoria simple. se elige al azar un punto de partida en la
labia de núme ros aleatorios. Un método con siste en cerrar los ojos y señalar números de
la tabla en forma aleatoria con un lápiz. Suponga que con este procedimiento el punto de
partida seleccionado es el renglón 06 y la columna 05 de la tabla 1.1 en la página 16 (que
es una réplica de la tabla E.l). Aunque la tabl a se puede leer en cualquier dire cción. su-
pong a que se toman secuencias de tres dígitos de derecha a izquierda sin saltarse números.
La persona que tiene el número de código 003 es el primer empleado de tiempo com-
pleto en la muestra (renglón 06 y columnas 05 a 07), el segundo individuo corresponde al
código 364 (renglón 06 y columnas 08 a 10), y el tercero al código 884. Como el número
de código más alto para cualquier empleado es 800, éste se descarta. Del tercer al décimo
miembro de la muestra serán los empleados con números de código respectivos 720, 433 ,
463, 363. 109, 592, 470 Y 705.
El proceso de selección continúa en fonna similar hasta obtener la muestra requerida de
40 empleados de tiempo compl eto. Durante este proceso, si se rep ite cualquier secuencia
de código de tres dígitos. el empleado que corresponde a esa secuencia de código se inclu-
ye de nuevo como parte de la muestra si se trata de un muestreo con reemplazo; sin em-
bargo. la secuencia de códigos repetidos se descarta si se tiene un muestreo sin ree mplazo.
,;~, ;. ~: "" :(;~-~ 1:'"" ...,.,..~,r~~Xt';i~ ,\;~"':' ''~ (' ~,,) -.:~ : :~J;:;r:~' , ,. .>" '~' f:.:' :; ')_ ; ~- ,,:,,~ - -

• Muestra sistemática En una muestra sistemática. se dividen N individuos O elemen-


tos del marco de población en k grupos, dividiendo el tamaño de la población N entre el
tamaño de la muestra deseado n. Es decir,
N
k=-
n
donde k se redondea al entero más cercano. Para obtener una muestra sistemática. el pri-
mer individuo o elemento se selecciona al azar entre los k individuos o elementos del primer
grupo del marco de población y, para el resto de la muestra. se elige un individuo o ele-
mento cada k en la lista completa de la población.
Cuando el marco de población consiste en listas de cheques numerados, notas de venta
o facturas, listas de miembros de un club. el registro de estudiantes inscritos, o a tal vez
un número predeterm inado de artículos consecutivos que salen de una línea de ensamble.
es más rápido y fácil obtener una muestra sistemática que una muestra aleatoria simple. En
estas situaciones la muestra sistemática es un mecanismo conveniente para obtener Jos da-
tos deseados.
Aunque su aplicación es más sencilla, en general, los métodos de muestreo aleatorio sim-
ple y de muestreo sistemático son menos eficientes que otros métodos de muestreo proba-
bilístico más elaborados. Es decir, para cualquier muestra que se adquiere mediante mues-
treo aleatorio simple o muestreo sistemático. los datos obtenidos pueden o no ser una buena
representación de las características fundamentales (parámetros) de la población. Aunque la
mayor parte de las muestras aleatorias simples son representativas de la población corres-
pondiente. no es posible saber si una muestra en particular es. de hecho. representativa.
Se presentan posibilidades todavía mayores de un sesgo en la selección y una falta de
representatividad de las características de la población en el muestreo sistemático. Si exis-
tiera un patrón en el listado del marco de población. podrían ocurrir errores de selección
importantes. Para evitar el problema potencial de la representación desproporcionada de gru-
pos específicos en una muestra, se pueden usar los métodos de muestreo estratificado o de
muestreo conglomerado.

• Muestra estratificada En una muestra estratificada, primero se dividen los N indivi-


duos o elementos de la población en subpoblaciones separadas. o estratos. de acuerdo con
alguna característica común. Se realiza un muestreo aleatorio simple en cada estrato y des-
pués se combinan los resultados de las muestras aleatorias separadas. Estos métodos de
muestreo son más eficientes que el muestreo aleatorio simple o el sistemático, porque ga-
rantizan la representación de individuos o elementos de toda la población. lo que asegura
una mayor precisión en las estimaciones de los parámetros poblacionales fundamentales .
Lo que proporciona la precisión. una vez combinados los estratos. es la homogeneidad de
individuos o elementos dentro de cada estrato.
Tabla l.l Uso de /lila tabla de números aleatorios
COL UMNA
00000 00001 11111 11112 22222 22223 33333 33334
RENGLÓN 12345 67890 12345 67890 12345 67890 12345 67890
01 49280 88924 35779 00283 81163 07275 89863 02348
02 6 1870 4 1657 07468 08612 98083 97349 20775 45091
03 43898 65923 25078 86129 78496 97653 91550 08078
04 62993 93912 30454 84598 56095 20664 12872 64647
05 33850 58555 51438 85507 71865 79488 76783 31708
Inicio de la 06 97340 03364 88472 04334 63919 36394 11095 92470
selección 07 70543 29776 10087 10072 55980 64688 68239 20461
-
(renglón 06, 08 89382 93809 00796 95945 34\01 81277 66090 88872
col umn a 05 ) 09 37818 72142 67140 50785 22380 16703 53362 44940
\O 60430 22834 14130 96593 23298 56203 92671 15925
11 82975 66158 84731 19436 55790 69229 28661 13675
12 39087 71938 40355 54324 08401 26299 49420 59208
13 55700 24586 93247 32596 11865 63397 44251 43189
14 14756 23997 78643 75912 83832 32768 18928 57070
15 32166 53251 70654 92827 63491 04233 33825 69662
16 23236 73751 31888 81718 06546 83246 47651 04877
17 45794 26926 15130 82455 78305 55058 52551 47182
18 09893 20505 14225 68514 46427 56788 % 297 78822
19 54382 74598 91499 14523 68479 27686 46 162 83554
20 94750 89923 37089 20048 80336 94598 26940 36858
21 70297 34135 53140 33340 42050 82341 441 04 82949
22 85157 47954 32979 26575 57600 40881 12250 73742
23 11100 02340 12860 74697 96644 89439 28707 25815
24 36871 50775 30592 57143 1738 1 68856 25853 35041
25 23913 48357 63308 16090 51690 54607 72407 55538

Fuente: Rep roducción parcia! de The Rand Corporation. A Million Random Digits with 100 ,000 Normal Deviates (G íencoe, JL: The Free Press,
1955 ); presentada en la tabla E./ del apéndice E al final del libro.

• Mues tra conglomerada En una mu estra conglomerada, se dividen los N individuo s


o elementos de la población en varios conglomerados. de manera que cada conglomerado
sea representativo de la población completa. Después, se obtiene una muestra aleatoria de
los conglomerados y se estudian todos los individuos o elementos dentro de cada cong lome-
rado seleccionado. Los conglomerados pueden ser asignaciones naturales. como condados.
distritos electorales. manzanas. edificios de departamentos o familias.
Los métodos de muestreo conglomerado pueden ser más eficientes (con relación a sus
costos) que los métodos de muestreo aleatorio simple, sobre todo si la población en cues-
tión se encuentra esparcida en una vasta región geográfica. Sin embargo, los métodos de
muestreo conglomerado tienden a ser menos eficientes que los métodos de muestreo alea-
torio simple o de muestreo estratificado. y necesitan una muestra total más grande para obte-
ner resultados tan precisos como los que se obtienen con los procedimientos más eficientes.
Se pueden encontrar análisis detallados de los procedimientos de muestreo sistemático,
estratificado y conglomerado en las referencias 3 y 9,
Problemas para la sección 1.8
AprendizaJe de conceptos básicos
t . 12 Par a un a población que con tiene N = 902 indivi duos, ¿qué número de código asi gnaría us
too en los siguientes casos?:
(a) la prim era persona de la lista.
(b) la persona número 40 de la lista.
(e) la última persona de la lista.
1. t 3 Para una pobla ción de N = 90 2, verifique que al com enzar en el renglón cinco de la ta-
bla de número s aleatorios (labia E. I), só lo se necesitan seis renglones para obtener una
muestra de tam año n = 60 sin reem plazo .
• 1.14 Dada una población de N = 93. inicie en el renglón 29 de la tabla de números aleatorios
(tabla E.l ) y lea a travé s del rengló n para ex traer una muestra de tam año n = 15
(a) .sin reemplazo .
(b) con reem plazo.

Aplicación de conceptos
1.15 Para un estudio q ue inclu ye entrevistas personales a los participant es (en lugar de enc ues-
tas por correo o por teléfo no) explique por qué una mues tra alea toria simple puede ser
menos prácti ca que otros mé todos.
1.16 Supong a que se desea selecc io nar una mue stra aleatori a simple de tamaño I de una po-
blación de tres art ícu los (A, B Y e). La regla para ext raer la mues tra es: se lanz a una
moneda ; si sale cara , se elige el artíc ulo A; si sale cruz. se lanza la moneda de nuevo:
esta vez, si es ca ra. se elige B; si es cruz. se elige C. Explique por qué se trata de una
muestra alea toria. pero no de una muestra aleato ria simple.
e
t. t 1 Suponga que una població n tiene cuatro elementos (A , S, y D ). Se desea obtener una
mue stra aleatoria de tamaño 2 y se decid e hacerlo de la siguiente manera; se lanza
una moneda ; si sale cara. la muestra serán los elementos A y B; si sale cruz, la muestra
serán los eleme ntos C y D . Aunque se trata de una muestra alea toria. no es una
muestra aleatoria simple. Expl ique por qué. (Si real izó el prob lema 1.16. compare el pro-
cedim ient o descri to en él con el procedimiento que se describe en este problema.)
• 1.18 Suponga que se pide al secretari o administrativo de una universidad con una pob lación
de N = 4.000 estudiantes (de tiempo completo) que rea lice una encuesta pa ra med ir la
satisfacción respecto a la calidad de vida en el cam pus. La siguiente tabla con tiene una
clasificación de los 4.000 estudiantes de tiempo co mpleto insc ritos po r sexo y año q ue
cursan.
Aso C UR SADO
l ER 20 3ER 40
SEXO A ÑO AÑ O AÑO AÑO T OTAL

Mujer 700 520 500 480 2,200


Hombre 560 460 400 380 1,800
Tota l 1,260 980 900 860 4,000

El secretario adm inistrativo se propone lomar una mue stra probabilística de n == 200 estu -
diantes y proyec tar los result ados a tod a la poblac ión de es tud iantes de tiempo co mpleto.
(a) Si el marco de po blación d ispon ible en los expediente s escolares es un listado
alfabé tico de los nombres los N = 4,00 0 estudiantes de tiem po com pleto inscritos,
¿qué tipo de muestra podría extraerse? Justifique su respuesta.
(b) ¿C uál seria la ventaj a de seleccionar una mue stra aleatoria simp le en el inciso (a)?
(c) ¿C uál sería la ventaja de se leccionar una muestra sistemática en el inciso (a )?
(d ) Si el marco de pob lación disponible en los expedien tes es un listado de no mbre s de
los N = 4.000 estudiantes de tiempo com pleto inscritos. recop ilados en ocho listas
alfabéticas separadas. segú n el sexo y año que cu rsan, como se muestra en la labia
ante rior. ¿q ué tipo de muestra deberá em plearse? Justifique su respu esta .
(e) Suponga que los N = 4,000 estudiantes de tiempo completo inscritos viven en uno
de los 20 dormitorios del campus. Cada dormitorio consta de cuatro pisos con 50
camas por piso. lo que significa 200 estudiantes. La política del colegio es integrar a
los estudiantes por sexo y año que cursan en cada piso de dormitorios. Si el director
administrativo pudiera recopilar un marco de población con los listados de los estu-
diantes que ocupan cada piso de dormitorio, ¿qué tipo de muestra deberá emplear?
Justifique su respuesta.
1.19 Una bitácora de ventas contiene copias foliadas de las facturas. Los folios van de 000 I a
5000.
(a) Inicie en el renglón 16, columna l. y proceda por renglón en la tabla E.I, para se-
leccionar una muestra aleatoria simple de 50 folios de facturas.
(b) Seleccione una muestra sistemática de 50 números de facturas. Use los números alea-
torios en el renglón 20. columnas cinco a siete, como punto inicial de su selección.
(e) ¿Las facturas elegidas en el inciso (a) son las mismas que las elegidas en el inciso
(b)? ¿Por qué sí o por qué no?
1.20 Suponga que 5,000 facturas de ventas están separadas en cuatro estratos. El estrato 1
contiene 50 facturas; el estrato 2, 500 facturas; el 3, 1,000 Y el 4, 3,450 facturas. Deben
seleccionarse todas las facturas del estrato 1, y 50 de cada uno de los demás estratos.
(a) ¿Qué tipo de muestreo deberá realizarse? ¿Por qué?
(b) Explique cómo realizaría el muestreo de acuerdo con el método descrito en el inciso (a).
(e) ¿Por qué el tipo de muestreo en el inciso (a) no es una muestra aleatoria simple?

~ EVALUACiÓN DEL VALOR DE UNA ENCUESTA


Prácticamente todos los días se oye o se lee acerca de resultado s de encuesta s o escrutinios
en periódicos. Internet. en la radi o o televisión. Es evidente que los avances en la tecnolo-
gía de la comunicación han provocado la proliferación de las inves tigaciones por medio de
encue stas. Sin e mbargo. no todas son ace ptables. significativas o importantes (véase la re-
ferencia 2).
Para evitar encuestas caren tes de objetividad o credib ilidad, debe evaluarse co n sentido crí-
tico todo lo que se lee y escucha, además , debe examinarse el valor de la encuesta. En pri-
mer lugar, se evalúa el propósito de la encuesta. por qué y para quién se realiza. Un escruti-
nio de opinión o una encuesta realizados para satisfacer la curios idad pertenece a la esfera de
la diversión . Su resultado es un fin en sí mismo, no un medio para lograr un fin. Debe exis-
tir escepticismo an te tales encuesta s porque el resultado no tiene una aplicaci ón posterior.
El segundo paso para evaluar el valor de una e ncuesta es determi nar si está basada en
una muestra probabilística o no probabilística (como se ob servó en la secci ón 1.8). Recuer-
de que el único medio disponible para hacer inferencia s estadísticas correctas a partir de
una m uestra es el uso de una muestra probabilística. Las encuestas que emplean métodos
de mue streo no probabilístico están sujetas a errores importante s, quizá no intencio nales, que
pueden generar resultados sin sentido, como se ilustra en el siguiente comentario,

COMENTA RIO: V I/ muestreo l/O probabilístico desastroso


En 1948, los encuestado res más importantes predijeron el resultado de la elección presidencial
en Estados Unidos entre Harry S. Trumao, entonces presidente, y Thomas E. Dewey, gober-
nador de Nueva York. como favorable para Dewey. El periódico Chicago Tríbune confió tan-
to en las predicciones de las elecciones que se basó en ellas para imprimir su edición matuti-
na sin esperar el conteo de las urnas.
Su predicción estaba equivocada, el periódico y los encuestadores en quienes había confia-
do, muy apenados, tuvieron que dar muchas explicaciones. ¿Cómo pudieron equivocarse tan-
lo los encuestadores? En el intento por descubrir la causa del error, los encuestadores encon-
traron que la culpa recaía en el uso de un método de muestreo no probabil ístico (véase la
referencia 17). En consecuencia. las organizaciones de encuestas adoptaron los métodos de
muestreo probab ilístico en elecciones posteriore s.
Errores en las encuestas
Aun cuando en las encuestas se utilizan métod os de muestreo probabilístico. están sujetas a
errores potenciales. Como se ilustra en el cuadro 1.4. hay cuatro tipos de errores de encues-
ta (véase referencia 8). Con las encuestas correcta. se diseñan modelos para reducir o dismi-
nuir los diferentes errores de las encuestas, los cuales suelen tener un costo considerable.

• Error de cobertura La clave para una selección apropiada en la muestra es un marco


de pobla ción adecuado o una lista actualizada. de todos los sujetos que participarán en el
muestreo. El error de cobertura ocurre si se exclu yen ciertos grupo s de sujetos de las lis-
tas de población, de manera que no tienen oportunidad de ser seleccionados en la muestra.
El error de cobe rtura conduce a un sesgo de selecci ón . Si el listado es inadecuado porque
no se incluyeron algunos grupos o sujetos de la població n. cualquier muestra probabilísti-
ca aleato ria proporcionará una estimació n de las características del marco, no de la pobla -
ción real. El sig ui ente comentario es un caso cél eb re de sesgo de se lección .

C OMEN TARIO: Un caso de sesgo de selección


En 1936. la revista U/erar)" Digest predijo que el gobe rnador Alf Landon de Kansas recibiría
57% de los votos y derrotaría e n forma abrumadora la ambici ón del presidente FrankJin D.
Roo sevel t de reelegi rse. Sin embargo , Landon fue derrotado, ya que sólo recibió 38% de los
votos. El error co metido por una revista respec to a una encuesta importante no tenía prece-
dentes. Como resultado. la predicción acabó con la credibilidad de la revista ante el púb lico,
y la llevó a la quiebra.
Los encuestadores de Literary Digest pensaron que habían hecho todo bien. Habían basa-
do su predicción en un tamaño de muestra muy grande. 2.4 millones de encuestados, de una
encuesta enviada a 10 millones de votantes registrados, ¿Qué salió mal? Hay dos respuestas:
sesgo de selección y sesgo de no respuesta.
Para com prender el papel del sesgo de selecció n. debemos analizar algunos antecedentes
históricos. En 1936, Estados Unidos sufría todav ía por la Gra n Depresión. Sin tomar en cuen-
la esto. la Literary D ígest recopiló su marco de población a partir de fuentes como directorios
telefónicos, listas de miemb ros de clubes, suscriptores a revistas y registros de automóviles
(referencia 6). Sin darse cuenta eligieron un marco de població n compue sto por gente rica. y
excluy eron a la mayoría de la población votante que. durante la Gran Depresión. no pod ía pa-
gar un teléfono, la membresfa de un club. suscripciones a revistas o adquirir un automóvil.
Asf, la estimación de 57% de votos para Landon pudo haber estado muy cercana al marco. no
así a la población real .
El sesgo de no respuesta ocurrió cuando la muestra de 10 millones de volantes registrad os
produjo solamente 2.4 millones de respuestas. Una tasa de respuesta de sólo 24% es demasia-
do baja para producir estimaciones precisas de los parámetros de población sin algún meca-
nismo que garantice que los 7.6 millones de individuos que no respondie ron tenfan una opi-
nión similar. Sin embargo, el problema del sesgo de no respuesta fue secundario con relación
al problema del sesgo de selecció n. Aun cuando los 10 millones de votante s registrados en la
muestra hubieran respondido, no se habría compen sado el hecho de que la com posición del
marco te nía diferencias tan sustanciales con respecto a la población votante real.

• Error de no respuesta No tod as las person as están dispuestas a contestar un a encues-


ta. De hecho , la in ve sti gaci ón indica que lo s individu o s d e las cl ases económicas alta y ba -
ja tienden a responder con menos frecuencia que los individuos de clase media. El error
de no respuesta surge del fracaso al recopilar datos de todos los sujetos de la muestra y
el resultado es un sesgo de no re spuesta. Como en general. no se puede suponer que las
personas que no responden son semejantes a aquellas que sí responden, es en extremo im-
portante dar seguimiento a las no respuestas des pués de un periodo espec ífico. Deberán ha-
cerse varios intentos. ya sea por co rreo o telé fono. para co nvencerlos y que cambien de opi-
nión . Con base en estos resultados, las estimaciones obtenidas con las respuestas inici ales
se co mbinan con las estimaci one s obte nidas con el seguimiento. de manera que las inferen-
cias hechas a partir de la encuesta sean válidas (referencia 1).
El modo de respuesta afecta la tasa de respuesta. La entrevista personal y por teléfono
casi siem pre produce una respuesta más alta que la encuesta por correo -pero a un costo
más elevado-. El co mentario en la Litera ry Digest sobre el escruti nio de 1936 página 19
también hace referencia a un sesgo de no respuesta.
• Error de muestreo Existen tres razo nes principale s para extraer una muestra en lugar
de realiz ar un censo completo: es más rápido, menos costoso y más efici ente . Sin embargo,
en el marco de población. el azar determina quién estará (o quién no estará) incluido. El
error de muestreo refleja la heterogeneidad, o las "diferencias aleatorias", de una muestra
a otra según la probabilidad de que individuos o elementos espe cíficos sean seleccionados
en unas muestras determ inadas.
Cuando se observan los re sultados de so ndeos O enc uestas en periódicos y revistas. a
menudo se hacen afirmac iones respecto al margen de error o prec isión: por eje mplo. Use
espera que los resultados de este escrutinio estén entre ±4 puntos porcentuales del valor
real". Este margen de error es e l e rror de mue streo . Este error se puede reduci r con tama-
ños de mue stras más grandes, aunque esto incrementará el cos to de la encuesta.
• Error de medición Cuando se quiere realizar una buena investigación por medio de
e ncuestas. se dise ña un cuestionario que permita reu nir infonnación importante. Los datos
obtenidos debe n ser válidos; es decir. las respuestas "correctas" deben ser ev aluadas y plan-
tearse de manera que arrojen medidas significativas.
Pero exi ste un dilema, es más fácil decir que se obtie nen mediciones sig nificativas que
el simple hecho de obten erlas. Considere el siguiente proverbio:
Un hombre con un reloj siempre sabe qué hora es,'
Un hombre con dos reloj es siemp re trata de determinar cuál tiene la hora exacta;
Un hombre con /0 relojes siempre recuerda la dificultad que implica medir el tiempo.
Por desgracia. la realización de mediciones está gobernada por lo que es conveniente, no
por lo que se nece sita. Co n bastante frecuencia. las mediciones que se obtienen son so la-
mente una aproximación de las medicione s que se de sean en realidad.

Se le ha dado mucha atención al error de medición que oc urre por fallas de redacció n en
el enunciado de las pregun tas (referencia 7). Una preg unta debe ser clara. no ambigua. De-
be presentarse en forma objetiva y neutral; se deben evitar las "preguntas guiadas".
Existen tres fuentes de errores en la medición: redacció n ambigua de las preguntas. efec-
to de halo y errores de la persona que contesta. Co mo ej emplo de ambigüedad en la redac-
ción. en noviem bre de 1993 el Departamento de Trabajo [Labor Depanmen ú de estados
Unidos informó que la tasa de dese mpleo se había subestimado durante más de una déca-
da debido a fallas en la redacción de las preguntas en la Encuesta de Población Actual [Cu-
rrent Population Survey) . En particular. esta falla provocó que se minimizara la prese ncia
de las mujeres en la fuerza laboral. Como la tasa de desempleo está ligada a los programas
de beneficio social, como los sistemas estatales de compen sación por desem pleo. era impe-
rativo que los investigadores del gobierno rectificaran la situación con ajustes a) co ntenido
de las preguntas.
El "efecto de halo" se presenta cuando la persona que responde se siente obligada a com-
placer al entrevi stador. Este tipo de error puede minimizarse con la capacitación adecuada
en la realización de entrevistas.
El error que proviene de la perso na que responde se produce cuando ésta reali za un es-
fuerzo dema siado grand e o demasiad o pequeño. Existen dos form as para minimi zar esta
clase de error: (1) mediante una revisión cuidadosa de los datos y un nuevo llamado a aque-
llos individuo s cuyas respuestas parecen raras y (2) al establ ecer un programa de llamada s
aleatorias para verificar la con fiabilid ad de las respue stas.
Aspectos éticos
Respecto a la proliferación de investigaciones que se apoyan en encuestas (referencia 2),
Eric Miller , editor del boletín de noticias Research Alert, afirmó que " ha habido una lenta
pérdida de ética. Lo que preocupa es que las person as toman decisiones con base a lo que
se publica. Puede que se trate de un crimen invisible. pero si existen víctimas". No todas
las investigaciones so n buenas, significativas o important es, y no todas so n éticas . Debe in-
tentarse distingui r entre un diseño de encuesta deficiente y un diseño carente de ética.
Las consideraciones éticas surgen con relaci ón a cuatro tipos de errores poten ciales que
pueden ocurrir cuando se diseñan encue stas que utilizan mue stras probabilísticas aleatoria s:
error de cobert ura o sesgo de selecció n. error o sesgo de no respuesta, error de mue streo
y error de medición. El error de cobertura o sesgo de selección se convierte en un proble-
ma ético sólo si se excluyen a propósito grupos específicos de individuos del marco de po-
blación, para obtener resultados sesgados, que indican una posición más favorable para el
patrocinador de la encuesta.
De igual manera, el error o sesgo de no respuesta se convi erte en un problema ético so-
lo si es menos probabl e que grupos o individuos específicos respond an a un formato de en-
cuesta dado y si e) patr ocinador diseña a propósito la encuesta, con el fin de excluir a eso
grupos o individuos. El error de muestreo se convierte en un problema ét ico sólo cuando
los resultados se presentan, a propó sito, sin referencia al tamaño de muestra o al margen
de error, de modo que el patrocinador puede promov er un punto de vista que de otra ma-
nera sería insignificante. El error de medici ón se con vierte en un problema ético en cual-
quiera de las tres formas: (1 ) un patrocinador puede elegir. en form a delibe rada , preguntas
orientadas que guían las respuestas hacia dirección específica; (2) un entrev istador, median -
te actitudes y tono de voz, puede crear un efecto deliberad o de halo o puede guiar las res-
puestas en ciert a direc ción; (3) alguien que respond e, pero no está de acuerdo con la en-
cuesta. puede proporcio nar informaci ón falsa, a propósi to.

Problemas para la sección 1.9


Aplicación de conceptos
1.21 "Un sondeo indica que los estadounidenses prefieren de manera abrumadora un Chrysler
a un Toyota después de manejar ambos vehículos:' ¿Qué información le interesaría tener
antes de aceptar los resultados de este sondeo?
1.21 "Una encuesta indica que la gran mayoria de estudiantes universitarios eligió pantalones
marca Gap como su prenda de vestir favorita." ¿Qué información le interesaría tener
antes de aceptar los resultados de este sondeo?
1.23 Se obtiene una muestra aleatoria simple de n = 300 empleados de tiempo completo de
las listas de una compañía con los nombres de los N = 5.000 empleados de tiempo
completo para evaluar su satisfacción en el trabajo.
(a) Dé un ejemplo de un posible error de cobertura.
(b) Dé un ejemplo de un posible error de no respuesta.
(e) Dé un ejemplo de un posible error de muestreo.
(d) Dé un ejemplo de un posible error de medición.
RESUMEN

Como puede observarse en la gráfica de resumen en la página 23, este capítulo presenté
una introducción a la estadística y analizó la recolección de datos. Se estudiaron diferente,
modos de respuesta a una encuesta, varios tipos de datos y diversas maneras de seleccio-
nar muestras aleatorias. Además, se examinaron varios aspecto s que están relacionados COI
el valor de una encuesta.
Una vez recopilados, los datos deben organizarse y prepararse para facilitar su análisis
En los dos capítulos siguientes. se mostrarán diferentes métodos para presentar los datos el
tablas y gráficas, se describirán varias técnicas de "análisis exploratorio de datos" y se de
sarrollarán mediciones descripti vas resumida s que son muy útiles para el análisis y la in
terpretaci ón de datos.

nos clave
-ación de la calidad total 4 inferencia estadística 5 pensamiento estadístico 4
marcos 11 población 5
cobertura 19 muestra 5 sesgo de no respuesta 20
medición 20 muestra aleatoria simple 13 sesgo de selección 19
muestreo 20 muestra conglomerada 16 tabla de números aleatorios 14
no respuesta 20 muestra estratificada 15 universo 5
'o 5 muestra no probabilística 12 variables aleatorias 9
'a descriptiva 5 muestra probabilística 12 variables aleatorias categóricas 9
15 muestra sistemática 15 variables aleatorias continuas 9
irirnarias 7 muestreo con reemplazo 13 variables aleatorias discretas 9
;ecundarias 7 muestreo sin reemplazo 13 variables aleatorias numéricas 9
cal 8 parámetro 5

Verificación de 105 conocimientos adquiridos


1.24 ¿Cuál es la diferencia entre muestra y población?
1.25 ¿Cuál es la diferencia entre un estadístico y un parámetro?
1.26 ¿En qué difieren la estadística descriptiva y la inferencia estadística?
1.21 ¿Qué utilidad ofrecen los método s estadísticos al administrador?
1.28 ¿En qué ha cambiado el ca mpo de la estadística con el desarro llo de la tecnología de
computadoras ?
1.29 ¿Cómo se relaciona el desarrollo del campo de la estadística con las necesidades de los
censos?
1.30 ¿Cuál ha sido el cambio en los programas estadísticos (software) en los últimos 30
años?
1.31 ¿Cuáles son los tres aspectos del mejoramiento de la calidad?
1.32 ¿Cuál es la diferencia entre una variable aleato ria categórica y una variable aleatoria nu
mérica?
1.33 ¿Cuál es la diferencia entre datos discretos y datos continuos?
1.34 ¿Cuáles son las principales razones para obtener datos?
1.35 ¿Cuál es la difere ncia entre muestreo probabi lístico y muestreo no probabilístico?
1.36 ¿Cuáles son algunos de los problemas potenciales que surgen al utilizar métodos "de ur
na" para obtener una muestra aleatoria simple?
1.31 ¿Cuál es la diferencia entre muestreo con reemplazo y muestreo sin reemplazo?
1.38 ¿En qué difieren una muestra aleatoria simple y una muestra sistemática?
1.39 Explique la diferencia entre una muestra estrat ificada y una muestra sistemática.
1.40 ¿Cuál es la diferencia entre una muestra estratificada y una muestra conglomerada ?
1.41 ¿Qué distingue a las cuatro fuentes potenciales de error cuando se manejan encuestas di
se ñadas para el muestreo probabilístico ?
Estadíst ica ¡..- Muest ra
Pensamiento
estadíst ico
I I I

Parámet ro ¡..- Población


Mejoramiento
del proceso
I I
I
Variable
aleato ria

Catecórice A de
variable
Numérica
I

Discreta Continua

I I
I
Fuent e
de datos
1
Usar los Diseñar Realizar Realizar un
datos publicados un experim ento una encuesta estudio obse rvacional
I
Tipo de Aspec tos
muestra ét icos
I

Probabilíst ica No probabilísti ca

Dia gra ma de resumen del capítulo I

Problemas de repaso
t .4 2 La Data and Story Library ¡DASL) (h tt p://li b.sta Lcmu.ed uIDASL) e, una bibliotec a en
línea de archivos de datos y artículos que muestran el uso de métodos estadísticos bási-
cos. Cada conj unto de datos tiene uno o más artículos asociados. Éslos se clasifican por
método y tema. Visite este sitio en la red y, después de leer un artículo . resuma la forma
en que se usó la estadística en una de las áreas.
1.43 Visite el siguiente sitio en la red, patrocinado por Microsoft Corporation para Microsoft
Excel: (htt p://www.m icro soft.comfoffice/excel). Explique la forma en que Microsoft
Excel puede ser útil en el campo de la estadística. ~
1.44 Visite el sitio de Minitab en la red (htt p ://www.mi nitab.com). Explique cómo puede ser
útil en un negocio el uso de un paquete estadístico de software.
• .45 La organización Gallup presenta el resultado de esc rutinios recientes en su dirección de ~
~
lntemct;
hllp:l/gallup.com
VIsite este sino y elija Hustness ano me bconomy. Para la encuesta mrncaca,
(a) proporcione un ejemp lo de variable aleato ria categórica que se encuentre en esta en-
cuesta.
(b) proporcione un ejemplo de variabl e aleatoria numérica que se encuent re en esta en-
cuesta .
(e) desarro lle tres preguntas que se puedan utilizar en esta encuesta.
1.46 El sitio de British Airway s (http :// www.b ri tisha ír wa ys.comlfeed ba cklfeedba ck.shtml)
proporciona un cuestionario que se puede con testar en forma electrónica .
Entre las preguntas enumeradas en e l pasado están las siguientes:
1. ¿Có mo se enteró de la exi stencia del sitio de British Airway s en Internet?
2. ¿Qué edad alcanzó en su úhi mo cumpleaño s?
3. ¿Cuál es la ve locidad de su con exión a Internet?
(a) La encuesta en el sitio de British Airways. ¿represe nta una muestra aleatoria? Exp li-
que.
(b) ¿Cómo se puede obtener una muestra aleatoria?
(c) Defina el marco para British Airways.
(d) Si no lo hace la encuesta. escriba una pregunta donde la edad sea una variable nu-
mérica.
(e) Diga si la pregunt a "¿cómo se ente ró de la existencia de l sitio de British Airways en
Internet'?" es una variable categórica o numérica . Expl ique.
(O Dé tres preguntas que no figuren en la encuesta de British Airw ays y que piense que
debe rían incluirse.
1A7 Por tradición el sondeo político se ha realizado med iante en trevistas telefónicas. Los inves-
tigadore s de la finn a Harris Black Intemational LId. aseguran que e l sondeo por Internet es
menos cos toso. más rápido, y ofrece una tasa de respuestas más alta que las encue stas por
teléfono . Los crú íccs están preocupados por la confiabilidad científica de este enfoque (Wall
St reet Jouma í, 19 de abril de 1999 ). A pesar de fuertes críti cas. el sondeo por Internet se
usa cada vez más. ¿Qué preoc upaciones tendría usted acerca del escrutinio por Intern et?
1.48 Un estudio realizado por Raj esh Mirani y Albert Lederer ("An lnstrument for Accessi ng
the Organiz ationa l Benefits of IS Projects ", Decision Sciences, vol. 29. 1998, págs . 803-
838) analiza los beneficios organizacionales de los proyect os de sistemas de información
(lS ). Los investigadore s enviaron por correo 936 cuestionarios al azar entre miembro s de
una organización grande de sistemas de informaci ón en el ámbito nacional. Se recibieron
200 respuestas válidas. o una tasa de respuesta de 21 %. De las 200 respuestas, 190 contes-
taron preguntas sobre un proyecto IS recién terminado . El presupuesto promedio para estos
proyectos fue de 3.8 millones de dólares en un interv alo de 4,000 a 100,000.000 dólares.
De estas 190, 45% indicó que se reque ría la aprobación del CEO antes de iniciar los pro-
yectos.
(a) ¿Qué fuente de datos se utilizó en este estudio?
(b) Indique una variable aleatoria categórica que se mencion a en este art ículo.
(e) Indique una varia ble aleatoria numérica que se menciona en este articulo.
(d ) Analice el método de muestreo que se utiliza en este estudio.
(e) ¡.Qué tipos de errores de encues ta que puede n encontrar los investigadores?
L49 The U.S. Census Bureau (Ofic ina de Censos de Estados Unidos] (h ttp://,,,ww.census.gov/)
mantiene un amplio sitio en la red que tiene víncu los co n muchos tipos de datos. El sitio
co ntiene información sobre personas, negoc ios. geografía y otras categorías. Visite el sitio y
localice la descripci ón del Ame rican Housing Survey en la sección People.
(a) Resuma brevemente la descripci ón del Ameri can Housing Survey.
(b) ¿Qué tan grande es la muestra , y qué tipo de método de muestreo se usa?
(e) Dé un ejemp lo de variable aleatoria categórica en esta encue sta.
(d) Dé un ejem plo de var iable aleatoria numérica en esta encuesta.
(e) ¿Qué tipo de negocio puede beneficiarse con la informa ción reunida por la American
Housing Surve y? Explique.
(f) Visite el enl ace de Business. y localice la sección ded icada al sector de manufa ctura .
Describa el Annual Survey of Manufacturers.
(g) ¿Qué tan gra nde es la muestra. y qué tipo de método de muestreo se usa?
(h) Propo rcione un ejemplo de variab le alea toria categórica en esta encuesta.
(i ) Dé un ejemplo de variable aleatoria numéric a en esta encuesta.
(j ) ¿Cómo se beneficia un ejecutivo de una compañía de manufactura con la informa-
ción reunida por la Annual Survey of Manufacturers ?
t .50 Suponga que el gerente de la div isión de servicio a clientes de una compañía que fabrica
aparatos electrónicos desea determin ar si los clientes que han adqu irido una videocasetera
en los últimos 12 meses están satisfechos con sus productos. El gerente planeaba anexar
la encues ta a las pólizas de garantía.
(a) Describa la población.
(b) Describa el marco de población.
(e) ¿Qué diferencia s hay entre la población y el marco? ¿Có mo pueden afectar los resul-
tado s?
(d! Desarrolle tres preguntas categóricas apropiadas para esta encue sta .
(e) Desarrolle tres preguntas numéri cas apropiadas para esta encuesta .
(f) ¿Cómo puede seleccionarse una muestra aleatoria simple entre las pólizas de garantía?
(g) Si el gerente desea seleccionar una muestra de pólizas de garantía para cada marca
de videocaseteras. ¿cómo debe seleccionar la muestra? Exp lique.
t .51 Los sondees políticos se realizan para predecir los resultados de una elección . Por rutina
esto s resu ltados se prese ntan en los periódicos y la televisión durante las semanas y los
meses previos a las eleccione s. Para una elección específica, como la del presidente de
Estados Unidos,
(a) ¿cuál es la población a la que se qu iere generalizar?
(b) ¿,cómo se obtiene una muestr a aleatoria de esa población?
(e) según lo que sabe acerca de có mo se llevan a cabo esos sondeos , ¿qué problemas
podrían presentars e con el muestreo en ellos?
1.52 El siguiente cuestionario se encuent ra en cada habitación de un hotel con ocido y respet a-
do . La intención de la admin istración es eva luar la satisfacción de l huésped.

¿Cómo calificarla la atenc ión que le dimos? ©O @ Q


Área de reservaciones
Botones
Recepcionis ta
Habitaci ón

Limp ieza
Restaurante

(a) ¿Cree que este diseño con cuatro categorías de "caras" proporciona a la admin istra-
ció n información suficiente sob re cada uno de los servicios mencionados? Analice .
(b) ¿Mejoraría este cuestionario con otra "cara fruncida" para balancear las dos "caras
sonrientes"? Explique .
(e) ¿Cuál es el valor de las encues tas de autoselecci6n com o ésta ? ¿Se pueden usar para
proyectar las opiniones de todos los huéspedes durante un intervalo dado (como una
se mana o un mes) ? Exp lique.
(d) ¿Cómo se puede seleccion ar una muestra aleatoria de huésped es?
(e) ¿Qué pregunta categórica agregaría a la encuesta ?
(f) ¿Qué preg unta numérica agregaría a la encuesta ?
1.53 Suponga que un fabrican te de alime ntos para gatos planea realizar una encuesta entre las
familias de Estados Unidos para determ inar los hábitos de compra de los dueños de ga·
tos. Entre las pregunta s a incluir se encuentran las relac ionadas con
l . dónde suele comprarse la comida para gatos .
2. si se compra com ida seca o blanda.
3. número de gatos que hay en la casa .
4. si se trata de un gato con ped igrí o no .
(a) Describa la pobl ación.
(b) Defina el marco.
(e) Indique el tipo de muestreo que usar ía y por qué.
(d) Para cada una de las preguntas anteri ore s. indique si la variable es categórica o nu-
mérica.
(e) Desarrolle cinco pregu ntas categóricas para la encuesta.
(O Desarrolle cinco pregunta s numéric as para la encuesta.

11------
PEI.1
PROYECTO DE EQUIPO

Suponga que se obtuv o la siguiente inform ación sobre F. Jay Mari cuand o fue admitido en
la enfermería de la Universid ad de Brandwein.
(a) Sexo: masculino (g) Tipo de sa ngre: B positivo
(b ) Residencia o dormit orio: Mogelever Hall (h) Alergias conocidas a medicame ntos : nin-
(e) Año que cursa: seg undo año guna
(d) Te mpera tura: 102. 2" F (o ral) (i) Diagnóstico prel iminar: gripe
(e ) Pulso: 70 latidos por minuto G) Duración estimada de es tancia: 3 días
(f) Presión sanguínea: 130/80 mgimm(g)

Cla sifique cada una de las 10 respuestas por tipo de da tos. (Sugerencia: cuidado co n la presión san-
guínea: puede ser engañosa.)

Caso de estudio - ENCUESTA EN LA ASOCIACIÓN DE EX AWMN05

Suponga que el presidente de la asociación de 3. un borrador del cuestionario (con una secuen
exalumncs de una universidad estatal desea rea- cia organ izada de preguntas categóricas y nu
lizar una encuesta entre sus miembros de las ge- mérica s).
neraciones de 1988 y 1989 para detenninar sus 4. un borrador de la carta de presentación de
logros anteri ores, actividades actuales y aspira- cuestionario.
c iones futu ras. Para es to. se necesita obten er in- 5. un borrador de instrucciones especiales par.
formación en las siguientes áreas: sexo del alum- quienes. responden, para ayudarlos a llenar e
no; área de especializac ión; promedio general de cues tionario.
licenciatura; metas educativas adicionales (maes- 6. una explicación de cómo planea probar la vaH
tría o doctorado); estado actual de empleo; sala- dez o ambigüedad del cuestionario.
rio anual actual; núm ero de puestos de tiempo 7. una explicación del tipo de muestreo que utili
co mpleto que ha ocupado desde su grad uaci6n; zará para la encuesta.
salari o anual esperado en 5 años ; afiliación a un S. una descripción que muestre que tomó e:
partido político, Y estado civil. cuenta aspect os como los costos de realizació
Usted. co mo director de investigación institu- de la encuesta. el personal necesario y el tiem
cional debe escribir una propuesta que indique po requerido panl iniciarla y terminarla.
cómo planea realizar la encuesta. Incluya en ella: 9. una comparación de la población meta d
miembros la asociación de exajumnos contra 1
1. objetivos (es dec ir. qué desea conocer y por poblaci6n real de graduados de ambas genera
qué ). cienes, 1988 y 1989, indique adem ás si los re
2. una explicación de cómo y cuándo se realizará sultados de la encuesta se pueden proyectar
la encuesta (es decir, sus planes para obtener la todos los graduados de estas generacione s.
muestra de 300 exaJumnos de la lista de 3,000
miembros de la asociación, consideran do am-
bas gen eraciones).
Referencias
1. Cccbran, W. G., Samp ling Techniq ues, 3d ed . (New York : 13. Kirk, R. E.. OO.• Statist ical Issues: A Reader f o r the Behav-
Wiley. 1977 ). tora l Sciences (Monterey. CA: Rroo kslCole, 1972 ).
2. Crc ssen . e., "Margin of Error: Studies and Surveys Prolif- 14. Lo tus J·2 -3 R elease 5 (Cambridge, MA : Lotu s Devel op-
erare, bUI Poor Methodology Makes Man y Unrellable" , The men t Corporation , 1994 ).
Wall Street Joum al, Nove mber 14, 1991. A l and A9 . 15. Microsoft Exce í 2000 (Re dmond, WA : Microsoft Co rpora-
3. Dem ing, W. E., Sample Design in Bus iness Research (New tion, 199 9).
Yo rk: Wiley. 1960 ). 16 . M ínítab Version 12 (State College. PA: Minitab, Inc.• 199 5).
4 . Deming , W. E.• Out 01 the Crisi s (Ca mbridge: Ma ssachu- 17. Mostell er, F., et al., The Pre-Election Polls 0/ 19-18 (New
setts Institute of Technology Center for Advanced Engi- York: Social Science Research Council, 1949).
neering Study, 1986). 18. Norusis. M., SPSS Guide to Data Analy sís Jo, SPSS·X:
5. Deming, W. R . The New Econom ics for Indust ry, Govem- Wilh Additional ln structions 101' SPSSlPC + (C hicago:
mem, Education (Cambridge: Massachusetts Institute of SP SS lnc., 1986).
Techno1ogy Cenler for Advanced Engineering Study. 1993). 19. Pearson , E. S.• ed., TI~ Hístory 01 Statistics in the Seven-
6. Gallup, G. H., The Sophisticated Po ít-wa tcher's Guide teeruh and Ei ghteent h Cen turíes (New York: Macm illan,
(Princeton , NJ : Princeton Üpinion Pre ss, 1972). 1978).
7. Gol eman, D.• "P ollsters Enlist Psychcl ogists in Ques t for 20. Pearson, E. S., and M. G. Kendall, OOs.• Srudies in the History
Unblased Results", The New York Times , Sept ember 7. of Statistics and Probability (Darien. Cf: Hafner. 197 0).
199 3. C1 andC lI . 2 1. Rand Corporation , A M illioll Random Dígits with 100. 000
S. Grcves, R. M., Survey Er rors and Survey Costs (New York: No rma l Deviates (Ne w York: Th e Free Press, 1955 ).
W i1cy, 1989). 22. Robb ins, S. P.. Management, 5th ed. (U pper Saddle River,
9. Hansen. M. R . W . N. Hurwitz , and W . G . Madc w. Samp le NJ: Prent ice Hall , 1997 ).
Survev Methods and Theory, vols. 1 and 2 (New York: Wi- 23 . SAS Longuage and Proced eres Usage. Venio" 6 (Rale igh,
ley, 1953). NC : SAS Institute, 1988).
O. Juran. J . M.. Juran on Leadership fo r Qua/U}' (New Yo rk: 24. Walke r, H. M ., Stud ies in the History of the Sta tistica l
Th e Free Press. 1989 ). Meth od t Bald more: WilJiams & Witkin s. 19 29 ).
1. Juran, J. M.• and F. M. Gryna, Qua liry Pla nning and Analy - 25. Wattenberg, B. E., ed ., Statistica l H ístory of the United
sls. 2d ed . (New York : McGrJ w-H ill, 1980) . Sta tes : Fro m Colonial Tim es lo the Presen t (Ne w York :
2. Kendall , M. G.. and R. L. Ptacketr. eds ., S tudies in che His- Ras ic Boo ks. 1976 ).
lOry of Sunistics and Probability. vol. 2 (London: Charles
W. Gri rfin, 1977 ).

.ste apéndice proporc iona una orientació n acerca de los conceptos bá sicos qu e se necesitan par a utili-
ar Microsoft Excel O Minitab, que corren en una interfaz de usuario de Windows. que a su vez utiliza
entanas o marcos para dividir la pantalla. En es ta interfaz de usuario. a pesar de que la com unica-
ión se puede lograr oprimiendo una co mbinación de teclas, la selección de tare as es más sencilla si
e utiliza un señalado r, como un ratón o un puntero de esfera o de pantalla de tacto. Al move r e l dis-
ositivo señalador (mo use o ratón) se mueve el puntero o curso r, que es una image n gráfica en la
antalla que suele apare cer como una flecha. Al mover el pun tero del ratón sobre otro obj eto y pre-
o nar uno de los botones se define una ope ración co n el ratón. En el cuad ro A 1.1.1 se presentan cua-
o tipos de ope raciones con el ratón que se utilizan en Microsoft Excel o Minitab.
En un ambiente de ventanas, las operaciones de ratón se aplican a una amplia variedad de obje tos
en la pantalla. En primer lugar se tienen las venta nas , marcos que sirven para contener otras venta-
nas o los objetos que se describen en este apéndice. Se pueden seleccionar y arrastrar muchas ven-
tanas desde una posición en la pantalla a orra. y a veces se puede modifica r su tamañ o. es decir.
modificar sus dimensiones.
Otros objetos comunes en el ambiente de ventanas incluyen íconos flotantes. barras de tareas o de
herramientas. barras de menú y cuadros de diálogo.

íconos flotantes
Los íconos flotantes son gráficos que representan una aplicación o un documento específicos. pue-
den seleccionarse y arrastrarse a otra posición. El hecho de activar un ícono que representa Micro-
soft Excel es una forma típica de iniciar el programa de ExceI.

Barras de menú
Las barras d e menú son listas horizontales de palabras que representan un conjunto de opciones. Al
seleccionar una opción aparece un men ú desplegable [pull-down] o una lista con más palabras pa-
ra elegir.

Barras de tareas o de herramientas


Las barras de tareas o de herramientas son grupos de íconos o botones de posición fija, es decir.
imágenes gráficas que se pueden seleccionar con un "die" para simular la operación de un botón. Las
barras de herramientas pueden ser fijas o flotantes. En aplicaciones como Microsofl Excel, hay ba-
rras de tareas que representan diferentes categorías de acciones del usuario como dar formato, editar
o dibujar.

Cuadros de diálogo
Al hacer una selección en un menú o una barra de herramientas. a menudo aparece un tipo especial
de ventana llamada cuadro de diálogo. Los cuadros de diálogo se usan para desplegar mensajes o
para pedir al usuario que elija o proporcione información adicional. Los obje tos comunes en muchos
cuadros de diálogo se enumeran en el cuadro A1.1.2.
COM ENTARIO: Notación abreviada para seleccionar UIl men ú
En este texto. los autores abreviarán las selecciones de menú con una raya vertical para
separar las opciones. Por ejemplo, se usará Archivo I Abrir en vez de la expresión "se-
leccione el menú de Archivo. y luego la opción Abrir". Además, tal como se escribió Ar-
chivo 1 Abrir . las selecciones aparecerán en negritas.

Microsoft Excel y este libro


Microsoft Excel es el programa de prod uctiv idad personal más adecu ado para manipular en forma in-
teractiva datos numéricos. con la ayuda de hojas de cálculo. Las hojas de cálculo permiten que el
usuario capture. en versiones electrónicas de papel u hojas de trabajo, datos con arreglos rectangu-
lares de reng lones o filas (horizontales) y columnas (vert icales). En un principio fueron usadas por
contadores públicos y privados, pero en la actualidad la flexibi lidad de las hojas de cálc ulo las ha
transform ado en una herramienta de uso diario para muchas persona s, incl uyendo a los estud iantes
que aprenden a reso lver problemas en un curso de esta dística pardo negocios.
Entre los numerosos programas de hojas de cálcu lo que están disponi bles. los autores han decidi -
do usar Micros oft Exce l en es te libro, no sólo por la razón obvia de su am plia d ispo nibi lidad y la in-
corporación de la interfaz para usuario de Micros oft Office . Micro soft Excel contiene funciones y pro-
cedimientos estadísticos especiales q ue facilitan el análisis de dato s, y puede aceptar en forma adicio nal
co mple mentos. que so n proced imientos preprogram ados que amplían su funcionalidad. Estas caracte-
rísticas ayudan a construir soluciones estadísticas en Excel y simplifican su uso. (En muchos casos.
los apéndices de Excel utiliza n el compleme nto PHSral de Prenli ce Hall -4:Jue se incl uye en el C D-
RO M q ue acom paña a este libro- para ampliar el uso directo de Excel , como se explica en la sec-
ción de complementos de este ap éndice .)
Microsoft Excel también perm ite al usuario crear cuadernos de tra bajo. coleccio nes de hojas de
cálc ulo y otra clas e de info nn ación q ue se co mbina en un so lo archivo. Las hojas de trabajo faci li-
tan el desarrollo de soluciones en conformidad con las reglas de un buen d iseño de aplicación. En
este texto, las so lucio nes q ue se generan siguen un patr ón pred etermi nado que co loca los da la s del
problema, los cálc ulos y los obje tos gráficos en hojas separadas. A su vez, este diseño de hojas se-
paradas resa lta el uso de los cuadernos de trabajo, propo rciona med ios más sencillos para mod ificar
los cuadernos de trabajo. y e n general facilita la presentación de resultados.
Aunq ue es útil como herramienta para aprender estad ística. los lectore s debe n tene r en mente que
Microsoft Excel no sustituye a los paquetes es tadís ticos est ándar. Conjuntos de dat os demasiado gra n-
des o co n propiedades estadísticas poco co munes, pueden provocar que Excel, al igual que sus pro-
gra mas suple mentarios, genere resultados no válidos.
Familiarización con la ventana de Mlcroson I:xcel
Al hacer doble die en los íconos del programa o de un cuaderno de trabajo de Microsoft Excel, Win-
dows carga Excel, y aparece una ventana de Excel similar a la que se muestra en la figura A 1.2.1.
Los usuarios pued en co nfigurar la combinación y colocación exactas de los objetos que aparece n en
ella. En la figura AI. 2.1, como en todas las ilustraciones de la aplicación de Excel en este libro. la
barra de herramientas estándar y la barra de formato se configuraron para que aparezcan debajo de
la barra de menú.

~ ..
?_" ñ' --'''' • -.-,.• "-

·,:<y_ i Jal'· "' ~.

- . :.

'ihe et t

F,GURA A 1.2.1 Venta no de lo aplica ción Excel

La hoja de cálculo que se presenta en el área de trabajo está maximizada. y la cubre completamen-
te. Los botones para cambiar tamaño y cerrar la ventana aparecen en la barra de título y en la de me-
nú. Las barras de desplazamiento, horizontal y vertical, permiten desplegar las partes de la hoja de
cálculo que están fuera de la pantalla. Las etiquetas de hojas, que identifican el nombre de cada una,
se utilizan para ir de una hoja a otra (del cuaderno de trabajo). Una barra de estado puede proporcio-
nar inform ación acerca de la operación actual y el estado de algunas teclas.

Especificación de posiciones en la hoja de cálculo


Parte del proceso de diseño al usar una hoja de cálculo implica colocar datos, cálculos y resultados
requeridos j unio con etiquetas y títulos. como encabezados de columnas. en la retícula de cada hoja
de trabajo . Si se usa la notación estándar para hojas de trabajo, las letras se refieren a las columnas
y los números a los renglones, para identificar en qué celdas. intersecciones de columnas y renglo-
nes deben colocarse los datos. En este sistema, la referencia de celda A1 indica la celda que está en
la primera columna y el primer renglón (celda en la esquina superior izquierda); la referencia de cel-
da 84 se encuentra en la segunda columna y el cuarto renglón.
Como un libro de Microsoft Excel puede contener muchas hojas de trabajo, en ciertos contextos.
este formato de letras y números resulta insuficiente para especificar la celda de interés. Cuando U!
diseño de hoja de cálculo necesita que las celdas en una hoja de trabajo llamen a celdas que están er
otra hoja de trabajo, la celda de referencia debe escribirse en la forma:
Nombrel /oj a /ColumnaReng lón
Con esta notación, se puede distinguir entre dos celdas que tienen la misma posición en dos hojas di-
ferentes del mismo libro. Por ejemplo, Datos!AI y Cálculos!AI se refieren a la celda de la esquina
superior izquierda de las hojas respectivas de datos y cálculos. Esta notación extendida sólo es nece-
saria cuando se hace referencia a una celda que está en una hoja diferente a la hoja donde se está tra-
bajando.
Además de celdas individuales. se puede n hacer referencias a bloques de celdas que son grupos
rectangulares de celdas adyacentes. Los bloques de celdas se identifican con la esquina superior iz-
quierda y la esquina inferior derecha del bloque. La forma correcta de indicar el bloque es
Superiorll.quierda:/nf eriorDaecJUl
Por ejemplo. el bloque de celdas Al :B3 se refiere al grupo de seis celdas en la hoja de trabajo que
contiene las celdas Al . Bt , A2. 8 2. A3 Y 8 3. Y el bloque A I:A8 se refiere a las ocho primeras cel o
das en la primera columna de la hoja. Se pueden indicar bloques en la fonna siguiente
Nombrelloja!Sup eriorIzquierda:lnferiorDerecha
y se refieren a bloque s que no están en la hoja de trabajo.
A veces es necesario distinguir entre dos celdas que tienen la misma posición en dos hojas de tra-
bajo (que tienen nomb res iguales) en dos libros distintos que se guardan en la misma carpeta o di-
rectorio. En esos caso s, las referencias a las celdas se escriben en la forma
'{NombreLibro/NombreHoja '!ColumnaFila
como en ·[MUl1JAL]Data'!A l , que se refiere a la celda que está en la esquina superior izquierda de
la hoja de trabajo Data en el libro MUTUAL.

Configuración de Microsoft Excel


Microsoft Excel permite que el usuario configure la ventana de Excel. Quizá los lectores prefieran
que sus ventanas de Excel sean lo más parecidas posible a la figura A 1.2.1 Y otras ilustraciones que
aparecen en este libro. Para configurar Microsoft Excel de modo que la ventana coincida con las ilus-
traciones, cargue y ejecute Excel, y luego siga los pasos que se indican en el cuadro A 1.2.1.
Cómo modificar el nombre de las hojas de trabajo
La asignación de nombres descriptivos a los objetos individuales del libro de trabajo facilita su uso.
En forma automátic a. Microsoft Excel nombra las hojas de trabajo en serie, es decir, Hojal , Hojaz.
etc. Los mejores nombres reftejan el contenido de las hojas, como "Datos" en una hoja que contiene
los datos que se van a analizar y "Cálculos" en la que se realizan los cálculos necesarios del análi-
siso Para darle un nombre descriptivo a las hojas, pulse doble clic en la pestaña de la hoja que se va
a renomb rar, escriba el nombre que desea y pulse la tecla Enter.

Introducción de datos en el libro de trabajo de Excel


Una vez que hemos obtenido la orientaci ón básica para Microsoft Excel y su interfaz de usuario. es
hora de utilizar Excel con un ejemplo ilustrativo. Suponga que se tienen disponibles datos relativos
a la cantidad de dinero que gastan cinco clientes en una tienda departament al. Los datos se ilustran
en la tabla A 1.2.1.

Tabla A 1.2.1 Cantidad gastada por una mu estra de cinco


clientes en una tienda de departam ento
NO~BRE C ANTIDAD (DLS)

AHen 125
Barry 250
Diane 72
Kim 105
Susan 48

Ahora se usará Microsoft Excel para realizar un análisis estadístico de estos dalas. Según la tabla
A 1.2.1. se decide que el encabezado de la primera columna, "Nombre", debe aparecer en la celda A l.
Con el mismo razonamie nto, el encabezado de "C antidad" debe aparecer en la celda B1, Y los valo-
res de cada variable para los cinco clientes, en las cinco filas siguientes (de la 2 a la 6). Una vez es-
pecificadas las direcc iones de las celdas para las pan es de la hoja de cálculo, se capturan los valores
en las celdas de una hoja de cálculo que se identifica con el nombre "Datos". Para hacer esto. acti-
ve Microsoft Excel, y seleccione Ar chivo I Nue vo para crear una nueva hoja de cálculo. Camb ie el
nombre de la Hoja l por Datos,
Seleccione la celda Al haciendo clic en su interior. Un borde especial que resalta la celda. apa-
rece alrededor de ella e indica que la celda A I es ahora la celda activa donde se introducirá el si-
guiente valor. (También observe que A l. la dirección de la celda activa, aparece en el cuadro de re-
ferencia de celdas.) Escriba el encabezado de columna. "Nom bre". Al hacerlo. observe que las letras
aparecen en el cuadro de edición de la barra de fónnu las al igual que en la celda A l . Presione la te-
cla Enter (o haga e1ie en la marca de correcto a la izquierda del cuadro de edición) para terminar.
(Si su teclado no tiene la tecla Enter entonce s debe presionar la tecla Retum .) Continúe con la selec-
ción de la celda B l y escriba el encabezado de colu mna "Cantidad" .
Una vez escritos los encabezados. puede iniciar la ca ptura de los valores en cada columna. Se es-
cribirán los valores por columna. utilizando la tecla Enter (Retum) , que da el avance automático de
la celda activa un renglón hacia abajo. después de cada dato. (Si desea ingresar valores por renglón.
debe presionarse la tecla Tab [tabulador] después de cada dato para desplazarse a la celda activa, que
está una columna a la dcrecha.)
Seleccione la celda A2. escrib a el nombre Allen, y oprima la tecla Enter (Retum ). Escriba el res-
to de los nombres en las celdas A3 a A6. oprimiendo Enter después de cada nombre. Seleccione la
celda B2. y escriba la cantidad J25 de la tabla A l. 1. Después siga con las cantidades 250. 72. 105 Y
48 en las celdas B3 a 86. Una vez introducidos todos los valores de la tabla fuente en la boja de tra-
bajo "Datos", debe guardar una copia del trabajo en el disco con Arc hivo I Guardar o Arch ivo I
Gu ardar como , antes de continuar.

COMENTARIO: Corre cción de errores


Al escribir dalas en una hoja de cálculo. es probable que se cometan errores. Para corregirlos.
puede seguir alguna de las siguientes instrucciones:

• Para cancelar la entrada actual al momento de escribirla, presione la tecla Escape o


haga clie en la marca de incorrecto en la barra de fó rmulas.
• Para borrar caracteres a la izquierda del cursor, uno o la vez, presione la tecla A trm .
• Para borrar caracteres a la derecha del cursor, "no a la vez. presione la tecla Suprimir.
• Para reemplazar UlI error en el texto, haga clíc al principio del error, luego arrastre el
puntero del ratón sobre el res to del error. }' escriba el nue\'O texto. Si cambia de opi-
nión. puede deshacer su última edición seleccionando el comando Edición I Deshacer
escritura. Si cambia de opinión y desea conservar la celda como estaba, seleccione Edi-
ción I Reha cer escritura .

Desarrollo de fórmulas para realizar cálculos


Una vez guardado el trabajo, el siguiente paso es calcular una estadística sencilla. la suma total que
gastaron los cinco cliente s. Una forma de obtener el resultado es sumar los valores 125.250. 72. 105
Y 48 en forma manual para obtener 6(X) como cantidad total gastada.
Aunque podría argumentarse que para este problema pequeño y sencillo el cálculo manual es el
método más adecuado para obtener la suma. es más conveniente que Microsoft Excel genere los valo-
res en vez de hacerlo uno mismo. Para hacer esto, habrá que desarrollar e introducir fórmulas o ins-
trucciones que realicen un cálculo o alguna otra tarea, en las celdas apropiadas de la hoja de cálculo
Datos (1a celda B7 en este ejemplo).
Para distinguirlas de otro tipo de entradas, todas las fórmulas empieza n con el símbolo = (signo
igual). El desarrollo de fórmulas requiere el conocimiento de los operadores, o símbolos especiales.
que expresan operaciones aritméticas. Los operadores que se utilizan para generar las fórmulas de es-
le libro incluyen suma ( + ), resta ( -). multiplicación (,.). división (/) y exponenciación (un número
elevado a una potencia (")l.
Como la definición de cantidad total gastada es la suma de cinco cantidades, se usará + (signo
más) en la fórmula, comb inado con las direcciones de las celdas que contienen los valores que se de-
sean sumar. En el caso del cálculo de la cantidad total gastada por cinco clie ntes. se sumarán las cel-
f as 6 2. 6 3. 64 . 65 Y 66 de la hoja Datos.
Al unir estas partes. se obtiene la fórmula:
= Datos!B2 + Datos!B3 + Datos!B4 + Datos!B5 + Datos!B6
la cual se inserta en la celda 87 . Sin embargo. como la fórmula se encuentra en la misma hoja a la
que hace referencia. podemos escribir la fónnu la aplicando la notación abreviada
= B2 + B3 + 84 + 8 5 + 86
y Microsoft Excel dará la interpretación correcta a las direcciones al referirlas a la hoja actual (Datos).

Uso de funciones en las fónnulas


Al presentar las f6nnu las se utilizó el operador aritmético de suma para construir una fórmula. Con
la misma facilidad se hubiera podido usar la función suma. una de muchas instrucciones predetermi-
nadas que están disponibles para resolver una amplia variedad de problemas comunes de aritmética.
negocios , ingeniería y estadística.
Para utilizar la función SUMA. se teclea la fórm ula =SUM A (B 2:B6) en la celda B7 en lugar de
la fórmula = 82 + B3 + 84 + 8 5 + 8 6. En la fórmula =SUMA(B2:86), la palabra SUMA identi-
fica la funció n suma. el par de paréntesis ( ) encierran las celdas de interés, y 82:86 es la dirección
del grupo de celdas cuyos valores usará la función.

COMENTARIO: Copiar objetos en Micros oft Excel


Se pueden copiar objetos que van desde una sola celda hasta una hoja co mpleta para simplificar o acelerar el dise-
ño de una hoja de cálcu lo. En gen eral, copiar implica que primero se debe seleccionar el objeto y lue go los coman-
dos apropia dos para copiar y pegar.
• Para copiar el elemento de una celda o WJ grupo de elementos. seleccione la celda o grupo de celdas que con·
tienen los elementos que se l'an a copia r arrastrando el puntero del ralón por todas las celdas del grupo. Se-
leccione Edü:ión I Copiar. Seleccione la celda (o la primera celda del grupo) que recibirá la copia. Seleccio-
ne Edición I Pegar. (Nota: Al copia r elementos que contienen fó rmulas quizá no se obtengan elementos
duplicados. Consulte el apéndice 2.1 pa ra una explicación de las direcciones absolutas.¡
• Para copiar una hoja completa. seleccione la lroja que desea copiar haciendo un clíc en el tabulador de la ho-
ja (cuadro superior izquierdo que está entre las barras de letras y números). Seleccione Edic ión I Mover o co..
piar hoja. En el cuadro de diálogo Mover o copiar, marque Crear una copia. Seleccione (n ue vo libro) en la
lista desplegabl e del cuadro Al libro: si la copia de la hoja de cálculo se va a colocar en un nuevo libro. Se-
leccione la posici ón de la copia en el cuaderno de trabajo en el cuadro Antes de la hoja : y haga elie en el
botón Aceptar.

Asistentes (Wiz:ards)
Los asistent es son conjuntos de cuadros de diálogo entrelazados que guían al usuario en la tarea de
crear cienos obje tos en libros de trabajo. Los usuarios proporcio nan informació n y eleccio nes en los
cuadros enlazados y avanzan haciendo clic en un botón "Siguiente" (y al final en "Terminar" para
crear el objeto; un e1ic en "Cancelar" suspende la tarea). Como ejemplo, considere el Asistente pa·
ra importar texto de Microsoft Excel que ayuda a importar o transferir datos de un archivo de tex-
to a una hoja de cálculo. (Un archivo de texto contiene valores no etiquetados y sin formato que es-
tán separados por delimitadores como espacios, comas o tabuladores .)
Para ilustrar este asistente, suponga que el archivo de texto MUTUAL.TXT con tiene un conjun to
de dates sobre fondos mutuos (este archivo se proporciona en el CD-ROM que acompaña al libro).
Para importar los datos de este archivo a una hoja de cálculo Excel: seleccio ne Archivo r Abrir. En
el cuadro de diálogo. seleccione la carpeta que contie ne el archivo MUTIJAL.TXT de la lista desple-
gable "Buscar en" . Seleccione la opción Archivos de texto (* .pr n; ...!xt; ...csv) de la lista "Ti po de
Archivo". También se puede seleccionar la opción Todos los archivos (* .*) . Introduzca el nombre
MUTUAL TXT en el cuadro " Nombre de archivo " o selecciónelo en la lista de archivos. (Si el ar-
chivo no aparece en [a lista de archivos, verifique que [os dos pasos anteriore s sean correctos.) Haga
elic en el botón Abrir.
Esto inicia el "Asistente para importar texto en tres pasos". En el cuadro de diálogo del Asisten-
te para importar texto -paso 1-, seleccione la opción De ancho fijo (porque los valores de datos
para las variables en este archivo se colocaron en columnas de ancho fijo). Observe que 10 que el tex-
to llama "variables" son "campos" en el cuadro de diálogo. Haga clic en el botón Siguiente. En el
cuadro de diálogo del Asistente para importar texto - paso 2- haga die en el botón Siguiente para
aceptar la colocación de los datos de cada línea del archivo de texto en columnas. (Arrastre la línea
vertical que separa columnas para alterar la colocación. si fuera necesario.) En el cuadro de diálogo
de Asistente para importar texto -paso 3- . seleccione el botón de opción General debajo del enca-
bezado de formato de datos de columna. Haga clíc en el botón Terminar. Los datos del archivo de tex-
lo se transfieren a una hoja de cálculo nueva. con el mismo nombre del archivo de texto (MlITUAL.
en este caso), en un nuevo libro de trabajo. Guarde este libro con formato Microsoft Excel (.XLS).
Recuerde que debe revisar los objetos que se crearon con los asistentes en busca de errores. Si los
objetos 'contienen errores se pueden modificar, ya sea oprimiendo el botón derecho en el objeto y se-
leccionando la opción apropiada del menú resumido, o bien borrándolos y creándolos de nuevo con
ayuda del asistente. (En este ejemplo, un buen procedimiento sería revisar los datos que se transfirie-
ron y, quizá. insertar encabezados de columna ; para ello seleccione cualquier celda de la fila l. lue-
go Insertar I Filas. por último, escriba los encabezado s deseados para las columnas.)

Complementos
Los com plementos son procedimientos preprogramad os y opcionales que amplían la funcionalidad
de Microsoft Excel. Algunos de ellos. como las herramientas para análisis de datos. se incluyen en
los archivos de Microsoft Excel; se instalan con el programa de Instalación de Microsoft Excel y es-
tán disponibles para los usuarios en forma permanente. Otros, llamados complementos de "terceras
personas", como PHStat de Prentice Hall (que se incluye en el CO-ROM que acompaña a esta edi-
ción en español) se instalan por separado.
Los complementos modifican la barra de menú de Microsoft Excel insertando ya sea un nuevo
menú de opciones a un menú preexistente, o un nuevo menú de opciones. Una vez seleccionados. al-
gunos suplementos de opciones conducen a recuadros de diálogo que le piden al usuario ingresar in-
formación y realizar selecciones, mientras que otros generan nuevos objetos o resultados en forma
directa.
Por ejemplo el suplemento de herramien tas para análisis de datos inserta la opción "Análisis de
datos" en el menú de herramie ntas. mientras que el complemento PHSIaI inserta el menú desplega-
ble PHStat en la barra de menú (véase la figura A1.2.1). La selección de Her r am ienta s I Análisis

fIGURA A 1.2.2
eHStat VllIt- t ,,¡
Menú PHSta t
DIIi:" ~aral:kln '

..
~.

oec-.-MaI<h;J ~ ,
~ Distrb1ens
de datos hace que el complemento de herramientas muestre el cuadro de diálogo Análisis de datos
donde se puede seleccionar el análisis estadístico de interés. Si se elige PHStat en la barra de menú
aparece un menú de opciones (véase la figura A 1.2.2) para elegir la operación de interés. Estas op-
ciones llevan a uno o más cuadros de diálogo o generan algún objeto del libro de trabajo.
Se pueden cargar muchos suplementos separados, incl uso PBSta t, en fonna tempora l. Se hace do-
ble ene en el ícono de PHStat for Exeel 97/2000 o PHStat Ior Exeel 9S en el escritorio (véase las
instrucciones para la instalación de PHStat en el apéndice F) o se usan los procedimi entos para abrir
un archivo de un cuaderno de trabajo Excel (al seleccionar PHStat en el menú Start de Prentice Hall
Add- Ins se carga el complemento). Al cargarlos en forma temporal, los complementos pueden accio-
nar el cuadro de diálogo de control de virus en macros que advierte la posible existencia de virus. Si
se presenta este cuadro de diálogo, presione el botón Activar macros para permitir la carga del com-
plemento sin virus (como PHStat). Tenga cuidado de no cargar como temporal un complemento que
está instalado como permanente. para evitar resultados impredecibles.
Recuerde que para utilizar Microsoft Excel y el comp lemento PHStat de este libro, se deben ins-
talar los complementos herramientas de análisis de datos y herramientas de análisis de datos - VBA-
que proporciona Microsoft Excel e instalar (o cargar como temporal) el complemento PHStat de Pren-
tice Hall que se incluye en el CO-ROM que acompañ a el libro . Se deben instalar los complementos
de herramientas de análisis para poder utilizar PHStat, ya que éste no funciona si detecta que no se
instalaron las herramientas.

Resumen
En este apéndice se presentó una introducción a las características básicas de Microsoft Excel. En el
resto de los apéndices de Excel se verán muchos aspectos adic ionales de Excel en el conte xto de aná-
lisis estadísticos específicos.

¿Qué son los programas de software para aplicaciones


estadísticas?
Cuando en la sección 1.2 se presentó cómo podía ayudar el software al administrador con relación al
uso de datos para tomar decisiones, se indicó que se ilustraría un paquete de software estadístico, Mi-
nitab. Los programas de software para aplicaciones estadísticas contienen una colección de métodos
estadísticos que ayudan a encontrar soluciones a problem as de administración . Estos programas per-
miten que el usuario que no está especializado en estadística tenga acceso a una gran variedad de m é-
todos estadísticos para sus conjuntos de datos de interés, Se ilustrará y explicará el uso del software
estadístico Minitab en los apéndices que están al final de los capítulos. La última versión de Minitab
opera en un ambiente de ventanas. Los lectores que no conocen este tipo de ambiente deberán leer
el apénd ice 1.1 que explica sus características básicas.

Cómo capturar datos en Minitab


Existen dos métodos fundamentales para capturar datos que se usan con Minitab, introducidos por el
teclado o importarlos de un archivo. Para empezar. abra Minitab para obtener una ventana similar a
la de la figura A L3.L
Esta ventana contiene varias características que conviene analizar. En la parte superior se encuen-
tra una barra de menú que permite seleccionar opciones para obtener estadísticas, desplegar gráficas,
almacenar y guardar datos, y realizar muchas operaciones más. Abajo de la barra de menú está la
ventana de la sesión que muestra salidas en forma de texto, como tablas de estadísticas. Abajo de es-
ta ventana hay una ventana de datos, un arreglo rectangular de filas y column as en donde se pueden
introducir, editar y ver datos. Observe que la primera fila en la ventana de datos enumera las colum-
nas, etiquetadas como e 1, el, etc. La siguiente fila contiene una flecha en la primera columna y un
conjunto de columnas en blanco. En este renglón se escriben los nombres de las variables.
Los datos se pueden insertar con el teclado en las celdas de la ventana de datos. Si la flecha apun-
ta hacia abajo, la celda activa (en la que se escriben los números) se mueve hacia abajo al presionar
C1 .~ _

, ; _ _ 1 --1- - j _ - - l - - - - _ . :, _ _ ,_ _....
2
J
...-+- - -_.- . - , --- ~
.
~
,
,• ;- -
~~--'- .- .... - _.- -. ' - -'- - ,--
~ ~_ _l_~._'_~·_·- ! t--
" ~ o

FIGURA A 1.3.1 Hojo de trobojo de Minitob y ventono de sesi ón

Enter, y se mueve a la derecha al presionar Enter cuando la flecha apunta hacia la derecha. Al ha-
cer die en la flecha ca mbia la dirección en que se insertan los datos.
Por ejemplo, supo nga que se tienen datos sobre la ca ntidad de dinero que gastaron cinco clientes
en una tienda departamental. Los resultados se muestran en la tabla A1.3.l.

Tabla A 1.3.1 Cantidad de dinero gas/oda por /lna muestra


de cinco clientes ell una tienda
N O MUR E CANTIDAD (01.8)

AHen 125
Barry 250
Diane 72
Kim 105
Susan 48

Empiece en la fila de la flecha. Esta fila se usa para escribir los nombres de cada variable. En la
primera col umna (con etiquet a el ), escriba la etiqueta de la primera variable (Nombre) y oprima En-
ter. Esto mueve el curso r a la prim era fila de esta columna . Escriba Allen en la fila l. Barry en la
fila 2. Diane e n la 3. Kim en la 4 y Susan en la fila 5. Mue va e l cursor al área de encabezados en
la parte superior de la co lumna 2 (abajo de C2), escriba Can tidad co mo etiqueta de esta co lumna.
Después de presionar Enter para moverse a la fila I en la columna e 2, inserte 125, la canti dad que
gastó Allen. Continúe con las cantidades que gasta ron Jos otros clientes en la" filas respe ctivas, fila
2 a fila 5.
Al realizar los análisis estadísticos en este libro. a men udo se enco ntrará n conjuntos de da tos con
un gran número de obse rvaciones . Si este tipo de conjuntos de dato s se cap turan y guardan en un ar-
chivo de datos. parece sensato tratar de importar el contenido de l archivo a una hoja de datos, para
evitar volver a introd ucir cada una de las observacione s. Los co njuntos de datos que se usaron aquí
se e ncuentran almacenados en difere ntes formato s, incluyendo el formato Minitab (.MTW ). Para im-
portar los conten idos de una hoja de cálcu lo Minit ab, abra el archivo de interés (de Min itab ) a par-
tir del directorio apropiado. Para esto se elige File I Open Worsheet en la barra de menú y después se
selecciona el archivo adecuado del directorio.
Aunque el programa Minitab puede importar datos almacenados en varios tipos de archivos espe-
ciales (como Microsoft Excelj, es posible que en otras situaciones encuentre datos guardados como
archivos de texto. archivos que contienen valores sin nombres y sin formato, datos separados por es-
pacios, comas o tabuladores. Para abrir datos de un archivo se usa el comando File I Open work-
sheet . Esto proporciona el cuadro de diálogo Open Worksheet. En este cuadro de diálogo se pueden
abrir muchos archivos diferentes, que incluyen archivos Minitab (.MTW), Microsoft Excel (.XLS).
de datos (.DAn y de texto (.TXn. Para asegurar que aparece el tipo de archivo adecuado en el cua-
dro de Files, seleccione el archivo que desea abrir. Para verlo en la hoja de trabajo, haga cl¡c en el
botón Preview.
Si la primera fila empieza con datos y no contiene los nombres de las variables (como es el caso
de los archivos con terminación .TXT que se incluyen en el CD-ROM que acompaña al libro), haga
die en el cuadro Optlons. Seleccione Nane entre las opciones del cuadro de Variable Names. Se-
leccione Free Fonnat de las opciones del cuadro Field Definitions. Haga d ie en el botón OK. Cuan.
do esté listo para abrir el archivo seleccionado. haga clic en Open para abrir el archivo selecciona-
do que aparecerá en la ventana Data. Inse-rte los nombres de cada variable. y salve el archivo como
una hoja de cálculo Minitab.

También podría gustarte