Está en la página 1de 43

1

Descripción de
datos por medio
de gráficas
OBJETIVOS GENERALES
Numerosos conjuntos de mediciones son muestras selec-
cionadas de poblaciones más grandes; otros constituyen © Ocean/Corbis
toda una población, como el caso de un censo nacional. En
este capítulo usted aprenderá qué es una variable, cómo
clasificar variables en diversos tipos y cómo se generan ¿Cómo está su presión
mediciones o datos. Por tanto, también aprenderá a usar sanguínea?
gráficas para describir conjuntos de datos. ¿Su presión sanguínea es normal, o es demasiado
alta o demasiado baja? El estudio práctico que
ÍNDICE DEL CAPÍTULO aparece al final de este capítulo examina un con-
Distribuciones de datos y sus formas (1.1, 1.4)
junto grande de datos sobre la presión sanguínea.
Usted usará gráficas para describir estos datos y
Gráficas de puntos (1.4)
comparar su presión sanguínea con la de otras
Gráficas de pastel, de barras, de líneas (1.3, 1.4)
personas de su misma edad y género.
Variables cualitativas y cuantitativas: discretas y
continuas (1.2)
Histogramas de frecuencia relativa (1.5)
Gráficas de tallo y hoja (1.4)
Datos univariados y bivariados (1.1)
Variables, unidades experimentales, muestras y
poblaciones, datos (1.1)

NECESITO SABER...

Cómo construir una gráfica de tallo y hoja


Cómo construir un histograma de frecuencia relativa

7
8 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

VARIABLES Y DATOS
1.1
En los capítulos 1 y 2 presentaremos algunas técnicas básicas de estadística descriptiva, la
rama de la estadística que se ocupa de describir conjuntos de mediciones, tanto muestras como
poblaciones. Una vez que haya recolectado un conjunto de mediciones, ¿cómo puede mos-
trar este conjunto en una forma clara, entendible y fácil de leer? Primero, debe ser capaz de
definir lo que se entiende por medición o “datos” y clasificar los tipos de datos que probable-
mente se encuentre en la vida real. Empezamos por presentar algunas definiciones.

Definición Una variable es una característica que cambia o varía con el tiempo o para
diferentes personas u objetos en estudio.

Por ejemplo, la temperatura corporal es una variable que cambia con el tiempo en una sola
persona; también varía de una persona a otra. La afiliación religiosa, el origen étnico, el
ingreso, la estatura, la edad y el número de hijos son variables, es decir, características que
varían según la persona seleccionada.
En la Introducción definimos una unidad experimental o un elemento de la muestra como
el objeto sobre el cual se toma una medición. Del mismo modo, podríamos definir una unidad
experimental como el objeto en el que se mide una variable. Cuando una variable se mide en
realidad en un conjunto de unidades experimentales, resulta un conjunto de mediciones o de
datos.

Definición Una unidad experimental es el individuo u objeto en el que se mide una


variable. Resulta una sola medición o datos cuando una variable se mide en realidad en
una unidad experimental.

Si se genera una medición para cada unidad experimental en toda la colección, el conjunto
de datos resultante constituye la población de interés. Cualquier conjunto más pequeño de
mediciones es una muestra.

Definición Una población es el conjunto de mediciones de interés para el investigador.

Definición Una muestra es un subconjunto de mediciones seleccionado de la población


de interés.

EJEMPLO 1.1 De entre todos los alumnos de una universidad grande se selecciona un conjunto de cinco
estudiantes y las mediciones se vacían en una hoja de cálculo, como se muestra en la figura
1.1. Identifique los diversos elementos comprendidos en la generación de este conjunto de
mediciones.
Solución Hay diversas variables en este ejemplo. La unidad experimental en la que se
miden las variables es un alumno del plantel en particular, identificado en la columna A.
Se miden cinco variables para cada estudiante: promedio de calificaciones (GPA), género,
año en la universidad, curso de maestría o especialidad y número actual de unidades en las que
está inscrito. Cada una de estas características varía de un estudiante a otro. Si consideramos las
GPA de todos los estudiantes de esta universidad como la población de interés, las cinco GPA
de la columna B representan una muestra de esta población. Si se hubiera medido el GPA de
cada estudiante de la universidad, hubiéramos generado toda la población de mediciones para
esta variable.
1.2 TIPOS DE VARIABLES 9

FIGURA 1.1
Mediciones de cinco Estudiante GPA Género Año Especialidad Número de unidades
estudiantes Primero Psicología
Segundo Matemáticas
Segundo Inglés
Primero Inglés
Pasante Negocios

La segunda variable que se mide en los estudiantes es el género, en la columna C. Esta


variable es algo diferente del promedio de calificaciones, ya que puede tomar sólo
dos valores: masculino (M) o femenino (F). La población, si pudiera ser enumerada, estaría
formada por un conjunto de letras M y F, una para cada estudiante de la universidad. Análoga-
mente, las variables tercera y cuarta, año y especialidad, generan datos no numéricos. El año
tiene cuatro categorías (primero, segundo, pasante y graduado) y la especialidad tiene una
categoría para cada una en el plantel. La última variable, el número actual de unidades en que
está inscrito, es de valor numérico y genera un conjunto de números en lugar de un conjunto
de cualidades o características.
Aun cuando hemos examinado cada una de las variables en forma individual, recuerde que
hemos medido cada una en una sola unidad experimental: el estudiante. Por lo tanto, en este
ejemplo, una “medición” en realidad está formada por cinco observaciones, una para cada una
de las cinco variables medidas. Por ejemplo, la medición tomada en el estudiante 2 produce
esta observación:
(2.3, F, So, Matemáticas, 15)

Observe que hay una diferencia entre una sola variable medida en una sola unidad expe-
rimental y múltiples variables medidas en una unidad experimental como en el ejemplo 1.1.

Definición Resultan datos univariados cuando se mide una sola variable en una sola
unidad experimental.

Definición Resultan datos bivariados cuando se miden dos variables en una sola
unidad experimental. Resultan datos multivariados cuando se miden más de dos variables.

Si se miden las temperaturas corporales de 148 personas, los datos resultantes son univariados.
En el ejemplo 1.1 se midieron cinco variables en cada estudiante, lo que resultó en datos mul-
tivariados.

TIPOS DE VARIABLES
1.2
Se pueden clasificar las variables en dos categorías: cualitativas y cuantitativas.

Definición Las variables cualitativas miden una cualidad o característica en cada uni-
dad experimental. Las variables cuantitativas miden una cantidad numérica en cada
unidad experimental.
10 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

MI CONSEJO
Las variables cualitativas producen datos que se clasifican de acuerdo con similitudes o
diferencias en clase; por lo tanto, con frecuencia se denominan datos categóricos. Las va-
Cualitativo ⇔ “calidad” o riables como género, año y especialidad en el ejemplo 1.1 son variables cualitativas que
característica
producen datos categóricos. Otros ejemplos son:
Cuantitativo ⇔ “cantidad”
o número
• Afiliación política: republicano, demócrata, independiente
• Clasificación de sabor: excelente, bueno, regular, malo
• Color de un dulce M&M’s®: café, amarillo, rojo, anaranjado, verde, azul

Las variables cuantitativas, con frecuencia representadas por la letra x, producen datos
numéricos, por ejemplo:

• x = tasa preferencial de interés


• x = número de pasajeros en un vuelo de Los Ángeles a Nueva York
• x = peso de un paquete listo para ser enviado
• x = volumen de jugo de naranja en un vaso

Observe que hay una diferencia en los tipos de valores numéricos que toman estas variables
cuantitativas. El número de pasajeros, por ejemplo, toma sólo los valores x = 0, 1, 2, ..., mien-
tras que el peso de un paquete puede tomar cualquier valor mayor que cero, o sea 0 x .
Para describir esta diferencia, definimos dos tipos de variables cuantitativas: discretas y
continuas.

Definición Una variable discreta toma sólo un número finito o contable de valores. Una
variable continua puede tomar infinitamente muchos valores correspondientes a los puntos
en un intervalo de recta.

MI CONSEJO
El término discreta se refiere a las brechas discretas que la variable puede tomar. Variables
como el número de miembros de una familia, el número de ventas de automóviles nuevos y el
Discreta ⇔ “factible de
número de llantas defectuosas devueltas para cambio, son ejemplos de variables discretas. Por
poner en lista”
el contrario, variables como la estatura, peso, tiempo, distancia y volumen son continuas porque
Continua ⇔ “no factible
de poner en lista” son capaces de tomar valores en cualquier punto a lo largo de un intervalo de recta. Para cual-
quier par de valores que se elijan, ¡un tercer valor siempre se hallará entre ellos!

EJEMPLO 1.2 Identifique como cualitativas o cuantitativas cada una de las siguientes variables:

1. El uso más frecuente de su horno de microondas (recalentar, descongelar, calentar,


otros)
2. El número de consumidores que se niegan a contestar una encuesta por teléfono
3. La puerta elegida por un ratón en un experimento de laberinto (A, B o C)
4. El tiempo ganador para un caballo que corre en el Derby de Kentucky
5. El número de niños en un grupo de quinto grado que leen al nivel de ese grado o mejor
MI CONSEJO

Es frecuente que las


variables discretas
Solución Las variables 1 y 3 son cualitativas porque sólo una cualidad o característica
comprendan el “número” se mide para cada individuo. Las categorías para estas dos variables se muestran entre parén-
de artículos de un tesis. Las otras tres variables son cuantitativas. Las variables 2 y 5 son discretas, que pueden
conjunto
tomar cualquiera de los valores x = 0, 1, 2, ..., con un valor máximo que depende del número
1.3 GRÁFICAS PARA DATOS CATEGÓRICOS 11

de consumidores llamados o del número de niños que haya en el grupo, respectivamente. La


variable 4, el tiempo ganador para un caballo del Derby de Kentucky, es la única variable
continua de la lista. El tiempo ganador, si pudiera medirse con bastante precisión, podría ser
121 segundos, 121.5 segundos, 121.25 segundos o cualquier valor entre dos tiempos que
hemos puesto en la lista.

¿Por qué deberían interesarle los diferentes tipos de variables (que se muestran en la figura
1.2) y los datos que generan? La razón es que diferentes tipos de datos requieren que utilice
diferentes métodos para su descripción, ¡de modo que los datos sean presentados con claridad
y de una manera comprensible para el público!

FIGURA 1.2
Tipos de datos Datos

Cualitativos Cuantitativos

Discretos Continuos

GRÁFICAS PARA DATOS CATEGÓRICOS


1.3
Una vez recolectados los datos, éstos deben consolidarse y resumirse para mostrar la siguien-
te información:

• Qué valores de la variable han sido medidos


• Con qué frecuencia se presenta cada uno de los valores

Para este fin, se construye una tabla estadística para mostrar gráficamente los datos como
una distribución de datos. El tipo de gráfica que se elija depende del tipo de variable que se
haya medido.
Cuando la variable de interés es cualitativa o categórica, la tabla estadística es una lista
de las categorías incluidas junto con una medida de la frecuencia con que se presenta cada
valor. Es posible medir “la frecuencia” en tres formas diferentes:

• La frecuencia o número de mediciones en cada categoría


• La frecuencia relativa o proporción de mediciones en cada categoría
• El porcentaje de mediciones en cada categoría

Por ejemplo, si con n representamos el número total de mediciones en el conjunto, se puede


hallar la frecuencia relativa y porcentaje usando estas relaciones:

Frecuencia relativa Frecuencia


_________
n
Porcentaje 100 Frecuencia relativa
12 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Encontrará que la suma de las frecuencias es siempre n, la suma de las frecuencias relativas
es 1 y la suma de los porcentajes es 100%.
Las categorías para una variable cualitativa deben elegirse de modo que

• una medición pertenecerá a una y sólo a una categoría


• cada medición tiene una categoría a la que se asigna

MI CONSEJO
Por ejemplo, si se clasifican productos cárnicos de acuerdo con el tipo de carne utilizada se
pueden usar estas categorías: res, pollo, mariscos, puerco, pavo, otra. Para clasificar los rangos
Tres pasos para una del cuerpo docente de alguna universidad se usan estas categorías: profesor, profesor adjunto,
distribución de datos:
profesor auxiliar, instructor, conferenciante, otro. La categoría “otro” está incluida en ambos
(1) Datos sin elaborar ⇒
casos para tomar en cuenta la posibilidad de que una medición no pueda asignarse a una de
(2) Tabla estadística ⇒
las categorías anteriores.
(3) Gráfica
Una vez que a las mediciones se les hayan dado categorías y se resumieron en una ta-
bla estadística, se utiliza ya sea una gráfica de pastel o una gráfica de barras para mostrar la
distribución de los datos. Una gráfica de pastel es la conocida gráfica circular que muestra
la forma en que están distribuidas las medidas entre las categorías. Una gráfica de barras
muestra la misma distribución de medidas en las categorías; la altura de la barra mide la fre-
cuencia observada de una categoría en particular.

EJEMPLO 1.3 En una encuesta sobre la educación pública, se pidió a 400 administradores de escuelas que
calificaran la calidad de la educación en Estados Unidos. Sus respuestas están resumidas en
la tabla 1.1. Elabore una gráfica de pastel y una de barras a partir de este conjunto de datos.

Solución Para construir una gráfica de pastel, asigne un sector del círculo a cada
categoría. El ángulo de cada sector debe ser proporcional a la magnitud de las mediciones (o
frecuencia relativa) en esa categoría. Como un círculo contiene 360°, aplique esta ecuación
para hallar el ángulo:

Ángulo Frecuencia relativa 360°

TABLA 1.1 Calificación de la educación en Estados Unidos hecha por 400 educadores
Calificación Frecuencia
A 35
B 260
C 93
D 12
Total 400

MI CONSEJO La tabla 1.2 muestra las calificaciones junto con las frecuencias, frecuencias relativas, por-
centajes y ángulos de sector necesarios para construir la gráfica de pastel. La figura 1.3 mues-
Las proporciones suman 1;
tra la gráfica de pastel construida a partir de los valores de la tabla. Mientras que las gráficas
los porcentajes, 100;
los ángulos de sector, 360° de pastel usan porcentajes para determinar los tamaños relativos de las “rebanadas de
pastel”, las de barras por lo general grafican la frecuencia contra las categorías. Una gráfica
de barras para estos datos se muestra en la figura 1.4.
1.3 GRÁFICAS PARA DATOS CATEGÓRICOS 13

TABLA 1.2 Cálculos para la gráfica de pastel del ejemplo 1.3

Calificación Frecuencia Frecuencia relativa Porcentaje Ángulo


A 35 35/400 .09 9% .09 360 32.4º
B 260 260/400 .65 65% 234.0º
C 93 93/400 .23 23% 82.8º
D 12 12/400 .03 3% 10.8º
Total 400 1.00 100% 360º

El impacto visual de estas dos gráficas es un poco diferente. La gráfica de pastel se usa para
mostrar las relaciones de las partes respecto al todo; la gráfica de barras para destacar la
cantidad real o frecuencia para cada categoría. Como las categorías en este ejemplo son “cali-
ficaciones” ordenadas (A, B, C, D), no desearíamos reacomodar las barras de la gráfica para
cambiar su forma. En una gráfica de pastel, el orden de presentación es irrelevante.

FIGURA 1.3
Gráfica de pastel para el D A
3.0%
ejemplo 1.3 8.8%

C
23.3%

B
65.0%

FIGURA 1.4
Gráfica de barras para el
ejemplo 1.3 250

200
Frecuencia

150

100

50

0
A B C D
Calificación

EJEMPLO 1.4 Una bolsa tamaño botana de dulces de cacahuate M&M’S contiene 21 dulces con los colores
que se indican en la tabla 1.3. La variable “color” es cualitativa, por tanto la tabla 1.4 lista
las seis categorías junto con un registro del número de dulces de cada color. Las últimas tres
columnas de la tabla 1.4 muestran con cuánta frecuencia ocurre cada categoría. Como las
categorías son colores y no tienen un orden particular, se pueden construir gráficas de barras
con muchas formas diferentes con sólo reordenar las barras. Para enfatizar que el café es
el color más frecuente, seguido por el azul, el verde y el anaranjado, ordenamos las barras de
mayor a menor y generamos la gráfica de barras de la figura 1.5. Una gráfica de barras en la que
las barras están ordenadas de mayor a menor se denomina gráfica de Pareto.
14 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

TABLA 1.3 Datos sin elaborar: colores de 21 dulces


Café Verde Café Azul
Rojo Rojo Verde Café
Amarillo Naranja Verde Azul
Café Azul Azul Café
Naranja Azul Café Naranja
Amarillo

TABLA 1.4 Tabla estadística: datos de M&M’S para el ejemplo 1.4


Categoría Registro Frecuencia Frecuencia relativa Porcentaje
Café 6 6 6/21 28%
Verde 3 3 3/21 14
Naranja 3 3 3/21 14
Amarillo 2 2 2/21 10
Rojo 2 2 2/21 10
Azul 5 5 5/21 24
Total 21 1 100%

FIGURA 1.5
Gráfica de Pareto para el
6
ejemplo 1.4
5

4
Frecuencia

0
Café Azul Verde Naranja Amarillo Rojo
Color

1.3 EJERCICIOS

PARA ENTENDER LOS CONCEPTOS 1.2 ¿Cualitativa o cuantitativa? Identifique cada una de
1.1 Unidades experimentales Identifique las unidades las variables como cuantitativa o cualitativa:
experimentales en las que se miden las variables a. Tiempo para armar un rompecabezas sencillo.
siguientes: b. Número de estudiantes en un salón de clases de primer
a. Género de un estudiante. año.
b. Número de errores en un examen de medio semestre. c. Calificación de un político recién electo (excelente,
c. Edad de un paciente con cáncer. bueno, regular, malo).
d. Número de flores en una planta de azalea. d. Estado donde vive una persona.
e. Color de un automóvil que entra a un estacionamiento.
1.3 GRÁFICAS PARA DATOS CATEGÓRICOS 15

1.3 ¿Discreta o continua? Identifique las siguientes la cual le gustaría seleccionar una muestra. ¿En qué forma
variables cuantitativas como discretas o continuas: esta población depende del tiempo?
a. Población en una región particular de un país. 1.8 Tiempos de supervivencia al cáncer Un
b. Peso de periódicos recuperados para reciclar en un solo investigador médico desea estimar el tiempo de
día. supervivencia de un paciente, después del inicio de cierto
tipo de cáncer y de un régimen particular de radioterapia.
c. Tiempo para completar un examen de sociología.
a. ¿Cuál es la variable de interés para el investigador
d. Número de consumidores en una encuesta de 1000 que
médico?
consideran importante aplicar leyenda nutrimental en
productos alimenticios. b. ¿La variable de la parte a es cualitativa, cuantitativa
discreta o cuantitativa continua?
1.4 ¿Discreta o continua? Identifique cada una de las
variables cuantitativas como discretas o continuas. c. Identifique la población de interés para el investigador
médico.
a. Número de accidentes en botes en un tramo de
50 millas del río Colorado. d. Describa la forma en que el investigador podría
seleccionar una muestra de entre la población.
b. Tiempo para completar un cuestionario.
e. ¿Qué problemas podrían surgir al muestrear desde esta
c. Costo de una lechuga.
población?
d. Número de hermanos y hermanas que usted tenga .
1.9 Nuevos métodos de enseñanza Un investigador
e. Rendimiento en kilogramos de trigo para un terreno de educacional desea evaluar la eficacia de un nuevo método
1 hectárea de un trigal. de enseñanza de lectura a estudiantes sordos. El logro
1.5 Estacionamiento en un plantel Se seleccionan seis es medido al final de un periodo de enseñanza por la
vehículos de los que tienen permiso para estacionarse y se calificación de un estudiante en un examen de lectura.
registran los datos siguientes: a. ¿Cuál es la variable que se medirá? ¿Qué tipo de
Distancia variable es?
de viaje
(millas) Antigüedad b. ¿Cuál es la unidad experimental?
en una del vehículo c. Identifique la población de interés para el
Vehículo Tipo Marca ¿Colectivo? dirección (años) experimentador.
1 Auto Honda No 23.6 6
2 Auto Toyota No 17.2 3 TÉCNICAS BÁSICAS
3 Camión Toyota No 10.1 4
4 Van Dodge Sí 31.7 2 1.10 Cincuenta personas se agrupan en cuatro categorías,
5 Moto- Harley- No 25.5 1 A, B, C y D, y el número de personas que caen en cada
cicleta Davidson categoría se muestra en la tabla:
6 Auto Chevrolet No 5.4 9
Categoría Frecuencia
a. ¿Cuáles son las unidades experimentales?
A 11
b. ¿Cuáles son las variables que se miden? ¿Qué tipos de B 14
variables son? C 20
D 5
c. ¿Estos datos son univariados, bivariados o
multivariados?
a. ¿Cuál es la unidad experimental?
1.6 Presidentes de Estados Unidos Un conjunto
de datos contiene las edades en el momento de su b. ¿Cuál es la variable que se mide? ¿Es cualitativa o
fallecimiento de cada uno de los 38 ex presidentes de cuantitativa?
Estados Unidos. c. Elabore una gráfica de pastel para describir los datos.
a. ¿Este conjunto de mediciones es una población o una d. Construya una gráfica de barras para describir los datos.
muestra? e. ¿La forma de la gráfica de barras de la parte d cambia
b. ¿Cuál es la variable que se mide? dependiendo del orden de presentación de las cuatro
c. ¿La variable de la parte b es cuantitativa o cualitativa? categorías? ¿Es importante el orden de presentación?
1.7 Actitudes del electorado Usted es candidato a la f. ¿Qué proporción de las personas está en la categoría B,
legislatura de su estado y desea hacer una encuesta de las C o D?
actitudes del electorado sobre sus probabilidades de ganar. g. ¿Qué porcentaje de las personas no está en la categoría
Identifique la población que es de interés para usted y de B?
16 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

1.11 Jeans Un fabricante de jeans (pantalones vaqueros) Los resultados se basaron en una muestra tomada en los
tiene plantas en California, Arizona y Texas. Un grupo días 9 a 11 de abril de 2010, de 907 votantes registrados en
de 25 pares de jeans se selecciona al azar de la base de todo el país.
datos computarizada, registrándose el estado en el que se a. Si los entrevistadores estuvieran planeando usar estos
produjo cada uno: resultados para pronosticar el resultado de la elección
presidencial de 2012, describa la población de interés
CA AZ AZ TX CA
CA CA TX TX TX para ellos.
AZ AZ CA AZ TX b. Describa la población real de la cual se sacó la muestra
CA AZ TX TX TX
CA AZ AZ CA CA c. Algunos entrevistadores prefieren seleccionar una
muestra de “probables” votantes. ¿Cuál es la diferencia
a. ¿Cuál es la unidad experimental? entre “votantes registrados” y “probables votantes”?
¿Por qué es importante esto?
b. ¿Cuál es la variable que se mide? ¿Es cualitativa o
cuantitativa? d. La muestra seleccionada por los entrevistadores, ¿es
representativa de la población descrita en la parte a?
c. Elabore una gráfica de pastel para describir los datos. Explique.
d. Construya una gráfica de barras para describir los datos. 1.13 ¿Desea ser presidente? ¿Le gustaría ser
e. ¿Qué proporción de los jeans se hizo en Texas? presidente de Estados Unidos? Aun cuando muchos
f. ¿Cuál estado produjo más jeans? adolescentes piensan que podrían llegar a ser presidente,
g. Si desea averiguar si las tres plantas produjeron igual la mayoría no desea el trabajo. En una encuesta de opinión
número de jeans, o si una produjo más que las otras, realizada por ABC News, casi 80% de los adolescentes no
¿cómo se usarían las gráficas de las partes c y d para estaban interesados en el trabajo.2 Cuando se les preguntó:
ayudarse? ¿Qué conclusiones obtiene de estos datos? “¿Cuál es la principal razón por la que no quisieras ser
presidente?” dieron estas respuestas:
APLICACIONES
Otros planes de carrera/no le interesa 40%
1.12 Elección 2012 Durante la primavera de 2010, Demasiada presión 20%
los medios de comunicación ya realizaban encuestas de Demasiado trabajo 15%
opinión que rastreaban las fortunas de los principales No sería bueno para ello 14%
candidatos que esperaban ser presidentes de Estados Demasiadas discusiones 5%
Unidos. Una de estas encuestas, dirigida por CNN/
Opinion Research Corporation Poll, mostró los siguientes a. ¿Están consideradas todas las razones en esta tabla?
resultados:1 Agregue otra categoría si es necesario.
“Si Barack Obama fuera el candidato del Partido Demócrata y [véa- b. ¿Usaría usted una gráfica de pastel o una de barras para
se abajo] fuera el candidato del Partido Republicano, ¿por quién describir gráficamente los datos? ¿Por qué?
sería más probable que votara: Obama, el demócrata, o [véase aba-
c. Trace la gráfica elegida en la parte b.
jo] el republicano?” Si no está seguro: “Al día de hoy, ¿por quién se
inclinaría más?” d. Si usted dirigiera la encuesta de opinión, ¿qué otros
tipos de preguntas desearía investigar?

Barack Mitt Ninguno


Obama (D) Romney (R) (vol.) 1.14 Fanáticos de Facebook El sitio de la red
4/9–11/10 social llamada Facebook ha crecido con rapidez
% % % EX0114
53 45 1 desde sus comienzos en 2004. De hecho, su base
Mike de usuarios en Estados Unidos creció de 42 millones a
Barack Huckabee Ninguno 103 millones entre 2009 y 2010. La tabla siguiente
Obama (D) (R) (vol.)
4/9–11/10 muestra la distribución de edad de los usuarios de
% % %
54 45 1 Facebook (en miles) conforme cambió de enero de 2009
Barack Sarah Ninguno a enero de 2010.3
Obama (D) Palin (R) (vol.) Edad El 1/04/2009 El 1/04/2010
4/9–11/10
% % %
55 42 3 13–17 5675 10,680
18–24 17,192 26,076
Barack Newt Ninguno 25–34 11,255 25,580
Obama (D) Gingrich (R) (vol.) 35–54 6989 29,918
4/9–11/10
% % % 55 955 9764
55 43 1 Desconocida 23 1068
Fuente: www.pollingreport.com
Total 42,089 103,086
1.4 GRÁFICAS PARA DATOS CUANTITATIVOS 17

a. Defina la variable que se ha medido en esta tabla. de vacaciones? A continuación se muestra una gráfica de
b. ¿La variable es cuantitativa o cualitativa? barras con datos de la sección Instantáneas de USA Today.4
c. ¿Qué representan los números? a. ¿Están consideradas todas las opiniones en la tabla?
Agregue otra categoría si es necesario.
d. Construya una gráfica de pastel para describir la
distribución de edad de los usuarios de Facebook el 4 de b. ¿La gráfica de barras está trazada con precisión? Esto
enero de 2009. es, ¿están las tres barras en la proporción correcta entre
sí?
e. Construya una gráfica de pastel para describir la
distribución de edad de los usuarios de Facebook el 4 de c. Use una gráfica de pastel para describir las opiniones.
enero de 2010. ¿Cuál gráfica es más interesante observar?
f. Consulte las partes d y e. ¿Cómo describiría los
cambios en las distribuciones de edad de los usuarios de
Facebook durante este periodo de un año?
1.15 De regreso al trabajo ¿Cuánto tarda usted en
ajustarse a su rutina normal de trabajo después de regresar

Ajuste después de vacaciones

Un
día 40%

Algunos
días 34%

Sin
tiempo 19%

0% 10% 20% 30% 40%

GRÁFICAS PARA DATOS CUANTITATIVOS


1.4
Las variables cuantitativas miden una cantidad en cada unidad experimental. Si la variable pue-
de tomar sólo un número finito o contable de valores es una variable discreta. Una variable
que puede tomar un número infinito de valores correspondientes a los puntos en un intervalo
de recta se llama continua.

Gráficas de pastel y gráficas de barras


A veces la información se recolecta para una variable cuantitativa medida en segmentos di-
ferentes de la población, o para distintas categorías de clasificación. Por ejemplo, se podría
medir el promedio de ingresos de personas de diferentes grupos de edad, géneros diversos o
que viven en distintas zonas geográficas del país. En tales casos se usan gráficas de pastel
o gráficas de barras para describir los datos, usando la cantidad medida en lugar de la frecuen-
cia con que se presenta cada una de las categorías. La gráfica de pastel muestra la forma en
que está distribuida la cantidad total entre las categorías y la gráfica de barras usa la altura
de la barra para mostrar la cantidad de una categoría en particular.
18 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

EJEMPLO 1.5 La cantidad de dinero gastada en el año fiscal 2009 por el Departamento de Defensa de Esta-
dos Unidos en varias categorías se muestra en la tabla 1.5.5 Construya una gráfica de pastel
y una gráfica de barras para describir los datos. Compare las dos formas de presentación.

TABLA 1.5 Gastos por categoría


Cantidad
(miles de millones
Categoría de dólares)
Personal militar 147.3
Operación y mantenimiento 259.3
Adquisiciones 129.2
Investigación y desarrollo 79.0
Construcción militar 17.6
Otra 4.3
Total 636.7
Fuente: The World Almanac and Book of Facts 2011

Solución Se miden dos variables: la categoría de gasto (cualitativa) y la cantidad del


gasto (cuantitativa). La gráfica de barras de la figura 1.6 muestra las categorías en el eje ho-
rizontal y las cantidades en el eje vertical.

FIGURA 1.6
Gráfica de barras para el
Cantidad (miles de millones)

ejemplo 1.5 250

200

150

100

50

0
llo n y

s
ta ón
ili al

tra
m y

s
ne
o
m son

rro ió
ni n

ili ci

O
nt
te ció
r

io

sa ac

m truc
ta

ie
r

sic

r
Pe

de stig
an ra

ns
m pe

ui

ve

Co
dq
O

In
A

Para la gráfica de pastel de la figura 1.7, cada “rebanada” representa la proporción de los gastos
totales (636,700 millones de dólares) correspondientes a su categoría en particular. Por ejem-
plo, para la categoría de investigación y desarrollo, el ángulo del sector es

79.0
360° 44.7°
636.7
FIGURA 1.7
Gráfica de pastel para el Construcción
ejemplo 1.5 militar
Investigación y 17.6
desarrollo
79.0 Personal
militar
147.3

Adquisiciones
129.2

Operación y
Otras mantenimiento
4.3 259.3
1.4 GRÁFICAS PARA DATOS CUANTITATIVOS 19

Ambas gráficas muestran que las cantidades más grandes de dinero se gastaron en personal y
operaciones. Como no hay un orden inherente a las categorías, hay libertad para reacomodar
las barras o los sectores de las gráficas en cualquier forma deseada. La forma de la gráfica
de barras no tiene nada que ver con su interpretación.

Gráficas de líneas
Cuando una variable cuantitativa se registra en el tiempo a intervalos igualmente espaciados
(por ejemplo diario, semanal, mensual, trimestral o anual), el conjunto de datos forma una
serie de tiempo. Los datos de una serie de tiempo se presentan con más efectividad en
una gráfica de líneas con el tiempo como eje horizontal. La idea es tratar de distinguir un
patrón o tendencia que sea probable de continuar y usar ese patrón para hacer predicciones
precisas para el futuro inmediato.

EJEMPLO 1.6 En el año 2025, el mayor de los baby boomers (nacido en 1946) tendrá 79 años de edad, y
el mayor de los de la Generación X (nacido en 1965) estará a dos años de ser elegible para el
Seguro Social. ¿Cómo afectará esto a las tendencias del consumidor en los siguientes 15
años? ¿Habrá suficientes fondos para que los baby boomers reciban prestaciones del Seguro
Social? La Oficina de Censos de Estados Unidos aporta proyecciones para la parte de la
población estadounidense que tendrá 85 años o más en los próximos años, como se muestra
en la tabla 1.6.5 Construya una gráfica de líneas para ilustrar los datos. ¿Cuál es el efecto de
prolongar y contraer el eje vertical de la gráfica de línea?

TABLA 1.6 Proyecciones de crecimiento de población


Año 2020 2030 2040 2050
85 y más (millones) 6.6 8.7 14.2 19.0
Fuente: The World Almanac and Book of Facts 2011

Solución La variable cuantitativa “85 y más” se mide en cuatro intervalos, creando así
MI CONSEJO
una serie de tiempo que se grafica con una gráfica de línea. Los intervalos están marcados en
¡Tenga cuidado de el eje horizontal y las proyecciones en el eje vertical. Los puntos de datos se enlazan entonces
prolongar o contraer los por medio de segmentos de línea para formar las gráficas de línea de la figura 1.8. Observe la
ejes cuando vea una
gráfica! marcada diferencia en las escalas verticales de las dos gráficas. Contraer la escala en el eje
vertical hace que grandes cambios aparezcan pequeños y viceversa. Para evitar conclusiones
erróneas, se deben ver con cuidado las escalas de los ejes vertical y horizontal. No obstante, de
ambas gráficas se obtiene una imagen clara del número constantemente creciente de quienes
tengan 85 años o más en los primeros años del nuevo milenio.
FIGURA 1.8
Gráficas de línea para el
20.0
ejemplo 1.6 100
85 y mayores (Millones)
85 y mayores (Millones)

17.5
80
15.0
60
12.5
40
10.0

7.5 20

5.0
2020 2030 2040 2050 2020 2030 2040 2050
Año Año
20 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Gráficas de puntos
Muchos conjuntos de datos cuantitativos están formados de números que no se pueden separar
fácilmente en categorías o intervalos. En consecuencia, ¡se necesita una forma diferente de
graficarlos!
La gráfica más sencilla para datos cuantitativos es la gráfica de puntos. Para un conjunto
pequeño de mediciones (por ejemplo, el conjunto 2, 6, 9, 3, 7, 6) simplemente se grafican las
mediciones como puntos en un eje horizontal, como se muestra en la figura 1.9a). Para un
conjunto grande de datos, como el de la figura 1.9b), la gráfica de puntos puede ser poco útil
y tediosa en cuanto a la interpretación de la información.

(a)
FIGURA 1.9
Gráficas de puntos para
conjuntos pequeños y
grandes de datos
2 3 4 5 6 7 8 9
Conjunto pequeño

(b)
MI APPLET EN LÍNEA

Construcción de una
gráfica de puntos

0.98 1.05 1.12 1.19 1.26 1.33 1.40 1.47


Conjunto grande

Gráficas de tallo y hoja


Otra forma sencilla de exponer la distribución de un conjunto de datos cuantitativos es la
gráfica de tallo y hoja. Esta gráfica presenta una exhibición gráfica de los datos usando los
valores numéricos reales de cada punto de datos.

NECESITO SABER...

Cómo construir una gráfica de tallo y hoja


1. Divida cada segmento en dos partes: el tallo y las hojas.
2. Liste los tallos en una columna, con una línea vertical a su derecha.
3. Para cada medición, registre la parte de hoja en el mismo renglón como su tallo
correspondiente.
4. Ordene las hojas de menor a mayor en cada tallo.
5. Dé una clave a su codificación de tallo y hoja para que el lector recree las mediciones reales
si es necesario.

EJEMPLO 1.7 La tabla 1.7 es una lista de precios (en dólares) de 19 marcas de zapatos deportivos. Construya
una gráfica de tallo y hoja para mostrar la distribución de los datos.
1.4 GRÁFICAS PARA DATOS CUANTITATIVOS 21

TABLA 1.7 Precios de zapatos deportivos


90 70 70 70 75 70
65 68 60 74 70 95
75 70 68 65 40 65
70

Solución Para crear el tallo y la hoja se divide cada observación entre las unidades y las
decenas. El número a la izquierda es el tallo; el de la derecha es la hoja. Entonces, para los
zapatos que cuestan $65.00, el tallo es 6 y la hoja es 5. Los tallos, que van de 4 a 9, aparecen
en la figura 1.10, junto con las hojas para cada una de las 19 mediciones. Si indicamos que la
unidad de hoja es 1, el lector verá que el tallo y hoja 6 y 8, por ejemplo, representan el número
68 registrado al dólar más cercano.

FIGURA 1.10
Gráfica de tallo y hoja para 4 0 Unidad de hoja
4 1 0
los datos de la tabla 1.7 5 5
6 580855 Reordenamiento ⎯→ 6 055588
7 0005040500 7 0000000455
8 8
9 05 9 05

MI CONSEJO A veces las opciones de tallo disponibles resultan en una gráfica que contiene muy pocos
tallos y un gran número de hojas dentro de cada tallo. En esta situación, se prolongan los tallos
tallo | hoja
al dividir cada uno en varias líneas, dependiendo de los valores de hojas que se les asignen. Por
lo general, los tallos se dividen en dos formas:

• En dos líneas, con las hojas 0-4 en la primera línea y las hojas 5-9 en la segunda línea
• En cinco líneas, con las hojas 0-1, 2-3, 4-5, 6-7 y 8-9 en las cinco líneas,
respectivamente

EJEMPLO 1.8 Los datos de la tabla 1.8 son los pesos de 30 bebés de gestación completa al momento de nacer
en un hospital metropolitano y cuyos pesos están registrados al décimo de libra más cercano.6
Construya una gráfica de tallo y hoja para mostrar la distribución de los datos.

TABLA 1.8 Pesos de 30 bebés de gestación completa al momento de nacer


7.2 7.8 6.8 6.2 8.2
8.0 8.2 5.6 8.6 7.1
8.2 7.7 7.5 7.2 7.7
5.8 6.8 6.8 8.5 7.5
6.1 7.9 9.4 9.0 7.8
8.5 9.0 7.7 6.7 7.7

Solución Los datos, aun cuando están registrados a una precisión de sólo un lugar deci-
mal, son mediciones de la variable continua x = peso, que puede tomar cualquier valor positi-
vo. Al examinar la tabla 1.8, rápidamente se observa que los pesos más alto y más bajo son 9.4
y 5.6, respectivamente. Pero, ¿cómo están distribuidos los pesos restantes?
22 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Si se usa el punto decimal como línea divisoria entre el tallo y las hojas, tenemos sólo cinco
tallos que no producen una imagen muy buena. Cuando se divide cada uno de los tallos en dos
líneas, hay ocho tallos porque la primera línea del tallo 5 y la segunda línea del tallo 9 están
vacías. Esto produce una gráfica más descriptiva, como se muestra en la figura 1.11. Para estos
datos, la unidad de hoja es .1 y el lector puede inferir que el tallo y hoja 8 y 2, por ejemplo,
representan la medición x = 8.2.

FIGURA 1.11
Gráfica de tallo y hoja para 5 86 5 68
los datos de la tabla 1.8 6 12 6 12
6 8887 Reordenamiento → 6 7888
7 221 7 122
7 879577587 7 557777889
8 0222 8 0222
8 565 8 556
9 040 Unidad de hoja .1 9 004

Si la gráfica de tallo y hoja se gira hacia un lado de modo que la recta vertical sea ahora
un eje horizontal, se observa que los datos se han “apilado” o “distribuido” a lo largo del eje,
de modo que se puede describir como “forma de montículo”. Esta gráfica de nuevo muestra
que los pesos de estos 30 recién nacidos varían entre 5.6 y 9.4; muchos pesos están entre 7.5 y
8.0 libras.

Interpretación de gráficas con ojo crítico


Una vez creada una gráfica o varias gráficas para un conjunto de datos, ¿qué debe buscarse al
tratar de describir los datos?

• Primero, verificar las escalas horizontales y verticales, de manera que haya claridad
en relación con lo que se mide.
• Examinar el lugar de la distribución de datos. ¿Dónde está el centro de distribución
del eje horizontal? Si se comparan dos distribuciones, ¿están centradas en el mismo
lugar?
• Examinar la forma de la distribución. ¿La distribución tiene un “pico”, un punto que es
más alto que cualquier otro? Si es así, ésta es la medición o categoría que se presenta
con más frecuencia. ¿Hay más de un pico? ¿Hay un número aproximadamente igual de
mediciones a la izquierda y a la derecha del pico?
• Buscar cualesquier mediciones poco comunes o resultados atípicos. Esto es, ¿hay
mediciones mucho mayores o menores que las otras? Es posible que estos resultados
atípicos no sean representativos de los otros valores del conjunto.

Es frecuente que las distribuciones se describan según sus formas.

Definición Una distribución es simétrica si los lados izquierdo y derecho de la distribu-


ción, cuando se divide en el valor medio, forman imágenes espejo.
Una distribución está sesgada a la derecha si una proporción más grande de las mediciones
se encuentra a la derecha del valor pico. Las distribuciones sesgadas a la derecha contienen
pocas mediciones anormalmente grandes.
1.4 GRÁFICAS PARA DATOS CUANTITATIVOS 23

Una distribución está sesgada a la izquierda si una proporción mayor de las mediciones está
a la izquierda del valor pico. Las distribuciones sesgadas a la izquierda contienen pocas me-
diciones anormalmente pequeñas.
Una distribución es unimodal si tiene un pico; una distribución bimodal tiene dos picos. Las
distribuciones bimodales representan a veces una combinación de dos poblaciones diferentes
del conjunto de datos

EJEMPLO 1.9 Examine las tres gráficas de puntos que se muestran en la figura 1.12. Describa estas distribu-
ciones en términos de sus ubicaciones y formas.

FIGURA 1.12
Formas de distribución de
datos para el ejemplo 1.19

1 2 3 4 5 6 7

2 4 6 8

2 4 6 8

MI CONSEJO Solución La primera gráfica de puntos muestra una distribución relativamente simétrica
Simétrica ⇔ imágenes
con un solo pico situado en x = 4. Si se dobla la página en este pico, las mitades izquierda y
espejo derecha casi serían imágenes espejo. La segunda gráfica, no obstante, está lejos de ser simé-
Sesgada a la derecha ⇔ trica. Tiene una larga “cola derecha”, lo cual significa que hay unas pocas observaciones anor-
cola larga a la derecha malmente grandes. Si se dobla la página en el pico, estaría en el lado derecho una proporción
Sesgada a la izquierda ⇔ de mediciones más grande que en el izquierdo. Esta distribución está sesgada a la derecha.
cola larga a la izquierda
Del mismo modo, la tercera gráfica de puntos con una larga “cola a la izquierda” está sesgada
a la izquierda.

EJEMPLO 1.10 Un asistente administrativo del departamento de atletismo de una universidad local está ob-
servando los promedios de calificaciones de ocho miembros del equipo femenil de volibol. El
asistente introduce los promedios en la base de datos pero por accidente coloca mal el punto
decimal de la última entrada.
2.8 3.0 3.0 3.3 2.4 3.4 3.0 .21
24 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Use una gráfica de puntos para describir los datos y descubrir el error del asistente.
Solución La gráfica de puntos de este pequeño conjunto de datos se muestra en la figura
1.13a). Claramente se distingue el resultado atípico u observación poco común causada por el
error del asistente al introducir los datos. Una vez corregido el error, como en la figura 1.13b),
se observa la distribución correcta del conjunto de datos. Como éste es un conjunto muy pe-
queño, es difícil describir la forma de la distribución aun cuando parece tener un valor pico
alrededor de 3.0 y parece ser relativamente simétrica.

(a)
FIGURA 1.13
Distribuciones de
promedios de calificaciones
para el ejemplo 1.10

0.5 1.0 1.5 2.0 2.5 3.0 3.5


Promedios de calificaciones

(b)

2.2 2.4 2.6 2.8 3.0 3.2 3.4


Promedios de calificaciones

Cuando se comparen gráficas creadas para dos conjuntos de datos, se deben comparar sus
escalas de medición, ubicaciones y formas, y buscar mediciones poco comunes o resultados
MI CONSEJO atípicos. Recuerde que estos últimos no siempre son causados por errores o introducción erró-
Los resultados atípicos
nea de datos. A veces dan información muy valiosa que no debe ser soslayada. Es posible que
están lejos del cuerpo se necesite más información para determinar si un resultado atípico es una medición válida
principal de datos que sólo sea anormalmente grande o pequeña, o si ha habido algún tipo de error en la recolec-
ción de datos. Si las escalas difieren en mucho, debe tenerse cuidado al hacer comparaciones
o ¡sacar conclusiones que pudieran ser imprecisas!

HISTOGRAMAS DE FRECUENCIA RELATIVA


1.5
Un histograma de frecuencia relativa es semejante a una gráfica de barras, pero se usa para
graficar cantidades en lugar de datos cualitativos. Los datos de la tabla 1.9 son los pesos de 30
bebés de gestación completa al momento de nacer, reproducidos del ejemplo 1.8 y mostrados
como gráfica de puntos en la figura 1.14a). Primero, dividimos el intervalo de las mediciones
más pequeñas a las más grandes en subintervalos o clases de igual longitud. Si se ponen en
columna los puntos de cada subintervalo (figura 1.14b)) y se traza una barra sobre cada una de
las columnas, se habrá creado un histograma de frecuencia o un histograma de frecuencia
relativa, dependiendo de la escala del eje vertical.
1.5 HISTOGRAMAS DE FRECUENCIA RELATIVA 25

TABLA 1.9 Pesos de 30 bebés de gestación completa al momento de nacer


7.2 7.8 6.8 6.2 8.2
8.0 8.2 5.6 8.6 7.1
8.2 7.7 7.5 7.2 7.7
5.8 6.8 6.8 8.5 7.5
6.1 7.9 9.4 9.0 7.8
8.5 9.0 7.7 6.7 7.7

FIGURA 1.14
(a)
Cómo construir un 6.0 6.6 7.2 7.8 8.4 9.0
histograma Pesos al nacer

(b)
6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5
Pesos al nacer

Definición Un histograma de frecuencia relativa, para un conjunto de datos cuantitati-


vo, es una gráfica de barras en la que la altura de la barra muestra “con qué frecuencia” (me-
dida como proporción o frecuencia relativa) las mediciones caen en una clase o subintervalo
particular. Las clases o subintervalos se grafican a lo largo del eje horizontal.

Como regla práctica, el número de clases debe ser de 5 a 12; cuantos más datos haya, más
clases se requieren.† Las clases deben ser elegidas para que cada una de las mediciones caiga
en una clase y sólo en una. Para los pesos al nacer que se muestran en la tabla 1.9, decidimos
MI APPLET EN LÍNEA usar ocho intervalos de igual longitud. Como el intervalo de pesos al nacer es
“Construcción de un 9.4 5.6 3.8
histograma”
“Lanzamiento de
monedas” el ancho mínimo de clase necesario para cubrir el margen de los datos es (3.8 8) .475.
Para más comodidad, redondeamos este ancho aproximado a .5. Empezando el primer inter-
valo al valor más bajo, 5.6, formamos subintervalos desde 5.6 hasta, pero no incluyendo 6.1,
de 6.1 hasta, pero no incluyendo 6.6, y así sucesivamente. Usando el método de inclusión
izquierda, e incluyendo el punto de frontera de clase izquierda pero no el punto de frontera
derecha en la clase, eliminamos cualquier confusión acerca de dónde poner una medición que
resulte caer en un punto de frontera de clase.
La tabla 1.10 muestra las ocho clases, marcadas de 1 a 8 para identificación. Las fronteras
para las ocho clases, junto con un total del número de mediciones que caen en cada una de
ellas, también se muestran en la tabla. Al igual que con las gráficas de la sección 1.3, podemos
ahora medir con qué frecuencia se presenta cada clase usando frecuencia o frecuencia relativa.


Es posible emplear esta tabla como guía para seleccionar un número apropiado de clases. Recuerde que esto es sólo una
guía; puede usar más o menos clases de las que recomienda la tabla si con ello se hace más descriptiva la gráfica.
Tamaño de la muestra 25 50 100 200 500
Número de clases 6 7 8 9 10
26 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Para construir el histograma de frecuencia relativa, grafique las fronteras de clase a lo largo
del eje horizontal. Trace una barra sobre cada intervalo de clase, con altura igual a la frecuen-
cia relativa para esa clase. El histograma de frecuencia relativa para los datos de peso al nacer,
figura 1.15, muestra de un vistazo la forma en que están distribuidos los pesos al nacer en el
intervalo de 5.6 a 9.4.

TABLA 1.10 Frecuencias relativas para los datos de la tabla 1.9


Frecuencia
Fronteras Frecuencia relativa de
Clase de clase Registro de clase clase
MI CONSEJO
1 5.6 a 6.1 II 2 2/30
Las frecuencias relativas 2 6.1 a 6.6 II 2 2/30
totalizan 1; las frecuencias 3 6.6 a 7.1 IIII 4 4/30
totalizan n 4 7.1 a 7.6 IIII 5 5/30
5 7.6 a 8.1 IIII III 8 8/30
6 8.1 a 8.6 IIII 5 5/30
7 8.6 a 9.1 III 3 3/30
8 9.1 a 9.6 I 1 1/30

FIGURA 1.15
Histograma de frecuencia
relativa
8/30

7/30
Frecuencia relativa

6/30

5/30

4/30

3/30

2/30

1/30

0
5.6 6.1 6.6 7.1 7.6 8.1 8.6 9.1 9.6
Pesos al nacer

EJEMPLO 1.11 Veinticinco clientes de Starbucks® son entrevistados en una encuesta de mercadeo y se les
pregunta, “¿con qué frecuencia visita usted Starbucks en una semana típica?”. La tabla 1.11 es
una lista de respuestas para estos 25 clientes. Construya un histograma de frecuencia relativa
para describir los datos.

TABLA 1.11 Número de visitas en una semana típica para 25 clientes


6 7 1 5 6
4 6 4 6 8
6 5 6 3 4
5 5 5 7 6
3 5 7 5 5

Solución La variable que se mide es el “número de visitas a Starbucks”, que es una varia-
ble discreta que toma sólo valores enteros. En este caso, lo más sencillo es elegir las clases o
subintervalos como los valores enteros en el rango de valores observados: 1, 2, 3, 4, 5, 6 y 7.
La tabla 1.12 muestra las clases y sus frecuencias correspondientes y frecuencias relativas. El
histograma de frecuencia relativa se muestra en la figura 1.16.
1.5 HISTOGRAMAS DE FRECUENCIA RELATIVA 27

TABLA 1.12 Tabla de frecuencia para el ejemplo 1.11


Número
de visitas a Frecuencia
Starbucks Frecuencia relativa
1 1 .04
2 — —
3 2 .08
4 3 .12
5 8 .32
6 7 .28
7 3 .12
8 1 .04

FIGURA 1.16
Histograma para el
ejemplo 1.11
8/25
Frecuencia relativa

6/25

4/25

2/25

0
1 2 3 4 5 6 7 8
Visitas

Observe que la distribución está sesgada a la izquierda y que hay una brecha entre 1 y 3.

NECESITO SABER...

Cómo construir un histograma de frecuencia relativa


1. Elija el número de clases, por lo general entre 5 y 12. Cuantos más datos se tengan, más
clases deben usarse.
2. Calcule la amplitud aproximada de clase al dividir la diferencia entre los valores máximo
y mínimo entre el número de clases.
3. Redondee el ancho aproximado de clase hasta un número cómodo.
4. Si los datos son discretos, se asigna una clase para cada valor entero tomado por los datos.
Para un número grande de valores enteros, será necesario agruparlos en clases.
5. Localice las fronteras de clase. La clase más baja debe incluir la medición más pequeña. A
continuación sume las clases restantes usando el método de inclusión izquierda.
6. Construya una tabla estadística que contenga las clases, sus frecuencias y sus frecuencias
relativas.
7. Construya un histograma como una barra de gráficas, graficando intervalos de clase en el
eje horizontal y frecuencias relativas como las alturas de las barras.
28 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Se usa un histograma de frecuencia relativa para describir la distribución de un conjunto de


datos en términos de su ubicación y forma, y ver si hay resultados atípicos como hizo usted
con otras gráficas. Por ejemplo, los datos de peso al nacimiento fueron relativamente simétri-
cos, sin mediciones poco comunes, en tanto que los datos de Starbucks estuvieron sesgados
a la izquierda. Como la barra construida arriba de cada clase representa la frecuencia relativa
o proporción de las mediciones en esa clase, estas alturas se utilizan para darnos información
adicional:

• La proporción de las medidas que caen en una clase o grupo particular de clases
• La probabilidad de que una medida tomada al azar del conjunto caerá en una clase
particular o grupo de clases

Considere el histograma de frecuencia relativa para los datos del peso al nacimiento de la
figura 1.15. ¿Qué proporción de los recién nacidos tienen al nacer pesos de 7.6 o mayores?
Esto abarca todas las clases de más de 7.6 en la tabla 1.10. Como hay 17 recién nacidos en esas
clases, la proporción de quienes tienen pesos al nacer de 7.6 o más es 17/30, o sea alrededor
de 57%. Éste también es el porcentaje del área total bajo el histograma de la figura 1.15 que
está a la derecha de 7.6.
Supongamos que usted escribió cada uno de los 30 pesos al nacer en pedazos de papel, los
puso en un sombrero y sacó uno de ellos al azar. ¿Cuál es la probabilidad de que este papelito
contenga un peso de 7.6 al nacimiento o más alto? Como 17 de los 30 papelitos caen en esta
categoría, hay 17 probabilidades en 30; esto es, la probabilidad es 17/30. La palabra probabi-
lidad no es desconocida para usted; la estudiaremos en más detalle en el capítulo 4.
Aun cuando estamos interesados en describir un conjunto de n = 30 mediciones, también
podríamos estar interesados en la población de la cual se tomó la muestra, que es el conjunto
de pesos al nacer de todos los bebés nacidos en este hospital. O bien, si estamos interesados en los
pesos de recién nacidos en general, podríamos considerar nuestra muestra como representativa de
la población de pesos al nacer para recién nacidos en hospitales metropolitanos similares. Un his-
tograma de muestra da valiosa información acerca del histograma de población, es decir, la gráfica
que describe la distribución de toda la población. Recuerde, sin embargo, que diferentes muestras
de la misma población producirán histogramas diferentes, aun cuando se usen fronteras de la
misma clase. No obstante, puede esperarse que los histogramas de la muestra y población sean
similares. Al agregar más y más datos a la muestra, los dos histogramas se hacen cada vez más
semejantes. Si se agranda la muestra para incluir toda la población, ¡ambos histogramas serán
idénticos!

1.5 EJERCICIOS

TÉCNICAS BÁSICAS b. Use la gráfica de tallo y hoja para hallar la observación


1.16 Construya una gráfica de tallo y hoja para mínima.
EX0116
estas 50 mediciones: c. Encuentre la octava y la novena observaciones más
grandes.
3.1 4.9 2.8 3.6 2.5 4.5 3.5 3.7 4.1 4.9
2.9 2.1 3.5 4.0 3.7 2.7 4.0 4.4 3.7 4.2
1.17 Consulte el ejercicio 1.16. Construya un histograma
3.8 6.2 2.5 2.9 2.8 5.1 1.8 5.6 2.2 3.4 de frecuencia relativa para los datos.
2.5 3.6 5.1 4.8 1.6 3.6 6.1 4.7 3.9 3.9 a. ¿Aproximadamente cuántos intervalos de clase debe usar?
4.3 5.7 3.7 4.6 4.0 5.6 4.9 4.2 3.1 3.9
b. Supongamos que usted decide usar clases que empiezan
en 1.6 con ancho de clase de .5 (es decir, 1.6 a <2.1, 2.1
a. Describa la forma de la distribución de datos. ¿Nota
a <2.6). Construya el histograma de frecuencia relativa
algunos resultados atípicos?
para los datos.
1.5 HISTOGRAMAS DE FRECUENCIA RELATIVA 29

c. ¿Qué fracción de las mediciones es menor que 5.1? Genere una gráfica de líneas para describir los datos.
d. ¿Qué fracción de las mediciones es mayor que 3.6? ¿Piensa usted que hay algún aprendizaje?
e. Compare el histograma de frecuencia relativa con Día 1 2 3 4 5
la gráfica de tallo y hoja del ejercicio 1.16. ¿Son Tiempo (segundos) 45 43 46 32 25
semejantes las formas?
1.18 Considere este conjunto de datos: 1.22 Medición en el tiempo El valor de una
EX0118 EX0122 variable cuantitativa se mide una vez al año
durante un periodo de 10 años. He aquí los datos:
4.5 3.2 3.5 3.9 3.5 3.9
4.3 4.8 3.6 3.3 4.3 4.2 Año Medición Año Medición
3.9 3.7 4.3 4.4 3.4 4.2
4.4 4.0 3.6 3.5 3.9 4.0 1 61.5 6 58.2
2 62.3 7 57.5
3 60.7 8 57.5
4 59.8 9 56.1
a. Construya una gráfica de tallo y hoja usando el dígito 5 58.0 10 56.0
inicial como tallo.
b. Construya una gráfica de tallo y hoja usando dos veces a. Genere una gráfica de líneas para describir la variable
cada uno de los dígitos iniciales. ¿Esta técnica mejora la conforme cambie con el tiempo.
presentación de los datos? Explique. b. Describa las mediciones usando la gráfica construida en
1.19 Una variable discreta puede tomar sólo los valores la parte a.
de 0, 1 o 2. Un conjunto de 20 mediciones sobre esta 1.23 Hamburguesas con queso Cree una gráfica
variable se muestra aquí: de puntos para la cantidad de hamburguesas con queso
1 2 1 0 2 consumidas por 10 estudiantes universitarios en una
2 1 1 0 0 determinada semana.
2 2 1 1 0
0 1 2 1 1 4 5 4 2 1
3 3 4 2 7
a. Construya un histograma de frecuencia relativa para los
datos. a. ¿Cómo describiría la forma de la distribución?
b. ¿Qué proporción de las mediciones es mayor que 1? b. ¿Qué proporción de los estudiantes comieron más de
cuatro hamburguesas con queso esa semana?
c. ¿Qué proporción de las mediciones es menor que 2?
1.24 Calificaciones de examen Las
d. Si una medición se selecciona al azar de entre las 20 calificaciones en un examen de 100 puntos se
mediciones mostradas, ¿cuál es la probabilidad de que EX0124
registraron para 20 estudiantes:
sea un 2?
e. Describa la forma de la distribución. ¿Ve algunos 61 93 91 86 55 63 86 82 76 57
resultados atípicos? 94 89 67 62 72 87 68 65 75 84

1.20 Consulte el ejercicio 1.19. a. Use una gráfica apropiada para describir los datos.
a. Trace una gráfica de puntos para describir los datos. b. Describa la forma y ubicación de las calificaciones.
b. ¿Cómo definiría usted el tallo y la hoja para este c. ¿Es poco común la forma de la distribución?
conjunto de datos? ¿Considera alguna razón por la que la distribución de
c. Trace la gráfica de tallo y hoja usando su decisión de la las calificaciones tendría esa forma?
parte b.
d. Compare la gráfica de puntos, la gráfica de tallo y hoja APLICACIONES
y el histograma de frecuencia relativa (ejercicio 1.19). 1.25 Tiempos de supervivencia Altman y Bland
¿Reflejan todos más o menos la misma información? informaron sobre los tiempos de supervivencia
EX0125
1.21 Navegar en un laberinto Un psicólogo para los pacientes con hepatitis activa, una mitad
experimental midió el tiempo que tardó una rata para del grupo recibió tratamiento con prednisona y la otra
navegar con éxito por un laberinto en cada uno de cinco no recibió tratamiento.7 Los datos que siguen se han
días. Los resultados se muestran en la tabla siguiente. adaptado de los datos de aquellos tratados con prednisona.
30 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Los tiempos de supervivencia se registraron al mes más c. ¿Cómo resumiría la información mostrada en la gráfica
próximo. sobre los niveles educativos y salarios?
8 87 127 147 1.28 Preescolar A continuación se proporciona
11 93 133 148 la lista de las edades (en meses) de 50 niños que
EX0128
52 97 139 157 se inscribieron por primera vez en una escuela
57 109 142 162 preescolar.
65 120 144 165
38 40 30 35 39 40 48 36 31 36
a. Observe los datos. ¿Adivina la forma aproximada de la 47 35 34 43 41 36 41 43 48 40
distribución de los datos? 32 34 41 30 46 35 40 30 46 37
b. Construya un histograma de frecuencia relativa para los 55 39 33 32 32 45 42 41 36 50
42 50 37 39 33 45 38 46 36 31
datos. ¿Cuál es la forma de la distribución?
c. ¿Hay algún resultado atípico en el conjunto? De ser así,
a. Construya una gráfica de tallo y hoja para los datos.
¿cuáles tiempos de supervivencia son anormalmente
cortos? b. Elabore un histograma de frecuencia relativa para estos
datos. Empiece la frontera inferior de la primera clase
1.26 Una enfermedad recurrente El tiempo
en 30 y use un ancho de clase de 5 meses.
EX0126
(en meses) entre el inicio de una enfermedad en
particular y su recurrencia se registró para c. Compare las gráficas de las partes a y b. ¿Hay alguna
n = 50 pacientes: diferencia importante que le haría elegir una como el
mejor método para exhibir los datos?
2.1 4.4 2.7 32.3 9.9 9.0 2.0 6.6 3.9 1.6
d. ¿Qué proporción de los niños tenían 35 meses (2 años,
14.7 9.6 16.7 7.4 8.2 19.2 6.9 4.3 3.3 1.2
4.1 18.4 .2 6.1 13.5 7.4 .2 8.3 .3 1.3 11 meses) o más, pero menos de 45 meses (3 años,
14.1 1.0 2.4 2.4 18.0 8.7 24.0 1.4 8.2 5.8 9 meses) de edad cuando se inscribieron por primera
1.6 3.5 11.4 18.0 26.7 3.7 12.6 23.1 5.6 .4 vez en preescolar?
a. Construya un histograma de frecuencia relativa para los e. Si un niño fuera seleccionado al azar de este grupo,
datos. ¿cuál es la probabilidad de que tuviera menos de 50
meses de edad (4 años, 2 meses) cuando se inscribió por
b. ¿Describiría usted la forma como aproximadamente
primera vez en preescolar?
simétrica, sesgada a la derecha o sesgada a la izquierda?
1.29 Religión organizada Las estadísticas de
c. Dé la fracción de tiempos de recurrencia menores o
las religiones del mundo son aproximaciones muy
iguales a 10 meses. EX0129
vagas, dado que muchas no dan seguimiento a sus
1.27 La educación funciona La educación miembros. Una estimación de estos números (en millones)
EX0127
funciona, según una instantánea dada por el Bureau se muestra en la tabla siguiente.9
of Labor Statistics.8 La mediana de los ingresos
anuales para seis niveles diferentes de educación se Miembros Miembros
muestra en la tabla: Religión (millones) Religión (millones)
Budismo 376 Judaismo 14
Nivel de educación Mediana de ingresos semanales ($) Cristianismo 2100 Sijismo 23
Menos que diploma de bachillerato 454 Hinduismo 900 China tradicional 394
Graduado de bachillerato 626 Islamismo 1500 Otra 61
Algo de universidad, sin título 699 Indígenas primitivas y
Título técnico 761 africanas tradicionales 400
Título de licenciatura
Título de maestría 1025
Título de especialidad 1257
Título de doctorado 1529 a. Elabore una gráfica de pastel para describir el total de
Mediana de ingresos semanales ($) 1532 miembros en las religiones organizadas del mundo.
Fuente: Bureau of Labor Statistics, Current Population Survey b. Construya una gráfica de barras para describir el total
de miembros en las religiones organizadas del mundo.
a. ¿Qué métodos gráficos usaría usted para describir los c. Ordene los grupos religiosos del número de miembros
datos? menor al mayor. Elabore una gráfica de Pareto para
b. Seleccione el método de la parte a que usted piensa describir los datos. ¿Cuál de las tres es más eficaz?
describe mejor los datos y cree la gráfica apropiada.
1.5 HISTOGRAMAS DE FRECUENCIA RELATIVA 31

1.30 ¿Qué tan larga es la fila? Para determinar Washington 67 Arthur 56


el número de cajas de pago que en el futuro es J. Adams 90 Cleveland 71
EX0130
Jefferson 83 B. Harrison 67
necesario construir, una cadena de supermercados
Madison 85 McKinley 58
desea obtener información del tiempo (en minutos) Monroe 73 T. Roosevelt 60
necesario para dar servicio a los clientes. Para hallar la J. Q. Adams 80 Taft 72
distribución de tiempos de tal servicio, se registró una Jackson 78 Wilson 67
muestra de tiempos de servicio a 60 clientes, los cuales Van Buren 79 Harding 57
W. H. Harrison 68 Coolidge 60
se muestran a continuación:
Tyler 71 Hoover 90
3.6 1.9 2.1 .3 .8 .2 1.0 1.4 1.8 1.6 Polk 53 F. D. Roosevelt 63
1.1 1.8 .3 1.1 .5 1.2 .6 1.1 .8 1.7 Taylor 65 Truman 88
1.4 .2 1.3 3.1 .4 2.3 1.8 4.5 .9 .7 Fillmore 74 Eisenhower 78
.6 2.8 2.5 1.1 .4 1.2 .4 1.3 .8 1.3 Pierce 64 Kennedy 46
1.1 1.2 .8 1.0 .9 .7 3.1 1.7 1.1 2.2 Buchanan 77 L. Johnson 64
1.6 1.9 5.2 .5 1.8 .3 1.1 .6 .7 .6 Lincoln 56 Nixon 81
A. Johnson 66 Ford 93
Grant 63 Carter 93
a. Construya una gráfica de tallo y hoja para los datos. Hayes 70 Reagan 93
b. ¿Qué fracción de los tiempos de servicio son menores Garfield 49
que o iguales a 1 minuto?
c. ¿Cuál de las 60 mediciones es la más pequeña?
1.31 Tiempos de servicio, continúa Consulte el a. Antes de graficar los datos, trate de visualizar la
ejercicio 1.30. Construya un histograma de frecuencia distribución de las edades al fallecimiento de los
relativa para los tiempos de servicio de supermercado. presidentes. ¿Qué forma piensa usted que tendrá?
a. Describa la forma de la distribución. ¿Observa algunos b. Construya una gráfica de tallo y hoja para los datos.
resultados atípicos? Describa la forma. ¿Le sorprende?
b. Suponiendo que los resultados atípicos de este c. Los cinco presidentes más jóvenes al momento de
conjunto de datos sean observaciones válidas, ¿cómo su fallecimiento aparecen en la “cola” inferior de la
los explicaría a la administración de la cadena de distribución. Tres de los cinco más jóvenes tienen una
supermercados? característica común. Identifique los cinco presidentes
c. Compare el histograma de frecuencia relativa con la más jóvenes a su fallecimiento. ¿Qué característica
gráfica de tallo y hoja del ejercicio 1.30. ¿Las dos común explica estas mediciones?
gráficas reflejan la misma información? 1.34 Cantidades de glóbulos rojos La cantidad
1.32 Contenido de calcio El contenido de de glóbulos rojos de una persona sana se midió en
EX0134
EX0132 calcio (Ca) de una sustancia mineral en polvo cada uno de 15 días. El número registrado se midió
fue analizado 10 veces, con las siguientes en 106 células por microlitro (mL).
composiciones porcentuales registradas:
5.4 5.2 5.0 5.2 5.5
.0271 .0282 .0279 .0281 .0268 5.3 5.4 5.2 5.1 5.3
.0271 .0281 .0269 .0275 .0276 5.3 4.9 5.4 5.2 5.2

a. Trace una gráfica de puntos para describir los datos.


(SUGERENCIA: La escala del eje horizontal debe ir de a. Use una gráfica apropiada para describir los datos
.0260 a .0290). b. Describa la forma y ubicación de las cantidades de
b. Trace una gráfica de tallo y hoja para los datos. Use los glóbulos rojos.
números de centenas y millares como tallo. c. Si la cantidad de glóbulos rojos de la persona se mide
c. ¿Algunas de las mediciones son inconsistentes con las hoy como 5.7 106/mL, ¿usted consideraría que esto
otras mediciones, indicando así que el técnico pudo es poco común? ¿Qué conclusiones podría obtener?
haber cometido un error en el análisis? 1.35 Campeones de bateo Los directivos
1.33 Presidentes de Estados Unidos La del béisbol de ligas mayores han coronado a un
EX0135
EX0133 siguiente tabla lista las edades que tenían al campeón de bateo en la Liga Nacional cada año
momento de fallecer 39 presidentes de Estados desde 1876. En la tabla siguiente aparece una muestra de
Unidos desde George Washington hasta Ronald Reagan:5 promedios ganadores de bateo:5
32 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

Año Nombre Promedio a. Trace una gráfica de tallo y hoja para los datos.
2000 Todd Helton .372 Describa la forma de la distribución. ¿Hay algunos
1915 Larry Doyle .320 resultados atípicos?
1917 Edd Roush .341 b. Construya una gráfica de puntos para los datos. ¿Cuál
1934 Paul Waner .362
de las dos gráficas es más informativa? Explique.
1911 Honus Wagner .334
1898 Willie Keeler .379 1.37 Desechos peligrosos ¿Qué tan seguro es
1924 Roger Hornsby .424 EX0137
su vecindario? ¿Hay algunos lugares cercanos con
1963 Tommy Davis .326 desechos peligrosos? La tabla siguiente muestra el
1992 Gary Sheffield .330 número de lugares con desechos peligrosos en cada uno
1954 Willie Mays .345 de los 50 estados de la Unión Americana y el Distrito de
1975 Bill Madlock .354
1958 Richie Ashburn .350
Columbia en el año 2009:5
1942 Ernie Lombardi .330
AL 15 HI 3 MA 32 NM 14 SD 2
1948 Stan Musial .376
AK 6 ID 9 MI 69 NY 90 TN 15
1971 Joe Torre .363
AZ 9 IL 48 MN 25 NC 36 TX 50
1996 Tony Gwynn .353
AR 9 IN 32 MS 6 ND 0 UT 19
1961 Roberto Clemente .351 CA 96 IA 12 MO 31 OH 41 VT 11
1968 Pete Rose .335 CO 20 KS 12 MT 17 OK 9 VA 31
1885 Roger Connor .371 CT 15 KY 14 NE 13 OR 13 WA 48
2009 Hanley Ramirez .342 DE 15 LA 12 NV 1 PA 97 WV 9
DC 1 ME 12 NH 21 RI 12 WI 39
a. Construya un histograma de frecuencia relativa FL 55 MD 19 NJ 114 SC 26 WY 2
para describir los promedios de bateo para estos 20 GA 16
campeones.
a. ¿Qué variable se está midiendo? ¿La variable es discreta
b. Si usted eligiera al azar uno de los 20 nombres, ¿qué
o continua?
probabilidad hay de que elija un jugador cuyo promedio
fuera arriba de .400 para su año de campeonato? b. Describa la forma de la distribución de datos utilizando
la gráfica de tallo y hoja que aquí se presenta.
1.36 Mejores 20 películas La tabla siguiente
Identifique las mediciones anormalmente grandes
EX0136 presenta las ventas brutas de boletos en fin de
marcadas “HI” por estado.
semana para las mejores 20 películas para el fin de
semana del 25 de junio de 2010.10
Gráfica de tallo y hoja: Desechos peligrosos
Venta bruta Tallo y hoja de los sitios N = 51
fin de semana Unidad de hoja = 1.0
Película ($ millones) 6 0 011223
13 0 6699999
1.Toy Story 3 59.3 23 1 1222223344
2. Son como niños 40.5 (8) 1 55556799
3. Encuentro explosivo 20.1 20 2 01
4. Karate Kid 15.5 18 2 56
5. Los magníficos 6.2 16 3 1122
6. Misión rockstar 3.1 12 3 69
7. Shrek para siempre 3.1 10 4 1
9 4 88
8. Príncipe de Persia 2.8 7 5 0
9. Killers 1.9 6 5 5
10. Jonah Hex 1.6
HI 69, 90, 96, 97, 114
11. Iron Man 2 1.4
12. Sexo en la ciudad 2 1.2
13. Marmaduke 1.0
14. Robin Hood 0.6 c. ¿Encuentra usted alguna razón por la que estos cinco
15. Un hombre solitario 0.5 estados tengan un gran número de sitios con desechos
16. Cómo entrenar a tu dragón 0.5
17. Invierno profundo 0.4
peligrosos? ¿Qué otra variable podría medir para
18. Cartas a Julieta 0.4 ayudar a explicar por qué los datos se comportan así?
19. Joan Rivers: A Piece of Work 0.4
20. Cyrus 0.3
Fuente: www.radiofree.com/mov-tops.shtml
TECNOLOGÍA ACTUAL 33

Conforme usted siga trabajando los ejercicios de este capítulo, adquirirá más experiencia
para reconocer diferentes tipos de datos y determinar el método gráfico más apropiado. Re-
cuerde que el tipo de gráfica que use no es tan importante como la interpretación que acompa-
ña a la imagen. Busque estas importantes características:

• Ubicación del centro de los datos


• Forma de la distribución de datos
• Observaciones poco comunes del conjunto de datos

Al utilizar estas características como guía, será capaz de interpretar y comparar conjuntos de
datos usando métodos gráficos, que son sólo la primera de numerosas herramientas estadísti-
cas que pronto tendrá a su disposición.

REPASO DEL CAPÍTULO

Conceptos clave a. Gráficas de pastel


b. Gráficas de barras
I. Cómo se generan datos
2. Datos cuantitativos
1. Unidades experimentales, variables, mediciones
a. Gráficas de pastel y de barras
2. Muestras y poblaciones
b. Gráficas de líneas
3. Datos univariados, bivariados y multivariados
c. Gráficas de puntos
II. Tipos de variables
d. Gráficas de tallo y hoja
1. Cualitativas o categóricas
e. Histogramas de frecuencia relativa
2. Cuantitativas
3. Descripción de distribuciones de datos
a. Discretas
a. Formas: simétricas, sesgadas a la izquierda,
b. Continuas
sesgadas a la derecha, unimodales, bimodales
III. Gráficas para distribuciones univariadas b. Proporción de mediciones en ciertos
de datos
intervalos
1. Datos cualitativos o categóricos c. Resultados atípicos

TECNOLOGÍA ACTUAL

Introducción a Microsoft Excel

MS Excel es un programa de hoja de cálculo en el paquete de Microsoft Office. Está diseñado


para una variedad de aplicaciones analíticas, incluyendo las estadísticas. Supondremos que us-
ted está familiarizado con Windows y que conoce las técnicas básicas necesarias para ejecutar
comandos desde las pestañas, grupos y menús desplegables en la parte superior de la pantalla.
De no ser así, quizás un auxiliar de laboratorio o un asistente de enseñanza le ayuden a do-
minar lo básico. La versión actual de MS Excel al momento de la publicación de este libro es
Excel 2010, usado en el ambiente Windows 7. Cuando se abre el programa, aparece una hoja
de cálculo (véase la figura 1.17), que contiene renglones y columnas en las que se pueden
introducir datos. Las pestañas en la parte inferior de la pantalla identifican las tres hojas de
trabajo disponibles para usar; cuando se guardan como una colección, estas hojas de trabajo
se llaman libros de trabajo.
34 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

FIGURA 1.17

Elaboración de gráficas con Excel


Es posible crear gráficas de pastel, de barras y de líneas en MS Excel. Los datos se intro-
ducen en una hoja de cálculo de Excel, incluyendo etiquetas si es necesario. Resalte los datos
que se van a graficar y luego haga clic en el tipo de gráfica que desee en la pestaña Insert en el
grupo Charts. Una vez que se ha creado la gráfica, puede editarse en una variedad de formas
para cambiar su apariencia.

EJEMPLO 1.12 (Gráficas de pastel y barras) El nivel en clase de 105 estudiantes en un curso de introducción
a la estadística se lista en la tabla 1.13. Se ha asentado la variable cualitativa “nivel en clase”
para cada estudiante, y ya se han registrado las frecuencias.

TABLA 1.13 Nivel en clase de estudiantes en un curso de estadística


Nivel Primer año Segundo año Tercer año Último año Graduado
Frecuencia 5 23 32 35 10

1. Introduzca las categorías en la columna A de la primera hoja de cálculo y las frecuencias


en la columna B. Deberá tener dos columnas de datos, incluyendo las etiquetas.
2. Resalte los datos, usando el botón izquierdo del ratón para seleccionar y arrastrar desde
la celda A1 a la celda B6 (que en ocasiones se escribe A1:B6). Haga clic en la pestaña
Insert y seleccione Pie en el grupo Charts. En la lista desplegable verá una variedad de
estilos para elegir. Seleccione la primera opción para producir la gráfica de pastel. Haga
doble clic en el título “Frequency” y cambie el título a “Nivel del estudiante”.
3. Edición de la gráfica de pastel: Una vez que se ha creado la gráfica, use el ratón
para asegurarse de que la gráfica está seleccionada. Deberá ver un área verde sobre
las pestañas marcada “Chart Tools”. Haga clic en la pestaña Design, y observe las
listas desplegables en los grupos Chart Layout y Chart Styles. Estas listas le permiten
modificar la apariencia de su gráfica. En la figura 1.18a), la gráfica de pastel se ha
cambiado de modo que los porcentajes se muestran en los sectores apropiados. Al hacer
clic en la leyenda, la hemos arrastrado de manera que quede más cerca de la gráfica de
pastel.
TECNOLOGÍA ACTUAL 35

(a)
FIGURA 1.18

Nivel del estudiante (b)

Nivel del estudiante

Primer año
Segundo año

Frecuencia
Tercer año
Último año
Graduado

Primer año Segundo año Tercer año Último año Graduado

4. Haga clic en varias partes de la gráfica de pastel (leyenda, área de la gráfica, sector) y
aparecerá un cuadro con puntos de anclaje redondos y/o cuadrados. Haga doble clic
y aparecerá un cuadro de diálogo. Ajuste la apariencia del objeto o la región seleccionados
en este cuadro y haga clic en OK. Haga clic en Cancel para salir del cuadro de diálogo
sin hacer ningún cambio.
5. Aun en la sección Design, pero en el grupo Type, haga clic en Change Chart Type y
elija el tipo Column más simple. Haga clic en OK para crear una gráfica de barras para
el mismo conjunto de datos, la cual se muestra en la figura 1.18b).
6. Edición de la gráfica de barras: Una vez más, puede experimentar con las diversas
opciones en los grupos Chart Layout y Chart Styles para cambiar el aspecto de la
gráfica. Haga clic en la gráfica de barras entera (“área de la gráfica”) o en el “área de
trazado” interior para alargar la gráfica. Cambie los colores haciendo doble clic en la
región apropiada. Hemos elegido un diseño que permite títulos en los ejes y eliminado
la “entrada de la leyenda de frecuencia”. También hemos elegido eliminar las cuadrículas
menores, al hacer clic en la pestaña Layout en Chart Tools, usando la lista desplegable
Gridlines y seleccionar Primary Horizontal Gridlines Major Gridlines. Hemos
disminuido los huecos entre las barras haciendo clic con el botón derecho en una de las
barras, seleccionando Format Data Series y cambiando Gap Width to 50%.

EJEMPLO 1.13 (Gráficas de líneas) El Promedio Industrial Dow Jones fue supervisado al cierre de las transac-
ciones durante 10 días en un año reciente, con los resultados que se muestran en la tabla 1.14.
TABLA 1.14 Promedio Industrial Dow Jones
Día 1 2 3 4 5 6 7 8 9 10
PIDJ 10,636 10,680 10,674 10,653 10,698 10,644 10,378 10,319 10,303 10,302

1. Haga clic en la pestaña en la parte inferior de la pantalla marcada “Sheet 2”. Introduzca
los Días en la columna A de esta segunda hoja de cálculo y el PIDJ en la columna B.
Deberá tener dos columnas de datos, incluyendo las etiquetas.
2. Resalte los datos del PIDJ en la columna B, usando el botón izquierdo del ratón para
hacer clic y arrastrar de la celda B1 a la celda B11 (escrito en ocasiones como B1:B11).
Haga clic en la pestaña Insert y seleccione Line en el grupo Charts. En la lista
desplegable, verá una variedad de estilos de dónde elegir. Seleccione la primera opción
para producir la gráfica de líneas.
3. Edición de la gráfica de líneas: Una vez más, puede experimentar con las diversas
opciones en los grupos Chart Layout y Chart Styles para cambiar el aspecto de la
gráfica. Hemos elegido un diseño que permite títulos en ambos ejes, los cuales hemos
cambiado a “Día” y “PIDJ”, y hemos eliminado el título y la “entrada de leyenda de
frecuencia”. La gráfica de líneas se muestra en la figura 1.19.
36 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

FIGURA 1.19

PIDJ

Día

4. Nota: Si su serie de tiempo implica periodos que no están igualmente espaciados, es mejor
usar una gráfica de dispersión con los puntos conectados para formar una gráfica de
línea. Este procedimiento se describe en la sección Tecnología actual en el capítulo 3
de este texto.

EJEMPLO 1.14 (Histogramas de frecuencia) Las 40 acciones principales en circulación en el mercado, cla-
sificadas por porcentaje de acciones sobresalientes negociadas en un día particular, se listan
en la tabla 1.15.

TABLA 1.15 Porcentaje de acciones en circulación negociadas


11.88 6.27 5.49 4.81 4.40 3.78 3.44 3.11 2.88 2.68
7.99 6.07 5.26 4.79 4.05 3.69 3.36 3.03 2.74 2.63
7.15 5.98 5.07 4.55 3.94 3.62 3.26 2.99 2.74 2.62
7.13 5.91 4.94 4.43 3.93 3.48 3.20 2.89 2.69 2.61

1. Muchos de los procedimientos estadísticos que se usarán en este libro requieren la


instalación del complemento Analysis ToolPak. Para cargar este complemento, haga
clic en File Options Add-ins. Seleccione Analysis ToolPak y haga clic en OK.
2. Haga clic en la pestaña en la parte inferior de la pantalla marcada “Sheet 3”. Introduzca
los datos en la primera columna de esta hoja de cálculo e incluya la etiqueta “Acciones”
en la primera celda.
3. Excel se refiere al valor máximo para cada intervalo de clase como un contenedor.
Esto significa que Excel está usando un método de inclusión derecha, el cual es
ligeramente diferente del método presentado en la sección 1.5. Para este ejemplo,
elegimos usar los intervalos de clase >2.5–3.5, >3.5–4.5, >4.5–5.5, etc. Introduzca los
valores de contenedor (3.5, 4.5, 5.5, ..., 12.5) en la segunda columna de la hoja de
cálculo, etiquetándolas como “Porcentaje negociado” en la celda B1.
4. Seleccione Data Data Analysis Histogram y haga clic en OK. Aparecerá el
cuadro de diálogo Histogram, como se muestra en la figura 1.20.
FIGURA 1.20
TECNOLOGÍA ACTUAL 37

5. Resalte o introduzca el Rango de entrada (Input Range) y Rango de contenedor (Bin


Range) apropiados para los datos. Observe que puede hacer clic en el botón minimizar
a la derecha del cuadro antes de hacer clic y arrastrar para resaltar. Haga clic de
nuevo en el botón minimizar para ver el cuadro de diálogo entero. El Rango de entrada
aparecerá como $A$1:$A$41, donde el signo monetario indica un rango de celda
absoluto. Asegúrese de hacer clic en las casillas de verificación “Labels” y “Chart
Output”. Elija una ubicación de celda conveniente para la salida (nosotros elegimos
D1) y haga clic en OK. La tabla de frecuencia y el histograma aparecerán en la hoja de
cálculo. El histograma (figura 1.21a)) no se ve como deseábamos.

(b)
FIGURA 1.21

(a)

Fracuencia
Histograma
Fracuencia

Frecuencia
Más

Más
Porcentaje negociado Porcentaje negociado

6. Edición del histograma: Haga clic en la entrada de la leyenda de frecuencia y oprima


la tecla Delete. Luego seleccione Data Series haciendo doble clic en una barra. En el
cuadro Series Options que aparece, cambie Gap Width a 0% (sin espacio) y haga clic
en Close. Alargue la gráfica arrastrando la esquina inferior derecha, y si es necesario
edite los colores, título y etiquetas para terminar su histograma, como se muestra en la
figura 1.21b). Recuerde que los números que se muestran a lo largo del eje horizontal
son los contenedores, el límite superior del intervalo de clase, no el punto medio del
intervalo.
7. Guarde su libro de Excel para usarlo más tarde empleando File Save o File Save As
y nómbrelo “Capítulo 1”.

TECNOLOGÍA ACTUAL

Introducción a MINITABTM
El software para computadora MINITAB es un programa para Windows diseñado de manera
específica para aplicaciones estadísticas. Supondremos que está familiarizado con Windows y
que conoce las técnicas básicas necesarias para ejecutar comandos desde las pestañas y menús
desplegables en la parte superior de la pantalla. De no ser así, quizás un auxiliar de laboratorio
o un asistente de enseñanza le ayude a dominar lo básico. La versión actual de MINITAB en
el momento de la publicación de este libro es MINITAB 16, usado en el ambiente Windows 7.
Cuando se abre el programa, se despliega la pantalla principal (véase la figura 1.22), la cual
contiene dos ventanas: la ventana Data, similar a la hoja de cálculo de Excel, y la ventana
Session, en la cual aparecerán sus resultados. Del mismo modo que con MS Excel, MINITAB le
permite guardar hojas de cálculo (parecidas a las hojas de cálculo de Excel), proyectos (colec-
ciones de hojas de cálculo) o gráficas.
38 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

FIGURA 1.22

Elaboración de gráficas con MINITAB


Todos los métodos gráficos que se han explicado en este capítulo se crean en MINITAB. Los
datos se introducen en una hoja de cálculo MINITAB, en la que se introducen las etiquetas en las
celdas grises justo debajo del nombre de la columna (C1, C2, etc.) en la ventana Data.

EJEMPLO 1.15 (Gráficas de pastel y barras) El nivel en clase de 105 estudiantes en un curso de introducción
a la estadística se lista en la tabla 1.16. Se ha asentado la variable cualitativa “nivel en clase”
para cada estudiante, y ya se han registrado las frecuencias.
TABLA 1.16 Nivel en clase de estudiantes en un curso de estadística

Nivel Primer año Segundo año Tercer año Último año Graduado
Frecuencia 5 23 32 35 10

1. Introduzca las categorías en la columna C1, con su propio nombre descriptivo, quizá
“Nivel” en la celda gris. Note que el nombre C1 ha cambiado a C1-T debido a que
usted introduce texto en lugar de números. Continúe nombrando la columna 2 (C2)
“Frecuencia” e introduzca las cinco frecuencias numéricas en C2.
2. Para construir una gráfica de pastel para estos datos, haga clic en Graph Pie Chart
y aparecerá un cuadro de diálogo (véase la figura 1.23). Haga clic en el botón de radio
marcado Chart values from a table. Luego coloque su cursor en el cuadro marcado
“Categorical variable”. El usuario puede 1) resaltar C1 en la lista a la izquierda y
elegir Select, 2) hacer doble clic en C1 en la lista a la izquierda o 3) escribir C1 en
el cuadro “Categorical variable”. Del mismo modo, coloque el cursor en el cuadro
marcado “Summary variables” y seleccione C2. Haga clic en Labels y seleccione la
pestaña marcada Slice Labels. Marque los cuadros denominados “Category names”
y “Percent”. Cuando haga clic dos veces en OK, MINITAB creará la gráfica de pastel
que se muestra en la figura 1.24a). Hemos eliminado la leyenda seleccionándola y
suprimiéndola.
TECNOLOGÍA ACTUAL 39

FIGURA 1.23

3. Conforme usted se vuelve más competente en el uso del comando de gráfica de pastel,
es posible que desee sacar ventaja de algunas de las opciones disponibles. Una vez
que se ha creado la gráfica, haga clic con el botón derecho en la gráfica de pastel y
seleccione Edit Pie. Puede cambiar los colores y el formato de la gráfica, “separar”
sectores importantes del pastel y cambiar el orden de las categorías. Si hace clic con
el botón derecho en la gráfica de pastel y selecciona Update Graph Automatically,
la gráfica de pastel se actualizará automáticamente cuando se cambien los datos en las
columnas C1 y C2 de la hoja de cálculo MINITAB.
4. Si desea construir una gráfica de barras, use el comando Graph Bar Chart. En
el cuadro de diálogo que aparece, seleccione Simple. Elija una opción en la lista
desplegable “Bars represent”, dependiendo de la forma en que se hayan introducido
los datos en la hoja de cálculo. Para los datos en la tabla 1.13, se eligió “Values from a
table” y se hizo clic en OK. Cuando aparezca el cuadro de diálogo, coloque el cursor
en el cuadro “Graph variables” y seleccione C2. Coloque el cursor en el cuadro
“Categorical variable” y seleccione C1. Haga clic en OK para terminar la gráfica de
barras, mostrada en la figura 1.24b). Una vez que se ha creado la gráfica, haga clic con
el botón derecho en varias partes de la gráfica de barras y elija Edit para cambiar la
apariencia de la gráfica.

FIGURA 1.24 (a)

Gráfica de pastel del estatus


Graduado Primer año
9.5% 4.8%

Segundo año
21.9%

Último año
33.3%

Tercer año
30.5%
40 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

(b)

Frecuencia

Primer año Segundo año Tercer año Último año Graduado


Nivel

EJEMPLO 1.16 (Gráficas de líneas) El Promedio Industrial Dow Jones fue supervisado al cierre de las tran-
sacciones durante 10 días en un año reciente, con los resultados que se muestran en la tabla
1.17.
TABLA 1.17 Promedio Industrial Dow Jones
Día 1 2 3 4 5 6 7 8 9 10
PIDJ 10,636 10,680 10,674 10,653 10,698 10,644 10,378 10,319 10,303 10,302

1. Aunque se podría simplemente introducir estos datos en la tercera y cuarta columnas


de la hoja de cálculo actual, crearemos una hoja de cálculo nueva usando File New
Minitab Worksheet. Introduzca los datos de Días en la columna C1 de esta segunda
hoja de cálculo y los datos de PIDJ en la columna C2. Deberá tener dos columnas de
datos, incluyendo las etiquetas.
2. Para crear la gráfica de líneas, use Graph Time Series Plot Simple. En el cuadro de
diálogo que aparece, coloque el cursor en el cuadro “Series” y seleccione “PIDJ”
de la lista de la izquierda. Bajo Time/Scale, elija “Stamp” y seleccione la columna
C1 (“Día”) en el cuadro denominado “Stamp Columns”. Haga clic dos veces en OK.
Seleccione los días numerados que se muestran arriba de la línea y eliminarlos para
obtener la gráfica de líneas que se muestra en la figura 1.25.

FIGURA 1.25

Gráfica de Serie de Tiempo de PIDJ


PIDJ

Día
TECNOLOGÍA ACTUAL 41

EJEMPLO 1.17 (Gráficas de puntos, gráficas de tallo y hoja, histogramas) Las 40 acciones principales en
circulación en el mercado, clasificadas por porcentaje de acciones sobresalientes negociadas
en un día particular, se enlistan en la tabla 1.18. Cree una hoja de cálculo nueva (File New
Minitab Worksheet). Introduzca los datos en la columna C1 y nómbrela “Acciones” en la
celda gris justo debajo de C1.
TABLA 1.18 Porcentaje de acciones en circulación negociadas
11.88 6.27 5.49 4.81 4.40 3.78 3.44 3.11 2.88 2.68
7.99 6.07 5.26 4.79 4.05 3.69 3.36 3.03 2.74 2.63
7.15 5.98 5.07 4.55 3.94 3.62 3.26 2.99 2.74 2.62
7.13 5.91 4.94 4.43 3.93 3.48 3.20 2.89 2.69 2.61

1. Para crear una gráfica de puntos, use Graph Dotplot. En la caja de diálogo que
aparece, elija One Y Simple y haga clic en OK. Para crear una gráfica de tallo y hoja,
use Graph Stem-and-Leaf. Para cualquiera de estas gráficas, ponga su cursor en el
cuadro “Graph variables” y seleccione “Acciones” de la lista a la izquierda (véase la
figura 1.26).

FIGURA 1.26

2. El usuario puede seleccionar de una variedad de opciones de formato antes de hacer


clic en OK. La gráfica de puntos aparece como una gráfica, en tanto que la gráfica
de tallo y hoja aparece en la ventana Session. Para imprimir una ventana Graph o la
ventana Session, haga clic en la ventana para activarla y use File Print Graph (o
Print Session Window).
3. Para crear un histograma, use Graph Histogram. En el cuadro de diálogo que
aparece, elija Simple y haga clic en OK, seleccionando “Acciones” para el cuadro
“Graph Variables”. Seleccione Scale Y-Scale Type y haga clic en el botón de
radio marcado “Frequency”. (Después edite el histograma para mostrar frecuencias
relativas.) Haga doble clic en OK. Una vez creado el histograma, haga clic con el
botón derecho en el eje Y y seleccione Edit Y Scale. Bajo la ficha marcada “Scale”,
haga clic en el botón de radio marcado “Position of ticks” y teclear 0 5 10 15. A
continuación haga clic en la ficha marcada “Labels” (Etiquetas), en el botón de radio
marcado “Specified” y teclee 0 5/40 10/40 15/40. Haga clic en OK. Esto reducirá el
número de “palomas” en el eje y y las cambia a frecuencias relativas. Por último, haga
doble clic en la palabra “Frecuencia” junto al eje y. Cambie la caja marcada “Text”
para leer “Frecuencia relativa” y haga clic en OK.
42 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

4. Para ajustar el tipo de fronteras para el histograma, haga clic con el botón derecho en
las barras del histograma y seleccione Edit Bars. Use la pestaña marcada “Binning”
para elegir ya sea “Cutpoints” (Puntos de corte) o “Midpoints” (Puntos medios) para
el histograma; especifique el punto de corte o el punto medio si lo desea. En este
mismo cuadro Edit puede usted cambiar los colores, llenar el tipo y estilo de fuente del
histograma. Si hace clic con el botón derecho en las barras y selecciona Update Graph
Automatically, el histograma se actualiza en forma automática cuando se cambien los
datos de la columna “Acciones”.
Cuando se familiarice con el MINITAB para Windows explorará las diversas opciones dispo-
nibles para cada tipo de gráfica. Es posible graficar más de una variable a la vez, cambiar los
ejes, elegir los colores y modificar gráficas en numerosas formas. No obstante, aun con
los comandos básicos predeterminados, es evidente que la distribución de acciones en circu-
lación en la figura 1.27 está muy sesgada a la derecha.

FIGURA 1.27

Ejercicios suplementarios
1.38 ¿Cuantitativa o cualitativa? Identifique cada e. Número de envolturas de taco rotas en un paquete de
variable como cuantitativa o cualitativa: 100 envolturas.
a. Origen étnico de un candidato a un cargo público. f. Número de garrapatas halladas en cada uno de 50
b. Calificación (0-100) en un examen de conocimientos. conejos de cola de algodón atrapados.
c. Establecimiento de comida rápida preferida por un 1.40 ¿Continuas o discretas? Identifique cada variable
estudiante (McDonald’s, Burger King o Carl’s Jr.). como continua o discreta:
d. Concentración de mercurio en una muestra de atún. a. Número de homicidios en Detroit en el periodo de un
mes.
1.39 ¿Simétrica o sesgada? ¿Espera usted que las
distribuciones de las variables siguientes sean simétricas o b. Lapso entre llegadas de un paciente externo a una
sesgadas? Explique. clínica.
a. Monto en dólares de préstamos no asegurados. c. Número de errores de tipografía en una página de
manuscrito.
b. Monto en dólares de préstamos asegurados.
d. Número de focos defectuosos en un paquete que
c. Precio de una lata de 8 onzas (¼ kg) de chícharos.
contiene cuatro focos.
d. Estatura en pulgadas de mujeres de primer año en la
e. Tiempo necesario para terminar un examen.
universidad.
EJERCICIOS SUPLEMENTARIOS 43

1.41 Continuas o discretas, otra vez Identifique cada Baikal 395 Issyk Kul 115
variable como continua o discreta: Gran Lago del oso 192 Torrens 130
Nyasa 360 Vänern 91
a. Peso de dos docenas de camarones. Gran lago del esclavo 298 Nettilling 67
b. Temperatura corporal de una persona. Erie 241 Winnipegosis 141
Winnipeg 266 Albert 100
c. Número de personas en espera de tratamiento en la sala Ontario 193 Nipigon 72
de emergencia de un hospital. Balkhash 376 Gairdner 90
d. Número de propiedades a la venta de una agencia de Ladoga 124 Urmia 90
Maracaibo 133 Manitoba 140
bienes raíces. Onega 145 Chad 175
e. Número de reclamaciones recibidas por una compañía Eyre 90
de seguros en un día. Fuente: The World Almanac and Book of Facts 2011

1.42 Continua o discreta, otra vez Identifique cada


a. Use una gráfica de tallo y hoja para describir las
variable como continua o discreta:
longitudes de los lagos más grandes del mundo.
a. Número de personas en la fila de espera en la caja de
b. Use un histograma para exhibir estos mismos datos.
pago de un supermercado.
¿Cómo se compara con la gráfica de tallo y hoja de la
b. Profundidad de una nevada. parte a?
c. Tiempo para que un conductor responda ante un choque c. ¿Estos datos son simétricos o sesgados? Si son
inminente. sesgados, ¿cuál es la dirección del sesgo?
d. Número de aviones que llegan al aeropuerto de Atlanta 1.45 Edades de centavos Recolectamos
en una hora determinada. 50 monedas de un centavo y registramos sus
EX0145
1.43 Agua corriente Se ha sugerido agua edades, al calcular EDAD = AÑO ACTUAL −
EX0143
corriente como método de acondicionamiento AÑO EN EL CENTAVO.
cardiovascular para atletas lesionados y otros
que deseen un programa de ejercicios aerobicos de bajo 5 1 9 1 2 20 0 25 0 17
1 4 4 3 0 25 3 3 8 28
impacto. Un estudio publicado en la Journal of Sports 5 21 19 9 0 5 0 2 1 0
Medicine investigó la relación entre la cadencia de 0 1 19 0 2 0 20 16 22 10
ejercicio y la frecuencia cardiaca, al medir las frecuencias 19 36 23 0 1 17 6 0 5 0
cardiacas de 20 voluntarios sanos a una cadencia de 96
a. Antes de trazar gráfica alguna, trate de visualizar
pasos por minuto.11 Los datos aparecen a continuación:
el aspecto que tendrá la distribución de edades de
87 109 79 80 96 95 90 92 96 98 centavos. ¿Tendrá forma de montículo, será simétrica,
101 91 78 112 94 98 94 107 81 96 estará sesgada a la derecha o sesgada a la izquierda?
b. Trace un histograma de frecuencia relativa para
Construya una gráfica de tallo y hoja para describir describir la distribución de edades de centavos. ¿Cómo
los datos. Analice las características de la distribución describiría usted la forma de la distribución?
de datos. 1.46 Edades de centavos, continúa Los datos
1.44 Los lagos más grandes del mundo Un que aparecen a continuación representan las edades
EX0146
EX0144
lago es un cuerpo de agua rodeado por tierra. de un conjunto diferente de 50 centavos, de nuevo
Por lo tanto, algunos cuerpos de agua llamados calculados usando EDAD = AÑO ACTUAL – AÑO EN
“mares”, como el mar Caspio, en realidad son lagos EL CENTAVO.
salados. En la tabla siguiente aparece la longitud en millas
de los lagos naturales más grandes del mundo, excluyendo 41 9 0 4 3 0 3 8 21 3
2 10 4 0 14 0 25 12 24 19
el mar Caspio, que tiene una longitud de 760 millas.5 3 1 14 7 2 4 4 5 1 20
14 9 3 5 3 0 8 17 16 0
Nombre Longitud (millas) Nombre Longitud (millas) 0 7 3 5 23 7 28 17 9 2
Superior 350 Titicaca 122
Victoria 250 Nicaragua 102 a. Trace un histograma de frecuencia relativa para
Hurón 206 Athabasca 208 describir la distribución de edades de centavos. ¿La
Michigan 307 Reindeer 143 forma es similar a la del histograma de frecuencia
Mar Aral 260 Tonlé Sap 70
relativa del ejercicio 1.45?
Tanganica 420 Turkana 154
b. Trace una gráfica de tallo y hoja para describir
las edades de centavos. ¿Hay algunas medidas
anormalmente grandes o pequeñas en el conjunto?
44 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

1.47 Vetos presidenciales A continuación (1950) 121.3 122.3 121.3 122.0 123.0 121.4 123.2 122.1 125.0 122.1
(1960) 122.2 124.0 120.2 121.4 120.0 121.1 122.0 120.3 122.1 121.4
EX0147aparece una lista de los 44 presidentes de Estados (1970) 123.2 123.1 121.4 119.2† 124.0 122.0 121.3 122.1 121.1 122.2
Unidos, junto con el número de vetos regulares (1980) 122.0 122.0 122.2 122.1 122.2 120.1 122.4 123.2 122.2 125.0
empleados por cada uno de ellos:5 (1990) 122.0 123.0 123.0 122.2 123.3 121.1 121.0 122.4 122.2 123.2
(2000) 121.0 119.97 121.13 121.19 124.06 122.75 121.36 122.17 121.86 122.66
(2010) 124.4
Washington 2 B. Harrison 19

J. Adams 0 Cleveland 42 Tiempo récord establecido por Secretariat en 1973
Jefferson 0 McKinley 6 Fuente: www.kentuckyderby.com
Madison 5 T. Roosevelt 42
Monroe 1 Taft 30 a. ¿Piensa usted que con los años habrá una tendencia en
J. Q. Adams 0 Wilson 33 los tiempos ganadores? Trace una gráfica de línea para
Jackson 5 Harding 5
Van Buren 0 Coolidge 20 verificar su respuesta.
W. H. Harrison 0 Hoover 21 b. Describa la distribución de tiempos ganadores usando
Tyler 6 F. D. Roosevelt 372
Polk 2 Truman 180 una gráfica apropiada. Comente sobre la forma de la
Taylor 0 Eisenhower 73 distribución y busque algunas observaciones poco
Fillmore 0 Kennedy 12 comunes.
Pierce 9 L. Johnson 16
Buchanan 4 Nixon 26 1.50 Limpieza de derrame de petróleo en el
Lincoln 2 Ford 48 Golfo El 20 de abril de 2010, Estados Unidos
A. Johnson 21 Carter 13 EX0150
Grant 45 Reagan 39
sufrió un desastre ambiental importante cuando
Hayes 12 G. H. W. Bush 29 la plataforma petrolera Deepwater Horizon explotó en el
Garfield 0 Clinton 36 Golfo de México. La cantidad de personal y equipo usados
Arthur 4 G. W. Bush 11
Cleveland 304 Obama 1
en la limpieza del derrame de petróleo en el Golfo, que
Fuente: The World Almanac and Book of Facts 2011 empezó el 2 de mayo de 2010 (día 13) y duró hasta el 9 de
junio de 2010 (día 51) se da en la siguiente tabla.13
Use una gráfica apropiada para describir el número de Día 13 Día 26 Día 39 Día 51
vetos emitidos por los 44 presidentes. Escriba un párrafo
Número de personal (miles) 3.0 17.5 20.0 24.0
de resumen que describa este conjunto de datos. Áreas de pesca federales cerradas en el Golfo 3% 8% 25% 32%
1.48 Ciudades ventosas ¿Hay algunas ciudades Barreras colocadas (millas) 46 315 644 909
Dispersantes usados (miles de galones) 156 500 870 1143
EX0148
más ventosas que otras? ¿Chicago merece el apodo Barcos desplegados (cientos) 1.0 6.0 14.0 35.0
de “La ciudad de los vientos”? Estos datos son las
velocidades promedio del viento (en millas por hora) para
54 ciudades seleccionadas en Estados Unidos:5 a. ¿Qué métodos gráficos usaría para mostrar estos datos?
b. Antes de trazar sus gráficas, ¿qué tendencias ve en cada
8.9 12.3 10.7 8.4 7.8 11.5 8.2 9.0 8.8 una de las variables mostradas?
7.1 11.8 10.3 7.7 9.0 10.5 9.1 8.7 8.7 c. Use una gráfica de líneas para mostrar el número de
9.1 9.0 10.5 11.2 7.7 8.8 12.2 7.9 8.8 personal desplegado durante este periodo de 51 días.
8.7 7.1 8.7 7.6 5.1 35.1 10.5 10.4 11.0
10.2 8.6 10.7 9.6 8.3 8.0 9.5 7.7 9.4 d. Use una gráfica de barras para mostrar el porcentaje de
8.7 7.8 10.2 6.9 9.2 10.2 6.2 9.6 12.2 áreas de pesca federales cerradas en el Golfo.
Fuente: The World Almanac and Book of Facts 2011 e. Use una gráfica de líneas para mostrar las cantidades
de dispersantes usados. ¿Hay alguna relación de recta
subyacente a lo largo del tiempo?
a. Construya un histograma de frecuencia relativa para
los datos. (SUGERENCIA: Elija las fronteras de clase sin 1.51 Resultados de elecciones La elección
incluir el valor x 35.1 en el rango de valores). EX0151
de 2008 fue una carrera en la que Barack Obama
derrotó a John McCain y a otros candidatos,
b. El valor x 35.1 se registró en Monte Washington, recibiendo 53% del voto popular. El voto popular (en
New Hampshire. ¿La geografía de esa ciudad explica la miles) para Barack Obama en cada uno de los 50 estados
observación? se lista a continuación:14
c. El promedio de velocidad del viento en Chicago está
registrado en 10.3 millas por hora. ¿Considera usted que AL 813 HI 326 MA 1904 NM 472 SD 171
esto es extraordinariamente ventoso? AK 124 ID 236 MI 2873 NY 4805 TN 1087
AZ 1035 IL 3420 MN 1573 NC 2143 TX 3529
1.49 Kentucky Derby El siguiente conjunto de AR 422 IN 1374 MS 555 ND 141 UT 328
EX0149
datos muestra los tiempos ganadores (en segundos) CA 8274 IA 829 MO 1442 OH 2933 VT 219
para las carreras del Derby de Kentucky de 1950 a
2010:12
EJERCICIOS SUPLEMENTARIOS 45

CO 1289 KS 515 MT 232 OK 502 VA 1960 a. Describa las formas de las dos distribuciones. ¿Hay
CT 998 KY 752 NE 333 OR 1037 WA 1751 resultados atípicos?
DE 255 LA 783 NV 534 PA 3276 WV 304
FL 4282 ME 422 NH 385 RI 297 WI 1677 b. ¿Las gráficas de tallo y hoja se asemejan a los
GA 1844 MD 1629 NJ 2215 SC 862 WY 83 histogramas de frecuencia relativa construidos en los
ejercicios 1.51 y 1.52?
a. Con sólo mirar la tabla, ¿qué forma piensa usted que c. Explique por qué la distribución del voto popular para
tendrá la distribución de datos para el voto popular por el presidente Obama por estado está sesgada, en tanto
estado? que el porcentaje de votos populares por estado tiene
b. Trace un histograma de frecuencia relativa para forma de montículo.
describir la distribución del voto popular para el 1.54 Estaturas de estudiantes Las estaturas
presidente Obama en los 50 estados. de 105 estudiantes de un grupo de bioestadística,
EX0153
c. ¿El histograma de la parte b confirma su cálculo en la indicadas voluntariamente, están descritas en el
parte a? ¿Hay resultados atípicos? ¿Cómo los explica? histograma de frecuencia relativa siguiente.
1.52 Resultados de elecciones,
EX0152
continúa Consulte el ejercicio 1.51. A
10/105
continuación aparece el porcentaje del voto
popular recibido por el presidente Obama en cada uno de
los 50 estados:14

Frecuencia relativa
AL 39 HI 72 MA 62 NM 57 SD 45 5/105

AK 38 ID 36 MI 57 NY 63 TN 42
AZ 45 IL 62 MN 54 NC 50 TX 44
AR 39 IN 50 MS 43 ND 45 UT 34
CA 61 IA 54 MO 49 OH 52 VT 68
CO 54 KS 42 MT 47 OK 34 VA 53 0
60 63 66 69 72 75
CT 61 KY 41 NE 42 OR 57 WA 58 Estaturas
DE 62 LA 40 NV 55 PA 55 WV 43
FL 51 ME 58 NH 54 RI 63 WI 56
GA 47 MD 62 NJ 57 SC 45 WY 33 a. Describa la forma de la distribución.
b. ¿Ve alguna característica poco común en este
a. Con sólo mirar la tabla, ¿qué forma piensa usted que
histograma?
tendrá la distribución de datos para el porcentaje del
voto popular por estado? c. ¿Tiene alguna explicación para los dos picos del
histograma? ¿Hay algún otro factor que esté causando
b. Trace un histograma de frecuencia relativa para
que las estaturas formen un montículo en dos picos
describir la distribución. Describa la forma de la
separados? ¿Qué es?
distribución y busque resultados atípicos. ¿La gráfica
confirma su respuesta a la parte a? 1.55 ¡Los diamantes son eternos! Gran parte de la
industria mundial de diamantes se localiza en África;
1.53 Resultados de elecciones, continúa Consulte los
Rusia y Canadá presentan también grandes ingresos por su
ejercicios 1.51 y 1.52. Las siguientes gráficas de tallo y hoja
industria minera de diamantes. A continuación se muestra
fueron generadas usando el MINITAB para las variables
una representación visual de las diversas participaciones
llamadas “Voto popular” y “Porcentaje de Votos”.
en los ingresos mundiales por diamantes, adaptado de
Gráfica de tallo y hoja: Gráfica de tallo y hoja: Time Magazine:15
Voto popular Porcentaje de votos
Participación mundial en los ingresos
Tallo y hoja de Tallo y hoja de 20%
por diamantes
Voto popular N = 50 Voto popular N = 50 Rusia
Unidad de hoja = 100 Unidad de hoja = 1.0
26%
17 0 01112222233333444 3 3 344 Botswana
(10) 0 5555778889 7 3 6899
Otros 18%
23 1 000234 15 4 01222334
Canadá
17 1 5667899 22 4 5555779
8–13%
10 2 12 (9) 5 001234444 Zimbabwe
8 2 89 19 5 556777788 10%
10% Sudáfrica
6 3 24 10 6 11222233
Angola
4 3 5 2 6 8
1 7 2 Fuente: Kimberley Process

HI 42, 48, 82
46 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

a. Elabore una gráfica de pastel para describir las porcentaje del presupuesto de este año para cada uno de los
diversas participaciones en los ingresos mundiales por 50 estados de Estados Unidos y el Distrito de Columbia.17
diamantes.
b. Genere una gráfica de barras para describir las Déficit esperado el año
siguiente como porcentaje
Mejor
WASH.
diversas participaciones en los ingresos mundiales por 13.9%
MONT.
del presupuesto de este año
Peor
MAINE
32.1%
Excedente
diamantes. ORE.
19.3%
N. D.
Excedente MINN.
26.4%
IDAHO VT 31.1%
S. D.
c. Construya una gráfica de Pareto para describir las Peor
3.3%
WYO.
8.0%
9.0%
WIS.
25.3%
MICH.
8.8%
N. Y.
NH 23.4%
MASS 8.5%
15.5%
diversas participaciones en los ingresos mundiales por NEV.
56.6% UTAH
NEB.
9.7%
IOWA
18.6%
PA. R.I. 13.2%
15.6% ILL IND OHIO 16.3% CONN. 29.2%
diamantes. CALIF.
9.1%
COLO.
21.2% KANS.
MO.
36.1% 9.9% 11.6%
W.V.A. VA
N.J. 37.4%
9.1% KY. 3.5% DEL 11.7%
9.3% 8.2%
d. ¿Qué gráfica es la más efectiva para describir los datos? ARIZ.
35.3%
N. M. OKLA.
ARK.
9.1%
TENN. 10.0%
N.C.
30.5%
MD. 15.0%
6.0% 12.4% S.C. D.C. 1.7%
Even
1.56 Frecuencia del pulso Un grupo de 50 ALA. GA.
MISS. 8.2% 24.3%
22.6%
TEXAS

EX0156
estudiantes de biomedicina tomaron la frecuencia 12.8% LA. 14.6%
11.1%
ALASKA HAWAII
de sus pulsos, al contar el número de pulsaciones Excedente 12.9% FLA.
22.2%
durante 30 segundos y luego multiplicando por 2.
80 70 88 70 84 66 84 82 66 42
52 72 90 70 96 84 96 86 62 78
60 82 88 54 66 66 80 88 56 104 a. Construya un histograma de frecuencia relativa para
84 84 60 84 88 58 72 84 68 74 describir los porcentajes para los 48 estados que esperan
84 72 62 90 72 84 72 110 100 58
enfrentar déficits el siguiente año.
a. ¿Por qué son pares todos los números de las b. ¿Cuál es la forma del histograma? ¿Observa alguna
mediciones? característica poco común? Si hay resultados atípicos,
b. Trace una gráfica de tallo y hoja para describir los ¿puede explicarlos?
datos, dividiendo cada tallo en dos líneas. c. Hay tres estados, Alaska, Montana y Dakota del Norte,
c. Construya un histograma de frecuencia relativa para los que esperan un excedente el siguiente año. ¿Existe
datos. alguna razón por la que podría suceder esto?
d. Escriba un párrafo corto que describa la distribución de 1.59 Un hallazgo arqueológico Un artículo en
las frecuencias de pulsos de los estudiantes. EX0159
Archaeometry contenía un análisis de 26 muestras
de alfarería romano-británica, hallada en cuatro
1.57 Starbucks Estudiantes de la Universidad de
sitios de hornos en el Reino Unido.18 Las muestras fueron
EX0157
California en Riverside (UCR), junto con muchos
analizadas para determinar su composición química, y
otros californianos, ¡adoran sus Starbucks! A
el porcentaje de óxido de aluminio de cada una de las 26
continuación se muestran las distancias en millas desde el
muestras se presenta en la tabla siguiente.
plantel para los 41 locales de Starbucks dentro de un radio
de 10 millas de la UCR:16
Llanederyn Caldicot Island Thorns Ashley Rails
0.4 0.5 4.3 5.2 9.3 4.2 8.3 9.4 7.3 7.1 8.7
14.4 11.6 11.8 18.3 17.7
6.1 3.7 8.0 4.8 3.9 5.3 9.8 1.2 6.4 9.8
13.8 11.1 11.6 15.8 18.3
8.0 7.8 9.4 8.4 5.9 9.8 7.3 2.5 9.6 0.7
14.6 13.4 18.0 16.7
6.7 7.6 9.7 3.5 9.5 8.8 9.0 7.9 5.2 6.8
11.5 12.4 18.0 14.8
13.8 13.1 20.8 19.1
Construya una frecuencia relativa para describir las 10.9 12.7
distancias desde el plantel de la UCR, usando 10 clases de 10.1 12.5
ancho 1, empezando en 0.0.
a. ¿Cuál es la forma del histograma? ¿Observa algunas Construya un histograma de frecuencia relativa para
características poco comunes? describir el contenido de óxido de aluminio en las 26
b. ¿Explique por qué se ve así el histograma? muestras.
1.58 Tiempos de tensión En la primavera de a. ¿Qué característica poco común observa usted en
2010 casi todos los 50 estados de Estados Unidos esta gráfica? ¿Encuentra alguna explicación de esta
EX0158
más el Distrito de Columbia enfrentaban una crisis característica?
financiera drástica, con muchos recortes presupuestales en b. Trace una gráfica de puntos para los datos, usando
la planeación en todas las áreas, despidos, colegiaturas de una letra (L, C, I o A) para localizar el punto de datos
educación superior y otras estrategias para acortar la brecha en la escala horizontal. ¿Ayuda esto a explicar la
presupuestal esperada para el año siguiente. La imagen que característica poco común de la parte b?
sigue muestra el déficit esperado el siguiente año como
EJERCICIOS SUPLEMENTARIOS 47

1.60 El gran debate de calorías ¿Quiere bajar de


30 40 50 60 70 80 90 100
peso? Lo lograría si reduce sus calorías, ¡mientras tome Con laptops Sin laptops
suficiente valor nutricional de los alimentos que consuma! .40

A continuación tenemos una representación visual del


número de calorías, en algunos de los alimentos favoritos .30

Frecuencia relativa
de los estadounidenses, adaptada de un artículo de The
Press-Enterprise.19 .20

.10
Número de caloría
0
30 40 50 60 70 80 90 100

26 53 140 145 330 800


Un Una Una lata Una botella Una rebanada Una hamburguesa
Kiss de galleta de de cerveza de pizza de King Whopper Escriba un resumen de un párrafo que describa y compare
Hershey's Orea Coca-Cola Budweiser peperoni con queso
de 12 onzas de 12 onzas Papa John’s la distribución de calificaciones del examen final para los
dos grupos de estudiantes.
1.62 El Old Faithful Los datos siguientes son
EX0162
los tiempos de espera entre erupciones del géiser
a. Comente sobre la precisión de la gráfica anterior. ¿Los llamado Old Faithful (Viejo Fiel) del parque
tamaños, alturas y volúmenes de los seis artículos nacional Yellowstone.21 Use uno de los métodos gráficos
representan con precisión el número de calorías en el de este capítulo para describir la distribución de tiempos de
artículo? espera. Si hay algunas características poco comunes en su
gráfica, formule alguna explicación práctica para éstas.
b. Trace una gráfica de barras real para describir el número
de calorías en estos seis alimentos favoritos. 56 89 51 79 58 82 52 88 52 78
69 75 77 53 80 54 79 74 65 78
1.61 Laptops y aprendizaje Un experimento
55 87 53 85 61 93 54 76 80 81
EX0161
informal fue realizado por la secundaria McNair 59 86 78 71 77 89 45 93 72 71
Academic de Jersey City, Nueva Jersey, para 76 94 75 50 83 82 72 77 75 65
investigar el uso de computadoras portátiles como 79 72 78 77 79 72 82 74 80 49
herramienta de aprendizaje en el estudio del álgebra.20 75 78 64 80 49 49 88 51 78 85
65 75 77 69 92 91 53 86 49 79
Un grupo de 20 estudiantes de primer año recibió estas
68 87 61 81 55 93 53 84 70 73
computadoras para usarlas en la escuela y en casa, al 93 50 87 77 74 89 87 76 59 80
tiempo que a otro grupo de 27 no se les dieron laptops;
no obstante, muchos de éstos podían usarlas en casa. Las 1.63 Impuesto a la gasolina Las siguientes son
calificaciones de examen final para los dos grupos se tasas de impuesto estatal a la gasolina en 2010, en
EX0163
muestran a continuación. centavos por galón, para los 50 estados y el Distrito
de Columbia.5
Con laptops Sin laptops
98 84 63 83 97
97 93 93 52 74
88 57 83 63 88
100 84 86 81 84
100 81 99 91 49
78 83 80 81 89
68 84 78 29 64
47 93 74 72 89
90 57 67 89 70
94 83 Mayor que 47.7

40.0-47.7

Menor que 40

PROMEDIO DE
ESTADOS UNIDOS 47.7

Los siguientes histogramas muestran la distribución de


calificaciones del examen final para los dos grupos.
48 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

AK 26.4 HI 63.5 MA 41.9 NM 37.2 SD 42.4 Ciudad Starbucks Ciudad Starbucks


AL 39.3 ID 43.4 MI 54.2 NY 63.3 TN 39.8
Riverside 18 Ontario 12
AR 40.2 IL 58.8 MN 45.6 NC 48.6 TX 38.4
Grand Terrace 1 Norco 4
AZ 37.4 IN 53.2 MS 37.2 ND 41.4 UT 42.9
Rialto 6 Fontana 7
CA 67.0 IA 40.4 MO 35.7 OH 46.4 VT 43.1
Colton 2 Mira Loma 2
CO 40.4 KS 43.4 MT 46.2 OK 35.4 VA 38.0
San Bernardino 6 Perris 3
CT 61.0 KY 40.9 NE 46.1 OR 43.4 WA 55.9
Redlands 8 Highland 1
DE 41.4 LA 38.4 NV 51.5 PA 50.7 WV 50.6
Corona 10 Rancho Cucamonga 10
DC 41.9 ME 49.4 NH 38.0 RI 51.4 WI 51.3
Yucaipa 3 Lake Elsinore 2
FL 52.8 MD 41.9 NJ 32.9 SC 35.2 WY 32.4
Chino 11 Moreno Valley 5
GA 39.3
Upland 2 Montclair 1
Fuente: http://www.api.org/statistics/fueltaxes/upload/GASOLlNE_ TAX_MAP_ BIoomington 1
APRIL2010.pdf, July 6, 2010

a. Construya una gráfica de tallo y hoja para los datos. a. Trace una gráfica de puntos para describir los datos.
b. ¿Cómo describiría la forma de esta distribución? b. Describa la forma de la distribución.
c. ¿Hay estados con impuesto a la gasolina c. ¿Hay otra variable medible que ayude a entender por
extraordinariamente bajo o alto? Si es así, ¿cuáles son qué algunas ciudades tienen más Starbucks que otras?
esos estados? Explique.
1.64 Plantas hidroeléctricas Los datos 1.67 ¿Qué es normal? La temperatura corporal
siguientes representan capacidades estimadas en EX0167
de 98.6 grados Farenheit como estándar en
EX0164
megawatts (millones de watts) para las 20 plantas los seres humanos fue obtenida por un médico
hidroeléctricas más grandes del mundo.5 alemán en 1868. En un intento por verificar esta
afirmación, Mackowiak, Wasserman y Levine22 tomaron
18,200 4,500 3,000 las temperaturas de 148 personas sanas en un periodo
12,600 4,200 2,940 de tres días. Un conjunto de datos, que estrechamente se
10,000 4,200 2,715 compara con el del artículo de Mackowiak, fue obtenido
8,370 3,840 2,700
6,400 3,444 2,541
por Allen Shoemaker y aparece en la Journal of Statistics
6,300 3,300 2,512 Education.23 Las temperaturas corporales para estas 130
6,000 3,100 personas se muestran en el histograma de frecuencia
Fuente: The World Almanac and Book of Facts, 2011 relativa siguiente.

a. Construya una gráfica de tallo y hoja para los datos.


b. ¿Cómo describiría usted la forma de esta distribución? .25

1.65 Colores de autos Los colores más


.20
EX0165
populares para autos compactos y deportivos en un
Frecuencia relativa

año reciente se dan en la tabla.5 .15

Color Porcentaje Color Porcentaje


.10
Plateado 19 Blanco/blanco perla 12
Negro/efecto negro 17 Beige/café 3 .05
Gris 17 Amarillo/dorado 2
Azul 15 Verde 2
0
Rojo 12 Otro 1 96.8 97.6 98.4 99.2 100.0 100.8
Fuente: The World Almanac and Book of Facts 2011 Temperatura

Use un método gráfico apropiado para describir estos a. Describa la forma de la distribución de temperaturas.
datos. b. ¿Hay algunas observaciones poco comunes? ¿Piensa en
1.66 Starbucks El número de cafeterías alguna explicación para éstas?
EX0166
Starbucks en ciudades a no más de 20 millas de la c. Localice los 98.6 grados normales en el eje horizontal
Universidad de California, en Riverside, se muestra de la gráfica. ¿Parecen estar cerca del centro de
en la tabla siguiente.16 distribución?
CASO PRÁCTICO 49

CASO PRÁCTICO ¿Cómo está su presión sanguínea?


La presión sanguínea es la presión que la sangre ejerce contra las paredes de las arterias. Cuan-
Presión
sanguínea
do los médicos o las enfermeras miden la presión sanguínea a una persona toman dos lecturas.
La presión sistólica es cuando el corazón se contrae y, por lo tanto, bombea. La presión dias-
tólica es la presión en las arterias cuando el corazón se dilata. La presión diastólica siempre es
la menor de las dos lecturas. La presión sanguínea varía de una persona a otra; también varía
en una sola persona de un día para otro e incluso en un mismo día.
Si su presión sanguínea es demasiado alta, esto puede causarle una hemorragia cerebral
o un infarto. Si es demasiado baja, la sangre no llega a las extremidades y es posible que el
paciente se maree. La presión baja no es tan grave.
Por lo tanto, ¿cuál debería ser la presión de usted? Una presión sistólica de 120 se consi-
dera normal; una de 150 es alta, pero como la presión varía con el género y aumenta con la
edad, una mejor posición de su presión sanguínea se obtendría al compararla con la población
de presiones sanguíneas de todas las personas de su género y edad en Estados Unidos. Desde
luego, no podemos proporcionarle ese conjunto de datos, pero sí presentarle una muestra muy
grande seleccionada de él. Los datos de presión sanguínea de 1910 personas, 965 hombres y
945 mujeres entre 15 y 20 años, se encuentran en el sitio web CourseMate. Los datos son parte
del estudio de salud llevado a cabo por los National Institutes of Health (NIH). Las entradas
para cada persona incluyen su edad y sus presiones sistólica y diastólica, al momento de regis-
trar la presión sanguínea.
1. Describa las variables que se han medido en este estudio. ¿Las variables son cuantitativas
o cualitativas? ¿Discretas o continuas? ¿Los datos son univariados, bivariados o
multivariados?
2. ¿Qué tipos de métodos gráficos existen para describir este conjunto de datos? ¿Qué
clase de preguntas se contestarían usando varios tipos de técnicas gráficas?
3. Usando el conjunto de datos de presión sanguínea sistólica, construya un histograma de
frecuencia relativa para los 965 hombres y otro para las 945 mujeres. Use un paquete
de software de estadística si tiene acceso a alguno. Compare los dos histogramas.
4. Considere los 965 hombres y 945 mujeres como toda la población de interés. Elija
una muestra de n 50 hombres y n 50 mujeres, registrando sus presiones sanguíneas
sistólicas y sus edades. Trace dos histogramas de frecuencia relativa para exhibir
gráficamente las presiones sanguíneas sistólicas para sus dos muestras. ¿Las formas de
los histogramas se asemejan a los histogramas de población de la parte 3?
5. ¿Cómo se compara su presión sanguínea con la de otros de su mismo género? Verifique
su presión sanguínea sistólica contra el histograma apropiado de la parte 3 o 4 para
determinar si su presión sanguínea es “normal” o si es extraordinariamente alta o baja.

También podría gustarte