Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cap - 1 - Descripcion de Datos
Cap - 1 - Descripcion de Datos
Descripción de
datos por medio
de gráficas
OBJETIVOS GENERALES
Numerosos conjuntos de mediciones son muestras selec-
cionadas de poblaciones más grandes; otros constituyen © Ocean/Corbis
toda una población, como el caso de un censo nacional. En
este capítulo usted aprenderá qué es una variable, cómo
clasificar variables en diversos tipos y cómo se generan ¿Cómo está su presión
mediciones o datos. Por tanto, también aprenderá a usar sanguínea?
gráficas para describir conjuntos de datos. ¿Su presión sanguínea es normal, o es demasiado
alta o demasiado baja? El estudio práctico que
ÍNDICE DEL CAPÍTULO aparece al final de este capítulo examina un con-
Distribuciones de datos y sus formas (1.1, 1.4)
junto grande de datos sobre la presión sanguínea.
Usted usará gráficas para describir estos datos y
Gráficas de puntos (1.4)
comparar su presión sanguínea con la de otras
Gráficas de pastel, de barras, de líneas (1.3, 1.4)
personas de su misma edad y género.
Variables cualitativas y cuantitativas: discretas y
continuas (1.2)
Histogramas de frecuencia relativa (1.5)
Gráficas de tallo y hoja (1.4)
Datos univariados y bivariados (1.1)
Variables, unidades experimentales, muestras y
poblaciones, datos (1.1)
NECESITO SABER...
7
8 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
VARIABLES Y DATOS
1.1
En los capítulos 1 y 2 presentaremos algunas técnicas básicas de estadística descriptiva, la
rama de la estadística que se ocupa de describir conjuntos de mediciones, tanto muestras como
poblaciones. Una vez que haya recolectado un conjunto de mediciones, ¿cómo puede mos-
trar este conjunto en una forma clara, entendible y fácil de leer? Primero, debe ser capaz de
definir lo que se entiende por medición o “datos” y clasificar los tipos de datos que probable-
mente se encuentre en la vida real. Empezamos por presentar algunas definiciones.
Definición Una variable es una característica que cambia o varía con el tiempo o para
diferentes personas u objetos en estudio.
Por ejemplo, la temperatura corporal es una variable que cambia con el tiempo en una sola
persona; también varía de una persona a otra. La afiliación religiosa, el origen étnico, el
ingreso, la estatura, la edad y el número de hijos son variables, es decir, características que
varían según la persona seleccionada.
En la Introducción definimos una unidad experimental o un elemento de la muestra como
el objeto sobre el cual se toma una medición. Del mismo modo, podríamos definir una unidad
experimental como el objeto en el que se mide una variable. Cuando una variable se mide en
realidad en un conjunto de unidades experimentales, resulta un conjunto de mediciones o de
datos.
Si se genera una medición para cada unidad experimental en toda la colección, el conjunto
de datos resultante constituye la población de interés. Cualquier conjunto más pequeño de
mediciones es una muestra.
EJEMPLO 1.1 De entre todos los alumnos de una universidad grande se selecciona un conjunto de cinco
estudiantes y las mediciones se vacían en una hoja de cálculo, como se muestra en la figura
1.1. Identifique los diversos elementos comprendidos en la generación de este conjunto de
mediciones.
Solución Hay diversas variables en este ejemplo. La unidad experimental en la que se
miden las variables es un alumno del plantel en particular, identificado en la columna A.
Se miden cinco variables para cada estudiante: promedio de calificaciones (GPA), género,
año en la universidad, curso de maestría o especialidad y número actual de unidades en las que
está inscrito. Cada una de estas características varía de un estudiante a otro. Si consideramos las
GPA de todos los estudiantes de esta universidad como la población de interés, las cinco GPA
de la columna B representan una muestra de esta población. Si se hubiera medido el GPA de
cada estudiante de la universidad, hubiéramos generado toda la población de mediciones para
esta variable.
1.2 TIPOS DE VARIABLES 9
FIGURA 1.1
Mediciones de cinco Estudiante GPA Género Año Especialidad Número de unidades
estudiantes Primero Psicología
Segundo Matemáticas
Segundo Inglés
Primero Inglés
Pasante Negocios
Observe que hay una diferencia entre una sola variable medida en una sola unidad expe-
rimental y múltiples variables medidas en una unidad experimental como en el ejemplo 1.1.
Definición Resultan datos univariados cuando se mide una sola variable en una sola
unidad experimental.
Definición Resultan datos bivariados cuando se miden dos variables en una sola
unidad experimental. Resultan datos multivariados cuando se miden más de dos variables.
Si se miden las temperaturas corporales de 148 personas, los datos resultantes son univariados.
En el ejemplo 1.1 se midieron cinco variables en cada estudiante, lo que resultó en datos mul-
tivariados.
TIPOS DE VARIABLES
1.2
Se pueden clasificar las variables en dos categorías: cualitativas y cuantitativas.
Definición Las variables cualitativas miden una cualidad o característica en cada uni-
dad experimental. Las variables cuantitativas miden una cantidad numérica en cada
unidad experimental.
10 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
MI CONSEJO
Las variables cualitativas producen datos que se clasifican de acuerdo con similitudes o
diferencias en clase; por lo tanto, con frecuencia se denominan datos categóricos. Las va-
Cualitativo ⇔ “calidad” o riables como género, año y especialidad en el ejemplo 1.1 son variables cualitativas que
característica
producen datos categóricos. Otros ejemplos son:
Cuantitativo ⇔ “cantidad”
o número
• Afiliación política: republicano, demócrata, independiente
• Clasificación de sabor: excelente, bueno, regular, malo
• Color de un dulce M&M’s®: café, amarillo, rojo, anaranjado, verde, azul
Las variables cuantitativas, con frecuencia representadas por la letra x, producen datos
numéricos, por ejemplo:
Observe que hay una diferencia en los tipos de valores numéricos que toman estas variables
cuantitativas. El número de pasajeros, por ejemplo, toma sólo los valores x = 0, 1, 2, ..., mien-
tras que el peso de un paquete puede tomar cualquier valor mayor que cero, o sea 0 x .
Para describir esta diferencia, definimos dos tipos de variables cuantitativas: discretas y
continuas.
Definición Una variable discreta toma sólo un número finito o contable de valores. Una
variable continua puede tomar infinitamente muchos valores correspondientes a los puntos
en un intervalo de recta.
MI CONSEJO
El término discreta se refiere a las brechas discretas que la variable puede tomar. Variables
como el número de miembros de una familia, el número de ventas de automóviles nuevos y el
Discreta ⇔ “factible de
número de llantas defectuosas devueltas para cambio, son ejemplos de variables discretas. Por
poner en lista”
el contrario, variables como la estatura, peso, tiempo, distancia y volumen son continuas porque
Continua ⇔ “no factible
de poner en lista” son capaces de tomar valores en cualquier punto a lo largo de un intervalo de recta. Para cual-
quier par de valores que se elijan, ¡un tercer valor siempre se hallará entre ellos!
EJEMPLO 1.2 Identifique como cualitativas o cuantitativas cada una de las siguientes variables:
¿Por qué deberían interesarle los diferentes tipos de variables (que se muestran en la figura
1.2) y los datos que generan? La razón es que diferentes tipos de datos requieren que utilice
diferentes métodos para su descripción, ¡de modo que los datos sean presentados con claridad
y de una manera comprensible para el público!
FIGURA 1.2
Tipos de datos Datos
Cualitativos Cuantitativos
Discretos Continuos
Para este fin, se construye una tabla estadística para mostrar gráficamente los datos como
una distribución de datos. El tipo de gráfica que se elija depende del tipo de variable que se
haya medido.
Cuando la variable de interés es cualitativa o categórica, la tabla estadística es una lista
de las categorías incluidas junto con una medida de la frecuencia con que se presenta cada
valor. Es posible medir “la frecuencia” en tres formas diferentes:
Encontrará que la suma de las frecuencias es siempre n, la suma de las frecuencias relativas
es 1 y la suma de los porcentajes es 100%.
Las categorías para una variable cualitativa deben elegirse de modo que
MI CONSEJO
Por ejemplo, si se clasifican productos cárnicos de acuerdo con el tipo de carne utilizada se
pueden usar estas categorías: res, pollo, mariscos, puerco, pavo, otra. Para clasificar los rangos
Tres pasos para una del cuerpo docente de alguna universidad se usan estas categorías: profesor, profesor adjunto,
distribución de datos:
profesor auxiliar, instructor, conferenciante, otro. La categoría “otro” está incluida en ambos
(1) Datos sin elaborar ⇒
casos para tomar en cuenta la posibilidad de que una medición no pueda asignarse a una de
(2) Tabla estadística ⇒
las categorías anteriores.
(3) Gráfica
Una vez que a las mediciones se les hayan dado categorías y se resumieron en una ta-
bla estadística, se utiliza ya sea una gráfica de pastel o una gráfica de barras para mostrar la
distribución de los datos. Una gráfica de pastel es la conocida gráfica circular que muestra
la forma en que están distribuidas las medidas entre las categorías. Una gráfica de barras
muestra la misma distribución de medidas en las categorías; la altura de la barra mide la fre-
cuencia observada de una categoría en particular.
EJEMPLO 1.3 En una encuesta sobre la educación pública, se pidió a 400 administradores de escuelas que
calificaran la calidad de la educación en Estados Unidos. Sus respuestas están resumidas en
la tabla 1.1. Elabore una gráfica de pastel y una de barras a partir de este conjunto de datos.
Solución Para construir una gráfica de pastel, asigne un sector del círculo a cada
categoría. El ángulo de cada sector debe ser proporcional a la magnitud de las mediciones (o
frecuencia relativa) en esa categoría. Como un círculo contiene 360°, aplique esta ecuación
para hallar el ángulo:
TABLA 1.1 Calificación de la educación en Estados Unidos hecha por 400 educadores
Calificación Frecuencia
A 35
B 260
C 93
D 12
Total 400
MI CONSEJO La tabla 1.2 muestra las calificaciones junto con las frecuencias, frecuencias relativas, por-
centajes y ángulos de sector necesarios para construir la gráfica de pastel. La figura 1.3 mues-
Las proporciones suman 1;
tra la gráfica de pastel construida a partir de los valores de la tabla. Mientras que las gráficas
los porcentajes, 100;
los ángulos de sector, 360° de pastel usan porcentajes para determinar los tamaños relativos de las “rebanadas de
pastel”, las de barras por lo general grafican la frecuencia contra las categorías. Una gráfica
de barras para estos datos se muestra en la figura 1.4.
1.3 GRÁFICAS PARA DATOS CATEGÓRICOS 13
El impacto visual de estas dos gráficas es un poco diferente. La gráfica de pastel se usa para
mostrar las relaciones de las partes respecto al todo; la gráfica de barras para destacar la
cantidad real o frecuencia para cada categoría. Como las categorías en este ejemplo son “cali-
ficaciones” ordenadas (A, B, C, D), no desearíamos reacomodar las barras de la gráfica para
cambiar su forma. En una gráfica de pastel, el orden de presentación es irrelevante.
FIGURA 1.3
Gráfica de pastel para el D A
3.0%
ejemplo 1.3 8.8%
C
23.3%
B
65.0%
FIGURA 1.4
Gráfica de barras para el
ejemplo 1.3 250
200
Frecuencia
150
100
50
0
A B C D
Calificación
EJEMPLO 1.4 Una bolsa tamaño botana de dulces de cacahuate M&M’S contiene 21 dulces con los colores
que se indican en la tabla 1.3. La variable “color” es cualitativa, por tanto la tabla 1.4 lista
las seis categorías junto con un registro del número de dulces de cada color. Las últimas tres
columnas de la tabla 1.4 muestran con cuánta frecuencia ocurre cada categoría. Como las
categorías son colores y no tienen un orden particular, se pueden construir gráficas de barras
con muchas formas diferentes con sólo reordenar las barras. Para enfatizar que el café es
el color más frecuente, seguido por el azul, el verde y el anaranjado, ordenamos las barras de
mayor a menor y generamos la gráfica de barras de la figura 1.5. Una gráfica de barras en la que
las barras están ordenadas de mayor a menor se denomina gráfica de Pareto.
14 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
FIGURA 1.5
Gráfica de Pareto para el
6
ejemplo 1.4
5
4
Frecuencia
0
Café Azul Verde Naranja Amarillo Rojo
Color
1.3 EJERCICIOS
PARA ENTENDER LOS CONCEPTOS 1.2 ¿Cualitativa o cuantitativa? Identifique cada una de
1.1 Unidades experimentales Identifique las unidades las variables como cuantitativa o cualitativa:
experimentales en las que se miden las variables a. Tiempo para armar un rompecabezas sencillo.
siguientes: b. Número de estudiantes en un salón de clases de primer
a. Género de un estudiante. año.
b. Número de errores en un examen de medio semestre. c. Calificación de un político recién electo (excelente,
c. Edad de un paciente con cáncer. bueno, regular, malo).
d. Número de flores en una planta de azalea. d. Estado donde vive una persona.
e. Color de un automóvil que entra a un estacionamiento.
1.3 GRÁFICAS PARA DATOS CATEGÓRICOS 15
1.3 ¿Discreta o continua? Identifique las siguientes la cual le gustaría seleccionar una muestra. ¿En qué forma
variables cuantitativas como discretas o continuas: esta población depende del tiempo?
a. Población en una región particular de un país. 1.8 Tiempos de supervivencia al cáncer Un
b. Peso de periódicos recuperados para reciclar en un solo investigador médico desea estimar el tiempo de
día. supervivencia de un paciente, después del inicio de cierto
tipo de cáncer y de un régimen particular de radioterapia.
c. Tiempo para completar un examen de sociología.
a. ¿Cuál es la variable de interés para el investigador
d. Número de consumidores en una encuesta de 1000 que
médico?
consideran importante aplicar leyenda nutrimental en
productos alimenticios. b. ¿La variable de la parte a es cualitativa, cuantitativa
discreta o cuantitativa continua?
1.4 ¿Discreta o continua? Identifique cada una de las
variables cuantitativas como discretas o continuas. c. Identifique la población de interés para el investigador
médico.
a. Número de accidentes en botes en un tramo de
50 millas del río Colorado. d. Describa la forma en que el investigador podría
seleccionar una muestra de entre la población.
b. Tiempo para completar un cuestionario.
e. ¿Qué problemas podrían surgir al muestrear desde esta
c. Costo de una lechuga.
población?
d. Número de hermanos y hermanas que usted tenga .
1.9 Nuevos métodos de enseñanza Un investigador
e. Rendimiento en kilogramos de trigo para un terreno de educacional desea evaluar la eficacia de un nuevo método
1 hectárea de un trigal. de enseñanza de lectura a estudiantes sordos. El logro
1.5 Estacionamiento en un plantel Se seleccionan seis es medido al final de un periodo de enseñanza por la
vehículos de los que tienen permiso para estacionarse y se calificación de un estudiante en un examen de lectura.
registran los datos siguientes: a. ¿Cuál es la variable que se medirá? ¿Qué tipo de
Distancia variable es?
de viaje
(millas) Antigüedad b. ¿Cuál es la unidad experimental?
en una del vehículo c. Identifique la población de interés para el
Vehículo Tipo Marca ¿Colectivo? dirección (años) experimentador.
1 Auto Honda No 23.6 6
2 Auto Toyota No 17.2 3 TÉCNICAS BÁSICAS
3 Camión Toyota No 10.1 4
4 Van Dodge Sí 31.7 2 1.10 Cincuenta personas se agrupan en cuatro categorías,
5 Moto- Harley- No 25.5 1 A, B, C y D, y el número de personas que caen en cada
cicleta Davidson categoría se muestra en la tabla:
6 Auto Chevrolet No 5.4 9
Categoría Frecuencia
a. ¿Cuáles son las unidades experimentales?
A 11
b. ¿Cuáles son las variables que se miden? ¿Qué tipos de B 14
variables son? C 20
D 5
c. ¿Estos datos son univariados, bivariados o
multivariados?
a. ¿Cuál es la unidad experimental?
1.6 Presidentes de Estados Unidos Un conjunto
de datos contiene las edades en el momento de su b. ¿Cuál es la variable que se mide? ¿Es cualitativa o
fallecimiento de cada uno de los 38 ex presidentes de cuantitativa?
Estados Unidos. c. Elabore una gráfica de pastel para describir los datos.
a. ¿Este conjunto de mediciones es una población o una d. Construya una gráfica de barras para describir los datos.
muestra? e. ¿La forma de la gráfica de barras de la parte d cambia
b. ¿Cuál es la variable que se mide? dependiendo del orden de presentación de las cuatro
c. ¿La variable de la parte b es cuantitativa o cualitativa? categorías? ¿Es importante el orden de presentación?
1.7 Actitudes del electorado Usted es candidato a la f. ¿Qué proporción de las personas está en la categoría B,
legislatura de su estado y desea hacer una encuesta de las C o D?
actitudes del electorado sobre sus probabilidades de ganar. g. ¿Qué porcentaje de las personas no está en la categoría
Identifique la población que es de interés para usted y de B?
16 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
1.11 Jeans Un fabricante de jeans (pantalones vaqueros) Los resultados se basaron en una muestra tomada en los
tiene plantas en California, Arizona y Texas. Un grupo días 9 a 11 de abril de 2010, de 907 votantes registrados en
de 25 pares de jeans se selecciona al azar de la base de todo el país.
datos computarizada, registrándose el estado en el que se a. Si los entrevistadores estuvieran planeando usar estos
produjo cada uno: resultados para pronosticar el resultado de la elección
presidencial de 2012, describa la población de interés
CA AZ AZ TX CA
CA CA TX TX TX para ellos.
AZ AZ CA AZ TX b. Describa la población real de la cual se sacó la muestra
CA AZ TX TX TX
CA AZ AZ CA CA c. Algunos entrevistadores prefieren seleccionar una
muestra de “probables” votantes. ¿Cuál es la diferencia
a. ¿Cuál es la unidad experimental? entre “votantes registrados” y “probables votantes”?
¿Por qué es importante esto?
b. ¿Cuál es la variable que se mide? ¿Es cualitativa o
cuantitativa? d. La muestra seleccionada por los entrevistadores, ¿es
representativa de la población descrita en la parte a?
c. Elabore una gráfica de pastel para describir los datos. Explique.
d. Construya una gráfica de barras para describir los datos. 1.13 ¿Desea ser presidente? ¿Le gustaría ser
e. ¿Qué proporción de los jeans se hizo en Texas? presidente de Estados Unidos? Aun cuando muchos
f. ¿Cuál estado produjo más jeans? adolescentes piensan que podrían llegar a ser presidente,
g. Si desea averiguar si las tres plantas produjeron igual la mayoría no desea el trabajo. En una encuesta de opinión
número de jeans, o si una produjo más que las otras, realizada por ABC News, casi 80% de los adolescentes no
¿cómo se usarían las gráficas de las partes c y d para estaban interesados en el trabajo.2 Cuando se les preguntó:
ayudarse? ¿Qué conclusiones obtiene de estos datos? “¿Cuál es la principal razón por la que no quisieras ser
presidente?” dieron estas respuestas:
APLICACIONES
Otros planes de carrera/no le interesa 40%
1.12 Elección 2012 Durante la primavera de 2010, Demasiada presión 20%
los medios de comunicación ya realizaban encuestas de Demasiado trabajo 15%
opinión que rastreaban las fortunas de los principales No sería bueno para ello 14%
candidatos que esperaban ser presidentes de Estados Demasiadas discusiones 5%
Unidos. Una de estas encuestas, dirigida por CNN/
Opinion Research Corporation Poll, mostró los siguientes a. ¿Están consideradas todas las razones en esta tabla?
resultados:1 Agregue otra categoría si es necesario.
“Si Barack Obama fuera el candidato del Partido Demócrata y [véa- b. ¿Usaría usted una gráfica de pastel o una de barras para
se abajo] fuera el candidato del Partido Republicano, ¿por quién describir gráficamente los datos? ¿Por qué?
sería más probable que votara: Obama, el demócrata, o [véase aba-
c. Trace la gráfica elegida en la parte b.
jo] el republicano?” Si no está seguro: “Al día de hoy, ¿por quién se
inclinaría más?” d. Si usted dirigiera la encuesta de opinión, ¿qué otros
tipos de preguntas desearía investigar?
a. Defina la variable que se ha medido en esta tabla. de vacaciones? A continuación se muestra una gráfica de
b. ¿La variable es cuantitativa o cualitativa? barras con datos de la sección Instantáneas de USA Today.4
c. ¿Qué representan los números? a. ¿Están consideradas todas las opiniones en la tabla?
Agregue otra categoría si es necesario.
d. Construya una gráfica de pastel para describir la
distribución de edad de los usuarios de Facebook el 4 de b. ¿La gráfica de barras está trazada con precisión? Esto
enero de 2009. es, ¿están las tres barras en la proporción correcta entre
sí?
e. Construya una gráfica de pastel para describir la
distribución de edad de los usuarios de Facebook el 4 de c. Use una gráfica de pastel para describir las opiniones.
enero de 2010. ¿Cuál gráfica es más interesante observar?
f. Consulte las partes d y e. ¿Cómo describiría los
cambios en las distribuciones de edad de los usuarios de
Facebook durante este periodo de un año?
1.15 De regreso al trabajo ¿Cuánto tarda usted en
ajustarse a su rutina normal de trabajo después de regresar
Un
día 40%
Algunos
días 34%
Sin
tiempo 19%
EJEMPLO 1.5 La cantidad de dinero gastada en el año fiscal 2009 por el Departamento de Defensa de Esta-
dos Unidos en varias categorías se muestra en la tabla 1.5.5 Construya una gráfica de pastel
y una gráfica de barras para describir los datos. Compare las dos formas de presentación.
FIGURA 1.6
Gráfica de barras para el
Cantidad (miles de millones)
200
150
100
50
0
llo n y
s
ta ón
ili al
tra
m y
s
ne
o
m son
rro ió
ni n
ili ci
O
nt
te ció
r
io
sa ac
m truc
ta
ie
r
sic
r
Pe
de stig
an ra
ns
m pe
ui
ve
Co
dq
O
In
A
Para la gráfica de pastel de la figura 1.7, cada “rebanada” representa la proporción de los gastos
totales (636,700 millones de dólares) correspondientes a su categoría en particular. Por ejem-
plo, para la categoría de investigación y desarrollo, el ángulo del sector es
79.0
360° 44.7°
636.7
FIGURA 1.7
Gráfica de pastel para el Construcción
ejemplo 1.5 militar
Investigación y 17.6
desarrollo
79.0 Personal
militar
147.3
Adquisiciones
129.2
Operación y
Otras mantenimiento
4.3 259.3
1.4 GRÁFICAS PARA DATOS CUANTITATIVOS 19
Ambas gráficas muestran que las cantidades más grandes de dinero se gastaron en personal y
operaciones. Como no hay un orden inherente a las categorías, hay libertad para reacomodar
las barras o los sectores de las gráficas en cualquier forma deseada. La forma de la gráfica
de barras no tiene nada que ver con su interpretación.
Gráficas de líneas
Cuando una variable cuantitativa se registra en el tiempo a intervalos igualmente espaciados
(por ejemplo diario, semanal, mensual, trimestral o anual), el conjunto de datos forma una
serie de tiempo. Los datos de una serie de tiempo se presentan con más efectividad en
una gráfica de líneas con el tiempo como eje horizontal. La idea es tratar de distinguir un
patrón o tendencia que sea probable de continuar y usar ese patrón para hacer predicciones
precisas para el futuro inmediato.
EJEMPLO 1.6 En el año 2025, el mayor de los baby boomers (nacido en 1946) tendrá 79 años de edad, y
el mayor de los de la Generación X (nacido en 1965) estará a dos años de ser elegible para el
Seguro Social. ¿Cómo afectará esto a las tendencias del consumidor en los siguientes 15
años? ¿Habrá suficientes fondos para que los baby boomers reciban prestaciones del Seguro
Social? La Oficina de Censos de Estados Unidos aporta proyecciones para la parte de la
población estadounidense que tendrá 85 años o más en los próximos años, como se muestra
en la tabla 1.6.5 Construya una gráfica de líneas para ilustrar los datos. ¿Cuál es el efecto de
prolongar y contraer el eje vertical de la gráfica de línea?
Solución La variable cuantitativa “85 y más” se mide en cuatro intervalos, creando así
MI CONSEJO
una serie de tiempo que se grafica con una gráfica de línea. Los intervalos están marcados en
¡Tenga cuidado de el eje horizontal y las proyecciones en el eje vertical. Los puntos de datos se enlazan entonces
prolongar o contraer los por medio de segmentos de línea para formar las gráficas de línea de la figura 1.8. Observe la
ejes cuando vea una
gráfica! marcada diferencia en las escalas verticales de las dos gráficas. Contraer la escala en el eje
vertical hace que grandes cambios aparezcan pequeños y viceversa. Para evitar conclusiones
erróneas, se deben ver con cuidado las escalas de los ejes vertical y horizontal. No obstante, de
ambas gráficas se obtiene una imagen clara del número constantemente creciente de quienes
tengan 85 años o más en los primeros años del nuevo milenio.
FIGURA 1.8
Gráficas de línea para el
20.0
ejemplo 1.6 100
85 y mayores (Millones)
85 y mayores (Millones)
17.5
80
15.0
60
12.5
40
10.0
7.5 20
5.0
2020 2030 2040 2050 2020 2030 2040 2050
Año Año
20 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
Gráficas de puntos
Muchos conjuntos de datos cuantitativos están formados de números que no se pueden separar
fácilmente en categorías o intervalos. En consecuencia, ¡se necesita una forma diferente de
graficarlos!
La gráfica más sencilla para datos cuantitativos es la gráfica de puntos. Para un conjunto
pequeño de mediciones (por ejemplo, el conjunto 2, 6, 9, 3, 7, 6) simplemente se grafican las
mediciones como puntos en un eje horizontal, como se muestra en la figura 1.9a). Para un
conjunto grande de datos, como el de la figura 1.9b), la gráfica de puntos puede ser poco útil
y tediosa en cuanto a la interpretación de la información.
(a)
FIGURA 1.9
Gráficas de puntos para
conjuntos pequeños y
grandes de datos
2 3 4 5 6 7 8 9
Conjunto pequeño
(b)
MI APPLET EN LÍNEA
Construcción de una
gráfica de puntos
NECESITO SABER...
EJEMPLO 1.7 La tabla 1.7 es una lista de precios (en dólares) de 19 marcas de zapatos deportivos. Construya
una gráfica de tallo y hoja para mostrar la distribución de los datos.
1.4 GRÁFICAS PARA DATOS CUANTITATIVOS 21
Solución Para crear el tallo y la hoja se divide cada observación entre las unidades y las
decenas. El número a la izquierda es el tallo; el de la derecha es la hoja. Entonces, para los
zapatos que cuestan $65.00, el tallo es 6 y la hoja es 5. Los tallos, que van de 4 a 9, aparecen
en la figura 1.10, junto con las hojas para cada una de las 19 mediciones. Si indicamos que la
unidad de hoja es 1, el lector verá que el tallo y hoja 6 y 8, por ejemplo, representan el número
68 registrado al dólar más cercano.
FIGURA 1.10
Gráfica de tallo y hoja para 4 0 Unidad de hoja
4 1 0
los datos de la tabla 1.7 5 5
6 580855 Reordenamiento ⎯→ 6 055588
7 0005040500 7 0000000455
8 8
9 05 9 05
MI CONSEJO A veces las opciones de tallo disponibles resultan en una gráfica que contiene muy pocos
tallos y un gran número de hojas dentro de cada tallo. En esta situación, se prolongan los tallos
tallo | hoja
al dividir cada uno en varias líneas, dependiendo de los valores de hojas que se les asignen. Por
lo general, los tallos se dividen en dos formas:
• En dos líneas, con las hojas 0-4 en la primera línea y las hojas 5-9 en la segunda línea
• En cinco líneas, con las hojas 0-1, 2-3, 4-5, 6-7 y 8-9 en las cinco líneas,
respectivamente
EJEMPLO 1.8 Los datos de la tabla 1.8 son los pesos de 30 bebés de gestación completa al momento de nacer
en un hospital metropolitano y cuyos pesos están registrados al décimo de libra más cercano.6
Construya una gráfica de tallo y hoja para mostrar la distribución de los datos.
Solución Los datos, aun cuando están registrados a una precisión de sólo un lugar deci-
mal, son mediciones de la variable continua x = peso, que puede tomar cualquier valor positi-
vo. Al examinar la tabla 1.8, rápidamente se observa que los pesos más alto y más bajo son 9.4
y 5.6, respectivamente. Pero, ¿cómo están distribuidos los pesos restantes?
22 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
Si se usa el punto decimal como línea divisoria entre el tallo y las hojas, tenemos sólo cinco
tallos que no producen una imagen muy buena. Cuando se divide cada uno de los tallos en dos
líneas, hay ocho tallos porque la primera línea del tallo 5 y la segunda línea del tallo 9 están
vacías. Esto produce una gráfica más descriptiva, como se muestra en la figura 1.11. Para estos
datos, la unidad de hoja es .1 y el lector puede inferir que el tallo y hoja 8 y 2, por ejemplo,
representan la medición x = 8.2.
FIGURA 1.11
Gráfica de tallo y hoja para 5 86 5 68
los datos de la tabla 1.8 6 12 6 12
6 8887 Reordenamiento → 6 7888
7 221 7 122
7 879577587 7 557777889
8 0222 8 0222
8 565 8 556
9 040 Unidad de hoja .1 9 004
Si la gráfica de tallo y hoja se gira hacia un lado de modo que la recta vertical sea ahora
un eje horizontal, se observa que los datos se han “apilado” o “distribuido” a lo largo del eje,
de modo que se puede describir como “forma de montículo”. Esta gráfica de nuevo muestra
que los pesos de estos 30 recién nacidos varían entre 5.6 y 9.4; muchos pesos están entre 7.5 y
8.0 libras.
• Primero, verificar las escalas horizontales y verticales, de manera que haya claridad
en relación con lo que se mide.
• Examinar el lugar de la distribución de datos. ¿Dónde está el centro de distribución
del eje horizontal? Si se comparan dos distribuciones, ¿están centradas en el mismo
lugar?
• Examinar la forma de la distribución. ¿La distribución tiene un “pico”, un punto que es
más alto que cualquier otro? Si es así, ésta es la medición o categoría que se presenta
con más frecuencia. ¿Hay más de un pico? ¿Hay un número aproximadamente igual de
mediciones a la izquierda y a la derecha del pico?
• Buscar cualesquier mediciones poco comunes o resultados atípicos. Esto es, ¿hay
mediciones mucho mayores o menores que las otras? Es posible que estos resultados
atípicos no sean representativos de los otros valores del conjunto.
Una distribución está sesgada a la izquierda si una proporción mayor de las mediciones está
a la izquierda del valor pico. Las distribuciones sesgadas a la izquierda contienen pocas me-
diciones anormalmente pequeñas.
Una distribución es unimodal si tiene un pico; una distribución bimodal tiene dos picos. Las
distribuciones bimodales representan a veces una combinación de dos poblaciones diferentes
del conjunto de datos
EJEMPLO 1.9 Examine las tres gráficas de puntos que se muestran en la figura 1.12. Describa estas distribu-
ciones en términos de sus ubicaciones y formas.
FIGURA 1.12
Formas de distribución de
datos para el ejemplo 1.19
1 2 3 4 5 6 7
2 4 6 8
2 4 6 8
MI CONSEJO Solución La primera gráfica de puntos muestra una distribución relativamente simétrica
Simétrica ⇔ imágenes
con un solo pico situado en x = 4. Si se dobla la página en este pico, las mitades izquierda y
espejo derecha casi serían imágenes espejo. La segunda gráfica, no obstante, está lejos de ser simé-
Sesgada a la derecha ⇔ trica. Tiene una larga “cola derecha”, lo cual significa que hay unas pocas observaciones anor-
cola larga a la derecha malmente grandes. Si se dobla la página en el pico, estaría en el lado derecho una proporción
Sesgada a la izquierda ⇔ de mediciones más grande que en el izquierdo. Esta distribución está sesgada a la derecha.
cola larga a la izquierda
Del mismo modo, la tercera gráfica de puntos con una larga “cola a la izquierda” está sesgada
a la izquierda.
EJEMPLO 1.10 Un asistente administrativo del departamento de atletismo de una universidad local está ob-
servando los promedios de calificaciones de ocho miembros del equipo femenil de volibol. El
asistente introduce los promedios en la base de datos pero por accidente coloca mal el punto
decimal de la última entrada.
2.8 3.0 3.0 3.3 2.4 3.4 3.0 .21
24 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
Use una gráfica de puntos para describir los datos y descubrir el error del asistente.
Solución La gráfica de puntos de este pequeño conjunto de datos se muestra en la figura
1.13a). Claramente se distingue el resultado atípico u observación poco común causada por el
error del asistente al introducir los datos. Una vez corregido el error, como en la figura 1.13b),
se observa la distribución correcta del conjunto de datos. Como éste es un conjunto muy pe-
queño, es difícil describir la forma de la distribución aun cuando parece tener un valor pico
alrededor de 3.0 y parece ser relativamente simétrica.
(a)
FIGURA 1.13
Distribuciones de
promedios de calificaciones
para el ejemplo 1.10
(b)
Cuando se comparen gráficas creadas para dos conjuntos de datos, se deben comparar sus
escalas de medición, ubicaciones y formas, y buscar mediciones poco comunes o resultados
MI CONSEJO atípicos. Recuerde que estos últimos no siempre son causados por errores o introducción erró-
Los resultados atípicos
nea de datos. A veces dan información muy valiosa que no debe ser soslayada. Es posible que
están lejos del cuerpo se necesite más información para determinar si un resultado atípico es una medición válida
principal de datos que sólo sea anormalmente grande o pequeña, o si ha habido algún tipo de error en la recolec-
ción de datos. Si las escalas difieren en mucho, debe tenerse cuidado al hacer comparaciones
o ¡sacar conclusiones que pudieran ser imprecisas!
FIGURA 1.14
(a)
Cómo construir un 6.0 6.6 7.2 7.8 8.4 9.0
histograma Pesos al nacer
(b)
6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5
Pesos al nacer
Como regla práctica, el número de clases debe ser de 5 a 12; cuantos más datos haya, más
clases se requieren.† Las clases deben ser elegidas para que cada una de las mediciones caiga
en una clase y sólo en una. Para los pesos al nacer que se muestran en la tabla 1.9, decidimos
MI APPLET EN LÍNEA usar ocho intervalos de igual longitud. Como el intervalo de pesos al nacer es
“Construcción de un 9.4 5.6 3.8
histograma”
“Lanzamiento de
monedas” el ancho mínimo de clase necesario para cubrir el margen de los datos es (3.8 8) .475.
Para más comodidad, redondeamos este ancho aproximado a .5. Empezando el primer inter-
valo al valor más bajo, 5.6, formamos subintervalos desde 5.6 hasta, pero no incluyendo 6.1,
de 6.1 hasta, pero no incluyendo 6.6, y así sucesivamente. Usando el método de inclusión
izquierda, e incluyendo el punto de frontera de clase izquierda pero no el punto de frontera
derecha en la clase, eliminamos cualquier confusión acerca de dónde poner una medición que
resulte caer en un punto de frontera de clase.
La tabla 1.10 muestra las ocho clases, marcadas de 1 a 8 para identificación. Las fronteras
para las ocho clases, junto con un total del número de mediciones que caen en cada una de
ellas, también se muestran en la tabla. Al igual que con las gráficas de la sección 1.3, podemos
ahora medir con qué frecuencia se presenta cada clase usando frecuencia o frecuencia relativa.
†
Es posible emplear esta tabla como guía para seleccionar un número apropiado de clases. Recuerde que esto es sólo una
guía; puede usar más o menos clases de las que recomienda la tabla si con ello se hace más descriptiva la gráfica.
Tamaño de la muestra 25 50 100 200 500
Número de clases 6 7 8 9 10
26 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
Para construir el histograma de frecuencia relativa, grafique las fronteras de clase a lo largo
del eje horizontal. Trace una barra sobre cada intervalo de clase, con altura igual a la frecuen-
cia relativa para esa clase. El histograma de frecuencia relativa para los datos de peso al nacer,
figura 1.15, muestra de un vistazo la forma en que están distribuidos los pesos al nacer en el
intervalo de 5.6 a 9.4.
FIGURA 1.15
Histograma de frecuencia
relativa
8/30
7/30
Frecuencia relativa
6/30
5/30
4/30
3/30
2/30
1/30
0
5.6 6.1 6.6 7.1 7.6 8.1 8.6 9.1 9.6
Pesos al nacer
EJEMPLO 1.11 Veinticinco clientes de Starbucks® son entrevistados en una encuesta de mercadeo y se les
pregunta, “¿con qué frecuencia visita usted Starbucks en una semana típica?”. La tabla 1.11 es
una lista de respuestas para estos 25 clientes. Construya un histograma de frecuencia relativa
para describir los datos.
Solución La variable que se mide es el “número de visitas a Starbucks”, que es una varia-
ble discreta que toma sólo valores enteros. En este caso, lo más sencillo es elegir las clases o
subintervalos como los valores enteros en el rango de valores observados: 1, 2, 3, 4, 5, 6 y 7.
La tabla 1.12 muestra las clases y sus frecuencias correspondientes y frecuencias relativas. El
histograma de frecuencia relativa se muestra en la figura 1.16.
1.5 HISTOGRAMAS DE FRECUENCIA RELATIVA 27
FIGURA 1.16
Histograma para el
ejemplo 1.11
8/25
Frecuencia relativa
6/25
4/25
2/25
0
1 2 3 4 5 6 7 8
Visitas
Observe que la distribución está sesgada a la izquierda y que hay una brecha entre 1 y 3.
NECESITO SABER...
• La proporción de las medidas que caen en una clase o grupo particular de clases
• La probabilidad de que una medida tomada al azar del conjunto caerá en una clase
particular o grupo de clases
Considere el histograma de frecuencia relativa para los datos del peso al nacimiento de la
figura 1.15. ¿Qué proporción de los recién nacidos tienen al nacer pesos de 7.6 o mayores?
Esto abarca todas las clases de más de 7.6 en la tabla 1.10. Como hay 17 recién nacidos en esas
clases, la proporción de quienes tienen pesos al nacer de 7.6 o más es 17/30, o sea alrededor
de 57%. Éste también es el porcentaje del área total bajo el histograma de la figura 1.15 que
está a la derecha de 7.6.
Supongamos que usted escribió cada uno de los 30 pesos al nacer en pedazos de papel, los
puso en un sombrero y sacó uno de ellos al azar. ¿Cuál es la probabilidad de que este papelito
contenga un peso de 7.6 al nacimiento o más alto? Como 17 de los 30 papelitos caen en esta
categoría, hay 17 probabilidades en 30; esto es, la probabilidad es 17/30. La palabra probabi-
lidad no es desconocida para usted; la estudiaremos en más detalle en el capítulo 4.
Aun cuando estamos interesados en describir un conjunto de n = 30 mediciones, también
podríamos estar interesados en la población de la cual se tomó la muestra, que es el conjunto
de pesos al nacer de todos los bebés nacidos en este hospital. O bien, si estamos interesados en los
pesos de recién nacidos en general, podríamos considerar nuestra muestra como representativa de
la población de pesos al nacer para recién nacidos en hospitales metropolitanos similares. Un his-
tograma de muestra da valiosa información acerca del histograma de población, es decir, la gráfica
que describe la distribución de toda la población. Recuerde, sin embargo, que diferentes muestras
de la misma población producirán histogramas diferentes, aun cuando se usen fronteras de la
misma clase. No obstante, puede esperarse que los histogramas de la muestra y población sean
similares. Al agregar más y más datos a la muestra, los dos histogramas se hacen cada vez más
semejantes. Si se agranda la muestra para incluir toda la población, ¡ambos histogramas serán
idénticos!
1.5 EJERCICIOS
c. ¿Qué fracción de las mediciones es menor que 5.1? Genere una gráfica de líneas para describir los datos.
d. ¿Qué fracción de las mediciones es mayor que 3.6? ¿Piensa usted que hay algún aprendizaje?
e. Compare el histograma de frecuencia relativa con Día 1 2 3 4 5
la gráfica de tallo y hoja del ejercicio 1.16. ¿Son Tiempo (segundos) 45 43 46 32 25
semejantes las formas?
1.18 Considere este conjunto de datos: 1.22 Medición en el tiempo El valor de una
EX0118 EX0122 variable cuantitativa se mide una vez al año
durante un periodo de 10 años. He aquí los datos:
4.5 3.2 3.5 3.9 3.5 3.9
4.3 4.8 3.6 3.3 4.3 4.2 Año Medición Año Medición
3.9 3.7 4.3 4.4 3.4 4.2
4.4 4.0 3.6 3.5 3.9 4.0 1 61.5 6 58.2
2 62.3 7 57.5
3 60.7 8 57.5
4 59.8 9 56.1
a. Construya una gráfica de tallo y hoja usando el dígito 5 58.0 10 56.0
inicial como tallo.
b. Construya una gráfica de tallo y hoja usando dos veces a. Genere una gráfica de líneas para describir la variable
cada uno de los dígitos iniciales. ¿Esta técnica mejora la conforme cambie con el tiempo.
presentación de los datos? Explique. b. Describa las mediciones usando la gráfica construida en
1.19 Una variable discreta puede tomar sólo los valores la parte a.
de 0, 1 o 2. Un conjunto de 20 mediciones sobre esta 1.23 Hamburguesas con queso Cree una gráfica
variable se muestra aquí: de puntos para la cantidad de hamburguesas con queso
1 2 1 0 2 consumidas por 10 estudiantes universitarios en una
2 1 1 0 0 determinada semana.
2 2 1 1 0
0 1 2 1 1 4 5 4 2 1
3 3 4 2 7
a. Construya un histograma de frecuencia relativa para los
datos. a. ¿Cómo describiría la forma de la distribución?
b. ¿Qué proporción de las mediciones es mayor que 1? b. ¿Qué proporción de los estudiantes comieron más de
cuatro hamburguesas con queso esa semana?
c. ¿Qué proporción de las mediciones es menor que 2?
1.24 Calificaciones de examen Las
d. Si una medición se selecciona al azar de entre las 20 calificaciones en un examen de 100 puntos se
mediciones mostradas, ¿cuál es la probabilidad de que EX0124
registraron para 20 estudiantes:
sea un 2?
e. Describa la forma de la distribución. ¿Ve algunos 61 93 91 86 55 63 86 82 76 57
resultados atípicos? 94 89 67 62 72 87 68 65 75 84
1.20 Consulte el ejercicio 1.19. a. Use una gráfica apropiada para describir los datos.
a. Trace una gráfica de puntos para describir los datos. b. Describa la forma y ubicación de las calificaciones.
b. ¿Cómo definiría usted el tallo y la hoja para este c. ¿Es poco común la forma de la distribución?
conjunto de datos? ¿Considera alguna razón por la que la distribución de
c. Trace la gráfica de tallo y hoja usando su decisión de la las calificaciones tendría esa forma?
parte b.
d. Compare la gráfica de puntos, la gráfica de tallo y hoja APLICACIONES
y el histograma de frecuencia relativa (ejercicio 1.19). 1.25 Tiempos de supervivencia Altman y Bland
¿Reflejan todos más o menos la misma información? informaron sobre los tiempos de supervivencia
EX0125
1.21 Navegar en un laberinto Un psicólogo para los pacientes con hepatitis activa, una mitad
experimental midió el tiempo que tardó una rata para del grupo recibió tratamiento con prednisona y la otra
navegar con éxito por un laberinto en cada uno de cinco no recibió tratamiento.7 Los datos que siguen se han
días. Los resultados se muestran en la tabla siguiente. adaptado de los datos de aquellos tratados con prednisona.
30 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
Los tiempos de supervivencia se registraron al mes más c. ¿Cómo resumiría la información mostrada en la gráfica
próximo. sobre los niveles educativos y salarios?
8 87 127 147 1.28 Preescolar A continuación se proporciona
11 93 133 148 la lista de las edades (en meses) de 50 niños que
EX0128
52 97 139 157 se inscribieron por primera vez en una escuela
57 109 142 162 preescolar.
65 120 144 165
38 40 30 35 39 40 48 36 31 36
a. Observe los datos. ¿Adivina la forma aproximada de la 47 35 34 43 41 36 41 43 48 40
distribución de los datos? 32 34 41 30 46 35 40 30 46 37
b. Construya un histograma de frecuencia relativa para los 55 39 33 32 32 45 42 41 36 50
42 50 37 39 33 45 38 46 36 31
datos. ¿Cuál es la forma de la distribución?
c. ¿Hay algún resultado atípico en el conjunto? De ser así,
a. Construya una gráfica de tallo y hoja para los datos.
¿cuáles tiempos de supervivencia son anormalmente
cortos? b. Elabore un histograma de frecuencia relativa para estos
datos. Empiece la frontera inferior de la primera clase
1.26 Una enfermedad recurrente El tiempo
en 30 y use un ancho de clase de 5 meses.
EX0126
(en meses) entre el inicio de una enfermedad en
particular y su recurrencia se registró para c. Compare las gráficas de las partes a y b. ¿Hay alguna
n = 50 pacientes: diferencia importante que le haría elegir una como el
mejor método para exhibir los datos?
2.1 4.4 2.7 32.3 9.9 9.0 2.0 6.6 3.9 1.6
d. ¿Qué proporción de los niños tenían 35 meses (2 años,
14.7 9.6 16.7 7.4 8.2 19.2 6.9 4.3 3.3 1.2
4.1 18.4 .2 6.1 13.5 7.4 .2 8.3 .3 1.3 11 meses) o más, pero menos de 45 meses (3 años,
14.1 1.0 2.4 2.4 18.0 8.7 24.0 1.4 8.2 5.8 9 meses) de edad cuando se inscribieron por primera
1.6 3.5 11.4 18.0 26.7 3.7 12.6 23.1 5.6 .4 vez en preescolar?
a. Construya un histograma de frecuencia relativa para los e. Si un niño fuera seleccionado al azar de este grupo,
datos. ¿cuál es la probabilidad de que tuviera menos de 50
meses de edad (4 años, 2 meses) cuando se inscribió por
b. ¿Describiría usted la forma como aproximadamente
primera vez en preescolar?
simétrica, sesgada a la derecha o sesgada a la izquierda?
1.29 Religión organizada Las estadísticas de
c. Dé la fracción de tiempos de recurrencia menores o
las religiones del mundo son aproximaciones muy
iguales a 10 meses. EX0129
vagas, dado que muchas no dan seguimiento a sus
1.27 La educación funciona La educación miembros. Una estimación de estos números (en millones)
EX0127
funciona, según una instantánea dada por el Bureau se muestra en la tabla siguiente.9
of Labor Statistics.8 La mediana de los ingresos
anuales para seis niveles diferentes de educación se Miembros Miembros
muestra en la tabla: Religión (millones) Religión (millones)
Budismo 376 Judaismo 14
Nivel de educación Mediana de ingresos semanales ($) Cristianismo 2100 Sijismo 23
Menos que diploma de bachillerato 454 Hinduismo 900 China tradicional 394
Graduado de bachillerato 626 Islamismo 1500 Otra 61
Algo de universidad, sin título 699 Indígenas primitivas y
Título técnico 761 africanas tradicionales 400
Título de licenciatura
Título de maestría 1025
Título de especialidad 1257
Título de doctorado 1529 a. Elabore una gráfica de pastel para describir el total de
Mediana de ingresos semanales ($) 1532 miembros en las religiones organizadas del mundo.
Fuente: Bureau of Labor Statistics, Current Population Survey b. Construya una gráfica de barras para describir el total
de miembros en las religiones organizadas del mundo.
a. ¿Qué métodos gráficos usaría usted para describir los c. Ordene los grupos religiosos del número de miembros
datos? menor al mayor. Elabore una gráfica de Pareto para
b. Seleccione el método de la parte a que usted piensa describir los datos. ¿Cuál de las tres es más eficaz?
describe mejor los datos y cree la gráfica apropiada.
1.5 HISTOGRAMAS DE FRECUENCIA RELATIVA 31
Año Nombre Promedio a. Trace una gráfica de tallo y hoja para los datos.
2000 Todd Helton .372 Describa la forma de la distribución. ¿Hay algunos
1915 Larry Doyle .320 resultados atípicos?
1917 Edd Roush .341 b. Construya una gráfica de puntos para los datos. ¿Cuál
1934 Paul Waner .362
de las dos gráficas es más informativa? Explique.
1911 Honus Wagner .334
1898 Willie Keeler .379 1.37 Desechos peligrosos ¿Qué tan seguro es
1924 Roger Hornsby .424 EX0137
su vecindario? ¿Hay algunos lugares cercanos con
1963 Tommy Davis .326 desechos peligrosos? La tabla siguiente muestra el
1992 Gary Sheffield .330 número de lugares con desechos peligrosos en cada uno
1954 Willie Mays .345 de los 50 estados de la Unión Americana y el Distrito de
1975 Bill Madlock .354
1958 Richie Ashburn .350
Columbia en el año 2009:5
1942 Ernie Lombardi .330
AL 15 HI 3 MA 32 NM 14 SD 2
1948 Stan Musial .376
AK 6 ID 9 MI 69 NY 90 TN 15
1971 Joe Torre .363
AZ 9 IL 48 MN 25 NC 36 TX 50
1996 Tony Gwynn .353
AR 9 IN 32 MS 6 ND 0 UT 19
1961 Roberto Clemente .351 CA 96 IA 12 MO 31 OH 41 VT 11
1968 Pete Rose .335 CO 20 KS 12 MT 17 OK 9 VA 31
1885 Roger Connor .371 CT 15 KY 14 NE 13 OR 13 WA 48
2009 Hanley Ramirez .342 DE 15 LA 12 NV 1 PA 97 WV 9
DC 1 ME 12 NH 21 RI 12 WI 39
a. Construya un histograma de frecuencia relativa FL 55 MD 19 NJ 114 SC 26 WY 2
para describir los promedios de bateo para estos 20 GA 16
campeones.
a. ¿Qué variable se está midiendo? ¿La variable es discreta
b. Si usted eligiera al azar uno de los 20 nombres, ¿qué
o continua?
probabilidad hay de que elija un jugador cuyo promedio
fuera arriba de .400 para su año de campeonato? b. Describa la forma de la distribución de datos utilizando
la gráfica de tallo y hoja que aquí se presenta.
1.36 Mejores 20 películas La tabla siguiente
Identifique las mediciones anormalmente grandes
EX0136 presenta las ventas brutas de boletos en fin de
marcadas “HI” por estado.
semana para las mejores 20 películas para el fin de
semana del 25 de junio de 2010.10
Gráfica de tallo y hoja: Desechos peligrosos
Venta bruta Tallo y hoja de los sitios N = 51
fin de semana Unidad de hoja = 1.0
Película ($ millones) 6 0 011223
13 0 6699999
1.Toy Story 3 59.3 23 1 1222223344
2. Son como niños 40.5 (8) 1 55556799
3. Encuentro explosivo 20.1 20 2 01
4. Karate Kid 15.5 18 2 56
5. Los magníficos 6.2 16 3 1122
6. Misión rockstar 3.1 12 3 69
7. Shrek para siempre 3.1 10 4 1
9 4 88
8. Príncipe de Persia 2.8 7 5 0
9. Killers 1.9 6 5 5
10. Jonah Hex 1.6
HI 69, 90, 96, 97, 114
11. Iron Man 2 1.4
12. Sexo en la ciudad 2 1.2
13. Marmaduke 1.0
14. Robin Hood 0.6 c. ¿Encuentra usted alguna razón por la que estos cinco
15. Un hombre solitario 0.5 estados tengan un gran número de sitios con desechos
16. Cómo entrenar a tu dragón 0.5
17. Invierno profundo 0.4
peligrosos? ¿Qué otra variable podría medir para
18. Cartas a Julieta 0.4 ayudar a explicar por qué los datos se comportan así?
19. Joan Rivers: A Piece of Work 0.4
20. Cyrus 0.3
Fuente: www.radiofree.com/mov-tops.shtml
TECNOLOGÍA ACTUAL 33
Conforme usted siga trabajando los ejercicios de este capítulo, adquirirá más experiencia
para reconocer diferentes tipos de datos y determinar el método gráfico más apropiado. Re-
cuerde que el tipo de gráfica que use no es tan importante como la interpretación que acompa-
ña a la imagen. Busque estas importantes características:
Al utilizar estas características como guía, será capaz de interpretar y comparar conjuntos de
datos usando métodos gráficos, que son sólo la primera de numerosas herramientas estadísti-
cas que pronto tendrá a su disposición.
TECNOLOGÍA ACTUAL
FIGURA 1.17
EJEMPLO 1.12 (Gráficas de pastel y barras) El nivel en clase de 105 estudiantes en un curso de introducción
a la estadística se lista en la tabla 1.13. Se ha asentado la variable cualitativa “nivel en clase”
para cada estudiante, y ya se han registrado las frecuencias.
(a)
FIGURA 1.18
Primer año
Segundo año
Frecuencia
Tercer año
Último año
Graduado
4. Haga clic en varias partes de la gráfica de pastel (leyenda, área de la gráfica, sector) y
aparecerá un cuadro con puntos de anclaje redondos y/o cuadrados. Haga doble clic
y aparecerá un cuadro de diálogo. Ajuste la apariencia del objeto o la región seleccionados
en este cuadro y haga clic en OK. Haga clic en Cancel para salir del cuadro de diálogo
sin hacer ningún cambio.
5. Aun en la sección Design, pero en el grupo Type, haga clic en Change Chart Type y
elija el tipo Column más simple. Haga clic en OK para crear una gráfica de barras para
el mismo conjunto de datos, la cual se muestra en la figura 1.18b).
6. Edición de la gráfica de barras: Una vez más, puede experimentar con las diversas
opciones en los grupos Chart Layout y Chart Styles para cambiar el aspecto de la
gráfica. Haga clic en la gráfica de barras entera (“área de la gráfica”) o en el “área de
trazado” interior para alargar la gráfica. Cambie los colores haciendo doble clic en la
región apropiada. Hemos elegido un diseño que permite títulos en los ejes y eliminado
la “entrada de la leyenda de frecuencia”. También hemos elegido eliminar las cuadrículas
menores, al hacer clic en la pestaña Layout en Chart Tools, usando la lista desplegable
Gridlines y seleccionar Primary Horizontal Gridlines Major Gridlines. Hemos
disminuido los huecos entre las barras haciendo clic con el botón derecho en una de las
barras, seleccionando Format Data Series y cambiando Gap Width to 50%.
EJEMPLO 1.13 (Gráficas de líneas) El Promedio Industrial Dow Jones fue supervisado al cierre de las transac-
ciones durante 10 días en un año reciente, con los resultados que se muestran en la tabla 1.14.
TABLA 1.14 Promedio Industrial Dow Jones
Día 1 2 3 4 5 6 7 8 9 10
PIDJ 10,636 10,680 10,674 10,653 10,698 10,644 10,378 10,319 10,303 10,302
1. Haga clic en la pestaña en la parte inferior de la pantalla marcada “Sheet 2”. Introduzca
los Días en la columna A de esta segunda hoja de cálculo y el PIDJ en la columna B.
Deberá tener dos columnas de datos, incluyendo las etiquetas.
2. Resalte los datos del PIDJ en la columna B, usando el botón izquierdo del ratón para
hacer clic y arrastrar de la celda B1 a la celda B11 (escrito en ocasiones como B1:B11).
Haga clic en la pestaña Insert y seleccione Line en el grupo Charts. En la lista
desplegable, verá una variedad de estilos de dónde elegir. Seleccione la primera opción
para producir la gráfica de líneas.
3. Edición de la gráfica de líneas: Una vez más, puede experimentar con las diversas
opciones en los grupos Chart Layout y Chart Styles para cambiar el aspecto de la
gráfica. Hemos elegido un diseño que permite títulos en ambos ejes, los cuales hemos
cambiado a “Día” y “PIDJ”, y hemos eliminado el título y la “entrada de leyenda de
frecuencia”. La gráfica de líneas se muestra en la figura 1.19.
36 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
FIGURA 1.19
PIDJ
Día
4. Nota: Si su serie de tiempo implica periodos que no están igualmente espaciados, es mejor
usar una gráfica de dispersión con los puntos conectados para formar una gráfica de
línea. Este procedimiento se describe en la sección Tecnología actual en el capítulo 3
de este texto.
EJEMPLO 1.14 (Histogramas de frecuencia) Las 40 acciones principales en circulación en el mercado, cla-
sificadas por porcentaje de acciones sobresalientes negociadas en un día particular, se listan
en la tabla 1.15.
(b)
FIGURA 1.21
(a)
Fracuencia
Histograma
Fracuencia
Frecuencia
Más
Más
Porcentaje negociado Porcentaje negociado
TECNOLOGÍA ACTUAL
Introducción a MINITABTM
El software para computadora MINITAB es un programa para Windows diseñado de manera
específica para aplicaciones estadísticas. Supondremos que está familiarizado con Windows y
que conoce las técnicas básicas necesarias para ejecutar comandos desde las pestañas y menús
desplegables en la parte superior de la pantalla. De no ser así, quizás un auxiliar de laboratorio
o un asistente de enseñanza le ayude a dominar lo básico. La versión actual de MINITAB en
el momento de la publicación de este libro es MINITAB 16, usado en el ambiente Windows 7.
Cuando se abre el programa, se despliega la pantalla principal (véase la figura 1.22), la cual
contiene dos ventanas: la ventana Data, similar a la hoja de cálculo de Excel, y la ventana
Session, en la cual aparecerán sus resultados. Del mismo modo que con MS Excel, MINITAB le
permite guardar hojas de cálculo (parecidas a las hojas de cálculo de Excel), proyectos (colec-
ciones de hojas de cálculo) o gráficas.
38 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
FIGURA 1.22
EJEMPLO 1.15 (Gráficas de pastel y barras) El nivel en clase de 105 estudiantes en un curso de introducción
a la estadística se lista en la tabla 1.16. Se ha asentado la variable cualitativa “nivel en clase”
para cada estudiante, y ya se han registrado las frecuencias.
TABLA 1.16 Nivel en clase de estudiantes en un curso de estadística
Nivel Primer año Segundo año Tercer año Último año Graduado
Frecuencia 5 23 32 35 10
1. Introduzca las categorías en la columna C1, con su propio nombre descriptivo, quizá
“Nivel” en la celda gris. Note que el nombre C1 ha cambiado a C1-T debido a que
usted introduce texto en lugar de números. Continúe nombrando la columna 2 (C2)
“Frecuencia” e introduzca las cinco frecuencias numéricas en C2.
2. Para construir una gráfica de pastel para estos datos, haga clic en Graph Pie Chart
y aparecerá un cuadro de diálogo (véase la figura 1.23). Haga clic en el botón de radio
marcado Chart values from a table. Luego coloque su cursor en el cuadro marcado
“Categorical variable”. El usuario puede 1) resaltar C1 en la lista a la izquierda y
elegir Select, 2) hacer doble clic en C1 en la lista a la izquierda o 3) escribir C1 en
el cuadro “Categorical variable”. Del mismo modo, coloque el cursor en el cuadro
marcado “Summary variables” y seleccione C2. Haga clic en Labels y seleccione la
pestaña marcada Slice Labels. Marque los cuadros denominados “Category names”
y “Percent”. Cuando haga clic dos veces en OK, MINITAB creará la gráfica de pastel
que se muestra en la figura 1.24a). Hemos eliminado la leyenda seleccionándola y
suprimiéndola.
TECNOLOGÍA ACTUAL 39
FIGURA 1.23
3. Conforme usted se vuelve más competente en el uso del comando de gráfica de pastel,
es posible que desee sacar ventaja de algunas de las opciones disponibles. Una vez
que se ha creado la gráfica, haga clic con el botón derecho en la gráfica de pastel y
seleccione Edit Pie. Puede cambiar los colores y el formato de la gráfica, “separar”
sectores importantes del pastel y cambiar el orden de las categorías. Si hace clic con
el botón derecho en la gráfica de pastel y selecciona Update Graph Automatically,
la gráfica de pastel se actualizará automáticamente cuando se cambien los datos en las
columnas C1 y C2 de la hoja de cálculo MINITAB.
4. Si desea construir una gráfica de barras, use el comando Graph Bar Chart. En
el cuadro de diálogo que aparece, seleccione Simple. Elija una opción en la lista
desplegable “Bars represent”, dependiendo de la forma en que se hayan introducido
los datos en la hoja de cálculo. Para los datos en la tabla 1.13, se eligió “Values from a
table” y se hizo clic en OK. Cuando aparezca el cuadro de diálogo, coloque el cursor
en el cuadro “Graph variables” y seleccione C2. Coloque el cursor en el cuadro
“Categorical variable” y seleccione C1. Haga clic en OK para terminar la gráfica de
barras, mostrada en la figura 1.24b). Una vez que se ha creado la gráfica, haga clic con
el botón derecho en varias partes de la gráfica de barras y elija Edit para cambiar la
apariencia de la gráfica.
Segundo año
21.9%
Último año
33.3%
Tercer año
30.5%
40 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
(b)
Frecuencia
EJEMPLO 1.16 (Gráficas de líneas) El Promedio Industrial Dow Jones fue supervisado al cierre de las tran-
sacciones durante 10 días en un año reciente, con los resultados que se muestran en la tabla
1.17.
TABLA 1.17 Promedio Industrial Dow Jones
Día 1 2 3 4 5 6 7 8 9 10
PIDJ 10,636 10,680 10,674 10,653 10,698 10,644 10,378 10,319 10,303 10,302
FIGURA 1.25
Día
TECNOLOGÍA ACTUAL 41
EJEMPLO 1.17 (Gráficas de puntos, gráficas de tallo y hoja, histogramas) Las 40 acciones principales en
circulación en el mercado, clasificadas por porcentaje de acciones sobresalientes negociadas
en un día particular, se enlistan en la tabla 1.18. Cree una hoja de cálculo nueva (File New
Minitab Worksheet). Introduzca los datos en la columna C1 y nómbrela “Acciones” en la
celda gris justo debajo de C1.
TABLA 1.18 Porcentaje de acciones en circulación negociadas
11.88 6.27 5.49 4.81 4.40 3.78 3.44 3.11 2.88 2.68
7.99 6.07 5.26 4.79 4.05 3.69 3.36 3.03 2.74 2.63
7.15 5.98 5.07 4.55 3.94 3.62 3.26 2.99 2.74 2.62
7.13 5.91 4.94 4.43 3.93 3.48 3.20 2.89 2.69 2.61
1. Para crear una gráfica de puntos, use Graph Dotplot. En la caja de diálogo que
aparece, elija One Y Simple y haga clic en OK. Para crear una gráfica de tallo y hoja,
use Graph Stem-and-Leaf. Para cualquiera de estas gráficas, ponga su cursor en el
cuadro “Graph variables” y seleccione “Acciones” de la lista a la izquierda (véase la
figura 1.26).
FIGURA 1.26
4. Para ajustar el tipo de fronteras para el histograma, haga clic con el botón derecho en
las barras del histograma y seleccione Edit Bars. Use la pestaña marcada “Binning”
para elegir ya sea “Cutpoints” (Puntos de corte) o “Midpoints” (Puntos medios) para
el histograma; especifique el punto de corte o el punto medio si lo desea. En este
mismo cuadro Edit puede usted cambiar los colores, llenar el tipo y estilo de fuente del
histograma. Si hace clic con el botón derecho en las barras y selecciona Update Graph
Automatically, el histograma se actualiza en forma automática cuando se cambien los
datos de la columna “Acciones”.
Cuando se familiarice con el MINITAB para Windows explorará las diversas opciones dispo-
nibles para cada tipo de gráfica. Es posible graficar más de una variable a la vez, cambiar los
ejes, elegir los colores y modificar gráficas en numerosas formas. No obstante, aun con
los comandos básicos predeterminados, es evidente que la distribución de acciones en circu-
lación en la figura 1.27 está muy sesgada a la derecha.
FIGURA 1.27
Ejercicios suplementarios
1.38 ¿Cuantitativa o cualitativa? Identifique cada e. Número de envolturas de taco rotas en un paquete de
variable como cuantitativa o cualitativa: 100 envolturas.
a. Origen étnico de un candidato a un cargo público. f. Número de garrapatas halladas en cada uno de 50
b. Calificación (0-100) en un examen de conocimientos. conejos de cola de algodón atrapados.
c. Establecimiento de comida rápida preferida por un 1.40 ¿Continuas o discretas? Identifique cada variable
estudiante (McDonald’s, Burger King o Carl’s Jr.). como continua o discreta:
d. Concentración de mercurio en una muestra de atún. a. Número de homicidios en Detroit en el periodo de un
mes.
1.39 ¿Simétrica o sesgada? ¿Espera usted que las
distribuciones de las variables siguientes sean simétricas o b. Lapso entre llegadas de un paciente externo a una
sesgadas? Explique. clínica.
a. Monto en dólares de préstamos no asegurados. c. Número de errores de tipografía en una página de
manuscrito.
b. Monto en dólares de préstamos asegurados.
d. Número de focos defectuosos en un paquete que
c. Precio de una lata de 8 onzas (¼ kg) de chícharos.
contiene cuatro focos.
d. Estatura en pulgadas de mujeres de primer año en la
e. Tiempo necesario para terminar un examen.
universidad.
EJERCICIOS SUPLEMENTARIOS 43
1.41 Continuas o discretas, otra vez Identifique cada Baikal 395 Issyk Kul 115
variable como continua o discreta: Gran Lago del oso 192 Torrens 130
Nyasa 360 Vänern 91
a. Peso de dos docenas de camarones. Gran lago del esclavo 298 Nettilling 67
b. Temperatura corporal de una persona. Erie 241 Winnipegosis 141
Winnipeg 266 Albert 100
c. Número de personas en espera de tratamiento en la sala Ontario 193 Nipigon 72
de emergencia de un hospital. Balkhash 376 Gairdner 90
d. Número de propiedades a la venta de una agencia de Ladoga 124 Urmia 90
Maracaibo 133 Manitoba 140
bienes raíces. Onega 145 Chad 175
e. Número de reclamaciones recibidas por una compañía Eyre 90
de seguros en un día. Fuente: The World Almanac and Book of Facts 2011
1.47 Vetos presidenciales A continuación (1950) 121.3 122.3 121.3 122.0 123.0 121.4 123.2 122.1 125.0 122.1
(1960) 122.2 124.0 120.2 121.4 120.0 121.1 122.0 120.3 122.1 121.4
EX0147aparece una lista de los 44 presidentes de Estados (1970) 123.2 123.1 121.4 119.2† 124.0 122.0 121.3 122.1 121.1 122.2
Unidos, junto con el número de vetos regulares (1980) 122.0 122.0 122.2 122.1 122.2 120.1 122.4 123.2 122.2 125.0
empleados por cada uno de ellos:5 (1990) 122.0 123.0 123.0 122.2 123.3 121.1 121.0 122.4 122.2 123.2
(2000) 121.0 119.97 121.13 121.19 124.06 122.75 121.36 122.17 121.86 122.66
(2010) 124.4
Washington 2 B. Harrison 19
†
J. Adams 0 Cleveland 42 Tiempo récord establecido por Secretariat en 1973
Jefferson 0 McKinley 6 Fuente: www.kentuckyderby.com
Madison 5 T. Roosevelt 42
Monroe 1 Taft 30 a. ¿Piensa usted que con los años habrá una tendencia en
J. Q. Adams 0 Wilson 33 los tiempos ganadores? Trace una gráfica de línea para
Jackson 5 Harding 5
Van Buren 0 Coolidge 20 verificar su respuesta.
W. H. Harrison 0 Hoover 21 b. Describa la distribución de tiempos ganadores usando
Tyler 6 F. D. Roosevelt 372
Polk 2 Truman 180 una gráfica apropiada. Comente sobre la forma de la
Taylor 0 Eisenhower 73 distribución y busque algunas observaciones poco
Fillmore 0 Kennedy 12 comunes.
Pierce 9 L. Johnson 16
Buchanan 4 Nixon 26 1.50 Limpieza de derrame de petróleo en el
Lincoln 2 Ford 48 Golfo El 20 de abril de 2010, Estados Unidos
A. Johnson 21 Carter 13 EX0150
Grant 45 Reagan 39
sufrió un desastre ambiental importante cuando
Hayes 12 G. H. W. Bush 29 la plataforma petrolera Deepwater Horizon explotó en el
Garfield 0 Clinton 36 Golfo de México. La cantidad de personal y equipo usados
Arthur 4 G. W. Bush 11
Cleveland 304 Obama 1
en la limpieza del derrame de petróleo en el Golfo, que
Fuente: The World Almanac and Book of Facts 2011 empezó el 2 de mayo de 2010 (día 13) y duró hasta el 9 de
junio de 2010 (día 51) se da en la siguiente tabla.13
Use una gráfica apropiada para describir el número de Día 13 Día 26 Día 39 Día 51
vetos emitidos por los 44 presidentes. Escriba un párrafo
Número de personal (miles) 3.0 17.5 20.0 24.0
de resumen que describa este conjunto de datos. Áreas de pesca federales cerradas en el Golfo 3% 8% 25% 32%
1.48 Ciudades ventosas ¿Hay algunas ciudades Barreras colocadas (millas) 46 315 644 909
Dispersantes usados (miles de galones) 156 500 870 1143
EX0148
más ventosas que otras? ¿Chicago merece el apodo Barcos desplegados (cientos) 1.0 6.0 14.0 35.0
de “La ciudad de los vientos”? Estos datos son las
velocidades promedio del viento (en millas por hora) para
54 ciudades seleccionadas en Estados Unidos:5 a. ¿Qué métodos gráficos usaría para mostrar estos datos?
b. Antes de trazar sus gráficas, ¿qué tendencias ve en cada
8.9 12.3 10.7 8.4 7.8 11.5 8.2 9.0 8.8 una de las variables mostradas?
7.1 11.8 10.3 7.7 9.0 10.5 9.1 8.7 8.7 c. Use una gráfica de líneas para mostrar el número de
9.1 9.0 10.5 11.2 7.7 8.8 12.2 7.9 8.8 personal desplegado durante este periodo de 51 días.
8.7 7.1 8.7 7.6 5.1 35.1 10.5 10.4 11.0
10.2 8.6 10.7 9.6 8.3 8.0 9.5 7.7 9.4 d. Use una gráfica de barras para mostrar el porcentaje de
8.7 7.8 10.2 6.9 9.2 10.2 6.2 9.6 12.2 áreas de pesca federales cerradas en el Golfo.
Fuente: The World Almanac and Book of Facts 2011 e. Use una gráfica de líneas para mostrar las cantidades
de dispersantes usados. ¿Hay alguna relación de recta
subyacente a lo largo del tiempo?
a. Construya un histograma de frecuencia relativa para
los datos. (SUGERENCIA: Elija las fronteras de clase sin 1.51 Resultados de elecciones La elección
incluir el valor x 35.1 en el rango de valores). EX0151
de 2008 fue una carrera en la que Barack Obama
derrotó a John McCain y a otros candidatos,
b. El valor x 35.1 se registró en Monte Washington, recibiendo 53% del voto popular. El voto popular (en
New Hampshire. ¿La geografía de esa ciudad explica la miles) para Barack Obama en cada uno de los 50 estados
observación? se lista a continuación:14
c. El promedio de velocidad del viento en Chicago está
registrado en 10.3 millas por hora. ¿Considera usted que AL 813 HI 326 MA 1904 NM 472 SD 171
esto es extraordinariamente ventoso? AK 124 ID 236 MI 2873 NY 4805 TN 1087
AZ 1035 IL 3420 MN 1573 NC 2143 TX 3529
1.49 Kentucky Derby El siguiente conjunto de AR 422 IN 1374 MS 555 ND 141 UT 328
EX0149
datos muestra los tiempos ganadores (en segundos) CA 8274 IA 829 MO 1442 OH 2933 VT 219
para las carreras del Derby de Kentucky de 1950 a
2010:12
EJERCICIOS SUPLEMENTARIOS 45
CO 1289 KS 515 MT 232 OK 502 VA 1960 a. Describa las formas de las dos distribuciones. ¿Hay
CT 998 KY 752 NE 333 OR 1037 WA 1751 resultados atípicos?
DE 255 LA 783 NV 534 PA 3276 WV 304
FL 4282 ME 422 NH 385 RI 297 WI 1677 b. ¿Las gráficas de tallo y hoja se asemejan a los
GA 1844 MD 1629 NJ 2215 SC 862 WY 83 histogramas de frecuencia relativa construidos en los
ejercicios 1.51 y 1.52?
a. Con sólo mirar la tabla, ¿qué forma piensa usted que c. Explique por qué la distribución del voto popular para
tendrá la distribución de datos para el voto popular por el presidente Obama por estado está sesgada, en tanto
estado? que el porcentaje de votos populares por estado tiene
b. Trace un histograma de frecuencia relativa para forma de montículo.
describir la distribución del voto popular para el 1.54 Estaturas de estudiantes Las estaturas
presidente Obama en los 50 estados. de 105 estudiantes de un grupo de bioestadística,
EX0153
c. ¿El histograma de la parte b confirma su cálculo en la indicadas voluntariamente, están descritas en el
parte a? ¿Hay resultados atípicos? ¿Cómo los explica? histograma de frecuencia relativa siguiente.
1.52 Resultados de elecciones,
EX0152
continúa Consulte el ejercicio 1.51. A
10/105
continuación aparece el porcentaje del voto
popular recibido por el presidente Obama en cada uno de
los 50 estados:14
Frecuencia relativa
AL 39 HI 72 MA 62 NM 57 SD 45 5/105
AK 38 ID 36 MI 57 NY 63 TN 42
AZ 45 IL 62 MN 54 NC 50 TX 44
AR 39 IN 50 MS 43 ND 45 UT 34
CA 61 IA 54 MO 49 OH 52 VT 68
CO 54 KS 42 MT 47 OK 34 VA 53 0
60 63 66 69 72 75
CT 61 KY 41 NE 42 OR 57 WA 58 Estaturas
DE 62 LA 40 NV 55 PA 55 WV 43
FL 51 ME 58 NH 54 RI 63 WI 56
GA 47 MD 62 NJ 57 SC 45 WY 33 a. Describa la forma de la distribución.
b. ¿Ve alguna característica poco común en este
a. Con sólo mirar la tabla, ¿qué forma piensa usted que
histograma?
tendrá la distribución de datos para el porcentaje del
voto popular por estado? c. ¿Tiene alguna explicación para los dos picos del
histograma? ¿Hay algún otro factor que esté causando
b. Trace un histograma de frecuencia relativa para
que las estaturas formen un montículo en dos picos
describir la distribución. Describa la forma de la
separados? ¿Qué es?
distribución y busque resultados atípicos. ¿La gráfica
confirma su respuesta a la parte a? 1.55 ¡Los diamantes son eternos! Gran parte de la
industria mundial de diamantes se localiza en África;
1.53 Resultados de elecciones, continúa Consulte los
Rusia y Canadá presentan también grandes ingresos por su
ejercicios 1.51 y 1.52. Las siguientes gráficas de tallo y hoja
industria minera de diamantes. A continuación se muestra
fueron generadas usando el MINITAB para las variables
una representación visual de las diversas participaciones
llamadas “Voto popular” y “Porcentaje de Votos”.
en los ingresos mundiales por diamantes, adaptado de
Gráfica de tallo y hoja: Gráfica de tallo y hoja: Time Magazine:15
Voto popular Porcentaje de votos
Participación mundial en los ingresos
Tallo y hoja de Tallo y hoja de 20%
por diamantes
Voto popular N = 50 Voto popular N = 50 Rusia
Unidad de hoja = 100 Unidad de hoja = 1.0
26%
17 0 01112222233333444 3 3 344 Botswana
(10) 0 5555778889 7 3 6899
Otros 18%
23 1 000234 15 4 01222334
Canadá
17 1 5667899 22 4 5555779
8–13%
10 2 12 (9) 5 001234444 Zimbabwe
8 2 89 19 5 556777788 10%
10% Sudáfrica
6 3 24 10 6 11222233
Angola
4 3 5 2 6 8
1 7 2 Fuente: Kimberley Process
HI 42, 48, 82
46 CAPÍTULO 1 DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS
a. Elabore una gráfica de pastel para describir las porcentaje del presupuesto de este año para cada uno de los
diversas participaciones en los ingresos mundiales por 50 estados de Estados Unidos y el Distrito de Columbia.17
diamantes.
b. Genere una gráfica de barras para describir las Déficit esperado el año
siguiente como porcentaje
Mejor
WASH.
diversas participaciones en los ingresos mundiales por 13.9%
MONT.
del presupuesto de este año
Peor
MAINE
32.1%
Excedente
diamantes. ORE.
19.3%
N. D.
Excedente MINN.
26.4%
IDAHO VT 31.1%
S. D.
c. Construya una gráfica de Pareto para describir las Peor
3.3%
WYO.
8.0%
9.0%
WIS.
25.3%
MICH.
8.8%
N. Y.
NH 23.4%
MASS 8.5%
15.5%
diversas participaciones en los ingresos mundiales por NEV.
56.6% UTAH
NEB.
9.7%
IOWA
18.6%
PA. R.I. 13.2%
15.6% ILL IND OHIO 16.3% CONN. 29.2%
diamantes. CALIF.
9.1%
COLO.
21.2% KANS.
MO.
36.1% 9.9% 11.6%
W.V.A. VA
N.J. 37.4%
9.1% KY. 3.5% DEL 11.7%
9.3% 8.2%
d. ¿Qué gráfica es la más efectiva para describir los datos? ARIZ.
35.3%
N. M. OKLA.
ARK.
9.1%
TENN. 10.0%
N.C.
30.5%
MD. 15.0%
6.0% 12.4% S.C. D.C. 1.7%
Even
1.56 Frecuencia del pulso Un grupo de 50 ALA. GA.
MISS. 8.2% 24.3%
22.6%
TEXAS
EX0156
estudiantes de biomedicina tomaron la frecuencia 12.8% LA. 14.6%
11.1%
ALASKA HAWAII
de sus pulsos, al contar el número de pulsaciones Excedente 12.9% FLA.
22.2%
durante 30 segundos y luego multiplicando por 2.
80 70 88 70 84 66 84 82 66 42
52 72 90 70 96 84 96 86 62 78
60 82 88 54 66 66 80 88 56 104 a. Construya un histograma de frecuencia relativa para
84 84 60 84 88 58 72 84 68 74 describir los porcentajes para los 48 estados que esperan
84 72 62 90 72 84 72 110 100 58
enfrentar déficits el siguiente año.
a. ¿Por qué son pares todos los números de las b. ¿Cuál es la forma del histograma? ¿Observa alguna
mediciones? característica poco común? Si hay resultados atípicos,
b. Trace una gráfica de tallo y hoja para describir los ¿puede explicarlos?
datos, dividiendo cada tallo en dos líneas. c. Hay tres estados, Alaska, Montana y Dakota del Norte,
c. Construya un histograma de frecuencia relativa para los que esperan un excedente el siguiente año. ¿Existe
datos. alguna razón por la que podría suceder esto?
d. Escriba un párrafo corto que describa la distribución de 1.59 Un hallazgo arqueológico Un artículo en
las frecuencias de pulsos de los estudiantes. EX0159
Archaeometry contenía un análisis de 26 muestras
de alfarería romano-británica, hallada en cuatro
1.57 Starbucks Estudiantes de la Universidad de
sitios de hornos en el Reino Unido.18 Las muestras fueron
EX0157
California en Riverside (UCR), junto con muchos
analizadas para determinar su composición química, y
otros californianos, ¡adoran sus Starbucks! A
el porcentaje de óxido de aluminio de cada una de las 26
continuación se muestran las distancias en millas desde el
muestras se presenta en la tabla siguiente.
plantel para los 41 locales de Starbucks dentro de un radio
de 10 millas de la UCR:16
Llanederyn Caldicot Island Thorns Ashley Rails
0.4 0.5 4.3 5.2 9.3 4.2 8.3 9.4 7.3 7.1 8.7
14.4 11.6 11.8 18.3 17.7
6.1 3.7 8.0 4.8 3.9 5.3 9.8 1.2 6.4 9.8
13.8 11.1 11.6 15.8 18.3
8.0 7.8 9.4 8.4 5.9 9.8 7.3 2.5 9.6 0.7
14.6 13.4 18.0 16.7
6.7 7.6 9.7 3.5 9.5 8.8 9.0 7.9 5.2 6.8
11.5 12.4 18.0 14.8
13.8 13.1 20.8 19.1
Construya una frecuencia relativa para describir las 10.9 12.7
distancias desde el plantel de la UCR, usando 10 clases de 10.1 12.5
ancho 1, empezando en 0.0.
a. ¿Cuál es la forma del histograma? ¿Observa algunas Construya un histograma de frecuencia relativa para
características poco comunes? describir el contenido de óxido de aluminio en las 26
b. ¿Explique por qué se ve así el histograma? muestras.
1.58 Tiempos de tensión En la primavera de a. ¿Qué característica poco común observa usted en
2010 casi todos los 50 estados de Estados Unidos esta gráfica? ¿Encuentra alguna explicación de esta
EX0158
más el Distrito de Columbia enfrentaban una crisis característica?
financiera drástica, con muchos recortes presupuestales en b. Trace una gráfica de puntos para los datos, usando
la planeación en todas las áreas, despidos, colegiaturas de una letra (L, C, I o A) para localizar el punto de datos
educación superior y otras estrategias para acortar la brecha en la escala horizontal. ¿Ayuda esto a explicar la
presupuestal esperada para el año siguiente. La imagen que característica poco común de la parte b?
sigue muestra el déficit esperado el siguiente año como
EJERCICIOS SUPLEMENTARIOS 47
Frecuencia relativa
de los estadounidenses, adaptada de un artículo de The
Press-Enterprise.19 .20
.10
Número de caloría
0
30 40 50 60 70 80 90 100
40.0-47.7
Menor que 40
PROMEDIO DE
ESTADOS UNIDOS 47.7
a. Construya una gráfica de tallo y hoja para los datos. a. Trace una gráfica de puntos para describir los datos.
b. ¿Cómo describiría la forma de esta distribución? b. Describa la forma de la distribución.
c. ¿Hay estados con impuesto a la gasolina c. ¿Hay otra variable medible que ayude a entender por
extraordinariamente bajo o alto? Si es así, ¿cuáles son qué algunas ciudades tienen más Starbucks que otras?
esos estados? Explique.
1.64 Plantas hidroeléctricas Los datos 1.67 ¿Qué es normal? La temperatura corporal
siguientes representan capacidades estimadas en EX0167
de 98.6 grados Farenheit como estándar en
EX0164
megawatts (millones de watts) para las 20 plantas los seres humanos fue obtenida por un médico
hidroeléctricas más grandes del mundo.5 alemán en 1868. En un intento por verificar esta
afirmación, Mackowiak, Wasserman y Levine22 tomaron
18,200 4,500 3,000 las temperaturas de 148 personas sanas en un periodo
12,600 4,200 2,940 de tres días. Un conjunto de datos, que estrechamente se
10,000 4,200 2,715 compara con el del artículo de Mackowiak, fue obtenido
8,370 3,840 2,700
6,400 3,444 2,541
por Allen Shoemaker y aparece en la Journal of Statistics
6,300 3,300 2,512 Education.23 Las temperaturas corporales para estas 130
6,000 3,100 personas se muestran en el histograma de frecuencia
Fuente: The World Almanac and Book of Facts, 2011 relativa siguiente.
Use un método gráfico apropiado para describir estos a. Describa la forma de la distribución de temperaturas.
datos. b. ¿Hay algunas observaciones poco comunes? ¿Piensa en
1.66 Starbucks El número de cafeterías alguna explicación para éstas?
EX0166
Starbucks en ciudades a no más de 20 millas de la c. Localice los 98.6 grados normales en el eje horizontal
Universidad de California, en Riverside, se muestra de la gráfica. ¿Parecen estar cerca del centro de
en la tabla siguiente.16 distribución?
CASO PRÁCTICO 49