Documentos de Académico
Documentos de Profesional
Documentos de Cultura
y ESTADÍSTICA
PARA BACHILLERATO
Robert J. Beaver
University of California, Riverside, Emérito
Barbara M. Beaver
University of California, Riverside, Emérito
Impreso en México
1 2 3 4 5 6 22 21 20 19
Prefacio
Cada vez que toma un periódico o una revista, cuando ve un programa por televisión o navega
en internet, aparece la estadística. Cada vez que llena un cuestionario, se registra en un sitio
web o desliza su tarjeta de puntos por el lector electrónico de algún supermercado, sus datos
personales pasan a una base de datos que contiene su información estadística personal. No
puede evitar el hecho de que en esta era de la información, la recolección y el análisis de datos
son una parte integral de nuestras actividades cotidianas. Para ser un cliente y un ciudadano
educado necesita entender cómo la estadística se aplica día con día y, si es el caso, cómo se le
da un mal uso en nuestras vidas.
CARACTERÍSTICAS DISTINTIVAS
Esta edición presenta la descripción tradicional para la cobertura de los temas de la estadística.
Conserva la simplificación y claridad del lenguaje con un estilo más legible y “amigable”, sin
sacrificar la integridad estadística de la presentación. Se ha hecho un gran esfuerzo para ense-
ñar cómo aplicar los procedimientos estadísticos, al igual que para explicar:
Ejercicios
La variedad y el número de aplicaciones reales en los conjuntos de ejercicios es la mayor
fortaleza de esta edición. Se han incluido los conjuntos de ejercicios para darle nuevas e inte-
resantes situaciones del mundo real y conjuntos de datos reales, muchos de ellos extraídos de
periódicos y revistas científicas recientes. Los ejercicios se gradúan según su nivel de dificul-
tad; algunos, relacionados con técnicas básicas, pueden ser resueltos por casi todos los alum-
nos, mientras que otros, moldeados para aplicaciones prácticas e interpretación de resultados,
harán que los alumnos usen un razonamiento y entendimiento estadísticos más complejos.
Organización y cobertura
Esta edición se diseñó para cubrir los aprendizajes esperados de Probabilidad y estadística en
bachillerato. Presenta los principales conceptos con un enfoque en la solución de problemas y
en el análisis de casos para favorecer un aprendizaje amplio y duradero en el alumno.
De manera integral, esta obra destaca la importancia de interpretar y dar solución a los
problemas de aplicación permitiendo generar así un pensamiento lógico y práctico para la
interpretación de resultados con base en la probabilidad.
Los temas desarrollados en la obra son:
• Distribución de frecuencias
• Medidas de tendencia central
• Medidas de variabilidad
• Análisis combinatorio
• Introducción a la probabilidad
• Condicionalidad e independencia
• Variables aleatorias y distribuciones de probabilidad,
• Distribución binomial
• Distribución normal
• Datos bivariados
Todos estos apoyos ofrecen la oportunidad de aplicar las técnicas, anteriormente menciona-
das, de manera que el alumno logre comprender la utilidad de la probabilidad y la estadística
dentro de su contexto.
PREFACIO v
RECONOCIMIENTOS
Los autores agradecen a Molly Taylor y al personal editorial de Cengage Learning por su
paciencia, asistencia y cooperación en la preparación de esta edición. Un agradecimiento es-
pecial a Gary McClelland por las applets Java usadas en el texto.
También se agradece a los revisores de la decimocuarta edición de Introducción a la Pro-
babilidad y Estadística Ronald C. Degges, Bob C. Denton, Dra. Dorothy M. French, Jungwon
Mun, Kazuhiko Shinki, Florence P. Shu y a los revisores de la décimo tercera edición Bob
Denton, Timothy Husband, Rob LaBorde, Craig McBride, Marc Sylvester, Kanapathi Thiru y
Vitaly Voloshin. Deseamos agradecer a los autores y organizaciones por permitirnos reimpri-
mir material selecto; se hacen reconocimientos siempre que tal material aparece en el texto.
Robert J. Beaver
Barbara M. Beaver
Contenido breve
1 DISTRIBUCIÓN DE FRECUENCIA 1
3 MEDIDAS DE VARIABILIDAD 55
4 ANÁLISIS COMBINATORIO 81
3 MEDIDAS DE VARIABILIDAD 55
Evaluación diagnóstica 56
3.1 Medidas de variabilidad por intervalos 57
Rango semi-intercuartil 57
Rango percentil 10-90 59
3.2 Medición de la variabilidad por desviaciones 60
Desviación media 60
Varianza 61
Desviación estándar 63
3.3. Sobre la significación práctica de la
desviación estándar 65
3.4 Una medición del cálculo de s 68
3.5 Mediciones relativas de la variabilidad 69
Estandarización de variables 71
3.6 Relaciones entre medidas de dispersión 74
Actividad sumativa 77
Rúbrica para evaluar proyecto estadístico 79
4 ANÁLISIS COMBINATORIO 81
Evaluación diagnóstica 82
Introducción 83
4.1 Principios fundamentales 83
Principio aditivo de conteo 83
Principio multiplicativo de conteo 83
Tareas con una etapa 84
Tareas con dos etapas 84
Tareas con más de dos etapas 86
4.2 Permutaciones 89
Permutaciones lineales con objetos diferentes 89
Permutaciones lineales con objetos no distinguibles 91
4.3 Combinaciones 93
Una regla de conteo para combinaciones 94
Guía para saber cuándo usar permutaciones
y cuándo usar combinaciones 94
Actividad sumativa 97
Rúbrica para evaluar proyecto estadístico 98
x CONTENIDO
Distribución de
frecuencia
© Pressmaster/Shutterstock
1
2 CAPÍTULO 1 DISTRIBUCIÓN DE FRECUENCIA
Evaluación diagnóstica
1. ¿Qué es la estadística?
INTRODUCCIÓN A LA ESTADÍSTICA
1.1
Cuando usted tiene ante sí un conjunto de mediciones, ya sea una muestra o una población, necesita
MI CONSEJO encontrar una forma de organizarlo y resumirlo. La rama de la estadística que enseña técnicas para
describir los conjuntos de mediciones se denomina estadística descriptiva. Usted ha visto estadísti-
La estadística es una cas descriptivas en numerosas formas: gráficas de barras, gráficas de pastel y gráficas de líneas pre-
rama de las matemáticas sentadas por un candidato político; tablas numéricas en el periódico, o el promedio de cantidad de
que tiene aplicaciones en
lluvia informado por el pronosticador del clima en la televisión local. Las gráficas y resúmenes nu-
casi todas las facetas de
méricos generados en computadoras son comunes en nuestra comunicación de todos los días.
nuestra vida. Es un
lenguaje nuevo y poco
conocido para la mayoría Definición La estadística descriptiva está formada por procedimientos empleados para resumir
de las personas pero, al y describir las características importantes de un conjunto de mediciones.
igual que cualquier idioma
nuevo, la estadística
Por otro lado, si el conjunto de mediciones es toda la población, solo se necesita obtener conclusio-
puede parecer agobiante
a primera vista. Pero una
nes basadas en la estadística descriptiva. No obstante, podría ser demasiado costoso o llevaría demasia-
vez aprendido y entendido do tiempo enumerar toda la población. Quizás enumerar la población la destruiría. Por estas y otras ra-
el lenguaje de la zones, usted puede tener solo una muestra de la población y quizás al verla desee responder preguntas
estadística veremos que acerca de la población en su conjunto. La rama de la estadística que se ocupa de este problema se llama
es una poderosa estadística inferencial.
herramienta para el Y aunque este no es el tema del presente capítulo, vale adelantar que la estadística inferencial está
análisis de datos en formada por procedimientos empleados para hacer inferencias acerca de características poblacionales a
numerosos y distintos partir de información contenida en una muestra de la población. Dicho de otra manera, el objetivo de la
campos de aplicación. estadística inferencial es hacer inferencias (es decir, obtener conclusiones, hacer predicciones, tomar
decisiones) acerca de las características de una población a partir de información contenida en una
muestra.
POBLACIÓN Y MUESTRA
1.2
En el lenguaje de la estadística, uno de los conceptos básicos es el muestreo. En casi todos los proble-
mas de estadística, un número específico de mediciones o datos (es decir, una muestra) se toma de un
cuerpo de mediciones más grande llamado población.
Muestra
Población
Pero, ¿cuál es el interés principal, la muestra o la población? En la mayoría de los casos estamos
interesados principalmente en la población, pero enumerarla puede ser difícil o imposible. Imagine tra-
tar de registrar la preferencia presidencial de ¡todo votante registrado en Estados Unidos! Seguramente,
la dificultad de esta pesquisa podría ser resuelta si tratáramos de describir o pronosticar el comporta-
miento de la población con base solo en la información obtenida de una muestra representativa de esa
población.
Las palabras muestra y población tienen dos significados para la mayoría de las personas. Por ejem-
plo, usted lee en los periódicos que una encuesta Gallup realizada en Estados Unidos se basó en una
muestra de 1 823 personas. Presumiblemente, a cada persona entrevistada se le hace una pregunta particu-
lar y la respuesta de esa persona representa una sola medida de la muestra. ¿La muestra es el conjunto
de las 1 823 personas, o es las 1 823 respuestas que dan?
Cuando usamos el lenguaje de la estadística, distinguimos entre el conjunto de objetos en el que se
toman las mediciones y las mediciones mismas. Para los experimentadores, los objetos en los que se to-
man las mediciones se denominan unidades experimentales. El estadístico que estudia las muestras las
llama elementos de la muestra.
4 CAPÍTULO 1 DISTRIBUCIÓN DE FRECUENCIA
EJEMPLO 1.1 Una encuesta realizada en Inglaterra tuvo como objetivo analizar los daños causados por fumar. Se pre-
guntó sobre hábitos de fumar y sobre algunas características demográficas de los entrevistados. Entre
estas, se encuentran género, edad, estado civil, máximo grado de estudios alcanzado, nacionalidad, etni-
cidad, ingreso anual, región de residencia, si eran o no fumadores y número de cigarros diarios fumados
entre semana o en fines de semana.
Se encuestó a 1 691 personas, de las cuales 965 eran mujeres y 726, hombres.
La gráfica de barras a continuación muestra el número de encuestados por estado civil. Para lograr
mayor claridad en la representación, es recomendable ordenar las categorías en el eje x en orden ascen-
dente o descendente de frecuencias. En este ejemplo, se ordenaron las categorías en orden descendente.
600
Frecuencia
400
200
0
Casado Soltero Viudo Divorciado Separado
D
600
Género
Frecuencia
400 Mujer
Hombre
200
0
Casado Soltero Viudo Divorciado Separado
Observamos que mientras que en las categorías “casado” y “soltero” el número de mujeres y hom-
bres es aproximadamente igual, en las categorías “viudo”, “divorciado” y “separado” el número de
mujeres es mayor que el de hombres.
Diagrama de puntos
En estos diagramas se puede apreciar el número de veces en el que se presenta cada valor en un conjun-
to de datos. En el eje horizontal se coloca una escala con los distintos valores, y sobre cada uno se
marcan tantos puntos como veces se repite el valor. Estos diagramas son útiles para detectar ciertas ca-
racterísticas del conjunto de datos, tales como:
• Observaciones atípicas: son valores que se observan particularmente pequeños o grandes cuan-
do se les compara con los valores del resto del conjunto.
• Huecos: espacios grandes entre conjuntos de puntos.
• Perfil de la distribución: valores que son más frecuentes.
Los diagramas de punto son muy fáciles de construir e interpretar si el número de observaciones es me-
nor a 100 y no se tienen demasiados valores repetidos o muy juntos, pues de lo contrario se perderá claridad.
EJEMPLO 1.3 A continuación, en la Tabla 1.1, se presentan las estaturas en cm de 100 hombres estudiantes universi-
tarios. Es difícil comprender la distribución de frecuencias tan solo con observar la tabla. Para resolver
este problema, procederemos a elaborar un diagrama de puntos con estos datos.
TABLA 1.1
154.94 167.64 170.18 172.72 175.26 177.8 180.34 182.88 185.42 187.96
160.02 167.64 170.18 175.26 175.26 177.8 180.34 182.88 185.42 187.96
160.02 167.64 172.72 175.26 175.26 177.8 180.34 182.88 185.42 190.5
162.56 170.18 172.72 175.26 177.8 180.34 180.34 182.88 185.42 190.5
162.56 170.18 172.72 175.26 177.8 180.34 180.34 182.88 185.42 193.04
162.56 170.18 172.72 175.26 177.8 180.34 180.34 182.88 187.96 193.04
165.1 170.18 172.72 175.26 177.8 180.34 180.34 182.88 187.96 193.04
165.1 170.18 172.72 175.26 177.8 180.34 180.34 182.88 187.96 193.04
167.64 170.18 172.72 175.26 177.8 180.34 182.88 182.88 187.96 195.58
167.64 170.18 172.72 175.26 177.8 180.34 182.88 182.88 187.96 198.12
6 CAPÍTULO 1 DISTRIBUCIÓN DE FRECUENCIA
En la Figura 1.3 se muestra el diagrama de puntos. Percibimos que las estaturas del grupo se con-
centran en el intervalo (170, 185) cm. Hay algunas observaciones atípicas en ambos extremos de la
distribución y no hay huecos grandes. La forma de esta distribución se asemeja a un montículo, con
muchos valores en el centro y pocos en los extremos. Veremos que las gráficas de muchas variables que
se generan en la naturaleza tienen esta misma forma.
FIGURA 1.3
Histogramas
La representación gráfica de la distribución de frecuencias de datos continuos se realiza mediante histo-
gramas. A diferencia de las gráficas de barras (en las que en uno de los ejes se muestran las categorías
de una variable cualitativa), en los histogramas se muestra la escala numérica que representa los valores de
una variable continua; además, no hay espacio entre las barras.
Definición Un histograma es una forma especial de gráfica de barras en la que los intervalos de
clase están representados por el ancho de las barras y las áreas de los rectángulos son proporcionales a
las frecuencias de las mediciones.
Para construir un histograma, los datos se agrupan en intervalos, que también reciben el nombre de
clases. Para ello, se divide el intervalo completo de valores en intervalos más pequeños de igual longi-
tud. Posteriormente, se cuentan los valores que pertenecen a cada intervalo. La altura de las barras
puede ser la frecuencia absoluta o la relativa. El perfil del histograma será el mismo; no obstante, es más
esclarecedor representar las frecuencias relativas porque así se tiene una idea del porcentaje de observa-
ciones que ocurrieron por intervalo.
El perfil del histograma es útil para observar la forma general de la distribución de frecuencias de un
conjunto de datos. Permite identificar el centro, el grado de dispersión de la distribución y los intervalos
con bajas o altas frecuencias.
EJEMPLO 1.4 Desde 1973, el primer domingo de abril se lleva a cabo en la ciudad de Washington, D.C., Estados Uni-
dos, la carrera de 10 millas (16 km) La flor de los cerezos. La carrera coincide con el florecimiento de
los cerezos donados a la ciudad en 1912 por el alcalde de Tokio, de ahí su nombre.
En 2012 participaron 16 924 corredores, para quienes se registró el tiempo en terminar la carrera.
Debido al gran número de posibles valores, la gráfica indicada para representar la distribución de esta
variable es un histograma.
Los pasos para construir el histograma se enlistan a continuación:
1. Identificar los valores mínimo y máximo observados en el conjunto de datos para calcular su
amplitud.
Tiempo mínimo en la carrera = 45.25 min.
Tiempo máximo en la carrera = 170.97 min.
Amplitud = máximo – mínimo = 170.97 – 45.25 = 125.72
POBLACIÓN Y MUESTRA 7
2. Decidir el número de intervalos de clase, así como el ancho de cada uno de ellos. Es recomen-
dable emplear entre cinco y 20 clases, todas ellas del mismo ancho. En el ejemplo de los corredo-
res, podría interesarnos observar intervalos de 10 minutos, por lo que estableceremos este ancho
de clase. Con el fin de obtener un número exacto de intervalos, ajustamos la amplitud a 130, lo
cual es válido; por consiguiente, el número de intervalos será:
130 = 13 intervalos
10
3. Elegir el valor inicial que limitará al primer intervalo de clase y a partir del cual se obtendrán
todos los puntos que limitarán a cada uno de los siguientes intervalos. (Estos puntos reciben el
nombre de límites de clase.) El primer límite inferior deberá ser un número un poco menor que
el valor mínimo observado en el conjunto de datos. Para nuestro ejemplo, el valor mínimo es
45.25, por lo que tomamos 45 como valor inicial. Para obtener el siguiente límite inferior suma-
mos el ancho del intervalo al límite inferior anterior: 45 + 10, y así sucesivamente.
4. Una vez elegido el límite inferior, los intervalos de clase quedan como se muestran en la Tabla 1.2.
5. A continuación, se efectúa un conteo del número de observaciones cuyos valores pertenecen a
cada intervalo de clase; es decir, se calculan las frecuencias absolutas, y a partir de estas, se po-
drán obtener las frecuencias relativas.
TABLA 1.2
FIGURA 1.4
4000
3000
Frecuencia
2000
1000
0
40 50 60 70 80 90 100 110 120 130 140 150 160 170 180
Minutos
En la Figura 1.5 se presenta el mismo histograma de la Figura 1.4, pero este representa, en el eje y,
las frecuencias relativas.
8 CAPÍTULO 1 DISTRIBUCIÓN DE FRECUENCIA
FIGURA 1.5
0.25
0.20
Frecuencia relativa
0.15
0.10
0.5
0
40 50 60 70 80 90 100 110 120 130 140 150 160 170 180
Minutos
Polígonos de frecuencias
Para dibujar el polígono de frecuencias, los puntos medios de la parte superior de las barras del histogra-
ma se conectan con segmentos de líneas rectas y se cierran los extremos con el eje horizontal, lo que
ayuda a visualizar el perfil de la distribución de frecuencias.
En la Figura 1.6 se replica el histograma de la Figura 1.4 con el polígono de frecuencias correspon-
diente, superpuesto en color negro.
FIGURA 1.6
4000
3000
Frecuencia
2000
1000
0
40 50 60 70 80 90 100 110 120 130 140 150 160 170 180
Minutos
Los polígonos de frecuencias resultan especialmente útiles cuando una variable se compara entre grupos
en el mismo diagrama. Para nuestro ejemplo, podríamos querer comparar los tiempos de carrera para los
grupos de mujeres y hombres. Los polígonos de frecuencias para ambos géneros se visualizan en la Figura 1.7.
Observamos que la posición del polígono para las mujeres se ubica a la derecha del polígono para los hombres
a lo largo de toda la escala del eje x. Esto se debe a que, entre otros factores, las mujeres corren, en promedio,
a menores velocidades que los hombres, lo que incrementa sus tiempos totales para terminar el recorrido.
FIGURA 1.7
2000
Género
Frecuencia
Mujer
Hombre
1000
0
40 50 60 70 80 90 100 110 120 130 140 150 160 170 180
Minutos
POBLACIÓN Y MUESTRA 9
FIGURA 1.8
1.0
0.9
0.8
Proporción acumulada
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
50 55 65 75 85 95 105 115 125 135 145 155 165 175
Minutos
FIGURA 1.9
Diagrama de tallo y hojas.
154 | 9
156 |
158 |
160 | 00
162 | 666
164 | 11
166 | 66666
168 |
170 | 222222222
172 | 777777777
174 | 333333333333
176 | 8888888888
178 |
180 | 333333333333333
182 | 999999999999
184 | 44444
186 |
188 | 0000000
190 | 55
192 | 0000
194 | 6
196 |
198 | 1
El primer renglón del diagrama 154 | 9 nos indica que la lista contiene el valor 154.9 cm; el segundo
y tercer renglones nos indican que la lista no contiene valores en el intervalo [155, 160] cm; el cuarto
renglón nos indica que la lista contiene dos valores iguales a 160.0 cm.
Observamos que el diagrama de tallo y hojas tiene la misma forma de montículo que el diagrama de
puntos. La diferencia consiste en que la orientación ha cambiado de horizontal a vertical y que ahora es
posible distinguir los valores originales.
TIPOS DE VARIABLES
1.3
Las variables pueden ser clasificadas en dos categorías: cualitativas y cuantitativas.
Definición Las variables cualitativas miden una cualidad o característica en cada unidad expe-
rimental. Las variables cuantitativas miden una cantidad numérica en cada unidad experimental.
Las variables cualitativas producen datos que se clasifican de acuerdo con similitudes o diferencias
en clase; por lo tanto, con frecuencia se denominan datos categóricos. Las variables como género, año
y especialidad en el ejemplo 1.1 son variables cualitativas que producen datos categóricos. Otros ejem-
MI CONSEJO plos son:
Cualitativo ⇔ “calidad” o • Afiliación política: republicano, demócrata, independiente
característica
• Clasificación de sabor: excelente, bueno, regular, malo
Cuantitativo ⇔ “cantidad” • Color de un dulce M&M’s®: café, amarillo, rojo, anaranjado, verde, azul
o número
Las variables cuantitativas, con frecuencia representadas por la letra x, producen datos numéri-
cos. Por ejemplo:
Observe que hay una diferencia en los tipos de valores numéricos que toman estas variables
cuantitativas. El número de pasajeros, por ejemplo, toma solo los valores x = 0, 1, 2, ..., mientras que
DISTRIBUCIÓN DE FRECUENCIA Y ALGUNAS GRÁFICAS PARA DATOS CATEGÓRICOS 11
el peso de un paquete puede tomar cualquier valor mayor que cero, o sea 0 < x < . Para describir
esta diferencia, definimos dos tipos de variables cuantitativas: discretas y continuas.
Definición Una variable discreta toma solo un número finito o contable de valores. Una varia-
ble continua puede tomar infinitamente muchos valores correspondientes a los puntos en un intervalo
de recta.
El término discreta se refiere a las brechas discretas que la variable puede tomar. Variables como el
número de miembros de una familia, el número de ventas de automóviles nuevos y el número de llantas
defectuosas devueltas para cambio son ejemplos de variables discretas. Por el contrario, variables como la
estatura, peso, tiempo, distancia y volumen son continuas porque son capaces de tomar valores en cual-
quier punto a lo largo de un intervalo de recta. Para cualquier par de valores que se elijan, ¡un tercer valor
siempre se hallará entre ellos!
EJEMPLO 1.5 Identifique como cualitativas o cuantitativas cada una de las siguientes variables:
Solución Las variables 1 y 3 son cualitativas porque solo una cualidad o característica se mide
para cada individuo. Las categorías para estas dos variables se muestran entre paréntesis. Las otras tres
variables son cuantitativas. Las variables 2 y 5 son discretas, pueden tomar cualquiera de los valores x
MI CONSEJO = 0, 1, 2, ..., con un valor máximo que depende del número de consumidores llamados o del número de
niños que haya en el grupo, respectivamente. La variable 4, el tiempo ganador para un caballo del Derby
Es frecuente que las
de Kentucky, es la única variable continua de la lista. El tiempo ganador, si pudiera medirse con bas-
variables discretas
tante precisión, podría ser 121 segundos, 121.5 segundos, 121.25 segundos o cualquier valor entre
comprendan el “número”
de artículos de un
dos tiempos que hemos puesto en la lista.
conjunto ¿Por qué deberían interesarle los diferentes tipos de variables (que se muestran en la Figura 1.10) y
los datos que generan? La razón es que diferentes tipos de datos requieren que utilice diferentes métodos
para su descripción, ¡de modo que los datos sean presentados con claridad y de una manera comprensi-
ble para el público!
FIGURA 1.10
Datos
Tipos de datos
Cualitativos Cuantitativos
Discretos Continuos
Para este fin, se construye una tabla estadística, para mostrar gráficamente los datos como una
distribución de datos. El tipo de gráfica que se elija depende del tipo de variable que se haya medido.
Cuando la variable de interés es cualitativa o categórica, la tabla estadística es una lista de las catego-
rías incluidas junto con una medida de la frecuencia con que se presenta cada valor. Es posible medir
“la frecuencia” en tres formas diferentes:
Por ejemplo, si con n representamos el número total de mediciones en el conjunto, se puede hallar
la frecuencia relativa y porcentaje usando estas relaciones:
Encontrará que la suma de las frecuencias es siempre n, la suma de las frecuencias relativas es 1 y
la suma de los porcentajes es 100%. Las categorías para una variable cualitativa deben elegirse de modo
que:
Definición La frecuencia relativa de un valor es la fracción o proporción de las veces que ocurre
el valor.
MI CONSEJO Por ejemplo, si se clasifican productos cárnicos de acuerdo con el tipo de carne utilizada, se pueden usar
estas categorías: res, pollo, mariscos, puerco, pavo, otra. Para clasificar los rangos del cuerpo docente de
Tres pasos para una distri-
alguna universidad se usan estas categorías: profesor, profesor adjunto, profesor auxiliar, instructor,
bución de datos:
conferenciante, otro. La categoría “otro” está incluida en ambos casos para tomar en cuenta la posibili-
(1) Datos sin elaborar ⇒ dad de que una medición no pueda asignarse a ninguna de las categorías anteriores.
(2) Tabla estadística ⇒ Una vez que a las mediciones se les dieron categorías y se resumieron en una tabla estadística, se
(3) Gráfica utiliza ya sea una gráfica de pastel o una gráfica de barras para mostrar la distribución de los datos. Una
gráfica de pastel es la conocida gráfica circular, que muestra la forma en que están distribuidas las me-
didas entre las categorías. Una gráfica de barras muestra la misma distribución de medidas en las cate-
gorías; la altura de la barra mide la frecuencia observada de una categoría en particular.
EJEMPLO 1.6 En una encuesta sobre la educación pública, se pidió a 400 administradores de escuelas que calificaran
la calidad de la educación en Estados Unidos. Sus respuestas están resumidas en la Tabla 1.3. Elabore
una gráfica de pastel y una de barras a partir de este conjunto de datos.
Solución Para construir una gráfica de pastel, asigne un sector del círculo a cada categoría. El
ángulo de cada sector debe ser proporcional a la magnitud de las mediciones (o frecuencia relativa) en
esa categoría. Como un círculo contiene 360°, aplique esta ecuación para hallar el ángulo:
TABLA 1.3 Calificación de la educación en Estados Unidos hecha por 400 educadores
Calificación Frecuencia
A 35
B 260
C 93
D 12
Total 400
DISTRIBUCIÓN DE FRECUENCIA Y ALGUNAS GRÁFICAS PARA DATOS CATEGÓRICOS 13
La Tabla 1.4 muestra las calificaciones junto con las frecuencias, frecuencias relativas, porcentajes y
MI CONSEJO
ángulos de sector necesarios para construir la gráfica de pastel. La Figura 1.11 muestra la gráfica de
Las proporciones suman 1; pastel construida a partir de los valores de la tabla. Mientras que las gráficas de pastel usan porcenta-
los porcentajes, 100; jes para determinar los tamaños relativos de las “rebanadas de pastel”, las de barras por lo general
los ángulos de sector, 360° grafican la frecuencia contra las categorías. Una gráfica de barras para estos datos se muestra en la Figu-
ra 1.12.
El impacto visual de estas dos gráficas es un poco diferente. La gráfica de pastel se usa para mostrar las
relaciones de las partes respecto al todo; la gráfica de barras, para destacar la cantidad real o frecuen-
cia para cada categoría. Como las categorías en este ejemplo son “calificaciones” ordenadas (A, B, C,
D), no desearíamos reacomodar las barras de la gráfica para cambiar su forma. En una gráfica de pastel,
el orden de presentación es irrelevante.
D A
FIGURA 1.11 3.0% 9%
B
65.0%
150
100
50
0
A B C D
Calificación
EJEMPLO 1.7 Una bolsa tamaño botana de dulces de cacahuate M&M’s contiene 21 dulces con los colores que se in-
dican en la Tabla 1.5. La variable “color” es cualitativa, por tanto la Tabla 1.6 lista las seis categorías
junto con un registro del número de dulces de cada color. Las últimas tres columnas de la Tabla 1.6
muestran con cuanta frecuencia ocurre cada categoría. Como las categorías son colores y no tienen un
orden particular, se pueden construir gráficas de barras con muchas formas diferentes con solo reordenar
las barras. Para enfatizar que el café es el color más frecuente, seguido por el azul, el verde y el anaran-
jado, ordenamos las barras de mayor a menor y generamos la gráfica de barras de la Figura 1.13. Una
gráfica de barras en la que las barras están ordenadas de mayor a menor se denomina gráfica de Pareto.
14 CAPÍTULO 1 DISTRIBUCIÓN DE FRECUENCIA
FIGURA 1.13
5
Gráfica de Pareto para el
4
ejemplo 1.7
Frecuencia
0
Café Azul Verde Naranja Amarillo Rojo
Color
1.1 ¿Discreta o continua? Identifique cada una de las c. Identifique la población de interés para el investigador
variables cuantitativas como discretas o continuas. médico.
a. Número de accidentes en botes en un tramo de d. Describa la forma en que el investigador podría seleccionar
50 millas del río Colorado. una muestra de entre la población.
b. Tiempo para completar un cuestionario. e. ¿Qué problemas podrían surgir al obtener una muestra de esta
c. Costo de una lechuga. población?
d. Número de hermanos y hermanas que usted tenga. 1.4 Nuevos métodos de enseñanza Un investigador
educacional desea evaluar la eficacia de un nuevo método de
e. Rendimiento en kilogramos de trigo para un terreno de 1
enseñanza de lectura a estudiantes sordos. El logro es medido al
hectárea de un trigal.
final de un periodo de enseñanza por la calificación de un
1.2 Actitudes del electorado Usted es candidato a la estudiante en un examen de lectura.
legislatura de su estado y desea hacer una encuesta de las actitudes
a. ¿Cuál es la variable que se medirá? ¿Qué tipo de variable es?
del electorado sobre sus probabilidades de ganar. Identifique la
población que es de interés para usted y de la cual le gustaría b. ¿Cuál es la unidad experimental?
seleccionar una muestra. ¿En qué forma esta población depende del c. Identifique la población de interés para el experimentador.
tiempo?
1.5 Unidades experimentales Identifique las unidades
1.3 Tiempos de supervivencia al cáncer Un investigador experimentales en las que se miden las variables siguientes:
médico desea estimar el tiempo de supervivencia de un paciente,
a. Género de un estudiante.
después del inicio de cierto tipo de cáncer y de un régimen
particular de radioterapia. b. Número de errores en un examen de medio semestre.
a. ¿Cuál es la variable de interés para el investigador médico? c. Edad de un paciente con cáncer.
b. ¿La variable de la parte a es cualitativa, cuantitativa discreta o d. Número de flores en una planta de azalea.
cuantitativa continua? e. Color de un automóvil que entra a un estacionamiento.
FRECUENCIAS RELATIVAS ACUMULADAS 15
1.6 Usuarios de Facebook El sitio de la red social f. Consulte las partes d y e. ¿Cómo describiría los cambios en
EX0106
Facebook ha crecido con rapidez desde sus comienzos, las distribuciones de edad de los usuarios de Facebook durante
en 2004. De hecho, su base de usuarios en Estados este periodo de un año?
Unidos creció de 42 millones a 103 millones entre 2009 y 2010.
1.7 Continua o discreta otra vez Identifique cada variable
La tabla siguiente muestra la distribución de edad de los usuarios
como continua o discreta:
de Facebook (en miles) conforme cambió, de enero de 2009 a
enero de 2010. a. Peso de dos docenas de camarones.
b. Temperatura corporal de una persona.
Edad El 1/04/2009 El 1/04/2010 c. Número de personas en espera de tratamiento en la sala de
13–17 5 675 10 680 emergencia de un hospital.
18–24 17 192 26 076 d. Número de propiedades a la venta de una agencia de bienes
25–34 11 255 25 580 raíces.
35–54 6 989 29 918
55 955 9 764 e. Número de reclamaciones recibidas por una compañía de
Desconocida 23 1 068 seguros en un día.
Total 42 089 103 086 1.8 Continua o discreta, otra vez Identifique cada variable
como continua o discreta:
a. Defina la variable que se ha medido en esta tabla. a. Número de personas en la fila de espera en la caja de pago de
b. ¿La variable es cuantitativa o cualitativa? un supermercado.
c. ¿Qué representan los números? b. Profundidad de una nevada.
d. Construya una gráfica de pastel para describir la distribución c. Tiempo para que un conductor responda ante un choque
de edad de los usuarios de Facebook el 4 de enero de 2009. inminente.
e. Construya una gráfica de pastel para describir la distribución d. Número de aviones que llegan al aeropuerto de Atlanta en una
de edad de los usuarios de Facebook el 4 de enero de 2010. hora determinada.
Si para un cierto valor xi sumamos todas las frecuencias correspondientes a los valores de la muestra
que son menores o iguales que xi se obtiene la frecuencia acumulada. Al igual que en la frecuencia rela-
tiva, la frecuencia relativa acumulada se define por
Frecuencia acumulada
Frecuencia relativa acumulada =
n
EJEMPLO 1.8 Las siguientes puntuaciones representan la calificación en el examen final para un curso de estadística
elemental:
5 3 7 4 3 1 6 9 0 4
3 5 10 0 2 8 3 0 9 5
6 2 4 4 2 3 6 8 7 1
De los datos anteriores, tenemos que la distribución de frecuencias de las calificaciones se muestra en la
Tabla 1.7:
16 CAPÍTULO 1 DISTRIBUCIÓN DE FRECUENCIA
La tabla anterior nos dice, por ejemplo, que 76% de los estudiantes obtuvo entre 0 y 6 de calificación
final en el curso de estadística elemental.
EJEMPLO 1.9 La cantidad de dinero gastada en el año fiscal 2009 por el departamento de defensa de Estados Unidos
en varias categorías se muestra en la Tabla 1.9. Construya una gráfica de pastel y una gráfica de barras
para describir los datos. Compare las dos formas de presentación.
Solución Se miden dos variables: la categoría de gasto (cualitativa) y la cantidad del gasto
(cuantitativa). La gráfica de barras de la Figura 1.14 muestra las categorías en el eje horizontal y las
cantidades en el eje vertical.
Cantidad (miles de millones de dólares)
FIGURA 1.14
Gráfica de barras para el 250
Ejemplo 1.9
200
150
100
50
0
o
s
y
n
ili al
ni y
tra
nt
es
r ió
llo ón
m son
te n
ie
O
on
ta c
r
an ció
rro ci
ta
ili uc
m
r
ci
sa iga
Pe
m ra
m nstr
ui
pe
de est
dq
Co
O
v
A
In
Para la gráfica de pastel de la Figura 1.15, cada sector representa la proporción de los gastos totales
($636 700 millones de dólares) correspondientes a su categoría en particular. Por ejemplo, para la cate-
goría de investigación y desarrollo, el ángulo del sector es:
79.0
360° = 44.7°
636.7
FIGURA 1.15
Construcción
Gráfica de pastel para el Investigación y
militar
17.6
Ejemplo 1.9 desarrollo
79.0 Personal
militar
147.3
Adquisiciones
129.2
Operación y
Otras mantenimiento
4.3 259.3
Ambas gráficas muestran que las cantidades más grandes de dinero se gastaron en personal y operacio-
nes. Como no hay un orden inherente a las categorías, hay libertad para reacomodar las barras o los
sectores de las gráficas en cualquier forma deseada. La forma de la gráfica de barras no tiene nada que
ver con su interpretación.
18 CAPÍTULO 1 DISTRIBUCIÓN DE FRECUENCIA
Gráficas de líneas
Cuando una variable cuantitativa se registra en el tiempo a intervalos igualmente espaciados (por ejem-
plo diario, semanal, mensual, trimestral o anual), el conjunto de datos forma una serie de tiempo. Los
datos de una serie de tiempo se presentan con más efectividad en una gráfica de líneas con el tiempo
como eje horizontal. La idea es tratar de distinguir un patrón o tendencia que sea probable de continuar,
y usar ese patrón para hacer predicciones precisas para el futuro inmediato.
EJEMPLO 1.10 En 2025, el mayor de los baby boomers (nacido en 1946) tendrá 79 años de edad, y el mayor de los de
la Generación X (nacido en 1965) estará a dos años de ser elegible para el Seguro Social. ¿Cómo
afectará esto a las tendencias del consumidor en los siguientes 15 años? ¿Habrá suficientes fondos
para que los baby boomers reciban prestaciones del Seguro Social? La Oficina de Censos de Estados
Unidos aporta proyecciones para el grupo de la población estadounidense que tendrá 85 años o más en
los próximos años, como se muestra en la Tabla 1.10. Construya una gráfica de línea para visualizar los
datos. ¿Cuál es el efecto de prolongar o contraer el eje vertical de la gráfica de línea?
Solución La variable cuantitativa “85 o más” se mide en cuatro años, con lo cual se crea una serie
MI CONSEJO
de tiempo que se representa con una gráfica de línea. Los años están marcados en el eje horizontal y las
¡Tenga cuidado de no proyecciones en el eje vertical. Los puntos de datos se enlazan entonces por medio de segmentos de línea
prolongar o contraer los para formar las gráficas de línea de la Figura 1.16. Observe la marcada diferencia en las escalas verticales
ejes cuando vea una de las dos gráficas. Contraer la escala del eje vertical hace que grandes cambios aparezcan pequeños y
gráfica! viceversa. Para evitar conclusiones erróneas, se deben ver con cuidado las escalas de los ejes vertical
y horizontal. No obstante, de ambas gráficas se obtiene una imagen clara del número constantemente
creciente de quienes tengan 85 años o más en las primeras décadas del milenio.
7.5 20
5.0
2020 2030 2040 2050 2020 2030 2040 2050
Año Año
Gráficas de puntos
Muchos conjuntos de datos cuantitativos están formados por números que no se pueden separar fácil-
mente en categorías o intervalos. En consecuencia, ¡se necesita una forma diferente de graficarlos!
La gráfica más sencilla para datos cuantitativos es la gráfica de puntos. Para un conjunto pequeño
de mediciones (por ejemplo, el conjunto 2, 6, 9, 3, 7, 6) simplemente se grafican las mediciones como
puntos en un eje horizontal, como se muestra en la Figura 1.17(a). Para un conjunto grande de datos,
como el de la Figura 1.17(b), la gráfica de puntos puede ser poco útil y tediosa en cuanto a la interpreta-
ción de la información.
GRÁFICAS PARA DATOS CUANTITATIVOS 19
(b)
NECESITO SABER...
EJEMPLO 1.11 La Tabla 1.11 es una lista de precios (en dólares) de 19 marcas de zapatos deportivos. Construya una
gráfica de tallo y hoja para mostrar la distribución de los datos.
Solución Para crear la gráfica de tallo y hoja se divide cada observación entre las unidades y las
decenas. El número a la izquierda es el tallo; el de la derecha es la hoja. Entonces, para los zapatos que
cuestan $65.00, el tallo es 6 y la hoja es 5. Los tallos, que van de 4 a 9, aparecen en la Figura 1.18, jun-
to con las hojas para cada una de las 19 mediciones. Si indicamos que la unidad de hoja es 1, el lector
sabrá que el tallo 6 y la hoja 8, por ejemplo, representan el número 68 registrado al dolar más cercano.
A veces, las opciones de tallo disponibles resultan en una gráfica que contiene muy pocos tallos y un
MI CONSEJO
gran número de hojas dentro de cada tallo. En esta situación, se prolongan los tallos al dividir cada uno
tallo | hoja en varias líneas, lo cual depende de los valores de hojas que se les asignen. Por lo general, los tallos se
dividen en dos formas:
• En dos líneas, con las hojas 0-4 en la primera línea y las hojas 5-9 en la segunda línea.
• En cinco líneas, con las hojas 0-1, 2-3, 4-5, 6-7 y 8-9 en las cinco líneas, respectivamente.
EJEMPLO 1.12 Los datos de la Tabla 1.12 son los pesos de 30 bebés de gestación completa al momento de nacer en un
hospital metropolitano y cuyos pesos están registrados al décimo de libra más cercano. Construya una
gráfica de tallo y hoja para mostrar la distribución de los datos.
Solución Los datos, aun cuando están registrados a una precisión de solo un lugar decimal, son
mediciones de la variable continua x = peso, que puede tomar cualquier valor positivo. Al examinar la
Tabla 1.11, se observa que los pesos más alto y más bajo son 9.4 y 5.6, respectivamente. Pero, ¿cómo
están distribuidos los pesos restantes?
Si se usa el punto decimal como línea divisoria entre el tallo y las hojas, se obtienen solo cinco tallos
que no producen una imagen muy precisa. Cuando se divide cada uno de los tallos en dos líneas, hay
ocho tallos, porque la primera línea del tallo 5 y la segunda línea del tallo 9 están vacías. Esto produce
una gráfica más descriptiva, como se muestra en la Figura 1.19. Para estos datos, la unidad de hoja es .1
y el lector puede inferir que el tallo 8 y la hoja 2 por ejemplo, representan la medición x = 8.2 libras.
FIGURA 1.19 5 86 5 68
Gráfica de tallo y hoja para 6 12 6 12
6 8887 Reordenamiento → 6 7888
los datos de la Tabla 1.13 7 221 7 122
7 879577587 7 557777889
8 0222 8 0222
8 565 8 556
9 040 Unidad de hoja .1 9 004
Si la gráfica de tallo y hoja se gira hacia un lado de modo que la recta vertical sea ahora un eje hori-
zontal, se observa que los datos se han “apilado” o “distribuido” a lo largo del eje, de modo que se
puede describir como “forma de montículo”. Esta gráfica muestra que los pesos de estos 30 recién naci-
dos varían entre 5.6 y 9.4; muchos pesos están entre 7.5 y 8.0 libras.
• Buscar las mediciones poco comunes o resultados atípicos. Esto es, ¿hay mediciones mucho
mayores o menores que las otras? Es posible que estos resultados atípicos no sean representati-
vos de los otros valores del conjunto.
Es frecuente que las distribuciones se describan según sus formas.
Definición Una distribución es simétrica si los lados izquierdo y derecho de la distribución, cuan-
do esta se divide en el valor medio, forman imágenes espejo.
Una distribución está sesgada a la derecha si una proporción más grande de las mediciones se encuen-
tra a la derecha del valor pico. Las distribuciones sesgadas a la derecha contienen pocas mediciones
anormalmente grandes.
Una distribución está sesgada a la izquierda si una proporción mayor de las mediciones se encuentra a
la izquierda del valor pico. Las distribuciones sesgadas a la izquierda contienen pocas mediciones
anormalmente pequeñas.
Una distribución es unimodal si tiene un pico; una distribución bimodal tiene dos picos. Las distribucio-
nes bimodales representan a veces una combinación de dos poblaciones diferentes en el conjunto de datos.
EJEMPLO 1.13 Examine las tres gráficas de puntos que se muestran en la Figura 1.20. Describa estas distribuciones en
términos de sus ubicaciones y formas.
FIGURA 1.20
Formas de distribución de
datos para el Ejemplo 1.13
1 2 3 4 5 6 7
2 4 6 8
2 4 6 8
MI CONSEJO
Solución La primera gráfica de puntos muestra una distribución relativamente simétrica con un
Simétrica ⇔ imágenes solo pico situado en x = 4. Si se dobla la página en este pico, las mitades izquierda y derecha casi serían
espejo imágenes espejo. La segunda gráfica, no obstante, está lejos de ser simétrica. Tiene una larga “cola de-
Sesgada a la derecha ⇔ recha”, lo cual significa que hay unas pocas observaciones anormalmente grandes. Si se dobla la página
cola larga a la derecha en el pico, estaría en el lado derecho una proporción de mediciones más grande que en el izquierdo. Esta
Sesgada a la izquierda ⇔ distribución está sesgada a la derecha. Análogamente, la tercera gráfica de puntos con una larga “cola a
cola larga a la izquierda la izquierda” está sesgada a la izquierda.
EJEMPLO 1.14 Un asistente administrativo del departamento de atletismo de una universidad local observa los prome-
dios de calificaciones de ocho miembros del equipo femenil de volibol. El asistente introduce los pro-
medios en la base de datos, pero por accidente coloca mal el punto decimal de la última entrada.
2.8 3.0 3.0 3.3 2.4 3.4 3.0 .21
22 CAPÍTULO 1 DISTRIBUCIÓN DE FRECUENCIA
Use una gráfica de puntos para describir los datos y descubrir el error del asistente.
Solución La gráfica de puntos de este pequeño conjunto de datos se muestra en la Figura 1.21(a).
Claramente se distingue el resultado atípico u observación poco común causada por el error del asistente
al introducir los datos. Una vez corregido el error, como en la Figura 1.21(b), se observa la distribución
correcta del conjunto de datos. Como este es un conjunto muy pequeño, es difícil describir la forma de la
distribución aun cuando parece tener un valor pico alrededor de 3.0 y parece ser relativamente simétrica.
(a)
FIGURA 1.21
Distribuciones de
promedios de calificaciones
para el Ejemplo 1.14
0.5 1.0 1.5 2.0 2.5 3.0 3.5
Promedios de calificaciones
(b)
Cuando se comparen gráficas creadas para dos conjuntos de datos, se deben comparar sus escalas de
MI CONSEJO
medición, ubicaciones y formas, y buscar mediciones poco comunes o atípicas. Recuerde que estos
últimos no siempre son causados por la introducción errónea de datos. A veces dan información muy
Los resultados atípicos valiosa que no debe ser soslayada. Es posible que se necesite más información para determinar si un
están lejos del cuerpo resultado atípico es una medición válida que solo sea anormalmente grande o pequeña, o si ha habido
principal de datos algún tipo de error en la recolección de datos. Si las escalas difieren mucho, debe tenerse cuidado al
hacer comparaciones o ¡podría sacar conclusiones imprecisas!
FIGURA 1.22
Cómo construir un (a)
histograma 6.0 6.6 7.2 7.8 8.4 9.0
Pesos al nacer
(b)
6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5
Pesos al nacer
HISTOGRAMAS DE FRECUENCIA RELATIVA 23
Como regla práctica, el número de clases debe ser de 5 a 12; cuantos más datos haya, más clases se re-
quieren.† Las clases deben ser elegidas para que cada una de las mediciones caiga en una y solo una
clase. Para los pesos al nacer que se muestran en la Tabla 1.12, decidimos usar ocho intervalos de igual
longitud. Como el rango de pesos al nacer es:
9.4 – 5.6 = 3.8
el ancho mínimo de clase necesario para cubrir el margen de los datos es (3.8 ÷ 8) = .475. Para más
comodidad, redondeamos este ancho aproximándolo a .5. Si el primer intervalo empieza con el valor
más bajo, 5.6, formamos subintervalos desde 5.6 hasta, pero no incluyendo 6.1, de 6.1 hasta, pero no
incluyendo 6.6, y así sucesivamente. Al utilizar el método de inclusión izquierda, que incluye el punto
de frontera izquierda de clase pero no el punto de frontera derecha de clase, se elimina cualquier confu-
sión acerca de dónde ubicar una medición que caiga exactamente en un punto de frontera de clase.
La Tabla 1.14 muestra las ocho clases, marcadas de 1 a 8 para identificarlas. Las fronteras para las
ocho clases, junto con un total del número de mediciones que caen en cada una de ellas, también se
muestran en la tabla. Al igual que con las gráficas de la sección 1.4, podemos ahora medir con qué fre-
cuencia relativa se presenta cada clase al usar frecuencia o frecuencia relativa.
Para construir el histograma de frecuencia relativa, grafique las fronteras de clase a lo largo del eje
horizontal. Trace una barra sobre cada intervalo de clase, con altura igual a la frecuencia relativa para
esa clase. El histograma de frecuencia relativa para los datos de peso al nacer (Figura 1.23) muestra de
un vistazo la forma en que están distribuidos los pesos de los bebés al nacer en el intervalo de 5.6 a 9.4.
FIGURA 1.23
Histograma de frecuencia 8/30
relativa
7/30
Frecuencia relativa
6/30
5/30
4/30
3/30
2/30
1/30
0
5.6 6.1 6.6 7.1 7.6 8.1 8.6 9.1 9.6
Pesos al nacer
†
Es posible emplear esta tabla como guía para seleccionar un número apropiado de clases. Recuerde que esto es solo una
guía; puede usar más o menos clases de las que recomienda la tabla si con ello se hace más descriptiva la gráfica.
EJEMPLO 1.15 Veinticinco clientes de Starbucks® son entrevistados en una encuesta de mercadeo y se les pregunta,
“¿con qué frecuencia visita usted Starbucks en una semana típica?”. La Tabla 1.15 contiene las respues-
tas de estos 25 clientes. Construya un histograma de frecuencia relativa para describir los datos.
TABLA 1.15 Número de visitas en una semana típica para 25 clientes
6 7 1 5 6
4 6 4 6 8
6 5 6 3 4
5 5 5 7 6
3 5 7 5 5
Solución La variable que se mide es el “número de visitas por semana a Starbucks”, que es una
variable discreta que toma solo valores enteros. En este caso, lo más sencillo es elegir las clases o subin-
tervalos como los valores enteros en el rango de valores observados: 1, 2, 3, 4, 5, 6 y 7. La Tabla 1.16
muestra las clases y sus frecuencias absolutas y relativas. El histograma de frecuencia relativa se mues-
tra en la Figura 1.24.
TABLA 1.16 Tabla de frecuencia para el Ejemplo 1.15
Número de
visitas a Frecuencia
Starbucks Frecuencia relativa
1 1 .04
2 — —
3 2 .08
4 3 .12
5 8 .32
6 7 .28
7 3 .12
8 1 .04
FIGURA 1.24
Histograma para el
8/25
Ejemplo 1.15
Frecuencia relativa
6/25
4/25
2/25
0
1 2 3 4 5 6 7 8
Visitas por semana
Observe que la distribución está sesgada a la izquierda y que hay una brecha entre 1 y 3.
NECESITO SABER...
1.9 Agua corriente Se ha sugerido agua corriente Otros planes de carrera/no le interesa 40%
como método de acondicionamiento cardiovascular para Demasiada presión 20%
EX0109
atletas lesionados y otros que deseen un programa de Demasiado trabajo 15%
ejercicios aerobicos de bajo impacto. Un estudio publicado en la No sería bueno para ello 14%
Journal of Sports Medicine investigó la relación entre la cadencia Demasiadas discusiones 5%
de ejercicio y la frecuencia cardiaca, al medir las frecuencias
cardiacas de 20 voluntarios sanos a una cadencia de 96 pasos por a. ¿Están consideradas todas las razones en esta tabla? Agregue
minuto.11 Los datos aparecen a continuación: otra categoría si es necesario.
b. ¿Usaría usted una gráfica de pastel o una de barras para
87 109 79 80 96 95 90 92 96 98 describir gráficamente los datos? ¿Por qué?
101 91 78 112 94 98 94 107 81 96
c. Trace la gráfica elegida en la parte b.
Construya una gráfica de tallo y hoja para describir d. Si usted dirigiera la encuesta de opinión, ¿qué otros tipos de
los datos. Analice las características de la distribución preguntas desearía investigar?
de datos.
1.11 Construya una gráfica de tallo y hoja para estas 50
1.10 ¿Desea ser presidente? ¿Le gustaría ser presidente mediciones:
de Estados Unidos? Aun cuando muchos adolescentes piensan EX0111
que podrían llegar a ser presidente, la mayoría no desea el 3.1 4.9 2.8 3.6 2.5 4.5 3.5 3.7 4.1 4.9
trabajo. En una encuesta de opinión realizada por ABC News, casi 2.9 2.1 3.5 4.0 3.7 2.7 4.0 4.4 3.7 4.2
80% de los adolescentes no estaban interesados en el trabajo.2 3.8 6.2 2.5 2.9 2.8 5.1 1.8 5.6 2.2 3.4
Cuando se les preguntó: “¿Cuál es la principal razón por la que 2.5 3.6 5.1 4.8 1.6 3.6 6.1 4.7 3.9 3.9
no quisieras ser presidente?”, dieron estas respuestas: 4.3 5.7 3.7 4.6 4.0 5.6 4.9 4.2 3.1 3.9
26 CAPÍTULO 1 DISTRIBUCIÓN DE FRECUENCIA
a. Describa la forma de la distribución de datos. ¿Nota algunos a. Construya un histograma de frecuencia relativa para los datos.
resultados atípicos? b. ¿Qué proporción de las mediciones es mayor que 1?
b. Use la gráfica de tallo y hoja para hallar la observación mínima. c. ¿Qué proporción de las mediciones es menor que 2?
c. Encuentre la octava y la novena observaciones más grandes. d. Si una medición se selecciona al azar de entre las 20 medicio-
1.12 Consulte el ejercicio 1.16. Construya un histograma de nes mostradas, ¿cuál es la probabilidad de que sea un 2?
frecuencia relativa para los datos. e. Describa la forma de la distribución. ¿Ve algunos resultados
a. ¿Aproximadamente cuántos intervalos de clase debe usar? atípicos?
b. Supongamos que usted decide usar clases que empiezan en 1.15 Consulte el Ejercicio 1.19.
1.6 con ancho de clase de .5 (es decir, 1.6 a <2.1, 2.1 a <2.6). a. Trace una gráfica de puntos para describir los datos.
Construya el histograma de frecuencia relativa para los datos.
b. ¿Cómo definiría usted el tallo y la hoja para este conjunto de
1.13 Considere este conjunto de datos: datos?
c. Trace la gráfica de tallo y hoja usando su decisión de la parte
EX0113
b.
4.5 3.2 3.5 3.9 3.5 3.9
d. Compare la gráfica de puntos, la gráfica de tallo y hoja y el
4.3 4.8 3.6 3.3 4.3 4.2
3.9 3.7 4.3 4.4 3.4 4.2 histograma de frecuencia relativa (Ejercicio 1.19). ¿Reflejan
4.4 4.0 3.6 3.5 3.9 4.0 todos más o menos la misma información?
1.16 Navegar en un laberinto Un psicólogo experimental
a. Construya una gráfica de tallo y hoja; use el dígito inicial
midió el tiempo que tardó una rata para navegar con éxito por un
como tallo.
laberinto en cada uno de cinco días. Los resultados se muestran
b. Construya una gráfica de tallo y hoja; use dos veces cada uno en la tabla siguiente. Genere una gráfica de líneas para describir
de los dígitos iniciales. ¿Esta técnica mejora la presentación los datos. ¿Piensa usted que hay algún aprendizaje?
de los datos? Explique.
1.14 Una variable discreta puede tomar solo los valores de 0, 1 o 2. Día 1 2 3 4 5
Un conjunto de 20 mediciones sobre esta variable se muestra aquí: Tiempo (segundos) 45 43 46 32 25
1 2 1 0 2
2 1 1 0 0
2 2 1 1 0
0 1 2 1 1
CONSTRUCCIÓN DE FRECUENCIAS
(REGLA DE STURGES)
1.8
Otro método para agrupar datos es la denominada regla de Sturges, la cual consiste en estimar el nú-
mero de clases por medio del uso de la fórmula
K = 1 + 3.322 log(n),
donde K representa el número de clases y n representa el número de datos a agrupar.
EJEMPLO 1.16 Considere los datos de la Tabla 1.12, donde se registran los pesos de 30 bebés al nacer (página 20). En
este caso, n = 30. Para determinar el número de intervalos de clase utilizando la regla de Sturges, tene-
mos que:
K = 1 + 3.322 log(n)
= 1 + 3.322 log(30)
= 1 + 3.322 (1.47712)
= 1 + 4.90699
= 5.90699
Entonces, redondeando: K = 6
EJEMPLO 1.17 Ahora, considere los datos de la Tabla 1.14 (sobre el número de visitas a Starbucks). Como puede ob-
servar, en este caso n = 25. Para determinar el número de intervalos de clase utilizando la regla de Stur-
ges, se tiene que
K = 1 + 3.322 log(n)
= 1 + 3.322 log(25)
= 1 + 3.322 (1.397940)
= 1 + 4.6439
= 1 + 4.644
= 5.644
Entonces, redondeando: K = 6
1 0.95 2.15 1
2 2.15 3.35 2
3 3.35 4.55 3
4 4.55 5.75 8
5 5.75 6.95 7
6 6.95 8.15 4
FIGURA 1.25 10
9
Histograma de frecuencias
para el Ejemplo 1.16 8
7
Frecuencia
Frecuencia
0
5.55 6.15 6.75 7.35 7.95 8.55 9.15 9.75
Pesos
Pesos al nacer
de bebés al nacer
28 CAPÍTULO 1 DISTRIBUCIÓN DE FRECUENCIA
10
FIGURA 1.26
9
Histograma de frecuencias
8
para el Ejemplo 1.17
7
Frecuencia
Frecuencia
6
0
0.95 2.15 3.35 4.55 5.75 6.95 8.15
Visitas
Visitaspor
V porsemana
semana
Definición Las mediciones descriptivas numéricas asociadas con una población de mediciones
se llaman parámetros; las calculadas a partir de mediciones muestrales reciben el nombre de esta-
dísticas.
Momento de práctica
CAPÍTULO 1
1.17 Hamburguesas con queso Cree una gráfica de puntos b. Describa la forma y ubicación de las calificaciones.
para la cantidad de hamburguesas con queso consumidas por 10 c. ¿Es poco común la forma de la distribución? ¿Considera
estudiantes universitarios en una determinada semana. alguna razón por la que la distribución de las calificaciones
4 5 4 2 1 tendría esa forma?
3 3 4 2 7 1.19 Tiempos de supervivencia Altman y Bland
a. ¿Cómo describiría la forma de la distribución? informaron sobre los tiempos de supervivencia de los
EX0119 pacientes con hepatitis activa; una mitad del grupo
b. ¿Qué proporción de los estudiantes comió más de cuatro
recibió tratamiento con prednisona y la otra no recibió
hamburguesas con queso esa semana?
tratamiento. Los datos que siguen se han adaptado de los datos
de aquellos tratados con prednisona.
1.18 Calificaciones de examen Las calificaciones
EX0118 en un examen de 100 puntos se registraron para 20 Los tiempos de supervivencia se registraron al mes más próximo.
estudiantes: 8 87 127 147
11 93 133 148
61 93 91 86 55 63 86 82 76 57
52 97 139 157
94 89 67 62 72 87 68 65 75 84
57 109 142 162
a. Use una gráfica apropiada para describir los datos. 65 120 144 165
PARÁMETROS Y MEDICIONES ESTADÍSTICAS 29
a. Observe los datos. ¿Adivina la forma aproximada de la b. Elabore un histograma de frecuencia relativa para estos datos.
distribución de los datos? Empiece la frontera inferior de la primera clase en 30 y use un
b. Construya un histograma de frecuencia relativa para los datos. ancho de clase de 5 meses.
¿Cuál es la forma de la distribución? c. Compare las gráficas de las partes a y b. ¿Hay alguna
c. ¿Hay algún resultado atípico en el conjunto? De ser así, diferencia importante que le haría elegir una como el mejor
¿cuáles tiempos de supervivencia son anormalmente cortos? método para exhibir los datos?
d. ¿Qué proporción de los niños tenía 35 meses (2 años, 11
meses) o más, pero menos de 45 meses (3 años, 9 meses) de
1.20 Una enfermedad recurrente El tiempo (en edad cuando se inscribieron por primera vez en preescolar?
meses) entre el inicio de una enfermedad en particular y
EX0120 e. Si un niño fuera seleccionado al azar de este grupo, ¿cuál es la
su recurrencia se registró para n = 50 pacientes:
probabilidad de que tuviera menos de 50 meses de edad (4 años,
2 meses) cuando se inscribió por primera vez en preescolar?
2.1 4.4 2.7 32.3 9.9 9.0 2.0 6.6 3.9 1.6
14.7 9.6 16.7 7.4 8.2 19.2 6.9 4.3 3.3 1.2
4.1 18.4 .2 6.1 13.5 7.4 .2 8.3 .3 1.3 1.23 Religión organizada Las estadísticas de las
14.1 1.0 2.4 2.4 18.0 8.7 24.0 1.4 8.2 5.8 religiones del mundo son aproximaciones muy vagas,
1.6 3.5 11.4 18.0 26.7 3.7 12.6 23.1 5.6 .4 EX0123
dado que muchas no dan seguimiento a sus miembros.
Una estimación de estos números (en millones) se
a. Construya un histograma de frecuencia relativa para los datos. muestra en la tabla siguiente.
b. ¿Describiría usted la forma como aproximadamente simétrica,
sesgada a la derecha o sesgada a la izquierda?
Miembros Miembros
c. Dé la fracción de tiempos de recurrencia menores o iguales a Religión (millones) Religión (millones)
10 meses.
Budismo 376 Judaismo 14
Cristianismo 2100 Sijismo 23
1.21 La educación funciona La educación Hinduismo 900 China tradicional 394
funciona, según una instantánea dada por el Bureau of Islamismo 1500 Otra 61
EX0121 Indígenas primitivas y
Labor Statistics. La mediana de los ingresos anuales para
seis niveles diferentes de educación se muestra en la tabla: africanas tradicionales 400
Nivel de educación Mediana de ingresos semanales ($) a. Elabore una gráfica de pastel para describir el total de
miembros en las religiones organizadas del mundo.
Menos que diploma de bachillerato 454
Graduado de bachillerato 626 b. Construya una gráfica de barras para describir el total de
Algo de universidad, sin título 699 miembros en las religiones organizadas del mundo.
Título técnico 761
Título de licenciatura c. Ordene los grupos religiosos del número de miembros menor
Título de maestría 1 025 al mayor. Elabore una gráfica de Pareto para describir los
Título de especialidad 1 257 datos. ¿Cuál de las tres es más eficaz?
Título de doctorado 1 529
Mediana de ingresos semanales 1 532
Fuente: Bureau of Labor Statistics, Current Population Survey
1.24 ¿Qué tan larga es la fila? Para determinar el
número de cajas de pago que en el futuro es necesario
EX0124
a. ¿Qué métodos gráficos usaría usted para describir los datos? construir, una cadena de supermercados desea obtener
b. Seleccione el método de la parte que usted piensa describe información del tiempo (en minutos) necesario para dar
mejor los datos y cree la gráfica apropiada. servicio a los clientes. Para hallar la distribución de tiempos de
tal servicio se registró una muestra de tiempos de servicio a 60
c. ¿Cómo resumiría la información mostrada en la gráfica sobre
clientes, los cuales se observan a continuación:
los niveles educativos y salarios?
1.25 Tiempos de servicio, continúa Consulte el ejercicio c. Los cinco presidentes más jóvenes al momento de su falleci-
1.30. Construya un histograma de frecuencia relativa a los miento aparecen en la “cola” inferior de la distribución. Tres
tiempos de servicio de supermercado. de los cinco más jóvenes tienen una característica común.
a. Describa la forma de la distribución. ¿Observa algunos Identifique los cinco presidentes más jóvenes a su fallecimien-
resultados atípicos? to. ¿Qué característica común explica estas mediciones?
b. Si se parte de que los resultados atípicos de este conjunto de
datos son observaciones válidas, ¿cómo los explicaría a la 1.28 Cantidades de glóbulos rojos La cantidad de
administración de la cadena de supermercados? glóbulos rojos de una persona sana se midió en cada uno
EX0128
de 15 días. El número registrado se midió en 106 células
c. Compare el histograma de frecuencia relativa con la gráfica de
por microlitro (mL).
tallo y hoja del ejercicio 1.30. ¿Las dos gráficas reflejan la
misma información? 5.4 5.2 5.0 5.2 5.5
5.3 5.4 5.2 5.1 5.3
5.3 4.9 5.4 5.2 5.2
1.26 Contenido de calcio El contenido de calcio
(Ca) de una sustancia mineral en polvo fue analizado 10 a. Use una gráfica apropiada para describir los datos.
EX0126
veces, con las siguientes composiciones porcentuales b. Describa la forma y ubicación de las cantidades de glóbulos
registradas: rojos.
c. Si la cantidad de glóbulos rojos de la persona se mide hoy
.0271 .0282 .0279 .0281 .0268 como 5.7 106/mL, ¿usted consideraría que esto es poco
.0271 .0281 .0269 .0275 .0276 común? ¿Qué conclusiones podría obtener?
a. Trace una gráfica de puntos para describir los datos. (sugeren- 1.29 Campeones de bateo Los directivos del
cia: la escala del eje horizontal debe ir de .0260 a .0290). beisbol de ligas mayores han coronado a un campeón de
EX0129
b. Trace una gráfica de tallo y hoja para los datos. Use los bateo en la Liga Nacional cada año desde 1876. En la
números de centenas y millares como tallo. tabla siguiente aparece una muestra de promedios
ganadores de bateo:
c. ¿Algunas de las mediciones son inconsistentes con las otras
mediciones, lo que indicaría que el técnico pudo haber
cometido un error en el análisis? Año Nombre Promedio
2000 Todd Helton .372
1.27 Presidentes de Estados Unidos La siguiente 1915 Larry Doyle .320
tabla enlista las edades que tenían al momento de 1917 Edd Roush .341
EX0127
fallecer 39 presidentes de Estados Unidos desde George 1934 Paul Waner .362
Washington hasta Ronald Reagan: 1911 Honus Wagner .334
1898 Willie Keeler .379
Washington 67 Arthur 56 1924 Roger Hornsby .424
J. Adams 90 Cleveland 71 1963 Tommy Davis .326
Jefferson 83 B. Harrison 67 1992 Gary Sheffield .330
Madison 85 McKinley 58 1954 Willie Mays .345
Monroe 73 T. Roosevelt 60 1975 Bill Madlock .354
J. Q. Adams 80 Taft 72 1958 Richie Ashburn .350
Jackson 78 Wilson 67 1942 Ernie Lombardi .330
Van Buren 79 Harding 57 1948 Stan Musial .376
W. H. Harrison 68 Coolidge 60 1971 Joe Torre .363
Tyler 71 Hoover 90 1996 Tony Gwynn .353
Polk 53 F. D. Roosevelt 63 1961 Roberto Clemente .351
Taylor 65 Truman 88 1968 Pete Rose .335
Fillmore 74 Eisenhower 78 1885 Roger Connor .371
Pierce 64 Kennedy 46 2009 Hanley Ramirez .342
Buchanan 77 L. Johnson 64
Lincoln 56 Nixon 81
A. Johnson 66 Ford 93 a. Construya un histograma de frecuencia relativa para describir
Grant 63 Carter 93 los promedios de bateo para estos 20 campeones.
Hayes 70 Reagan 93
b. Si usted eligiera al azar uno de los 20 nombres, ¿qué probabi-
Garfield 49
lidad hay de que elija un jugador cuyo promedio fuera arriba
de .400 para su año de campeonato?
a. Antes de graficar los datos, trate de visualizar la distribución
de las edades al fallecimiento de los presidentes. ¿Qué forma 1.30 Mejores 20 películas La tabla siguiente
piensa usted que tendrá? presenta las ventas brutas de boletos en fin de semana
EX0130
b. Construya una gráfica de tallo y hoja para los datos. Describa para las mejores 20 películas para el fin de semana del
la forma. ¿Le sorprende? 25 de junio de 2010.
ACTIVIDAD SUMATIVA 31
Venta bruta a. Trace una gráfica de tallo y hoja para los datos. Describa la
fin de semana forma de la distribución. ¿Hay algunos resultados atípicos?
Película ($ millones) b. Construya una gráfica de puntos para los datos. ¿Cuál de las
1.Toy Story 3 59.3 dos gráficas es más informativa? Explique.
2. Son como niños 40.5
3. Encuentro explosivo 20.1
4. Karate Kid 15.5
5. Los magníficos 6.2
6. Misión rockstar 3.1
7. Shrek para siempre 3.1
8. Príncipe de Persia 2.8
9. Killers 1.9
10. Jonah Hex 1.6
11. Iron Man 2 1.4
12. Sexo en la ciudad 2 1.2
13. Marmaduke 1.0
14. Robin Hood 0.6
15. Un hombre solitario 0.5
16. Cómo entrenar a tu dragón 0.5
17. Invierno profundo 0.4
18. Cartas a Julieta 0.4
19. Joan Rivers: A Piece of Work 0.4
20. Cyrus 0.3
Fuente: www.radiofree.com/mov-tops.shtml
ACTIVIDAD SUMATIVA
En la siguiente actividad usted hará un estudio con datos generados por el Instituto Nacional de Estadís-
tica y Geografía de México (INEGI) y otros obtenidos por una investigación propia (encuesta) sobre la
eficiencia terminal y el número de años de estudio de los mexicanos. Para esta actividad deberá formar
un equipo de tres personas.
Usted está a poco de terminar la educación media superior, esto es un beneficio que no todos los mexi-
canos tienen; según el INEGI, el porcentaje de eficiencia terminal de la educación media superior en
México no supera 70%.
Para obtener estos datos, ¿el INEGI habrá utilizado una muestra o una población?
Investigue en la página del INEGI, en la sección de Datos, la eficiencia terminal por entidad federativa
según nivel educativo, obtenga los datos de los dos últimos ciclos escolares de los 32 estados del nivel
educativo “Medio Superior”, genere con ellos una tabla donde muestre el porcentaje de eficiencia termi-
nal por estado, como se muestra a continuación.
Zacatecas
• ¿Qué puede concluir sobre el estado en que reside comparado con los demás estados de la Repú-
blica Mexicana?
• ¿Qué medidas propone para mejorar la eficiencia terminal a nivel medio superior en su estado?
Investigue el número de años que se espera que una persona de entre cinco y 29 años de edad esté ins-
crita en algún nivel educativo en los 32 estados de la República Mexicana del año más reciente, esto lo
encontrará en los datos del INEGI con el nombre de “Esperanza de escolaridad por Entidad federativa y
Ciclo escolar”
• Realice una tabla con los datos obtenidos y por medio de la Regla de Sturges complete la si-
guiente tabla:
n:
K:
Rango:
Amplitud del intervalo:
Frecuencia
Intervalos de Frecuencia Frecuencia
Clase relativa
clase absoluta relativa
acumulada
Investigue el número de años que se espera que una persona de entre cinco y 29 años de edad esté inscrita
en algún nivel educativo en su estado, esto lo encontrará en los datos del INEGI con el nombre de “Espe-
ranza de escolaridad por Entidad federativa y Ciclo escolar”. Escriba los valores de los últimos tres años:
1.
2.
3.
Por medio de una investigación de campo, recolecte el número de años que han estudiado al menos 50
personas adultas (mayores a 29 años) en su comunidad, recuerde que los años contarán a partir de la
educación primaria.
Con los datos obtenidos, realice la tabla de frecuencias para poder realizar el histograma de frecuen-
cias relativas.
• ¿Qué semejanzas o diferencias muestran las gráficas de su estudio comparadas con la de los 32
estados?
RÚBRICA PARA EVALUAR PROYECTO ESTADÍSTICO 33
Nombre de la materia:
Probabilidad y estadística
Equipo: Grado y grupo:
Profesor: Fecha de aplicación:
Tema: Productos que se evaluarán:
Estudio sobre la eficiencia terminal a nivel • Tablas de frecuencia
medio superior y años de estudio.
• Gráficas
Profesor(a), escriba en la tabla que se encuentra a continuación los nombres de los integrantes del
equipo y califique de acuerdo con la característica que describa mejor el desempeño de cada uno de
los alumnos en la columna coincidente con el número.
Asegúrese de contestar todas las categorías.
Núm. Nombre
1
2
3
Medidas de
tendencia central
© Hyejin Kang/stock.adobe.com
35
36 CAPÍTULO 2 MEDIDAS DE TENDENCIA CENTRAL
Evaluación diagnóstica
1. ¿Cuál de las siguientes es una gráfica de tallo y hoja?
10
20.0
9
85 y mayores (Millones)
8
17.5
7
6
15.0
154 | 9
5
12.5 156 |
4
10.0 158 |
3 7.5 160 | 00
2
5.0 162 | 666
0
1
2020 2030 2040 2050 164 | 11
Año
5.55 6.15 6.75 7.35 7.95 8.55 9.15 9.75 166 | 66666
Pesos al nacer 168 |
170 | 222222222
172 | 777777777
D A
174 | 333333333333
3.0% 9%
176 | 8888888888
C
23.3% 178 |
180 | 333333333333333
182 | 999999999999
184 | 44444
186 |
188 | 0000000
190 | 55
B 192 | 0000
65.0%
194 | 6
196 |
198 | 1
3. ¿Cuánto da, en todas las ocasiones, la suma de las frecuencias relativas de un conjunto de datos?
5. ¿Qué es medir?
Definición Las mediciones descriptivas numéricas asociadas con una población de mediciones
se llaman parámetros; las calculadas a partir de mediciones muestrales reciben el nombre de medi-
ciones estadísticas.
MEDIA
2.1
Hasta este punto ya ha estudiado la función que tienen las gráficas de puntos, las gráficas de tallo y
hoja y los histogramas, para describir la distribución de un conjunto de mediciones en una variable
cuantitativa x. El eje horizontal presenta los valores de x, y los datos están “distribuidos” a lo largo de
esta recta horizontal. Una de las primeras mediciones numéricas importantes es una medida de centro,
es decir, una medida a lo largo del eje horizontal que localiza el centro de la distribución.
Los datos de peso al nacer presentados en la Tabla 1.13 variaban de un punto bajo de 5.6 a uno alto de
9.4, con el centro del histograma situado en la cercanía de 7.5 (véase la Figura 2.1). Consideremos algunas
reglas para localizar el centro de una distribución de mediciones.
FIGURA 2.1
8/30
Centro de los datos de
7/30
peso al nacer.
Frecuencia relativa
6/30
5/30
4/30
3/30
2/30
1/30
0
5.6 6.1 6.6 7.1 7.6 8.1 8.6 9.1 9.6
Centro
Peso al nacer
El promedio aritmético de un conjunto de mediciones es una medida de centro muy común y útil. Es
frecuente que esta medida se conozca como media aritmética, o simplemente media, de un conjunto de me-
diciones. Para distinguir entre la media para la muestra y la media para la población, usamos el símbolo x (x
barra) para una media muestral y el símbolo m (la letra griega mu minúscula) para la media de una población.
Media aritmética
Como es frecuente que las fórmulas estadísticas comprendan la suma de números, usamos un símbo-
lo para indicar el proceso de sumar. Suponga que hay n mediciones en la variable x y que las llamamos
x1, x2, . . . , xn. Para sumar las n mediciones, utilizamos esta notación abreviada:
n
xi que significa x1 x2 x3 xn
i 1
La letra griega mayúscula sigma (S) implica sumar los términos que aparezcan a su derecha,
empezando con el número debajo de la sigma (i 1) y terminando con el número arriba (i n).
No obstante, como las sumas típicas en cálculos estadísticos se hacen casi siempre sobre el conjunto
total de las n mediciones, se puede usar una notación más sencilla:
Sxi que significa “la suma de todas las mediciones de x”.
Utilizando esta notación, escribimos la fórmula para la media muestral:
NOTACIÓN
Sxi
Media muestral: x
n
Media poblacional: m
38 CAPÍTULO 2 MEDIDAS DE TENDENCIA CENTRAL
EJEMPLO 2.1 Trace una gráfica de puntos para las n 5 mediciones 2, 9, 11, 5, 6. Encuentre la media muestral y
compare su valor con lo que usted pudiera considerar el “centro” de estas observaciones en la gráfica
de puntos.
Solución La gráfica de puntos de la Figura 2.2 parece estar centrada entre 6 y 8. Para hallar la
media muestral, calcule:
Sxi 2 9 11 5 6
x 6.6
n 5
FIGURA 2.2
Gráfica de puntos para el
Ejemplo 2.1.
2 4 6 8 10
Mediciones
La estadística x 6.6 es el punto de equilibrio o fulcro que se muestra en la gráfica de puntos. Este
aparece para marcar el centro de los datos.
MI CONSEJO
Recuerde que las muestras son mediciones tomadas de una población más grande que, en general, es des-
conocida. Un uso importante de la media muestral x es como un estimador de la media poblacional desco-
Media punto de nocida m. Los datos de peso al nacer en la Tabla 1.13 son una muestra de una población más grande de
equilibrio o fulcro pesos al nacer y su distribución se muestra en la Figura 2.1. La media de los 30 pesos al nacer es:
Σ xi 22 7 .2
x 7.57
30 30
ilustrada en la Figura 2.1; marca el punto de equilibrio de la distribución. La media de toda la población
de pesos de recién nacidos es desconocida, pero si usted tuviera que calcular su valor, su mejor estima-
ción sería 7.57. Aun cuando la media muestral x cambia de una muestra a otra, la media poblacional m
sigue igual.
Media geométrica
Definición La media geométrica G de un conjunto de n números positivos x1, x2, ..., xn es la raíz
n-ésima del producto de esos números:
G " n x1 x 2 x3 $ x n
¿Cuándo es apropiado usar la media geométrica? La media aritmética es relevante cuando varias
cantidades se suman para producir un total. La media aritmética responde a la pregunta: Si todas las
cantidades fueran iguales, ¿cuál debe ser el valor de la media para obtener el mismo total?
De forma análoga, la media geométrica es relevante en los casos en que varias cantidades se multi-
plican para producir un producto. La media geométrica responde a la pregunta: Si todas las cantidades
fueran iguales, ¿cuál debe ser el valor de la media para obtener el mismo producto?
La media geométrica se usa principalmente para promediar razones, cambios porcentuales en una
serie de números positivos, tasas de variación e índices económicos.
Tiene amplia aplicación en economía y negocios porque en estas disciplinas frecuentemente se está
interesado en establecer el cambio porcentual en variables económicas como, por ejemplo: ventas, pro-
ducción, costos, dividendos.