Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2 MEDIDAS DE CENTRO ❍ 53
DESCRIPCIÓN DE UN CONJUNTO DE
DATOS CON MEDIDAS NUMÉRICAS
2.1
Las gráficas pueden ayudar a describir la forma básica de una distribución de datos.
Sabemos que “una imagen vale por mil palabras” pero hay limitaciones para usar grá-
ficas. Supongamos que usted necesita presentar sus datos a un grupo de personas y que
el foco del proyector de imágenes se quema o que usted necesita describir sus datos por
teléfono; no hay modo de ver las gráficas. Necesita entonces hallar otra forma de llevar
la imagen mental de los datos a su audiencia.
Una segunda limitación es que las gráficas son un tanto imprecisas para usar en infe-
rencia estadística. Por ejemplo, supongamos que desea usar un histograma muestral para
hacer inferencias acerca de un histograma poblacional. ¿Cómo puede medir las similitu-
des y diferencias entre los dos histogramas en alguna forma concreta? Si son idénticas,
podría usted decir que son las mismas, pero, si son diferentes, es difícil describir el grado
de diferencia.
Una forma de superar estos problemas es usar medidas numéricas, que se pueden
calcular para una muestra o una población de mediciones. Se pueden usar los datos
para calcular un conjunto de números que llevarán una buena imagen mental de la dis-
tribución de frecuencia. Estas mediciones se llaman parámetros cuando se asocian con
la población y se denominan estadísticas cuando se calculan a partir de mediciones
muestrales.
MEDIDAS DE CENTRO
2.2
En el capítulo 1 introdujimos gráficas de puntos, gráficas de tallo y hoja e histogramas
para describir la distribución de un conjunto de mediciones en una variable cuantita-
tiva x. El eje horizontal presenta los valores de x, y los datos están “distribuidos” a lo
largo de esta recta horizontal. Una de las primeras mediciones numéricas importantes es
una medida de centro, es decir, una medida a lo largo del eje horizontal que localiza el
centro de la distribución.
Los datos de peso al nacer presentados en la tabla 1.9 iban de un punto bajo de 5.6 a uno
alto de 9.4, con el centro del histograma situado en la cercanía de 7.5 (véase la figura 2.1).
Consideremos algunas reglas para localizar el centro de una distribución de mediciones.
F I GU RA 2 . 1
●
Centro de los datos de
peso al nacer
8/30
7/30
Frecuencia relativa
6/30
5/30
4/30
3/30
2/30
1/30
0
5.6 6.1 6.6 7.1 7.6 8.1 8.6 9.1 9.6
Centro
Pesos al nacer
54 ❍ CAPÍTULO 2 DESCRIPCIÓN DE DATOS CON MEDIDAS NUMÉRICAS
La letra griega mayúscula (8) pide sumar los términos que aparezcan a su derecha,
empezando con el número debajo de la sigma (i 1) y terminando con el número arriba
(i n). No obstante, como las sumas típicas en cálculos estadísticos se hacen casi siem-
pre sobre el conjunto total de n mediciones, se puede usar una notación más sencilla:
8xi que significa “la suma de todas las mediciones de x”
Usando esta notación, escribimos la fórmula para la media muestral:
NOTACIÓN
_ 8xi
___
Media muestral: x n
Media poblacional: m
EJEMP L O 2.1 Trace una gráfica de puntos para las n 5 mediciones 2, 9, 11, 5, 6. Encuentre la media
muestral y compare su valor con lo que usted pudiera considerar el “centro” de estas
observaciones en la gráfica de puntos.
Solución La gráfica de puntos de la figura 2.2 parece estar centrada entre 6 y 8. Para
hallar la media muestral, calcule
8xi
___ 2_________________
9 11 5 6
x n 6.6
5
F I GUR A 2 . 2
●
Gráfica de puntos para el
ejemplo 2.1
2 4 6 8 10
Mediciones
_
La estadística x 6.6 es el punto de equilibrio o fulcro que se muestra en la gráfica de
puntos. Parece marcar el centro de los datos.
2.2 MEDIDAS DE CENTRO ❍ 55
La observación de enmedio, marcada con una flecha, es el centro del conjunto o sea
m 6.
Ahora hay dos observaciones “de enmedio”, vistas en la caja. Para hallar la mediana,
MI CONSEJO
escoja un valor a la mitad entre las dos observaciones de enmedio:
Casi 50% de las mediciones
son más pequeñas, 50% son
m 6 9
_____ 7.5
más grandes que la mediana. 2
Aunque tanto la media como la mediana son buenas medidas del centro de una dis-
MI CONSEJO
tribución, la mediana es menos sensible a valores extremos o resultados atípicos. Por
Simétrico: ejemplo, el valor x 27 en el ejemplo 2.3 es mucho mayor que las otras mediciones.
media mediana.
La mediana, m 7.5, no es afectada por el resultado atípico, en tanto que el promedio
Sesgada a la derecha:
media mediana.
muestral,
Sesgada a la izquierda: 8xi ___
___ 60 10
media mediana. x
n 6
sí es afectado; su valor no es representativo de las cinco observaciones restantes.
Cuando un conjunto de datos tiene valores extremadamente pequeños u observacio-
nes muy grandes, la media muestral se traza hacia la dirección de las mediciones extre-
mas (véase la figura 2.3).
F I GUR A 2 . 3
●
Distribuciones de a) b)
.25 .25
frecuencia relativa
mostrando el efecto de
Frecuencia relativa
Frecuencia relativa
.19 .19
valores extremos en la
media y mediana .12
.12
.06 .06
0 0
Media mediana Media > mediana
Si una distribución está sesgada a la derecha, la media se corre a la derecha; si una dis-
tribución está sesgada a la izquierda, la media se corre a la izquierda. La mediana no es
afectada por estos valores extremos porque los valores numéricos de las mediciones
no se usan en este cálculo. Cuando una distribución es simétrica, la media y la mediana
son iguales. Si una distribución está fuertemente sesgada por uno o más valores extre-
mos, el usuario debe emplear la mediana en lugar de la media como medida de centro.
MI APPLET
Se puede ver el efecto de valores extremos en la media y la mediana usando el applet
How Extreme Values Affect the Mean and Median. El primero de tres applets
(figura 2.4) muestra una gráfica de puntos de los datos del ejemplo 2.2. Use su mouse
para mover la observación más grande (x 11) aún más a la derecha. ¿En qué forma
esta observación más grande afecta a la media? ¿Cómo afecta a la mediana? Usare-
mos este applet otra vez para los ejercicios Mi Applet al final del capítulo.
F I GUR A 2 . 4
●
Forma en que los valores
extremos afectan al applet
de la media y la mediana
2.2 MEDIDAS DE CENTRO ❍ 57
La moda por lo general se usa para describir conjuntos grandes de datos, mientras que
la media y la mediana se usan para conjuntos de datos grandes y pequeños. De los datos
del ejemplo 1.11, la moda de la distribución del número de visitas hechas semanalmente
a Starbucks para 30 clientes es de 5. La clase modal y el valor de x que se presenta con
la más alta frecuencia son iguales, como se muestra en la figura 2.5a).
Para los datos de la tabla 1.9, un peso de 7.7 al nacer se presenta cuatro veces y, por
MI CONSEJO
tanto, la moda para la distribución de pesos al nacer es 7.7. Usando el histograma
Recuerde que puede para hallar la clase modal, se encuentra que la clase con el pico más alto es la quinta
haber varias modas o
puede no haberlas (si cada
clase, de 7.6 a 8.1. Nuestra opción para la moda sería el punto medio de esta clase, o sea
observación se presenta sólo 7.85. Véase la figura 2.5b).
una vez). Es posible que una distribución de mediciones tenga más de una moda. Estas modas
aparecerían como “picos locales” en la distribución de frecuencia relativa. Por ejemplo,
si fuéramos a tabular la longitud de los peces sacados de un lago durante una temporada,
podríamos obtener una distribución bimodal, posiblemente reflejando una mezcla de
peces jóvenes y viejos en la población. A veces las distribuciones bimodales de tamaños
o pesos reflejan una mezcla de mediciones tomadas en machos y hembras. En cualquier
caso, un conjunto o distribución de mediciones puede tener más de una moda.
F I GU RA 2 . 5
●
Histogramas de frecuencia a) b)
relativa para datos de
8/25 8/30
Starbucks y peso al nacer
Frecuencia relativa
Frecuencia relativa
7/30
6/25 6/30
5/30
4/25 4/30
3/30
2/25 2/30
1/30
0 0
1 2 3 4 5 6 7 8 5.6 6.1 6.6 7.1 7.6 8.1 8.6 9.1 9.6
Visitas Peso al nacer
2.2 EJERCICIOS