En capítulos anteriores construimos tablas y gráficas a partir de una colección de
datos sin procesar. Los «retratos» resultantes de las distribuciones de frecuencias ilustraron tendencias y patrones de los datos. En casi todos lo casos, sin embargo, teníamos necesidad de medidas más exactas. En estos casos, podemos usar los números que constituyen la estadística sumaria para describir las características del conjunto de datos. Dos de estas características son de particular importancia para los responsables de tomar decisiones: la tendencia central y la dispersión. Tendencia central: La tendencia central se refiere al punto medio de una distribución. Las medidas de tendencia central se conocen también como medidas de posición.
Comparación de la posición central de tres curvas.
En la figura, la posición central de la curva B está a la derecha de las
posiciones centrales de las curvas A y C. Observe además que la posición central de la curva A es la misma que la de la curva C. Dispersión: La dispersión se refiere a la separación de los datos de una distribución, es decir, al grado en que las observaciones se separan.
Note que la curva A tiene una mayor separación o dispersión que la
curva B.
Existen otras dos características de los conjuntos de datos que proporcionan
información útil: el sesgo y la curtosis. Sesgo: Las curvas que representan los datos puntuales de un conjunto de datos pueden ser simétricas o sesgadas. Las curvas simétricas (como el de la figura de abajo), tienen una forma tal que una línea vertical que pase por el punto más alto de la curva, dividirá su área en dos partes iguales. Cada parte es una imagen o espejo de la otra. Las curvas A y B de la figura, son curvas sesgadas. Están sesgadas porque los valores de su distribución de frecuencias se concentran en el extremo inferior o en el superior de la escala de medición del eje horizontal. Estos valores no están igualmente distribuidos. La curva A está sesgada a la derecha (o positivamente sesgada), debido a que va disminuyendo poco a poco hacia el extremo derecho de la escala. La curva B es exactamente opuesta. Está sesgada a la izquierda (negativamente sesgada), ya que disminuye poco a poco si la recorremos hacia el extremo inferior de la escala. Curtosis: Cuando medimos la curtosis de una distribución, estamos midiendo qué tan puntiaguda es. Por ejemplo, las curvas A y B difieren entre sí solo en que una tiene un pico más pronunciado que la otra. Tienen la misma posición central y la misma dispersión, y ambas son simétricas, pero tienen un grado diferente de curtosis. Aplicación 1.
1. Trace tres curvas, todas simétricas, pero con diferente dispersión.
2. Trace tres curvas, todas simétricas y con la misma dispersión, pero con las siguientes posiciones centrales: a) 0.0 b) 1.0 c) -1.0 3. a) tiene el valor promedio más grande. b) es más probable que produzca un valor pequeño que uno grande. Para las distribuciones siguientes, indique cuál de ellas: c) es la mejor representación de la distribución de edades de los asistentes a un concierto de rock. d) es la mejor representación de la distribución de los tiempos de espera de pacientes en el consultorio de un médico. Comparación de la media, la mediana y la moda.
Cuando trabajamos problemas de estadística, debemos decidir si vamos a utilizar la
media, la mediana o la moda como medidas de tendencia central. Las distribuciones simétricas que solo contienen una moda siempre tiene el mismo valor para la media, la mediana y la moda. En estos casos, no es necesario escoger las medidas de tendencia central, pues ya está hecha la selección. En una distribución con sesgo positivo (es decir, sesgada a la derecha), la moda se encuentra todavía en el punto más alto de la distribución, la mediana está a la derecha de la moda y la media se encuentra todavía más a la derecha de la moda y la mediana. En una distribución con sesgo negativo (es decir, sesgada a la izquierda), la moda sigue siendo el punto más alto de la distribución, la mediana está a la izquierda y la media se encuentra todavía más a la izquierda de la moda y la mediana. Cuando la población está sesgada negativamente o positivamente, la mediana suele ser la mejor medida de posición, debido a que siempre está entre la moda y la media. La frecuencia de ocurrencia de un solo valor no influye mucho en la mediana como es el caso de la moda, ni la distorsionan los valores extremos como en la media.
En cualquier otro caso, no existen guías universales para la aplicación de la media, la
mediana o la moda como medidas de tendencia central para diferentes poblaciones. Cada caso deberá considerarse de manera independiente, de acuerdo con las líneas generales que se analizaron.