Está en la página 1de 14

Descripción de datos con

medidas numéricas
¿Por qué usar medidas numéricas?
• Las gráficas son sumamente útiles para la descripción visual de
un conjunto de datos, pero no siempre son la mejor herramienta
cuando se desea hacer inferencias acerca de una población a
partir de la información contenida en una muestra. Para este
propósito, es mejor usar medidas numéricas para construir una
imagen mental de los datos.
Lo que veremos…
• Gráficas de caja
• Medidas de centro: media, mediana y moda
• Medidas de posición relativa: puntajes z, percentiles, cuartiles y el
rango intercuartil
• Medidas de variabilidad: rango, varianza y desviación estándar
• Teorema de Chebyshev y la Regla Empírica
Limitaciones del análisis solo de graficas
• Las gráficas pueden ayudar a describir la forma básica de una distribución de
datos.

• Supongamos, que necesitamos traspasar la información de las gráficas, pero no


tenemos como mostrarlas (Para esto necesitamos los datos numéricos.

• Una segunda limitación es que las gráficas son un tanto imprecisas para usar en
inferencia estadística. Por ejemplo, supongamos que desea usar un histograma
muestral para hacer inferencias acerca de un histograma poblacional. ¿Cómo puede
medir las similitudes y diferencias entre los dos histogramas en alguna forma
concreta? Si son idénticas, podría usted decir que son las mismas, pero, si son
diferentes, es difícil describir el grado de diferencia
Soluciones
• Una forma de superar estos problemas es usar medidas
numéricas, que se pueden calcular para una muestra o una
población de mediciones. Se pueden usar los datos para calcular
un conjunto de números que llevarán una buena imagen mental de
la distribución de frecuencia. Estas mediciones se llaman
parámetros cuando se asocian con la población y se denominan
estadísticas cuando se calculan a partir de mediciones
muestrales.
Medidas de
centro
• Hemos visto: gráficas de puntos,
gráficas de tallo y hoja e histogramas
para describir la distribución de un
conjunto de mediciones en una variable
cuantitativa x. El eje horizontal
presenta los valores de x, y los datos
están “distribuidos” a lo largo de esta
recta horizontal. Una de las primeras
mediciones numéricas importantes es
una medida de centro, es decir, una
medida a lo largo del eje horizontal que
localiza el centro de la distribución.
Media aritmética o media
• El promedio aritmético de un conjunto de mediciones es una medida de centro
muy común y útil. Es frecuente que esta medida se conozca como media
aritmética o simplemente media, de un conjunto de mediciones. Para distinguir
entre la media para la muestra y la media para la población, usamos el símbolo
(x barra) para una media muestral y el símbolo para la media de una población.
Formulas
Ejemplo:
MEDIANA
• Una segunda medida de tendencia central es la
mediana, que es el valor de la posición media en el
conjunto de mediciones ordenada de menor a mayor
Ejemplo
Moda
• Otra forma de localizar el centro de una distribución es buscar el valor de x que se
presenta con la frecuencia más alta. Esta medida del centro se denomina moda.
• Es posible que una distribución de mediciones tenga más de una moda. Estas
modas aparecerían como “picos locales” en la distribución de frecuencia relativa.
Por ejemplo, si fuéramos a tabular la longitud de los peces sacados de un lago
durante una temporada, podríamos obtener una distribución bimodal, posiblemente
reflejando una mezcla de peces jóvenes y viejos en la población.
Importante
• Si una distribución está sesgada a la derecha, la media se corre a la derecha; si
una distribución está sesgada a la izquierda, la media se corre a la izquierda.
• La mediana no es afectada por estos valores extremos porque los valores
numéricos de las mediciones no se usan en este cálculo.
• Cuando una distribución es simétrica, la media y la mediana son iguales.
• Si una distribución está fuertemente sesgada por uno o más valores extremos, el
usuario debe emplear la mediana en lugar de la media como medida de centro.
• La moda por lo general se usa para describir conjuntos grandes de datos, mientras
que la media y la mediana se usan para conjuntos de datos grandes y pequeños.
Trabaje en la guía

También podría gustarte