Está en la página 1de 31

Medidas Descriptivas

Conceptos previos
Parámetro:
Medida descriptiva de la población total de todas las observaciones de interés
para el investigador.

Estadístico:
Elemento que describe una muestra y sirve como una estimación del
parámetro de la población correspondiente.
Medidas Descriptivas
Previamente a estudiar las medidas de tendencia central, las ubicaremos en el contexto de las
medidas descriptivas más utilizadas en la estadística. Estas medidas sirven para describir los
datos o información de interés en un estudio, permitiendo hacer una especie de retrato de la
información, ya que nos proporcionan aspectos esenciales de la misma, sin tener que ver uno a
uno los datos.
Las medidas de tendencia central son el primero de los tres grupos de medidas descriptivas que
estudiaremos. En el desarrollo de este tema se identificará cuáles son las diferentes medidas de
tendencia central, como se calculan, y la interpretación de las mismas.
El cuadro sinóptico que se presenta a continuación resume la clasificación de las medidas
descriptivas y dentro de éstas las diferentes medidas de tendencia central que estudiaremos.
Media Media Simple
Medidas de Tendencia Central Moda Media Ponderada

Mediana

Cuartiles
Medidas Medidas de Posición Deciles
Descriptivas
Percentiles

Rango
Absoluta Desviación Media
Desviación estándar
Varianza
Medidas de Dispersión

Relativa Coeficiente de variación


Las medidas de tendencia central, son medidas que describen un conjunto de datos, indicando
cuales son los valores que tienden a ubicarse en la parte central de los mismos; y alrededor de
ellas se agrupa la mayor parte de los valores de la información analizada.
Las medidas de tendencia central más utilizadas son tres:

Media Moda Mediana


Media aritmética o simple y ponderada
Como pudieron observar en el cuadro sinóptico al inicio del tema, la media se subdivide en
media aritmética o simple y en la media ponderada, por lo cual te invito a conocer las mismas a
fin de diferenciarlas. Para ello te invito a que leas con detenimiento el siguiente texto.

Media aritmética
Es una medida de tendencia central que indica el valor promedio de un conjunto de datos, de
allí que a veces nos referimos a la media como el promedio de los datos y la denotamos con los
siguientes símbolos:

Características

La media solo puede utilizarse para datoscuantitativos y es única.

Tiene la desventaja que es afectada por valores extremos

Para calcular la media de un conjunto de datos, ya sea de una muestra o de la


población, se suman todos los datos y el resultado se divide entre el número total de
datos, puntuaciones u observaciones.
La fórmula que se utiliza para calcular la media es la siguiente:

Por Ejemplo

En una encuesta a personas con hipertensión arterial , se les ha preguntado el numero de veces que han recibido el
control de su presión arterial en los últimos seis meses. Las respuestas se muestran en los siguientes datos :

3 5 2 2 16 0 6 0 4 3 1 3
Observe que el numero de elementos de la muestra es n = 13
Si se hace un arreglo de los datos en orden ascendente, quedarían de la siguiente manera:

0 0 1 1 2 2 3 3 3 4 5 6 6
Para calcular la media de las edades: se suman todos los valores y se divide entre el
número de observaciones, como se muestra a continuación:

Este valor indica que el numero promedio que han recibido control de
su presión arterial en los últimos seis meses es de 2.77

Es importante recordar que la edad media obtenida de la muestra es un estadístico, es


decir, un estimado de la edad promedio de la población de personas que viajaban en el
autobús. Si se tienen todos los datos de la población, al calcular la media con esos
datos se obtiene un parámetro.
Media de la población
Si se tienen todos los datos de la población, la media se calcula de la misma manera, solamente
se usa una notación diferente para la Media (μ) y para el tamaño de la población (N), para
hacer la distinción de que se está calculando no un estimador del parámetro de la población
sino que el verdadero valor.
La fórmula para calcular la media poblacional es la siguiente:

Suponga que se toman todos los datos del ejercicio anterior, los cualles se presentan de
forma ascendente

0 0 1 1 2 2 2 2 2 3 3 3 3 4 5 5 5 6 6 6 6 7 7 8
Observe que el numero de elementos de la población es N=24

Para calcular la media poblacional se suman todos los datos de la población y se divide por el
número de observaciones :

Este valor indica que el numero promedio de es población de 24 personas que


han recibido control de su presión arterial en los últimos seis meses es de 3.71

Si ordenamos los datos de la población en forma ascendente, posiblemente podamos


observar que en la lista de datos no hay ninguna persona que el numero de veces que ha
recibido el control de su presión sea 3.71 veces pero µ =3.71 es un valor que tiende a
ubicarse cerca del centro del conjunto de datos.
Si comparamos la media muestral con la media poblacional tenemos :
X=2.77 y µ = 3.71, se observa una diferencia entre ambos valores de
0.94 este es un error de estimación relativamente pequeño, sin embargo
no siempre es posible trabajar con todos los datos de la población por lo
que el valor que nos proporciona el estadístico obtenido de una muestra,
es un buen estimador del parámetro de la población
Media Ponderada
Cuando calculamos la media para algunos casos particulares donde los datos a considerar tienen
diferente peso con respecto a los demás. Por ejemplo, al calcular el índice académico de un
estudiante, que lleva clases que tienen diferente número de unidades valorativas; se utiliza la
media ponderada para poder obtener un promedio (no simple) al que se llama índice
académico.
La fórmula para calcular la media ponderada es la siguiente:

Consideremos el siguiente ejemplo:


Los dueños de una farmacia compraron aspirinas a tres diferentes proveedores.
El primero les vendió 150 unidades a un precio de 12 lps cada una, el segundo 100 unidades a 12.80
lps cada una y a un tercero le compraron un lote de 80 unidades a 13 lps. ¿Cuál es el precio
promedio que han pagado los dueños de la farmacia por cada aspirina?
En este caso podemos considerar que xi es
Cada precio Wi es el peso relativo a cada
Unidad adquirida de medicamento por lo que
Aplicando la formula para calcular la media
Ponderada tendríamos

El preio promedio que han pagado los dueños de la farmacia


por cada aspirina ha sido 12.40 lps
Mediana
Es la medida de tendencia central que se ubica exactamente en el centro del conjunto de datos,
dividiendo la distribución en dos partes iguales, el símbolo para denotar la Mediana es
Características
* La mediana ocupa la posición central de un conjunto de datos, divide los datos en dos
partes
iguales, no se afecta por los valores extremos de los datos, pero es sensible al tamaño de la
muestra.
* Para aclarar este concepto supongamos que tenemos un conjunto de datos ordenado en
forma ascendente, la mediana ocupa la posición central en el conjunto de datos, dividiendo
el
arreglo de datos en dos partes iguales, de modo que cada una contiene el 50% de los datos,
como se muestra en la siguiente figura.
Ejemplo
Las edades tomadas de una muestra de 16 niños
hospitalizados por una crisis de asma son las siguientes

Para determinar la mediana la mediana se tendría que observa cual es el


dato que se ubica en el centro de los datos después de ordenarlos
Al ordenar los datos en forma ascendente tenemos

Note que en este caso el número de elementos de la muestra es par (n=16) en este caso se
toman los dos valores centrales del conjunto de datos ordenados y se calcula el promedio de
ambos.
Para calcular la mediana de un conjunto de datos no agrupados, se siguen los
siguientes pasos:
1. Se ordenan los datos en forma ascendente.
2. Si el conjunto de datos es impar, la mediana ocupa el valor central del conjunto de
valores.
3. Si el conjunto de datos es impar, la mediana se obtiene sacando el promedio de los
dos valores centrales.
Como se muestra en el siguiente ejemplo, en el cual quitamos un dato a la muestra del
ejemplo anterior quedando n=15
50% 50%

Al hacer un arreglo ascendente tenemos que el dato que ocupa la posición


central es el octavo, a la izquierda de él hay 7 datos y a la derecha de él
también hay 7 datos; por lo tanto la

Note que en este caso el número de elementos de la muestra es impar (n=15), por
lo tanto la mediana se ubica en el valor central; si el conjunto de datos es par, se
toman los dos valores centrales y se saca el promedio de los dos para obtener la
mediana.
Moda
Es la medida de tendencia central con mayor frecuencia dentro de un conjunto de datos, en
otras palabras es el valor que más se repite en una serie de datos. La notación usada para
representar la Moda es

Características
* La moda tiene la ventaja que puede aplicarse a datos cualitativos y cuantitativos, es fácil de
calcular, no se ve afectada por los valores extremos del conjunto de datos; sin embargo, pudiera
ser que la moda no exista, es decir, que ningún dato se repite. Por otra parte la moda podría no
ser única, o sea conjuntos de datos con más de una moda, cuando hay dos modas se dice que
los datos son bimodales, y en general, si los datos tienen más de tres modas, se dice que esos
datos son multimodales.

Si tomamos nuevamente el ejemplo de las edades tomadas a 16 niños hospitalizados por una crisis
de asma. Para determinar la moda se tendría que observar cual es el dato que tiene la frecuencia
mas alta hay cuatro niños que tienen 8 años, por lo tanto la moda es 8
Para reforzar sus conocimientos sobre medidas de tendencia central para datos no agrupados
observe los siguientes video:Video 1 y Video 2
Medidas de dispersión
Las medidas de dispersión corresponden al segundo bloque de medidas descriptivas,
éstas indican que tan dispersos están los datos entre sí; ayudan a determinar aspectos
de homogeneidad o heterogeneidad en un conjunto de datos.

En este caso el Gerente de Producción tiene un problema ya que no es posible dividir el bono.
¿Qué otro criterio, con base estadística, puede considerarse para definir cuál de los dos
empleados tiene un mejor indicador de productividad?
Como los datos obtenidos sumando la última columna, podemos calcular el promedio
de las desviaciones de los datos con respecto a la media (Desviación Media) de cada
empleado de la siguiente manera
Interpretación:
• Para el Empleado A, el promedio de las deviaciones de su producción
semanal con respecto a la media fue de 65 unidades y
• Para el Empleado B, el promedio de las deviaciones de su producción
semanal con respecto a la media fue de 7.5 unidades
Lo anterior indica que los valores de producción del Empleado B son más cercanos a la
media, indicando menor variación o dispersión, lo cual podría inducirnos a pensar que
su producción es más estable, versus Empleado A que pareciera ser menos estable en
sus resultados.
En Conclusión :
Considerando el indicador de dispersión, podríamos recomendar al Gerente de Producción que
en caso de empate, el bono se otorgue al empleado con el indicador de dispersión más bajo. Si
éste fuera el criterio para desempatar. La bonificación sería para el Empleado B
Con este ejemplo se evidencia la importancia de las medidas de dispersión ya que
complementan el análisis de la información, indicando que tan homogéneos o heterogéneos
son los datos entre si.

Las medidas de dispersión son medidas que indican que tan


Cerca o tan lejos están entre si los valores de un conjunto de datos
Las medidas de dispersión que estudiaremos son de dos tipos, las cuales se presentan en el
mapa mental

Rango
De dispersión Desviación media
absoluta Estándar o típica
Varianza
Medidas de dispersión
De dispersión
relativa Coeficiente de
variación
Rango
Esta medida de dispersión nos indica la distancia entre el valor máximo y el valor mínimo de la
muestra o de la población. La fórmula para calcular el Rango de un conjunto de datos es la
siguiente:

Rango = Valor Máximo – Valor Mínimo

Ejemplo: El numero de mediciones reproducidos a continuación muestran el


ultimo digito del numero del seguro social para un grupo de 5 personas
7 5 1 2 4
Rango = 7– 1 = 6
Desviación Media
Esta medida de dispersión indica el promedio del valor absoluto de las desviaciones de un
conjunto de datos con respecto a su media; la fórmula para calcular la desviación media es la
siguiente:

Interpretación:El promedio de las


desviaciones de los datos del ultimo digito
del seguro social con respecto a la media
es de 1.84
Desviación Estándar o Desviación Típica
Esta medida de dispersión -al igual que la Desviación Media- indica el promedio de las
desviaciones de los datos con respecto a su media. El símbolo S se utiliza para denotar la
desviación típica de la muestra y el símbolo σ para la Desviación Estándar de la población. La
fórmulas para calcular la Desviación Estándar de la muestra y la población para datos no
agrupados son las siguientes:

Si observa la diferencia entre las dos fórmulas anteriores es que para la calcular S, se utiliza la
media de la muestra y se divide por n-1, y para calcular σ se utiliza la media poblacional y se
divide por N.
Ejemplo:
Calculemos la desviación estándar del ejercicio anterior referido

Interpretación : Indica
que en promedio los
datos del ultimo digito del
seguro social de 5
personas se desvían con
respecto a su media 2.39
Varianza
Esta es una medida de dispersión que se obtiene al elevar al cuadrado la desviación estándar, se
denota por los símbolos: s2 la muestra y σ2 para la población; las fórmulas para calcular la
varianza son las siguientes:

La Varianza se interpreta sencillamente como el cuadrado del promedio de las desviaciones de


los datos con respecto a su media.

En el caso del ejemplo del ultimo digito del seguro social de 5 personas s=2.39
¿Cuál seria la varianza?
Solución:
Varianza:s2=(2.39)2=5.7121
Medidas de Dispersión Relativas
Estás son medidas de dispersión que se comparan con otra medida que puede ser de tendencia
central , estudiaremos únicamente el coeficiente de variación, denotado por CV y se expresa en
porcentaje, el cual se calcula de la siguiente manera:

Ejemplo:
En el caso del ejemplo del ultimo digito del seguro social de 5
personas conocemos la media =3.8 y la desviación estándar s=2.39
¿Cuál es el coeficiente de variación ? Interpretación:el coeficiente de
variación indica que los últimos
dígitos del seguro social se dispersan
con respecto a la media en un
69.89%
Utilizando el modo estadístico de la
calculadora
Dependiendo del tipo de calculadora vean el siguiente Video

También podría gustarte