Está en la página 1de 13

Valores

estadísticos: de
posición y de
dispersión

Herramientas
Matemáticas III -
Estadística I

1
Valores de posición y de
dispersion
Según sus características los valores estadísticos se pueden
clasificar:

− 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎
𝐷𝑒 𝑡𝑒𝑛𝑑𝑒𝑛𝑐𝑖𝑎 𝑐𝑒𝑛𝑡𝑟𝑎𝑙 𝑜 𝑑𝑒 𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 { −𝑀𝑒𝑑𝑖𝑎𝑛𝑎
−𝑀𝑜𝑑𝑎
− 𝑅𝑎𝑛𝑔𝑜
𝑉𝑎𝑙𝑜𝑟𝑒𝑠 𝑒𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑜𝑠 −𝐷𝑒𝑠𝑣í𝑜 𝑚𝑒𝑑𝑖𝑜
𝐷𝑒 𝑑𝑖𝑠𝑝𝑒𝑟𝑠𝑖ó𝑛 −𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎
−𝐷𝑒𝑠𝑣í𝑜 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑑
{ {−𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛

Valores o medidas de tendencia central o de posición:

“Es la medida que describe cómo todos los valores de los datos
se agrupan en torno a un valor central.” (Berenson y Levine,
2006, pag. 72 ).

Media aritmetica o promedio:

Es el cociente entre las sumas de todas las observaciones y el


número total de las mismas.

La media poblacional la representamos con la letra μ y el tamaño


de la población con N, por lo que la media poblacional se expresa
como:

𝑥1 + 𝑥2 + ⋯ + 𝑥𝑁
𝛍=
𝐍

Y en notación abreviada:

∑𝑁
1 𝑥𝑖
𝛍=
𝐍

2
En cambio, la media muestral, la representamos con 𝐗 y el
tamaño de la muestra o número de observaciones lo
representaremos con n.

𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝐗=
𝐧

Y en notación abreviada:

∑𝑛1 𝑥𝑖
𝐗=
𝐧
Ejemplo N°1:
En un brote de gripe invernal, 8 personas que
desarrollaron la enfermedad tardaron la siguiente cantidad de
días en curarse completamente:
8, 8, 9, 10, 7, 7, 7, 9, y para calcular la media de esta población,
procedemos de la siguiente manera:

8 + 8 + 9 + 10 + 7 + 7 + 7 + 9
𝛍=
𝟖

65
𝛍= → 𝛍 = 8,125
𝟖

Es viable notar que si bien la media no coincide con ninguna


medición nos representa el valor medio de duración de la
enfermedad.
Ahora bien, tratándose de un grupo de datos muy grande, en
que alguno de ellos se presenta con distinta frecuencia, se puede
modificar la ecuación anterior:

𝑥1 . 𝑓1 + 𝑥2 . 𝑓2 + ⋯ + 𝑥𝑛 . 𝑓𝑛
𝐗=
𝑓1 + 𝑓2 + ⋯ + 𝑓𝑛

Llamando 𝑓1 , 𝑓2 , …, 𝑓𝑛 , a las distintas frecuencias en que


aparecen los datos.

Ejemplo N°2:
En la siguiente tabla se representa el número de
hermanos de cada alumno de 4° año de la carrera de Abogacía:

3
Tabla 1: hermanos de cada alumno de 4° año de la carrera de
Abogacía.
N° de hermanos Frecuencia
1 30
2 20
3 15
4 5
5 2
Fuente: elaboración propia

(1.30) + (2.20) + (3.15) + (4.5) + (5.2)


𝐗=
72

𝐗 = 2,01

En el caso que estamos analizando, vemos que la media cuenta


con la ventaja de la facilidad del cálculo, pero la desventaja es
que es un parámetro muy sensible a los valores extremos, lo cual
le hace perder representatividad en esos casos y convendría
utilizar otra de las medidas de tendencia central.

Ejemplo N°3:

Si en un curso de Postgrado de la Universidad asisten 10 alumnos


y se hace una encuesta de las edades de los mismos:
24, 23, 25, 27, 30, 26, 28, 29, 30, 65

Se verifica que la media aritmética es 30,7 años, valor que no


sería representativo, dado que solo un alumno superaría ese
valor (65 años) afectando demasiado al promedio. Si analizamos
el resto de los 9 alumnos y calculamos su media, esta toma un
valor de 26,9. Veremos más adelante que para este caso la
mediana sería una opción más conveniente.

Mediana:

Es el valor que divide en partes iguales a los datos ordenados


de una distribución. La mediana, en una distribución ordenada,
deja a uno de sus lados los valores menores o iguales a ella y
hacia el otro lado los mayores o iguales a ella en igual número
de observaciones.

4
Para calcularla, se procede de las siguientes dos maneras, según
si el número de observaciones fuera par o impar: Si n es impar
es el valor central al ordenar la distribución, por ejemplo:

Tabla 2: ejemplo si n es impar

Valores ordenados de una 22 23 25 29 30


observación
Orden de la distribución 1 2 3 4 5
Fuente: elaboración propia

Me = 25

En cambio, si n es par es el promedio de los valores centrales al


ordenar la distribución, por ejemplo:

Tabla 3: ejemplo si n es par

Valores ordenados de una 32 35 37 40 42 83


observación
Orden de la distribución 1 2 3 4 5 6
Fuente: elaboración propia

Me =37+40 = 38,5
2

En este último ejemplo, observamos que la mediana es


insensible a los valores extremos, por lo que describe con más
exactitud las distribuciones con valores extremos despegados de
la mayoría.

5
Moda:

Es el valor que más se repite en una distribución.Tomando el


mismo ejemplo N°2:

Tabla 4: hermanos de cada alumno de 4° año de la carrera de


Abogacía.

N° de hermanos Frecuencia
1 30
2 20
3 15
4 5
5 2

Fuente: elaboración propia

Observamos que la cantidad de hermanos que más se repite es


el 1, con 30 alumnos, por lo tanto, la moda es:

Mo = 1

Si contamos con el caso en que más de un valor de la distribución


se repite el mismo máximo número de veces, puede tener más
de una moda; por ejemplo, si existen dos valores en esas
condiciones recibe el nombre de bimodal, si fueran tres,
trimodal y así sucesivamente.

En cambio si todos los valores de la distribución tienen el mismo


número de repeticiones se dice que no tiene moda.

Valores o medidas de variacion o dispersion:


En la figura siguiente, mostramos dos conjuntos de datos con la
misma posición
central, pero uno con mayor dispersión que el otro.
La media de las dos curvas es toma el mismo valor, pero la curva
de la serie 2 tiene menor separación (o variabilidad) que la curva
de la serie 3, si medimos sólo la media de estas dos
distribuciones, estaremos pasando por alto una distinción
importante que existe entre las dos curvas. Al igual que sucede
con cualquier conjunto de datos, la media, la mediana y la moda

6
sólo nos muestran parte de la información que debemos conocer
acerca de las características de los eventos.

Figura 2: Distribuciones con igual media


8

4 Series2
Series3
3

0
0 1 2 3 4 5 6 7 8 9 10 11 12
Fuente: elaboración propia

Para mejorar nuestra comprensión del conjunto de datos de


cada distribución, debemos medir también su dispersión,
separación o variabilidad.

Figura 1: Clasificación de las dispersiones


Amplitud o rango
Desvío medio
Varianza
Valores de dispersión Desvío estándar
Dispersión relativa, Coeficiente de variación
Cuartiles y percentiles
{ Regla empírica
Fuente: elaboración propia

Serie simple:

Los datos en bruto, tal cual fueron obtenidos, sin agrupar


constituyen una serie simple. Están dados, entonces, por una
cantidad finita de datos estén éstos ordenados o no.

Como ejemplo de serie simple: 2 4 5 1 7

7
Serie de frecuencia:

Cuando se realiza un estudio de cada uno de los elementos que


componen la población o muestra bajo análisis, observamos que
en general, hay un número de veces en que aparece repetido un
mismo valor de una variable, o bien repeticiones de la misma
modalidad de un atributo.
Este número de repeticiones de un resultado, recibe el nombre
de frecuencia absoluta o simplemente frecuencia.
El procedimiento mediante el cual se realiza el conteo, para así
determinar el número de veces que cada dato se repite, recibe
el nombre de tabulación.
Al agrupar los resultados de las observaciones en término de las
veces que éstos se repiten, da lugar a las llamadas "series de
frecuencias" o distribuciones de frecuencias.

Frecuencia relativa:

La frecuencia relativa de un valor, expresada como fri, es el


cociente entre su frecuencia absoluta y la suma de todas las
frecuencias absolutas.

La suma de todas las frecuencias es igual al número de


elementos de la distribución.

Frecuencia acumulada:

La frecuencia acumulada de una clase y se la denota como fai, a


la suma de su frecuencia absoluta y la suma de las frecuencias
absolutas de los valores que le anteceden.

Frecuencia desacumulada:

La frecuencia desacumulada de un valor, y se denota f ds de una


distribución, a la diferencia entre el número total de
observaciones y su frecuencia acumulada.
Para un valor cualquiera, i, se verifica:

fdsi = n - fai

8
Valores de dispersión
Frecuentemente, los valores de posición central no suelen ser
suficientes para determinar las características de una
distribución, ya que podemos tener distribuciones que
presenten la misma media, la misma moda y la misma mediana,
pero aun así sean diferentes. Podemos tener también
distribuciones de igual número de elementos o conformadas por
los mismos elementos, que, no obstante, son distintas.
Deberíamos, entonces, considerar valores que nos determinen
cuán dispersas están dichas distribuciones. Estos valores se
denominan valores de dispersión.

Amplitud o rango

Es la diferencia entre el valor más grande y el más pequeño del


conjunto de datos.

Rango = Xmayor - Xmenor.

El rango no toma en cuenta cómo se distribuyen los datos entre


el valor más grande y el más pequeño.

Desvío medio

Lo podemos expresar como la media aritmética de los valores


absolutos de los desvíos respecto a la media del agrupamiento
de datos.
Se simboliza por las siglas DM y se calcula como sigue:

∑|𝑥𝑚𝑖 − 𝜇|. 𝑓𝑖
𝐷𝑀 = .
𝑁

Varianza

Es la sumatoria de los cuadrados de las diferencias con respecto


a la media de la población relevada.
Se simboliza por Var(x) o σ2 y se calcula de la siguiente manera:

∑(𝑥 − 𝜇)2
𝜎2 = .
𝑁

9
Desvío estándar

Es la raíz cuadrada de la varianza; por lo tanto, es la raíz cuadrada


de la sumatoria de los cuadrados de las diferencias con respecto
a la media de la población relevada. Su mayor ventaja es que
permite trabajar con las unidades lineales y no al cuadrado como
ocurre con la varianza.
Se simboliza por σ(x) y se calcula así:

∑(𝑥 − 𝜇)2
𝜎(𝑥) = √𝜎 2 = √ .
𝑁

Coeficiente de variación

Es una medida de dispersión relativa que relaciona la desviación


estándar con la media, expresándola como un por ciento de ella.
Es un porcentaje, que se denota mediante el símbolo CV e indica
la dispersión de los datos con respecto a la media aritmética.
Se simboliza por CV y se calcula:

𝜎
𝐶𝑉 = 𝜇 . 100.

Cuartiles y percentiles
Un fractil es una fracción o proporción dada de los datos de una
distribución de frecuencias. Estos fractiles toman
denominaciones según el número de partes iguales en que se
subdividen los datos, como por ejemplo, cuando se dividen en
10 partes iguales, cada una de ellas es un decil.Los cuartiles son
aquellos que surgen de dividir los datos en cuatro partes iguales,
es decir que cada una es un cuartil. De la misma manera, los
percentiles son los que surgen de dividir al agrupamiento de
datos en 100 partes iguales y cada una de ellas es un percentil.

Regla empírica

10
La mediana y la media son iguales en conjuntos de datos
simétricos, donde los valores tienden a agruparse alrededor de
ella y así generan una distribución con forma de campana. En las
distribuciones de este tipo, se puede utilizar la regla empírica,
que observamos a continuación, para calcular su dispersión.

 Empíricamente el 68 % de la población se encuentra a una


distancia de ±1 desvío estándar respecto de la media.
 Del mismo modo, el 95 % de la población se encuentra a una
distancia de ±2 desvíos estándar respecto de la media.
 De la misma manera anterior, se comprobó que el 99,7 % de
la población se encuentra a una distancia de ±3 desvíos
estándar de la media de distribución.

Resolución de ejercicios

1. Dados los siguientes datos de cantidad de formularios


utilizados por horas en una oficina: 8 - 6 - 8 - 7 - 9,

a. Calcula la media, la mediana y la moda;


b. Calcula el rango, la varianza, la desviación estándar y el
coeficiente de variación;
c. Describe la forma del conjunto de datos.

2. Una oficina de reclamos, ubicada en una zona comercial de


la ciudad, desarrolló un proceso para atender a sus clientes
desde la hora 10:00 a. m. hasta la 1:00 p. m. Se registra el
tiempo de demora, en minutos (definido como el tiempo
transcurrido desde que el cliente saca su turno en la máquina
situada al ingreso de la oficina hasta que es llamado por la
pantalla electrónica), de todos los clientes durante ese
horario por una semana. Se obtiene una muestra aleatoria
de 15 clientes y se tienen los siguientes resultados:

5,21; 5,55; 3,02; 5,13; 4,77; 2,34; 3,54;


5,20; 4,50; 5,10; 0,38; 5,12; 6,46; 6,19; 4,79.

a. Define los intervalos de clases y la marca de cada una de ellas.


b. Calcula la media, la mediana, el primer cuartil y el tercero.
c. Calcula la varianza, la desviación estándar, el rango y el
coeficiente de variación.
d. Realiza la tabla de frecuencias absolutas, relativas,
acumuladas y desacumuladas.

11
e. Grafica las frecuencias calculadas anteriormente y encuentra
los polígonos de frecuencia correspondientes.

12
Bibliografía de referencias
Levin, R. y Rubin, D. (1996). Estadística para administradores. México
DF: Pearson Educación.

13