Está en la página 1de 10

Medidas descriptivas de las distribuciones de frecuencia.

Se ha visto que los mtodos grficos son extremadamente tiles para lograr una descripcin de
los datos y es por esto que las representaciones resultantes de las distribuciones de frecuencia nos
permitieron discernir las tendencias y patrones de los datos; sin embargo, los mtodos grficos
presentan limitaciones cuando se desea tener una mayor exactitud, motivo por el cual si
necesitamos de medidas ms exactas de un conjunto de datos, recurrimos a nmeros
individuales, llamados estadsticos resumidos. Mediante estos estadsticos podemos describir
ciertas caractersticas del conjunto de datos los cuales nos permitirn tomar decisiones ms
rpidas y satisfactorias.
Medidas de tendencia central
Promedio
Es un valor tpico o representativo de un conjunto de datos. Como tales valores tienden a situarse
en el centro del conjunto de datos ordenados segn su magnitud, los promedios se conocen
tambin como medidas de centralizacin o de tendencia central.
Entre las medidas de tendencia central tenemos:
La Media Aritmtica
Es aquella que representa el promedio aritmtico de un conjunto de observaciones, la misma
acta como punto de equilibrio, de manera que las observaciones menores equilibran a las
mayores.
Notacin

'

poblacin una para sea cuando


muestra una para sea cuando x

Frmulas:
Datos no agrupados Datos agrupados
N
i
x

n
x ... x x x
n
n
i
x
x
N
1 i
n
3 2 1 1 i

+ + + +

g
*f *f
g
1 1 2 3 3
2 g
i 1
M * f M M *f M ... M *f
i i
x
f n n
i

+ + + +


M
i
son las marcas de clase
f
i
son las respectivas frecuencias absolutas
Para los datos agrupados, lo que se calcula es una estimacin del valor de la media ya que al
agrupar por clases no conocemos los valores individuales de cada observacin, slo que para
facilitar los clculos se ha de renunciar a la exactitud.
Ejemplos:
1) Calcular la media aritmtica de 8, 3, 5, 12, 10:

8 3 5 12 10
x 7, 6
5
+ + + +

2) Un investigador que deseaba determinar cmo varian las estaturas de las obreras de
una empresa y toma una muestra de 50 mujeres para registrar luego sus estaturas en
pulgadas, obteniendo la siguiente tabla:
l
i
- l
s
f
i
M
i
F
i
h
i
H
i
[53 56) 2 54,5 2 0,0400 0,0400
[56 59) 5 57,5 7 0,1000 0,1400
[59 62) 9 60,5 16 0,1800 0,3200
[62 65) 15 63,5 31 0,3000 0,6200
[65 68) 12 66,5 43 0,2400 0,8600
[68 71) 5 69,5 48 0,1000 0,9600
[71 74) 2 72,5 50 0,0400 1,0000
Para calcular la media, debemos agregar una nueva columna:
l
i
- l
s
f
i
M
i
M
i
* f
i
[53 56) 2 54,5 109,0
[56 59) 5 57,5 287,5
[59 62) 9 60,5 544,5
[62 65) 15 63,5 952,5
[65 68) 12 66,5 798,0
[68 71) 5 69,5 347,5
[71 74) 2 72,5 145,0
= 3184
68 , 63
50
3184
x
pulgadas
Interpretacin: en promedio, las obreras presentaron una estatura de 63,68 pulgadas.
La Media Aritmtica Ponderada
A veces se asocia a los nmeros de un conjunto de datos, ciertos factores o pesos y es por ello
que la media aritmtica ponderada es un promedio que se calcula a fin de tener en cuenta la
importancia de cada valor para el total global.
Notacin:
w x
Frmula:
k 3 2
k k 3 3 2 2
k
1 i
i
k
1 i
i i
w
w ... w w w
x * w ... x * w x * w x * w
w
x * w
x
1
1 1
+ + + +
+ + + +

Al calcular la media aritmtica a partir de datos agrupados, en realidad obtuvimos la media


aritmtica ponderada utilizando las marcas de clase para los valores de x y las frecuencias de
cada clase como los pesos, en ese caso f
i
= w
i
.
Ejemplo:
Si un examen final de curso se valora como 3 veces los exmenes parciales y un estudiante tiene
una nota de examen final de 85 y notas de exmenes parciales de 70 y 90, calcular su nota final.
83
3 1 1
85 * 3 90 * 1 70 * 1
xw
+ +
+ +

puntos.
Observaciones sobre la media aritmtica:
Es una medida que toma en consideracin todos los valores de la distribucin. Esto es
positivo, pero por la misma razn es muy sensible a la presentacin de observaciones
extremas o anmalas que hacen que la media se desplace hacia ellas. En consecuencia no
es recomendable usar la media como medida de tendencia central en los casos en el cual
el conjunto de datos no es homogneo, pues la cantidad obtenida no es representativa del
total de los datos.
Tiene la ventaja de que es nica y siempre se puede calcular (si no hay intervalos
abiertos).
El valor de la media aritmtica puede no coincidir con los valores de la variable.
Algunas propiedades de la media aritmtica:
La suma algebraica de las desviaciones de un conjunto de nmeros con respecto a su
media aritmtica es cero.
( ) 0 x x
k
1 i
i

La media aritmtica de una constante es igual a la constante.


La media de la suma de dos o ms variables es igual a la suma de las medias de dichas
variables.

i
y
i
x
i
y
i
x x x x +

,
_

+
Si a cada valor de la serie se le agrega una constante, la media de la nueva serie es igual a
la media de la serie original ms la constante. Igual sucede si a la media se le resta una
constante.

k x x k x x
i
x k
i
x
i
x k
i
x +

,
_

,
_

+
Media de medias: Si f
1
nmeros tienen de media m
1
, f
2
nmeros tiene de media m
2
,..., f
k
nmeros tienen de media m
k
, entonces la media de todos los nmeros es:

k 3 2 1
k k 3 3 2 2 1 1
w
f ... f f f
m * f ... m * f m * f m * f
x
+ + + +
+ + + +


es, decir, la media aritmtica ponderada de todas las medias.

La Mediana
Es el punto medio de un conjunto de datos representando el valor ms central en dicho conjunto,
por lo que deja por encima y por debajo la misma cantidad de datos (una vez que estos han sido
ordenados). Geomtricamente es el valor de x que corresponde a la vertical que divide al
histograma en dos partes de igual rea.
Notacin: Med
Frmulas:
Datos no agrupados Datos agrupados
El valor de la mediana puede coincidir o no
con un valor de la serie, todo depende si el
nmero de datos es par o impar.
Los pasos son:
1. Organizar por orden ascendente a los
datos.
2. Utilizar la frmula de posicionamiento
de punto:
2
1 n +
para localizar el lugar
que ocupa el valor de la mediana en el
arreglo ordenado.
3. Si el conjunto tiene un nmero impar
de elementos, el de la mitad ser la
mediana, si contiene un nmero par de
elementos, la mediana ser el promedio
aritmtico de los dos que se hallan en
la mitad.
a *
f
F
2
n
l Med
med
a
i

+
en donde:
l
i
es el lmite inferior.
F
a
es la frecuencia acumulada anterior.
f
med
es la frecuencia absoluta del intervalo de la
mediana.
a es la amplitud.
Los pasos son:
1. Calcular
2
n
2. Localizar ese valor en F
i
, si no est,
pasar al inmediato superior. Con esto se
halla el intervalo de la mediana.
3. Aplicar la frmula sustituyendo los
valores correspondientes.
Ejemplos:
1) Datos no agrupados:
Sean los nmeros: 3, 4, 4, 5, 6, 8, 8, 8, 10. Usando la frmula de posicionamiento, el
valor ocupado por la posicin
5
2
1 9

+
sera a mediana, entonces la respuesta es 6.
Sean los nmeros: 5, 5, 7, 9, 11, 12, 15, 18. Usando la frmula de posicionamiento, el
valor
5 , 4
2
1 8

+
dara la posicin de la mediana; como no hay esa posicin, buscamos el
promedio de los nmeros que ocupan los puestos 4 y 5, dando como resultado que la
mediana ser 10
2) Datos agrupados:
Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban las
estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para
registrar luego sus estaturas en pulgadas, se haba obtenido la siguiente tabla:
l
i
- l
i+1
f
i
M
i
F
i
% h
i
H
i
[53 56) 2 54,5 2 4 0,0400
[56 59) 5 57,5 7 10 0,1400
[59 62) 9 60,5 16 18 0,3200
[62 65) 15 63,5 31 30 0,6200
[65 68) 12 66,5 43 24 0,8600
[68 71) 5 69,5 48 10 0,9600
[71 74) 2 72,5 50 4 1,0000
Paso 1:
25
2
50
2
n


Paso 2:
Como 25 no aparece en F
i
, pasamos al inmediato superior: 31 y lo tomamos como clase
medianal
Paso 3:

+ 3 *
15
16 25
62 Med
63,8 pulgadas
Interpretacin: El 50% de las obreras tienen una estatura igual o inferior a 63,8 pulgadas
aproximadamente.
Observaciones sobre la mediana:
Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones
extremas, ya que no depende de los valores que toma la variable, sino el orden de los
mismos. Por ello, es adecuado su uso en distribuciones que presentan observaciones
extremadamente grandes o pequeas.
Puede ser calculada an a partir de datos agrupados con clases abiertas.
Puede usarse con datos cualitativos.
No utiliza toda la informacin de los datos (slo los valores centrales).
Su mayor defecto es que no se ajusta fcilmente al clculo algebraico, lo que hace que
sea difcil de utilizar en otras reas, como en la inferencia.
La Moda
Es el valor de los datos que se presenta con ms frecuencia, por lo que representa el punto ms
alto en la curva de distribucin de un conjunto de datos.
Notacin: Mo
Frmulas:
Datos no agrupados Datos agrupados
No hay frmulas, slo ver cul valor o
elemento es el que ms se repite.
a l Mo *
2

i
+
+
l
i
es el lmite inferior del intervalo de mayor
frecuencia.

1
es el valor que se obtiene a restar la f
modal
con
la frecuencia de la clase anterior.

2
es el valor que se obtiene a restar la f
modal
con
la frecuencia de la clase nsiguiente.
a es la amplitud.
Los pasos para calcular la moda con datos agrupados seran:
1. Ubicar la mayor f
i
para hallar el intervalo modal
2. Aplicar la frmula
Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban las estaturas de
las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para registrar luego sus
estaturas en pulgadas, se haba obtenido la siguiente tabla:
l
i
- l
s
f
i
M
i
F
i
h
i
H
i
[53 56) 2 54,5 2 0,0400 0,0400
[56 59) 5 57,5 7 0,1000 0,1400
[59 62) 9 60,5 16 0,1800 0,3200
[62 65) 15 63,5 31 0,3000 0,6200
[65 68) 12 66,5 43 0,2400 0,8600
[68 71) 5 69,5 48 0,1000 0,9600
[71 74) 2 72,5 50 0,0400 1,0000
Para calcular la moda:
1. Ubicamos la mayor frecuencia absoluta, en este caso es 15 y el mismo pertenece a la
cuarta clase.
2. Aplicamos la frmula:
( ) ( )

+

+ 3 *
12 15 9 15
9 15
62 Mo
64 pulgadas
Interpretacin: la mayora de las obreras tienen una estatura de 64 pulgadas
aproximadamente.
Observaciones sobre la moda:
Se puede usar para datos cualitativos y cuantitativos.
Se puede emplear aunque existan clases abiertas en la distribucin.
Puede no ser nica, por ello, cuando los conjuntos de datos contiene 2, 3, o ms modas,
son difciles de interpretar.
Puede que una distribucin no tenga moda.
El intervalo modal es aquel que posee una barra en el histograma con mayor altura,
geomtricamente, se calcula segn la grfica:
Medidas de Posicin: Cuantiles
Si una serie de datos se colocan en orden de magnitud, el valor medio que divide al conjunto de
datos en dos partes iguales es la mediana, por extensin de esta idea se puede pensar en aquellos
valores que dividen a los datos en cuatro partes iguales, en cien partes iguales, etc. El nombre
genrico es el de cuantil y el mismo se define como el valor bajo el cual se encuentra una
determinada proporcin de los valores de una distribucin.
Dentro de las medidas de los cuantiles tenemos:
Deciles:
Son aquellos valores que dividen en diez partes iguales a un conjunto de datos ordenados. Se
representan por D
1
, D
2
, D
3
, ....D
9
. De esta manera tenemos que:
- D
1
(primer decil) es el valor por debajo del cual se encuentran como mximo el 10% de las
observaciones, mientras que el 90% restante se sitan por encima de l.
- D
2
(segundo decil) es el valor por debajo del cual se encuentran como mximo el 20% de las
observaciones, mientras que el 80% restante se sitan por encima de l.
Y as sucesivamente.
Cuartiles:
Son aquellos valores que dividen en cuatro partes iguales a un conjunto de datos ordenados. Se
representan por Q
1
, Q
2
, y Q
3
. De esta manera tenemos que:
- Q
1
(primer cuartil) es el valor por debajo del cual se sitan a lo sumo el 25% de las
observaciones y por encima de ste el 75% restante.
- Q
2
(segundo cuartil) es el valor por debajo de cual se sitan a lo sumo el 50% de las
observaciones y por encima de ste el 50% restante. Est justo en el centro y corresponde a la
mediana
- Q
3
(tercer cuartil) es el valor por debajo del cual se sitan a lo sumo el 75% de las
observaciones y por encima de ste el 25% restante
Observacin: Hay algunas variaciones en las convenciones de clculo de cuartiles ya que los
valores reales calculados pueden variar un poco dependiendo de la convencin seguida. Sin
embargo, el objetivo de todos los procedimientos de clculo de cuartiles es dividir los datos en
aproximadamente cuatro partes iguales.
Percentiles:
Son aquellos valores que dividen a un conjunto de datos ordenados en cien partes iguales. Se
representan por P
1
, P
2
.... , P
99
. De esta manera tenemos que:
- P
1
es el valor por debajo del cual se sitan a lo sumo el 1% de los datos y por encima de l
tenemos el 99% restante.
- P
2
es el valor por debajo del cual se sitan a lo sumo el 2% de los datos y por encima de l
tenemos el 98% restante. Y as sucesivamente..
En forma genrica el p-simo percentil es un valor tal que por lo menos un p por ciento de los
elementos tiene dicho valor o menos y, al menos, un (100-p) por ciento de los elementos tiene
ese valor o ms.
Es conveniente tomar en cuenta que: D
1
= P
10
, D
2
= P
20
, Q
1
= P
25
, y as sucesivamente.
Dependiendo de si trabajamos con datos agrupados o no tendremos los siguientes pasos para el
clculo de los percentiles:
* Para datos no agrupados:
1. Ordenar los datos de manera ascendente.
2. Calcular el ndice:
n *
100
P
i
,
_

- Si i es entero, el p-simo percentil es el promedio de los valores de los datos


ubicados en los lugares i e i +1.
- Si i no es entero, se redondea al siguiente entero. El valor entero inmediato
mayor que i indica la posicin del p-simo percentil.
Ejemplo:
Determinar el P
50
y el P
85
de los datos siguientes:
2350, 2450, 2550, 2380, 2255, 2210, 2390, 2630, 2440, 2825, 2420, 2380.
1. Ordenamos de manera ascendente:
2210, 2255, 2350, 2380, 2380, 2390, 2420, 2440, 2450, 2550, 2630, 2825.
Para P
50
:
2. Calculamos i:
6 12 *
100
50
i
,
_

Como i es entero, P
50
es el promedio de los 6 y 7, luego nos dara:

2405
2
2420 2390
P
50

+

Para P
85
:
2. Calculamos i:
2 , 0 1 12 *
100
85
i
,
_

Como i no es entero, redondeamos. El lugar del P


85
es el siguiente entero mayor que
10,2 es decir, el lugar 11. Esto nos dara que P
85
= 2630.
* Para datos agrupados:
a. Se aplica la frmula:
a
f
F
100
p * n
l P *
p
a
i p

+
b. Para aplicar la frmula, los pasos son:
1. Ubicar el resultado de
100
p * n
en F
i
2. Si no est el valor, se pasa al inmediato superior.
3. Al ubicar el valor de F
i
determinamos el intervalo de donde se obtendrn los
datos para sustituir en la ecuacin.

Por medio de los percentiles, se halla el valor de la variable para un porcentaje dado.
Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban las estaturas de
las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para registrar luego sus
estaturas en pulgadas, se haba obtenido la siguiente tabla:
l
i
- ls f
i Mi
F
i
h
i
H
i
[53 56) 2 54,5 2 0,0400 0,0400
[56 59) 5 57,5 7 0,1000 0,1400
[59 62) 9 60,5 16 0,1800 0,3200
[62 65) 15 63,5 31 0,3000 0,6200
[65 68) 12 66,5 43 0,2400 0,8600
[68 71) 5 69,5 48 0,1000 0,9600
[71 74) 2 72,5 50 0,0400 1,0000
P
15
= ?
1.
5 , 7
100
15 * 50
100
p * n

2.
17 , 59 3 *
9
7 5 , 7
59 P
15

+
pulgadas
Interpretacin: el 15% de las obreras tienen una estatura de 59,17 pulgadas o menos.
Q
1
= ?
Q
1
= P
25
1.
5 , 12
100
25 * 50
100
p * n

2.
83 , 60 3 *
9
7 5 , 12
59 P
25

+
pulgadas
Interpretacin: el 25% de las obreras tienen una estatura de 60,83 pulgadas o menos.
D
3
= ?
D
3
= P
30
1.
15
100
30 * 50
100
p * n

2.
67 , 61 3 *
9
7 15
59 P
30

+
pulgadas
Interpretacin: el 30% de las obreras tienen una estatura de 61,67 pulgadas o menos.
P
75
= ?
1.
5 , 37
100
75 * 50
100
p * n

2.
63 , 66 3 *
12
31 5 , 37
6 P
75

+
pulgadas
Interpretacin: el 75% de las obreras tienen una estatura de 66,63 pulgadas o menos.
Rango Percentil
Es una expresin mediante la cual podemos hallar el porcentaje, dado un valor de la variable.
Dicha expresin se obtiene al despejar p en la frmula de percentiles para datos agrupados, el
proceso para hallar el rango percentil es:
1. Ubicar el valor de la variable que nos dan, en el intervalo que le corresponda.
2. Una vez ubicado, podemos determinar l
i
, f
i
, etc, para sustituir en la frmula:
( )
100 *
n
F
a
f * l P
p
a
i i p
+


Del ejemplo inicial sobre el investigador que deseaba determinar cmo variaban las estaturas de
las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para registrar luego sus
estaturas en pulgadas, se haba obtenido la siguiente tabla:
l
i
- l
s
f
i
M
i
F
i
h
i
H
i
[53 56) 2 54,5 2 0,0400 0,0400
[56 59) 5 57,5 7 0,1000 0,1400
[59 62) 9 60,5 16 0,1800 0,3200
[62 65) 15 63,5 31 0,3000 0,6200
[65 68) 12 66,5 43 0,2400 0,8600
[68 71) 5 69,5 48 0,1000 0,9600
[71 74) 2 72,5 50 0,0400 1,0000
Hallar el porcentaje de obreras cuyas estaturas son iguales o inferiores a 67 pulgadas:
1. Ubicamos el valor de 67 en la tabla y vemos que corresponde a la 5
ta
clase.
2. Sustituimos los valores:

( )
78% 100 *
50
1 3
3
12 * 5 6 7 6
p
+

Interpretacin: el 78% de las obreras tienen estaturas iguales o inferiores a 67 pulgadas.

También podría gustarte