Está en la página 1de 13

TUTOR: PEDRO AGUSTIN DUARTE ACOSTA

Medidas descriptivas de las distribuciones de frecuencia.

Se ha visto que los métodos gráficos son extremadamente útiles para lograr una
descripción de los datos y es por esto que las representaciones resultantes de las
distribuciones de frecuencia nos permitieron discernir las tendencias y patrones de los
datos; sin embargo, los métodos gráficos presentan limitaciones cuando se desea tener
una mayor exactitud, motivo por el cual si necesitamos de medidas más exactas de un
conjunto de datos, recurrimos a números individuales, llamados estadísticos resumidos.
Mediante estos estadísticos podemos describir ciertas características del conjunto de
datos los cuales nos permitirán tomar decisiones más rápidas y satisfactorias.
Cuatro de estas características son:
1) Medidas de tendencia central
2) Medidas de dispersión.
3) Medidas de sesgo.
4) Medidas de curtosis.


Medidas de tendencia central

Promedio
Es un valor típico o representativo de un conjunto de datos. Como tales valores tienden a
situarse en el centro del conjunto de datos ordenados según su magnitud, los promedios
se conocen también como medidas de centralización o de tendencia central.
Entre las medidas de tendencia central tenemos:


 La Media Aritmética
Es aquella que representa el promedio aritmético de un conjunto de observaciones, la
misma actúa como punto de equilibrio, de manera que las observaciones menores
equilibran a las mayores.
Notación
¹
´
¦
población una para sea cuando
muestra una para sea cuando x
µ

Fórmulas:
Datos no agrupados Datos agrupados
N
i
x
μ
n
x ... x x x
n
n
i
x
x
N
1 i
n
3 2 1 1 i
¿
=
+ + + +
=
¿
=
=
=

n
f * x ... x f * x x
n
i
f
i
f *
i
x
x
g
g
3
f *
3
2
2
1
f *
1
g
1 i
+ + + +
=
¿ =
¿
=
=

x
i
son las marcas de clase
f
i
son las respectivas frecuencias absolutas
Para los datos agrupados, lo que se calcula es una estimación del valor de la media ya que
al agrupar por clases no conocemos los valores individuales de cada observación, sólo
que para facilitar los cálculos se ha de renunciar a la exactitud.

Ejemplos:
1) Calcular la media aritmética de 8, 3, 5, 12, 10:
6 , 7
5
10 12 5 3 8
=
+ + + +
= µ
2) Del ejemplo inicial sobre el investigador que deseaba determinar
cómo variaban las estaturas de las obreras de una empresa y el
cual tomaba una muestra de 50 mujeres para registrar luego sus
estaturas en pulgadas, se había obtenido la siguiente tabla:
l
i
- l
i+1
f
i
x
i
F
i
h
i
% h
i
H
i
% H
i

[53 – 56) 2 54,5 2 0,0400 4 0,0400 4
[56 – 59) 5 57,5 7 0,1000 10 0,1400 14
[59 – 62) 9 60,5 16 0,1800 18 0,3200 32
[62 – 65) 15 63,5 31 0,3000 30 0,6200 62
[65 – 68) 12 66,5 43 0,2400 24 0,8600 86
[68 – 71) 5 69,5 48 0,1000 10 0,9600 96
[71 – 74) 2 72,5 50 0,0400 4 1,0000 100






Para calcular la media, debemos agregar una nueva columna:
l
i
- l
i+1
f
i
x
i
x
i
* f
i
[53 – 56) 2 54,5 109,0
[56 – 59) 5 57,5 287,5
[59 – 62) 9 60,5 544,5
[62 – 65) 15 63,5 952,5
[65 – 68) 12 66,5 798,0
[68 – 71) 5 69,5 347,5
[71 – 74) 2 72,5 145,0
E = 3184
68 , 63
50
3184
x = = pulgadas
Interpretación: en promedio, las obreras presentaron una estatura
de 63,68 pulgadas.


 La Media Aritmética Ponderada
A veces se asocia a los números de un conjunto de datos, ciertos factores o pesos y es por
ello que la media aritmética ponderada es un promedio que se calcula a fin de tener en
cuenta la importancia de cada valor para el total global.
Notación: w x
Fórmula:
k 3 2
k k 3 3 2 2
k
1 i
i
k
1 i
i i
w
w ... w w w
x * w ... x * w x * w x * w
w
x * w
x
1
1 1
+ + + +
+ + + +
= =
¿
¿
=
=

Al calcular la media aritmética a partir de datos agrupados, en realidad
obtuvimos la media aritmética ponderada utilizando las marcas de clase para
los valores de “x” y las frecuencias de cada clase como los pesos, en ese caso
E f
i
= E w
i
.
Ejemplo:
Si un examen final de curso se valora como 3 veces los exámenes parciales y
un estudiante tiene una nota de examen final de 85 y notas de exámenes
parciales de 70 y 90, calcular su nota final.
83
3 1 1
85 * 3 90 * 1 70 * 1
xw =
+ +
+ +
= puntos.

Observaciones sobre la media aritmética:
 Es una medida que toma en consideración todos los valores de la
distribución. Esto es positivo, pero por la misma razón es muy sensible
a la presentación de observaciones extremas o anómalas que hacen
que la media se desplace hacia ellas. En consecuencia no es
recomendable usar la media como medida de tendencia central en los
casos en el cual el conjunto de datos no es homogéneo, pues la
cantidad obtenida no es representativa del total de los datos.
 Tiene la ventaja de que es única y siempre se puede calcular (si no
hay intervalos abiertos).
 El valor de la media aritmética puede no coincidir con los valores de la
variable.

Algunas propiedades de la media aritmética:
 La suma algebraica de las desviaciones de un conjunto de números
con respecto a su media aritmética es cero.
( ) 0 x x
k
1 i
i
= ÷
¿
=

 La media aritmética de una constante es igual a la constante.
 La media de la suma de dos o más variables es igual a la suma de las
medias de dichas variables.

i
y
i
x
i
y
i
x x x x + =
|
.
|

\
|
+
 Si a cada valor de la serie se le agrega una constante, la media de la
nueva serie es igual a la media de la serie original más la constante.
Igual sucede si a la media se le resta una constante.
k x x k x x
i
x k
i
x
i
x k
i
x ÷ = + =
|
.
|

\
|
|
.
|

\
|
÷ +
 Media de medias: Si f
1
números tienen de media m
1
, f
2
números tiene
de media m
2
,..., f
k
números tienen de media m
k
, entonces la media
de todos los números es:

k 3 2 1
k k 3 3 2 2 1 1
w
f ... f f f
m * f ... m * f m * f m * f
x
+ + + +
+ + + +
=
es, decir, la media aritmética ponderada de todas las medias.


 La Mediana
Es el punto medio de un conjunto de datos representando el valor más central en dicho
conjunto, por lo que deja por encima y por debajo la misma cantidad de datos (una vez
que estos han sido ordenados). Geométricamente es el valor de “x” que corresponde a la
vertical que divide al histograma en dos partes de igual área.
Notación: Med
Fórmulas:
Datos no agrupados Datos agrupados
El valor de la mediana puede coincidir o no
con un valor de la serie, todo depende si el
número de datos es par o impar.
Los pasos son:
1. Organizar por orden
ascendente a los datos.
2. Utilizar la fórmula de
posicionamiento de punto:
2
1 n +
para localizar el lugar
que ocupa el valor de la
mediana en el arreglo
ordenado.
3. Si el conjunto tiene un número
impar de elementos, el de la mitad
será la mediana, si contiene un
número par de elementos, la
mediana será el promedio
aritmético de los dos que se hallan
en la mitad.
a *
f
F
2
n
l Med
med
a
i
÷
+ =
en donde:
l
i
es el límite inferior.
F
a
es la frecuencia acumulada anterior.
f
med
es la frecuencia absoluta del intervalo
de la mediana.
a es la amplitud.

Los pasos son:
1. Calcular
2
n

2. Localizar ese valor en F
i
, si no está,
pasar al inmediato superior. Con
esto se halla el intervalo de la
mediana.
3. Aplicar la fórmula sustituyendo los
valores correspondientes.

Ejemplos:
1) Datos no agrupados:
Sean los números: 3, 4, 4, 5, 6, 8, 8, 8, 10. Usando la fórmula de
posicionamiento, el valor ocupado por la posición 5
2
1 9
=
+
sería a
mediana, entonces la respuesta es 6.
Sean los números: 5, 5, 7, 9, 11, 12, 15, 18. Usando la fórmula de
posicionamiento, el valor 5 , 4
2
1 8
=
+
daría la posición de la mediana;
como no hay esa posición, buscamos el promedio de los números que
ocupan los puestos 4 y 5, dando como resultado que la mediana será
10

2) Datos agrupados:
Del ejemplo inicial sobre el investigador que deseaba determinar cómo variaban
las estaturas de las obreras de una empresa y el cual tomaba una muestra de 50
mujeres para registrar luego sus estaturas en pulgadas, se había obtenido la
siguiente tabla:

l
i
- l
i+1
f
i
x
i
F
i
h
i
% h
i
H
i
% H
i

[53 – 56) 2 54,5 2 0,0400 4 0,0400 4
[56 – 59) 5 57,5 7 0,1000 10 0,1400 14
[59 – 62) 9 60,5 16 0,1800 18 0,3200 32
[62 – 65) 15 63,5 31 0,3000 30 0,6200 62
[65 – 68) 12 66,5 43 0,2400 24 0,8600 86
[68 – 71) 5 69,5 48 0,1000 10 0,9600 96
[71 – 74) 2 72,5 50 0,0400 4 1,0000 100

Paso 1:
25
2
50
2
n
= =

Paso 2:
Como 25 no aparece en F
i
, pasamos al inmediato superior: 31.

Paso 3:
=
÷
+ = 3 *
15
16 25
62 Med 63,8 pulgadas
Interpretación: El 50% de las obreras tienen una estatura igual o
inferior a 63,8 pulgadas aproximadamente.

Observaciones sobre la mediana:
 Como medida descriptiva, tiene la ventaja de no estar afectada por las
observaciones extremas, ya que no depende de los valores que toma
la variable, sino el orden de los mismos. Por ello, es adecuado su uso
en distribuciones que presentan observaciones extremadamente
grandes o pequeñas.
 Puede ser calculada aún a partir de datos agrupados con clases
abiertas.
 Puede usarse con datos cualitativos.
 No utiliza toda la información de los datos (sólo los valores centrales).
 Su mayor defecto es que no se ajusta fácilmente al cálculo algebraico,
lo que hace que sea difícil de utilizar en otras áreas, como en la
inferencia.


 La Moda
Es el valor de los datos que se presenta con más frecuencia, por lo que representa el punto
más alto en la curva de distribución de un conjunto de datos.
Notación: Mo
Fórmulas:
Datos no agrupados Datos agrupados
No hay fórmulas, sólo ver cuál valor
o elemento es el que más se repite.
a l Mo *
2
Δ
1
Δ
1
Δ
i
+
+ =
l
i
es el límite inferior (si se trabajan
con límites imaginarios y reales, se
toman los reales).
A
1
es el valor que se obtiene a restar
la f
modal
con la frecuencia anterior.
A
2
es el valor que se obtiene a restar
la f
modal
con la frecuencia siguiente.
a es la amplitud.

Los pasos para calcular la moda con datos agrupados serían:
1. Ubicar la mayor f
i
para hallar el intervalo modal
2. Aplicar la fórmula







Del ejemplo inicial sobre el investigador que deseaba determinar cómo variaban las
estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para
registrar luego sus estaturas en pulgadas, se había obtenido la siguiente tabla:

l
i
- l
i+1
f
i
x
i
F
i
h
i
% h
i
H
i
% H
i

[53 – 56) 2 54,5 2 0,0400 4 0,0400 4
[56 – 59) 5 57,5 7 0,1000 10 0,1400 14
[59 – 62) 9 60,5 16 0,1800 18 0,3200 32
[62 – 65) 15 63,5 31 0,3000 30 0,6200 62
[65 – 68) 12 66,5 43 0,2400 24 0,8600 86
[68 – 71) 5 69,5 48 0,1000 10 0,9600 96
[71 – 74) 2 72,5 50 0,0400 4 1,0000 100
Para calcular la moda:
1. Ubicamos la mayor frecuencia absoluta, en este caso es 15 y el mismo
pertenece a la cuarta clase.
2. Aplicamos la fórmula:
( ) ( )
=
÷ + ÷
÷
+ = 3 *
12 15 9 15
9 15
62 Mo 64 pulgadas
Interpretación: la mayoría de las obreras tienen una estatura de 64
pulgadas aproximadamente.

Observaciones sobre la moda:
 Se puede usar para datos cualitativos y cuantitativos.
 Se puede emplear aunque existan clases abiertas en la distribución.
 Puede no ser única, por ello, cuando los conjuntos de datos contiene
2, 3, o más modas, son difíciles de interpretar.
 Puede que una distribución no tenga moda.
 El intervalo modal es aquel que posee una barra en el histograma con
mayor altura geométricamente, se calcula según la gráfica:




Cuantiles

Si una serie de datos se colocan en orden de magnitud, el valor medio que divide al
conjunto de datos en dos partes iguales es la mediana, por extensión de esta idea se puede
pensar en aquellos valores que dividen a los datos en cuatro partes iguales, en cien partes
iguales, etc. El nombre genérico es el de cuantil y el mismo se define como el valor bajo
el cual se encuentra una determinada proporción de los valores de una distribución.
Dentro de las medidas de los cuantiles tenemos:

 Deciles:
Son aquellos valores que dividen en diez partes iguales a un conjunto de
datos ordenados. Se representan por D
1
, D
2
, D
3
, ....D
9
. De esta manera
tenemos que:
- D
1
(primer decil) es el valor por debajo del cual se encuentran como
máximo el 10% de las observaciones, mientras que el 90% restante se
sitúan por encima de él.
- D
2
(segundo decil) es el valor por debajo del cual se encuentran como máximo el 20%
de las observaciones, mientras que el 80% restante se sitúan por encima de él.
Y así sucesivamente.

 Cuartiles:
Son aquellos valores que dividen en cuatro partes iguales a un conjunto de
datos ordenados. Se representan por Q
1
, Q
2
, y Q
3
. De esta manera tenemos
que:
- Q
1
(primer cuartil) es el valor por debajo del cual se sitúan a lo sumo el
25% de las observaciones y por encima de éste el 75% restante.
- Q
2
(segundo cuartil) es el valor por debajo de cual se sitúan a lo sumo el
50% de las observaciones y por encima de éste el 50% restante. Está justo
en el centro y corresponde a la mediana
- Q
3
(tercer cuartil) es el valor por debajo del cual se sitúan a lo sumo el 75%
de las observaciones y por encima de éste el 25% restante
Observación: Hay algunas variaciones en las convenciones de cálculo de cuartiles ya que
los valores reales calculados pueden variar un poco dependiendo de la convención
seguida. Sin embargo, el objetivo de todos los procedimientos de cálculo de cuartiles es
dividir los datos en aproximadamente cuatro partes iguales.

 Percentiles:
Son aquellos valores que dividen a un conjunto de datos ordenados en cien
partes iguales. Se representan por P
1
, P
2
.... , P
99
. De esta manera tenemos
que:
- P
1
es el valor por debajo del cual se sitúan a lo sumo el 1% de los datos y
por encima de él tenemos el 99% restante.
- P
2
es el valor por debajo del cual se sitúan a lo sumo el 2% de los datos y
por encima de él tenemos el 98% restante. Y así sucesivamente..
En forma genérica el p-ésimo percentil es un valor tal que por lo menos un
“p” por ciento de los elementos tiene dicho valor o menos y, al menos, un
(100-p) por ciento de los elementos tiene ese valor o más.
Es conveniente tomar en cuenta que: D
1
= P
10
, D
2
= P
20
, Q
1
= P
25
, y así
sucesivamente.
Dependiendo de si trabajamos con datos agrupados o no tendremos los
siguientes pasos para el cálculo de los percentiles:
* Para datos no agrupados:
1. Ordenar los datos de manera ascendente.
2. Calcular el índice:
n *
100
P
i |
.
|

\
|
=
- Si “i” es entero, el p-ésimo percentil es el promedio de los
valores de los datos ubicados en los lugares “i” e “i +1”.

- Si “i” no es entero, se redondea. El valor entero inmediato
mayor que “i” indica la posición del p-ésimo percentil.

Ejemplo:
Determinar el P
50
y el P
85
de los datos siguientes:
2350, 2450, 2550, 2380, 2255, 2210, 2390, 2630, 2440, 2825, 2420,
2380.
1. Ordenamos de manera ascendente:
2210, 2255, 2350, 2380, 2380, 2390, 2420, 2440, 2450, 2550, 2630, 2825.
Para P
50
:
2. Calculamos “i”: 6 12 *
100
50
i = |
.
|

\
|
=
Como “i” es entero, P
50
es el promedio de los 6° y 7°, luego nos daría:
2405
2
2420 2390
P
50
=
+
=
Para P
85
:
2. Calculamos “i”: 2 , 0 1 12 *
100
85
i = |
.
|

\
|
=
Como “i” no es entero, redondeamos. El lugar del P
85
es el siguiente
entero mayor que 10,2 es decir, el lugar 11. Esto nos daría que P
85
=
2630.


* Para datos agrupados:
a. Se aplica la fórmula:
a
f
F
100
p * n
l P *
p
a
i p
÷
= +

b. Para aplicar la fórmula, los pasos son:
1. Ubicar el resultado de
100
p * n
en F
i

2. Si no está el valor, se pasa al inmediato superior.
3. Al ubicar el valor de F
i
determinamos el intervalo de donde se
obtendrán los datos para sustituir en la ecuación.
Observación: si se trabajan con límites reales e imaginarios, se
toman los reales.

Por medio de los percentiles, se halla el valor de la variable para un
porcentaje dado.
Del ejemplo inicial sobre el investigador que deseaba determinar cómo variaban las
estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para
registrar luego sus estaturas en pulgadas, se había obtenido la siguiente tabla:
l
i
- l
i+1
f
i
x
i
F
i
h
i
% h
i
H
i
% H
i

[53 – 56) 2 54,5 2 0,0400 4 0,0400 4
[56 – 59) 5 57,5 7 0,1000 10 0,1400 14
[59 – 62) 9 60,5 16 0,1800 18 0,3200 32
[62 – 65) 15 63,5 31 0,3000 30 0,6200 62
[65 – 68) 12 66,5 43 0,2400 24 0,8600 86
[68 – 71) 5 69,5 48 0,1000 10 0,9600 96
[71 – 74) 2 72,5 50 0,0400 4 1,0000 100
P
15
= ?
1. 5 , 7
100
15 * 50
100
p * n
= =
2. 17 , 59 3 *
9
7 5 , 7
59 P
15
=
÷
+ = pulgadas
Interpretación: el 15% de las obreras tienen una estatura de 59,17 pulgadas o menos.

Q
1
= ?
Q
1
= P
25
1. 5 , 12
100
25 * 50
100
p * n
= =
2. 83 , 60 3 *
9
7 5 , 12
59 P
25
=
÷
+ = pulgadas
Interpretación: el 25% de las obreras tienen una estatura de 60,83 pulgadas o menos.

D
3
= ?
D
3
= P
30

1. 15
100
30 * 50
100
p * n
= =
2. 67 , 61 3 *
9
7 15
59 P
30
=
÷
+ = pulgadas
Interpretación: el 30% de las obreras tienen una estatura de 61,67 pulgadas o menos.

P
75
= ?
1. 5 , 37
100
75 * 50
100
p * n
= =
2. 63 , 66 3 *
12
31 5 , 37
6 P
75
=
÷
+ = pulgadas
Interpretación: el 75% de las obreras tienen una estatura de 66,63 pulgadas o menos.




 Rango Percentil
Es una expresión mediante la cual podemos hallar el porcentaje, dado un
valor de la variable. Dicha expresión se obtiene al despejar “p” en la fórmula
de percentiles para datos agrupados, el proceso para hallar el rango percentil
es:
1. Ubicar el valor de la variable que nos dan, en el intervalo que le corresponda.
2. Una vez ubicado, podemos determinar l
i
, f
i
, etc, para sustituir en la fórmula:
( )
100 *
n
F
a
f * l P
p
a
i i p
+
÷
=

Del ejemplo inicial sobre el investigador que deseaba determinar cómo variaban las
estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para
registrar luego sus estaturas en pulgadas, se había obtenido la siguiente tabla:
l
i
- l
i+1
f
i
x
i
F
i
h
i
% h
i
H
i
% H
i

[53 – 56) 2 54,5 2 0,0400 4 0,0400 4
[56 – 59) 5 57,5 7 0,1000 10 0,1400 14
[59 – 62) 9 60,5 16 0,1800 18 0,3200 32
[62 – 65) 15 63,5 31 0,3000 30 0,6200 62
[65 – 68) 12 66,5 43 0,2400 24 0,8600 86
[68 – 71) 5 69,5 48 0,1000 10 0,9600 96
[71 – 74) 2 72,5 50 0,0400 4 1,0000 100

Hallar el porcentaje de obreras cuyas estaturas son iguales o inferiores a 67 pulgadas:
1. Ubicamos el valor de 67 en la tabla y vemos que corresponde a la 5
ta
clase.
2. Sustituimos los valores:

( )
78% 100 *
50
1 3
3
12 * 5 6 7 6
p =
+
÷
=
Interpretación: el 78% de las obreras tienen estaturas iguales o inferiores a 67 pulgadas.

5 57. se había obtenido la siguiente tabla: li . Ejemplos: 1) Calcular la media aritmética de 8..3200 0.0000 4 14 32 62 86 96 100 [62 – 65) 15 [65 – 68) 12 [68 – 71) [71 – 74) 5 2 ..5 69. 10:  8  3  5  12  10  7.9600 1.1800 0.1000 0.5 72.2400 0. sólo que para facilitar los cálculos se ha de renunciar a la exactitud.li+1 fi xi Fi hi % hi Hi % Hi [53 – 56) [56 – 59) [59 – 62) 2 5 9 54.0400 4 10 18 30 24 10 4 0.x cuando sea para una muestra Notación   cuando sea para una población Fórmulas: Datos no agrupados Datos agrupados n g  x i x  x  x  . lo que se calcula es una estimación del valor de la media ya que al agrupar por clases no conocemos los valores individuales de cada observación.1000 0...6 5 2) Del ejemplo inicial sobre el investigador que deseaba determinar cómo variaban las estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para registrar luego sus estaturas en pulgadas.1400 0.3000 0.5 63.5 2 7 16 31 43 48 50 0.5 66.  x  x *f x 1 * f  x 2 * f  x 3 * f  . 5. 3.8600 0. 12.5 60.0400 0.  x g * f n i 1 2 3 g 2 3 i 1 i x  i 1  1 x  n n n  fi  n i 1 μ  xi N N xi son las marcas de clase fi son las respectivas frecuencias absolutas Para los datos agrupados.6200 0.0400 0.

en ese caso  fi =  wi.5 72..  w k * x k w 1  w 2  w 3  ..5 544.  w k Al calcular la media aritmética a partir de datos agrupados.0  = 3184 x 3184  63.li+1 [53 – 56) [56 – 59) [59 – 62) [62 – 65) [65 – 68) [68 – 71) [71 – 74) fi 2 5 9 15 12 5 2 xi 54.5 57.5 63.5 69. ciertos factores o pesos y es por ello que la media aritmética ponderada es un promedio que se calcula a fin de tener en cuenta la importancia de cada valor para el total global. Notación: x w Fórmula: k x w  i 1  wi *xi  wi i 1 k  w 1 * x 1  w 2 * x 2  w 3 * x 3  .0 287.68 pulgadas..68 pulgadas 50 Interpretación: en promedio.5 66.5 798. las obreras presentaron una estatura de 63..5 145. Ejemplo: Si un examen final de curso se valora como 3 veces los exámenes parciales y un estudiante tiene una nota de examen final de 85 y notas de exámenes .5 952.Para calcular la media. en realidad obtuvimos la media aritmética ponderada utilizando las marcas de clase para los valores de “x” y las frecuencias de cada clase como los pesos. debemos agregar una nueva columna: li .5 xi * fi 109.0 347.5 60.  La Media Aritmética Ponderada A veces se asocia a los números de un conjunto de datos.

. pero por la misma razón es muy sensible a la presentación de observaciones extremas o anómalas que hacen que la media se desplace hacia ellas. Igual sucede si a la media se le resta una constante. la media de la nueva serie es igual a la media de la serie original más la constante. x  xi  k   x xi  k     x  xi  k   x xi  k      Media de medias: Si f1 números tienen de media m1. calcular su nota final. Esto es positivo. entonces la media de todos los números es: f * m1  f 2 * m 2  f 3 * m 3  . f2 números tiene de media m2 .parciales de 70 y 90. .  El valor de la media aritmética puede no coincidir con los valores de la variable..  x i 1 k i  x  0  La media aritmética de una constante es igual a la constante.  f k * m k xw  1 f1  f 2  f 3  .. x  xi  yi   x xi  x yi      Si a cada valor de la serie se le agrega una constante. Algunas propiedades de la media aritmética:  La suma algebraica de las desviaciones de un conjunto de números con respecto a su media aritmética es cero.  La media de la suma de dos o más variables es igual a la suma de las medias de dichas variables. xw  1 * 70  1 * 90  3 * 85  83 puntos.... En consecuencia no es recomendable usar la media como medida de tendencia central en los casos en el cual el conjunto de datos no es homogéneo. pues la cantidad obtenida no es representativa del total de los datos. fk números tienen de media mk. 11 3 Observaciones sobre la media aritmética:  Es una medida que toma en consideración todos los valores de la distribución. la media aritmética ponderada de todas las medias.  Tiene la ventaja de que es única y siempre se puede calcular (si no hay intervalos abiertos). decir.  f k es...

Con será la mediana. Usando la fórmula de posicionamiento. el valor ocupado por la posición mediana. f med Los pasos son: en donde: 1. Localizar ese valor en Fi. el de la mitad pasar al inmediato superior. 9. Ejemplos: 1) Datos no agrupados: Sean los números: 3. 5. Notación: Med Fórmulas: Datos no agrupados Datos agrupados El valor de la mediana puede coincidir o no n  Fa con un valor de la serie. Usando la fórmula de posicionamiento. 4. 2 como no hay esa posición. impar de elementos. 12. todo depende si el M ed  l i  2 *a número de datos es par o impar. 8. Si el conjunto tiene un número 2. 15. si contiene un esto se halla el intervalo de la número par de elementos. si no está. Fa es la frecuencia acumulada anterior. entonces la respuesta es 6. Organizar por orden li es el límite inferior. 8. n 1 para localizar el lugar a es la amplitud. 11. 4. Calcular ordenado. 2 3. 2. 5. 18. ascendente a los datos. Geométricamente es el valor de “x” que corresponde a la vertical que divide al histograma en dos partes de igual área. Aplicar la fórmula sustituyendo los aritmético de los dos que se hallan valores correspondientes. en la mitad. 8. dando como resultado que la mediana será 10 . 2 que ocupa el valor de la Los pasos son: mediana en el arreglo n 1. Sean los números: 5. Utilizar la fórmula de f med es la frecuencia absoluta del intervalo posicionamiento de punto: de la mediana. La Mediana Es el punto medio de un conjunto de datos representando el valor más central en dicho conjunto.5 daría la posición de la mediana. mediana será el promedio 3. 6. por lo que deja por encima y por debajo la misma cantidad de datos (una vez que estos han sido ordenados). 10. la mediana. el valor 9 1  5 sería a 2 8 1  4. buscamos el promedio de los números que ocupan los puestos 4 y 5. 7.

li+1 [53 – 56) [56 – 59) [59 – 62) [62 – 65) [65 – 68) [68 – 71) [71 – 74) Paso 1: fi 2 5 9 15 12 5 2 xi 54. . es adecuado su uso en distribuciones que presentan observaciones extremadamente grandes o pequeñas.5 72.6200 0. sino el orden de los mismos.5 Fi 2 7 16 31 43 48 50 hi 0. Observaciones sobre la mediana:  Como medida descriptiva.0400 % hi 4 10 18 30 24 10 4 Hi 0. se había obtenido la siguiente tabla: li .0400 0.3200 0.2) Datos agrupados: Del ejemplo inicial sobre el investigador que deseaba determinar cómo variaban las estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para registrar luego sus estaturas en pulgadas.1000 0.9600 1.0400 0. Paso 3: Med  62  25  16 * 3  63.5 60.5 66.8 pulgadas aproximadamente.0000 % Hi 4 14 32 62 86 96 100 n 50   25 2 2 Paso 2: Como 25 no aparece en Fi.8 pulgadas 15 Interpretación: El 50% de las obreras tienen una estatura igual o inferior a 63.5 69.1000 0.1800 0.2400 0.5 63. Por ello. tiene la ventaja de no estar afectada por las observaciones extremas.3000 0.8600 0. ya que no depende de los valores que toma la variable.1400 0. pasamos al inmediato superior: 31.5 57.

Notación: Mo Fórmulas: Datos no agrupados No hay fórmulas. Aplicar la fórmula . a es la amplitud.  Su mayor defecto es que no se ajusta fácilmente al cálculo algebraico.  Puede usarse con datos cualitativos. Puede ser calculada aún a partir de datos agrupados con clases abiertas.  La Moda Es el valor de los datos que se presenta con más frecuencia. 2 es el valor que se obtiene a restar la fmodal con la frecuencia siguiente. Los pasos para calcular la moda con datos agrupados serían: 1. Datos agrupados Δ 1 *a Δ Δ 1 2 Mo  l i  li es el límite inferior (si se trabajan con límites imaginarios y reales.  No utiliza toda la información de los datos (sólo los valores centrales). lo que hace que sea difícil de utilizar en otras áreas. se toman los reales). Ubicar la mayor fi para hallar el intervalo modal 2. 1 es el valor que se obtiene a restar la fmodal con la frecuencia anterior. como en la inferencia. por lo que representa el punto más alto en la curva de distribución de un conjunto de datos. sólo ver cuál valor o elemento es el que más se repite.

3. se calcula según la gráfica: . Ubicamos la mayor frecuencia absoluta.0000 % Hi 4 14 32 62 86 96 100 Para calcular la moda: 1. se había obtenido la siguiente tabla: li .1800 0.5 72.5 69.Del ejemplo inicial sobre el investigador que deseaba determinar cómo variaban las estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para registrar luego sus estaturas en pulgadas.li+1 [53 – 56) [56 – 59) [59 – 62) [62 – 65) [65 – 68) [68 – 71) [71 – 74) fi 2 5 9 15 12 5 2 xi 54.1000 0.1400 0.6200 0.2400 0.  El intervalo modal es aquel que posee una barra en el histograma con mayor altura geométricamente. en este caso es 15 y el mismo pertenece a la cuarta clase. por ello. son difíciles de interpretar.9600 1.5 66.3200 0. Aplicamos la fórmula: Mo  62  15  9 * 3  64 pulgadas 15  9  15  12 Interpretación: la mayoría de las obreras tienen una estatura de 64 pulgadas aproximadamente.3000 0. o más modas.5 57.5 63.5 60.0400 0.5 Fi 2 7 16 31 43 48 50 hi 0.8600 0. cuando los conjuntos de datos contiene 2.1000 0.0400 0. Observaciones sobre la moda:  Se puede usar para datos cualitativos y cuantitativos.  Puede no ser única.0400 % hi 4 10 18 30 24 10 4 Hi 0.  Puede que una distribución no tenga moda.  Se puede emplear aunque existan clases abiertas en la distribución. 2.

D3 . el valor medio que divide al conjunto de datos en dos partes iguales es la mediana. Dentro de las medidas de los cuantiles tenemos:  Deciles: Son aquellos valores que dividen en diez partes iguales a un conjunto de datos ordenados.D9. Se representan por D1 ..Cuantiles Si una serie de datos se colocan en orden de magnitud.. De esta manera tenemos que: .D1 (primer decil) es el valor por debajo del cual se encuentran como máximo el 10% de las observaciones. Q2. por extensión de esta idea se puede pensar en aquellos valores que dividen a los datos en cuatro partes iguales. Y así sucesivamente. mientras que el 90% restante se sitúan por encima de él. en cien partes iguales.D2 (segundo decil) es el valor por debajo del cual se encuentran como máximo el 20% de las observaciones. El nombre genérico es el de cuantil y el mismo se define como el valor bajo el cual se encuentra una determinada proporción de los valores de una distribución. y Q3. . De esta manera tenemos que: . D2 . etc..  Cuartiles: Son aquellos valores que dividen en cuatro partes iguales a un conjunto de datos ordenados. . Se representan por Q1. mientras que el 80% restante se sitúan por encima de él.Q1 (primer cuartil) es el valor por debajo del cual se sitúan a lo sumo el .

P2 es el valor por debajo del cual se sitúan a lo sumo el 2% de los datos y por encima de él tenemos el 98% restante. Ordenar los datos de manera ascendente. Dependiendo de si trabajamos con datos agrupados o no tendremos los siguientes pasos para el cálculo de los percentiles: * Para datos no agrupados: 1. Si “i” no es entero. al menos. En forma genérica el p-ésimo percentil es un valor tal que por lo menos un “p” por ciento de los elementos tiene dicho valor o menos y. .  Percentiles: Son aquellos valores que dividen a un conjunto de datos ordenados en cien partes iguales.. el objetivo de todos los procedimientos de cálculo de cuartiles es dividir los datos en aproximadamente cuatro partes iguales..25% de las observaciones y por encima de éste el 75% restante. Está justo en el centro y corresponde a la mediana . De esta manera tenemos que: . Y así sucesivamente. y así sucesivamente..Q2 (segundo cuartil) es el valor por debajo de cual se sitúan a lo sumo el 50% de las observaciones y por encima de éste el 50% restante. el p-ésimo percentil es el promedio de los valores de los datos ubicados en los lugares “i” e “i +1”.P1 es el valor por debajo del cual se sitúan a lo sumo el 1% de los datos y por encima de él tenemos el 99% restante. Es conveniente tomar en cuenta que: D1= P10 .. P2 . . D2 = P20 . P99. Se representan por P1. Sin embargo.Q3 (tercer cuartil) es el valor por debajo del cual se sitúan a lo sumo el 75% de las observaciones y por encima de éste el 25% restante Observación: Hay algunas variaciones en las convenciones de cálculo de cuartiles ya que los valores reales calculados pueden variar un poco dependiendo de la convención seguida. El valor entero inmediato mayor que “i” indica la posición del p-ésimo percentil. 2. Q1 = P25. . se redondea. un (100-p) por ciento de los elementos tiene ese valor o más. - . Calcular el índice:  P  i *n  100  Si “i” es entero.

* Para datos agrupados: a. 2440. 2825. 2255. Para P50: 2. se pasa al inmediato superior. n*p en Fi 100 . 2255. el lugar 11. Al ubicar el valor de Fi determinamos el intervalo de donde se obtendrán los datos para sustituir en la ecuación. 2380. Observación: si se trabajan con límites reales e imaginarios. 2380. 2440. se toman los reales. 2825. 1. 2450. El lugar del P85 es el siguiente entero mayor que 10. Calculamos “i”: Como “i” no es entero. 3. 2630. Ubicar el resultado de 2. luego nos daría: 2390  2420 P50   2405 2  85  i  *12  10.2 es decir. 2390. 2350. Calculamos “i”:  50  i  *12  6  100  Como “i” es entero. 2550. 2630. Si no está el valor. 2550. 2420. 2210. redondeamos. 2450. 2390. P50 es el promedio de los 6° y 7°.2  100  Para P85: 2. Para aplicar la fórmula. 2380. Ordenamos de manera ascendente: 2210. los pasos son: 1.Ejemplo: Determinar el P50 y el P85 de los datos siguientes: 2350. 2380. Se aplica la fórmula: Pp  l i  n*p F a 100 *a f p b. Esto nos daría que P85 = 2630. 2420.

1000 0.83 pulgadas 9 Interpretación: el 25% de las obreras tienen una estatura de 60.5 60.1800 0. 1. P75 = ? . D3 = ? D3 = P30 n * p 50 * 30   15 100 100 15  7 2. Q1 = ? Q1 = P25 n * p 50 * 25   12.5 57. 1.5 Fi 2 7 16 31 43 48 50 hi 0.1400 0.83 pulgadas o menos.5 66.8600 0.67 pulgadas o menos. se había obtenido la siguiente tabla: li .5 63.3200 0. P15  59  * 3  59.67 pulgadas 9 Interpretación: el 30% de las obreras tienen una estatura de 61.17 pulgadas 9 Interpretación: el 15% de las obreras tienen una estatura de 59.0400 0.0400 % hi 4 10 18 30 24 10 4 Hi 0.0400 0.5 100 100 7.3000 0. se halla el valor de la variable para un porcentaje dado. Del ejemplo inicial sobre el investigador que deseaba determinar cómo variaban las estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para registrar luego sus estaturas en pulgadas.0000 % Hi 4 14 32 62 86 96 100 n * p 50 *15   7.17 pulgadas o menos.1000 0. 1.5 69.li+1 [53 – 56) [56 – 59) [59 – 62) [62 – 65) [65 – 68) [68 – 71) [71 – 74) P15 = ? fi 2 5 9 15 12 5 2 xi 54. P25  59  * 3  60.6200 0.5 100 100 12.5 72.9600 1.5  7 2.5  7 2.2400 0. P30  59  * 3  61.Por medio de los percentiles.

5 63.0400 0. 2.n * p 50 * 75   37.9600 1.63 pulgadas o menos.5  31 2. podemos determinar li.5 57. para sustituir en la fórmula: Pp  l i * f i  Fa a p *100 n   Del ejemplo inicial sobre el investigador que deseaba determinar cómo variaban las estaturas de las obreras de una empresa y el cual tomaba una muestra de 50 mujeres para registrar luego sus estaturas en pulgadas. Dicha expresión se obtiene al despejar “p” en la fórmula de percentiles para datos agrupados.5 66. Sustituimos los valores: 67  65*12  31 3 p *100  78% 50 Interpretación: el 78% de las obreras tienen estaturas iguales o inferiores a 67 pulgadas.1000 0.2400 0.63 pulgadas 12 Interpretación: el 75% de las obreras tienen una estatura de 66.li+1 [53 – 56) [56 – 59) [59 – 62) [62 – 65) [65 – 68) [68 – 71) [71 – 74) fi 2 5 9 15 12 5 2 xi 54.1800 0. . dado un valor de la variable.0000 % Hi 4 14 32 62 86 96 100 Hallar el porcentaje de obreras cuyas estaturas son iguales o inferiores a 67 pulgadas: 1. el proceso para hallar el rango percentil es:  Rango Percentil 1.5 Fi 2 7 16 31 43 48 50 hi 0.5 100 100 37.1400 0. Una vez ubicado.8600 0. Ubicar el valor de la variable que nos dan.1000 0.6200 0.3200 0. fi. Ubicamos el valor de 67 en la tabla y vemos que corresponde a la 5ta clase.5 60. se había obtenido la siguiente tabla: li .5 72. etc. en el intervalo que le corresponda. P75  6  * 3  66. 1.0400 0.5 69.0400 % hi 4 10 18 30 24 10 4 Hi 0. 2. Es una expresión mediante la cual podemos hallar el porcentaje.3000 0.