Está en la página 1de 14

PROBABILIDADES Y ESTADÍSTICA

II DISTRIBUCIÓN DE FRECUENCIAS (2da PARTE)

2.5. Medidas de Posición


2.5.1. Medidas de Tendencia Central
2.5.2. Medidas de localización
2.6. Relación entre media, mediana y moda
2.7. Media Geométrica y Media Armónica
2.8. Medidas de dispersión

2.5. Medidas de Posición


Las medidas de posición reflejan la tendencia central y la
localización de los datos.

Las medidas de tendencia central, ubican el centro de los datos,


como los promedios, la media aritmética, media geométrica,
media armónica y la mediana.

Las medidas de localización ubican ciertas posiciones de los datos


más frecuentes (moda) o los menos frecuentes como los deciles,
cuartiles y percentiles.

2.5.1. Medidas de Tendencia Central

1. Media ( x ): Denominado también media aritmética o promedio


aritmético, es la suma de los valores observados de la variable,
dividida por el número de observaciones, esto es:

x1  x 2  x 3  ...  x n
x
n
n

x i
x i 1
(Para datos no tabulados) (no agrupados)
n

x f i i

x i 1
(Para datos tabulados) (agrupados)
n

Ejemplos:
1. Determinar la media de las edades de un grupo de
estudiantes:
25, 18, 19, 23, 19, 20, 21, 20, 19, 20
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

x

2. Calcular la media de los datos agrupados en la siguiente


tabla de frecuencias:

xi fi xi fi hi xi hi
2 2
3 4
4 7
5 4
6 3
Total n=20

x f i i

x i 1
=
n

2. Mediana (Me, XMe): O valor mediano, es el número que separa a la


serie de datos ordenados en forma creciente (o decreciente) en dos
partes de igual número de datos (50% de datos a la izquierda y
50% de datos a la derecha), se puede decir también que la mediana
es aquel valor que ocupa la posición central del conjunto de datos.

Mediana para datos no tabulados:

Hallar la mediana de los siguientes datos: 25, 29, 16, 18, 23

x1 x2 x3 x4 x5
:

O también:
Posición:
 Me =

Otro ejemplo, sea el conjunto de datos: 15, 08, 13, 18, 17, 17, 19, 11
hallar la mediana.

x1 x2 x3 x4 x5
Ordenando:

UNSAAC 18
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

Me =

Por tanto, para hallar la mediana para datos no tabulados se


procede:

Si n es impar  Me  x  n1 
2

x  n   x  n 1
Si n es par  Me  2 2

Mediana para datos tabulados:

 n F 
Me  Li   2 i 1  A
 fi 

Donde:
Li es el límite inferior del intervalo de la clase mediana.
Fi–1 es la frecuencia acumulada absoluta del intervalo
inmediatamente anterior al intervalo de la mediana
fi es la frecuencia absoluta de la clase mediana.
A es la amplitud del intervalo de la clase mediana.

Ejemplo. Calcular la mediana si se tiene la siguiente tabla de


frecuencias:

Ii fi Fi
 0, 6  7
 6, 12  8
12, 18  10
 18, 24  13
24 , 30  22
n = 60

UNSAAC 19
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

2.5.2. Medidas de localización:

Moda: (Mo) (XMo) : Se define como el dato que más se repite en el


conjunto de datos, es decir el valor que tiene la mayor
frecuencia absoluta o mayor frecuencia relativa. La moda no
siempre existe y si existe no siempre es única.

Si un conjunto de datos no tiene moda, se denomina _______


Si un conjunto de datos tiene:
Una sola moda, se denomina ________
Dos modas, se denomina ________
Más de dos modas, se denomina ___________

Así por ejemplo: 1, 3, 2, 4, 1, 2, 1, 2, 2, 3, 6, 1, 2, 5


 Mo = 2 (repite más veces) (unimodal)

Moda de datos tabulados:

 d1 
Mo  Li   A
 d1  d 2 
Donde:
Li : Límite inferior de la clase modal
d1 : fi – fi–1 (diferencia 1)
d2 : fi – fi+1 (diferencia 2)
A : Amplitud de la clase modal

Ejemplo:
Calcular la moda de la siguiente tabla de frecuencias:

Ii fi
 0, 6  7
 6, 12  8
12, 18  10
 18, 24  13
24 , 30  12
n=50

UNSAAC 20
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

CUANTILES (FRACTILES): Es una consecuencia de la mediana,


los cuales dividen al conjunto de datos en partes iguales
(4 partes, 10 partes o 100 partes); a estas medidas se les llama
los cuartiles, deciles y percentiles respectivamente.

1. Cuartiles: Son valores que dividen a un conjunto de datos en


4 partes exactamente iguales, para esto los datos deben
estar ordenados en forma ascendente y se denotan por: Q1 ,
Q2 y Q3.

25% 25% 25% 25%

Q1 Q2 Q3
Me

Cálculo de los cuartiles:


a) Para datos no tabulados
Se ordenan los datos en forma ascendente:
n 1
Si es un entero, entonces : Q1  x  n 1 
4 
 4 

1
Si (n  1) no es entero, entonces se debe realizar una
4
interpolación entre los valores correspondientes.

3
Si (n  1) es un entero, entonces : Q3  x  3 
4  (n 1) 
4 

3
Si (n  1) no es entero, entonces se debe realizar una
4
interpolación entre los valores correspondientes.

b) Para datos tabulados


Se construye la tabla de frecuencias absolutas
acumuladas (frecuencias relativas acumuladas), luego:
n
Para Q1 se busca el menor Fi que supere a y se aplica la
4
siguiente fórmula:
 n F 
Q1  Li   4 i 1  A
 fi 

UNSAAC 21
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

Para el segundo cuartil, se procede de la misma forma


que para la mediana, esto es:
 2n  Fi 1 
Me = Q2  Li   4 A
 fi 
3n
Para Q3 se busca el menor Fi que supere a y se aplica
4
la siguiente fórmula:
 3n
 Fi 1 
Q3  Li   4
A
 fi 
Ejemplos:

1. Calcular la suma del primer y tercer cuartil del siguiente conjunto de


datos:
4, 8, 11, 2, 5, 10, 14, 13, 9, 10, 18

2. Calcular el primer cuartil del siguiente conjunto de datos:

6, 9, 11, 12, 14, 15, 17, 18, 18, 18

3. Calcular el tercer cuartil del siguiente conjunto de datos:

1, 4, 5, 7, 8, 9, 9, 11, 14, 15, 17, 17, 19

4. En la siguiente tabla incompleta de distribución de frecuencias de


amplitud constante, calcular los cuartiles

Ii xi fi Fi
[ , > 4
[10, > 7
[ , 30 > 10
[ , > 15
[ , > 14
Total

2. Deciles: Son valores que dividen al conjunto de datos


ordenados en 10 partes exactamente iguales y se denotan
por: D1, D2, D3, . . . , D9

10% 10% 10% 10%

D1 D2 D3 D5 D9
Me

UNSAAC 22
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

Cálculo de los deciles:


a) Para datos no tabulados
Se ordenan los datos en forma ascendente:
i(n  1)
Si es un entero, entonces : Di  x  i(n 1) 
10 
 10 

i(n  1)
Si no es entero, entonces se debe realizar una
10
interpolación entre los valores correspondientes.

b) Para datos tabulados


Se construye la tabla de frecuencias absolutas
acumuladas (frecuencias relativas acumuladas), luego:
in
Para Di se busca el menor Fi que supere a y se aplica la
10
siguiente fórmula:
 n F 
D1  Li   10 i 1  A
 fi 
 2n  F 
D 2  Li   10 i 1  A
 fi 
 3n  F 
D3  Li   10 i 1  A
 fi 

 9n
 Fi 1 
D9  L i   10
A
 fi 

En general:
 in  F 
Di  Li   10 i 1  A
 fi 

3. Percentiles: Son valores que dividen al conjunto de datos


ordenados en 100 partes exactamente iguales y se denotan
por: P1, P2, P3, . . . , P99

1% 1% 1% ... 1%

P1 P2 P3 P50 P99
Me

UNSAAC 23
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

Cálculo de los percentiles:


a) Para datos no tabulados
Se ordenan los datos en forma ascendente:
i(n  1)
Si es un entero, entonces : Pi  x  i(n 1) 
100 
 100 

i(n  1)
Si no es entero, entonces se debe realizar una
100
interpolación entre los valores correspondientes.

b) Para datos tabulados


Se construye la tabla de frecuencias absolutas
acumuladas (frecuencias relativas acumuladas), luego:
in
Para Pi se busca el menor Fi que supere a y se aplica
100
la siguiente fórmula:
 n F 
P1  Li   100 i 1  A
 fi 
 2n  F 
P2  Li   100 i 1  A
 fi 
 F 
3n
P3  Li   100 i 1  A
 fi 

 9n  F 
P9  Li   100 i 1  A
 fi 
En general:
 in  F 
Pi  Li   100 i 1  A
 fi 
Ejemplo:
Determinar el primer cuartil, sexto decil y el 85 avo percentil de
la siguiente tabla de distribución de frecuencias

Ii fi Fi
[85, 105> 2
[105, 125> 6
[125, 145> 14
[145, 165> 20
[165, 185> 18
[185, 205> 4
[205, 225> 2
n=66

UNSAAC 24
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

Solución:

2.6. Relación entre media, mediana y moda

1. Si la distribución de frecuencias es simétrica entonces la


media, la mediana y la moda son iguales.
x = Me = Mo

x = Me = Mo
2. Si la distribución es asimétrica de cola a la derecha entonces la
moda es menor que la mediana y esta a su vez es menor que la
media.
Mo < Me < x

Mo Me
x

3. Si la distribución es asimétrica de cola a la izquierda entonces


la media es menor que la mediana y esta a su vez será menor
que la moda
x < Me < Mo

Me Mo
x

UNSAAC 25
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

Si se tiene distribuciones unimodales y asimétricas se tiene la


siguiente relación:

x  Mo  3(x  Me)

2.7. Media Geométrica y Media Armónica

Media Geométrica: Sean x1, x2, x3, …. xn (n valores positivos) entonces la media
geométrica es la raíz n-ésima del producto de estos n números, esto es:

x G  n x1.x 2 .x 3 .......x n (para datos no tabulados)

x G  n x1f1 .x 2 f 2 .x 3f3 .......x k f k (para datos tabulados)

Así por ejemplo para el 4 y el 9

Para el 3, el 9 y 27

La media geométrica se utiliza para promediar razones (a/b), índices (a/b %), para valores
que varían con el tiempo.

Media Armónica: Sean x1, x2, x3, …. xn (n valores no nulos) entonces la media armónica
se define como la inversa del promedio aritmético de sus inversas, esto es:

n
xH  (para datos no tabulados)
1
x1  1
x2  1
x3  ....  1
xn

n
xH  n


i 1
1
xi

n
xH  (para datos tabulados)
f1
x1  f2
x2  f3
x3  ....  fk
xk

n
xH  k


i 1
fi
xi

La media armónica se utiliza para promediar valores que están en relación inversa como por
ejemplo la velocidad y el tiempo

Nota. La media armónica es menor que la media geométrica y esta a su vez es menor que la
media aritmética. x H  x G  x
Si todos los xi son iguales , entonces x H  x G  x

Así por ejemplo para los números 16, 4

UNSAAC 26
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

2.8. Medidas de dispersión

1. VARIANZA: La varianza o variancia de una muestra finita de n elementos, se define


como el promedio aritmético de las diferencias de las observaciones con respecto a
su media, esto es:

Para datos no agrupados:

n n
 (x i  x)2  x i2
i 1 i 1
Var(x)  S 2  o también Var(x)  S 2  x2
n n

Para datos agrupados:

k k
 (x i  x)2 fi  x i 2 fi
i 1 i 1
Var(x)  S 2  o también Var(x)  S2  x2
n n

PROPIEDADES

1. Var(X)  0

2. Var(c) = 0 (c = constante)

3. Var(X + Y) = Var(X) + Var(Y)

4. Var(X + c) = Var(X)

5. Var(cX) = c2 Var(X)

Observaciones:
1a Cuando la varianza es cero, se dice que el conjunto de datos no tiene variación o no tiene
variabilidad. (no hay dispersión)

2a La varianza no está en las mismas unidades que los datos, está siempre en unidades
cuadradas, por lo que su interpretación no se adecúa a las unidades de los datos, así por
ejemplo: Km2, litros2, $2, etc.

3a Existen otras medidas de dispersión como el Rango, el Rango intercuartil, etc. pero no
son exactas porque no usan todo el conjunto de datos.

4a La varianza es un número real no negativo.

5a Se puede calcular la varianza a partir de las frecuencias relativas, esto es:

k
fi
Var(x)  S 2   (x i  x)2 h i puesto que: hi 
i 1 n

2. DESVIACIÓN ESTANDAR: Llamado también desviación típica, se define como la raíz


cuadrada positiva de la varianza, esto es:

S Var(x)

UNSAAC 27
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

Observaciones:
1a La desviación estándar si está en las mismas unidades que los datos, por esta razón su
interpretación se ajusta al conjunto de datos, así por ejemplo: Km, $, litros, etc.
2a La desviación estándar es un número real no negativo.
3a Si la desviación estándar es cero, significa que todos los datos son iguales, por lo que
afirmamos que no hay variación en el conjunto de datos.

3. COEFICIENTE DE VARIACIÓN: (C.V.) Es una medida de dispersión relativa (que no


tiene unidades) y se define como el cociente que resulta de dividir la desviación
estándar entre la media, esto es:
S
CV =
x
El CV se utiliza para comparar la variabilidad de dos o más conjuntos de datos que
tengan medias iguales o diferentes o que tengan distintas unidades de medida.

Ejemplos:
1. Determinar la varianza y la desviación estándar de los siguientes datos referidos
al número de hijos por familia de un grupo de estudiantes.
4, 1, 4, 4, 3, 3, 4, 3, 4, 2,
2, 3, 4, 3, 3, 4, 2, 3, 2, 4

Xi fi xifi xi  x (x i  x) 2 (x i  x) 2 f i
1 1
2 4
3 7
4 8
n=20

x f i i
x i 1
=
n
n

 (x i  x) 2 fi
Var(X)  i 1
=
n

S  Var(X) =

Interpretación:

S
CV  =
x

2. Sean dos secciones del curso de Probabilidades y Estadística (A y B) que tienen la


misma desviación estándar igual a 4 y las medias son de 11 y 16 entonces ambos
grupos son homogéneos?

S
CVA 
x

UNSAAC 28
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

S
CVB 
x

3. En un examen de los cursos de Estadística y Cálculo II resultan las medias de 13 y


17 y las desviaciones estándar de 3 y 4 respectivamente. Si un estudiante tiene 14
en Estadística y 16 en Cálculo II ¿en cuál de los dos cursos tiene mejor
rendimiento?

S
CVEst  =
x
S
CVCal  =
x
Hallando valores estandarizados (valor Z)

Xx
Z
S
En Estadística: Z =

En Cálculo II: Z=

UNSAAC 29
PROBABILIDADES Y ESTADÍSTICA – Ing. Informática Mgt. Joel Olarte Estrada

EJERCICIOS COMPLEMENTARIOS

1. De una tabla de frecuencias se sabe que se obtiene una distribución simétrica con 5 intervalos de
amplitud constante, de modo que:

f1 + f4 = f3 + 10 ; F3 = 130
Hallar: F2 + F5

2. Calcular el tamaño de la muestra “n” si se cumple que :

x
2
S2 = 9,45 ;  2817 y X  16,5

3. Las notas de un grupo de 200 alumnos fueron:

Nota Cantidad
<0;5] 50
< 5 ; 10] 60
<10 ; 15] 60
<15 ; 20] 30

¿Qué porcentaje de alumnos obtuvieron una nota entre 10 y 16?

4. Dada la siguiente distribución de frecuencia en base a las edades de 200 personas.

 Li – Ls  fi
[10 – 20  50
[20 – 30  12
[30 – 40  45
[40 – 50  28
[50 – 60  30
[60 – 70  35

¿Cuántas personas tienen edades comprendidas entre 36 y 57 años?

5. El siguiente polígono de frecuencias muestra los resultados de una encuesta realizada a personas
con un trabajo estable acerca de su salario semanal

N° de personas

72

51

30

14

45 135 Salario

Calcule cuántas personas cobran entre S/. 140 por dos semanas y S/. 435 por 3 semanas

UNSAAC 30

También podría gustarte