Está en la página 1de 32

Estadística I Facultad de Ingeniería UPDS

MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN


1. Definición.- Las medidas de posición describen la ubicación que ocupa una distribución de
frecuencias respecto a un valor de la variable, que identifica el punto alrededor del cual se
centran los datos. Estas medidas se clasifican en:
a) Medidas de tendencia central: Son las medidas que se ubican en posiciones centrales o
intermedias entre el menor y mayor valor del conjunto de datos; entre las más usuales son: la
media aritmética, la media ponderada, la mediana y la media geométrica.

b) Medidas de localización: Estas medidas señalan la ubicación de los valores más frecuentes
o de valores extremos, los más usuales son: la moda y los cuantiles.

( )
2. Media aritmética x .- Es un valor promedio de tendencia central que se calcula según el tipo
de datos con los que se cuenta y pueden ser:

a) Media aritmética para datos no tabulados: Se define como la suma del conjunto de
observaciones dividido entre el número total de observaciones y se representa:
n

x i =1
i
x = media aritmética
xi = observaciones diferentes
x= n = # total de observaciones
n

b) Media aritmética para datos no agrupados en clases:


x = media aritmética
xi  ni xi = observaciones diferentes
i =1 ni = frecuencia absoluta de xi
x=
n n = # total de observaciones

c) Media aritmética para datos agrupados en clases:


y = media aritmética
yi  ni yi = marca de clase
i =1
y= ni = frecuencia absoluta de la clase i
n n = # total de observaciones

( )
3. Media ponderada x p .- Es un valor promedio que toma en cuenta la importancia (peso o
ponderación) que tiene cada valor sobre el total; y se calcula mediante la siguiente expresión:

x
xp = media ponderada
i  wi xi = observaciones diferentes
i =1
xp = n
wi = Ponderación de la observación de xi

w
n = # total de observaciones
i
i =1

Elaborado por Ing. Ricardo Chura Sucojayo 1


Estadística I Facultad de Ingeniería UPDS

4. Mediana ( Md ) .- Es aquel valor que no es superado ni supera a más de la mitad de todas las
observaciones; para calcular la mediana se requiere ordenar los datos.

a) Mediana para datos no tabulados: Se debe seguir el siguiente procedimiento:

1º Ordenar los datos de forma ascendente o descendente.


n +1
2º Ubicar la posición central de los datos mediante la siguiente expresión: P = ;
2
Donde: P = posición y n = número total de observaciones.

3º Determinar la mediana según:


• Si el número de datos es impar; entonces la mediana es el valor que ocupa la posición
media calculada en el paso anterior.
• Si el número de datos es par, la mediana será igual al promedio entre los dos valores
xi −1 + xi
anterior y posterior a la posición indicada; es decir: Md =
2
b) Mediana para datos tabulados no agrupados en clases: En este caso se debe construir la
tabla de frecuencias hasta la frecuencia absoluta acumulada menor que ( N i ) y luego
analizar las siguientes dos situaciones posibles:

n n = # total de observaciones
1º Si  N i ; entonces Md = xi Ni = Frecuencia absoluta acumulada de
2
la observación i
n x + xi +1
2º Si = N i ; entonces Md = i xi = valor de la observación i
2 2 xi+1 = valor posterior a xi

c) Mediana para datos tabulados agrupados en clases: En este caso se debe utilizar el
procedimiento y expresión siguientes:
n
1º Determinar la clase mediana mediante la expresión: N i 
2
2º Identificar los datos siguientes: Ni −1(md) ; ni (md) ; Li (md) ; w
3º Calcular la mediana de los datos reemplazando en la siguiente fórmula:

n 
 − N i −1( md ) 
Md = Li ( md) +  2 w
 ni ( md ) 
 
n = Número total de observaciones
ni = Frecuencias absoluta de la clase mediana
Li (md) = Límite inferior de la clase mediana
Ni-1 (md) = Frec. Abs. Acumulada anterior a la clase mediana
W = Amplitud de clase

Elaborado por Ing. Ricardo Chura Sucojayo 2


Estadística I Facultad de Ingeniería UPDS

5. Media Geométrica ( MG ) .- La media geométrica de un conjunto de “n” observaciones se


define como la raíz n-ésima del producto de las “n” observaciones. La media geométrica se
emplea generalmente para obtener los promedios de cualquier serie económica, promedios de
producción, promedios de ventas, como también para determinar las tasas promedio de
crecimiento de datos tabulados como series de tiempo.

a) Media geométrica para datos no tabulados: Si se tiene x1 , x 2 ,..., x n observaciones


positivas, entonces la media geométrica se define como:

MG = media geométrica
MG = n x1  x2  ...  xn xi = observaciones diferentes
n = # total de observaciones
b) Media geométrica para datos tabulados no agrupados en clases: Se utiliza la siguiente
expresión:
ni = frecuencia absoluta de la
MG = x1  x2  ...  xk
n n1 n2 nk observación xi
i = 1, 2, … , k
c) Media geométrica para datos tabulados agrupados en clases: Se utiliza la siguiente
expresión:
yi = marca de clase.
MG = y1  y 2  ...  yk
n n1 n2 nk
i = 1, 2, … , k

d) Tasa de crecimiento: Se utiliza las siguientes expresiones:


MG(FC) = Media geométrica de los factores
MG(FC ) = n FC1  FC2  ...  FCn de crecimiento
FCi = Factores de crecimiento
TASA = [ MG(FC ) − 1] 100 %
6. Moda ( Mo ) .- Es aquel valor de la variable xi que se presenta con mayor frecuencia (el valor
que más se repite).
Nota: En algunos conjuntos de datos la moda puede no existir, o puede no ser única en otros.
a) Moda para datos no tabulados: Es el valor de xi que más veces se repite.
b) Moda para datos tabulados no agrupados en clases: Es el valor de xi que corresponde al
mayor valor de la frecuencia absoluta del conjunto de datos.
c) Moda para datos tabulados agrupados en clases: Se utiliza la siguiente expresión:

 1  1 = ni (Mo ) − ni −1(Mo )
Mo = Li ( Mo) +  w

 1 +  2  2 = ni (Mo ) − ni +1(Mo )
Li ( Mo ) = Límite inferior de la clase modal.
Δ1 = Exceso de frecuencia modal sobre la frecuencia de la clase anterior inmediata.
Δ2 = Exceso de frecuencia modal sobre la frecuencia de la clase posterior inmediata.
ni ( Mo ) = Frecuencias absoluta de la clase modal.
ni -1 ( Mo ) = Frecuencias absoluta anterior inmediata a la clase modal.
ni +1 ( Mo ) = Frecuencias absoluta posterior inmediata a la clase modal.
w = Amplitud de clase

Elaborado por Ing. Ricardo Chura Sucojayo 3


Estadística I Facultad de Ingeniería UPDS

7. Cuantiles.- Son estadígrafos que dividen el conjunto de datos en otras proporciones que no sean
la mitad, como en el caso de la mediana; los cuantiles se utilizan frecuentemente para describir
el comportamiento de una población. Entre los cuantiles más utilizados tenemos a los: Cuartiles,
Deciles y Percentiles.

i) Cuartiles ( Qi ) : Son los que dividen un conjunto de “n” observaciones, ordenados en


forma ascendente o descendente en 4 partes iguales. En un conjunto de datos solo existen
tres cuartiles, como se muestra en el siguiente esquema:

⎯ ⎯→ ⎯
25%
⎯→ ⎯
25%
⎯→ ⎯
25%
⎯→
25%
0 Q1 Q2 Q3 100
i.1) Cuartiles para datos no tabulados: Para calcular los cuartiles de este tipo de datos
reutiliza el procedimiento siguiente:
Paso 1: Ordenar los datos de forma ascendente o descendente.
Paso 2: Localizar la posición de cada cuartil según:

n +1 2(n + 1)
PQ1 =  Posición del 1º cuartil ; PQ2 =  Posición del 2º cuartil
4 4

3(n + 1)
PQ3 =  Posición del 3º cuartil
4
Paso 3: Se analiza las siguientes dos situaciones:
n +1
• Si es valor entero, entonces el valor que corresponde a dicha posición es el
4
cuartil.
n +1
• Si no es valor entero, entonces se debe realizar una interpolación lineal de los
4
dos valores correspondientes a las observaciones entre las cuales se encuentra dicho
valor.
Fórmula de interpolación:
Qi = Valor del cuartil i
Qi = xi −1 + 0,...( xi − xi −1 ) x i - 1 = observaciones anterior a x i
0,… = Parte decimal obtenida del
valor de la posición.

Elaborado por Ing. Ricardo Chura Sucojayo 4


Estadística I Facultad de Ingeniería UPDS

i.2) Cuartiles para datos tabulados: Para calcular los cuartiles de este tipo de datos
reutiliza el procedimiento siguiente:
Paso 1: Determinar la clase cuartílica según los siguientes criterios:

n
• Para el cuartil Q1 : Ni 
4
2n
• Para el cuartil Q2 : Ni 
4
3n
• Para el cuartil Q3 : Ni 
4
Paso 2: Calcular los cuartiles según las siguientes expresiones:

n 
 − N i −1 ( Q1 
)
Q1 = Li (Q1 ) +  4 w
 ni (Q1 )  ;
 
 2n 
 − N i − 1( Q 2 
)
Q2 = Li (Q2 ) +  4 w
 n i (Q2 ) 
 

 3n 
 4 − N i −1(Q3 ) 
Q3 = Li (Q3 ) +  w
 ni (Q3 ) 
 
Li ( Qi ) = Límite inferior de la clase cuartílica i.
Ni -1 ( Qi ) = Frecuencias absoluta acumulada anterior inmediata a la clase cuartílica.
ni ( Qi ) = Frecuencias absoluta de la clase cuartílica.
n = Número de datos.
w = Amplitud de clase

Elaborado por Ing. Ricardo Chura Sucojayo 5


Estadística I Facultad de Ingeniería UPDS

ii) Deciles ( Dk ) : Son los que dividen en 10 partes iguales un conjunto de datos.

Se utiliza un procedimiento similar al anterior solamente considerando que las clases y los
valores de cada decil se obtienen mediante:

kn
Posición de Dk : Ni  donde : k = 1,2,...,9
10

kn 
 10 − N i −1( Dk ) 
Dk = Li ( Dk ) +  w
 ni ( Dk ) 
 
iii) Percentiles ( Pk ) : Son los que dividen en 100 partes iguales un conjunto de datos.

Se utiliza un procedimiento similar al anterior solamente considerando que las clases y los
valores de cada percentil se obtienen mediante:

kn
Posición de Pk : Ni  donde : k = 1,2,...,99
100

 kn 
 100 − N i −1( Pk ) 
Pk = Li ( Pk ) +  w
 ni ( Pk ) 
 

Elaborado por Ing. Ricardo Chura Sucojayo 6


Estadística I Facultad de Ingeniería UPDS

MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN

1. Definición.- Las medidas de posición describen la ubicación que ocupa una distribución de
frecuencias respecto a un valor de la variable, que identifica el punto alrededor del cual se
centran los datos. Estas medidas se clasifican en:
d) Medidas de tendencia central: Son las medidas que se ubican en posiciones centrales o
intermedias entre el menor y mayor valor del conjunto de datos; entre las más usuales son: la
media aritmética, la media ponderada, la mediana y la media geométrica.

e) Medidas de localización: Estas medidas señalan la ubicación de los valores más frecuentes
o de valores extremos, los más usuales son: la moda y los cuantiles.

( )
2. Media aritmética x .- Es un valor promedio de tendencia central que se calcula según el tipo
de datos con los que se cuenta y pueden ser:

b) Media aritmética para datos no tabulados: Se define como la suma del conjunto de
observaciones dividido entre el número total de observaciones y se representa:
n

x
i =1
i
x = media aritmética
xi = observaciones diferentes
x= n = # total de observaciones
n
Ejemplo1: Los conjuntos A y B muestran las edades de los estudiantes de dos cursos de estadística,
uno de la mañana y otro de la noche. Calcular las edades promedio e indicar cuál de los grupos tiene
el mayor promedio de edad?
A : {23 25 26 22 21 23} Turno mañana ; B : {21 27 25 25 24 25 22} Turno
noche

Respuesta: En el turno de la noche la edad promedio de los estudiantes es mayor a la del turno
mañana.
NOTA: La unidad el promedio es la misma que la unidad de la variable; el promedio de
un conjunto de datos de una variable discreta puede tomar valores decimales.

Elaborado por Ing. Ricardo Chura Sucojayo 7


Estadística I Facultad de Ingeniería UPDS

Ejemplo 2: Los datos que se muestran a continuación: 71 62 50 37 8 24 19 47 81 53 16 62


50 37 4, representan el número de internados por día con problemas de COVID-19 en un hospital
de la ciudad de Santa Cruz. Determine cuál fue el promedio de internados en dicho hospital?

Respuesta:
c) Media aritmética para datos no agrupados en clases:

x n
x = media aritmética
i i xi = observaciones diferentes
i =1
x= ni = frecuencia absoluta de xi
n n = # total de observaciones
Ejemplo1: El cuadro que se muestra a continuación, representa el número de infracciones de
tránsito cometidas diariamente por conductores en una intersección de la ciudad. Con esta
información usted determine el promedio de infracciones que se presentan en dicha intersección.

INFRACCIONES POR DIA EN UN PUNTO DE LA CIUDAD


N° de N° de
infracciones conductores
xi ni
12 27
13 48
14 53
15 45
16 51
17 37
18 39
∑ = 300 ∑=

Respuesta:

Elaborado por Ing. Ricardo Chura Sucojayo 8


Estadística I Facultad de Ingeniería UPDS

Ejemplo 2: Una distribuidora de productos registro el volumen de facturación a lo largo de 25 días


laborables de un mes.
VOLUMEN DE FACTURACION DE 25 DIAS
Volumen
facturado en N° de días
miles de Bs.
10.5 2
12.4 3
13.2 6
14.8 9
15.8 4
16.5 1

f) Media aritmética para datos agrupados en clases:


n

y
i =1
i  ni
y = media aritmética
yi = marca de clase
y= ni = frecuencia absoluta de la clase i
n n = # total de observaciones

Ejemplo 1: El siguiente cuadro muestra la distribución de pesos de los clientes en un gimnasio; a


partir de esta información determinar el peso promedio de los asistentes en dicho gimnasio.
DISTRIBUCIÓN DE PESO DE LOS CLIENTES EN Kg.
N° de
Peso en Kg.
personas
]Li – Ls]
ni
45 – 50 23
50 – 55 37
55 – 60 45
60 – 65 67
65 – 70 51
70 – 75 30
75 – 80 17
n= 270 ∑=

Respuesta:

Elaborado por Ing. Ricardo Chura Sucojayo 9


Estadística I Facultad de Ingeniería UPDS

( )
3. Media ponderada x p .- Es un valor promedio que toma en cuenta la importancia (peso o
ponderación wi) que tiene cada valor sobre el total; y se calcula mediante la siguiente expresión:
n

x
i =1
i  wi xp = media ponderada
xi = observaciones diferentes
xp = n

w i =1
i
wi = Ponderación de la observación de xi
n = # total de observaciones
Ejemplo 1: Las notas en una asignatura se obtienen a través de dos exámenes parciales de igual
valor y un examen final cuyo valor es el triple que un examen parcial. Todos los exámenes se
toman sobre 100 puntos. El siguiente cuadro muestra las calificaciones obtenidas por un estudiante,
obtener la nota final.

DISTRIBUCIÓN DE CALIFICACIONES
Nota
Examen wi xi * wi
xi
1er Parcial 40
2do Parcial 35 ∑=
∑= Examen Final 70

Respuesta:

Ejemplo adicional:
DISTRIBUCIÓN DE CALIFICACIONES
Nota
Examen wi xi * wi
xi
1er Parcial 40
2do Parcial 35
Examen Final 70

∑=
∑=

Media aritmética simple:

Elaborado por Ing. Ricardo Chura Sucojayo 10


Estadística I Facultad de Ingeniería UPDS

Ejemplo 2: El siguiente cuadro muestra las calificaciones de los estudiantes A y B, además de los
créditos de 4 materias en una universidad. Con esta información determine el promedio ponderado
del semestre de ambos estudiantes
DISTRIBUCIÓN DE NOTAS POR MATERIA
NOTAS
CREDITOS
MATERIA Est. A Est. B
wi
xia xib
ECO 001 3 90 30
ADM 001 4 69 57
MAT 001 5 45 83
PSI 001 4 51 79

4. Mediana ( Md ) .- Es aquel valor que no es superado ni supera a más de la mitad de todas las
observaciones; para calcular la mediana se requiere ordenar los datos.

d) Mediana para datos no tabulados: Se debe seguir el siguiente procedimiento:

1º Ordenar los datos de forma ascendente o descendente.


n +1
2º Ubicar la posición central de los datos mediante la siguiente expresión: P = ;
2
Donde: P = posición y n = número total de observaciones.

3º Determinar la mediana según:

• Si el número de datos es impar; entonces la mediana es el valor que ocupa la posición


media calculada en el paso anterior.

Ejemplo 1: Los siguientes datos representan el número de productos que compran en un


supermercado algunos clientes 3 23 17 5 19 3 16. Determine usted el valor que es superado por
no más del 50 % de las observaciones.
Solución:

Paso 1: Ordenamos los datos:

Paso 2: Ubicamos la posición de la mediana: P=


Paso 3: La mediana es Md =

Respuesta:

Elaborado por Ing. Ricardo Chura Sucojayo 11


Estadística I Facultad de Ingeniería UPDS

• Si el número de datos es par, la mediana será igual al promedio entre los dos valores
xi −1 + xi
anterior y posterior a la posición indicada; es decir: Md =
2

Ejemplo 2: Un estudio estadístico registro los siguientes datos 7 14 9 13 5 7 6 27 31 40 32


31, que representan la cantidad de viajes por año realizadas por un grupo de turistas. Determine
usted el valor que supera a no más del 50 % de las observaciones.

Solución:
Paso 1: Ordenamos los datos:

Paso 2: Hallar la posición de la mediana:

Paso 3: Determinamos la mediana:

e) Mediana para datos tabulados no agrupados en clases: En este caso se debe construir la
tabla de frecuencias hasta la frecuencia absoluta acumulada menor que ( N i ) y luego
analizar las siguientes dos situaciones posibles:
n = # total de observaciones
n
1º Si  N i ; entonces Md = xi Ni = Frecuencia absoluta acumulada de
2 la observación i
n x + xi +1 xi = valor de la observación i
2º Si = N i ; entonces Md = i xi+1 = valor posterior a xi
2 2

Ejemplo 3: El registro estadístico de empresas tiene los datos que se muestran en el cuadro adjunto;
con esta información determine e intérprete el valor de la mediana.

DISTRIBUCIÓN DE EMPRESAS CON EMPLEADOS NO ASEGURADOS


Empleados
N° de
no
empresas
asegurados
xi
ni
30 2
40 7
50 7
60 14
70 15
80 8
90 3
n= 56

Determinamos la Posición: entonces la mediana es Md = empresas

Respuesta:

Elaborado por Ing. Ricardo Chura Sucojayo 12


Estadística I Facultad de Ingeniería UPDS

Ejemplo 4: Determinar la mediana para los datos que tiene una empresa que vende automóviles
durante los últimos 6 meses.
DISTRIBUCIÓN DE VENTAS EN LOS 6 ULTIMOS MESES
N° de N° de
movilidades vendedores Ni
xi ni
2 3
3 2
4 9
5 4
6 7
7 11
n= 36

Determinamos la Posición:

Entonces la mediana

Respuesta:

Ejemplo 5. El cuadro siguiente muestra la distribución del Número de materias aprobadas por 48
estudiantes de una carrera. Calcule el valor de la mediana y también el promedio de materias
aprobadas por los estudiantes?

DISTRIBUCIÓN DE MATERIAS APROBADAS


N° de N° de
materias estudiantes
0 5
1 10
2 9
3 8
4 5
5 7
6 4
n= 48
Para resolver

f) Mediana para datos tabulados agrupados en clases: En este caso se debe utilizar el
procedimiento y expresión siguientes:
n
1º Determinar la clase mediana mediante la expresión: N i 
2
2º Identificar los datos siguientes: Ni −1( md) ; ni ( md) ; Li ( md) ; w

Elaborado por Ing. Ricardo Chura Sucojayo 13


Estadística I Facultad de Ingeniería UPDS

3º Calcular la mediana de los datos reemplazando en la siguiente fórmula:

n 
 2 − N i −1( md) 
Md = Li ( md) + w
 ni ( md ) 
 
n = Número total de observaciones
ni = Frecuencias absoluta de la clase mediana
Li (md) = Límite inferior de la clase mediana
Ni-1 (md) = Frec. Abs. Acumulada anterior a la clase mediana
W = Amplitud de clase
Ejemplo 6. El cuadro adjunto muestra la distribución de los pesos en libras, de 50 lingotes de oro;
con esta información determine el valor de la mediana de pesos y el peso promedio de los lingotes
de oro.

DISTRIBUCIÓN DE PESOS DE LINGOTES DE ORO EN LIBRAS


Peso en N° de
Libras. lingotes Ni Clase Mediana
]Li – Ls] ni
91.5 – 92.5 4
92.5 – 93.5 11
93.5 – 94.5 20
94.5 – 95.5 9
95.5 – 96.5 6
n= 50

Paso 1: Determinamos la clase mediana:

Paso 2: Identificamos los siguientes valores:

w=

Paso 3: Calculamos el valor de la mediana:

Respuesta:

Elaborado por Ing. Ricardo Chura Sucojayo 14


Estadística I Facultad de Ingeniería UPDS

Ejemplo 7. El cuadro muestra la distribución de pesos de encomiendas recibidas por una empresa
de transporte en la terminal de buses; con esta información usted:
a) Determine el peso promedio de los equipajes.
b) ¿A partir de qué peso se encuentra el 50% del total de pesos, los más pesados? Mediana

DISTRIBUCIÓN DE PESOS DE ENCOMIENDAS EN kg.


N° de
Peso en Kg.
encomiendas
30 – 40 69
40 – 50 73
50 – 60 101
60 – 70 51
70 – 80 27
n= 321

5. Media Geométrica ( MG ) .- La media geométrica de un conjunto de “n” observaciones se


define como la raíz n-ésima del producto de las “n” observaciones. La media geométrica se
emplea generalmente para obtener los promedios de cualquier serie económica, promedios de
producción, promedios de ventas, como también para determinar las tasas promedio de
crecimiento de datos tabulados como series de tiempo.

d) Media geométrica para datos no tabulados: Si se tiene x1 , x 2 ,..., x n observaciones


positivas, entonces la media geométrica se define como:

MG = media geométrica
MG = n x1  x2  ...  xn xi = observaciones diferentes
n = # total de observaciones
Ejemplo 1. Determine la Media Geométrica y la media Aritmética para el siguiente conjunto de
datos: 2, 4, 6, 12 y 18, analice sus resultados.

e) Media geométrica para datos tabulados no agrupados en clases: Se utiliza la siguiente


expresión:

MG = x1n1  x2 n2  ...  xk nk
n
ni = frecuencia absoluta de la observación
xi
i = 1, 2, … , k

Elaborado por Ing. Ricardo Chura Sucojayo 15


Estadística I Facultad de Ingeniería UPDS

Ejemplo 2. Determine y analice, la Media Geométrica y la media Aritmética para el siguiente


conjunto de datos:

Variable Frecuencias
xi ni
1 3
2 10
3 7
n= 20

Solución:

f) Media geométrica para datos tabulados agrupados en clases: Se utiliza la siguiente expresión:
MG = y1n1  y 2 n2  ...  yk nk
n
yi = marca de clase.
i = 1, 2, … , k
Ejemplo 3. Determine usted la Media Geométrica, la media Aritmética y la mediana de las
superficies que ofrece a sus clientes un parqueo público.
DISTRIBUCIÓN DE ESPACIOS EN UN PARQUEO
N° de
Superficie
Clientes yi
m2.
ni
0–4 2
4–8 4
8 – 12 5
12 – 16 1
n= 12

Solución:

Marca de clase:

Elaborado por Ing. Ricardo Chura Sucojayo 16


Estadística I Facultad de Ingeniería UPDS

Paso 1: Determinamos la clase mediana

Paso 2: Identificamos los datos siguientes:

Paso 3: Calculamos la mediana de los datos reemplazando en la siguiente fórmula:

g) Tasa de crecimiento: Se utiliza las siguientes expresiones:

MG(FC ) = n FC1  FC2  ...  FCn MG(FC) = Media geométrica de los factores
de crecimiento
FCi = Factores de crecimiento
TASA = [ MG(FC ) − 1] 100 %

Ejemplo 4. Con la información que se muestra en el cuadro; determine usted la Tasa de crecimiento
que tuvo el PIB durante los 5 últimos años de nuestro país.
PIB DURANTE LOS ULTIMOS 5 AÑOS
Factor de
PIB
Año Crecimiento
en Bs.
FC
2017 1016
2018 1079
2019 1080
2020 1025

Solución:
Factor de crecimiento:

MG de los FC:

Tasa de crecimiento:

Respuesta:

Elaborado por Ing. Ricardo Chura Sucojayo 17


Estadística I Facultad de Ingeniería UPDS

Ejemplo 5: El director ejecutivo de una empresa aérea desea determinar la tasa de crecimiento
promedio de los ingresos con base en las cifras que se muestran en el cuadro. Si la tasa de
crecimiento promedio es menor que el promedio industrial del 10%, se asumirá una nueva campaña
publicitaria.

INGRESOS EN $us.
Factor de
Ingresos
Año Crecimiento
en $us.
FC
2015 50000
2016 55000
2017 66000
2018 60000
2019 78000

Solución:
Factor de crecimiento:

MG de los FC: $us.

Tasa de crecimiento:

Respuesta:

Elaborado por Ing. Ricardo Chura Sucojayo 18


Estadística I Facultad de Ingeniería UPDS

MEDIDAS DE DISPERSIÓN
1. Introducción. Con las medidas de centralización y localización se pueden conocer valores
centrales de un conjunto de datos y la distribución de los mismos. Estas medidas por sí solas no
bastan para ver su grado de significación o representación completa de un conjunto de datos; es
por esta razón que debemos considerar las medidas de dispersión. Antes de definir las medidas
de dispersión, conceptualizaremos algunos términos que se emplean:
a) Homogéneo: Un conjunto de datos es homogéneo cuando todos los valores son parecidos.
b) Heterogéneo: Un conjunto de datos es heterogéneo cuando sus valores son distintos y están
separados unos de otros entre sí.
c) Disperso: Un conjunto de datos es disperso cuando todos sus valores están separados unos
de otros entre sí.
d) Variabilidad: Es la condición que tiene un conjunto de datos numéricos respecto de su
grado de separación entre ellos.( A mayor variabilidad existe una mayor dispersión).
2. Definición. Son medidas que nos indican cuál es el grado de separación que existe entre los
datos. Las medidas de dispersión se dividen en: Medidas de dispersión absoluta (el rango o
recorrido, la desviación media, la desviación mediana, la varianza y la desviación estándar o
desviación típica) y Medidas de dispersión relativa (como el coeficiente de variación).

a) Rango o Recorrido ( R ) : Es la diferencia entre el valor máximo y valor mínimo de un


conjunto de datos; es decir:
R = xmax − xmin xmax = Valor máximo
xmin = Valor mínimo
El cálculo del rango presenta limitaciones debido a que sólo toma en cuenta los valores menor y
mayor, que nos puede llevar a una interpretación incorrecta.

Ejemplo 1: Determine el rango para los conjuntos de datos A y B

Conjunto A: 3 7 5 4 8 6 RA =

Conjunto B: 5 3 2 13 10 12 RB =

Respuesta: El conjunto de datos B tiene mayor dispersión con respecto al conjunto de datos A

b) Desviación cuartílica ( DQ ) : Es una medida de dispersión más exacta que la anterior y se


determina como:
Q3 − Q1 Q3 = Tercer Cuartil
DQ =
2 Q1 = Primer cuartil

Elaborado por Ing. Ricardo Chura Sucojayo 19


Estadística I Facultad de Ingeniería UPDS

Ejemplo 1: Determine la desviación cuartílica de las siguientes observaciones de notas 16, 10, 12, 8,
9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14 obtenidas de una actividad (sobre 20 puntos) en Estadística
Descriptiva de un grupo de estudiantes.

Solución:
Paso 1: Ordenamos los datos de forma ascendente o descendente.

Paso 2: Ubicamos la posición de cada cuartil según:


n +1 3(n + 1)
PQ1 =  Posición del 1º cuartil ; PQ3 =  Posición del 3º cuartil
4 4

Paso 3: Analizamos las siguientes dos situaciones:


n +1
• Si no es valor entero, entonces se debe realizar una interpolación lineal de los dos
4
valores correspondientes a las observaciones entre las cuales se encuentra dicho valor.
Fórmula de interpolación:

Determinamos el valor de la desviación cuartílica:

Respuesta:

Ejemplo 2: Para los datos que se muestran en el cuadro; determine e interprete la


desviación cuartílica.

CUADRO DE DISTRIBUCION DE FRECUENCIAS


Variable
Ni Ni
] Li – Ls ]
11 – 17 125 125
17 – 23 132 257
23 – 29 129 386
29 – 35 130 516
35 – 40 126 642
n = 642

Solución:

Elaborado por Ing. Ricardo Chura Sucojayo 20


Estadística I Facultad de Ingeniería UPDS
2
( )
c) Varianza S : Es el cociente de la sumatoria del cuadrado de las desviaciones de cada dato con
respecto a la media y dividido entre la cantidad total de datos; es decir:

c.1) Para datos no tabulados:

 (x )
n
2
i −x
i =1
Sx2 = n = Nº total de datos
n

Nota: La varianza tiene por unidad, la misma unidad que el de la variable elevada al cuadrado;
pero ésta no tiene un sentido físico para su interpretación.
c.2) Para datos tabulados no agrupados en clases:
n

(x
i =1
i − x) 2  ni
n = Nº total de datos
Sx2 =
n ni = Frecuencia absoluta de xi

c.3) Para datos tabulados agrupados en clases:


n

( y
i =1
i − y ) 2  ni
n = Nº total de datos
Sy2 = ni = Frecuencia absoluta de xi
n yi = Marca de clase

Elaborado por Ing. Ricardo Chura Sucojayo 21


Estadística I Facultad de Ingeniería UPDS

Ejemplo 1: Los datos que se muestran a continuación representan las edades de los
niños de dos kinders, calcule la varianza e indique en que kínder las edades son más
homogéneas.
Edades de niños en Kinder A: 5, 4, 5, 4, 5, 6
Edades de niños en Kinder B: 4, 4, 6, 4, 7, 4
Solución:
Calculamos la media aritmética:

Kinder A Kinder B
xi
xi

∑=
∑=

Respuesta:

Ejemplo 2: El cuadro adjunto muestra la distribución de edades de los estudiantes


universitarios de una carrera; determine usted el valor de la varianza.
DISTRIBUCIÓN DE EDADES DE UNIVERSITARIOS
N° de
EDAD
universitarios xi*ni
(xi)
ni
18 12
19 50
20 123
21 178
22 156
23 98
24 77
n = 694 ∑= ∑=

Elaborado por Ing. Ricardo Chura Sucojayo 22


Estadística I Facultad de Ingeniería UPDS

Calculamos la media aritmética:


Calculamos las diferencias al cuadrado y multiplicamos por la frecuencia de cada observación:

Calculamos la varianza:

Respuesta:

Ejemplo 3. Determine usted la varianza de los pesos de encomiendas recibidas por una empresa de
transporte en la terminal de buses; si tiene los siguientes datos:

DISTRIBUCIÓN DE PESOS DE ENCOMIENDAS EN kg.


N° de
Peso en Kg.
encomiendas
30 – 40 69
40 – 50 73
50 – 60 101
60 – 70 51
70 – 80 27
n= 321

Calculamos las marcas de clase:

Calculamos la media aritmética:

Calculamos las diferencias al cuadrado y multiplicamos por la frecuencia:

Calculamos la varianza:

Respuesta:

d) Desviación estándar ( S ) : Este es uno de los mejores indicadores de dispersión, porque


toma en cuenta a todos los elementos del conjunto, además que calcula la desviación de
cada dato respecto a la media. Se calcula como la raíz cuadrada de la varianza.

Elaborado por Ing. Ricardo Chura Sucojayo 23


Estadística I Facultad de Ingeniería UPDS

d.1) Para datos no tabulados:

 (x )
n
2
i −x
i =1
Sx = o bien Sx = Sx2
n

d.2)Para datos tabulados no agrupados en clases:


n

 (x
i =1
i − x ) 2  ni
Sx = o bien Sx = Sx2
n

d.3)Para datos tabulados agrupados en clases:


n

(y
i =1
i − y ) 2  ni
Sy = o bien Sy = Sy2
n

Ejemplos: Para los 3 ejemplos que utilizó en el cálculo de la varianza; determine usted la
desviación estándar

Ejemplo 1: Los datos que se muestran a continuación representan las edades de los
niños de dos kinders, calcule la varianza e indique en que kínder las edades son más
homogéneas.
Edades de niños en Kinder A: 5, 4, 5, 4, 5, 6
Edades de niños en Kinder B: 4, 4, 6, 4, 7, 4

Determine la desviación estándar

Solución:

Respuesta: Las edades del Kinder A son más homogéneas.

Ejemplo 2: El cuadro adjunto muestra la distribución de edades de los estudiantes


universitarios de una carrera; determine usted el valor de la desviación estándar.

Ejemplo 3. Determine usted la desviación estándar de los pesos de encomiendas recibidas por una
empresa de transporte en la terminal de buses; si tiene los siguientes datos:

Elaborado por Ing. Ricardo Chura Sucojayo 24


Estadística I Facultad de Ingeniería UPDS

e) Coeficiente de variación ( CV ) : Es una medida de dispersión relativa que se emplea para


comparar la variabilidad de dos o más conjuntos de datos, expresados en diferentes unidades de
medida. El coeficiente de variación es expresado generalmente como porcentaje y se calcula
mediante las siguientes expresiones:

e.1) Para datos tabulados no agrupados en clases:

Sx x = Media aritmética
CV = 100[%]
x S x = Desviación estandar

e.2) Para datos tabulados agrupados en clases:

Sy y = Media aritmética
CV = 100[%]
y S y = Desviación estandar

Ejemplo: Si consideramos dos distribuciones cuyas medias aritméticas son: X 1 = 24,5 y

X 2 = 40 , además sus desviaciones standard son idénticas, S1 = 2 y S2 = 2 . Determine
usted el coeficiente de variación en cada caso e interprete.
Solución:
Grupo A Grupo B
− −
X 1 = 24,5 X 2 = 40
S1 = 2 S2 = 2

Calculamos el CV.

Respuesta:

Elaborado por Ing. Ricardo Chura Sucojayo 25


Estadística I Facultad de Ingeniería UPDS

SIMETRIA Y CURTOSIS
1. Medidas de Asimetría. El concepto de asimetría de una distribución de frecuencias, indica la
deformación horizontal (o sesgo) que tienen los datos respecto al punto central. En una
distribución se pueden presentar los siguientes casos:

a) Distribución simétrica: Una distribución es simétrica, cuando el polígono de frecuencias


está simétricamente dispuesto respecto a un eje vertical; es decir que:

x = Md = Mo
b) Asimetría Positiva (a la derecha): Una distribución de frecuencias unimodal presenta una
asimetría positiva, si se tiene una ramificación más extendida hacia la derecha del conjunto
de observaciones; es decir que:
Mo  Md  x
c) Asimetría Negativa (a la izquierda): Una distribución de frecuencias unimodal presenta
una asimetría negativa, si se tiene una ramificación más extendida hacia la izquierda del
conjunto de observaciones; es decir que:
x  Md  Mo
2. Coeficiente de Pearson ( CP ) . Este coeficiente determina el grado de asimetría que presenta
una distribución de frecuencias unimodal y se calcula mediante las siguientes expresiones:

CP =
(
3 x − Md ) ó CP =
x − Mo
S S
x = Media aritmética
Md = Mediana
Dónde: Mo = Moda
S = Desviación estandar
Para la interpretación del Coeficiente de Pearson se analiza lo siguiente:

• Si el CP = 0 , entonces la distribución es simétrica.


• Si el CP  0 , entonces la distribución tiene asimetría positiva.
• Si el CP  0 , entonces la distribución tiene asimetría negativa.

Elaborado por Ing. Ricardo Chura Sucojayo 26


Estadística I Facultad de Ingeniería UPDS

Ejemplo 1: Los datos del cuadro adjunto muestran la distribución de las edades de los
niños en una escuela, determinar la simetría e interpretar.
DISTRIBUCIÓN DE EDADES
N° de
Edad niños
xi ni
4 4
5 6
6 9
7 6
8 4
n = 29
Solución:

Calculamos o de la media:
Calculamos la moda:

Calculamos el CP para determinar el Sesgo

Respuesta:

Ejemplo 2: Los ingresos anuales de 40 familias se muestran en el cuadro adjunto; con


esta información determine usted la asimetría o sesgo que presenta.
DISTRIBUCIÓN DE INGRESOS EN Bs.
Ingreso en N° de
Miles de Bs. familias
20 – 25 2
25 – 30 8
30 – 35 12
35 – 40 7
40 – 45 5
45 – 50 4
50 – 55 2
n= 40

Solución:

Calculamos o de la media:

Elaborado por Ing. Ricardo Chura Sucojayo 27


Estadística I Facultad de Ingeniería UPDS

Calculamos la moda:

w=

Calculamos la Desviación estándar:

Calculamos el CP para determinar el Sesgo

Respuesta:

3. CURTOSIS. Se entiende por curtosis a la medida de deformación vertical que presenta una
distribución de frecuencias; es decir que la curtosis es la medida de apuntamiento o achatamiento
de una distribución de frecuencias y se presentan los siguientes casos:

a) Mesocúrtica: Se llama así a la curva de distribución normal, cuya característica principal es


que la desviación estándar es moderada y se observa una distribución con apuntalamiento
moderado.

Elaborado por Ing. Ricardo Chura Sucojayo 28


Estadística I Facultad de Ingeniería UPDS

b) Platicúrtica: Es una curva más achatada que la normal, su característica es que la


desviación estándar es grande y se observa una distribución aplanada, ya que la diferencia
entre los percentiles (P90 − P10 ) tiende a ser mayor que la diferencia entre los cuartiles
(Q3 − Q1 ) .

c) Leptocúrtica: Es una curva más alargada que la normal, su característica es que la


desviación estándar es pequeña y se observa un alto apuntalamiento de los datos, ya que la
diferencia entre los cuartiles (Q3 − Q1 ) tiende a ser igual a la diferencia entre los
percentiles (P90 − P10 ) .

NOTA: Para determinar el coeficiente de curtosis de una distribución de frecuencias se utiliza la


siguiente expresión:
K = Coeficiente de curtosis
Q1 = Primercuartil

K=
( Q3 −Q1 ) Q3 = T ercercuartil
2  (P90 − P10 ) P10 = Percentil10º
P90 = Percentil90º

Para clasificar la distribución de frecuencias según la curtosis se analiza lo siguiente:

• Si K  0.25 , entonces la distribución es platicúrtica. ( es decir que K tienda a cero)


• Si K = 0.25 , entonces la distribución es mesocúrtica. ( es decir que K tienda a 0.25)
• Si K  0.25 , entonces la distribución es leptocúrtica. ( es decir que K tienda a 0.5)

Elaborado por Ing. Ricardo Chura Sucojayo 29


Estadística I Facultad de Ingeniería UPDS

Ejemplo 1: Si una distribución de frecuencia tiene los siguientes indicadores de posición:


Q1 = 268,25 Kg P10 = 258,12 Kg
Q3 = 290,75 Kg. P90 = 301 Kg.
Determine usted el coeficiente de curtosis e identifique qué tipo de distribución presenta.
Solución:

Interpretación:

Elaborado por Ing. Ricardo Chura Sucojayo 30


Estadística I Facultad de Ingeniería UPDS

SOLUCIÓN DEL EJEMPLO PROPUESTO


Ejemplo 1: Los datos del cuadro adjunto muestran la distribución de las edades de los
niños en una escuela, determinar la simetría e interpretar.
DISTRIBUCIÓN DE EDADES
N° de
Edad niños xi * ni
xi ni
4 4 16
5 6 30
6 9 54
7 6 42
8 4 32
n = 29 ∑= 174
Solución:

Calculamos o de la media:
Calculamos la moda: Ubicando la frecuencia más alta identificamos que la moda es 6 años
Calculamos el CP para determinar el Sesgo:
Respuesta: La distribución de las edades de los niños es SIMETRICA.

Ejemplo 2: Los ingresos anuales de 40 familias se muestran en el cuadro adjunto; con


esta información determine usted la asimetría o sesgo que presenta.
DISTRIBUCIÓN DE INGRESOS EN Bs.
N° de
Ingreso en Marca de clase
familias yi * ni
Miles de Bs. yi
ni
20 – 25 2 22.5 45.0 343.22
25 – 30 8 ni-1 27.5 220.0 524.88
30 – 35 12 ni 32.5 390.0 115.32
35 – 40 7 ni+1 37.5 262.5 25.27
40 – 45 5 42.5 212.5 238.05
45 – 50 4 47.5 190.0 566.44
50 – 55 2 52.5 105.0 571.22
n= 40 ∑= 1425 ∑= 2384.4

Solución:

Calculamos la media aritmética:

miles de Bs.

Calculamos la moda:

Elaborado por Ing. Ricardo Chura Sucojayo 31


Estadística I Facultad de Ingeniería UPDS

w = 25-20= 5 amplitud de clase


Reemplazamos en la ecuación de la moda:

Calculamos la Desviación estándar:

Calculamos el CP para determinar el Sesgo:

Si el CP  0 , entonces la distribución tiene asimetría


positiva.

Respuesta: La distribución de ingresos de las 40 familias tiene una asimetría positiva


(asimetría hacia la derecha)

Ejemplo 1: Si una distribución de frecuencia tiene los siguientes indicadores de posición:


Q1 = 268,25 Kg P10 = 258,12 Kg
Q3 = 290,75 Kg. P90 = 301 Kg.
Determine usted el coeficiente de curtosis e identifique qué tipo de distribución presenta.
Solución:

Interpretación: La distribución de frecuencias de peso en Kg. es LEPTOCURTICA.

Elaborado por Ing. Ricardo Chura Sucojayo 32

También podría gustarte