Está en la página 1de 33

Análisis Univariable

Profesora: Loreto Montealegre Vera


Medidas de
Posición
Definición: Ejemplo:
Las medidas de posición 1.- En economía se utiliza
principalmente para definir sectores
dividen la distribución en socioeconómicos según ingreso per
partes iguales y sirven para cápita familiar (por ejemplo quintiles,
clasificar a un individuo o deciles).
elemento dentro de una
determinada población o
muestra.
Cuartil 𝑄𝑘

Definición
Los cuartiles son 3, los que dividen los
datos ordenados en 4 partes.
Los cuartiles son datos bajos los
cuales se acumula el 25%, 50% y el
75% de los datos estudiados, se
representan como Q1, Q2 y Q3
respectivamente.
Quintil

Definición
Los quintiles son 4, los que dividen
los datos ordenados en 5 partes.
Los quintiles son datos bajos los
cuales se acumula el 20%, 40%, 60% y
el 80% de los datos estudiados.
Decil

Definición
Los deciles son 9, los que dividen los
datos ordenados en 10 partes.
Los deciles son datos bajos los cuales
se acumula el 10%, 20%, … y el 90%
de los datos estudiados.
Percentil

Definición
Los percentiles son 99, los que
dividen los datos ordenados en 100
partes.
Los percentiles son datos bajos los
cuales se acumula el 1%, 2 %, 3%, …,
100% de los datos estudiados.
¿Como lo interpreto?
Ejemplos medidas de posición:

Ingresos por decil en Chile


Datos No Agrupados
Calculo de medidas de posición para datos
no agrupados:
Cálculo de cuartiles: Calculo de quintiles:
Cuando n es impar Cuando n es par
Cuando n es impar Cuando n es par
𝒌(𝒏 + 𝟏) 𝒌𝒏
𝑸𝒌 ; 𝒙 = 𝑸𝒌 ; 𝒙 = 𝒌(𝒏 + 𝟏) 𝒌𝒏
𝟒 𝟒 𝑸𝒌 ; 𝒙 = 𝑸𝒌 ; 𝒙 =
𝟓 𝟓
1(𝑛 + 1) 𝑛
𝑄1 ; 𝑥 = 𝑄1 ; 𝑥 = 1(𝑛 + 1) 𝑛
4 4 𝑄1 ; 𝑥 = 𝑄1 ; 𝑥 =
4 5
2(𝑛 + 1) 2𝑛
𝑄2 ; 𝑥 = 𝑄2 ; 𝑥 = 2(𝑛 + 1) 2𝑛
4 4 𝑄2 ; 𝑥 = 𝑄2 ; 𝑥 =
5 5
3(𝑛 + 1) 3𝑛
𝑄3 ; 𝑥 = 𝑄3 ; 𝑥 = 3(𝑛 + 1) 3𝑛
4 4 𝑄3 ; 𝑥 = 𝑄3 ; 𝑥 =
5 5
Si el resultado anterior (x) no tiene decimales, el quintil, cuartil,
decil o percentil se obtiene seleccionando el valor de la muestra que 4(𝑛 + 1) 4𝑛
𝑄4 ; 𝑥 = 𝑄3 ; 𝑥 =
ocupa la posición x. 5 5
Si el resultado (x) tiene decimales, el quintil, cuartil, decil o percentil
se obtiene haciendo la media de las muestras en posición x y x+1
Calculo de medidas de posición para datos
no agrupados:
Cálculo de Deciles: Cálculo de Percentiles:
Cuando n es impar Cuando n es par Cuando n es impar Cuando n es par

𝒌(𝒏 + 𝟏) 𝒌𝒏 𝒌(𝒏 + 𝟏) 𝒌𝒏
𝑫𝒌 ; 𝒙 = 𝑫𝒌 ; 𝒙 = 𝑷𝒌 ; 𝒙 = 𝑷𝒌 ; 𝒙 =
𝟏𝟎 𝟏𝟎 𝟏𝟎𝟎 𝟏𝟎𝟎
1(𝑛 + 1) 𝑛 1(𝑛 + 1) 𝑛
𝐷1 ; 𝑥 = 𝐷1 ; 𝑥 = 𝑃1 ; 𝑥 = 𝑃1 ; 𝑥 =
10 10 100 100
2(𝑛 + 1) 2𝑛 2(𝑛 + 1) 2𝑛
𝐷2 ; 𝑥 = 𝐷2 ; 𝑥 = 𝑃2 ; 𝑥 = 𝑃2 ; 𝑥 =
10 10 100 100
° °
° °
° °
9(𝑛 + 1) 9𝑛 99(𝑛 + 1) 99𝑛
𝐷9 ; 𝑥 = 𝐷9 ; 𝑥 = 𝑃99 ; 𝑥 = 𝑃99 ; 𝑥 =
10 10 100 100
Ejemplo cálculo de medidas de posición: Cuartil

Calcular el cuartil 2 (𝑄2 ) de las siguientes muestras de notas en matemática de un curso (notas de 1 a 7):
1, 1, 3, 1, 6, 7, 2, 2, 2, 1, 4, 7, 2, 3, 5
Ordenamos de menor a mayor: 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 5, 6, 7, 7

𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 = 15 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠


2(𝑛+1) 2·(15+1)
x= = =8
4 4

Como 𝑥 = 8, entonces el 𝑄2 =2
Ejemplo cálculo de medidas de posición: Quintil

Calcular el quintil 3 (𝑄3 ) de las siguientes muestras de notas en matemática de un curso


(notas de 1 a 7):
1, 1, 3, 1, 6, 7, 2, 2, 2, 1, 4, 7, 2, 3, 5
Ordenamos de menor a mayor: 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 5, 6, 7, 7
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 = 15 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
3(𝑛+1) 3·(15+1)
x= = = 9,6
5 5

Como 𝑥 = 9,6 es un número con decimales, entonces debo obtener la media entre las
posiciones 9 y 10, entonces el 𝑄3 = 3
Ejemplo cálculo de medidas de posición: Decil

Calcular el decil 5 (𝐷5 ) de las siguientes muestras de notas en matemática de un curso (notas
de 1 a 7):
1, 1, 3, 1, 6, 7, 2, 2, 2, 1, 4, 7, 2, 3, 5
Ordenamos de menor a mayor: 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 5, 6, 7, 7
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 = 15 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
5(𝑛+1) 5·(15+1)
x= = =8
10 10

Como 𝑥 = 8 , entonces el 𝐷5 = 2
Ejemplo cálculo de medidas de posición: Percentil

Calcular el percentil 25 (𝑃25 ) de las siguientes muestras de notas en matemática de un curso


(notas de 1 a 7):
1, 1, 3, 1, 6, 7, 2, 2, 2, 1, 4, 7, 2, 3, 5
Ordenamos de menor a mayor: 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, 5, 6, 7, 7
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 = 15 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
25(𝑛+1) 25·(15+1)
x= = =4
100 100

Como 𝑥 = 4 , entonces el 𝑃25 = 1


Datos Agrupados
Calculo de medidas de posición para datos
agrupados:

Cuartiles: Quintiles
𝑛 𝑛
𝑘 −𝐹𝑘−1 𝑘 −𝐹𝑘−1
4 5
𝑄𝑘 =𝐿𝑘 +a· 𝑄𝑘 =𝐿𝑘 +a·
𝑓𝑘 𝑓𝑘
k= 1,2,3 k= 1,2,3
Donde: Donde:
𝐿𝑘 = Límite real inferior de la clase del cuartil k 𝐿𝑘 = Límite real inferior de la clase del quintil k
n = Número de datos n = Número de datos
𝐹𝑘 = Frecuencia acumulada de la clase que antecede a la 𝐹𝑘 = Frecuencia acumulada de la clase que antecede a la
clase del cuartil k. clase del quintil k.
𝑓𝑘 = Frecuencia de la clase del cuartil k 𝑓𝑘 = Frecuencia de la clase del quintil k
a = Longitud del intervalo de la clase del cuartil k a = Longitud del intervalo de la clase del quintil k
Calculo de medidas de posición para datos
agrupados:

Deciles: Percentil
𝑛 𝑛
𝑘 −𝐹𝑘−1 𝑘 −𝐹𝑘−1
10 100
𝐷𝑘 =𝐿𝑘 +a· 𝑃𝑘 =𝐿𝑘 +a·
𝑓𝑘 𝑓𝑘
k= 1,2,3 k= 1,2,3
Donde: Donde:
𝐿𝑘 = Límite real inferior de la clase del decil k 𝐿𝑘 = Límite real inferior de la clase del percentil k
n = Número de datos n = Número de datos
𝐹𝑘 = Frecuencia acumulada de la clase que antecede a la 𝐹𝑘 = Frecuencia acumulada de la clase que antecede a la
clase del decil k. clase del percentil k.
𝑓𝑘 = Frecuencia de la clase del decil k 𝑓𝑘 = Frecuencia de la clase del percentil k
a = Longitud del intervalo de la clase del decil k a = Longitud del intervalo de la clase del percentil k
Ejemplo:

Salario fi Fi Calcular el séptimo decil:


(M$)
𝑛
200-299 85 85 𝑘 −𝐹𝑘−1
10
𝑄𝑘 =𝐿𝑘 +a·
300-399 90 175 𝑓𝑘

400-499 120 295 1º PASO Se determina el intervalo al cual pertenece el


decil a calcular :
500-599 70 365 𝑛+1 464
7∙ =7∙ = 324,8.
10 10
600-699 62 427
Entonces el decil está en el intervalo 500 − 599, porque
700-800 36 463 365 es la 𝐹𝑖 más pequeña que contiene al 324,1.
Salario fi Fi 2º PASO Se determina el límite inferior del intervalo en
(M$)
el que se encuentra k.
200-299 85 85

300-399 90 175 𝐿7 = 500


400-499 120 295 3º PASO Se determina la frecuencia absoluta del
intervalo donde se encuentra k.
500-599 70 365

600-699 62 427
𝑓𝑖 = 70
700-800 36 463
Salario fi Fi 4º PASO Se determina la frecuencia acumulada del
(M$)
intervalo anterior al que se encuentra k.
200-299 85 85

300-399 90 175 𝐹𝑖−1 =295


400-499 120 295 5º PASO Calcular la amplitud del intervalo donde se
encuentra k.
500-599 70 365

600-699 62 427 a= 599 − 500


700-800 36 463
Salario fi Fi 6º Paso Reemplazar los datos en la fórmula.
(M$) 𝑛 464
𝑘 −𝐹𝑘−1 7 −295
200-299 85 85 10 10
𝑄𝑘 =𝐿𝑘 +a· 𝑄𝑘 =500 + 99 ·
𝑓𝑘 70
300-399 90 175

400-499 120 295


7 46,3 − 295
𝑄𝑘 = 500 + 99 ·
500-599 70 365
70
29,8
600-699 62 427
𝑄𝑘 = 500 + 99 ·
700-800 36 463
70
𝑄𝑘 = 500 + 42,14 = 542,14
Salario fi Fi
(M$)
200-299 85 85 7º Paso Interpretar:

300-399 90 175 El 70% de los trabajadores tiene


400-499 120 295
un salario igual o inferior a 542,14
500-599 70 365

600-699 62 427

700-800 36 463
Ejercicio:

Calcular e interpretar el 3º decil y el cuarto quintil:


Salario fi Fi
(M$)
200-299 85 85

300-399 90 175

400-499 120 295

500-599 70 365

600-699 62 427

700-800 36 463
Medidas de
Dispersión
Definición:

Estas medidas indicarán por un lado el En cambio, si se obtiene un valor


grande, significará que los valores no
grado de variabilidad que hay en la
están concentrados, sino dispersos (por
muestra y, por otro, la lo que habrá mucha variabilidad y el
representatividad de dicho punto centro no será muy representativo).
central, ya que si se obtiene un valor
pequeño, eso significará que los valores
se concentran entorno a ese centro (por
lo que habrá poca variabilidad y el
centro representará bien a todos).
Varianza

Es otra medida de dispersión que corresponde al cuadrado de la desviación estándar.

Datos no agrupados Datos agrupados en tablas de frecuencia


𝒇𝟏 ∙ 𝒙𝟏 − 𝒙 𝟐 ഥ 𝟐 + ⋯ + 𝒇𝒏 ∙ 𝒙𝒏 − 𝒙
+ 𝒇𝟐 ∙ 𝒙𝟐 − 𝒙 ഥ 𝟐

𝒙𝟏 − 𝒙 𝟐 ഥ 𝟐 + ⋯ + (𝒙𝒏 − 𝒙
+ 𝒙𝟐 − 𝒙 ഥ)𝟐 𝝈𝟐 =
𝝈𝟐 = 𝒏−𝟏
𝒏−𝟏
Donde 𝒙𝒊 es dato
𝒇𝒊 es frecuencia

Observación:
1.- El valor de la varianza es siempre un número no negativo.
2.- Al trabajar con datos agrupados en intervalos se utiliza la marca de clase
de cada uno de ellos, en lugar de 𝑥𝑖
Ejemplo para datos no agrupados

Los siguientes son los puntajes de un grupo de adolescentes en un test de Agudeza Visual:
25, 12, 15, 23, 24, 39, 13, 31, 19, 16.
Calcula la varianza.

PASO 1: Calcular la media aritmética.


25 + 12 + 15 + 23 + 24 + 39 + 13 + 31 + 19 + 16 217
𝑥ҧ = = = 21,7
10 10
ഥ 𝟐.
PASO 2: Calcular 𝒙𝟏 − 𝒙

𝟐 𝟐 𝟐 𝟐
𝟐𝟓 − 𝟐𝟏, 𝟕 = 𝟏𝟎, 𝟖𝟗 𝟏𝟐 − 𝟐𝟏, 𝟕 = 𝟗𝟒, 𝟎𝟗 𝟏𝟓 − 𝟐𝟏, 𝟕 = 𝟒𝟒, 𝟖𝟗 𝟐𝟑 − 𝟐𝟏, 𝟕 = 𝟏, 𝟔𝟗
𝟐 𝟐 𝟐 𝟐
𝟐𝟒 − 𝟐𝟏, 𝟕 = 𝟓, 𝟐𝟗 𝟑𝟗 − 𝟐𝟏, 𝟕 = 𝟐𝟗𝟗, 𝟐𝟗 𝟏𝟑 − 𝟐𝟏, 𝟕 = 𝟕𝟓, 𝟔𝟗 𝟑𝟏 − 𝟐𝟏, 𝟕 = 𝟖𝟔, 𝟒𝟗
𝟏𝟗 − 𝟐𝟏, 𝟕 𝟐 = 𝟕, 𝟐𝟗 𝟏𝟔 − 𝟐𝟏, 𝟕 𝟐 = 𝟑𝟐, 𝟒𝟗

PASO 3: Sumar resultados y dividir por la cantidad de datos.


658,71
𝜎= = 73,19
9
Desviación Típica o Estándar.

Es una medida de dispersión y nos indica cuánto tienden a alejarse los datos del promedio aritmético.
Para calcular la desviación estándar (𝜎) se utiliza la siguiente fórmula:

Datos no agrupados Datos agrupados en tablas de frecuencia


𝒙𝟏 − 𝒙 𝟐 ഥ 𝟐 + ⋯ + (𝒙𝒏 − 𝒙
+ 𝒙𝟐 − 𝒙 ഥ)𝟐 𝟐

𝒇𝟏 ∙ 𝒙𝟏 − 𝒙 ഥ 𝟐 + ⋯ + 𝒇𝒏 ∙ 𝒙𝒏 − 𝒙
+ 𝒇𝟐 ∙ 𝒙𝟐 − 𝒙 ഥ 𝟐
𝝈= 𝝈=
𝒏−𝟏 𝒏−𝟏

Donde 𝑥𝑖 es dato
𝑓𝑖 es frecuencia
Observación:
Al trabajar con datos agrupados en intervalos se utiliza la
marca de clase de cada uno de ellos, en lugar de 𝑥𝑖
Ejemplo para datos no agrupados

Los siguientes son los puntajes de un grupo de adolescentes en un test de Agudeza Visual:
25, 12, 15, 23, 24, 39, 13, 31, 19, 16.
Calcula la desviación estándar.
PASO 1: Calcular la media aritmética.
25 + 12 + 15 + 23 + 24 + 39 + 13 + 31 + 19 + 16 217
𝑥ҧ = = = 21,7
10 10

ഥ 𝟐.
PASO 2: Calcular 𝒙𝟏 − 𝒙
𝟐 𝟐 𝟐 𝟐
𝟐𝟓 − 𝟐𝟏, 𝟕 = 𝟏𝟎, 𝟖𝟗 𝟏𝟐 − 𝟐𝟏, 𝟕 = 𝟗𝟒, 𝟎𝟗 𝟏𝟓 − 𝟐𝟏, 𝟕 = 𝟒𝟒, 𝟖𝟗 𝟐𝟑 − 𝟐𝟏, 𝟕 = 𝟏, 𝟔𝟗
𝟐𝟒 − 𝟐𝟏, 𝟕 𝟐 = 𝟓, 𝟐𝟗 𝟑𝟗 − 𝟐𝟏, 𝟕 𝟐 = 𝟐𝟗𝟗, 𝟐𝟗 𝟏𝟑 − 𝟐𝟏, 𝟕 𝟐 = 𝟕𝟓, 𝟔𝟗 𝟑𝟏 − 𝟐𝟏, 𝟕 𝟐 = 𝟖𝟔, 𝟒𝟗
𝟐 𝟐
𝟏𝟗 − 𝟐𝟏, 𝟕 = 𝟕, 𝟐𝟗 𝟏𝟔 − 𝟐𝟏, 𝟕 = 𝟑𝟐, 𝟒𝟗
PASO 3: Sumar resultados y dividir por la cantidad de datos.
658,71
𝜎= = 73,19
9

PASO 4: Obtener el valor de la raíz del resultado.


𝜎 = 73,19
𝜎 = 8,55