Está en la página 1de 50

CUARTILES

EJEMPLO 2

Los datos nutricionales acerca de una muestra de siete cereales


para el desayuno incluyen el número de calorías por porción,
datos que se muestran a continuación:
Posición 1 2 3 4 5 6 7
Dato 80 100 100 110 130 190 200
Se desea conocer las posiciones del primer y tercer cuartil
CUARTILES
SOLUCIÓN EJEMPLO 2
Primer cuartil:
7+1
𝑄1 = = 2𝑑𝑜 𝑣𝑎𝑙𝑜𝑟 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑜
4
Aplicando la regla 1, se sabe que el 𝑄1 es el segundo valor
ordenado. Por lo tanto, el primer cuartil corresponde a 100
calorías, el cual nos indica que el 25% de los cereales tienen
calorías que son menores que o iguales a 100, y el 75% tienen
calorías que son mayores que o iguales a 100.
CUARTILES
SOLUCIÓN EJEMPLO 2
Tercer cuartil:
3(7 + 1)
𝑄3 = = 6𝑡𝑜 𝑣𝑎𝑙𝑜𝑟 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑜
4
Aplicando la regla 1, se sabe que el 𝑄3 es el sexto valor ordenado. Por lo
tanto, el tercer cuartil corresponde a 190 calorías, el cual nos indica que el
75% de los cereales tienen calorías que son menores que o iguales a 190, y
el 25% tienen calorías que son mayores que o iguales a 190.
PERCENTILES
PERCENTILES

GENERALIDADES
•Como segunda medida de posición
tenemos el percentil, medida que
aporta información acerca de la
dispersión de los datos en el intervalo
que va del menor al mayor de los datos.
PERCENTILES

GENERALIDADES
• En los conjuntos de datos que no tienen muchos valores
repetidos, el percentil (p) divide los datos en dos partes.
• Cerca de p por ciento de las observaciones tienen
valores menores que el percentil p y aproximadamente
(100 – p) por ciento de las observaciones tienen valores
mayores que el percentil p.
Cálculo del percentil p
PERCENTILES

FORMA DE CÁLCULO
Paso 1: Ordenar los datos de menor a mayor, de la misma
forma que para calcular la mediana o los cuartiles.
Paso 2: Calcular el índice i
𝑝
𝑖= 𝑛
100
Dónde p es el percentil deseado y n es el número de
observaciones.
PERCENTILES

FORMA DE CÁLCULO
Paso 3: (a) Si i no es un número entero, se debe
redondearlo. El primer entero mayor que i denota la
posición del percentil p.
(b) Si i es un número entero, el percentil p es el promedio
de los valores en las posiciones i e i + 1.
Veamos el siguiente ejemplo
PERCENTILES
EJEMPLO 1

A continuación se muestra los salarios


iniciales de 12:
3.310 3.355 3.450 3.480 3.480 3.490 3.520 3.540 3.550 3.650 3.730 3.925

Se desea determinar el percentil 85


PERCENTILES
SOLUCIÓN EJEMPLO 1
Paso 1: Ordenar los datos de menor a mayor
Paso 2: Calcular el percentil utilizando la fórmula correspondiente:
𝑝 85
𝑖= 𝑛= 12 = 𝟏𝟎, 𝟐
100 100
Paso 3: Como i no es un número entero, se debe redondear. La posición del percentil 85 es el
primer entero mayor que 10,2, es la posición 11.
Observamos ahora los datos, entonces el percentil 85 es el dato en la posición 11, es decir,
3.730
Por lo tanto, se puede decir que alrededor del 85% (percentil 85) de los egresados obtuvieron
un salario inicial menor a los $ 3.730, y el 15% restante un salario inicial mayor a tal monto.
Consideraciones importantes
PERCENTILES

Consideraciones
Existen exactitudes entre los cuatro cuartiles y
percentiles específicos.
El 𝑄1 se define como el percentil 25, dado que
concuerdan exactamente con la posición del dato
buscado.
El 𝑄2 se define como el percentil 50, por la misma
coincidencia.
El 𝑄3 se define como el percentil 75, por la misma
coincidencia.
El 𝑄4 se define como el percentil 100, por la
misma similitud.
Se puede apreciar tales similitudes mediante la
siguiente ilustración:
UNIDAD N° 4:
MEDIDAS DE DISPERSIÓN O
VARIABILIDAD
¿Por qué estudiar la
dispersión de los datos?
Veamos el siguiente ejemplo
Medidas de dispersión
1. La siguiente tabla Observación x y
corresponde a las
edades de dos Individuo 1 14 2
grupos de Individuo 2 16 4
individuos Individuo 3 18 5
representados en Individuo 4 20 39
las distribuciones Individuo 5 22 40
unitarias (x) y (y) Suma de edades 90 90
Media aritmética 18 18
¿Qué podemos observar del
ejemplo anterior?
Medidas de dispersión
Si nos basamos en el promedio de
ambos grupos es el mismo para ambos, Observación x y
pero si nos fijamos en las edades el
primer grupo podría corresponder a las Individuo 1 14 2
edades de jóvenes, sin embargo, el Individuo 2 16 4
segundo grupo podría corresponder a
los miembros de una familia. Por Individuo 3 18 5
consiguiente, la media aritmética no Individuo 4 20 39
nos muestra la realidad de los datos, Individuo 5 22 40
dado que los valores en el segundo
grupo varían o están demasiados Suma de edades 90 90
dispersos con respecto a la media. Media aritmética 18 18
En efecto, es necesario conocer la
dispersión de los datos con respecto
a la media
Medidas de dispersión
Es la medida que nos muestra la lejanía o cercanía que tienen un
conjunto de datos respecto a su media o posición central.
Las medidas de variabilidad más importantes son:
• Rango
• Rango intercuartílico
• Varianza
• Desviación típica o estándar
RANGO
RANGO

GENERALIDADES
•Es una medida de distancia, dónde, muestra la
diferencia entre el valor máximo y el valor
mínimo. La fórmula es la siguiente:
𝑅𝑎𝑛𝑔𝑜 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜
Veamos el siguiente ejemplo
RANGO
Sueldo Sueldo
Egresado
Mensual
Egresado
Mensual EJEMPLO 1
Inicial Inicial
($) ($)
Se presenta a
1 3.450 7 3.490 continuación una tabla
2 3.550 8 3.730 de frecuencias de los
3 3.650 9 3.540 salarios iniciales de 12
4 3.480 10 3.925
egresados de las carreras
5 3.355 11 3.520
de ciencias económicas y
empresariales.
6 3.310 12 3.480
RANGO

SOLUCIÓN EJEMPLO 1
Primeramente, debemos ordenar los datos de forma ascendente:

3.310 3.355 3.450 3.480 3.480 3.490 3.520 3.540 3.550 3.650 3.730 3.925

Luego, identificamos los valores extremos (valor más grande y valor más pequeño),
posteriormente, reemplazamos en la fórmula para el cálculo correspondiente:
𝑅𝑎𝑛𝑔𝑜 = 3.925 − 3.310 = $𝟔𝟏𝟓
La distancia entre los ingresos del egresado 1 al egresado 12 es de $615.
Para tomar en consideración
RANGO
CONSIDERACIONES
•El rango es una medida muy débil y sensible a
los valores extremos en un conjunto de datos,
dado que solo toma como referencia dos
valores, además, no refleja realmente la
variación entre todos los valores.
RANGO INTERCUARTÍLICO
RANGO INTERCUARTÍLICO

GENERALIDADES
• Denominado rango intercuartil, dispersión media o RIC. Es
una medida que no es sensible por los valores extremos, a
diferencia del rango, dado que considera los valores medios
que corresponden al tercer cuartil 𝑄3 y primer cuartil 𝑄1 .
• De manera más precisa, es la diferencia entre el 𝑄3 y el 𝑄1 .
Por lo tanto:
𝑅𝐼𝐶 = 𝑄3 − 𝑄1
Veamos el siguiente ejemplo
RANGO INTERCUARTÍLICO
En un intento de aumentar las EJEMPLO 1
ventas en un centro comercial
local, la dirección recogió
datos sobre el tiempo que
pasaban los compradores en el
centro. Se calculó el tiempo de
una muestra aleatoria de n =
104 compradores y los
resultados (en minutos) se
muestran en la tabla siguiente:
RANGO INTERCUARTÍLICO

SOLUCIÓN EJEMPLO 1
Ordenando los datos y aplicando las fórmulas correspondientes
para determinar el tercer y primer cuartil, se obtuvo lo siguiente:
𝑄3 = 56,5 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝑄1 = 28,5 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
Reemplazando en la fórmula del RIC se obtuvo:
𝑅𝐼𝐶 = 𝑄3 − 𝑄1 = 56,5 − 28,5 = 28 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
La dispersión media que presenta los datos es de 28 minutos.
¿Cuáles son las medidas de
dispersión que consideran todos los
datos en el cálculo?
La varianza y desviación
estándar
VARIANZA
VARIANZA

GENERALIDADES
• Es el promedio de las desviaciones con respecto a la
media elevadas al cuadrado.
• Demuestra la diferencia que presenta el valor de cada
observación con la media.
• La fórmula para determinar la varianza es diferente
para una población como para una muestra.
Fórmulas para calcular la
varianza poblacional
Varianza poblacional
• Para un simple conjunto Dónde:
de datos la fórmula es la • 𝝈𝟐 = Varianza Poblacional
siguiente:
𝑁 2 • 𝒙𝒊 = marca de clase
2
σ (𝑥
𝑖=1 𝑖 − 𝜇)
𝜎 = • (𝒙𝒊 − 𝝁)𝟐 = desviaciones al cuadrado de cada marca de
𝑁 clase 𝑥𝑖 de cada valor con respecto a la media de la
• Para una tabla de población (𝜇).
frecuencias distribuido
por intervalos de clase: • 𝑵 = número total de datos de la población.
𝑘 2
2
σ (𝑓
𝑖=1 𝑖 )(𝑥𝑖 − 𝜇) • 𝒇𝒊 = frecuencia absoluta del intervalo i.
𝜎 =
𝑁 • 𝒌 = número total de clases o intervalos.
Fórmulas para calcular la
varianza muestral
Varianza muestral
Dónde:
• Para un simple conjunto
de datos la fórmula es la • 𝑺𝟐 = Varianza Muestral
siguiente:
𝑛 2 • 𝒙𝒊 = marca de clase
2
σ (𝑥
𝑖=1 𝑖 − 𝑥)
ҧ
𝑆 = ഥ)𝟐 = desviaciones al cuadrado de cada marca de clase
• (𝒙𝒊 − 𝒙
𝑛−1
• Para una tabla de 𝑥𝑖 de cada valor con respecto a la media de la muestra (𝑥).
ҧ
frecuencias distribuido • 𝒏 = número total de datos de la muestra.
por intervalos de clase:
𝑘 2
2
σ (𝑓
𝑖=1 𝑖 )(𝑥𝑖 − 𝑥)
ҧ • 𝒇𝒊 = frecuencia absoluta del intervalo i.
𝑆 =
𝑛−1 • 𝒌 = número total de clases o intervalos.
Veamos los siguientes
ejemplos
VARIANZA
EJEMPLO 1
El siguiente conjunto de datos
pertenecen a una muestra.
3, 4, 5, 6, 6, 7, 8, 9, 9, 10
•Calcular la varianza
Varianza
SOLUCIÓN EJEMPLO 1
Los datos corresponden a una muestra, por lo
cual, la fórmula a utilizar es de la varianza
muestral para un conjunto de datos simples:
𝑛 2
2
σ𝑖=1(𝑥 𝑖 − 𝑥)
ҧ
𝑆 =
𝑛−1
Varianza
SOLUCIÓN EJEMPLO 1
Para poder realizar el reemplazo de los valores en la fórmula es necesario calcular la media
aritmética del conjunto de datos, por lo tanto:
σ𝑛𝑖=1 𝑥𝑖
𝑥ҧ =
𝑛
3 + 4 + 5 + 6 + 6 + 7 + 8 + 9 + 9 + 10
𝑥ҧ =
10
67
𝑥ҧ = = 𝟔, 𝟕 𝒖𝒏𝒊𝒅𝒂𝒅𝒆𝒔
10
Varianza
Dato
(𝑥𝑖 − 𝑥)ҧ 2

(𝑥𝑖 )
(𝑥𝑖 − 𝑥)ҧ
SOLUCIÓN EJEMPLO 1
1 3 (3 - 6,7) = -3,7 (−3,7)2 = 13,69
2 4 (4 - 6,7) = -2,7 (−2,7)2 = 7,29 Una vez que tenemos
(−1,7)2 = 2,89
3
4
5
6
(5 – 6,7) = -1,7
(6 – 6,7) = -0,7 (−0,7)2 = 0,49
calculado la media,
5 6 (6 – 6,7) = -0,7 (−0,7)2 = 0,49 procedemos a realizar los
(0,3)2 = 0,09
6
7
7
8
(7 – 6,7) = 0,3
(8 – 6,7) = 1,3 (1,3)2 = 1,69
cálculos del numerador
8 9 (9 – 6,7) = 2,3 (2,3)2 = 5,29 σ𝑁 (𝑥
𝑖=1 𝑖 − 𝑥)ҧ 2
, para ello,
(2,3)2 = 5,29
9
10
9
10
(9 – 6,7) = 2,3
(10 – 6,7) = 3,3 (3,3)2 = 10,89
necesitaremos apoyarnos
Total 67 0 48,10 con una tabla:
Varianza
SOLUCIÓN EJEMPLO 1
Por último, realizamos el reemplazo de los valores en la fórmula de la varianza muestral:
σ 𝑁 2
𝑖=1 (𝑥𝑖 − 𝑥)
ҧ
𝑆2 =
𝑛−1
2
48,10 48,10
𝑆 = = = 𝟓, 𝟑𝟒 𝒖𝒏𝒊𝒅𝒂𝒅𝒆𝒔 𝒂𝒍 𝒄𝒖𝒂𝒅𝒓𝒂𝒅𝒐
10 − 1 9
El resultado nos demuestra que la dispersión de los datos con respecto a su media (6,7
unidades) es de 5,34 unidades al cuadrado.

También podría gustarte