Está en la página 1de 24

Medidas de Posición

en datos no
agrupados
martes, 7 de mayo de 2019

Docente
1
Rembranth G. Castro Pabón
Ingeniero Industrial, Especialista en Estadística.
Extremos, Mediana y Cuartiles
Conocer los valores extremos, mediana y cuartiles
de un conjunto de datos, nos muestra la
variabilidad total y tendencia central

Variable: edad
en años
2
Cuartiles Qi

• El primer cuartil Q1 es el valor debajo


del cual se presenta 25% de las
observaciones.
Min 4
• El tercer cuartil Q 3 es el valor debajo del Max 64
cual se presenta 75% de las Q1 31
observaciones. Q2 37
• Q 2 es la mediana, pues, es el valor Q3 45
debajo del cual se presenta 50% de las
observaciones.
• 𝑄1 puede considerarse como la mediana
de la mitad inferior de los datos y 𝑄3 3
como la mediana de la parte superior de
los datos.
Rango y Rango Intercuartil.
RIC= Q2-Q1 RIC= Q3-Q2

Rango= Max -mín


RIC central= Q3-Q1

• Es la diferencia entre el cuartil superior y el


cuartil inferior, conocido como rango Min 4
intercuartílico (RIC), es también una
Max 64
medida de dispersión pero en la que no se
toman en cuenta los valores extremos y Rango 60
regularmente los atípicos, con lo que se Q1 31
elimina la influencia que pudieran tener Q2 37
esos valores en la dispersión. Q3 45
• En el rango intercuartílico se encuentra RIC central 14
aproximadamente el 50% de los datos 4
Deciles y Percentiles
• Los deciles dividen un conjunto de observaciones en 10
partes iguales y los percentiles en 100 partes iguales. Por lo
tanto, si su promedio general en la universidad se encuentra
en el octavo decil, usted podría concluir que 80% de los
estudiantes tuvieron un promedio general inferior al suyo y
20%, un promedio superior.

• Fórmula para localización de un percentil


n es impar n es par
𝑝 𝑛𝑝
𝐿𝑃 = 𝑛 + 1 𝐿𝑃 =
100 100
5
Con p =1, 2, 3,…,100
Ejemplo <<Comisionista de bolsa>>

En seguida aparecen las comisiones que ganó el último


mes una muestra de 15 corredores de bolsa de nivel
nacional. Valores en dólares.
$ 2.038 $ 2.311 $ 1.637 $ 1.471 $ 2.205
$ 1.940 $ 1.721 $ 2.406 $ 1.074 $ 1.787
$ 1.758 $ 2.054 $ 2.097 $ 1.460 $ 2.287

• Localice la mediana, el primer, tercer cuartil y percentil


90 de las comisiones ganadas.

6
Solución <<Comisionista de bolsa>>
El valor mediano se encuentra en el centro por tanto con la
siguiente fórmula ubico la localización de la mediana en el
𝑝 50
conjunto de datos 𝐿𝑝 = 𝑛 + 1 siendo 𝐿50 = 15 + 1 =
100 100
8, la posición en la que se encuentra la mediana (cuando los datos
están ordenados).

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1.074 1.460 1.471 1.637 1.721 1.758 1.787 1.940 2.038 2.054 2.097 2.205 2.287 2.311 2.406

La octava comisión más grande es de $1.940. La mitad de los


corredores obtienen comisiones mayores que $1.940, y la mitad
gana menos que $1.940 7
Solución <<Comisionista de bolsa>>
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1.074 1.460 1.471 1.637 1.721 1.758 1.787 1.940 2.038 2.054 2.097 2.205 2.287 2.311 2.406

25
Primer cuartil 𝐿25 = 15 + 1 = 4 , en la posición cuatro
100
encontramos la comisión de $1.637 y decimos que: El 25% de los
corredores obtienen comisiones menores e iguales que $1.637, y
el 75% restante gana más de $1.637.
75
Tercer cuartil 𝐿75 = 15 + 1 = 12 , en la posición doce
100
encontramos la comisión de $2.205 y decimos que: El 75% de los
corredores obtienen comisiones menores e iguales que $2.205, y
el 25% restante gana más de $2.205.
8
Solución <<Comisionista de bolsa>>
El percentil 90 nos arroja una posición decimal

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1.074 1.460 1.471 1.637 1.721 1.758 1.787 1.940 2.038 2.054 2.097 2.205 2.287 2.311 2.406

𝐿𝑃90 = 16 (0,9) = 14,4. esto indica que el valor de la comisión


que representa al 90% de las comisiones (ordenadas) se
encuentra entre la posición 14 y 15. Reemplazando entonces,
tenemos que:

2.311 + 2.406 − 2.311 (0,4) = $2.349


9
Fórmula del percentil
De lo anterior se puede deducir que:

𝑃𝑖 = 𝐷𝑝𝑒𝑖𝑃 + 𝐷𝑝𝑒𝑠𝑃 − 𝐷𝑝𝑒𝑖𝑃 (𝐿𝑃 − 𝐿𝑝𝑒𝑖𝑃 )


Donde
• 𝐷𝑝𝑒𝑠𝑃 : es el dato que corresponde a la posición entera
superior
• 𝐷𝑝𝑒𝑖𝑃 : es el dato que corresponde a la posición entera inferior
• 𝐿𝑃 : Localización del percentil
• 𝐿𝑝𝑒𝑖 : Localización de la Posición entera inferior

10
Diagrama de caja
• representación gráfica que
muestra la forma general de la
distribución de una variable.
• Se basa en cinco estadísticos
descriptivos: los valores máximo y
mínimo , el primer y tercer cuartil
y la mediana.
• Revela el sesgo (falta de simetría)
de una distribución, centro de la
distribución medido por la
mediana y la variabilidad por
cuartiles. 11
Componentes del diagrama de caja
Valor atípico (*) - Observación que se encuentra más
allá del bigote superior o inferior
∗ 𝑆𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑠𝑖 > 𝑄3 + 1.5(𝑄3 − 𝑄1 )
∗ 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟 < 𝑄1 − 1.5(𝑄3 − 𝑄1 )

bigote superior - Se extiende hasta 1.5 RIC a partir


del cuartil 3.
Caja de rango Intercuartil - 50% intermedio de los
datos (Q3-Q1)
 Línea superior - Q3 (tercer cuartil). 75% de los
datos es menor que o igual a este valor.
 Línea media - Q2 (mediana). 50% de los datos es
menor que o igual a este valor.
 Línea inferior - Q1 (primer cuartil). 25% de los
datos es menor que o igual a este valor.
Bigote inferior - Se extiende hasta 1.5 RIC a partir
del cuartil 1. 12
Ejemplo <<Comisionista de bolsa>>

Min $ 1.074
Max $ 2.406
Q1 $ 1.637
Q2 $ 1.940
Q3 $ 2.205
RIC $ 568
Bi $ 785 $ 1.074
Bs $ 3.057 $ 2.406

Se observa mayor
variabilidad en los
datos de la mediana 13
para arriba, que de la
mediana hacia abajo
Comparación de conjuntos de
datos.

Los diagramas de caja y bigotes son a menudo


empleados para comparar dos o más conjuntos de
datos, en relación con sus tendencias centrales,
variabilidades y formas de distribución; todas las
cajas y bigotes correspondientes a cada grupo de
datos se grafican con la misma escala en una 14
misma gráfica
Ejemplo << Tiempo de llegada>>
El director de recursos humanos del hotel Dan Carlton de
Bucaramanga, lleva a cabo un estudio relacionado con el tiempo
que invierten los empleados en llegar al trabajo. La alcaldía de
Bucaramanga hace planes de ofrecer incentivos a las empresas
que ubicadas en zonas centrales y congestionadas, estimulen a
sus empleados a utilizar el transporte público.
A continuación los datos en minutos de una muestra de 24
empleados. Compare los tiempos de los dos grupos mediante
un diagrama de caja

Tiempo empleado en llegar al trabajo en min


Transporte Público 23 23 25 30 31 31 32 33 35 36 37 42
Transporte Privado 32 32 33 34 37 37 38 38 38 39 40 44 15
Ejemplo << Tiempo de llegada>>

Análisis de la gráfica:

Se percibe mayor
viabilidad en las llegadas
del trasporte público que
en el privado y el tiempo
mediano de llegada es
mayor en el transporte
privado.
Además se percibe un
sesgo negativo en las
llegadas del transporte
público, lo que indica que
es seguro que el 50% de 16
las llegadas sea después
de 37,5 min
Estadísticos Público Privado Razón Dif Análisis individual
Hay 7 min más de variabilidad total
en tiempo de llegada de los que
Rango 19 12 1,6 7,0 usaron el público que en privado, por
lo que la variabilidad es de 60% más
en el público que en el privado.
Q1 26,25 33,25 0,8 -7,0
La llegada promedio es 20% más
rápida en el público que en el
privado, esto indica que los que se
Q2 31,5 37,5 0,8 -6,0
movilizaron en transportare público,
en promedio llegaron 6 min más
rápido.
Q3 35,75 38,75 0,9 -3,0
La variabilidad general vista en el
RIC 50% central 9,5 5,5 1,7 4,0 rango se conserva igual en el 50%
central. (1,6 vs 1,7)
Mínimo 23 32 0,7 -9,0
Máximo 42 44 1,0 -2,0

Conclusiones: aunque en promedio fue más rápido llegar en transporte público que
en el privado, la variabilidad en los tiempos de llegadas fue de un 60% más. Esto 17
genera mayor incertidumbre en el tiempo de llegada en el público que el privado.
Inclusión de Dato atípico en << Tiempo de llegada>>

∗ 𝑆𝑢𝑝𝑒𝑟𝑖𝑜𝑟 𝑠𝑖 > 𝑄3 + 1.5(𝑄3 − 𝑄1 )


∗ 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟 < 𝑄1 − 1.5(𝑄3 − 𝑄1 )
Por ejemplo en los datos de llegadas
mediante el trasporte público, no hay
datos atípicos, pero si remplazamos el
primer dato en transporte público por
5, tendríamos la siguiente gráfica.
Esto implica que hubo una persona
que llegó en 5 min y se considera
atípica su llegada, pues es muy rápida
en comparación con las llegadas de
los demás. 18
Minitab
Software estadístico

19
Gráfica de caja de Transporte Público. Transporte Privado

31,5
Transporte Público

37,5
Transporte Privado

20 25 30 35 40 45
Datos
Tiempo en llegar al trabajo en minutos

20
21
22
23
BIBLIOGRAFÍA
• HURTADO, Antonio Nieves y DOMÍNGUEZ, Federico.
Probabilidad y Estadística para Ingeniería. Un enfoque
moderno. Mc Graw Hill. México . 2010
• LIND Douglas, MARCHAL William y WATHEN Samuel.
Estadística Aplicada a los negocios y la Economía. 15ª Edición.
Mc Graw Hill, Colombia. 2012.

24