0% encontró este documento útil (0 votos)
142 vistas44 páginas

Medidas de Posición No Central

Este documento presenta medidas de posición no central como percentiles, deciles y cuartiles. Explica que estos valores dividen los datos en tramos iguales para indicar la posición de un dato dentro del conjunto ordenado. Describe cómo calcular percentiles para datos no agrupados usando fórmulas que involucran la posición del dato y la muestra total. También provee ejemplos numéricos para ilustrar el cálculo de estos indicadores.

Cargado por

lisbethalmey07
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
142 vistas44 páginas

Medidas de Posición No Central

Este documento presenta medidas de posición no central como percentiles, deciles y cuartiles. Explica que estos valores dividen los datos en tramos iguales para indicar la posición de un dato dentro del conjunto ordenado. Describe cómo calcular percentiles para datos no agrupados usando fórmulas que involucran la posición del dato y la muestra total. También provee ejemplos numéricos para ilustrar el cálculo de estos indicadores.

Cargado por

lisbethalmey07
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

MEDIDAS DE POSICIÓN

NO CENTRAL:
PERCENTILES, DECILES Y
CUARTILES
SEMANA N°04
SESION 7-8
RESULTADO DE APRENDIZAJE DE LA SESIÓN

Al finalizar la sesión, el estudiante interpreta


medidas de tendencia no central en datos
agrupados y no agrupados usando las fórmulas
correctas.
correcta
REFLEXIÓN DESDE LA EXPERIENCIA

Si la talla de una niña es inferior al percentil 30 para su


edad, significa que el 70% de las niñas de la misma edad
miden más, a la niña también se le denomina “pequeña
para su edad”.

https://bit.ly/3IVGa32
REFLEXIÓN DESDE LA EXPERIENCIA
El colesterol se distribuye simétricamente en la población. Supongamos que se
consideran patológicos los valores extremos. El 90% de los individuos son
normales. ¿Entre qué valores se encuentran los individuos normales?

20
15 Percentiles 5 y 95
frecuencia

10
5
0

https://bit.ly/3KtsfC0
180 200 220 240 260

Colesterol en 100 personas


REFLEXIÓN DESDE LA EXPERIENCIA

Responde en el Padlet las siguientes


preguntas:

• ¿En cuántas partes se puede dividir un conjunto de


datos?

• ¿Cómo se llama a la medida que esta por encima del


50% de los datos?
Medidas de tendencia no central
Las medidas de tendencia central son en realidad, un caso particular de un tipo de
medidas más amplias, llamadas “de posición”.

Estas medidas de posición, tienen la propiedad de ubicarse entre los dos


extremos de variación de los datos, pero ya no necesariamente hacia el
centro del intervalo como las de tendencia central.

Entre otros indicadores, se suelen utilizar una serie de valores que


dividen la muestra en tramos iguales: cuartiles; deciles y
percentiles.

Se utilizan principalmente para indicar la posición relativa de un


dato dentro del conjunto de datos previamente ordenados.
SECCIÓN DE REFERENCIA

Medidas de tendencia no central

DATOS NO 117 161 116 138


AGRUPADOS 353 123 376 194

Para obtener
sus valores Sin Intervalos
depende como
se presentan
los datos.
DATOS
AGRUPADOS

Con Intervalos
Cuartiles: QK
TÍTULO
Son valores de la variable que dividen a la distribución de datos en cuatro
partes iguales, en donde cada parte incluye el 25% de los datos y se denotan
por 𝑄𝑘 , k=1,2,3.

Vmin. Vmax.
25%
Deciles: Dk
Son valores de la variable que dividen a la distribución de datos en diez
partes iguales, en donde cada parte incluye el 10% de los datos y se denotan
por 𝐷𝑘 , k=1,2,3,…..,9.

V. min._10%_._10%_.10%_._10%_._10%_._10%_._10%_._10%_._10%_._10%_ V. máx.
D1 D2 D3 D4 D5 D6 D7 D8 D9
Q2
Me
Primer decil : D1 , el 10% de los datos esta por debajo del D1
Segundo decil: D2 , el 20% de los datos esta por debajo del D2
Tercer Decil : D3 , el 30% de los datos esta por debajo del D3
…….
Quinto Decil : D5 , el 50% de los datos esta por debajo del D5
…….
Noveno Decil : D9 , el 90% de los datos esta por debajo del D9
Percentiles: Pk
Son valores de la variable que dividen a la distribución de datos en cien
partes iguales, en donde cada parte incluye el 1% de los datos y se denotan
por P𝑘 , k=1,2,3,….,99

V. mín._ 1%_._ 1%_. …._ ._ …… _._ 1%_._ …… ._ … ._1%_ V. máx.


P1 P2 …. P25 …..... P50 P51 …..... P75 ...... P99
Q1 Q2 Q3
Me
En resumen
Algunas de las medidas de posición no central coinciden, de acuerdo al cuadro
siguiente:
PERCENTIL DECIL CUARTIL
Observación P10 D1
Los valores del percentil 50
P20 D2
(P50), decil 5 (D5) y cuartil 2
P25 Q1
(Q2) son iguales; y, a su vez,
son iguales al valor de la P30 D3
mediana (Me). P40 D4
P50 D5 Q2
P60 D6
P70 D7
P75 Q3
P80 D8
P90 D9
TÍTULO
Cálculo de los percentiles para datos no agrupados

1.- Ordenar los datos, de preferencia de menor a mayor: X1 X2 X3 X4 ….Xn


𝒌∗(𝒏+𝟏)
2.- Obtener la posición correspondiente del percentil. , 𝐤: 𝟏, 𝟐, 𝟑, … , 𝟗𝟗
𝟏𝟎𝟎

3.- Calculo de los percentiles


𝑘(𝑛+1)
E: parte entera de 100

𝒌 ∗ (𝒏 + 𝟏) 𝐏𝐤 = XE + d*(X(E+1) – XE)
𝐏𝐤 = ? 𝟏𝟎𝟎
𝐤: 𝟏, 𝟐, 𝟑, …, 99
𝑘(𝑛+1)
d: parte decimal de 100
Cálculo de los percentiles para datos no agrupados
TÍTULO
Ejemplo 1:
Se han recopilado los minutos que un calmante hace efecto a una muestra de 10
personas.
Xi : 14,15,16,18,7,8,15, 7, 20, 11
Calcule los percentiles: 𝑃10 , 𝑃69

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
Xi : 7, 7, 8, 11, 14, 15, 15, 16, 18, 20
𝐏𝐤 = XE + d*(X(E+1) – XE)
E= 1
𝑘 𝑛+1
100
P10 = X1 + 0.1*(X(1+1) – X1)
𝟏𝟎∗(𝟏𝟎+𝟏) P10 = X1 + 0.1*(X(2) – X1)
𝐏𝟏𝟎 = ? 𝟏𝟎𝟎
= 1.1 𝐏𝟏𝟎 = 7 + 0.1*(7 – 7) = 7 minutos

D = 0.1
En la muestra el 10% de las personas le hizo efecto el calmante en un tiempo máximo de 7
minutos.
Cálculo de los percentiles para datos no agrupados
TÍTULO
Ejemplo 2:
Se han recopilado los minutos que un calmante hace efecto a una muestra de 10
personas.
Xi : 14,15,16,18,7,8,15, 7, 20, 11
Calcule los percentiles:𝑃10 𝑃69

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
Xi : 7, 7, 8, 11, 14, 15, 15, 16, 18, 20 𝐏𝐤 = XE + d*(X(E+1) – XE)
E= 7
𝑘 𝑛+1
100 P69 = X7 + 0.59*(X(7+1) – X7)
𝟔𝟗∗(𝟏𝟎+𝟏) P69 = X7 + 0.59*(X(8) – X7)
𝐏𝟔𝟗 = ? 𝟏𝟎𝟎
= 7.59
𝐏𝟔𝟗 = 15 + 0.59*(16 – 15) = 15.59 minutos

D = 0.59
En la muestra el 69% de las personas le hizo efecto el calmante en un tiempo máximo de
15.59 minutos.
Cálculo de los percentiles para datos no agrupados
TÍTULO
Ejemplo 3:
Se han recopilado los minutos que un calmante hace efecto a una muestra de 7 personas.
Xi : 14,15,16,18,7,8,15
Calcule el cuartil: 𝑄1

X1 X2 X3 X4 X5 X6 X7
Xi : 7, 8, 14, 15, 15, 16, 18
𝐏𝐤 = XE + d*(X(E+1) – XE)
E= 2
𝑘 𝑛+1
100
𝟐𝟓∗(𝟕+𝟏) 𝐏𝟐𝟓 = X2 + 0*(X(2+1) – X2) = X2
𝐐𝟏 = 𝐏𝟐𝟓 ? 𝟏𝟎𝟎
= 2.0
𝐏𝟐𝟓 = X2 = 8 minutos
D=0
En la muestra 25% de las personas le hizo efecto el calmante en un tiempo máximo de 8
minutos.
Cálculo de los percentiles para datos no agrupados
TÍTULO
Ejemplo 4:
Se han recopilado los minutos que un calmante hace efecto a una muestra de 7
personas.
Xi : 14,15,16,18,7,8,15
Calcule los cuartiles: 𝑄2
X1 X2 X3 X4 X5 X6 X7
Xi : 7, 8, 14, 15, 15, 16, 18

E= 4 𝐏𝐤 = XE + d*(X(E+1) – XE)
𝑘 𝑛+1
100
𝟓𝟎∗(𝟕+𝟏) 𝐏𝟓𝟎 = X4 + 0*(X(4+1) – X4) = X4
𝐐𝟐 = 𝐏𝟓𝟎? = 4.0
𝟏𝟎𝟎

D=0 𝐏𝟓𝟎 = X4 = 15 minutos


En la muestra 50% de las personas le hizo efecto el calmante en un tiempo máximo de 15
minutos.
Cálculo de los percentiles para datos agrupados sin
TÍTULO
intervalos

Paso 1: Calcular las frecuencias absolutas acumuladas: 𝐹𝑖


𝐤∗𝐧
Paso 2: Calcular la posición del Pk :
𝟏𝟎𝟎
𝐤∗𝐧
Paso 3: El percentil 𝑃𝑘 = 𝐗𝐢 es el valor de la variable; cuya 𝑭𝒊 >
𝟏𝟎𝟎
𝐤 𝐤∗𝐧
El percentil 𝑃𝑘 = Xi +(X(i+1) – Xi)* ; cuya 𝑭𝒊 =
𝟏𝟎𝟎 𝟏𝟎𝟎
n: número de datos.
Cálculo de los percentiles para datos agrupados sin intervalos
TÍTULO
Los datos de la tabla muestran información sobre la variable X que representa el número de años
de consumo de estupefacientes en una muestra de pacientes del Hospital Nacional del Centro.
Completar los datos que faltan en la siguiente tabla estadística:
Años de
consumo de
fi Fi
estupefacientes 𝐏𝟏𝟗 = ?
: Xi
Paso 1: Calcular las frecuencias absolutas acumulada.
1 4 4 𝟏𝟗∗𝟓𝟎
2 4 8 Paso 2: Calcular la posición del 𝐏𝟏𝟗 : 𝑘 × 𝑛 = = 9.5
𝟏𝟎𝟎
P19 3 8 16 𝑭𝟑 > 9.5 100
4 7 23
5 5 28 𝐏𝟔𝟗 = ?
P69 6 10 38
Paso 1: Calcular las frecuencias absolutas acumulada.
7 7 45 𝟔𝟗∗𝟓𝟎
Paso 2: Calcular la posición del 𝑃69 : = 34.5
8 5 50 𝟏𝟎𝟎
Total 50 𝑭𝟔 > 34.5

PERCENTIL VALOR INTERPRETACIÓN


P19 3 años En la muestra el 19% de los pacientes del Hospital Nacional del Centro
consumieron estupefaciente en un tiempo máximo de 3 años.
P69 6 años En la muestra el 69% de los pacientes del Hospital Nacional del Centro
consumieron estupefaciente en un tiempo máximo de 6 años.
Cálculo de los percentiles para datos agrupados con
intervalos
Los percentiles se calculan utilizando la siguiente fórmula:

𝑘∗𝑛
− 𝐹(𝑖−1)
𝑃𝑘 = 𝐿𝑖 + 𝐶 ∗ 100 K = 1,2,3, … ,99
𝑓𝑖
Donde:

PK : Percentil k ésimo
𝒌∗𝒏
: Posición del PK
𝟏𝟎𝟎
Li : Limite real inferior de la clase que contiene el PK .
C : Amplitud de la clase que contiene PK .
𝑭(𝒊−𝟏) : Frecuencia absoluta acumulada anterior a la clase que contiene el PK .
𝒇𝒊 : Frecuencia absoluta simple de la clase que contiene el PK
Ejemplo 1:
La siguiente tabla representa la distribución de las edades de una muestra de 50
trabajadores.

https://bit.ly/35qEJeO

Calcule el P68
𝑘×𝑛
100

𝑓𝑖

𝑭𝒊 ≥34

kn
𝟏𝟎𝟎
𝑷𝑲 c años
𝑓𝑖
Interpretación: En la muestra el 68% de los trabajadores tienen una edad máxima de
39.3 años.
Ejemplo 2:
TÍTULO
La siguiente tabla corresponde a la distribución de los sueldos semanales
de los trabajadores de la aseguradora Rímac Seguros.

https://bit.ly/3CfHRpJ

¿Cuál es el sueldo mínimo del 25% de los trabajadores que tienen los mayores
sueldos?
¿Cuál es el sueldo mínimo del 25% de los trabajadores que tienen los mayores sueldos?
𝑃75
𝑘×𝑛 𝟕𝟓(𝟔𝟎𝟎)
= = 𝟒𝟓𝟎
100 𝟏𝟎𝟎

Clase de 𝑷𝟕𝟓

𝑓𝑖
𝑭𝒊 ≥ 𝟒𝟓𝟎

485.9 soles

Interpretación: El 25% de los trabajadores de la aseguradora Rímac Seguros que tienen


los mayores sueldos tienen un sueldo semanal mínimo de 485.9 soles.
Diagrama de cajas (box plot)
TÍTULO
Es un gráfico representativo que permite visualizar tanto la dispersión como la forma
(simetría de los datos) de una variable y detectar valores atípicos (outliers). Asimismo,
es especialmente útil para comparar diferentes distribuciones de manera simultanea.

https://bit.ly/37fhOna https://bit.ly/3tCyQTP
Diagrama de cajas (box plot)
¿QUÉ INDICA EL BOX PLOT?

Mientras más larga la


caja y los bigotes,
más dispersa es la
distribución de datos.

La distancia entre las


cinco medidas descritas
en el box plot (sin incluir
la media aritmética)
puede variar.
Diagrama de cajas (box plot)

¿QUE INDICA EL BOX PLOT?


CASO 1.- La línea que representa
Al igual que el la mediana indica la simetría. Si
histograma y el gráfico está relativamente en el centro de
de Tallos y Hojas la caja la distribución es
permite tener una idea simétrica.
visual de la distribución
de los datos (simetría y
CASO 2.- Si por el contrario se
variabilidad).
acerca al tercer cuartil, la
distribución pudiera ser sesgada
a la izquierda (asimétrica
negativa).

CASO 3.- Si por el contrario se


acerca al primer cuartil, la
distribución pudiera ser sesgada
a la derecha (asimétrica
Diagrama de cajas (box plot)
Grafique el diagrama de BOX PLOT de las edades de 100 trabajadores
Diagrama de cajas (box plot)
Grafique el diagrama de BOX PLOT de las edades de 100
Tabla I. Distribución de
trabajadores. frecuencias de la edad en
100 pacientes.

Posición de los cuartiles Nº de


Edad Fi
pacientes
N=100 18 1 1
19 3 4
20 4 8
25(100) 21 7 15
𝑸𝟏 = 𝑷𝟐𝟓 = 25 20
22 5
100 Q1 = 23 8 28
24 10 38
25 8 46
Q2 = 26 9 55
27 6 61
𝑸𝟐 = 𝑷𝟓𝟎 50(100) 67
= 50 28 6
100 29 4 71
30 3 74
Q3 = 31 4 78
32 5 83

𝑸𝟑 = 𝑷𝟕𝟓 75(100) 33 3 86
= 75 34 2 88
100 35 3 91
36 1 92
37 2 94
Min = 18 Máx = 42 38
39
3
1
97
98
Q1 = 23; Mediana = Q2 = 26; Q3 = 31 41 1 99
100
42 1
Diagrama de cajas (box plot)
Grafique el diagrama de BOX PLOT
de las edades de 100 trabajadores.
Máx.

Los valores para obtener el diagrama:


Min. = 18 Máx. = 42 Mediana = 26
Q1 = 23 ; Q3 = 31;
RIC = Q3 - Q1 = 31 – 23 = 8
Q3
Calculando los extremos de los bigotes:
Extremo inferior = (Q1 – 1,5RIC) = 23 - 1,5(8) = 11 RIC Q2 = Me
Extremo superior =(Q3 + 1,5RIC)= 31 +1,5(8)=43
Q1
Como los valores máximo y mínimo se
encuentran entre estos extremos, los bigotes se Mín.
graficarán hasta 18 y 42, no existiendo ningún
valor atípico (outlier).
APLIQUEMOS LO APRENDIDO
EJERCICIO 1: Sobre las equivalencias que se presentan a continuación, indique cuales son
VERDADERAS y cuáles son FALSAS. Marque con un aspa la opción correcta.

N° AFIRMACIONES V F
1 𝑄1 = 𝑃25
2 El segundo cuartil es la mediana
3 El noveno decil es igual al percentil 9
4 𝐷7 = 𝑃70
5 El tercer cuartil equivale al percentil 75
6 El segundo cuartil es menor que el percentil 48
7 El séptimo decil es menor que el tercer cuartil
El 80% central de los datos se encuentra comprendido entre el
8
decil 2 y el decil 6
El 90% central de los datos se encuentra comprendido entre el
9
percentil 5 y el percentil 95
10 𝑄3 = 𝑃3
Solución.
N° AFIRMACIONES V F
1 𝑄1 = 𝑃25 X
2 El segundo cuartil es la mediana X
3 El noveno decil es igual al percentil 9 X
4 𝐷7 = 𝑃70 X
5 El tercer cuartil equivale al percentil 75 X
6 El segundo cuartil es menor que el percentil 48 X
7 El séptimo decil es menor que el tercer cuartil X
El 80% central de los datos se encuentra comprendido entre el
8 X
decil 2 y el decil 6
El 90% central de los datos se encuentra comprendido entre el
9 X
percentil 5 y el percentil 95
10 𝑄3 = 𝑃3 X
2) La siguiente tabla muestra el tiempo (en minutos) que demora 60 médicos de
consulta externa en un centro hospitalario de Trujillo (La Libertad).

Tiempo (minutos) 8 - 13 13 - 18 18 - 23 23 - 28
Numero de médicos 10 30 12 8

a) Determine el valor de la medida de resumen que se


utilizará para determinar que un médico se ubique en el
25% de los mas rápidos en la atención a una consulta
externa.
b) Determine el valor de la medida de resumen que se
utilizará para determinar que un médico se ubique en el
25% de los mas lentos en la atención a una consulta
externa.
https://bit.ly/3aRUMnX
Solución a): Realizando tabla de distribución de frecuencias

Tiempo Numero de
𝑭𝒊 La formula de percentil es:
(minutos) médicos 𝒇𝒊
𝑘𝑛
8-13 10 10 − 𝐹𝑖−1
𝑃𝑘 = 𝐿𝑖 + 𝑐 100
13-18 30 40 𝑓𝑖
Remplazando los datos
18-23 12 52
15 − 10
23-28 8 60 𝑃25 = 13 + 5
30
Total 𝒏 = 𝟔𝟎 𝑃25 = 13.83

Hallar 𝑃25 . Rpta: Para que un médico se ubique en el


Hallando la posición del percentil 𝑃25 : 25% de los mas rápidos en la atención a
𝑘 × 𝑛 25 × 60 una consulta externa, el tiempo máximo que
= = 15 emplearía sería de 13.83 minutos.
100 100

𝐹𝑖 ≥ 15
Entonces 𝑃25 se encuentra en el
intervalo de clase 2.
Solución b: Realizando tabla de distribución de frecuencias

Tiempo Numero de
𝑭𝒊 La formula de percentil es:
(minutos) médicos 𝒇𝒊
𝑘𝑛
8-13 10 10 − 𝐹𝑖−1
𝑃𝑘 = 𝐿𝑖 + 𝑐 100
13-18 30 40 𝑓𝑖
18-23 12 52 Remplazando los datos
45 − 40
23-28 8 60 𝑃25 = 18 + 5
12
Total 𝒏 = 𝟔𝟎 𝑃25 = 20.08

Hallar 𝑃75 . Rpta: Para que un médico se ubique en el


Hallando la posición del percentil 𝑃75 : 25% de los mas lentos en la atención a
𝑘 × 𝑛 75 × 60 una consulta externa, el tiempo mínimo
= = 45 que empleará sería de 20.08 minutos.
100 100

𝐹𝑖 ≥ 45
Entonces 𝑃75 se encuentra en el
intervalo de clase 3.
3) La empresa “Rappi” que brinda servicio de delivery en dos 2 zonas A y B del distrito
de SJL, ha realizado un estudio de los tiempos (en minutos) de los pedidos solicitados
por sus clientes en el mes de abril. En las zonas A y B se tomaron muestras de 40 y 50
pedidos, respectivamente. Con la finalidad de comparar los tiempos de los pedidos de
ambas zonas, se obtuvieron los diagramas de cajas y bigotes que se muestran en el
siguiente gráfico:
a) ¿Cuál es el tiempo máximo aproximado del 75 %
de los tiempos más cortos en la zona A? Justifique
su respuesta.
b) ¿Cuál es el tiempo mínimo aproximado del 25 %
de los recorridos más largos en la zona B? Justifique
su respuesta.
c) ¿Qué zona presenta la mayor amplitud total de
los tiempos? Justifique su respuesta.

d) ¿Qué zona presenta la mayor asimetría en los


tiempos? Justifique su respuesta.
4) Se realiza una estadística en la Institución Educativa “Fe y Alegría”, referente a la nota
global de cada uno de los estudiantes que van a acudir a los exámenes de selectividad.
Las distribuciones de frecuencias son las siguientes:

Nota global de cada alumno Número de alumnos


15 15
16 20
17 30
18 30
19 20 https://bit.ly/3tEBh8b
20 15
Se realiza una estadística en la Institución Educativa “Fe y Alegría”, referente a la nota
global de cada uno de los estudiantes que van a acudir a los exámenes de selectividad.
Las distribuciones de frecuencias son las siguientes:
a) Calcule la nota máxima global del 30% de los alumnos menos aplicados.
b) Calcule la nota mínima global del 30% de los alumnos mas aplicados.
5) En una granja avícola se registra la siguiente tabla de distribución de pollos respecto a
sus pesos.
Peso (gramos) fi
960 990 60
990 1020 160
1020 1050 280
1050 1080 280
1080 1110 160
https://bit.ly/3xkZXoh
1110 1140 60

Se desea agrupar los pollos en cuatro categorías, con relación al peso de modo que
a) El peso del 20% de los pollos menos pesados sean de la categoría D
b) El peso del 30% de los siguientes sean de la categoría C
c) El peso del 30% de los siguientes sean de la categoría B
d) El peso del 20% de los pollos más pesados sean de la categoría A
e) ¿Cuáles son los limites de peso entre las categorías A,B,C,D?
INTEGREMOS LO APRENDIDO

• ¿Cuál es la medida que esta por encima del


30% de los menores datos?

• ¿Qué es lo que aún puedes mejorar para


calcular percentiles?

• ¿Cómo puedes aplicar lo aprendido en la


https://bit.ly/3pKZIzI sesión a tu vida profesional?
Actividad Asincrónica

Resolver el cuestionario de la semana 5


Referencias bibliográficas

También podría gustarte