Está en la página 1de 55

ESTADÍSTICA GENERAL

Departamento Académico de Cursos Básicos


MEDIDAS DE POSICIÓN
NO CENTRAL

Semana 04
Sesión 8
Resultado de aprendizaje de la sesión
Al finalizar la sesión, el estudiante interpreta medidas de posición no central en datos
agrupados y no agrupados usando las fórmulas correctas.

Imagen: www.freepik.com
Reflexión desde la experiencia
El percentil es una medida que se utiliza para hacer un seguimiento
del crecimiento del niño en cuestión de estatura y peso, desde su
nacimiento y a lo largo de toda la etapa de crecimiento.

https://bit.ly/3IVGa32

Si la talla de una niña es inferior al percentil 30 para su


edad, significa que el 70% de las niñas de la misma
edad miden más, a la niña también se le denomina
“pequeña para su edad”.
https://bit.ly/3IVGa478
Reflexión desde la experiencia
El colesterol se distribuye simétricamente en la población. Supongamos que se
consideran patológicos los valores extremos. El 90% de los individuos son
normales. ¿Entre qué valores se encuentran los individuos normales?
Percentiles
Percentiles 5 y595y 95
20
15
frecuencia

10
5
0

180 200 220 240 260


https://bit.ly/3Ktsfl9
Colesterol en 100 personas

https://bit.ly/3KtsfC0
Reflexión desde la experiencia

Responde en el padlet las siguientes


preguntas:

• ¿En cuántas partes se puede dividir un conjunto de


datos?
• ¿Cómo se llama la medida que esta por encima del 50%
de los datos?
Desarrollo del tema
Cuartiles
Deciles
Percentiles
Medidas de tendencia no central

Las medidas de tendencia central son en realidad, un caso particular de un tipo de


medidas más amplias, llamadas “medidas de posición “ .

Estas medidas de posición, tienen la propiedad de ubicarse entre los dos extremos de
variación de los datos, pero ya no necesariamente hacia el centro del intervalo como
las medidas de tendencia central.

Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra
en tramos iguales: cuartiles; deciles y percentiles.

Se utilizan principalmente para indicar la posición relativa de un dato dentro del


conjunto de datos previamente ordenados.
Medidas de tendencia no central

Medidas de tendencia no central

117 161 116 138


Para obtener sus DATOS NO 353 123 376 194
valores depende AGRUPADOS
como se presentan
los datos.
Sin Intervalos

DATOS
AGRUPADOS

Con Intervalos
Medidas de tendencia no central

Cuartiles: QK
Son valores de la variable que dividen a la distribución de datos en cuatro partes
iguales, en donde cada parte incluye el 25% de los datos y se denotan por 𝑄𝑘 ,
k=1,2,3.

Vmin. Vmax.
25%

Primer cuartil: Q1 , el 25% de los datos esta por debajo del Q1


Segundo cuartil: Q2 , el 50% de los datos esta por debajo del Q2
Tercer cuartil: Q3 , el 75% de los datos esta por debajo del Q3
Medidas de tendencia no central

Deciles: DK
Son valores de la variable que dividen a la distribución de datos en diez partes iguales,
en donde cada parte incluye el 10% de los datos y se denotan por 𝐷𝑘 , k=1,2,3,…..,9.

V. min._10%_._10%_.10%_._10%_._10%_._10%_._10%_._10%_._10%_._10%_ V. máx.
D1 D2 D3 D4 D5 D6 D7 D8 D9

Primer decil: D1 , el 10% de los datos esta por debajo del D1


Segundo decil: D2 , el 20% de los datos esta por debajo del D2
Tercer decil: D3 , el 30% de los datos esta por debajo del D3
…….
Quinto decil: D5 , el 50% de los datos esta por debajo del D5
…….
Noveno decil: D9 , el 90% de los datos esta por debajo del D9
Medidas de tendencia no central
Percentiles: PK
Son valores de la variable que dividen a la distribución de datos en cien partes iguales,
en donde cada parte incluye el 1% de los datos y se denotan por P𝑘 , k=1,2,3,….,99.

V. mín. _ 1%__ 1%_. …._ ._ …… 1%__ …… _ … 1%__________ V. máx.


P1 P2 …. P25 …..... P50 P51 …..... P75 ...... P99
Q1 Q2 Q3
Me
Equivalencias

PERCENTILES
41 42
1 2433444 45
5 6467478 48
9 10
49 50
11 51
12521353145415
55 16
56 17
57 58
18 59
19602061216222
63 23
64 24
65 66
25 67
2668
2769287029

71 30
72 31
73 74
32 75
3376
3477357836
79 37
80 38
81 82
39 83
4084
4185428643
87 44
88 45
89 90
46 91
47 92
4893499450
95 51
96 52
97 98
53 99
54 100
55 56

DECILES
1 2 3 4 5 6 7 8 9 10
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D1 D2 D3 D4 D5 D6 D7 D8 D9
P10 P20 P30 P40 P50 P60 P70 P80 P90
CUARTILES
1 2 3 4
25% 25% 25% 25%

Q1 Q2 Q3
P25 P50 P75
Equivalencias

En resumen
Algunas de las medidas de posición no central coinciden, de acuerdo al cuadro
siguiente: PERCENTIL DECIL CUARTIL
P10 D1
Observación P20 D2
Los valores del percentil P25 Q1
50 (P50), decil 5 (D5) y P30 D3
cuartil 2 (Q2) son P40 D4
iguales; y a su vez, son P50 D5 Q2
iguales al valor de la P60 D6
mediana (Me). P70 D7
P75 Q3
P80 D8
P90 D9
Medidas de tendencia no central para datos no agrupados

Cálculo de los percentiles para datos no agrupados


1.- Ordenar los datos, de preferencia de menor a mayor: X1 ,X2 ,X3 ,X4 ,….,Xn

𝒌∗(𝒏+𝟏)
2.- Obtener la posición correspondiente del percentil. , 𝐤: 𝟏, 𝟐, 𝟑, … , 𝟗𝟗
𝟏𝟎𝟎

3.- Calculo de los percentiles


E: parte entera de
𝑘(𝑛+1)
100
𝒌 ∗ (𝒏 + 𝟏) 𝐏𝐤 = XE + d*(X(E+1) – XE)
𝐏𝐤 = ?
𝟏𝟎𝟎
𝐤: 𝟏, 𝟐, 𝟑, …, 99
d: parte decimal de
𝑘(𝑛+1)
100
Medidas de tendencia no central para datos no agrupados

Ejemplo:
Se han recopilado los minutos que un calmante hace efecto a una muestra de 10 personas.
Xi : 14, 15, 16, 18, 7, 8, 15, 7, 20, 11
Calcule los percentiles: 𝑃10 , 𝑃69

X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
Xi : 7, 7, 8, 11, 14, 15, 15, 16, 18, 20
E= 1 𝐏𝐤 = XE + d*(X(E+1) – XE)
P10 = X1 + 0,1*(X(1+1) – X1)
𝐏𝟏𝟎 = ? 𝟏𝟎∗(𝟏𝟎+𝟏)
= 1,1 P10 = X1 + 0,1*(X(2) – X1)
𝟏𝟎𝟎
𝐏𝟏𝟎 = 7 + 0,1*(7 – 7) = 7 minutos
D = 0,1
En la muestra el 10% de las personas le hizo efecto el calmante en un tiempo máximo de 7
minutos.
Medidas de tendencia no central para datos no agrupados

Ejemplo:
Se han recopilado los minutos que un calmante hace efecto a una muestra de 10 personas.
Xi : 14, 15, 16, 18, 7, 8 ,15, 7, 20, 11
Calcule los percentiles: 𝑃10 𝑃69
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
𝐏𝐤 = XE + d*(X(E+1) – XE)
Xi : 7, 7, 8, 11, 14, 15, 15, 16, 18, 20

E= 7
P69 = X7 + 0,59*(X(7+1) – X7)
𝐏𝟔𝟗 = ?
𝟔𝟗∗(𝟏𝟎+𝟏)
= 7,59 P69 = X7 + 0,59*(X(8) – X7)
𝟏𝟎𝟎 𝐏𝟔𝟗 = 15 + 0,59*(16 – 15) = 15,59 minutos
D = 0,59
En la muestra el 69% de las personas le hizo efecto el calmante en un tiempo máximo de 15,59
minutos.
Medidas de tendencia no central para datos no agrupados

Ejemplo:
Se han recopilado los minutos que un calmante hace efecto a una muestra de 7 personas.
Xi : 14, 15, 16, 18, 7, 8, 15
Calcule el cuartil: 𝑄1
X1 X2 X3 X4 X5 X6 X7
Xi : 7, 8, 14, 15, 15, 16, 18 𝐏𝐤 = XE + d*(X(E+1) – XE)
E= 2

𝐐𝟏 = 𝐏𝟐𝟓 ? 𝟐𝟓∗(𝟕+𝟏) 𝐏𝟐𝟓 = X2 + 0*(X(2+1) – X2) = X2


= 2,0
𝟏𝟎𝟎
𝐏𝟐𝟓 = X2 = 8 minutos
D=0
En la muestra 25% de las personas le hizo efecto el calmante en un tiempo máximo de 8
minutos.
Medidas de tendencia no central para datos agrupados

Cálculo de los percentiles para datos agrupados sin intervalos


Paso 1: Calcular las frecuencias absolutas acumuladas: 𝐹𝑖

𝐤∗𝐧
Paso 2: Calcular la posición del Pk :
𝟏𝟎𝟎

𝐤∗𝐧
Paso 3: El percentil 𝑃𝑘 = 𝐗𝐢 es el valor de la variable; cuya 𝑭𝒊 >
𝟏𝟎𝟎
𝐤 𝐤∗𝐧
El percentil 𝑃𝑘 = Xi +(X(i+1) – Xi)* ; cuya 𝑭𝒊 =
𝟏𝟎𝟎 𝟏𝟎𝟎
n: número de datos
Medidas de tendencia no central para datos agrupados

A continuación se presentan los ingresos semanales de los trabajadores de la empresa A.


Calcule el percentil 25 e interprete

Ingresos Número de
(Soles) personas(fi)
300 10
330 15
350 20
360 5
Medidas de tendencia no central para datos agrupados

A continuación se presentan los ingresos semanales de los trabajadores de la empresa A.


Calcule el percentil 25 e interprete.

Número de 𝐏𝟐𝟓 = ?
Ingresos
personas Fi Paso 1: Calcular las frecuencias absolutas
(Soles)
(fi) acumulada
300 10 10 𝟐𝟓∗𝟓𝟎
P25 Paso 2: Calcular la posición del 𝐏𝟐𝟓 : = 12,5
330 15 25 𝟏𝟎𝟎
350 20 45 𝑭𝑖 > 12,5
360 5 50
Total 50 𝐏𝟐𝟓 = 𝟑𝟑𝟎 𝐬𝐨𝐥𝐞𝐬

Interpretación: El 25% de los trabajadores de la empresa A tienen un ingreso semanal


máximo de 330 soles.
Medidas de tendencia no central para datos agrupados

Cálculo de los percentiles para datos agrupados con intervalos


Los percentiles se calculan utilizando la siguiente fórmula:

𝑘∗𝑛 K = 1,2,3, … ,99


− 𝐹(𝑖−1)
𝑃𝑘 = 𝐿𝑖 + c ∗ 100
𝑓𝑖
Donde:
𝑃𝑘 : Percentil k ésimo
𝒌∗𝒏
: Posición del 𝑃𝑘
𝟏𝟎𝟎
Li : Limite real inferior de la clase que contiene el 𝑃𝑘
c : Amplitud de la clase que contiene 𝑃𝑘
𝑭(𝒊−𝟏) : Frecuencia absoluta acumulada anterior a la clase que
contiene el 𝑃𝑘
𝒇𝒊 : Frecuencia absoluta simple de la clase que contiene el 𝑃𝑘
Medidas de tendencia no central para datos agrupados

Ejemplo:
La siguiente tabla representa la distribución de la edades de una muestra de 50
trabajadores.

Calcule el P68 https://bit.ly/35qEJeO


Medidas de tendencia no central para datos agrupados

𝑓𝑖

𝑭𝒊 ≥34

kn
𝟏𝟎𝟎 39,3 años
𝑷𝑲 c
𝑓𝑖

Interpretación: En la muestra el 68% de los trabajadores tienen una edad máxima de 39,3 años.
Diagrama de cajas (box plot)

Es un gráfico representativo que permite visualizar tanto la dispersión como la forma


(simetría de los datos) de una variable y detectar valores atípicos (outliers). Asimismo,
es especialmente útil para comparar diferentes distribuciones de manera simultánea.

https://bit.ly/37fhOna https://bit.ly/3tCyQTP
Diagrama de cajas (box plot)

¿QUÉ INDICA EL BOX PLOT?

Mientras más larga la caja


y los bigotes, más dispersa
es la distribución de datos.

La distancia entre las cinco


medidas descritas en el
boxplot (sin incluir la
media aritmética) puede
variar.
Diagrama de cajas (box plot)

¿QUÉ INDICA EL BOX PLOT?

Al igual que el histograma CASO 1. La línea que representa la


y el gráfico de tallos y mediana indica la simetría. Si está
relativamente en el centro de la
hojas permite tener una
caja la distribución es simétrica.
idea visual de la
distribución de los datos
(simetría y variabilidad) CASO 2.- Si por el contrario se
acerca al tercer cuartil, la
distribución pudiera ser sesgada a
la izquierda (asimétrica negativa).

CASO 3.- Si por el contrario se


acerca al primer, la distribución
pudiera ser sesgada a la derecha
(asimétrica positiva).
Diagrama de cajas (box plot)

Grafique el diagrama de BOX PLOT de las edades de 100 trabajadores


Diagrama de cajas (box plot)
Grafique el diagrama de BOX PLOT de las edades de 100 trabajadores
Tabla I. Distribución de
frecuencias de la edad en
100 pacientes.

Nº de
Edad Fi
pacientes
25(100) 18 1 1
𝑸𝟏 = 𝑷𝟐𝟓 = 25 19
20
3
4
4
8
100 Q1 = 21 7 15
22 5 20
23 8 28
24 10 38
Q2 =
𝑸𝟐 = 𝑷𝟓𝟎 50(100) 25
26
8
9
46
55
= 50 27 6 61
100 28
29
6
4
67
71
Q3 = 30 3 74
75(100) 31 4 78

𝑸𝟑 = 𝑷𝟕𝟓 = 75 32
33
5
3
83
86
100 34 2 88
35 3 91
36 1 92
37 2 94

Min = 18 Máx = 42 38
39
3
1
97
98
41 1 99
Q1 = 23; Mediana = Q2 = 26; Q3 = 31 42 1 100
Diagrama de cajas (box plot)

Grafique el diagrama de BOX PLOT de las edades


de 100 trabajadores Máx.
Los valores para obtener el diagrama:
Min. = 18 Máx. = 42 Mediana = 26
Q1 = 23 ; Q3 = 31 ;
RIC = Q3 - Q1 = 31 – 23 = 8 Q3
Calculando los extremos de los bigotes: RIC
Extremo inferior = (Q1 – 1,5RIC) = 23 - 1,5(8) = 11 Q2 = Me
Extremo superior=(Q3 + 1,5RIC)= 31 + 1,5(8) = 43 Q1

Como los valores máximo y mínimo se Mín.


encuentran entre estos extremos, los bigotes se
graficarán hasta 18 y 42, no existiendo ningún
valor atípico (outlier)
Apliquemos lo aprendido
Apliquemos lo aprendido
Integremos lo aprendido
Integremos lo aprendido

1)¿Cuál es la diferencia entre un cuartil y decil?


2)¿Cuál es la medida que esta por encima del
30% de los datos inferiores?
3)¿Cuál es la medida que es superada por el
40% de los datos superiores?

https://bit.ly/3pKZIzIc
Actividad complementaria
Actividad complementaria

Resuelve la autoevaluación 4
en el aula virtual
Referencias Bibliográficas
Referencias Bibliográficas
Cárdenas, R. (2014). Estadística en la educación. Digital UNID. bit.ly/3GSn1kB

Celis de la Rosa, A. y Labrada, V. (2014). Bioestadística. El Manual Moderno. http://bit.ly/3Uh9VR2

De Oteyza, E., Lam, E., Hernández, C. y Carrillo, A. (2015). Probabilidad y estadística. Pearson.
http://bit.ly/3Vw7JGs

Martínez, C. (2012). Estadística y muestreo. Eco ediciones. http://bit.ly/3UjMG8E

Obando, J. y Arango, N. (2013). Probabilidad y estadística. Fondo Editorial Universidad EIA.


http://bit.ly/3FehZxG

Posada, G. (2016). Elementos básicos de estadística descriptiva para el análisis de datos. Fundación
Universitaria Luis Amigó. http://bit.ly/3AYplmh

Rodríguez, J., Pierdant, A. y Rodríguez, C.(2014) . Estadística para administración. Grupo editorial patria,
http://bit.ly/3Ud3Vso
Referencias Bibliográficas
Ross, M. (2014). Introducción a la estadística. REVERTÉ. http://bit.ly/3ua4AjA

Warr, R. y Erich, R. (2019). Should the Interquartile Range Divided by the Standard Deviation be
Used to Assess Normality? The American Statistician, 67(4), 242–244. http://bit.ly/3XUJKCK

DE CONSULTA

Anderson, D., Sweeney, D. y Williams, T. (2008). Estadística para administración y economía.


Cengage Learning Editores. http://bit.ly/3XJPpv3

Triola, M. (2018). Estadística. Pearson educación. http://bit.ly/3UhadHC

Walpole, R., Myers, R., Myers, S. y Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias.
Pearson educación. http://bit.ly/3GUBdJV
Apliquemos lo aprendido
Ejercicio 1

1)Sobre las equivalencias que se presentan a continuación, indique cuales son


VERDADERAS y cuáles son FALSAS. Marque con un aspa la opción correcta.
AFIRMACIONES V F
• Q1 P25
• El segundo cuartil es la mediana
• El noveno decil es igual al percentil 9
• D7 = P70
• El tercer cuartil equivale al percentil 75
• El segundo cuartil es m enor que el percentil 48
• El séptimo decil es menor que el tercer cuartil
• El 80% central de los datos se encuentra comprendido entre el decil 2 y el
decil 6.
• El 90% central de los datos se encuentra comprendido entre el percentil 5 y
el percentil 95.
• Q3 = P3
Ejercicio 2

2)La siguiente tabla muestra el tiempo de atención (en minutos) que demoran 60 médicos
para la atención consulta externa en un centro hospitalario de Trujillo (La Libertad).

Tiempo (minutos) 8 - 13 13 - 18 18 - 23 23 - 28
Número de médicos 10 30 12 8

a)Determine el valor de la medida de resumen que se utilizará para


determinar que un médico se ubique en el 25% de los mas rápidos
en la atención a una consulta externa.
b)Determine el valor de la medida de resumen que se utilizará para
determinar que un médico se ubique en el 25% de los mas lentos
https://bit.ly/3aRUMnX
en la atención a una consulta externa.
Ejercicio 3
3) La empresa “Rappi” que brinda servicio de delivery en dos 2 zonas A y B del distrito de SJL,
ha realizado un estudio de los tiempos(en minutos) de los pedidos solicitados por sus
clientes en el mes de abril. En las zonas A y B se tomaron muestras de 40 y 50 pedidos,
respectivamente. Con la finalidad de comparar los tiempos de los pedidos de ambas zonas,
se obtuvieron los diagramas de cajas y bigotes que se muestran en el siguiente gráfico:
a) ¿Cuál es el tiempo máximo aproximado del 75 %
de los tiempos más cortos en la zona A? Justifique
su respuesta.
b)¿Cuál es el tiempo mínimo aproximado del 25
% de los recorridos más largos en la zona B?
Justifique su respuesta.
c)¿Qué zona presenta la mayor amplitud total de
los tiempos? Justifique su respuesta.
d)¿Qué zona presenta la mayor asimetría en los
tiempos? Justifique su respuesta.
Ejercicio 4
4) Se realiza una estadística en la Institución Educativa “Fe y Alegría”, referente a la nota
global de cada uno de los estudiantes que van a acudir a los exámenes de selectividad.
Las distribuciones de frecuencias son las siguientes:

Nota global de cada alumno Número de alumnos


15 15
16 20
17 30
18 30
19 20 https://bit.ly/3tEBh8b
20 15
Se realiza una estadística en la Institución Educativa “Fe y Alegría”, referente a la nota
global de cada uno de los estudiantes que van a acudir a los exámenes de selectividad.
Las distribuciones de frecuencias son las siguientes:
a) Calcule la nota máxima global del 30% de los alumnos menos aplicados
b) Calcule la nota mínima global del 30% de los alumnos mas aplicados
Ejercicio 5
5)En una granja avícola se registra la siguiente tabla de distribución de pollos respecto a
sus pesos. Peso (gramos) fi
960 990 60
990 1020 160
1020 1050 280
1050 1080 280
1080 1110 160
https://bit.ly/3xkZXoh
1110 1140 60

Se desea agrupar los pollos en cuatro categorías, con relación al peso de modo que
a) El peso del 20% de los pollos menos pesados sean de la categoría D
b) El peso del 30% de los siguientes sean de la categoría C
c) El peso del 30% de los siguientes sean de la categoría B
d) El peso del 20% de los pollos mas pesados sean de la categoría A
e) ¿Cuáles son los limites de peso entre las categorías A,B,C,D?
Integremos lo aprendido
Integremos lo aprendido

1)¿Cuál es la diferencia entre un cuartil y


decil?
2)¿Cuál es la medida que esta por encima
del 30% de los datos inferiores?
3)¿Cuál es la medida que es superada por
el 40% de los datos superiores?

https://bit.ly/3pKZIzIc
Actividad complementaria
Actividad complementaria

Resuelve la autoevaluación 4
en el aula virtual
Referencias Bibliográficas
Referencias Bibliográficas
Cárdenas, R. (2014). Estadística en la educación. Digital UNID. bit.ly/3GSn1kB

Celis de la Rosa, A. y Labrada, V. (2014). Bioestadística. El Manual Moderno. http://bit.ly/3Uh9VR2

De Oteyza, E., Lam, E., Hernández, C. y Carrillo, A. (2015). Probabilidad y estadística. Pearson.
http://bit.ly/3Vw7JGs

Martínez, C. (2012). Estadística y muestreo. Eco ediciones. http://bit.ly/3UjMG8E

Obando, J. y Arango, N. (2013). Probabilidad y estadística. Fondo Editorial Universidad EIA.


http://bit.ly/3FehZxG

Posada, G. (2016). Elementos básicos de estadística descriptiva para el análisis de datos. Fundación
Universitaria Luis Amigó. http://bit.ly/3AYplmh

Rodríguez, J., Pierdant, A. y Rodríguez, C.(2014) . Estadística para administración. Grupo editorial patria,
http://bit.ly/3Ud3Vso
Referencias Bibliográficas
Ross, M. (2014). Introducción a la estadística. REVERTÉ. http://bit.ly/3ua4AjA

Warr, R. y Erich, R. (2019). Should the Interquartile Range Divided by the Standard Deviation be
Used to Assess Normality? The American Statistician, 67(4), 242–244. http://bit.ly/3XUJKCK

DE CONSULTA

Anderson, D., Sweeney, D. y Williams, T. (2008). Estadística para administración y economía.


Cengage Learning Editores. http://bit.ly/3XJPpv3

Triola, M. (2018). Estadística. Pearson educación. http://bit.ly/3UhadHC

Walpole, R., Myers, R., Myers, S. y Ye, K. (2012). Probabilidad y estadística para ingeniería y ciencias.
Pearson educación. http://bit.ly/3GUBdJV

También podría gustarte