Está en la página 1de 39

Estadística descriptiva y

probabilidades
Medidas de posición y de forma
INICIO
Completa los espacios en blanco

comportamiento
Las medidas de posición son fundamentales en el
análisis de ………. porque proporcionan una datos
comprensión rápida y concisa de la distribución de los
datos y ayudan a identificar………. , medidas, ………. y
tendencias dentro de un conjunto de datos. Las medidas
valores atípicos
de forma son importantes para comprender la ………. y
el patrón de los datos. Por lo tanto, al comprender tanto patrones
las medidas de posición como las medidas de forma, los
analistas pueden tener una visión completa de la variabilidad
naturaleza y el ………. de los datos que están
analizando.
UTILIDAD

A B C

1 2 3

Fuente: https://anestesiar.org/2015/una-caja-con-bigotes-el-grafico-de-caja/

Relaciona la gráfica de boxplot (caja y bigotes) con el histograma correspondiente


UTILIDAD
Logro de la sesión

Al finalizar la sesión de clase,


el estudiante interpreta las
medidas de posición y de
forma en un conjunto de
datos a partir del cálculo de
dichas medidas
TRANSFORMACIÓN

Medidas de posición

Las medidas de posición son


Cuartiles (Qk)
valores numéricos que nos
Los cuartiles son tres valores que dividen al conjunto de
dicen dónde se encuentra un
datos en cuatro partes iguales.
dato en relación con los demás
datos en un conjunto ordenado. Deciles (Dk)
También se les conoce como Los deciles son nueve valores que dividen al conjunto de datos
cuantiles, ya que dividen el en diez partes iguales.
conjunto de datos en partes
Percentiles (Pk)
iguales, ayudándonos a
Los percentiles son noventa y nueve valores que dividen al
entender mejor cómo se
conjunto de datos en cien partes iguales.
distribuyen los valores.
Medidas de posición

Cuartiles (Qk)
Equivalencias:
⮚Q2 = D5 = P50 = Me
⮚Q3 = P75
Deciles (Dk) ⮚D7 = P70

Percentiles (Pk)
Percentil Pi

Son 99 valores que dividen al conjunto de datos


ordenados en 100 partes iguales. Cada parte
representa el 1 % del total. Se denotan con:

𝑷𝟏 = primer percentil
𝑷𝟐𝟓 = 𝑸𝟏 = percentil 25
𝑷𝟓𝟎 = 𝑸𝟐 = 𝑴𝒆 = percentil 50
𝑷𝟕𝟓 = 𝑸𝟑 = percentil 75
𝑷𝟗𝟗 = percentil 99

⮚ Si el puntaje alcanzado es 19, entonces se


encuentra en el percentil 67, esto significa que esté
examinado está mejor posicionado que el 66% de
los examinados
Percentil Pi
Cálculo de percentiles para datos
Cálculo de percentiles para
no agrupados (Pk)
datos agrupados (Pk)

⮚ Ordenar los datos en forma ascendente Paso 1: Calcular frecuencia absoluta acumulada (F)
Paso 2: Ubicar posición del percentil
⮚ Calcular la posición del percentil k-ésimo mediante la siguiente
expresión:
Posición = k (n + 1) Paso3: Reemplazar en la fórmula
100

⮚ Ubicar el percentil buscado en la posición calculada si éste es un


número entero, de lo contrario dicho valor se calcula en
forma proporcional en base a
Pk = Li + parte decimal x (Ld– Li) Donde:
k: Valor k-ésimo según el cuantil Ck: k-ésimo valor del cuantil.
Donde: Li: Límite inferior del intervalo donde se encuentra el valor del cuantil C k:
Pk: Percentil k-ésimo. c: Amplitud de la clase
Li: Valor del dato ubicado en la posición con el valor de k aproximado a entero. Fi-1: Frecuencia acumulada.
Ld: Valor del dato superior o inmediato a Li fi: Frecuencia absoluta del intervalo donde se encuentra el valor del cuantil C k:
Cálculo de percentiles para datos no agrupados

Un fabricante de componentes electrónicos se interesa en determinar el tiempo de vida útil de cierto tipo de batería. Se
presenta a continuación una muestra de 24 horas de vida registradas:

134 122 122 125 126 172 131 180


134 120 136 161 140 140 140 145
146 153 155 159 139 162 128 132

¿ Cuál es el valor a partir del cual se encuentra el 30%


superior de los tiempos en horas de vida útil de las baterías?
Cálculo de percentiles para datos no agrupados

Solución
Posición = 17.5
Nota: Parte decimal=0.5

Cálculo de la posición del percentil 70: (k=70)


Posición = 70 (24+1) =17.5
100

⮚ Ordenando los datos en forma ascendente


120 122 122 125 126 128 131 132
134 134 136 139 140 140 140 145
146 153 155 159 161 162 172 180
Cálculo de percentiles para datos no agrupados

Solución
Interpretación:
El 70% de los tiempos de vida útil registrados
son menores iguales a 149.5 horas.

⮚ Cálculo de P70
Pk = Li + parte decimal x (Ld – Li) P70 = 146 + 0.5 x (153 – 146)
P70 = 149.5 horas

120 122 122 125 126 128 131 132


134 134 136 139 140 140 140 145
⮚ El valor de 17.5 se encuentra entre las posiciones 17 y 18 de los datos
ordenados en forma ascendente: 146 153 155 159 161 162 172 180
X17 = 146, entonces: Li = 146
X18 = 153, entonces: Ld = 153
Cálculo de percentiles para datos agrupados

Si se ha registrado en el siguiente cuadro los pagos adicionales (soles) por concepto de horas extras
durante una semana de todos los trabajadores de una empresa constructora

X (S/.hora extra) fi (obrero)


[50 – 70> 30
[70 – 90> 50
[90 – 110> 65
[110 – 130> 30
[130 – 150> 25

¿Cuál es el valor a partir del cual se encuentra el 55% de los obreros


con menores o inferiores montos por horas extras en semana?
Cálculo de percentiles para datos
agrupados
Solución
Interpretación:

El 55% de los obreros tienen un tiempo de


extra menor a 99.23 soles Y el otro 45% de los
obreros tiene un tiempo extra mayor

Paso3: Reemplazar en la fórmula

X (S/.hora extra) fi (obrero) Fi


[50 – 70> 30 30
[70 – 90> 50
[90 – 110>
Paso 1: Calcular (F) [110 – 130> 30 175
Paso 2: Ubicar posición del percentil : K=55 [130 – 150> 25 200
Decil (Di)
Los deciles son útiles para analizar la distribución de los datos y
entender cómo se agrupan los valores en diferentes segmentos
dentro del conjunto de datos. Son una forma de entender la
dispersión de los datos y pueden ser utilizados para identificar
valores atípicos o para realizar comparaciones entre diferentes
partes de un conjunto de datos

Son valores que dividen al conjunto en diez partes iguales


son los deciles y se denotan 𝑫𝟏, 𝑫𝟐, 𝑫𝟑, … , 𝑫𝟗
𝑫𝟓 = 𝑴𝒆 = quinto decil o decil medio
El histograma muestra la distribución de calificaciones en una
prueba (de 60 puntos) que intentaron 600 estudiantes. El puntaje
de cada alumno está representado por un cuadrado en el
histograma
Decil (Di)
Cálculo de percentiles para datos agrupados (P k)

⮚ Calcular frecuencia absoluta acumulada (F) ¡Recuerda!


⮚ Ubicar posición del Decil Ubicar la posición calculada en los valores de la
frecuencia acumulada Fi. (Se sigue el mismo
procedimiento que el percentil)
⮚ Reemplazar en la fórmula

⮚ Donde:
⮚ k: Valor k-ésimo según el decil Dk: k-ésimo valor del decil.
⮚ Li: Límite inferior del intervalo donde se encuentra el valor del decil Dk:
⮚ c: Amplitud de la clase
⮚ Fi-1: Frecuencia acumulada.
⮚ fi: Frecuencia absoluta del intervalo donde se encuentra el valor del decil Dk:
Cálculo de deciles para datos agrupados

La siguiente tabla muestra el tiempo requerido para auditar saldos de cuentas

Tiempo de Auditoría Número de Registro (fi )

[10 – 19> 3
[19 – 28> 5
[28 – 37> 10
[37 – 46> 12
[46 – 55> 20

¿Cuál es el primer decil?


Cálculo de deciles para datos agrupados

Solución
Interpretación:

El decil 1 se encuentra en el segundo


intervalo y su valor es 22.6 min.

Paso 3: Reemplazar en la fórmula

X (S/.hora extra) fi (obrero) Fi


[10 – 19> 3 3
Paso 1: Calcular (F) [19 – 28> 5 8
Paso 2: Ubicar posición decil: K=1 [28 – 37> 10 18
[37 – 46> 12 30
[46 – 55> 20 50
Cuartil (Qi)

Son 3 valores que dividen al conjunto de


datos ordenados en 4 partes iguales. Cada
parte representa el 25 % del total (un cuarto).
Se denotan con:

𝑸𝟏 = primer cuartil o cuartil inferior

𝑸𝟐 = 𝑴𝒆 = segundo cuartil o cuartil medio

𝑸𝟑 = tercer cuartil o cuartil superior

Fuente: https://datatab.es/tutorial/box-plot
Cálculo de cuartiles para datos agrupados (Qk)

⮚ Calcular frecuencia absoluta acumulada (F)

⮚ Ubicar posición : según el cuartil


¡Recuerda!

⮚ Reemplazar en la fórmula

⮚ Ubicar la posición calculada en los valores de la frecuencia acumulada Fi. (Se sigue el
mismo procedimiento que el percentil)
Cálculo de cuartiles para datos agrupados (Qk)

La siguiente tabla muestra el tiempo requerido para auditar saldos de cuentas

Número de Registros
Tiempo de Auditoria
(fi )
[10 – 19> 3
[19 – 28> 5
[28 – 37> 10
[37 – 46> 12
[46 – 55> 20

¿Cuál es el segundo
cuartil?
Cálculo de cuartiles para datos agrupados (Qk)

Solución
Interpretación:

EL cuartil 2 se encuentra en el cuarto


intervalo y su valor es 42.25 min.

Paso3: Reemplazar en la fórmula

X (S/.hora extra) fi (obrero) Fi


[10 – 19> 3 3
Paso1: Calcular (F) [19 – 28> 5 8
Paso2: Ubicar posición cuartil 2: Q=2 [28 – 37> 10 18
[37 – 46> 12 30
[46 – 55> 20 50
Medidas de forma

Asimetría Ak
Describen la forma o la estructura
de una distribución de datos. Estas
medidas proporcionan información
sobre la simetría, el nivel de
concentración de datos y nivel
de apuntamiento. Lo que ayuda a
comprender mejor la variabilidad y
el patrón de los datos.
Curtosis Ku
Asimetría
Son medidas que permiten conocer la forma que tiene la curva que representa al conjunto de datos. Nos
brindan información sobre la dirección de la dispersión de los datos.
Si esta dispersión tiende hacia el lado derecho, diremos que la curva tiene asimetría positiva, en caso
contrario diremos que tiene asimetría negativa.
Si las dispersiones de la curva son iguales diremos que la curva es simétrica.
Coeficiente de asimetría de Pearson

Si Ak < 0, la distribución tiene asimetría negativa.


Si Ak = 0, la distribución es simétrica.
Si Ak > 0, la distribución tiene asimetría positiva.
Curtosis
Proporciona información sobre la forma de la distribución de datos y cómo se comparan con una distribución
normal estándar.
Brindan información sobre el grado de deformación vertical de una distribución de
frecuencias en comparación con la curva normal que le corresponde.

Fuente: https://www.javierparra.net/ecoknowmic/analisis-estadistico-y-grafico-analisis-univariante/
Curtosis
Ku < 0.263, la distribución es Platicúrtica

Si el grado de apuntamiento es menor que el de la distribución


normal.

Ku = 0.263, la distribución es Mesocúrtica

Si el grado de apuntamiento es igual que el de la distribución


normal.

Ku > 0.263, la distribución es Leptocúrtica

Si el grado de apuntamiento es mayor que el de la distribución


normal.
Curtosis
La resistencia es una característica importante de los materiales utilizados en casas prefabricadas.
Cada uno de los 50 elementos de placa prefabricados se sometieron a prueba de esfuerzo severo y
se registró el ancho máximo (mm) de las grietas resultantes. Los datos registrados para la muestra
en estudio fue la siguiente:
N° de elementos de placa
Ancho máximo de la grieta (mm)
(fi)
[0.4; 0.5> 6
[0.5; 0.6> 14
[0.6; 0.7> 10
[0.7; 0.8> 9
[0.8; 0.9] 4
[0.9; 1] 7
Total 50

Calcular e interpretar el coeficiente de curtosis correspondiente a los anchos máximos (mm) de las
grietas resultantes para la muestra de 50 elementos de placa prefabricados.
. Paso 1. Completando la tabla de frecuencias:
Paso 2. Cálculo de las medidas de posición:

Percentil Posición Fórmula Valor


P75
37.5 = 0.7+0.1x(37.5-30)/9 0.78
N° de Frecuencia P25
Ancho máximo de la 12.5 = 0.5+0.1x(12.5-6)/14 0.55
elementos de acumulada P90
grieta (mm)
P10
placa (fi) (Fi) 45 = 0.9+0.1x(45-43)/7 0.93
P25 [0.4; 0.5> 6 6
P10
5 = 0.4+0.1x(5-0)/6 0.48
[0.5; 0.6> 14 20
P75 [0.6; 0.7> 10 30
[0.7; 0.8> 9 39
P90
[0.8; 0.9] 4 43
[0.9; 1] 7 50
Total 50
Percentil Valor
P75
0.78
P25 Paso 4. Interpretación: Los datos presentan una
0.55
P90 distribución PLATICÚRTICA.
0.93
P10
0.48

. Paso 3. Reemplazando en la fórmula de


curtosis

Ku = 0.255556
Asimetría

Se realiza un estudio sobre el tiempo de vida útil de un componente electrónico. A continuación, se


presenta la tabla de datos agrupados por intervalos para una muestra de 40 tiempos en horas de vida
útil de los componentes electrónicos en estudio:

Tiempo de vida útil (Horas) N° de componentes (fi)


[500; 700> 6
[700; 900> 12
[900; 1100> 10
[1100; 1300> 8
[1300; 1500] 4
Total 40

Calcular e interpretar el coeficiente de asimetría correspondiente a los tiempos en horas de


vida útil de la muestra de 40 componentes electrónicos.
. Paso 1. Completando la tabla de frecuencias: Paso 2. Cálculo de los estadísticos:

Tiempo de vida N° de Marca de Frecuencia 𝒇𝒊 .𝑿𝒊 𝑥 𝑖2 𝑓𝑖


útil (Horas) componentes(fi) clase (Xi) acumulada(Fi)
[500; 700> 6 600 6 3600 2160000
[700; 900> 12 800 18 9600 7680000
[900; 1100> 10 1000 28 10000 10000000 +
[1100; 1300> 8 1200 36 9600 11520000
[1300; 1500] 4 1400 40 5600 7840000
Total 40 38400 39200000
. Paso 3. Reemplazando en la fórmula de Paso 4. Interpretación: La distribución de los
curtosis datos presenta una asimetría positiva.

As = 0.245
¿Tienen alguna consulta o duda?
Práctica grupal

Resolver los ejercicios


propuestos
Tiempo : 30 min
Ejercicio 1
El Gerente General por víspera del aniversario de la empresa decide otorgar un bono de
reconocimiento a los empleados, siempre y cuando se cumpla algunas condiciones.
En la tabla se muestra los minutos adicionales que han trabajado los empleados en los 3 últimos
meses, al finalizar la jornada laboral, de manera voluntaria, para cumplir las metas.

X (minutos CONDICIONES:
fi (empleado)
adicionales) Si el 55% de los empleados ha trabajado 99.231 minutos,
[50 – 70> 30
adicional a su jornada laboral regular, entonces el Gerente
General otorgará un bono de compras de mil soles a todos los
[70 – 90> 50 empleados.
[90 – 110> 65
Si no pasa ello, todos los empleados se quedarán sin bono
[110 – 130> 30 este año.

[130 – 150> 25 A partir de los datos de la tabla ¿Los empleados recibirán


dicho bono?
Ejercicio 2
La siguiente imagen muestra un gráfico de box plot en relación al tránsito total de vehículos según
las restricciones vehiculares por semana y en toque de queda.

¿Qué conclusiones puedes generar a partir de la interpretación de las gráficas?


CIERRE

¿Qué hemos aprendido hoy

Si observamos una distribución con una alta


curtosis, ¿qué conclusiones podríamos sacar
sobre la variabilidad de los datos?

Si observamos una distribución con una alta


curtosis, ¿qué conclusiones podríamos sacar
sobre la variabilidad de los datos?

También podría gustarte