Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Medidas descriptivas
Ante la gran cantidad de datos que se utilizan al realizar un estudio estadístico se hace
necesario intentar resumir toda esa información. La idea es resumirla en unos pocos
valores que son representativos de una distribución, de manera que se conserve la
mayor información posible del conjunto total de datos y el comportamiento global de la
población o muestra en estudió.
Vamos a estudiar medidas estadísticas que nos ayudan a emitir conclusiones sobre
las muestras en estudio y a hacer comparaciones entre ellas. Estas medidas
estadísticas se denominan medidas descriptivas y se clasifican en medidas de
tendencia central, de posición, de dispersión y de forma.
∑ xi
i=1
n
x́=¿
Si los datos están presentados en tablas de frecuencias se puede calcular de la
siguiente manera:
n
∑ xi . f i
i=1
n
x́=¿
Donde x́ representa la media aritmética muestral, x ies cada uno de los valores
que toma la variable en caso de que los datos no estén agrupados en
intervalos o, en caso de que los datos estén agrupados en intervalos, será la
marca de clase de cada uno de estos, f i es la frecuencia absoluta y n la
cantidad total de datos.
Veamos dos ejemplos:
Página 1 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
x́=37,67
5.8+15.12+25.10+35.14+ 45.21+55.16+65.9
x́=
90
40+180+ 250+ 490+ 945+ 880+585
x́=
90
3370
x́=
90
x́=37,44
Página 2 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
Mediana (Me)
La mediana es el punto central de los datos, es decir que divide al conjunto de
datos en dos partes iguales, dejando la misma cantidad de datos por encima y
por debajo de ella.
En el caso de datos no agrupados en intervalos, una vez ordenados los
datos:
Si la cantidad de datos es impar, la mediana es el valor del centro,
se encuentra en la posición (n+1)/2
Por ejemplo: Se le preguntó a 5 personas elegidas al azar cuántas
cuadras caminan por día. Los datos obtenidos fueron 31 15 8 17 4
1. Los ordenamos:
4 8 15 17 31
2. Calculamos la posición de la mediana:
5+1
=3 Entonces el valor de la mediana se encuentra en la posición
2
3, por lo tanto Me=15, ya que es el dato que se encuentra en la
tercera posición.
Como conclusión se puede decir que hay un 50% de los encuestados
que caminan 15 o menos cuadras al día.
Si la cantidad de datos es par, la mediana es el promedio de los dos
valores centrales que se encuentran en las posiciones n/2 y (n/2)+1
Por ejemplo: Se le pregunta a 6 fumadores elegidos al azar la
cantidad de cigarrillos que fuma por día. Los datos obtenidos fueron
14 10 20 23 5 7
1. Los ordenamos:
5 7 10 14 20 23
2. Calculamos las posiciones
6 6+ 2
=3 y =4
2 2
A la posición 3 le corresponde el valor 10 y a la posición 4 le
corresponde el valor 14
3. Calculamos la mediana calculando el promedio de los valores de
la posición 3 y 4
10+14
Me= =12
2
5 7 10 14 20 23
Me=12
Página 3 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
fi Menor Mayor
Índices Índices
que que
(intervalos)
1 0 25
[1-2) 3 2 3 22
[2-3) 5 3 8 17
[3-4) 10 4 18 7
[4-5) 4 5 22 3
[5-6) 3 6 25 0
10
5
0
1 2 3 4 5 6
índices
12,5 ´
BC=18−8=10
Me=3,45
Página 4 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
Como sabemos que la mediana divide a los datos en dos partes iguales,
´ calculando:
podemos obtener la medida del segmento DE
n 25
= =12,5Este es el valor de la coordenada y del punto E.
2 2
Como la coordenada y del punto D es 8, entonces podemos calcular la longitud
del segmento:
´
DE=12,5−8=4,5
Ahora podemos aplicar el Teorema de Thales para hallar la longitud del
´ y así obtener la mediana:
segmento AD
´
AB ´
BC
=
AD
´ DE
´
Método de interpolación
Primero hay que saber cuál es el intervalo mediano o central (contiene a la
n 25
mediana). Para ello vamos a calcular = =12,5 y nos fijamos en cuál
2 2
frecuencia acumulada puede estar contenido este valor, la misma puede ser
igual a 12,5 o mayor, pero nunca menor, por lo tanto la frecuencia acumulada
que lo contiene es 18, es decir, que el intervalo mediano es [3-4), ya que es el
intervalo cuya frecuencia acumulada es 18.
Luego aplicamos la siguiente fórmula:
Página 5 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
n
−f
2 a−1
Me=Li−1 + . Ci
fi
Página 6 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
2
0
V R S A
Sectores
Como conclusión se puede decir: “el sector que tiene más empleados en la
empresa es el V.
3 3 3
1 1
0
1 2 3 4 5 6 7 8 9 10
Calificaciones
En este caso se puede decir como conclusión que: “la calificación que más se
repite en este grupo de alumnos es 5”
Puede haber en un conjunto de datos, varias modas o ninguna si no hay
ningún dato con mayor frecuencia. Cuando un conjunto de datos tiene 1 moda
se llama unimodal, si tiene 2 modas bimodal y si tiene más de 2 modas
multimodal.
Página 7 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
La moda es la marca de clase o el punto medio del intervalo modal (el que
tiene mayor frecuencia).
Índices xi fi
Índice de accidentes (intervalos)
12 [0-1) 0,5 0
10
8 [1-2) 1,5 3
6 [2-3) 2,5 5
fi
4
2
[3-4) 3,5 10
0 [4-5) 4,5 4
0.5 1.5 2.5 3.5 4.5 5.5
[5-6) 5,5 3
Índices 6,5 0
[6-7)
En este caso se considera Mo=3,5 que es la marca de clase del intervalo de mayor
frecuencia.
Interpolación mediante gráfico
d1=10-5=5 d2=10-4=6
h1=x h2=1-x
Como tenemos dos triángulos semejantes podemos aplicar el Teorema de Thales:
d1 d 2
=
h1 h2
Reemplazamos:
5 6
=
x 1−x
Aplicamos la propiedad fundamental de las proporciones:
5. ( 1−x )=6 x
5−5 x=6 x
5=6 x+5 x
Página 8 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
5=11 x
5
=x
11
0,45=x
Por lo tanto Mo=3+0,45=3,45
Interpolación por fórmula
Mo=Li + ( d 1+d 1d 2 ). C i
Mo=3+ ( 5+5 6 ) .1
Mo=3+ ( 115 ) .1
Mo=3+0,45
Mo=3,45
Medidas de posición
Las medidas de posición indican, una vez ordenados los datos, cuantos elementos
quedan a la izquierda o derecha de uno dado. Dentro de las medidas de posición
tenemos los cuartiles, deciles y percentiles.
Cuartiles (Qk)
Los cuartiles son valores posicionales que dividen a los datos en cuatro partes iguales,
el primer cuartil (Q1) deja el 25% de la información por debajo de él, y el 75% por
encima, el segundo cuartil (Q2), coincide con la mediana, divide la información en dos
partes iguales, y por último el tercer cuartil (Q3) deja el 75% por debajo de sí, y el 25%
por encima.
Gráficamente:
Página 9 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
45 – 47 – 49– 52 – 57 – 60 – 62 – 65– 74 – 74 – 50 – 52 – 65 – 68 – 74
Para calcular los cuartiles en los datos sin agrupar se debe seguir el siguiente
procedimiento
1) Ordenar los datos de menor a mayor.
k . ( n+1 )
Qk = siendo k el número del cuartil que se va a calcular .
4
k .n
Qk = siendo k el número del cuartil que se va a calcular .
4
Calculemos:
En este caso el número de datos es impar, por lo tanto vamos a usar la primera
fórmula.
1.(15+1) 16
Q 1= = =4 El primer cuartil se encuentra en el 4° lugar.
4 4
3.(15+1) 3.16 48
Q 3= = = =12 El tercer cuartil se encuentra en el 12° lugar
4 4 4
Para el cuartil 2 usaríamos la misma fórmula solo que k sería 2.
45 – 47 – 49– 50 – 52 – 52 – 57 – 60 – 62 – 65– 65 – 68 – 74 – 74 – 74
Q1
El 25% cuya El 75% cuya calificación es superior a 50
calificación es
menor o igual a 50
Página 10 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
El dato que ocupa la posición del cuartil 3 es 68, es decir que hay un
75% de los postulantes que tiene una calificación menor o igual a 68 y
hay un 25% de ellos que obtuvo una calificación superior a 68.
45 – 47 – 49– 50 – 52 – 52 – 57 – 60 – 62 – 65– 65 – 68 – 74 – 74 – 74
Q3
El 75% cuya calificación es menor o igual a 68
El 25% cuya
calificación es
superior a 68
Si tuviéramos estos datos tabulados en una tabla de frecuencias de la siguiente forma:
Calificaciones fi fa
45 1 1
47 1 2
49 1 3
50 1 4
52 2 6
57 1 7
60 1 8
62 1 9
65 2 11
68 1 12
74 3 15
Total 15
Aplicamos las mismas fórmulas, solo que la forma de identificar los datos es usando la
frecuencia acumulada. Veamos cómo sería:
1.(15+1) 16
Q 1= = =4 Buscamos en la tabla cuál de las frecuencias acumuladas
4 4
contiene al 4 para saber cuál es el valor del cuartil 1. En este caso Q1=50, ya que 50
tiene una frecuencia acumulada de 4.
3.(15+1) 3.16 48
Q 3= = = =12 Buscamos en la tabla cuál de las frecuencias
4 4 4
acumuladas contienen al 12 para saber cuál es el valor del cuartil 3. En este caso
Q3=68, ya que 68 tiene una frecuencia acumulada de 12.
xi N° de fa (menor
Consumo
camiones(fi) que)
[0-10) 5 8 8
[10-20) 15 12 20
[20-30) 25 10 30 Intervalo en el que se encuentraQ 1
[30-40) 35 14 44
[40-50) 45 21 65
[50-60) 55 16 81
[60-70) 65 9 90
Total 90
Una vez que tabulamos y ordenamos los datos en una tabla procedemos a calcular el
cuartil deseado usando la siguiente fórmula:
k.n
−f a−1
4
Qk =Li −1 + . Ci
fi
Donde: Li−1 es el límite inferior del intervalo al que pertenece el cuartil buscado.
Página 12 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
Q1=20+ 2,5
Q1=22,5
Cuartil 2
1) Determinamos el orden
2.90 180
Q 2= ⟹ Q 2= =Q 2=45
4 4
2) Nos fijamos qué intervalo contiene al 45 dentro de su frecuencia
acumulada. El intervalo que contiene al 45 es [40-50), ya que su frecuencia
acumulada llega hasta 65. No elegimos el intervalo anterior porque la
frecuencia acumulada solo llega hasta 44.
3) Una vez definido el orden procedemos a calcular el valor del cuartil usando
la fórmula:
2.90
−44
4
Q2=40+ .10
21
45−44
Q 2=40+ .10
21
1
Q 2=40+ .10
21
Q2=40+0,48
Q2=40,48
Cuartil 3
1) Determinamos el orden
3.90 270
Q 3= ⟹ Q 3= =Q 3=67,5
4 4
2) Nos fijamos qué intervalo contiene al 67,5 dentro de su frecuencia
acumulada. El intervalo que contiene al 67,5 es [50-60), ya que su
frecuencia acumulada llega hasta 81. No elegimos el intervalo anterior
porque la frecuencia acumulada solo llega hasta 65.
3) Una vez definido el orden procedemos a calcular el valor del cuartil usando
la fórmula:
3.90
−65
4
Q3=50+ . 10
16
67,5−65
Q 3=50+ . 10
16
Página 13 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
2,5
Q 3=50+ .10
16
Q 3=50+1,56
Q 3=51,56
Al igual que en el caso de los datos sin agrupar acá también podemos sacar
conclusiones, por ejemplo respecto del cuartil 3 podemos decir que el 75% de los
camiones tiene un consumo de combustible de carburantes menor o igual a 51,56
litros y el 25% de los camiones tiene un consumo superior a este valor.
Deciles (Dk)
Los deciles son valores posicionales que dividen a los datos en diez partes iguales. El
primer decil (D1) deja el 10% de la información por debajo de él, y el 90% por encima,
el segundo decil (D2) deja el 20% de la información por debajo de él, y el 80% por
encima, y así sucesivamente hasta el noveno decil (D9) que deja el 90% por debajo de
él, y el 10% por encima.
Las fórmulas y procedimientos para calcular los deciles son análogas a las de los
cuartiles:
Para datos sin agrupar:
k . ( n+1 )
Dk = siendo k el número del cuartil que se va a calcular .
10
k .n
Dk = siendo k el número del cuartil que se va a calcular .
10
k.n
−f a−1
10
Dk = Li −1 + . Ci
fi
Donde: Li−1 es el límite inferior del intervalo al que pertenece el decil buscado.
Página 14 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
Percentiles (Pk)
Los percentiles dividen a la distribución en cien partes iguales. Así, por ejemplo el
percentil 80 (P80) deja el 80% de los datos por debajo de él y el 20% por encima.
Las fórmulas y procedimiento para calcular los percentiles son análogas a las de los
cuartiles:
Para datos sin agrupar:
k . ( n+1 )
Pk = siendo k el número del cuartil que se va a calcular .
100
k .n
Pk = siendo k el número del cuartil que se va a calcular .
100
k.n
−f
100 a−1
Pk =Li−1 + . Ci
fi
Actividades
Las siguientes actividades deberán ser realizadas en Excel, usando las funciones,
fórmulas y herramientas vistas en los videos de la clase del 22/09 para construir tablas
y gráficos. Lo único que deberán realizar en la carpeta son los cálculos para obtener
las medidas descriptivas solicitadas en cada actividad. Cabe aclarar que deberán
enviar las tablas y gráficos realizados en Excel y además las fotos de los cálculos de
las medidas descriptivas realizados en sus carpetas.
Página 15 de 16
Medidas descriptivas: Medidas de tendencia central. Medidas de posición.
C A B P U A C Cl B P A B U A C Cl A U B B
A B B U C Cl A B P C B A Cl B C A A P C Cl
Página 16 de 16