Está en la página 1de 29

TEMA 3.

MEDIDAS DE CENTRALIZACIÓN Y DE POSICIÓN.

3.1. Medidas descriptivas. Definición y clasificación.


3.2. Medidas de centralización: Media, Moda y Mediana. Propiedades.
3.3. Medidas de posición: Cuantiles (Cuartiles, Deciles y Percentiles)
3.4. Diagramas de CAJAS

Natividad Jiménez Saavedra (natjimen@ull.es)


Departamento de Matemáticas, Estadística e Investigación Operativa
Las medidas descriptivas son valores numéricos calculados a partir de la
muestra y que nos resumen la información contenida en ella.

¿Cómo se clasifican?
1. Centralización: Nos dan un valor central (o centro) de la distribución,
que se puede tomar como representativo de todos los datos
Media – Mediana - Moda
2. Posición: se les llama también “cuantiles” y son valores de la
distribución que la dividen en partes iguales, es decir, en intervalos,
que comprenden el mismo número de valores. Los más usados son los
Cuartiles - deciles - percentiles.
3. Dispersión: Son aquellos parámetros o estadísticos que valoran la
proximidad o alejamiento existente entre los datos
Rango – Varianza - Desviación típica - Coeficiente de Variación
4. Forma: comparan la forma que tiene la representación gráfica de la
variable en estudio, con la distribución normal 
Coeficiente de asimetría - de apuntamiento o curtosis.
Medidas de Centralización - media
Media (media aritmética o simplemente media): Es el promedio que todos
conocemos y se obtiene sumando todos los datos y dividiendo por el nº
total de datos.
Si 𝑥𝑖 es el valor de la variable y 𝑛𝑖 su frecuencia absoluta:

x1  n1  x2  n2  x3  n3      xn nk
x
N
k

x n
i 1
i i

O también: x
N
Propiedades de la media aritmética
1. Se puede hallar sólo para variables cuantitativas.
2. Es independiente de las amplitudes de los intervalos.
3. Es muy sensible a las puntuaciones extremas.
4. La media no se puede calcular si hay un intervalo con una amplitud
indeterminada.
Ejemplo 3.1 (Es muy sensible a las puntuaciones extremas):
Si tenemos una distribución con los siguientes pesos:
65, 69, 65, 72, 66, 75, 70, 110

¿Cuál es la media?

¿Te parece que representa adecuadamente a los valores de la que


proviene?
Ejemplo 3.2
En un test realizado a un grupo de 42 personas se han obtenido las
puntuaciones que muestra la tabla.

ni
[10, 20) 1
[20, 30) 8
[30,40) 10
[40, 50) 9
[50, 60 8
[60,70) 4
[70, 80) 2
42
Calcula la puntuación media.
Medidas de Centralización - moda
Moda (𝑴𝒐 ): es el valor de la variable cuya frecuencia absoluta es la mayor.
No tiene porque ser única.

• Si en un grupo hay dos o más puntuaciones con la misma frecuencia


máxima, la distribución es bimodal o multimodal. Ejemplo: 1, 1, 1, 4, 4,
5, 5, 5, 7, 8, 9, 9, 9
• Cuando todas las puntuaciones de un grupo tienen la misma frecuencia,
no hay moda. Ejemplo: 2, 2, 3, 3, 6, 6
• Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es
el promedio de las dos puntuaciones adyacentes. Ejemplo: 0, 1, 3, 3, 5,
5, 7, 8
Medidas de Centralización - moda

Cálculo de la moda para datos agrupados cuando todos los intervalos tienen
la misma amplitud.
La clase modal es la que tiene mayor frecuencia absoluta.

ni  ni 1
Mo  L i 1   ai
ni  ni 1   ni  ni 1 

𝐿𝑖−1  Límite inferior de la clase modal.


𝑛𝑖  Frecuencia absoluta de la clase modal.
𝑛𝑖−1  Frecuencia absoluta inmediatamente inferior a la de la clase modal.
𝑛𝑖+1  Frecuencia absoluta inmediatamente posterior a la clase modal.
𝑎𝑖  Amplitud de la clase.
Ejemplo 3.3
Calcular la moda de una distribución estadística que viene dada por la
siguiente tabla:

ni
[60, 63) 5
[63, 66) 18
[66, 69) 42
[69, 72) 27
[72, 75) 8
100

Dese cuenta de que todos los intervalos tienen la misma amplitud.


Medidas de Centralización - moda

Cálculo de la moda para datos agrupados cuando los intervalos tienen


amplitudes distintas.

ni
En primer lugar tenemos que hallar las alturas. hi 
ai

La clase modal es la que tiene mayor altura.


Y la MODA:
h i  h i 1
Mo Li 1  ai
hi  hi 1   hi  hi 1 
Medidas de Centralización - mediana
Mediana (Me): es el valor que ocupa el lugar central de todos los datos
cuando éstos están ordenados de menor a mayor, de forma que el 50% de
los datos son menores que la mediana y el otro 50% son mayores.
• Si el nº de datos es impar, la mediana es el valor central.
• Si es par, entonces es la media aritmética de los dos valores centrales.

Cálculo de la mediana para variables discretas (y con pocos datos):


1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un número impar de medidas la mediana es la
puntuación central de la misma. Ejemplo: 2, 3, 4, 4, 5, 5, 5, 6, 6
3. Si la serie tiene un número par de puntuaciones la mediana es la media
entre las dos puntuaciones centrales. Ejemplo: 7, 8, 9, 10, 11, 12
Medidas de Centralización - mediana
Cálculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada
llega hasta la mitad de la suma de las frecuencias absolutas. Es decir
𝑁
tenemos que buscar el intervalo en el que se encuentre .
2

N
 Ni 1
Me  Li 1  2  ai
ni

𝐿𝑖−1  Límite inferior de la clase donde se sitúa la mediana.


𝑁𝑖−1  Frecuencia acumulada anterior a la clase mediana.
𝑎𝑖  Amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.
Cálculo de medidas de Centralización
Ejemplo 1.1 (del tema 1):
El número de empleados que tienen 20 empresas de un sector es:
3, 1, 2, 2, 1, 5, 2, 2, 0, 6, 3, 2, 4, 3, 4, 2,3, 1, 7, 6
Calcule las medidas centrales (media, moda y mediana).
Cálculo de medidas de Centralización
Ejemplo 1.2 (del tema 1):
Calcule ahora las medidas centrales (media, mediana y moda) para el ejemplo
de las cotizaciones de las acciones de una determinada sociedad anónima
durante 40 sesiones consecutivas de la Bolsa, cuyos resultados han sido:
356 358 362 363 361 364 367 366

349 348 352 355 354 353 357 358

338 341 343 347 346 345 348 349

330 332 335 334 335 337 340 339

331 327 326 323 325 324 321 322


Medidas de Posición

Los cuantiles son valores de la distribución que la dividen en partes iguales,


es decir, en intervalos, que comprenden el mismo número de valores. Los
más usados son los cuartiles, los deciles y los percentiles.
Medidas de Posición
Cuartiles: son los tres valores que dividen al conjunto de datos ordenados
en cuatro partes iguales.
 El primer cuartil 𝑸𝟏 es el menor valor que es mayor que una cuarta
parte de los datos. Es el valor de la variable que deja a su izquierda el
25% de los valores, y a su derecha el 75% de los valores.
 El 2º cuartil 𝑸𝟐 (la mediana), es el menor valor que es mayor que la
mitad de los datos. Es el valor de la variable que deja a su izquierda el
50% de los valores, y a su derecha el 50% de los valores.
 El tercer cuartil 𝑸𝟑 es el menor valor que es mayor que tres cuartas
partes de los datos. Es el valor de la variable que deja a su izquierda el
75% de los valores, y a su derecha el 25% de los valores.
Medidas de Posición

Cálculo de los cuartiles


Se procede de forma análoga a como hicimos para el cálculo de la Me.
En el caso de datos agrupados se busca el intervalos en el que se encuentre:
𝑁 2𝑁 3𝑁
, , .
4 4 4
k .N
 N i 1
Qk  Li 1  4  ai
ni

𝐿𝑖−1  Límite inferior de la clase donde se sitúa el cuartil.


𝑁𝑖−1  Frecuencia acumulada anterior a la clase del cuartil.
𝑎𝑖  Amplitud de la clase.
Medidas de Posición
Deciles: son los nueve valores que dividen al conjunto de datos ordenados
en diez partes iguales.

Así:
• El 7º decil es el valor de la variable que deja a su izquierda el…………..…. de los
valores y a su derecha el…………..…. de los valores.
• El 3er decil es el valor de la variable que deja a su izquierda el………..……. de
los valores y a su derecha el……………… de los valores.

Percentiles: son 99 valores que dividen en cien partes iguales el conjunto de


datos ordenados.

Así:
• El percentil de orden 15 deja por debajo al 15% de las observaciones, y
por encima queda el 85%.
• El percentil de orden 17 deja por debajo (a su izquierda) al………………..…….. de
las observaciones, y por encima (a su derecha)………………………………
Medidas de Posición
Cálculo de los deciles y percentiles
Se procede de forma análoga a cómo hicimos para el cálculo de la Me y de
los cuartiles. En el caso de datos agrupados se busca el intervalo en el que
𝑁 2𝑁 9𝑁 𝑁 2𝑁 99𝑁
se encuentre respectivamente: , ,…, 𝑜 , ,…, .
10 10 10 100 100 100

El percentil es una medida que se utiliza para comparar el crecimiento de un niño


con el crecimiento de otros niños de su edad.
¿Cómo se interpretan los percentiles?
 Cuando el pediatra dice que un niño está en el percentil 25 de altura, significa
que de cada 100 niños de su edad, 75 son más altos que él y 24 serían más bajos.
 Por el contrario, si el bebé está en el percentil 90 de altura significa que, de cada
100 bebés, solo hay 10 que midan más que él, y 89 que medirían menos.
Cálculo de medidas de Posición
Para los dos ejemplos siguientes, calcule las siguientes medidas de posición:
𝑸𝟏 , 𝑸𝟑 , 𝑫𝟐 , 𝑫𝟕 , 𝑷𝟑𝟓 , 𝑷𝟗𝟎 .

Ejemplo 1.1 (del tema 1):


El número de empleados que tienen 20 empresas de un sector es:
3, 1, 2, 2, 1, 5, 2, 2, 0, 6, 3, 2, 4, 3, 4, 2,3, 1, 7, 6

Ejemplo 1.2 (del tema 1):


Las cotizaciones de las acciones de una determinada sociedad anónima
durante 40 sesiones consecutivas de la Bolsa.
Diagramas de Cajas y Bigotes (boxplots o box and whiskers).
Permite resumir información utilizando 5 medidas estadísticas:
mín, 𝑸𝟏 , 𝑸𝟐 , 𝑸𝟑 y máx.
Consta de DOS partes:
CAJA: Rectángulo cuyo lados más largos muestran el recorrido entre
cuartiles. Dicho rectángulo se ubica a escala sobre un segmento que tiene
como extremos los valores mínimo y máximo de la variable.
BIGOTES: Las líneas que quedan a un lado y al otro de la CAJA.
La mayor utilidad de estos diagramas es para comparar dos o más conjuntos
de datos.
¿Cómo se dibuja el Diagrama de Cajas y Bigotes ?
Es necesario tener calculadas las CINCO medidas que lo conforman:
mín, 𝑸𝟏 , 𝑴𝒆, 𝑸𝟑 y máx.
PRIMER PASO: Dibujamos un eje (horizontal o vertical, como se desee).

SEGUNDO PASO: marcamos en ese eje las 5 medidas anteriores.


mín 𝑸𝟏 𝑴𝒆 𝑸𝟑 máx

TERCER PASO: construimos la CAJA desde el primer al tercer cuartiles y lo


dividimos por un segmento en el punto que corresponde a la Me.
Si desea amplíe los bigotes en los puntos correspondientes al mín y al máx.

mín 𝑸𝟏 𝑴𝒆 𝑸𝟑 máx
En el siguiente ejemplo, sobre las características de los smartphones de
2014, los diagramas de “cajas y bigotes” nos permiten visualizar en una sola
gráfica todas las puntuaciones obtenidas por todos los dispositivos de gama
alta (verde) y gama media (azul).
Así, por ejemplo, en la columna de la izquierda -la verde- del bloque
“Software“, que corresponde a las puntuaciones del software de los modelos
de gama alta vemos lo siguiente:
El “bigote” inferior indica la puntuación más baja que ha sido otorgada a
algún modelo de esa gama, en este caso, un 6.
El lado inferior del rectángulo verde -la “caja”- representa la puntuación por
debajo de la cual han sido puntuados el 25% de los modelos con la
puntuación más baja, en este caso, 6.5.
La línea horizontal dentro de la caja representa la puntuación por debajo de la
cual han sido puntuados el 50% de los modelos con la puntuación más baja,
en este ejemplo, un 7.
El lado superior de la “caja” representa la puntuación por debajo de la cual
han sido puntuados el 75% de los modelos con la puntuación más baja o, visto
de otro modo, la puntuación por encima de la cual han sido puntuados el 25%
de los modelos. Para el ejemplo que estamos viendo este valor es un 8.
El “bigote” superior indica la puntuación más alta que ha sido otorgada a
algún modelo de esa gama, en este caso, un 9.
Entonces, podemos deducir que cuánto más alta esté la caja de una
característica y más pequeña sea la distancia entre los bigotes de la misma,
mejores serán las puntuaciones de dicha característica.
Así, volviendo a la gráfica, vemos que:
• Los puntos fuertes de los smartphones de 2014 son el Hardware, el
Rendimiento y el Diseño y Calidad de Materiales, seguidos de cerca por la
Pantalla y la Batería en el caso de los modelos de gama alta.
• En lo que más fallan los teléfonos analizados durante este año es en el
Sonido y en el Software.
• También se observa que la mitad de los modelos de gama media fallan en
la Batería, registrándose en esta característica y para esta gama las
puntuaciones más bajas de todos los análisis.
Diagrama de Cajas y Bigotes
Para los dos ejemplos siguientes, dibuje los diagramas de Cajas y bigotes

Ejemplo 1.1 (del tema 1):


El número de empleados que tienen 20 empresas de un sector es:
3, 1, 2, 2, 1, 5, 2, 2, 0, 6, 3, 2, 4, 3, 4, 2,3, 1, 7, 6

Ejemplo 1.2 (del tema 1):


Las cotizaciones de las acciones de una determinada sociedad anónima
durante 40 sesiones consecutivas de la Bolsa.

También podría gustarte