Está en la página 1de 39

3 MEDIDAS DE RESUMEN

Se van a obtener cuatro tipos de estadísticos:


• Estadísticos de tendencia central (promedios y medidas
de posición)
• Estadísticos de dispersión
• Estadísticos de forma
• Estadísticos de concentración y desigualdad (solo para
magnitudes de tipo económico)
3.1. Media aritmética

Valor de la variable
xi
Marca de clase del intervalo

n Tamaño de la muestra

Adecuada: resumir variables en escala métrica (variables de escala)

VENTAJAS • Tiene en cuenta todos los valores de la variable


• Tiene un significado claro y sencillo
• Es única para cada muestra
INCONVENIENTES . Está muy afectada por la presencia de valores
atípicos Facultad de Comercio y Turismo 18 60
PROPIEDADES
Si dividimos la muestra de tamaño “n” en dos submuestras de tamaños n1 y n2, la media
para el total de observaciones puede obtenerse, a partir de las medias parciales como:

x1n1  x 2n 2 siendo:
x x1 media para las n1 observaciones
n x 2 media para las n 2 observaciones

Del resultado de un examen de estadística realizado a 100 alumnos, solo se sabe que 45
han suspendido con una nota media de 2.5 y el resto han aprobado con una nota media
de 6. La nota media total es:

n  100
n1  45 x1  2.5 x1n1  x 2 n 2 2.5* 45  6*55
x   4.4
n2  55 x2  6 n 100
opcional
n1 n2 nk
• Media Geométrica
MEDIA.GEOM
(excel) G  x 1 x 2 .......x
n
k

Se utiliza para promediar porcentajes, tasas, índices. En general para promediar variables que presenten
variaciones acumulativas.

En su cálculo intervienen todos los valores de la variable


Ventajas
Por su carácter de producto es menos sensible que la media
aritmética a la presencia de valores extremos

Su significado estadístico es menos intuitivo que el


Inconvenientes de la media aritmética.
En ocasiones no queda determinada. Si algún valor
de la variable es cero G es cero. Si la variable toma
valores negativos se pueden presentar toda una
gama de casos particulares en los que no queda
determinada. En estos casos no es que G no exista,
sino que no la podemos determinar
• Media Armónica n
H  k
1
MEDIA.ARMO
(excel) 
i x
1
ni
i
Se utiliza para promediar velocidades, tiempos y rendimientos.
En general para promediar variables que vienen expresadas en
términos relativos.

En su cálculo intervienen todos los valores de la variable


Ventajas Es única

Está muy influida por la presencia de valores muy


Inconvenientes:
pequeños llegando incluso a no poder ser determinada si
algún valor de la variable es cero.

Relación entre los tres promedios: H G  x


3.2. Medidas de posición
Mediana
•Es una medida de posición no un promedio
•Supuestos los datos ordenados de menor a mayor, la mediana es el
valor que divide a la muestra en dos partes iguales.
n
•Es por tanto, el valor con frecuencia acumulada :
2
n: El tamaño de la muestra

•Es la medida de tendencia central adecuada para datos en escala


ordinal, para las que no tiene sentido el cálculo de promedios
•Para conjuntos de datos numéricos con valores atípicos o muy
asimétricos puede ser mas representativa que la media aritmética

Facultad de Comercio y Turismo


VENTAJAS DE LA MEDIANA

• Es única para cada muestra


• No está afectada por los valores atípicos
• No presenta problemas de cálculo
• Tiene un significado estadístico muy claro

INCONVENIENTES DE LA MEDIANA

• No utiliza todos los datos de la muestra

Facultad de Comercio y Turismo


Cálculo de la mediana

Caso 2: Existe un valor de la variable


Caso 1: No existe ningún
con frecuencia acumulada igual a
valor de la variable con
n/2. La mediana es el punto medio
frecuencia acumulada igual a
entre ese valor y el siguiente (habría
n/2. La mediana es el valor
infinitas medianas)
con frecuencia acumulada
inmediatamente superior a
n/2
xi ni Ni
10 20 20
xi ni Ni
15 30 50
10 20 20
17 40 90
15 35 55
22 10 100
17 40 95
22 5 100
n 15  17
n
 50 M e  15  50 M Facultad
e  de Comercio y 16
Turismo
2 2 2
Comportamiento de la media y la mediana ante la
presencia de valores atípicos
Ejemplo
xi xi
2 2 El valor 100 desplaza la
4 4 media, a la derecha, pero
no la mediana
6 6
8 8
10 100

x  6 Me  6 x  24 M e  6

Facultad de Comercio y Turismo


Moda

• Es el valor de la variable de mayor frecuencia.


• Es la medida de tendencia central adecuada para
datos en escala nominal
• Las ventajas e inconvenientes son los mismos que
para la mediana, si bien puede NO ser única

Facultad de Comercio y Turismo


(generalización de la mediana)
CUANTILES Dividen la distribución en K partes iguales

K=4 CUARTILES Frecuencia acumulada

Primer cuartil n/4

Mediana n/2

Tercer cuartil 3n/4

n/4

Q1
Frecuencia acumulada
K=10 DECILES
Primer decil n/10

Segundo decil 2n/10

……….. ………

Noveno decil 9n/10

K=100 PERCENTILES
Frecuencia acumulada

Percentil 1 n/100

Percentil 2 2n/100

……….. ………

Percentil 99 99n/100

2n/
20n/100 80n/100
100

P2
P20 P80
3.3 MEDIDAS DE DISPERSIÓN

Indican la mayor o menor separación entre los valores de


la variable

• Recorrido o rango (mayor valor – menor valor)


• No informa sobre cómo se distribuyen los datos entre los extremos

• Recorrido Intercuartílico (cuartil 3 – cuartil 1)

• No depende de los valores extremos de la muestra: no está


afectado por valores atípicos.
• Mide el tamaño del 50% central de la muestra.

Facultad de Comercio y Turismo


Valores Frecuencia Frecuencia
Recorrido  20  18  2
acumulada
18 5 5
Q1  19 Q3  20
19 30 35 Recorrido entre cuartiles  1
20 15 50

Valores Frecuencia Frecuencia


acumulada Recorrido  55  18  37
18 7 7 Q1  29 Q 3  41
29 10 17 Recorrido entre cuartiles =12
35 10 27
41 13 40
50 5 45 MÁS
DISPERSA
55 5 50

Facultad de Comercio y Turismo


• Varianza
La varianza permite cuantificar las distancias de los valores de la variable
a un valor medio

1
  xi  x 
2 VAR.S
S 
2
x (excel)
n 1

Tiene un significado estadístico muy claro: lo que se separan por


término medio los valores de la variable de la media. La media será
tanto más representativa del colectivo cuanto más se acerque a cero
la varianza. En este caso diremos que la distribución es muy
homogénea o poco dispersa.

Facultad de Comercio y Turismo


Inconveniente: eleva al cuadrado la unidad de medida de la variable.
Solución:
DESVEST.M
• DESVIACIÓN TÍPICA Sx   Sx 2 (excel)

¿Cuándo consideramos un valor de la desviación típica grande o


pequeño? (unidades de medida)

Solución:

Sx
• COEFICIENTE DE VARIACIÓN DE PEARSON CV 
x
La media se considera representativa si el CV  1

• Es adimensional lo que permite comparar la dispersión entre dos variables


que estén expresadas en distinta unidad de medida
• No se puede calcular si la media de la variable es cero

Facultad de Comercio y Turismo


Ejemplo

• Empresa A • Empresa B
– Media de los – Media de los
sueldos de la sueldos de la
empresa : empresa :
1000 euros 1200 dólares

– Desviación típica: – Desviación típica:


225 euros 500 dólares
225 500
cv   0.225 cv   0.41
1000 1200

Facultad de Comercio y Turismo


Funciones de Excel relacionadas con la varianza:
1 k
  xi  x  ni
2
VAR.S
n  1 i 1
Varianza y
desviación típica
1 k
  xi  x  ni
2
DESVEST.M  de la muestra
n  1 i 1

1 k
  xi  x  ni
2
VAR.P
n i 1

k Varianza y
1
   xi  x  ni
2
DESVEST.P desviación típica
n i 1 de la población

Facultad de Comercio y Turismo


3.4 VARIABLE TIPIFICADA

Llamamos valor tipificado al resultado de realizar la


siguiente transformación sobre los valores originales:

xi  x
zi 
Sx

Un valor tipificado no es más que el número de unidades de


desviación típica que un valor queda por encima o por
debajo de la media del grupo.

Facultad de Comercio y Turismo


• Son independientes de las unidades originales de medida
y facilitan enormemente la comparación de valores entre
diferentes muestras ya que reduce todas las muestras a una
escala común: el 0 de la escala es la media aritmética . La
unidad de medida la desviación típica

• Permiten determinar la puntuación relativa de un valor


dentro de la distribución e incluso comparar posiciones
relativas entre distintos grupos.

Facultad de Comercio y Turismo


muestra Peso medio. x 70 xn
kg Altura media. x 170xncm
Desviación típica. S x = 5 kg Desviación típica. S x = 10 cm

Pesa, 80 kg 10 kg por encima del peso medio


Mide, 165 cm 5 cm por debajo de la altura media

¿Cómo puedo comparar la posición que ocupa


respecto del grupo en ambas características?
Ejemplo
• Empresa A • Empresa B
– Media de los sueldos – Media de los sueldos
de la empresa : de la empresa :
1000 euros 1.500 euros
– Desviación típica: – Desviación típica:
825 euros 650 euros

Entre un empleado de A que gana 1300 euros y un


empleado de B que gana 1650 euros ¿Cuál de los dos
tiene una posición relativa mejor dentro de su empresa?
1300  1000 1650  1500
 0.3636  0.2307
825 650
Facultad de Comercio y Turismo
Ejemplo
Una persona ha realizado dos pruebas en una empresa para optar a
dos puestos de trabajo diferentes A y B. En la prueba para el puesto
A ha obtenido una calificación de 18 puntos sobre 20 y en la prueba
para el puesto B 16 puntos sobre 20. La media en la prueba para el
puesto A para el conjunto de candidatos que opta al puesto ha sido
de 15 puntos con una desviación típica de 7 puntos, mientras que en
la prueba para el puesto B la media ha sido también de 15 puntos
pero con una desviación típica de 3 puntos. ¿Para cuál de los dos
puestos tiene más posibilidades esta persona?

 media=15  media=15
Puesto A  Puesto B 
desviacion tipica=7 desviacion tipica=3
18-15 16-15
 0.42  0.33
7 3
Facultad de Comercio y Turismo
3.5 ASIMETRÍA

Supongamos que hemos representado gráficamente una distribución de frecuencias y


trazamos una perpendicular al eje de abcisas por la media. Si tomamos esta
perpendicular como eje de simetría, diremos que una distribución es simétrica si existe
el mismo número de valores a ambos lados de dicho eje, equidistantes de la media
dos a dos y tales que cada par de valores equidistantes a la media tengan la misma
frecuencia. En caso contrario diremos que la distribución es asimétrica.

Simétrica

Media: 3,16
Mediana: 3,16 Facultad de Comercio y Turismo
Asimetría positiva

x
Asimetría positiva

x  Me
Una asimetría
positiva grande
puede deberse a la Media: 34419
presencia de valores
Mediana: 28875
atípicos por la
derecha que
Asimétrica a la derecha:
desplazan la media
• Media mayor que mediana
hacia ese lado
• Muchos valores “bajos”, y pocos
valores “altos” pero muy separados
de la media
Facultad de Comercio y Turismo
Asimetría negativa

x
Asimetría negativa

x  Me
Una asimetría
negativa grande
puede deberse a la
presencia de valores
atípicos por la
izquierda que
desplazan la media
hacia ese lado
Facultad de Comercio y Turismo
Coeficientes de asimetría
3
n  xi  x 
EXCEL
 n  1  n  2
 
  x S

1
 
3
 xi  x
FISHER g1  n
S x3

•Simétrica coeficiente = 0
•Asimétrica positiva coeficiente > 0
•Asimétrica negativa coeficiente < 0

Facultad de Comercio y Turismo


Válido para distribuciones campaniformes, unimodales y
moderadamente asimétricas se puede utilizar el
coeficiente de Pearson:

PEARSON gp 
x  Mo
gp 

3 x  Me 
SX SX

Distribución simétrica: media = mediana = moda coeficiente = 0

Distribución asimétrica positiva: media > mediana coeficiente > 0

Distribución asimétrica negativa: media < mediana coeficiente < 0

Facultad de Comercio y Turismo


3.6 MEDIDAS DE CONCENTRACIÓN O
DESIGUALDAD

Las medidas de concentración tienen por objetivo


cuantificar el grado de igualdad o equidad en el reparto
del total de los valores de la variable. Son por tanto
indicadores del grado de equidistribución de la
variable. A mayor igualdad en el reparto menor
concentración y viceversa.

Tienen especial interés en el caso de distribuciones de variables


económicas, como renta, salarios, etc, donde lo que realmente nos
interesará conocer el grado de equidistribución de la renta entre los
individuos de una comunidad, o de los salarios entre los trabajadores
de una empresa, etc.

Facultad de Comercio y Turismo


Para medir el grado de igualdad en el reparto utilizaremos el Índice de
Lorenz (IL )

0  IL  1
Máxima Mínima
igualdad en el igualdad en el
reparto. reparto.
Mínima Máxima
concentración concentración

Vemos el índice con un ejemplo

Facultad de Comercio y Turismo


Consideremos una empresa con 4 trabajadores: dos de ellos ganan
600 euros al mes, uno gana 1800 y el otro 3000. ¿Puede considerarse
equitativo el reparto de salarios?
salario trabajadores Salario Trabajad % % (pi-qi)
acumul ores salario trabajadores
ado acumula (qi) (pi)
dos

600 1 600 1 10% 25% 15%


600 1 1200 2 20% 50% 30%
1800 1 3000 3 50% 75% 25%
3000 1 6000 4 100% 100%

600 1
*100  10% *100  25%
6000 4
Facultad de Comercio y Turismo
La información contenida en esta tabla puede materializarse gráficamente
obteniéndose lo que denominamos Curva de Lorenz. Dibujamos un cuadrado
cuyos lados estén divididos de 0 a 100.

La curva se inscribe siempre por debajo de la diagonal, es decir, i pi  qi

Facultad de Comercio y Turismo


Si el caso de máxima igualdad en el reparto es gráficamente la diagonal del
cuadrado, podemos medir el grado de igualdad midiendo el área que separa
la curva de la diagonal del cuadrado. El Indice de Concentración de Lorenz es
dos veces el valor de dicho área: k 1

p
i 1
i  qi 
Il  k 1

p
i 1
i

En el ejemplo

k 1

  pi  qi 
70
Il  i1
k 1
  0.46
150

i
pi
1

Facultad de Comercio y Turismo


3.7 ANÁLISIS EXPLORATORIO DE DATOS

Facultad de Comercio y Turismo


El propósito del análisis exploratorio es extraer cuanta
información sea posible, sin ideas preconcebidas sino al
contrario, con el objetivo de generar hipótesis acerca de
la estructura de los datos y la información que contienen.

Se apoya fuertemente en las representaciones gráficas,


no como un fin, sino como un medio para descubrir la
información.

En este nivel nos limitamos a exponer el diagrama de


caja, como herramienta para detectar casos “atípicos”

Facultad de Comercio y Turismo


VALORES ATÍPICOS

Un valor atípico es un valor “raro” respecto del conjunto de


datos. Para detectar valores atípicos suele recurrirse al
DIAGRAMA DE CAJA

110

Q3  1.5 Q3  Q1 
100

90 Cuartil 3

80
mediana

Cuartil 1
70

Q1  1.5 Q3  Q1 
60
N= 474 Facultad de Comercio y Turismo
Meses desde el contr
• CAJA
– Raya central : la mediana
– Bordes inferior y superior : los cuartiles Q1 y Q3
respectivamente
• BIGOTES
– Inferior : Q1  1.5 Q 3  Q1 
– Superior : Q 3  1.5 Q 3  Q1 
– Se consideran valores atípicos los que quedan
fuera de esos límites
– Si no hay valores atípicos los bigotes se hacen
coincidir con los valores mínimo y máximo de la
muestra.
• Se llaman valores extremos a los atípicos que quedan
fuera de los límites:` Q  3 Q  Q  ,Q  3 Q  Q  
 1 3 1 3 3 1 
Facultad de Comercio y Turismo
Diagrama de caja con valores atípicos

22
137

20 173
130

18

16

14

12

10

6
N= 474

Nivel educativo

Facultad de Comercio y Turismo


A partir del gráfico se puede estudiar la tendencia
central (mediana) y la dispersión (longitud de la caja).
Suele ocurrir que: si la distribución es simétrica, la
mediana está en el centro de la caja.

• Asimetría positiva: la mediana está más cerca


de la parte inferior de la caja (los casos se
concentran en los valores pequeños de la distribución
y la cola se alarga hacia los valores grandes).

• Asimetría negativa: la mediana está más cerca


de la parte superior de la caja (los casos se
concentran en los valores altos de la distribución y la
cola se alarga en la dirección de los valores
pequeños).

Facultad de Comercio y Turismo

También podría gustarte