Está en la página 1de 85

Tema 3

Descripción de variables estadísticas

1. Introducción.
2. Medidas de posición.
2.1 Medidas de posición no central
2.2. Medidas de posición central
3. Medidas de dispersión
3.1. Medidas de dispersión absolutas.
3.2 Medidas de dispersión relativas.
Descripción de variables estadísticas unidimensionales

4. Momentos.
5. Medidas de forma: Coeficientes de asimetría y curtosis
6. Medidas de concentración
7. Transformación lineal de una variable estadística

Bibliografía:
CASAS, J.M.; et al. (2010): Estadística para las Ciencias Sociales. Ed.
Universitaria Ramón Areces. Cap.2:4-6

1
1. Introducción

• El comportamiento de una variable estadística se caracterizada por:


 Los valores que puede tomar: numerables (v.e. discreta) o no numerables (v.a.
continua)
 Y su distribución de frecuencias: de tipo II (v.e. discreta) o de tipo III (v.e.
continua)
• Sus distribuciones de frecuencias presentan aspectos que pueden ser
sintetizados mediante unos indicadores sencillos:
Descripción de variables estadísticas unidimensionales

– Localización, dispersión, simetría, curtosis o apuntamiento, ...


Objetivo de este tema:
• sintetizar los principales aspectos que presentan las distribuciones de
frecuencias asociadas a las variables estadísticas unidimensionales, tanto
discretas como continuas, más frecuentemente observadas en nuestro
ámbito de estudio

2
2. Medidas de Posición

• Tienen por objeto informar de la zona de valores en la que se


sitúa o posiciona una determinada parte de la distribución.

– Medidas de Posición Central: las que informan de la zona de posicionamiento


de la parte central de la distribución
– Medidas de Posición no Central: las que informan de la zona de
posicionamiento de otras partes de la distribución
Descripción de variables estadísticas unidimensionales

Cuartiles
0,120 No Central: Cuantiles Deciles
0,100
Percentiles

Media Aritmética
0,080

Medidas Medias
0,060

de Media Geométrica
simples
0,040
Posición Media Armónica
0,020 Central:
Medias Ponderadas
0,000

Mediana
Relativas
Modas
Absoluta

3
2.1 Medidas de posición no centrales: cuantiles

Definición:
– En una distribución ordenada de menor a mayor, los cuantiles de orden q son q-1
valores de la variable que dividen el recorrido de la distribución en q intervalos
consecutivos conteniendo todos el mismo número de observaciones (la q-ésima parte
del número de datos, en cada uno)

– Cr/q : Cuantil r-ésimo de orden q: deja a su izquierda (incluidos los datos con éste valor)
al menos (r/q)·N datos de la distribución; y a su derecha (incluidos los datos con éste
valor) al menos los (1-r/q)·N datos restantes. r qr
Descripción de variables estadísticas unidimensionales

100 % 100 %
q q

Cr /q
• Cuartiles: Dividen a la distribución en cuatro partes iguales: Q1,Q2, Q3 .
• Deciles: Dividen la distribución en diez partes iguales: D1, D2,...., D9
• Percentiles: Dividen la distribución en cien partes iguales P1, P2,...., P99
 
      

Q1 Q2 Q3
4
Medidas de posición no centrales

Propiedades:
• Pueden calcularse en escalas ordinales o superiores (de
intervalo o de razón)
• Casos particulares:

75%
Descripción de variables estadísticas unidimensionales

50%
25%

Q1  P25  C1/ 4 Q2  D5  P50  C1/ 2 Q3  P75  C3 / 4

5
Medidas de posición no centrales

Cálculo de cuantiles en distribuciones con valores no


agrupados en intervalos (Tablas de Tipo I y Tipo II):

– Para calcular el cuantil r-ésimo de orden q, Cr/q:

rN
• 1) Calcular
q

• 2) Considerar las frecuencias Ni


Descripción de variables estadísticas unidimensionales

rN
• 3) Buscar el primer Ni 
q
rN
• 4) Si N i   C r / q  xi correspondiente a este Ni
q
rN  xi  xi 1 
• Si N i   Cr / q  xi , xi 1   
q  2 

6
Ejemplo

Las puntuaciones de 120 alumnos en un examen fueron recogidas en la


siguiente distribución de frecuencias. Determinar los 3 cuartiles, el séptimo
decil y el percentil 99. Interprételos. Variable: Puntuación en un examen (0-10)

Unidades puntos

r 1 Elementos: alumnos
– Q1 : N  120  30  Q1  3
q 4 Valores Frec

xi ni Ni

r 2 0 3 3
– Q2 : N  120  60  Q2  5
q 4 1 12 15

2 4 19
Descripción de variables estadísticas unidimensionales

r 3
– Q3 : N  120  90  Q3  6 3 17 36
q 4 4 19 55

5 29 84
r 7 56
– D 7: N  120  84  D7   5,5 6 19 103
q 10 2
7 5 108

8 7 115
r 99
– P99: N  120  118,8  P99  9 9 4 119
q 100
10 1 120

Total 120

7
Medidas de posición no centrales

Cálculo de cuantiles en distribuciones con valores agrupados


en intervalos (Tablas de Tipo III):

– Para calcular el cuantil r-ésimo de orden q, Cr/q:

rN
• 1) Calcular
q

• 2) Considerar las frecuencias Ni


Descripción de variables estadísticas unidimensionales

rN
• 3) Buscar el primer N i  ; entonces:  Cr/q  (Li-1 , Li]
q

rN
 N i 1
q
• 4) Cr / q  Li 1  ci
ni

8
Ej-Cuantiles_[CS;SP Ej2.31]

Ejemplo Ej_Unidim_Continuo_5.xlsx

La recaudación mensual expresada en miles de euros de 100 establecimientos


comerciales se reflejan en la siguiente distribución de frecuencias. Calcular:
a) el nivel de ventas que no es superado por el 25 por ciento de los
establecimientos.
b) el nivel de ventas mínimo que recauda el 15% de los establecimientos que más
venden.
Variable: recaudación mensual
r 1 Unidades: miles de euros
– Q1 : N  100  25  Int.Q1   75; 200 Elementos: establecimientos comerciales
q 4
rN Valores Frec
 N i 1 (Li-1 Li] ni Ni
Descripción de variables estadísticas unidimensionales

q 75 200 50 50
Q1  C1/ 4  Li 1  ci  200 250 40 90
ni 250 300 7 97
300 400 3 100
1
100  0
 75  4 125  137, 5 m.€
50 100

r 85
– P85: N 100  85  Int.P85   200; 250
q 100
rN 85
 N i 1 100  50
q
P85  C85/100  Li 1  ci  200  100 50  243, 75 m.€
ni 40
9
2.2 Medidas de posición centrales

2.2.1 Medias
• simples y
• ponderadas
Descripción de variables estadísticas unidimensionales

2.2.2 Mediana

2.2.3 Moda

10
2.2.1 Medias simples

• Media aritmética
– Caso de valores no agrupados:
N
1
• Datos no tabulados Tipo I x1,x2,....,xN frec. unitarias
x
N
x
i 1
i

• Datos en tablas de Tipo II (xi son los valores de la variable)


xi ni
x1 n1
... ...
r
1
 x ·n
xi ni
Descripción de variables estadísticas unidimensionales

frec. no
... ... unitarias
x i i
N i 1
xr nr
N

– Caso de valores agrupados:


• Datos en Tablas de Tipo III (xi son las marcas de clase de los intervalos)
Li-1, Li x i ni
L0, Li x 1 n1
........ ... ...
r
1
 x ·n
Li-1, Li xi ni frec. no
........ ... ... unitarias
x i i
N i 1
Lr-1, Lr x r nr
N
11
Ej_Media aritmética_[CS;SP Ej2.14]

Ejemplo

Tablas Tipo I: Datos no tabulados

Las rentas anuales de cinco familias, expresadas en miles de euros, son:


200, 150, 300, 250 y 175.
Calcular la renta media de estas familias.
Descripción de variables estadísticas unidimensionales

N
1 200+150+300+250+175 1075
x
N
 xi 
i 1 5

5
 215 miles de €

12
Ej_Media aritmética_[CS;SP Ej2.15]

Ejemplo Ej_Unidim_Discreto_2.xlsx

Tablas Tipo II

En una comunidad de vecinos se ha preguntado a las 20 familias que la componen, el


número de personas que trabaja en cada una de ellas, siendo las respuestas las
siguientes: 1, 0, 2, 4, 1, 3, 2, 0, 1, 1, 1, 2, 1, 1, 0, 0, 1, 1, 1, 2.
Obtenga el número de personas que trabaja en estas familias.
Descripción de variables estadísticas unidimensionales

xi ni ni.xi
0 4 0
1 10 10 r
1 25
2
3
4
1
8
3
x
N
 xi ·ni 
i 1 20
 1, 25 personas
4 1 4
20 25

13
Ej_Media aritmética_[CS;SP Ej2.16]

Ejemplo Ej_Unidim_Continuo_3.xlsx

Tablas Tipo III

Un comercio ha abierto sus puertas al público durante 25 días de un mes y ha


obtenido las siguientes recaudaciones (en euros):
16.500, 10.050, 12.320, 10.000, 22.540, 7.325, 13.800, 18.300, 14.600, 25.000, 17.085, 19.000,
11.900, 13.760, 15.075, 20.210, 7.280, 21.200, 23.090, 24.500, 15.800, 5.000, 13.050, 21.600, 17.700
Obtenga la recaudación diaria media y dé dos interpretaciones del resultado.
Descripción de variables estadísticas unidimensionales

(Li-1 Li] ni xi ni.xi

5000 9000 3 7000 21.000


r
9000 13000 4 11000 44.000 1 403000
13000
17000
17000
21000
7
5
15000
19000
105.000
95.000
x
N
 xi ·ni 
i 1 25
 16120 €
21000 25000 6 23000 138.000

25 403.000

14
Medias simples

Propiedades de la media aritmética


• La suma de las desviaciones de los valores respecto a su media
aritmética es cero: r

 ( x  x )n
i 1
i i 0

• La media aritmética minimiza la suma de los cuadrados de las


desviaciones de los valores observados respecto de una constante
arbitraria K; es decir, minimiza la expresión:
N
S (K )   i
( x
i 1
 K ) 2
Descripción de variables estadísticas unidimensionales

o, lo que es lo mismo, la expresión es mínima cuando K  x

• Si el total de observaciones se estratifica en L grupos distintos, la media


aritmética del total es una media ponderada de las distintas medias de
los grupos, siendo cada ponderación el número de observaciones que
tiene dicho grupo:
x1 N1 ··· xL N L
x
N1 ··· N L
15
2.2.1 Medias ponderadas

• Wi = peso (absoluto) del valor xi = coeficiente absoluto de ponderación


W W
• wi = peso relativo del valor xi = coeficiente relativo de ponderación = wi  r i  i
W
W j
j 1

xi Wi
xi ni
Descripción de variables estadísticas unidimensionales

x1 n1 x1 W1
r r
... ... 1
 W i ·x i 
r
... ... 1 xp   w i ·x i
xi ni x
N
 xi ·ni
i 1
xi
...
Wi
...
W i 1 i 1
... ...
xr nr xr Wr
N
W

16
Ej_Media ponderada_[CS;SP Ej2.17]

Ejemplo

El examen final de una asignatura puntúa el doble que los exámenes parciales. Un
alumno ha obtenido las siguientes calificaciones: 5 puntos en el primer parcial , 9 en el
segundo y 6 en le examen final (todas sobre 10 puntos). Obtener la nota media final
del curso

r
xi Wi xi.Wi
 W ·x
Descripción de variables estadísticas unidimensionales

i i
5 1 5 26
9 1 9 xp  i 1
r
  6, 5 puntos
4
6 2
4
12
26
W i 1
i

17
2.2.2 Mediana

Definición
• En una distribución ordenada de menor a mayor, la mediana es
aquél valor de la distribución que deja a su izquierda el mismo
número de frecuencias que a su derecha
 
      
Descripción de variables estadísticas unidimensionales

Me
Cálculo para valores no agrupados y frecuencias unitarias:
N impar  Me  x N 1 
 
Frecuencias Unitarias:  2 

x N   x N 
   1 
N par
 Me   2  2 

18
Ej_Mediana_[CS;SP Ej2.21]
Ej_Unidim_Discreto_2.xlsx
Ejemplo Tablas Tipo I: Datos no tabulados

En una comunidad de vecinos se ha preguntado a las 20 familias que la componen, el


número de personas que trabaja en cada una de ellas, siendo las respuestas las
siguientes: 1, 0, 2, 4, 1, 3, 2, 0, 1, 1, 1, 2, 1, 1, 0, 0, 1, 1, 1, 2.

- ordenamos los datos:


0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 4

x N   x N 
   1 
Descripción de variables estadísticas unidimensionales

 2  2 
- N=20 (par)  Me 
2

N 20 N
- las posiciones centrales son las:   10ª y la siguente:  1  11ª
2 2 2
- y la mediana será:
x N   x N 
   1
11
Me  2 2 
  1 persona
2 2
19
Cálculo para valores no agrupados y frecuencias no unitarias (Tipo II) :

1) Calcular
N
2
2) Considerar las frecuencias Ni
N
3) Buscar el primer Ni 
2
N
4) • Si Ni   Mediana= Me  xi correspondiente a este Ni
2
N xi  xi 1
• Si Ni   Mediana = Me 
Descripción de variables estadísticas unidimensionales

2 2

Ni N
 Ni
N 2
2

xi-1 xi xi+1 xi-1 xi xi  xi 1 xi+1


Me 
Me  xi 2

20
Ej_Mediana_[CS;SP Ej2.22]

Ejemplo Ej_Unidim_Discreto_3.xlsx

Tablas Tipo II

Los salarios mensuales de 100 empleados de unos grandes almacenes son los
siguientes:
Valores Frec
xi ni fi Ni Fi
1000 50 0,50 50 0,50
1250 30 0,30 80 0,80
2000 15 0,15 95 0,95
3000 5 0,05 100 1,00
100 1,00

Calcular la mediana e interpretar su significado


Descripción de variables estadísticas unidimensionales

N 100
1) Calcular   50
2 2
2) Considerar las frecuencias Ni
N
3) Buscar el primer Ni  : el del valor 1000
2
N xi  xi 1 1000  1250
4) • Como N i  50   Mediana = Me    1125 €
2 2 2

21
Cálculo para valores agrupados en intervalos y frecuencias no
unitarias (Tablas Tipo III):

Intervalos ni Ni 1) Calcular N/2


[L0-L1] n1 N1
2) Considerar las frecuencias Ni
(L1-L2] n2 N2
... ... ... 3) Buscar el primer Ni  N/2  Me  (Li-1 , Li]  Intervalo Mediana
(Li-2-Li-1] ni-1 Ni-1
N
Descripción de variables estadísticas unidimensionales

(Li-1-Li] ni Ni  N i 1
(Li-Li+1] ni+1 Ni+1 4) Me  Li 1  2 ci
... ... ... ni
(Lk-1-Lk] nk Nk
N

22
Ej_Mediana_[CS;SP Ej2.23]
Ej_Unidim_Continuo_2.xlsx

Ejemplo Tablas Tipo III

Los ingresos anuales de 50 familias, en miles de euros, agrupados en intervalos, son


los siguientes:

Valores Frec
(Li-1 Li] ni xi fi Ni Fi
40 100 10 70 0,200 10 0,200
100 200 20 150 0,400 30 0,600
200 500 15 350 0,300 45 0,900
500 1000 5 750 0,100 50 1,000
50 1,00
Descripción de variables estadísticas unidimensionales

Calcular la mediana e interpretar su significado

1) Calcular N/2 = 50/2 = 25


2) Considerar las frecuencias Ni
3) Buscar el primer Ni  N/2  Me  (Li-1 , Li] = (100 , 200]  Intervalo Mediana

N
 N i 1
2 25  10
4) Me  Li 1  ci  100  (200  100)  175 m.€
ni 20

23
Ej_Mediana_[CS;SP Ej2.24]
Ej_Unidim_Continuo_1.xlsx

Ejemplo Tablas Tipo III

100 pequeños comercios se agrupan según su número de empleados en la


siguiente distribución:
Valores Frec
(Li-1 Li] ni xi fi Ni Fi
0 1 20 0,5 0,200 20 0,200
1 2 30 1,5 0,300 50 0,500
2 4 20 3 0,200 70 0,700
4 6 15 5 0,150 85 0,850
6 10 10 8 0,100 95 0,950
10 15 5 12,5 0,050 100 1,000
100 1,00
Descripción de variables estadísticas unidimensionales

Calcular la mediana e interpretar su significado

1) Calcular N/2 = 100/2 = 50


2) Considerar las frecuencias Ni
3) Buscar el primer Ni  N/2  Me  (Li-1 , Li] = (1 , 2]  Intervalo Mediana

N
 N i 1
4) 2 50  20
Me  Li 1  ci  1  (2  1)  2 empleados
ni 30

24
Propiedades de la Mediana

– La mediana minimiza la suma de todas las desviaciones


absolutas:
r r
Min  xi  K ·ni   xi  Me ·ni
K i 1 i 1
Descripción de variables estadísticas unidimensionales

– Calculable en escalas ordinales o superiores


– Insensible a los valores extremos y/o de las colas

25
2.2.3 Modas

• MODA ABSOLUTA: valor (o valores) de la variable con mayor


frecuencia (densidad de frecuencia) absoluta

• MODA RELATIVA: valor (o valores) de la variable cuya frecuencia


(densidad de frecuencia) absoluta no es superada por las de sus
valores contiguos. (sólo a partir de escalas ordinales)
Descripción de variables estadísticas unidimensionales

fi f

x x
mo Mo Mo mo

26
Cálculo de las modas en distribuciones con valores no agrupados y
frecuencias no unitarias (Tablas Tipo II)

• Buscar los valores cuyas frecuencias no son superadas por las de los
valores colindantes:
– Todas son modas relativas
Descripción de variables estadísticas unidimensionales

– La de mayor frecuencia es la moda absoluta

27
Ej_Moda_[CS;SP Ej2.25]
Ej_Unidim_Discreto_2.xlsx

Ejemplo 1 moda interior y 1 moda en el extremo

En una comunidad de vecinos se ha preguntado a las 20 familias que la componen, el


número de personas que trabaja en cada una de ellas, siendo las respuestas las
siguientes: 1, 0, 2, 4, 1, 3, 2, 0, 1, 1, 1, 2, 1, 1, 0, 0, 1, 1, 1, 2.
Calcular la/s moda/s e interpretarla/s

Población: 20 familias;
Descripción de variables estadísticas unidimensionales

X= nº de personas que trabajan

xi ni
Max(ni ); Mo=1
0 4
1 10 Moda Absoluta
2 4
3 1
4 1 Moda Relativa =4
20

28
Ej_Moda_1

Ejemplo 2 modas interiores

Las puntuaciones de 100 alumnos en un examen fueron recogidas en la siguiente


distribución de frecuencias.
Calculas la/s moda/s e interpretarla/s.

Población: 100 alumnos;


Descripción de variables estadísticas unidimensionales

X= Puntuación de un examen
xi ni
4 10
5 30 Moda Relativa = 5
6 10
7 45 Moda Absoluta = 7
8 5
100

29
Ej_Moda_2

Ejemplo 2 modas absolutas

Las puntuaciones de 100 alumnos en un examen fueron recogidas en la siguiente


distribución de frecuencias.
Calculas la/s moda/s e interpretarla/s.

Población: 100 alumnos;


Descripción de variables estadísticas unidimensionales

X= Puntuación de un examen
xi ni
Max(ni ):
4 10
5 40 Mo1 =5
6 5
7 40 Mo2 =7
8 5
Hay 2 Modas Absolutas
100
Distribución Bimodal

30
Ej_Moda_[CS;SP Ej2.26]

Ejemplo 2 modas absolutas

Las puntuaciones de 100 alumnos en un examen fueron recogidas en la siguiente


distribución de frecuencias.
Calculas la/s moda/s e interpretarla/s.
Población: 100 alumnos;
Descripción de variables estadísticas unidimensionales

X= Puntuación de un examen
xi ni
Max(ni ):
5 15
6 40 Mo1 =6
7 40
8 5 Mo2 =7
100
Hay 2 Modas Absolutas
Distribución Bimodal

31
Ej_Moda_[CS;SP Ej2.27]
Ej_Unidim_Discreto_1.xlsx

Ejemplo más de 2 modas

Las puntuaciones de 120 alumnos en un examen fueron recogidas en la siguiente


distribución de frecuencias
Calculas la/s moda/s e interpretarla/s.

Variable: Puntuación en un examen (0-10) Moda absoluta


35
Unidades puntos
30
Elementos: alumnos
25
Valores Frec
Descripción de variables estadísticas unidimensionales

xi ni Ni fi Fi 20
0 3 3 0,025 0,025 15
1 12 15 0,100 0,125
2 4 19 0,033 0,158 10
3 17 36 0,142 0,300 5
4 19 55 0,158 0,458
5 29 84 0,242 0,700 0
0 1 2 3 4 5 6 7 8 9 10
6 19 103 0,158 0,858
7 5 108 0,042 0,900
8 7 115 0,058 0,958
9 4 119 0,033 0,992
10 1 120 0,008 1,000 Modas relativas
Total 120 1

32
Ej_Moda_3

Ejemplo datos en escala nominal

El estado civil de 100 jubilados se recoge en la siguiente distribución de frecuencias.


Calcular la/s moda/s e interpretarla/s.

Población: 100 jubilados


Descripción de variables estadísticas unidimensionales

X= Estado Civil
xi ni
Casadas 50 Max(ni ); Mo=“Casadas”
Viudas 15
Moda Absoluta
Solteras 25
Divorciadas 10
N=100

33
Cálculo de las modas en distribuciones con valores agrupados
en intervalos (Tablas Tipo III)
ni
• Calcular la densidad de frecuencia de los intervalos: hi 
ci
• Intervalo Modal: Aquél con mayor hi
• Moda: Aproximaremos por la marca de clase del Intervalo Modal
Descripción de variables estadísticas unidimensionales

• Observación: si las amplitudes de los intervalos son constantes, entonces no es


necesario calcular las densidades de frecuencias, y el intervalo modal será aquél
cuya frecuencia absoluta sea máxima

34
Ej_Moda_4
Ej_Unidim_Continuo_3.xlsx

Ejemplo

Un comercio ha abierto sus puertas al público durante 25 días de un mes y ha obtenido las
siguientes recaudaciones (en euros):
16.500, 10.050, 12.320, 10.000, 22.540, 7.325, 13.800, 18.300, 14.600, 25.000, 17.085, 19.000,
11.900, 13.760, 15.075, 20.210, 7.280, 21.200, 23.090, 24.500, 15.800, 5.000, 13.050, 21.600,
17.700
Calcular la/s moda/s e interpretarla/s. (Li-1 Li] ni xi ci hi
5000 9000 3 7000 4000 0,00075
9000 13000 4 11000 4000 0,00100
13000 17000 7 15000 4000 0,00175
17000 21000 5 19000 4000 0,00125
21000 25000 6 23000 4000 0,00150
Descripción de variables estadísticas unidimensionales

25

Ventas observadas en un comercio durante 25 días;


Población: 25 días; X= ventas de un día (u.m.)

Li-1; Li xi ni
[5000; 9000] 7000 3
(9000;13000] 11000 4 Intervalo Modal: (13000;17000]
(13000;17000] 15000 7 Moda: marca de clase del intervalo Modal  15000
(17000;21000] 19000 5
(21000;25000] 23000 6
N=25

35
Ej_Moda_[CS;SP Ej2.28]
Ej_Unidim_Continuo_6.xlsx

Ejemplo

Los salarios anuales de 200 ejecutivos de un país expresados en miles de euros se


recogen en la siguiente distribución de frecuencias.
Calcular la/s moda/s e interpretarla/s.

(Li-1 Li] ni xi ci hi
75 125 25 100 50 0,5000
125 175 100 150 50 2,0000
Descripción de variables estadísticas unidimensionales

175 225 50 200 50 1,0000


225 275 25 250 50 0,5000
200

36
Ej_Moda_[CS;SP Ej2.29]
Ej_Unidim_Continuo_5.xlsx

Ejemplo

Las recaudaciones mensuales expresadas en miles de euros de 100 establecimientos


comerciales se reflejan en la siguiente distribución de frecuencias.
Calcular la/s moda/s e interpretarla/s.

(Li-1 Li] ni xi ci hi
Descripción de variables estadísticas unidimensionales

75 200 50 137,5 125 0,4000


200 250 40 225 50 0,8000
250 300 7 275 50 0,1400
300 400 3 350 100 0,0300
100

37
Propiedades de la Moda

– Las modas absolutas se pueden calcular en escalas nominales o


superiores (en todas las escalas)
– Las modas relativas se pueden calcular en escalas ordinales o
Descripción de variables estadísticas unidimensionales

superiores (requieren un orden en los niveles de la medida)

38
Relaciones entre las medidas de localización

– Para distribuciones unimodales y ligeramente asimétricas, se verifica


que:
Mo  Me  x ó x  Me  Mo
Descripción de variables estadísticas unidimensionales

– Y, además: x  Mo  3 x  Me

39
3. Medidas de Dispersión

• En el apartado anterior hemos visto las:


Central
Medidas de Posición
No Central: Cuantiles

0,120

0,100

0,080

0,060
Descripción de variables estadísticas unidimensionales

0,040

0,020

0,000

• Las medidas de dispersión tienen por objeto informar de la separación


general de los valores de la distribución en torno a sus posiciones
centrales

40
Medidas de dispersión

Clasificación:

Rango o Recorrido
Recorrido Intercuartílico
Recorrido Semiintercuartílico
Absolutas Desviación media
Desviación mediana
Varianza
Medidas Desviación típica
de
Descripción de variables estadísticas unidimensionales

Dispersión Coeficiente de Apertura


Recorrido Relativo
Recorrido Intercuartílico Relativo
Relativas
Recorrido Semi-intercuartílico Relativo
Coeficiente de Variación de Pearson
Índice de Dispersión Mediana

41
Medidas de Dispersión Absoluta

Medidas de Dispersión Absoluta:


las que informan de la desviación general que presentan las
observaciones con respecto de las posiciones centrales, expresando
dicha desviación en las unidades de la escala de medida original (o en
función de ellas)
 Por tanto, se ven influenciadas por la escala de medida
Ejemplo: unas mismas cantidades expresadas en dos monedas diferentes
Descripción de variables estadísticas unidimensionales

42
Medidas de dispersión

Principales medidas de Dispersión Absoluta

• Rango, Recorrido o Intervalo de Variación: Re  maxxi   minxi 

1 r
1 r
1 r
- No podemos emplear:
N

i 1
ni i
x  x  
N

i 1
ni xi  x ·  ni  x  x  0
N i 1

r
1
Dx 
• Desviación Media (a la media): EM1 N
 ni xi  x
Descripción de variables estadísticas unidimensionales

i 1

- Pero son más manejables matemáticamente las siguientes medidas:

1 r
• Varianza: S  m2 
2
 ni  xi  x 
2

N i 1

 Desviación Típica: S   S 2

43
Diapositiva 43

EM1 La desviación media, hay que pensar si se quita o se introduce un ejemplo de ella...
Emilia Martos; 04/05/2021
Medidas de dispersión

Propiedades de la Varianza

 0  S2  
r r
1 1
n x  x n x
2
 S 2
i i  2
i i  x2
N i 1 N i 1

 En distribuciones unimodales y moderadamente asimétricas (aprox. Normales):


Descripción de variables estadísticas unidimensionales

x
x S x  S
~68,3%

x  2S x  2S
~95,4%

x  3S x  3S
~99,7%

44
Medidas de dispersión

Otras medidas de Dispersión absoluta:


r
1
• Desviación Mediana: DMe 
N
 ni xi  Me
i 1
EM2

• MEDA: MEDA  Mediana  xi  Me , i  1, ..., n

Otras medidas de Dispersión absoluta (relativas al 50% central):


Descripción de variables estadísticas unidimensionales

• Recorrido Intercuartílico: RI  Q3  Q1

Propiedades generales de las Medidas de Dispersión Absolutas

• Todas son no negativas (  0)


EM3
• DMe  D x  S

45
Diapositiva 45

EM2 Dejamos las medidas de dispersión con respecto a la mediana? Si dejamos alguna, habrá que hacer un ejemplo...
Emilia Martos; 04/05/2021

EM3 Esta propiedad sólo iene sentido si dejamos las desviaciones con respecto a la mediana y la desviación Media
Emilia Martos; 04/05/2021
Medidas de Dispersión Relativas

Medidas de Dispersión Relativa:


las que informan de dicha separación de forma adimensional, sin verse afectadas
por las unidades de la escala de medida original, por referencia a una cierta
magnitud patrón (generalmente, alguna medida de posición central como la media)
Ejemplo: unas mismas cantidades expresadas en dos monedas diferentes
Descripción de variables estadísticas unidimensionales

46
Medidas de dispersión

Principales medidas de Dispersión Relativa:

Algunas medidas sencillas, aunque muy sensible a los casos extremos:

 
max x i
• Coeficiente de Apertura: A
 
min x i
xi  0 i  1,···,r

• Recorrido Relativo: Re max  xi   min  xi 


R  
r x x
Descripción de variables estadísticas unidimensionales

La más empleada:

S
• Coeficiente de Variación de Pearson: V1 
x

47
Ej_Medidas Dispersión_[CS;SP Ej2.32]
Ej_Unidim_Discreto_2.xls
Ejemplo Tablas Tipo II

En una comunidad de vecinos se ha preguntado a las 20 familias que la componen, el


número de personas que trabaja en cada una de ellas, siendo las respuestas las
siguientes: 1, 0, 2, 4, 1, 3, 2, 0, 1, 1, 1, 2, 1, 1, 0, 0, 1, 1, 1, 2.
Calcular las principales medias de dispersión y forma; e interpretar los resultados.
xi ni ni.xi ni.xi^2 ni(xi-xmed)^2
0 4 0 0 6,25
1 10 10 10 0,63
U1 2 4 8 16 2,25
3 1 3 9 3,06
4 1 4 16 7,56
20 25 51 19,75
Descripción de variables estadísticas unidimensionales

 ni  xi  x 
2
r
1 25 19, 75
x
N
 ni xi 
i 1 20
 1, 25 personas  S2  i 1

N

20
 0,9875 personas 2
r

n x 2
i i
51
 1, 25   0,9875 personas 2
2
O, alternativamente: S 2  i 1
 x2 
N 20
S   S 2   0,9875  0,99 personas
S 0,99
V1    0, 795  79,5%
x 1, 25
48
Diapositiva 48

U1 Si dejamos las medidas de dispersión Desviación media, Desviación mediana, MEDA y Recorrido intercuartílico, hay que calcularlas en el ejemplo
UAH; 21/04/2021
Ej_Medidas Dispersión_[CS;SP Ej2.16]
Ej_Unidim_Continuo_3.xls
Ejemplo Tablas Tipo III

Un comercio ha abierto sus puertas al público durante 25 días de un mes y ha


obtenido las siguientes recaudaciones (en euros):
16.500, 10.050, 12.320, 10.000, 22.540, 7.325, 13.800, 18.300, 14.600, 25.000, 17.085, 19.000,
11.900, 13.760, 15.075, 20.210, 7.280, 21.200, 23.090, 24.500, 15.800, 5.000, 13.050, 21.600, 17.700
Calcular las principales medias de dispersión y forma; e interpretar los resultados.
(Li-1 Li] ni xi ni.xi ni.xi^2
5000 9000 3 7000 21.000 147.000.000
9000 13000 4 11000 44.000 484.000.000
13000 17000 7 15000 105.000 1.575.000.000
17000 21000 5 19000 95.000 1.805.000.000
21000 25000 6 23000 138.000 3.174.000.000
Descripción de variables estadísticas unidimensionales

25 403.000 7.185.000.000

r
1 403000
x
N
 ni xi 
i 1 25
 16120 €

r r

n x  x n x
2 2
i i i i
7185·106
 16120   27545600 € 2
2
S 
2 i 1
 i 1
x 
2

N N 25

S   S 2   27545600  5248,39 €

S 5248, 39
V1    0, 3256  32,56%
x 16120
49
4. Momentos

r
1
• Hemos visto que: x
N
n x
i 1
i i

r r
1 1
n x  x n x
2
S2  i i  i i
2
 x2
N i 1 N i 1

• Estas expresiones, con diversas potencias, aparecen


Descripción de variables estadísticas unidimensionales

frecuentemente en fórmulas estadísticas; y dan lugar al


concepto de Momentos (potenciales)

Momentos (o momentos con respecto al origen)


Momentos (potenciales)
Momentos centrales (o momentos con respecto a la media)

50
Momentos

Momentos (o momentos con respecto al origen)

• Definición: Momento de orden h de una variable X


r
1
ah 
N
ii
n x
i 1
h

• Casos particulares:
Descripción de variables estadísticas unidimensionales

– a 1
0
1 r
– a1  
N i 1
ni xi  x
r
1 1 r
– a 
2 
N i 1
n x
i i
2
 S 2

N

i 1
n x
i i
2
 x 2
 a 2  a1
2

51
Momentos

Momentos centrales (o con respecto a la media)

• Definición: Momento central de orden h de una variable X


r
1
n x  x 
h
mh  i i
N i 1

• Casos particulares:
Descripción de variables estadísticas unidimensionales

– m0  1

– m1  0
1 r

i i
 
2
– m2  n x  x  S 2

N i 1

52
Momentos

Relaciones entre los momentos con respecto al origen y


los momentos con respecto a la media

» m2  a2  x 2

» m3  a3  3a 2 x  2 x 3

» m 4  a 4  4 a3 x  6 a 2 x 2  3 x 4
Descripción de variables estadísticas unidimensionales

Estas fórmulas se deducen del desarrollo de Newton de la potencia de


un binomio:
1 r
1 r h  j  h  h j j 
h
j  h
n x  x  
h
mh  i i  ni  ( 1)   i x x   ( 1) a
  h j x j

N i 1 N i 1 j  0   j   j  0  j

53
Medidas de Forma

4. Medidas de Forma

• Acabamos de ver las medidas de dispersión, para distinguir situaciones


diferentes que podrían presentar unas mismas medidas de posición:
0,120

0,100

0,080

0,060

0,040

0,020

0,000
Descripción de variables estadísticas unidimensionales

Rango o Recorrido
0,120 Recorrido Intercuartílico
Recorrido Semi-intercuartílico
Desviación media
0,100

Absolutas
0,080 Desviación mediana
Varianza
Desviación típica
0,060

0,040
Medidas de
Coeficiente de Apertura
Dispersión
0,020
Recorrido Relativo
0,000
Relativas Recorrido Intercuartílico Relativo
Recorrido Semi-intercuartílico Relativo
Coeficiente de Variación de Pearson
Índice de Dispersión Mediana

54
Medidas de Forma

4. Medidas de Forma

• Pero puede haber variables que con la misma medida de posición central y
dispersión sean sustancialmente diferentes
Descripción de variables estadísticas unidimensionales

Objetivo de este apartado:


• Ampliar las medidas de posición y dispersión, con otras medidas de forma
que permitan distinguir estas diferentes situaciones

Nº 55
Medidas de Forma

Las medidas de forma:


• Tienen por objeto informar de cómo se reparte la dispersión de los
datos alrededor de sus posiciones centrales.
– Medidas de Asimetría: las que informan del grado de simetría de la
distribución con respecto de alguna medida de posición central
Descripción de variables estadísticas unidimensionales

vs

– Medidas de Curtosis o apuntamiento central: las que informan del grado de


polarización existente entre los valores centrales y los de las colas de la
distribución

vs

56
Medidas de Forma

Clasificación:
Índice de asimetría de Pearson
Con respecto a la Media
Índice de asimetría de Fisher
Medidas de
Asimetría
Coeficiente Absoluto de Asimetría
Medidas Con respecto a la Mediana
de Índice de asimetría de Bowley

Forma

Medidas de Curtosis Coeficiente de Curtosis


Descripción de variables estadísticas unidimensionales

o Apuntamiento

57
Medidas de Forma

Medidas de Asimetría

• La Simetría implica que

x  Me  Mo

Me  x  Mo
Simetría

• y si, además, la distribución es unimodal, entonces: Simetría  m3=0


Descripción de variables estadísticas unidimensionales

Simetría / m3=0
Tipos de Asimetría:

Asimetría a la derecha o positiva Asimetría a la izquierda o negativa


Mo  Me  x x  Me  Mo

Mo Me x x Me Mo
58
EM4 Medidas de Forma

Si índice = 0 
Medidas de Asimetría: Simetría
Si índice > 0  Asimetría positiva
Si índice < 0  Asimetría negativa

• Medidas de asimetría con respecto de la media:


r
1
– Índice de Asimetría de Fisher: m3 N
 i i
n ( x  x ) 3

g1  3  i 1
S S3

• Medidas de asimetría (central) con respecto de la mediana


Descripción de variables estadísticas unidimensionales

(Q3  Q2 )  (Q2  Q1 )
– Coeficiente Absoluto de Asimetría: f2 
S

(Q3  Q2 )  (Q2  Q1 )
– Indice de Asimetría de Bowley: B
Q3  Q1

59
Diapositiva 59

EM4 Dejamos las medidas de asimetría con respecto a la mediana? Si las dejamos habrá que calcularlas en el ejemplo...
Emilia Martos; 04/05/2021
Medidas de Forma

Medidas de Curtosis o apuntamiento central

m4
– Coeficiente de Curtosis de Fisher: g2  4  3
s

Si g2>0  Más apuntamiento que la distribución normal: Leptocúrtica


Si g2=0  Apuntamiento similar a la distribución normal: Mesocúrtica
Si g2<0  Menos apuntamiento que la distribución normal: Platicúrtica
Descripción de variables estadísticas unidimensionales

Platicúrtica Leptocúrtica

60
U2 Ej_Medidas de Forma_[CS;SP Ej2.32]
Ej_Unidim_Discreto_2.xls

Ejemplo

En una comunidad de vecinos se ha preguntado a las 20 familias que la componen, el


número de personas que trabaja en cada una de ellas, siendo las respuestas las
siguientes: 1, 0, 2, 4, 1, 3, 2, 0, 1, 1, 1, 2, 1, 1, 0, 0, 1, 1, 1, 2.
Calcular las principales medias de dispersión y forma; e interpretar los resultados.
xi ni ni.xi ni.xi^2 ni.xi^3 ni.xi^4
0 4 0 0 0 0
1 10 10 10 10 10
2 4 8 16 32 64
3 1 3 9 27 81
4 1 4 16 64 256
20 25 51 133 411
Descripción de variables estadísticas unidimensionales

Momentos: 1,25 2,55 6,65 20,55


=a1 =a2 =a3 =a4

m2  a2  x 2  2,55  1, 25  0,9875


2

m3  a3  3a2 x  2 x 3   6, 65   3· 2,55 ·1, 25   2·1, 25   0, 9938


3

m4  a4  4a3 x  6a2 x 2  3 x 4 
  20, 55   4· 6, 65 1, 25   6· 2,55 ·1, 25   3·1, 25   3,8820
2 4

m3 0,9938 m4 3,8820
g1    1, 01 g2   3   3  0,98
 0,9875
3 3/ 2
S s 4
0.9875 2

61
Diapositiva 61

U2 Si se quedan los índices de asimetría con respecto a la mediana, hay que calcularlos en el ejemplo
UAH; 21/04/2021
Ej_Unidim_Continuo_3.xls
Ejemplo

Un comercio ha abierto sus puertas al público durante 25 días de un mes y ha


obtenido las siguientes recaudaciones (en euros):
16.500, 10.050, 12.320, 10.000, 22.540, 7.325, 13.800, 18.300, 14.600, 25.000, 17.085, 19.000, 11.900,
13.760, 15.075, 20.210, 7.280, 21.200, 23.090, 24.500, 15.800, 5.000, 13.050, 21.600, 17.700
Calcular las principales medias de dispersión y forma; e interpretar los resultados.
(Li-1 Li] ni xi ni.xi ni.xi^2 ni.xi^3 ni.xi^4
5000 9000 3 7000 21.000 147.000.000 1.029.000.000.000 7.203.000.000.000.000
9000 13000 4 11000 44.000 484.000.000 5.324.000.000.000 58.564.000.000.000.000
13000 17000 7 15000 105.000 1.575.000.000 23.625.000.000.000 354.375.000.000.000.000
17000 21000 5 19000 95.000 1.805.000.000 34.295.000.000.000 651.605.000.000.000.000
21000 25000 6 23000 138.000 3.174.000.000 73.002.000.000.000 1.679.046.000.000.000.000
25 403.000 7.185.000.000 137.275.000.000.000 2.750.793.000.000.000.000
Descripción de variables estadísticas unidimensionales

16.120,00 287.400.000 5.491.000.000.000 110.031.720.000.000.000


Momentos: =a1 =a2 =a3 =a4

m2  a2  x 2  287400  16120  27545600


2

m3  a3  3a2 x  2 x 3   5491·109   3· 2874·104 ·16120   2·16120   29958144000


3

m4  a4  4a3 x  6a2 x 2  3 x 4 
 110031720·109   4· 5491·109  16120   6· 2874·10 4 ·16120   3·16120   1492039761920000
2 4

m3 29958144000 m4 1492039761920000
g1    0, 21 g2   3   3  1, 03
 27545600 
3 3/ 2
S s 4
27545600 2

62
Síntesis Gráfica: el Gráfico de Caja y Bigotes
• Es una representación gráfica de una distribución estadística
unidimensional que refleja sus principales características: límite inferior,
primer cuartil, mediana, tercer cuartil y límite superior, informando de
cómo son las colas de la misma.
• Si H  Q 3  Q 1 , el diagrama general es:
~100%

~99,3%
3 3
Q3  (Q3  Q1 ) Q3  3(Q3  Q1 )
Descripción de variables estadísticas unidimensionales

Q1  3(Q3  Q1 ) Q1  (Q3  Q1 ) 2
2
1,5H 1,5H Q1 Q3 1,5H 1,5H

Min{xi} Me Max{xi}

Barreras interiores

Zona de observaciones atípicas

Barreras exteriores

Zona de observaciones extremas


63
Elementos básicos
Mediana
Bisagra inferior: Q1 8000000
6

Bisagra superior: Q3
376
extensión: H=Q3-Q1 6000000
637
7

164

Barreras interiores: 4000000


853

Superior Q3 +1.5H (ó máx) 934


594
798
262
391
709
394
889
266
Inferior Q1 -1.5H (ó min)
228
19
479
906
357
914
598
371
512
881
Descripción de variables estadísticas unidimensionales

2000000
Barreras exteriores:
Superior Q3 +3H
Inferior Q1 -3H
348
23
430
419
0

Valores atípicos (outsiders):


-2000000
valores entre barreras N= 424 51

Valores extremos (far out values): Varón Mujer

fuera de las barreras exteriores Sexo

64
6. Medidas de Concentración

• Tratan de poner en relieve el mayor o menor grado de igualdad-


desigualdad (equidistribución-concentración) en el reparto de la suma
total de los valores de la variable.
– Ejemplo: ¿cómo se reparte la masa salarial entre los N trabajadores de una empresa?

• Dos casos extremos:


– Si el reparto se realiza asignando a todos los individuos la misma cantidad, ésta será la
Descripción de variables estadísticas unidimensionales

media de la distribución, y se dice que hay equidistribución (o máxima igualdad)


x1  x2 ··· xi ··· x N  x

– Si el reparto se realiza de forma que todo lo recibe un individuo y el resto no reciben


nada, se dice que hay máxima concentración (ó máxima desigualdad)
x1  x2 ··· xi ··· x N 1  0 , x N  N ·x

• Principales indicadores de concentración (desigualdad):


– Gráfico: La curva de Lorenz
– Numérico: El índice de Gini

65
Medidas de concentración

La curva de Lorenz:
– Ordenamos los valores de menos a mayor, como de costumbre
x1  x2 ··· xi ··· xr Ni

– Calculamos la proporción de individuos hasta el intervalo í-ésimo: i N 100
p

i
– Calculamos la cantidad de recursos repartidos hasta el intervalo í-ésimo: ui   n j x j
j 1
Descripción de variables estadísticas unidimensionales

– Calculamos la proporción de recursos repartidos hasta el intervalo í-ésimo:


ui u
qi  100  i 100
ur Nx
– Dibujamos la Curva de Lorenz
• poligonal que une los puntos (pi, qi) q i%

• Casos extremos:
– Equidistribución: diagonal del cuadrado
– Máxima concentración: Lados del cuadrado
Curva de
Lorenz
p i%
66
Medidas de concentración

Índice de Concentración de Gini:


– Es el doble del área que deja la Curva de Lorenz con la diagonal del cuadrado.

Indice de Concentración de Gini:


r 1 r 1 q i%
 ( pi  qi )  qi
i 1 i 1
IG  r 1
 1 r 1
 pi  pi
Descripción de variables estadísticas unidimensionales

i 1 i 1

Curva de
Mínima 0  IG  1 Máxima Lorenz
Concentración Concentración p i%

• Casos extremos:
– Equidistribución: Curva de Lorenz en la diagonal del cuadrado  IG=0
– Máxima concentración: Curva de Lorenz en los lados del cuadrado  IG=1

67
Ej_medidas de concentración_[CS;SP Ej2.34]
Ej_Unidim_Discreto_4.xlsx
Ejemplo

En una empresa existen 4 categorías profesionales, y cada una de ellas tiene unos
niveles de ingresos mensuales diferentes. Las frecuencias que expresan dichos
niveles de ingresos junto al número de personas de cada categoría es la siguiente:
xi ni
1000 25
2000 10
3000 4
4000 1
40

Obtener el índice de Gini y la Curva de Lorenz


Descripción de variables estadísticas unidimensionales

xi ni pi=Fi(a) ni.xi(a) qi pi-qi


1000 25 0,6250 25.000 0,4098 0,2152
2000 10 0,8750 45.000 0,7377 0,1373
3000 4 0,9750 57.000 0,9344 0,0406
4000 1 1,0000 61.000 1,0000 0,0000
40 3,4750 3,0820 0,3930

r 1 r 1

( p  q ) i i
0,393
q i
2, 08
IG  i 1
r 1
  0,1588 IG  1  i 1
r 1
 1  0,1588
2, 48 2, 48
p i p
i 1
i
i 1

68
Transformación lineal de una Variable Estadística

A. Cambio de Origen:

U3 xi   ui  xi O t
transforma r

– ¿Cómo se transforma la distribución de X?

•• ••
•• •• ••
•• ••
xi ni

••
Descripción de variables estadísticas unidimensionales

10
20
30
4
6
6
•• ••
40 2 -20 -15 -10 -5 0 5 10 15 20 25 30 35 40 45 50
50 2

ui  xi  30
•• ••
ui ni
•• •• ••
-20
-10
0
4
6
6
•• •• •• •• ••
10 2
20 2 -20 -15 -10 -5 0 5 10 15 20 25 30 35 40 45 50

69
Diapositiva 69

U3 Para explicar la transformación de una variable, mejor hacer un ejercicio con salarios y diferentes subidas salariales
UAH; 21/04/2021
Transformación lineal de una variable estadística

B. Cambio de Escala
xi
transforma r
xi   
 wi 
C
– ¿Cómo se transforma la distribución de X?

•• ••
•• •• ••
xi ni
•• •• •• •• ••
Descripción de variables estadísticas unidimensionales

10 4
20 6
30 6
-20 -15 -10 -5 5 10 15 20 25 30 35 40 45 50
40 2 0
50 2

xi
wi 
10
••••
••••••
wi ni

••••••••••
1 4
2 6
3 6
4 2 -5 40 45 50
-20 -15 -10 0 5 10 15 20 25 30 35
5 2

70
Transformación lineal de una variable estadística

C. Cambio de Origen y de Escala


xi O t
transforma r
xi   
 yi  ( xi  Ot  Cyi )
C
– ¿Cómo se transforma la distribución de X?

•• ••
•• •• ••
xi ni
•• •• •• •• ••
Descripción de variables estadísticas unidimensionales

10 4
20 6
30 6
40 2 -20 -15 -10 -5 0 5 10 15 20 25 30 35 40 45 50
50 2

xi  30
yi 
10
••••
••••••
yi ni
-2 4
-1
0
1
6
6
2
••••••••••
2 2 -20 -15 -10 -5 0 5 10 15 20 25 30 35 40 45 50

71
Transformación lineal de una variable estadística

xi  Ot x  Ot
Efecto sobre la media yi   y
C C

x i2ni •• ••
••
xi ni x ini
10 4 40 400
•• ••
20
30
40
6
6
2
120
180
80
2400
5400
3200
•• •• •• •• ••
50 2 100 5000
20 520 16400 -20 -15 -10 -5 0 5 10 15 20 25 30 35 40 45 50

ui  xi  30 •• •• x
520
 26
•• •• •• 20
ui
-20
-10
ni
4
6
uini
-80
-60
ui2ni
1600
600
•• •• •• •• ••
Descripción de variables estadísticas unidimensionales

0 6 0 0
10 2 20 200
-20 -15 -10 -5 0 5 10 15 20 25 30 35 40 45 50
20 2 40 800 80
20 -80 3200 u  x  Ot  26  30  4 u  4
20

yi 
ui xi  30
 ••••
10 10 ••••••
yi
-2
ni
4
y ini
-8
y i2ni
16
••••••••••
-1 6 -6 6
0 6 0 0 -20 -15 -10 -5 0 5 10 15 20 25 30 35 40 45 50
1 2 2 2
x  Ot 26  30 8
2 2 4 8
y   0.4 y  0.4
20 -8 32
10 10 20

72
Transformación lineal de una variable estadística

Efecto de un cambio de origen y de escala sobre las medidas de posición:


Si se realiza un cambio de origen y de escala sobre una variable X,
X  Ot xi  Ot
X Y   xi  yi   xi  C·yi  Ot
C C

entonces, las medidas de posición sufren un cambio análogo al de la


variable:

x  Ot
y  x  C ·y  Ot
Descripción de variables estadísticas unidimensionales

C
Mex  Ot
Me y   Mex  C ·Mey  Ot
C
Mox  Ot
Mo y   Mox  C ·Mo y  Ot
C
Cr / q ( x )  Ot
Cr / q ( y )   Cr / q ( x )  C ·Cr / q ( y )  Ot
C

73
Transformación lineal de una variable estadística

Efecto sobre la varianza x  Ot S 2 SX


yi  i  S y2  x2  SY 
C C C
x i2ni •• ••
••
xi ni x ini
10 4 40 400
•• ••
20
30
40
6
6
2
120
180
80
2400
5400
3200
•• •• •• •• ••
50 2 100 5000
20 520 16400 -20 -15 -10 -5 0 5 10 15 20 25 30 35 40 45 50

ui  xi  30 •• •• Sx 
16400
 26 2  12
•• •• •• 20
ui
-20
-10
ni
4
6
uini
-80
-60
ui2ni
1600
600
•• •• •• •• ••
Descripción de variables estadísticas unidimensionales

0 6 0 0
10 2 20 200
-20 -15 -10 -5 0 5 10 15 20 25 30 35 40 45 50
20 2 40 800
S u  S x  12
3200
20 -80 3200 Su   ( 4) 2  12
20
yi 
ui xi  30
 ••••
10 10 ••••••
yi
-2
ni
4
y ini
-8
y i2ni
16
••••••••••
-1 6 -6 6
0 6 0 0 -20 -15 -10 -5 0 5 10 15 20 25 30 35 40 45 50
1 2 2 2
S x 12 32
2 2 4 8
Sy    1 .2 Su   (0.4) 2  1.2
20 -8 32
C 10 20

74
Transformación lineal de una variable estadística

Efecto de un cambio de origen y de escala sobre las medidas de dispersión


absoluta y los momentos centrales:
Si se realiza un cambio de origen y de escala sobre una variable X
X  Ot x  Ot
X Y   xi  yi  i  xi  C·yi  Ot
C C
entonces, estas medidas sólo se ven afectadas por el cambio de escala:

SX
SY   S X  C ·SY
Descripción de variables estadísticas unidimensionales

C
S x2
S  2
2
y  S x2  C 2 ·S y2
C
mh ( x) h
mh ( y )  h
 mh ( x)  C mh ( y )
C

75
Transformación lineal de una variable estadística

Efecto de un cambio de origen y de escala sobre las medidas de dispersión


relativa:
Si se realiza un cambio de origen y de escala sobre una variable X
X  Ot xi  Ot
X Y   xi  yi   xi  C·yi  Ot
C C

entonces, las medidas de dispersión relativa se ven influenciadas por


los cambios de origen; pero, son invariantes frente a cambios simples
de escala del tipo
xi
xi  yi   xi  C·yi  V1 ( x )  V1 ( y )
Descripción de variables estadísticas unidimensionales

Efecto de un cambio de origen y de escala sobre las medidas de forma:


Si se realiza un cambio de origen y de escala sobre una variable X
X  Ot xi  Ot
X Y   xi  yi   xi  C·yi  Ot
C C

entonces, las medidas de forma no se ven afectadas, salvo


posiblemente en su signo: g1 ( x )  signo(C )·g1 ( y )
g 2 ( x)  signo(C )·g 2 ( y )
76
Ej_Transformación de una v.e. unidimensional

Ejemplo Ej_Transformacion de una


ve1dim.xlsx

Calcular como varían las principales medidas estadísticas descriptivas


unidimensionales ante un cambio del origen al valor 30 y de escala a unidades 10
veces mayores:

X Y = (X-30) / 10 Y
x  Ot
media 26 y = (26-30) / 10 = -0,40
C
Me  X   Ot
mediana 26 Me Y   = (26-30) / 10 = -0,40
Cx
Mo  X   Ot
moda 26 Mo Y   = (26-30) / 10 = -0,40
Cx
C p  X   Ot
Descripción de variables estadísticas unidimensionales

cuantil de orden p 26 C p Y   = (26-30) / 10 = -0,40


Cx
Var  X 
varianza 144 Var Y   = 144 / (10^2) = 1,44
C x2
S
desviación típica 12 SY  X = 12 / |10| = 1,20
Cx
Momento central de m (Y )
3 144 mh (Y )  h h = 144 / (|10|^3) = 0,14
orden h= Cx
Coeficiente de g1 ( X )  g1 (Y )
1 =1= 1
asimetría de Fisher
Coeficiente de g 2 ( X )  g 2 (Y )
0,8 = 0,8 = 0,8
curtosis de Fisher

77
Tipificación de una variable

• Una variable Z se dice que está tipificada o estandarizada


cuando su media es cero y su desviación típica es uno;
– es decir, si z 0 y Sz  1

Proceso de Tipificación:
• Dada cualquier variable X, con media x y varianza positiva S x  0
siempre podemos obtener la correspondiente variable tipificada, Z,
Descripción de variables estadísticas unidimensionales

realizando el siguiente cambio de origen y de escala:


 xx
 z  0
X x  Sx
Z 
Sx S z  S x  1
 Sx

• El proceso de tipificación produce variables tipificadas, independientes de
la escala de medida de la variable original
78
Bibliografía

Básica:
–CASAS, J.M.; et al. (2010): Estadística para las Ciencias Sociales. Ed. Universitaria Ramón
Areces. Cap.2:4,6

Complementaria:
–[A;S;W] ANDERSON, D.R.; SWEENEY, D.J. & WILLIAMS, T.A. Estadística para Administración
y Economía. Ed. Paraninfo. 1999. págs. 63-88; 100-104.
–[A;G] ARANDA, J.; GOMEZ, J. Introducción a la Estadística Económica y Empresarial. (2 Vols). Ed. PPU.
1992. págs. 35-69
Descripción de variables estadísticas unidimensionales

–[CS+4] CASAS, J.M; CALLEALTA, F.J.; NUÑEZ, J.J.; TOLEDO, M.I.; UREÑA, C. Curso Básico de Estadística
Descriptiva. INAP. Madrid. 1986. págs. 87-149
–[CS;SP] Casas Sánchez, J.M.; Santos Peñas, J. Introducción a la estadística para Economía. 2ª edición.
Editorial Centro de Estudios Ramón Areces. 2002. págs. 61-108
–[MP] MARTIN PLIEGO, J.J. Introducción a la Estadística Económica y Empresarial (Teoría y Práctica). Ed.
AC. 1994. págs. 37-192
–[U;M] URIEL, E.; MUÑIZ, M. Estadística Económica y Empresarial. Teoría y ejercicios. Ed. AC. 1988. págs.
15-50

79

También podría gustarte