Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Contenidos
Parámetros y Estadísticos
1. Medidas de posición
1.2. Mediana:
Simbología. Definición. Formas de cálculo para series simples y
distribuciones de frecuencias en lista y en intervalos. Interpretación.
Propiedad.
1.4. Fractiles:
Cuartiles, deciles y percentiles simbología. Definición. Formas de cálculo para
series simples y distribuciones de frecuencias en lista y en intervalos.
Interpretaciones.
2. Medidas de asimetría
Simetría. Asimetría positiva o derecha. Asimetría negativa o izquierda.
3.1. Recorrido:
Simbología. Definición. Formas de cálculo para series simples y
distribuciones de frecuencias en lista y en intervalos.
3.3. Varianza:
Simbología. Definición. Formas de cálculo para series simples y
distribuciones de frecuencias en lista y en intervalos. Propiedades.
Variables Variables
Categóricas Numéricas
De Intervalo De Razón
Nominal Ordinal
Medidas De
Medidas De Dispersión Apuntamiento
Recorrido
Varianza
Desviación Estándar
Coeficiente De Variación
PARÁMETROS Y ESTADÍSTICOS
Estadísticas y parámetros son calculados con las mismas ecuaciones, por lo tanto
convendremos:
En Resumen
Como por lo general, trabajaremos con muestras, la preferencia será por los
estadísticos.
Medidas De Posición
Se Refieren Al Valor De La Variable Que Representa Al Conjunto De
Datos.
Población: Parámetros De Posición
Población: Parámetros De Posición
Muestra: Estadísticos De Posición
Medidas De Asimetría
Se Refieren A La Falta De Asimetría De Ambos Lados Del Pico, Es Decir, Del
Punto Con Más Alta Densidad De Frecuencia, De Una Distribución.
Medidas De Puntiagudez
Se Refieren Al Grado De Variación, o La Velocidad Con Que Sube y Baja La
Distribución De Izquierda A Derecha.
1. Medidas de Posición
Son valores típicos, en el sentido que se emplean para representar a todos los
valores individuales de una serie o de una variable.
No pasan de ser un valor más de la variable, por lo tanto, tendrán las mismas
dimensiones que ella.
Definición
Simbología
Población M(X) = X
Muestra M(x) = x
Formas de Cálculo
x x 2 ... x n
x
i 1
i
M ( x) x 1
n n
Ejemplo:
Utilizaremos el mismo ejemplo dado para series simples, es decir que consideraremos el
número de hijos en 10 familias observadas.
n = 10
xi = número de hijos por familia
10
x
i 1
i
x1 x 2 ... x10 2 1 3 1 2 1 3 0 2 1 16
x 1,6
10 10 10 10
x 1,6 hijos
b) Datos Agrupados
y n y 2 n 2 ... y m n m
y
i 1
i ni
M ( y) y 1 1
n n
ni
O bien, teniendo en cuenta que hi , o sea considerando la frecuencia
n
relativa:
m
M ( y ) y y1 h1 y 2 h2 ... y m hm y i 1
i hi
Ejemplo:
y
i n i hi y n
i i yh i i
y1 n1 y2 n2 y3 n3 y4 n4 y n i i
16
M ( y) y i 1
1,6 hijos
n n 10
4
M ( y) y y1 h1 y2 h2 y3 n3 y4 h4 yi hi 1,6 hijos
i 1
Los resultados que se obtienen con a) y b.1) son idénticos, lo cual es lógico ya
que en el caso de la tabla de distribución de frecuencias, sólo hemos agrupado a
aquellos valores que se repiten. Luego, a) es un caso particular, donde ni es igual a 1.
y n y 2 n 2 ... y m n m
y
i 1
i ni
M ( y) y 1 1
n n
ni
O bien, teniendo en cuenta que hi , o sea considerando la frecuencia
n
relativa:
m
M ( y ) y y1 h1 y 2 h2 ... y m hm y
i 1
i hi
Ejemplo:
y i' 1 y i' yi ni hi y i ni y i hi
45-55 50 2 0,10 100 5
55-65 60 4 0,20 240 12
65-75 70 7 0,35 490 24,5
75-85 80 4 0,20 320 16
85-95 90 3 0,15 270 13,5
20 1,00 1420 71
Entonces:
5
y1 n1 y2 n2 y3 n3 y4 n4 y5 n5 y n i i
1420
M ( y) y i 1
71 años
n n 20
5
M ( y) y y1 h1 y2 h2 y3 h3 y4 h4 y5 h5 yi hi 71 años
i 1
y 71 años
Interpretación
Propiedades
( y
i 1
i y ) ni 0
Ejemplo
yi ni yi y ( y i y ) ni
0 1 -1,60 -1,60
1 4 -0,60 -2,40
2 3 0,40 1,20
3 2 1,40 2,80
10 m
( y
i 1
i y ) ni 0
i 1
( y i y ) 2 ni ( y
i 1
i a) 2 ni
Ejemplo:
Consideraremos a= 1 y y = 1,6
yi ni yi y ( y i y ) 2 ni yi a ( y i a ) 2 ni
0 1 -1,60 2,56 -1 1
1 4 -0,60 1,44 0 0
2 3 0,40 0,48 1 3
3 2 1,40 3,92 2 8
10 m m
( y
i 1
i y ) 2 n i 8,40 ( y
i 1
i a ) 2 n i 12
yi ni
0 1
1 4
2 3
3 2
10 Donde y = 1,6
Supongamos, además:
n (1) 4 y1 0 ; y 2 1 ; y 3 1 ; y 4 2
n ( 2) 6 y 1 1 ; y 2 1 ; y 3 2 ; y 4 2 ; y ( 5) 3 ; y ( 6 ) 3
0 11 2 1 1 2 2 3 3 12
y (1) 1 y ( 2) 2
4 6 6
Entonces:
y (1) n(1) y ( 2) n( 2) 1(4) 2(6) 4 12 16
y 1,6
n 10 10 10
Promedios
anuales de Cantidad de
Años de notas de materias
una materias aprobadas yi n i
carrera aprobadas ni
yi
1º 7,54 6 45,24
2º 7,98 7 55,86
3º 8,45 8 67,6
4º 9,09 10 90,9
5º 9,45 12 113,4
43 373
373
Luego: y 8,67
43
M (k) = k
Si yi = k → y=k
i=1, 2, ...n
Ejemplo:
yi = 6,6,6,6,6
yi ni y i ni
6 5 30
30
5
y i 1
i ni
30
y 6
n 5
M (y k) = k y
Ejemplo:
yi ni y i ni
Salarios
200 4 800
300 4 1200
400 2 800
10 2800
3
y n i i
2800
Calculamos: y i 1
280
n 10
y i' 2 y i ni y i' n i
400 4 1600
600 4 2400
800 2 1600
10 5600
3
yn '
i i
5600
Y calculamos: y
'
i 1
560
n 10
k k
M x ( j )i M (x j )i
j 1 j 1
Ejemplo:
4
x (1)i
x
(1) i
1232 i 1 1 2 3 2
M x (1)i 2
4 4
4
x ( 2 )i
x
( 2)i
1223 i 1 1 2 2 3
M x ( 2)i 2
4 4
4
x ( 3) i
x
( 3) i
2132 i 1 2 1 3 2
M x ( 3) i 2
4 4
3 3
x
j 1
( j )i 4587 xj 1
( j )i 6
4 3
3
x ( j )i
i 1 j 1 4 5 8 7 24
M x ( j )i 6
j 1 4 4 4
7- Se puede utilizar para estimar una cantidad total en una población. Por
ejemplo, la tarifa media de salario por hora para una muestra de n=6 secretarias
ejecutivas es de $8,00. Si en esta compañía, hay 200 secretarias, el costo total por hora
de la mano de obra secretarial se calcula como:
Ejemplo:
y 1 2 ; y 2 7 ; y 3 8 ; y 4 7 ; y ( 5) 9
27879
y 6,6
5
Se observa, que un solo valor extremadamente pequeño da por resultado una gran
reducción en y . Por supuesto, ocurriría el caso inverso si el valor extremo fuera mucho
mayor que las otras observaciones.
1.2. Mediana
Definición
Simbología
Población Me
Muestra me
Formas de Cálculo
Ejemplo:
yi = 1, 4, 10, 8, 10
Vemos que hay dos elementos (1,4) antes de la mediana y dos elementos (10,10)
después de la mediana.
Ejemplo:
yi = 1, 2, 3, 4, 5, 5, 5, 6, 7, 8, 9
n 1 11 1
Entonces: (6) me 5
2 2
Puede que la mediana tenga valores idénticos al suyo, a ambos lados. Con estas
características se puede definir a la mediana como “Aquel valor de la variable que divide
a la serie de tal forma que por lo menos el 50% de los valores sean menores o iguales a
él, y por lo menos el 50% de los valores sean mayores o iguales a él”.
Por ello, se conviene que la mediana es igual al promedio de los dos valores
centrales de la variable, luego de ordenarlos por su magnitud.
Ejemplo
yi = 9, 6, 2, 5, 18, 12
1- Ordenamos: 2, 5, 6, 9, 12, 18
2- Determinamos el orden de la mediana
n 1 6 1 6 9 15
(3,5) me 7,5
2 2 2 2
b) Datos Agrupados
n
Vamos a llamar N j a la primer frecuencia absoluta acumulada que supere a .
2
n
De tal manera que N j 1 Nj.
2
n
b.1.1) N j 1 me y j
2
n
que supera a (Nj )
2
Ejemplo
yi ni Ni
0 2 2
y j 1 1 4 6 N J 1
yj 2 6 12 NJ
3 3 15
4 5 20
20
n 20 n
10 N j 1 me y j 2
2 2 2
22
me 2
2
Como puede observarse es idéntico al encontrado a través de la Distribución de
Frecuencias.
Este valor, puede también determinarse gráficamente, para lo cual debe utilizarse
el Gráfico Acumulativo de Frecuencias, ya explicado. Una vez construido, se identifican
n n
los valores de N j , N j 1 , y , en la ordenada, y se traza una horizontal a la altura de ,
2 2
hasta intersectar el polígono y bajando la vertical, se obtiene el valor de la mediana, que
en nuestro caso es 2.
10
8
6
4
2
0
0 1 2 3 4
yi
n y j 1 y j
b.1.2) N j 1 me
2 2
Donde todos los valores del intervalo cerrado y j 1 y j son valores que corresponden a
la definición de mediana.
Ejemplo
yi ni Ni
0 2 2
1 4 6
y j 1
n
2 4 10 N J 1
2
yj 3 7 17 NJ
4 3 20
20
n 20 n y j 1 y j 2 3
10 N j 1 me 2,5
2 2 2 2 2
23
Entonces me 2,5 , igual que antes.
2
10
8
6
4
2
0 0
0 1 2 3 4
yi
Pasos a seguir:
1- Establecer la columna en la tabla donde se registran las frecuencias absolutas
acumuladas.
2- Obtener la clase mediana.
3- Interpolar la mediana a partir de los valores incluidos en la clase mediana.
Ejemplo:
y i' 1 y i' ni Ni
140-160 7 7
160-180 20 27 N J 1
180-200 33 = n J 60 NJ
200-220 25 85
220-240 11 96
240-260 4 100
100
Entonces:
n
N j 1
n 2 50 27
N j 1 me y ( i 1) j cj 180 20 193,94
2 nj 33
50
40
30
20
10
0
140 160 180 200 220 240 260
Intervalos
n
b.2.2) N j 1 me y( i1) j , puesto que el segundo término se anula.
2
Ejemplo:
yi' 1 yi' ni Ni
140 – 160 7 7
160 – 180 30 37
180 – 200 13 50 n
N j 1
2
200 – 220 35 85 NJ
220 – 240 11
96
240 - 260 4 100
100
me y( i 1) j 200
100
80
Ni
60
40
20
0
140 160 180 200 220 240 260
Intervalos
Interpretación
El 50% de los valores son menores a la mediana y el otro 50% son mayores a la
mediana.
Propiedades
i 1
yi me ni yi a ni
i 1
Ejemplo:
(1) (2) De A De B De C De D De E De F De G
A 12 0 28 64 84 112 120 136
B 40 28 0 36 56 84 92 108
C 76 64 36 0 20 38 56 72
D 96 84 56 20 0 28 36 52
E 124 112 84 48 28 0 8 24
F 132 120 92 56 36 8 0 16
G 148 136 108 72 52 24 16 0
Totales 544 404 296 276 294 328 408
(1) Restaurante
(2) Distancia En Kilómetros De La Entrada Al Restaurante.
Además, supongamos que el servicio requiera dos camiones cada día, entonces
para minimizar la distancia total de los siete restaurantes al almacén central, ¿dónde debe
estar ubicado éste?
La mediana de la serie es “D” = 96 kms., pues se trata de una serie impar, por lo
que el valor de variable que ocupa el 4° lugar, corresponde a la mediana.
Definición
Simbología
Población Md
Muestra md
Puede que dos o más valores se repitan un número iguales de veces. En tal situación,
no hay forma lógica de determinar qué valor debe ser escogido como la moda.
Puede que no hallemos ningún valor que aparezca más de una vez.
Es un valor muy inestable, puede cambiar con el método de redondeo de los datos.
Formas de Cálculo
Ejemplos:
xi = 1, 2, 4, 9 No hay moda, puesto que ninguno de los valores ocurre más de un vez
b) Datos Agrupados
md y j Si se cumple que n j 1 n j n j 1
Con lo cual son valores de variable que presentan picos en sus frecuencias.
Ejemplo:
yi ni
0 2
1 3
2 6 n j 1 n j n j 1 md 2
3 5
4 4
Otros ejemplos:
1-
yi ni
0 2
1 3 n j 1 n j n j 1 md 1
2 1
3 5 n j 1 n j n j 1 md 3
4 2
5 1
2-
yi ni
0 2
1 2 No hay moda
2 2
3-
yi ni
0 2
1 5 n j 1 n j n j 1 md 1
2 2
3 5 n j 1 n j n j 1 md 3
4 3
5 1
4-
yi ni
0 16 n j 1 n j n j 1 md 0 , ya que la frecuencia hacia arriba es 0.
1 5
2 4
3 3
5-
yi ni
0 4
1 4
2 3
3 5 n j 1 n j n j 1 md 3
4 1
5 9 n j 1 n j n j 1 md 5 , ya que la frecuencia hacia abajo es 0.
Puede ser obtenida por varios métodos, cada uno de los cuales puede dar un
valor diferente de moda:
Utiliza como moda al valor correspondiente al punto medio del intervalo modal. Si
( yi'1 yi' ) j es el intervalo modal, entonces:
( yi'1 ) j ( yi' ) j
md y j
2
Se utilizan:
1. Los valores del intervalo modal
2. La frecuencia del intervalo modal
3. Las frecuencias de las clases inmediatas anterior y posterior a la clase modal.
Ejemplo:
yi' 1 yi' ni
Kms. recorridos N° de estudiantes
0-2 2
2-4 4
4-6 5 n j 1
6-8 8 nj
8-10 1 n j 1
20
ni
5
4
0 2 4 6 8 10
y 'j 1 y j ´
Clase Modal
Llamemos d1 n j n j 1
d 2 n j n j 1
Dónde:
d1 (8 5) 3
md ( yi' 1 ) j c 62 62 6,6
d1 d 2 (8 5) (8 1) 3 7
md y 3 y me
Los fractiles son medidas estadísticas que dividen una distribución de datos en
1.4. Fractiles partes específicas, de acuerdo con ciertas proporciones de frecuencias observadas.
Cuartiles
Los cuartiles de una distribución, son los valores de la variable que dividen a los
datos (ordenados de menor a mayor) en cuatro partes iguales.
Formas de cálculo
a) Datos no agrupados
2º Cuartil n 1 n 1
2 4 2
n n
Q2 2 4 2
3º Cuartil n n 1
Q3 3 4 3 4
Ejemplo 1:
1- Determinación de Q1
8
Determinamos el Orden: 1 4 2
151 152
Q1 = 151,5
2
2- Determinación de Q2
8
Determinamos el Orden: 2 4 4
El segundo cuartil, Q2, es el valor de la variable que divide a la serie en dos partes
iguales. Luego:
154 155
Q2 = 154,5
2
2 2
3- Determinación de Q3
8
Determinamos el Orden: 3 4 6
156 157
Q1 = 156,5
2
Resumiendo:
Ejemplo 2:
150 – 151- 152 -153 – 154 – 155 – 156 – 157 – 159 cms.
1- Determinación de Q1
9 1
Determinamos el Orden: 1 4 2,5
151 152
Q1 = 151,5
2
2- Determinación de Q2
9 1 9 1
2 5
Determinamos el Orden: 4 2
El segundo cuartil, Q2, es el valor de la variable que divide a la serie en dos partes
iguales. Luego:
Q2 = 154
2 2
3- Determinación de Q3
9 1
Determinamos el Orden: 3 4 7,5
156 157
Q3= 156,5
2
Resumiendo:
b) Datos Agrupados
n n
N j 1 k N j 1 k
4 4
General y j 1 y j
Qk y j Qk
2
K: Número de cuartil: 1, 2, 3
n
n N j 1 1
1º Cuartil N j 1 1 4
4
Q1 y j 1 y j
Q1 y j Q1
2
n
2º Cuartil n N j 1 2
N j 1 2 4
4
Q2 y j 1 y j
Q2 y j Q2
2
n
n N j 1 3
3º Cuartil N j 1 3 4
4
Q3 y j 1 y j
Q3 y j Q3
2
Ejemplo:
Número de
n i N i Q 1 Q 3
Hijos
0 5 5 N j 1
Q 1 1 11 16 Nj N j 1
Q 3 2 35 51 Nj
3 2 53
4 2 55
5 1 56
Total 56
n 56
Orden: 14
4 4
n
N j 1 5; por lo cual N j 1 14
4
Q1 y j 1 Hijo
n (56)
Orden: 3 3 42
4 4
N j 1 16
Q3 y j 2 Hijos
General n
k ( ) N j 1 Qk ( yi' 1 ) j
Qk ( yi'1 ) j c 4
nj
K: Número de cuartil: 1, 2, 3
n
N j 1 1
n N j 1 1
4 4
1º Cuartil
Q1 n
1 ( ) N j 1 Q1 ( yi'1 ) j
Q1 ( yi'1 ) j c 4
nj
n n
N j 1 2 N j 1 2
2º Cuartil 4 4
n n
Q2 2 ( ) N j 1 N j 1
Q2 ( yi'1 ) j c 4 ( yi'1 ) j c 2 Q2 ( yi'1 ) j
nj nj
n n
N j 1 3 N j 1 3
4 4
3º Cuartil
n
Q3 3 ( ) N j 1 Q3 ( yi'1 ) j
Q2 ( yi'1 ) j c 4
nj
El Cuartil 2º Q2 = Me
Ejemplo:
Tabla de frecuencias para la longitud de los tornillos fabricados por una máquina.
Intervalos
n i N i
de Clase
6-7 11 11
7-8 9 20 N j 1
y 'j 1 8-9 14 34 Nj
9-10 11 45
10-11 22 67 N j 1
y 'j 1 11-12 14 81 Nj
12-13 7 88
13-14 5 93
14-15 4 97
15-16 3 100
Total 100
100
( ) 20
Q1 8 1 4 8,36 mm
14
3(100)
[ ] 67
Q3 11 1 4 11,57mm
14
Este resultado indica que el 75% de los tornillos mide menos de 11,57 mm., y el
25% restante mide más de 11,57 mm.
Deciles
Simbología Definición
Valor de la variable que agrupa el 10% de los datos.
D 1
(10% de los datos a la izquierda y 90% de los datos a la derecha)
D 2 Valor de la variable que agrupa el 20% de los datos.
D 3 Valor de la variable que agrupa el 30% de los datos.
D 4 Valor de la variable que agrupa el 40% de los datos.
D 5
Valor de la variable que agrupa el 50% de los datos.
Mediana
D 6 Valor de la variable que agrupa el 60% de los datos.
D 7 Valor de la variable que agrupa el 70% de los datos.
D 8 Valor de la variable que agrupa el 80% de los datos.
D 9 Valor de la variable que agrupa el 90% de los datos.
D 10 Valor de la variable que agrupa el 100% de los datos.
Formas de Cálculo
a) Datos No Agrupados
1º Decil n n 1
D1 1 10 1 10
5º Decil n 1 n 1
5 10 2
n n
D5 5 10 2
7º Decil n n 1
b) D7 7 10 7 10
b) Datos Agrupados
n n
N j 1 k N j 1 k
10 10
General y j 1 y j
Dk y j Dk
2
K: Número de Decil: 1, 2,…, 9
n
n N j 1 1
1º Decil N j 1 1 10
10
D1 y j 1 y j
D1 y j D1
2
n
5º Decil n N j 1 5
N j 1 5 10
10
D5 y j 1 y j
D5 y j D5
2
n
n N j 1 7
7º Decil N j 1 7 10
10
D7 y j 1 y j
D7 y j D7
2
General n
k ( ) N j 1 Dk ( yi' 1 ) j
Dk ( yi'1 ) j c 10
nj
K: Número de Decil: 1, 2, …,9
n
N j 1 1
n N j 1 1
10 10
1º Decil n
1 ( ) N j 1
D1 D1 ( yi'1 ) j c 10
nj D1 ( yi'1 ) j
n n
N j 1 5 N j 1 5
10 10
5º Decil
n n
D5 5 ( ) N j 1 N j 1
D5 ( yi'1 ) j c 10 ( yi'1 ) j c 2 D5 ( yi'1 ) j
nj nj
n n
N j 1 7 N j 1 7
10 10
7º Decil
n
D7 7 ( ) N j 1 D7 ( yi'1 ) j
D7 ( yi'1 ) j c 10
nj
El Decil 5º D5 = Q2 = Me
Percentiles
Así, cuando se habla del percentil 15, se quiere expresar que es el valor de la
variable que deja el 15% de los datos a su izquierda y el 85% de los mismos a su derecha.
Formas de Cálculo
a) Datos No Agrupados
1º Percentil n n 1
P1 1 100 1 100
50º Percentil n n n 1 n 1
P50 50 100 2 50 100 2
70º Percentil n n 1
P70 70 100 70 100
b) Datos Agrupados
n n
N j 1 k N j 1 k
100 100
General y j 1 y j
Pk y j Pk
2
K: Número de Percentil: 1, 2,…, 99
n
n N j 1 1
1º Percentil N j 1 1 100
100
P1
y j 1 y j
P1 y j P1
2
n
n N j 1 5 0
50º Percentil N j 1 5 0 100
100
P 50
y j 1 y j
P5 y j P5
2
n
n N j 1 70
70º Percentil N j 1 70 100
100
P 70
y j 1 y j
P7 y j P7
2
General n
k( ) N j 1
Pk ( yi'1 ) j c 100 Pk ( yi' 1 ) j
nj
K: Número de Percentil: 1, 2, …, 99
n n
N j 1 1 N j 1 1
100 100
1º Percentil
n
P1 1( ) N j 1
P1 ( yi'1 ) j c 100 P1 ( yi'1 ) j
nj
n n
N j 1 50 N j 1 50
100 100
50º Percentil n 1
P50 50 ( ) N j 1 ( ) N j 1
P50 ( yi 1 ) j c
' 100 ( yi 1 ) j c 2
'
nj nj P50 ( yi'1 ) j
n n
N j 1 7 0 N j 1 70
100 100
70º Percentil
n
P70 70 ( ) N j 1 P70 ( yi'1 ) j
P70 ( yi 1 ) j c
' 100
nj
Me = Q2 = D5 = P50
2. Medidas de Asimetría
Simetría
x me md
Una distribución simétrica significa que la clase central tiene la mayor frecuencia y
que las frecuencias, arriba de la clase central de la distribución, corresponden
exactamente a las frecuencias debajo de la clase central.
Ejemplo
30 – 40 35 2 70 2
40 – 50 45 3 135 5
50 – 60 55 5 275 10 N j-1
60 – 70 65 8 = nj 520 18 N j
70 – 80 75 5 275 23
80 – 90 85 3 255 26
90 - 100 95 2 190 28
28 1.820
Calculamos:
1.820
y 65
28
n 28 n 14 10
me 14 N j 1 M e 60 10. 65
2 2 2 8
3
m d 60 10. 65
6
Gráficamente
x me md
Si las frecuencias por arriba de la clase modal, no son las mismas que las
frecuencias por debajo de dicha clase, la distribución no es simétrica y los valores de las
medidas vistas no son iguales.
x me md
Gráficamente:
x me md
x me md .
Gráficamente:
md me x
Prof. Cdra. Gladys M. Rouadi 118
Probabilidades y Estadística
La media, en este caso está afectada por los valores altos de la distribución, y su
posición sobre la escala de las x es estirada hacia la derecha o hacia valores más altos de
la escala.
Para eliminar ambos defectos se trabaja con una medida relativa de asimetría,
llamado coeficiente de Pearson, que simbolizamos y calculamos de la siguiente manera:
3( x - md )
kP
sˆ
Dónde:
x : media aritmética
md : mod a
sˆ : desviación estándar muestral corregida
3( x - md )
kP
sˆ
Como vimos anteriormente la moda por el método empírico se determina:
md x - 3( x - me )
Reemplazando
x - md = x - [ x - 3( x - me )] = 3( x - me )
3( x - me )
kP =
ŝ
∑ y
m
3
-y ni
3
i m 3
k3 , donde 3 i 1
∑ yi - y hi
sˆ 3 n i 1
k= 0; indica simetría
Ejemplo:
A) B) C)
y 50 z 50
x 50
Las figuras A, B y C, si bien son iguales en cuanto a su promedio, los datos en C)
están más concentrados alrededor del promedio que la figura B) y los de ésta más que los
de la figura A), o dicho de otro modo, los datos de la figura A) están más dispersos que
los de la figura B) y éstos más que los de la C).
Las Medidas De Tendencia Central Tienen Como Objetivo El Sintetizar Los Datos En Un Valor
Representativo, Las Medidas De Dispersión Nos Dicen Hasta Qué Punto Estas Medidas De Tendencia
Central Son Representativas Como Síntesis De La Información. Las Medidas De Dispersión Cuantifican
La Separación, La Dispersión, La Variabilidad De Los Valores De La Distribución Respecto Al Valor
Central.
3.1. Recorrido
Simbología
Formas De Cálculo
R x máx x mín R x n x1
xi i 1,2,..., n ; x 1 , x 2 ,..., x n
b) Datos Agrupados
R y máx y mín R y m y1
yi i 1,2,..., m ; y1 , y2 ,..., ym
Se ve muy influenciado por valores no usuales de los datos. Si aparece un valor fuera
de lo común ya sea muy grande o muy pequeño, no es posible utilizarlo como
medida de dispersión, porque su resultado está deformado por estos valores fuera de
serie.
No es una medida de dispersión de los datos intermedios con relación al valor típico.
Ejemplo:
Los informes de mercado de acciones se expresan frecuentemente en términos de
su amplitud, cotizando precios altos y bajos de acciones durante un período de tiempo.
Para medir la dispersión de una serie simétrica y casi continua. En tal caso puede ser
aproximada la medida, tomando el promedio de los dos valores extremos, llamado
Amplitud Media.
Ejemplo:
Temperatura media diaria. Se promedia la máxima y la mínima, en vez de usar las
veinticuatro lecturas horarias del día.
Ejemplo:
Control Estadístico de la Calidad
Definición
m
∑ y i - x ni
DM x = i =1
n
∑ yi - me ni
DM me i 1
n
m
∑ y i - md ni
DM md = =1
i
n
De esta manera esta medida se basa en todos los elementos y permite medir la
dispersión alrededor de un promedio.
Simbología
Población DM(X)
Muestra DM(x)
Formas De Cálculo
xi x
DM ( x ) M xi x i 1
Se ignoran los signos positivos o negativos de las desviaciones ya que como se vio
al estudiar las propiedades de la media:
x y
n m
i x 0 ó i y ni 0
i 1 i 1
a) Datos Agrupados
m
∑ y i - y ni
[
DM( y ) = M y i - y ] = =1
i
n
Donde yi será:
Procedimiento:
2- Obtener las desviaciones de cada valor de la variable o cada marca de clase, según
corresponda, con respecto a la media aritmética
3.3. Varianza
Definición
Simbología
Población V(X)= X2
2
Muestra V(x)= s x
x y
n m
i x i y ni
Como ya vimos i 1
0 , en series simples, y i 1
0, en datos
n n
agrupados, cualquiera sea la distribución. El que esta media valga 0, se debe a las
compensaciones de las desviaciones positivas con las negativas. Esta compensación, ya fue
evitada considerando el valor absoluto de las desviaciones.
La otra forma de evitarlas es tomar una potencia par para dichas desviaciones. Si
tomamos la potencia 2, se transforma en la varianza, haciendo uso de esta manera de la
propiedad de los mínimos cuadrados de la media:
x y
n m 2
2
i x mínimo ó i y ni mínimo
i 1 i 1
Formas De Cálculo
n
∑( x i x )2
V( x ) = M [( x i ]
x )2 = i =1
n
b) Datos Agrupados
m
∑( y i y ) 2 ni
V( y ) = M [( y i ]
y ) 2 = i =1
n
Procedimiento:
x
n
2
i x
i 1
V ( x)
n
x
n
2
2
i 2 xi x x
i 1
V ( x)
n
Introduciendo el sumatorio:
n n
x 2 x xi n x
2 2
i
i 1 i 1
V ( x)
n
Recordamos que:
Luego:
n
x i n
x i 1
n
x i 1
i xn , reemplazando:
n n n
xi2 2 n x n x xi2 n x x
2 2 2 2
i
i 1 i 1 i 1 2
V ( x) x
n n n
Entonces:
n
x 2
x M x 2 M x
i
2
V ( x) i 1 2
Ejemplo:
Sean:
n = 10
xi = número de hijos por familia = 2, 1, 3, 1, 2, 1, 3, 0, 2, 1
x
i 1
2
i
2
V ( x) x
n
Obtenemos
x
i 1
i
16
x 1,6
n 10
x
2
x 4, 1, 9, 1, 4, 1, 9, 0, 4, 1 y 2
i 34
i 1
Luego reemplazamos:
1,6 0,84
34
V ( x)
2
10
b) Datos Agrupados
y
m
2
y ni
y
i
V ( y) M y i 1
2
i
n
y 2
ni
y M y 2 M y
i
i 1 2
V ( y)
2
m m
V ( y) yi y hi yi2 hi y
2
i 1 i 1
Ejemplo:
yi ni yi ni y i ( y i ni ) y i2 ni hi y i2 hi
0 1 0 0 0,10 0
1 4 4 4 0,40 0,40
2 3 6 12 0,30 1,20
3 2 6 18 0,20 1,80
10 16 34 1 3,40
y 2
i ni
1,6 0,84
i 1 2 34
V ( y) y
2
n 10
O bien
m
y i' 1 y i' yi ni yi ni y i2 n i hi y i2 hi
45-55 50 2 100 5.000 0,10 250
55-65 60 4 240 14.400 0,20 720
65-75 70 7 490 34.300 0,35 1.715
75-85 80 4 320 25.600 0,20 1.280
85-95 90 3 270 24.300 0,15 1.215
20 1.420 103.600 1 5.180
y
i 1
i ni
1.420
y 71
n 20
y 2
i ni
71 139
i 1 2 103.600
V ( y) y
2
n 20
Propiedades
V ( y) 0
V (k ) 0
Si todas las observaciones son iguales (k), es decir iguales, la media coincide con
el valor común y las desviaciones son todas nulas.
3- La Varianza del producto de una constante por una variable, es igual al producto del
cuadrado de la constante por la varianza de la variable.
V ( k y ) = k 2 V (y)
Ejemplo:
yi ni
0 1
1 4
2 3
3 2
10
V (y) = 0,84
'
y
i 1
'
i ni
32
y 3,20
n 10
y '2
i ni
3,20 3,36
i 1 '2 136
V(y' ) y
2
n 10
V (k y ) V y
Ejemplo:
'
y
i 1
'
i ni
36
y 3,60
n 10
y '2
i ni
3,60 0,84
i 1 '2 138
V(y ) y
' 2
n 10
V ( y k) V y
V ( x y ) V ( x) V y V ( x y ) V ( x) V y
y
6- Si “x” e “y” son dos variables dependientes, entonces la varianza de la suma es igual a
la suma de las varianzas más dos veces la covarianza de x, y.
V ( x y ) V ( x) V y 2 Cov ( x, y )
y
V ( x y ) V ( x) V y 2 Cov ( x, y )
Observaciones
2) En los casos en que no se pueda hallar la media, tampoco será posible hallar la
varianza.
3) La varianza no viene expresada en las mismas unidades que los datos, ya que las
desviaciones están elevadas al cuadrado.
Definición
Simbología
Población DS(X)= X
Muestra DS(x)= s x
Esta medida ha sido definida con el fin de hacer comparable su resultado o valor
con los valores de la variable, dado que en el caso de la Varianza, por ser su valor de un
orden superior a los valores de la variable, debido a que es un promedio de cuadrados,
no es comparable. A los fines de reducir dicho valor a la misma dimensión que los
valores de la variable, se le extrae la raíz cuadrada y se define la Desviación Estándar.
otra, si la primera tiene una menor Varianza, ó Desviación Estándar. Sin embargo,
dudaríamos de hacer una declaración precisa acerca de un conjunto de datos cuando se
da un valor específico de una u otra medida.
Formas de Cálculo
x
i 1
2
i
2
DS ( x ) s x V ( x ) x
n
b) Datos Agrupados
y
i 1
2
i ni
2
DS ( y ) s y V ( y ) y
n
Propiedades
D( y ) ≥0
2- La desviación típica será siempre cero, en el caso de que las puntuaciones sean iguales.
D( k ) = 0
3- Si a todos los valores de la variable se les suma un mismo número la desviación típica
no varía
D( k + y ) = D(y)
D( y - k ) = D(y)
D(k y) k D y
4- Si “x” e “y” son dos variables independientes, entonces la desviación típica de la suma
o diferencia, es igual a la suma de las desviaciones.
D( x + y ) = V( x ) + V( y ) D( x - y ) = V( x ) + V( y )
Observaciones
Definición
Por otro lado, las medidas de dispersión expresadas en valores absolutos son
útiles para describir la dispersión de un solo conjunto de valores, mientras que el
Por ejemplo, si nos piden comparar la dispersión de los pesos de las poblaciones
de elefantes de dos circos diferentes, la desviación estándar nos dará información útil.
El problema no deriva sólo de que una de las medidas sea de longitud y la otra
sea de masa. La misma dificultad se plantea si medimos cierta cantidad, por ejemplo la
masa, de dos poblaciones, pero con distintas unidades. Este es el caso en que
comparamos el peso en toneladas de una población de 100 elefantes con el
correspondiente en miligramos de una población de 50 hormigas.
Por ejemplo, se nos puede ocurrir medir a las hormigas con las mismas unidades
que los elefantes (toneladas). Lo lógico es que la dispersión de la variable peso de las
hormigas sea prácticamente nula (¡Aunque haya algunas que sean 1.000 veces mayores
que otras!)
En síntesis, si los promedios son diferentes, aunque las unidades sean las mismas,
o bien, si los promedios son similares, pero las unidades de medida son distintas, la
comparación de grados de dispersión basados en valores absolutos no se puede realizar.
Puesto que tanto la desviación estándar como la media se miden en las unidades
originales, el CV es una medida independiente de las unidades de medición.
Ejemplo:
Si tengo que el peso promedio de los elefantes es de 7500 kg con una desviación estándar
de 500kg y también tengo que el peso promedio de los ratones es de 30g con una
desviación estándar de 5 g, podré suponer (erróneamente) que los elefantes tienen mayor
desviación que los ratones, sin embargo, si calculamos el coeficiente de variación de cada
muestra se tendrá que el de los elefantes es de 6,7% y el de los ratones de 16,67%, es
decir, es mayor la variación entre los pesos de los ratones.
Simbología
Población CV(X)
Muestra CV(x)
Formas de Cálculo
DS ( x )
CV ( x )
M ( x)
b) Datos Agrupados
DS ( y )
CV ( y )
M ( y)
Basta dar una rápida mirada a la definición del coeficiente de variación, para ver
que las siguientes consideraciones deben ser tenidas en cuenta:
Sólo se debe calcular para variables con todos los valores positivos. Todo índice de
variabilidad es esencialmente no negativo. Las observaciones pueden ser positivas o
nulas, pero su variabilidad debe ser siempre positiva. De ahí que sólo debemos
trabajar con variables positivas, para la que tenemos con seguridad que la media debe
ser mayor que 0.
DS ( y ) DS ( x) DS ( x)
CV ( y )
M ( y) M ( x) b M ( x)
DS ( y ) DS (a x) a DS ( x)
CV ( y ) CV ( x)
M ( y) a M ( x) a M ( x)
2)
Coeficiente de Variación Apreciación
26% o más Muy heterogéneo
Del 16% a menos del 26% Heterogéneo
Del 11% a menos del 16% Homogéneo
0% a menos del 11% Muy Homogéneo
3)
4)
Coeficiente de Variación Apreciación
≤ 10% Poca variabilidad
>10 y ≤ 33% Variabilidad Aceptable
>33 y ≤ 50 % Mucha variabilidad pero tolerable
>50 % Variabilidad excesiva y pérdida de su naturaleza
Simbólicamente:
yi - y
zi
DS ( y )
Media
Variable Natural yi M ( y) y
Variable Desvío yi y M ( yi y) 0
yi - y
Variable Tipificada zi 0
DS ( y )
Nos interesa la posibilidad que existe de llevar todas las distribuciones de distintas
variables a una única escala de valores relativos, que por ser tales pierden ya sus
respectivas unidades de medida y pasan a ser valores abstractos, y como consecuencia,
podrán ser analizadas con una única distribución de probabilidad, como modelo teórico
explicativo, que es la conocida Distribución Normal Estandardizada, que veremos más
adelante.
4 (y i y ) 4 ni m
k4 3, donde 4 i 1
( yi y ) 4 hi
s4 n i 1
Gráficamente: