Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GENERALIDADES.
MEDIA ARITMETICA.
3+ 4+5
Sean las notas de un alumno: 3, 4, 5 entonces el promedio será: x = =4
3
i=k
x i
Luego se puede decir que: x = i =1
Para datos agrupados donde x1, x2, ......., xk son las marcas de clase y f1, f2, ......., fk las
frecuencias absolutas k, el numero de clases, entonces:
i=k
x i fi
x= i =1
N
Ejemplo: Supongamos que la siguiente distribución de frecuencias corresponde a una
encuesta del numero ovejas que posee cada familia en una comunidad de 30 habitantes.
Clases fi xi xifi
[10 - 26> 4 18 72
[26 - 42> 12 34 408
[42 - 58> 7 50 350
[58 - 74> 4 66 264
[74 - 90> 2 82 164
[90 - 106| 1 98 98
30 1356
1
i =k
x1356 i fi
Donde: x = i =1
;x =
= 45,2 45
N 30
Donde el promedio de ovejas es de 45 en una comunidad de 30 habitantes.
2.- Si a todos los datos le sumamos (o restamos) una constante, la media aritmética de esta
serie es la misma sumada(o restada) por la constante.¨
f1 + f 2 + ...... + f n C x C
3.- Si a todas los datos los multiplicamos (o dividimos) por una constante c, distinta de cero ,
su media queda multiplicada o dividida por dicha constante.
( f 1 + f 2 + ...... + f n )(*o /)C x (*o /)C
4.- La suma de los desvíos respecto de la media aritmética es siempre igual a cero.
i =m
(x
i =1
i − x) fi = 0
i =m
(x
i =1
i − A) 2 f i = 0 si A= x
METODO CORTO:
Si las marcas de clase Xi son remplazados por una constante di entonces la media aritmética
seria igual a:
i =k
d i fi
x= i =1
+ A donde: A es la frecuencia absoluta de clase central o también llamado de
N
trabajo.
Donde: di es una desviación de variación del ancho del intervalo de clase(w).
2
Por otro lado si ui es una desviación de variación unitaria se tiene:
i =k
u i fi
x=w i =1
+A
N
Ejemplo:
− 144
Para el primer caso el promedio será: x = + 50 = 45,2 ; Para el segundo caso será:
30
−9
x = 16 + 50 = 45,2
30
MEDIA PODERADA.
x1 + x2 + ..... + xn
x1 , x2 ,...., xn X =
n
MEDIA ARMONICA:
i =k
1 N 1 1 1
H= i =k
1
= i =k
1
ó = x Para datos simples.
H N i =1 i
i =1 xi i =1 xi
N
Ejemplo:
3 3
La media harmónica de 2, 4, 8 es: H = = 3 = 3,42857
1 1 1 7
+ +
2 4 8
3
i =k
1 N 1 1 fi
H= i =k
fi
= i =k
fi
ó = x Para datos agrupados.
H N i =1 i
i =1 xi i =1 xi
N
Ejemplo:
Minutos Nº de
por obreros
Articulo
xi fi
10 5
15 20
16 10
20 5
40
40 10
H= = 14 = 14,7692
5 20 10 5 13
+ + +
10 15 16 20
MEDIA GEOMÉTRICA:
La media geométrica G de un conjunto de N números x 1, x2, ...... , xn es la raíz N-esima del
producto de los n números:
i =k
G = N xi x 2 ...x n = N xi Ejemplo: La media geométrica de: 2, 4, 8 es: G = 3 2 x 4 x8 = 4
i =1
i =k
Logx i
Utilizando logaritmos seria: log G = i =1
N
Ejemplo2:
Calcular el crecimiento promedio porcentual de producción de estaño según el siguiente
cuadro:
4
3.725430995
LogG = = 0,9313577488 G = AntiLog (0,9313577588 ) = 8.538031
4
Respuesta: EL crecimiento porcentual promedio anual de estaño es 8,54%
i =k
f i log xi
Para datos agrupados seria: G = utilizando logaritmos: log G = i =1
N f11 f 22 fnk
x x
1 2 ...x k
N
La media geométrica tiene algunos inconvenientes como por ejemplo si algún x i es igual “0”
entonces G=0 ó si algún xi es negativo entonces G es imaginario, luego es preciso buscar una
forma diferente de calcular la media geométrica:
Luego:
MODA:
La moda de una serie estadística es la frecuencia más alta de la serie estadística o dicho de otra
manera es el valor más frecuente.
Ejemplo:
20, 40, 30, 40, 50, 110, 20, 50, 40, 15 donde la moda de esta serie es: Mo=40.
5
C) Si todas las frecuencias son iguales se dice que la distribución no tiene moda y se trata
de una distribución uniforme:
Mo=Moda
Lo=Limite real inferior de
la clase modal.
no=Frecuencia absoluta de
la clase modal.
f1=Frecuencia absoluta
anterior a la clase modal.
f2=Frecuencia absoluta
posterior a la clase modal.
w=Amplitud o ancho del
intervalo de clase.
Lo Mo (Lo+w+Mo)
EF EG M − L0 L0 + w − M 0 M − L0 L0 + w − M 0 1
= 0 = 0 = M 0 = LO + w
AB DC f 0 − f1 f0 − f2 1 2 1 + 2
Ejemplo:
1
Intervalos Universitar M 0 = LO + w.
ios 1 + 2
fi 20
M 0 = 50 + 10 = 52 ,86 53
20 - 30 10 20 + 50
30 – 40 20
40 – 50 40
50 – 60 60
60 – 70 10
70 - 80 5
Total 145
6
MEDIANA:
N
Me − L Me − L − F j −1
AB AC j −1 w j −1 w 2
= = = Me = L j −1 + w
BD CE N F j − F j −1 N fj fj
− F j −1 − F j −1
2 2
Ejemplo:
N
Edades Xi Univ. Fi − F j −1
Me = L j −1 + 2
15 – 19 17 5 5 w
fj
20 – 24 22 10 15
25 – 29 50
27 20 35 − 15
30 – 34 32 10 45 Me = 24 ,5 + 2 5 = 27
35 – 40 37 5 50 20
Total 50
FRACTILES:
7
de frecuencias, entonces es posible dividirla también en cuatro partes iguales (cuartiles), o en
diez partes iguales(deciles), o cien partes iguales(percentiles), y así sucesivamente.
N
(n) − F j −1
Cuartil: Me = L j −1 + 4 w Donde n indica la posición
fj del fractil.
N
(n) − F j −1
Decil: Me = L j −1 + 10 w
fj
N
(n) − F j −1
Percentil: Me = L j −1 + 100 w
fj
CUARTILES
Son los que dividen la serie o el histograma de frecuencias en cuatro partes iguales.
Son los valores de la variable que dividen en cuartos a los datos ordenados; cada conjunto de
datos posee tres cuartiles. El primer cuartil Q1, es el número tal que cuando mucho el 25 % de
los datos es menor en valor que Q1 y cuando mucho el 75% de de los datos es mayor que Q1.
El segundo cuartil es la mediana. El tercer cuartil, Q3, es el número tal que cuando mucho el
75% de los datos es menor en valor que Q3 y cuando mucho el 25% de datos es mayor que
Q3. (Según el cuadro siguiente)
Datos clasificados en orden creciente
25% 25% 25% 25%
Q1 Q2 Q3
N
(n) − F j −1
Q1 = L j −1 + 4 w
fj
Siendo:
8
N
(2) − F j −1
Q2 = L j −1 + 4 w ; El cuartil dos coincide con la mediana, ya que
f2
N
(3) − F j −1
Q3 = L j −1 + 4 w
f3
QUINTILES
Son los que dividen una serie o un histograma de frecuencias en cinco partes iguales se denota
por “T”
N 2N 3N 4N
5 − F j −1 5 2 − F j −1 5 3 − F j −1 5 4 − F j −1
T1 = Li + w j ; T2 = Li + w j ; T3 = Li + w j ; T4 = Li + w j
f r1 f r2 fr3 f r4
DECILES
Son los que dividen una serie o un histograma de frecuencias en diez partes iguales se denota
por “D”
N 2N 5N
10 − F j −1 10 2 − F j −1 10 5 − F j −1
D1 = L1 + w j ; D2 = Li + w j ;........; D5 = Li + w j
f D1 f D 2 f D 5
5N N
El decil quinto es la mediana ya que: =
10 2
PERCENTILES
Son los que dividen una serie o un histograma de frecuencia en cien partes iguales. se denota
por “P”
Son los valores de la variable que dividen a un conjunto de datos ordenados en 100
subconjuntos iguales; cada conjunto de datos tiene 99 percentiles (consulte la figura
siguiente), El k–ésimo percentil, Pk, es un valor tal que cuando mucho k % de los datos son
mas pequeños en valor que Pk y cuando mucho (100 – k )% de los datos es mayor.
9
Datos clasificados en orden creciente
1% 1% 1% 1% 1% 1% 1%
N 50 N 99 N
100 − F j −1 100 − F j −1 100 − F j −1
P1 = L1 + w j ;...; P50 = L1 + w j ;...; P99 = L1 + w j
f p1 f p 50 f p 99
50 N N
La mediana es el percentil cincuenta ya que: =
100 2
Notas:
Paso 1
Ordenar los datos n, del más chico al más
Paso 2 grande
Calcular: Nk
100
100
SALARIOS NUMERO DE Fi
POR DIA EMPLEADOS
50 – 60 8 8
60 – 70 10 18
70 – 80 16 34
80 – 90 14 48
90 – 100 10 58
100 –110 5 63
110 – 120 2 65
TOTAL 65
N 65
(n) − F j −1 1− 8
Q1 = L j −1 + 4 w Q1 = 60 + 4 10 = 68,25
fj 10
C) Calcular el 3 decil.
N 65
(n) − F j −1 3 − 18
D3 = L j −1 + 10 w D3 = 70 + 10 10 = 70,9375
fj 16
D) Calcular 5 percentil.
N 65
(n) − F j −1 5−0
P5 = L j −1 + 10 w P5 = 50 + 100 10 = 54,0625
fj 8
11
MEDIDAS DE VARIABILIDAD
Las medidas de tendencia central que se describen en él capitulo anterior, son útiles para la
identificación de un valor típico en un grupo de valores. Por el contrario, las medidas de
dispersión o variabilidad describen un grupo de valores en función de la variación o dispersión
de los datos incluidos en ese grupo. Existen varias técnicas para medir el grado de dispersión
en los conjuntos de datos en este capitulo describiremos: La desviación media, la desviación
intercuartilica, la varianza y la desviación típica.
Es un estadígrafo sumamente sencillo pero frecuentemente influido por sus valores extremos,
descuidando los valores intermedios, por cuyo motivo su aplicación se restringe a una parte
especializada de la estadística, conocida como el control de calidad, y utilizado
frecuentemente en el sector industrial.
Se define como:
LA DIFENENCIA DEL VALOR MAS ALTO DE LA VARIABLE Y EL VALOR MAS
BAJO PARA UNA SERIE. PARA DATOS AGRUPADOS, ES LA DIFERENCIA ENTRE
EL LIMITE SUPERIOR DE LA ULTIMA CLASE, Y EL LIMITE INFERIOR DE LA
PRIMERA”
R = X max − X min
R = Lsm − Li1
LA DESVIACION MEDIA:
Es la diferencia entre cada valor del conjunto de datos y la media del grupo. Si se calculara la
media de la suma de diferencias más o menos entre cada valor y la media aritmética, la
respuesta en realidad siempre seria cero. Por esta razón, se suman los valores absolutos de las
diferencias. Es decir que, la desviación media son los promedios absolutos de los valores de la
variable con respecto a su media aritmética.
i=k i=k
| x i −x | | x i − x | fi
Para datos simples seria: DM = i =1
para datos agrupados seria: DM = i =1
N N
Ejemplo:
12
DESVIACION MEDIANA
DMe = M X i − Me
n
X i − Me
Para una serie simple DMe = i =1
n
m
f i X i − Me
Para datos agrupados DMe = i =1
n
RELACION GENERAL
DMe DM S
¨
DESVIACION INTERCUARTILICA:
Es una medida de dispersión que solo depende de dos valores que están situados en la mitad
central de los datos. Este indicador se usa cuando otras medidas de dispersión son afectadas
seriamente por los valores extremos o cuando se trata de distribuciones asimétricas.
13
Q3 − Q1
Q=
2
Ejemplo:
N 50
= = 12,5
Edades xi fi Fi 4 4
14,5-19,5 17 5 5 12,5 − 5
Q1 = 19,5 + 5 = 23,25
19,5-24,5 22 10 15 10
N 50
24,5-29,5 27 20 35 3 =3 = 37,5
50 4
29,5-34,5 32 10 45 37,5 − 35
34,5-40,5 37,5 5 50 Q3 = 29,5 + 5 = 30,75
10
50
VARIANZA.
Es una medida de dispersión, que mide la agrupación de los datos, al rededor de la media
aritmética, conocida también como el segundo momento central.
Según el concepto: Las diferencias de xi − x , nos darían las distancias entre los datos
observados y la media aritmética, pero la suma de estas diferencias serian siempre cero, por lo
que es necesario, hallar una forma en que esta suma no sea cero, por lo que se propone sumar
los números absolutos de estas diferencias así: | xi − x |, luego el promedio de estas
i=k
x i −x
diferencias seria: DM = i =1 ; que como ya hemos visto es conocida como desviación
N
media. Pero otra manera de evitar los números negativos, para evitar la suma cero seria, elevar
las diferencias al cuadrado de la siguiente manera: ( xi − x )2, el promedio de estas
i=k
(x − x)
2
i
diferencias seria: S 2 = i =1 , conocida como varianza para datos simples, para datos
N
i=k
(x − x ) fi
2
i
agrupados seria: S 2 = i =1
N
Ejemplo:
14
DESVIACION TIPICA O STANDART.
i=N
(x − x ) fi
2
i
S= i =1
S = 31,02 = 5,57 .
N
Problema.
Solución:
i =k 2
( xi − x )
i =1
= 1.250
xi2 = 5.000
N = 50
x =?
( )
i =k i =k i =k i =k i =k
15
Si:
i =k
x i i =k i =k i =k i =k i =k
x= i =1
Nx = xi xi2 − 2 x Nx + x 2 = 1.250 xi2 − 2 Nx 2 + x 2 = 1.250 Lu
N i =1 i =1 I =1 i =1 I =1
ego:
i =k
5.000 − 1.250
x
i =1
2
i − Nx 2 = 1.250 5.000 − 50 x = 1.250 x =
50
= 8,66
PROPIEDADES DE LA VARIANZA:
(c − c )
2
c, c, c x = c; ci luego: s 2 = i =1
=0
N
(x − x)
2
i
x1 , x 2 , x3 ,......x k s 2 = i =1
N
Luego:
i =k i =k 2 i =k
(cxi − cx ) c(xi − x ) c 2 ( xi − x )
2 2
(x − x)
2
i
x1 , x 2 , x3 ,......x k s 2 = i =1
i =k i =k
(xi + c ) − (x + c ) (x + c − x − c )
2 2
i
x1 + c, x 2 + c, x3 + c,......x k + c s c2 = i =1
s c2 = i =1
N N
16
i =k
(x − x)
2
i
luego: s c2 = i =1
s c2 = s 2
N
i =k
(x − A) la desviación es mínima si A = x :
2
4) En la expresión i
i =1
i =k
Si: L = (xi − A)
2
i =1
La primera derivada seria:
L i =k
L i =k i =k i =k i =k
= −2 (xi − A) = 0 = (xi − A) xi − A = 0 xi − NA = 0
A i =1 A i =1 i =1 i =1 i =1
De donde:
i =k
x i
A= i =1
A= x
N
Demostración de condición de mínimo:
L i =k
2L i =k
2L
= 2 ( xi − A) (− 1) 2 = 2 (0 + 1) 2 = 2 N 2 N 0
2
A i =1 A i =1 A
i =k
(x − A) es mínimo.
2
Luego si 2N>0, i
i =1
COEFICIENTE DE VARIACION
Por otra parte, sirve para comparar fenómenos semejantes en tiempos distintos y viceversa,
(por ejemplo: consumo de leche con azúcar), así se pondría interés en conocer si la
distribución de leche. Tiene mayor o menor dispersión que la distribución del azúcar, en el
sentido de si, una desviación típica de 6,5 litros, ¿es mayor o menor?, que otra de 2.3 kilos.
17
OTROS ESTADIGRAFOS Y MOMENTOS
(+)
(-)
Mo Me X
ASIMETRIA X Mo Me
POSITIVA ASIMETRIA
(Mo < X) POSITIVA
ESTADÍGRAFOS DE APUNTAMIENTO O CURTOSIS
(Mo > X)
Mo = X = Me Mo = X = Me Mo = X = Me
APUNTADA APLANADA NORMAL
18
COEFICIENTE DE ASIMETRÍA DE KARL PEARSON(Sesgo):
Definición:
x − Mo
Sk =
S
Interpretación:
Ejemplo:
40,51 − 41,17
Sk = = −0,127 La distribución es sesgada a la izquierda.
5,18
Demostración gráfica:
Para evitar el uso de la moda, podemos recurrir a la formula empírica, llamada también
segundo coeficiente de Pearson.
3(x − M e )
SP =
S
19
Ejemplo:
N 370
= = 185
2 2
185 − 150
M e = 39 ,5 + 5 = 40 ,67
150
CURTOSIS(Apuntamiento):
La curtosis, mide cuan putiaguda es una distribución, en general, por referencia a la normal, si
tiene un pico alto(leptocurtica), si es aplastada (platicurtica), o si es normal(mesocurtica), este
coeficiente viene definida por:
1
(Q3 − Q1 )
K= 2
P90 − P10
Interpretación:
Ejemplo:
Sueldos Nº de xi Fi 370
= 92,5
Bs. Empleados 4
30 – 34 50 32 50 92,5 − 50
Q1 = 34,5 + 5 = 36,625
35 – 39 100 37 150 100
40 – 44 150 42 300 370
3 = 277,5
45 – 49 50 47 350 4
50 – 54 20 52 370 277,5 − 150
Q3 = 39,5 + 5 = 43,75
370 150
370
10 = 37
100
37 − 0
1
(43,75 − 36,625) P10 = 29,5 +
50
5 = 30,24
K= 2 = 0,203 370
47,8 − 30,24 100
90 = 333
333 − 300
P90 = 44,5 + 5 = 47,8
50
20
La distribución de frecuencias es mesocurtica o tiene tendencia mesocurtica.
MOMENTOS
Los momentos son en realidad promedios o medias de las potencias de la diferencia de la
variable respecto a un valor constante, es decir:
i=N
f (x i i − A) r
m= i =1
Los momentos mas usados son dos, respecto al origen y respecto a la media llamado también
momento central.
Es decir si:
i= N
f (x i i − A) r
ar = i =1
N
i= N i=N
f (x − 0) r fx
r
i i i i
Donde A═0 a r = i =1
= i =1
N N
21
Es decir si:
i=N
f (x i i − A) r
mr = i =1
N
i=N
f (x i i − x)r
Donde A = x mr = i =1
donde r es el momento r-esimo respecto a la media.
N
i =1
fi ( X i − X )2
m2 = =S2
N
m2 = S2 momento central de segundo orden (varianza)
Cuando r = 3
i=N
i =1
fi ( X i − X )3
m3 =
N
Y así sucesivamente.
22