Está en la página 1de 24

MEDIAS DE

TENDENCIA
CENTRAL
MODA
El dato u observación con mayor frecuencia, es decir el
dato que mas se repite. Puede existe mas de una moda
en esos casos sí: Existen 2 modas (Bimodal), 3 modas
(Trimodal), cuatro o más (Polimodal).

Moda en el caso Discreto: Es aquella clase o categoría


con mayor frecuencia si la hay, sino se dice que no hay
moda.
Moda en el caso Continuo:
f a−f a−1
Mo=Li modal + ∗(Ls−Li)
2 f a−f a−1−f a +1

Limites Marca de Limites Marca de


Clase fa
Inferior Superior fa Fa Inferior Superior Clase
4,795 4,945 4,87 24 24 1,05 2,25 1,65 7
4,945 5,095 5,02 11 35 2,25 3,45 2,85 6
5,095 5,245 5,17 21 56 3,45 4,65 4,05 4
5,245 5,395 5,32 26 82 4,65 5,85 5,25 4
5,395 5,545 5,47 12 94 5,85 7,05 6,45 2
5,545 5,695 5,62 6 100
7,05 8,25 7,65 2
5,695 5,845 5,77 12 112
TOTAL 25
5,845 5,995 5,92 8 120
TOTAL 120  

26−21
Mo=5,245+ ∗(5,395−5,245 )=5,28
2 ( 26 )−21−12

MEDIANA
El dato u observación que divide al conjunto de datos en
un 50/50, es decir es la observación 50%.

Mediana en el caso Discreto:


x ( 25+1) , sin es impar
Mediana=
{ 1
(x +x
2

2 n/ 2 n2 +1
=13

, si n es par
)
Mediana en el caso Continuo:
n
( )−Fa −1
2
Me=Li mediano + ∗( Ls−Li )
fa

Limites Marca de Limites Marca de Fa


Clase fa
Inferior Superior fa Fa Inferior Superior Clase
4,795 4,945 4,87 24 24 1,05 2,25 1,65 7 7
4,945 5,095 5,02 11 35 2,25 3,45 2,85 6 13
5,095 5,245 5,17 21 56 3,45 4,65 4,05 4 17
5,245 5,395 5,32 26 82 4,65 5,85 5,25 4 21
5,395 5,545 5,47 12 94 5,85 7,05 6,45 2 23
5,545 5,695 5,62 6 100 25
7,05 8,25 7,65 2
5,695 5,845 5,77 12 112
TOTAL 25
5,845 5,995 5,92 8 120
TOTAL 120  
120
( )−56
2
Me=5,245+ ∗( 5,395−5,245 )=5,26
26

MEDIA ARITMÉTICA
El resultado de sumar todas las observaciones y dividir el
resultado entre el total de ellas.
Media aritmética caso discreto:
Media de la población Media de la muestra
N
n
∑ xi ∑ xi
μ= i=1 x́= i=1
N n
N
n
∑ f i xi ∑ f i xi
μ= i=1 x́= i=1
N n
Media aritmética caso continua: Se aplican las mismas
formulas, pero en vez de usar las cada una de las
observaciones se usa la marca de clase como referente y
se multiplicada cada una por la frecuencia absoluta
individual.
Limites Marca de
Inferior Superior Clase fa Fa
4,795 4,945 4,87 24 24
4,945 5,095 5,02 11 35
5,095 5,245 5,17 21 56
5,245 5,395 5,32 26 82
5,395 5,545 5,47 12 94
5,545 5,695 5,62 6 100
5,695 5,845 5,77 12 112
5,845 5,995 5,92 8 120
TOTAL 120  
( 4,87∗24 )+ ( 5,02∗11 ) + ( 5,17∗21 ) + ( 5,32∗26 )+ ( 5,47∗12 ) + ( 5,62∗6 ) + ( 5,77∗12 )+(5,92∗8)
x́= =5.29
120

x́=5,29

Me=5,27
Mo=5,28
MEDIAS DE
DISPERSIÓN
Una medida de centralización casi nunca es suficiente por si sola, para
analizar adecuadamente las características de un conjunto de datos. Por
lo general, necesitaremos, además, una medida de la dispersión o
variación de los datos, entre las que analizaremos se encuentran el
rango o recorrido, el rango intercuartil, la desviación, la varianza y la
desviación estándar.
El rango o recorrido de un conjunto de datos se define como la
diferencia entre el dato más alto y el más bajo. Su ventaja es que es fácil
de calcular. Su desventaja es que considera solo dos de la gran cantidad
de datos que hay en un conjunto (de datos), ignorando así el resto de los
datos.
El rango intercuartílico El rango intercuartil, simbolizado por R.I, es la
diferencia entre el tercer y el primer cuartil. Es decir, R.I = Q3 − Q1.
Percentiles o Cuantiles: Es aquel valor que deja a su izquierda el r% y a
su derecha 100-r% restante.
n∗r
En el caso discreto: P = 100 r

Se busca el resultado en la Fa y la categoría o clase que contenga el


percentil es el valor buscado o resultante (Si no se encuentra el valor
exacto se busca la Fa inmediatamente superior que lo contenga)

n∗r
En el caso continuo: buscamos primero la posición del percentil con 100
n∗r
( )−F a−1
100
Pr=Li percentil+ ∗( Ls−Li)
fa
Limites Marca de
Inferior Superior Clase fa Fa
4,795 4,945 4,87 24 24
4,945 5,095 5,02 11 35
5,095 5,245 5,17 21 56
5,245 5,395 5,32 26 82
5,395 5,545 5,47 12 94
5,545 5,695 5,62 6 100
5,695 5,845 5,77 12 112
5,845 5,995 5,92 8 120
TOTAL 120  

Calcular los: P25(5,02) , P50(5,27) y P75(5,49) (Q1, Q2 y Q3):


R.I:Q3-Q1 =P75-P25= 5,49 -5,02 =0,47 “La mitad de los individuos se
diferencia en 0,47 millones en la compra de acciones”
120∗25
( )−24
100
P 25=4,945+ ∗( 5,095−4,945 )=5,02
11
120∗50
( )−56
100
P 50=5,245+ ∗( 5,395−5,245 )=5,27
26

120∗75
( )−82
100
P 75=5,395+ ∗(5,545−5,395 )=5,49
12
En caso de cambiar la escala, también se úsalos los
Deciles y los Cuartiles

n∗r
( )−F a−1
10
Dr=Li Decil + ∗(Ls−Li )
fa

n∗r
( )−F a−1
4
Qr=Li cuartil + ∗( Ls−Li)
fa

La Desviación de un dato se define como la diferencia entre el dato y la


media del conjunto de datos de donde proviene dicho dato. Es decir,
sean dados los datos x , . . . , x . Entonces, la desviación del dato x se
1 n i

define como:
Desviación (D)
Di=x i− x́
Una desviación positiva para una medida, indica que la medida está por
encima de la media, mientras que una desviación negativa nos señala
que está por debajo de la media. Una desviación 0 para un dato indica
que el dato es igual a la media.
Desviación media
n

∑ ¿ x i− x́ ∨¿
DM = i =1 ¿
n

Varianza y desviación estándar (o típica): Aunque el rango es una


medida de dispersión total y el rango intercuartil es una medida de la
dispersión de la media, ninguna de estas medidas de variación toma en
cuenta como se distribuyen o se agrupan las observaciones. Dos
medidas de uso común que si toman en cuenta la distribución de los
valores de los datos son la varianza y su raíz cuadrada, la desviación
estándar o típica. Estas medidas evalúan la manera en que fluctúan los
valores respecto a la media.
Varianza poblacional Varianza muestral
N n

∑ ( xi −μ )2 ∑ ( x i−x́ )2
σ 2= i=1 s2= i=1
N n−1
N n

∑ f i ( x i−μ )2 ∑ x i2−n x́ 2
σ 2= i=1 s2= i=1
N n−1
N n

∑ x i2 ∑ f i ( x i− x́ )2
σ 2= i=1 −μ2 s2= i=1
N n−1
N n

∑ f i xi2 ∑ f i x i2−n x́ 2
La
σ =desviación
2 i=1
N
−μ estándar (o típica) poblacional
2 2
s= i=1
n−1 de un conjunto de datos,
simbolizada por σ , muestras que la desviación muestral se simboliza por
S, y ambas se definen como la raíz cuadrada positiva de la varianza
poblacional y muestral respectivamente de los datos, Es decir,

Desviación estándar muestral


s= √ s2
Desviación estándar poblacional
σ =√ σ 2

El Coeficiente De Variación De Pearson de un conjunto de datos,


simbolizado por CV, es igual a la desviación estándar dividida entre la
media, multiplicada por 100 por ciento. Es decir,
CV = ( desviaci ó n est á ndar de losdatos
media aritm é tica de los datos )
∙ 100 %

Limites Marca de
Inferior Superior Clase fa Fa
4,795 4,945 4,87 24 24
4,945 5,095 5,02 11 35
5,095 5,245 5,17 21 56
5,245 5,395 5,32 26 82
5,395 5,545 5,47 12 94
5,545 5,695 5,62 6 100
5,695 5,845 5,77 12 112
5,845 5,995 5,92 8 120
TOTAL 120  
n

∑ f i ( x i− x́ )2 ( 4,87−5,29 )2 (24)+ ( 5,02−5,29 )2 (11)+ ( 5,17−5,29 )2 (21)+…+ ( 5,92−5,29 )2 (8)


s2= i=1 = 120−1
=0,1037
n−1

s= √ s2 =√ 0,1037=0,3221 Los datos difieren en mas o menos 0.37 con respecto a la media
CV = ( x́s ) x 100= 0,3221
5,29
x 100=6,1%
MEDIDAS DE
FORMA
Medidas de formas
Las medidas de forma se clasifican en medidas de asimetría (o
coeficiente de sesgo) y medidas de curtosis (o de apuntamiento).
Simetría: Decimos que una distribución de frecuencias es simétrica
cuando lo es su representación gráfica, es decir, los datos equidistantes
a una medida central de la misma tienen frecuencias iguales. Esta
medida central coincide con la mediana y la media.
Asimetría: Una distribución de frecuencias que no es simétrica, se
denomina asimétrica. La asimetría se puede presentar a la derecha
(asimetría positiva) o a la izquierda (asimetría negativa) si la
representación gráfica está más “estirada” hacia la derecha o hacia la
izquierda, respectivamente.
Medidas de asimetría
El coeficiente de asimetría de Pearson

¿ A p <0 distribución sesgada negativamente o a la  derecha


Ap=
x́−Moda
s {
¿ A p=0                                                    distribución simetrica 
¿ A p >0 distribuci ó n sesgada positivamente o la izquierda

Los coeficientes de asimetría de Fisher (simbolizado por g ) y de Fisher 1

¿ g <0 sesgada negativamente


estandarizado (simbolizado por g ) g=

( x 1− x́ )3∗f 1+ …+(x n − x́)3∗f n


¿ g =0∼é trica
s

gs =
1

g1
{ 1

1
¿ g1 >0 sesgada positivamente
g1 =
s 3∗n √ 6 /n
Limites Marca de
Inferior Superior Clase fa Fa
4,795 4,945 4,87 24 24
4,945 5,095 5,02 11 35
5,095 5,245 5,17 21 56
5,245 5,395 5,32 26 82
5,395 5,545 5,47 12 94
5,545 5,695 5,62 6 100
5,695 5,845 5,77 12 112
5,845 5,995 5,92 8 120
TOTAL 120  

∑ f i ( x i− x́ )3 ( 4,87−5,29 )3 (24)+ ( 5,02−5,29 )3 (11)+ ( 5,17−5,29 )3 (21)+ …+ ( 5,92−5,29 )3 (8)


g1= i=1 3
= 0,3 2213∗120
=¿
s ∗n

g1
gs = = ❑ =¿
6 6
√ √
n 120

Curtosis
El Coeficiente de Curtosis analiza el grado de concentración que
presentan los valores alrededor de la zona central de la distribución. 
Se definen 3 tipos de distribuciones según su grado de curtosis: 
• Distribución mesocúrtica: presenta un grado de concentración
medio alrededor de los valores centrales de la variable (el mismo
que presenta una distribución normal). g =0
2

• Distribución leptocúrtica: presenta un elevado grado de concen-


tración alrededor de los valores centrales de la variable. g >0
2

• Distribución platicúrtica: presenta un reducido grado de concen-


tración alrededor de los valores centrales de la variable. g <0
2
( x 1− x́ )4∗f 1 +…+(x n− x́ )4∗f n
g2 = −3 ¿ g2 <0 Planicurtica
s 4∗n
{
g2= ¿ g2=0 Mesocurtica
¿ g2 >0 Leptocurtica
Limites Marca de
Inferior Superior Clase fa Fa
4,795 4,945 4,87 24 24
4,945 5,095 5,02 11 35
5,095 5,245 5,17 21 56
5,245 5,395 5,32 26 82
5,395 5,545 5,47 12 94
5,545 5,695 5,62 6 100
5,695 5,845 5,77 12 112
5,845 5,995 5,92 8 120
TOTAL 120  

∑ f i ( x i− x́ ) 4 ( 4,87−5,29 )4 (24 )+ (5,02−5,29 )4 (11)+ ( 5,17−5,29 )4 (21)+…+ ( 5,92−5,29 )4 (8)


g2= i=1 4
= 0,3121 4∗120
=¿
s ∗n

También podría gustarte