Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TENDENCIA
CENTRAL
MODA
El dato u observación con mayor frecuencia, es decir el
dato que mas se repite. Puede existe mas de una moda
en esos casos sí: Existen 2 modas (Bimodal), 3 modas
(Trimodal), cuatro o más (Polimodal).
26−21
Mo=5,245+ ∗(5,395−5,245 )=5,28
2 ( 26 )−21−12
MEDIANA
El dato u observación que divide al conjunto de datos en
un 50/50, es decir es la observación 50%.
2 n/ 2 n2 +1
=13
, si n es par
)
Mediana en el caso Continuo:
n
( )−Fa −1
2
Me=Li mediano + ∗( Ls−Li )
fa
MEDIA ARITMÉTICA
El resultado de sumar todas las observaciones y dividir el
resultado entre el total de ellas.
Media aritmética caso discreto:
Media de la población Media de la muestra
N
n
∑ xi ∑ xi
μ= i=1 x́= i=1
N n
N
n
∑ f i xi ∑ f i xi
μ= i=1 x́= i=1
N n
Media aritmética caso continua: Se aplican las mismas
formulas, pero en vez de usar las cada una de las
observaciones se usa la marca de clase como referente y
se multiplicada cada una por la frecuencia absoluta
individual.
Limites Marca de
Inferior Superior Clase fa Fa
4,795 4,945 4,87 24 24
4,945 5,095 5,02 11 35
5,095 5,245 5,17 21 56
5,245 5,395 5,32 26 82
5,395 5,545 5,47 12 94
5,545 5,695 5,62 6 100
5,695 5,845 5,77 12 112
5,845 5,995 5,92 8 120
TOTAL 120
( 4,87∗24 )+ ( 5,02∗11 ) + ( 5,17∗21 ) + ( 5,32∗26 )+ ( 5,47∗12 ) + ( 5,62∗6 ) + ( 5,77∗12 )+(5,92∗8)
x́= =5.29
120
x́=5,29
Me=5,27
Mo=5,28
MEDIAS DE
DISPERSIÓN
Una medida de centralización casi nunca es suficiente por si sola, para
analizar adecuadamente las características de un conjunto de datos. Por
lo general, necesitaremos, además, una medida de la dispersión o
variación de los datos, entre las que analizaremos se encuentran el
rango o recorrido, el rango intercuartil, la desviación, la varianza y la
desviación estándar.
El rango o recorrido de un conjunto de datos se define como la
diferencia entre el dato más alto y el más bajo. Su ventaja es que es fácil
de calcular. Su desventaja es que considera solo dos de la gran cantidad
de datos que hay en un conjunto (de datos), ignorando así el resto de los
datos.
El rango intercuartílico El rango intercuartil, simbolizado por R.I, es la
diferencia entre el tercer y el primer cuartil. Es decir, R.I = Q3 − Q1.
Percentiles o Cuantiles: Es aquel valor que deja a su izquierda el r% y a
su derecha 100-r% restante.
n∗r
En el caso discreto: P = 100 r
n∗r
En el caso continuo: buscamos primero la posición del percentil con 100
n∗r
( )−F a−1
100
Pr=Li percentil+ ∗( Ls−Li)
fa
Limites Marca de
Inferior Superior Clase fa Fa
4,795 4,945 4,87 24 24
4,945 5,095 5,02 11 35
5,095 5,245 5,17 21 56
5,245 5,395 5,32 26 82
5,395 5,545 5,47 12 94
5,545 5,695 5,62 6 100
5,695 5,845 5,77 12 112
5,845 5,995 5,92 8 120
TOTAL 120
120∗75
( )−82
100
P 75=5,395+ ∗(5,545−5,395 )=5,49
12
En caso de cambiar la escala, también se úsalos los
Deciles y los Cuartiles
n∗r
( )−F a−1
10
Dr=Li Decil + ∗(Ls−Li )
fa
n∗r
( )−F a−1
4
Qr=Li cuartil + ∗( Ls−Li)
fa
define como:
Desviación (D)
Di=x i− x́
Una desviación positiva para una medida, indica que la medida está por
encima de la media, mientras que una desviación negativa nos señala
que está por debajo de la media. Una desviación 0 para un dato indica
que el dato es igual a la media.
Desviación media
n
∑ ¿ x i− x́ ∨¿
DM = i =1 ¿
n
∑ ( xi −μ )2 ∑ ( x i−x́ )2
σ 2= i=1 s2= i=1
N n−1
N n
∑ f i ( x i−μ )2 ∑ x i2−n x́ 2
σ 2= i=1 s2= i=1
N n−1
N n
∑ x i2 ∑ f i ( x i− x́ )2
σ 2= i=1 −μ2 s2= i=1
N n−1
N n
∑ f i xi2 ∑ f i x i2−n x́ 2
La
σ =desviación
2 i=1
N
−μ estándar (o típica) poblacional
2 2
s= i=1
n−1 de un conjunto de datos,
simbolizada por σ , muestras que la desviación muestral se simboliza por
S, y ambas se definen como la raíz cuadrada positiva de la varianza
poblacional y muestral respectivamente de los datos, Es decir,
Limites Marca de
Inferior Superior Clase fa Fa
4,795 4,945 4,87 24 24
4,945 5,095 5,02 11 35
5,095 5,245 5,17 21 56
5,245 5,395 5,32 26 82
5,395 5,545 5,47 12 94
5,545 5,695 5,62 6 100
5,695 5,845 5,77 12 112
5,845 5,995 5,92 8 120
TOTAL 120
n
s= √ s2 =√ 0,1037=0,3221 Los datos difieren en mas o menos 0.37 con respecto a la media
CV = ( x́s ) x 100= 0,3221
5,29
x 100=6,1%
MEDIDAS DE
FORMA
Medidas de formas
Las medidas de forma se clasifican en medidas de asimetría (o
coeficiente de sesgo) y medidas de curtosis (o de apuntamiento).
Simetría: Decimos que una distribución de frecuencias es simétrica
cuando lo es su representación gráfica, es decir, los datos equidistantes
a una medida central de la misma tienen frecuencias iguales. Esta
medida central coincide con la mediana y la media.
Asimetría: Una distribución de frecuencias que no es simétrica, se
denomina asimétrica. La asimetría se puede presentar a la derecha
(asimetría positiva) o a la izquierda (asimetría negativa) si la
representación gráfica está más “estirada” hacia la derecha o hacia la
izquierda, respectivamente.
Medidas de asimetría
El coeficiente de asimetría de Pearson
gs =
1
g1
{ 1
1
¿ g1 >0 sesgada positivamente
g1 =
s 3∗n √ 6 /n
Limites Marca de
Inferior Superior Clase fa Fa
4,795 4,945 4,87 24 24
4,945 5,095 5,02 11 35
5,095 5,245 5,17 21 56
5,245 5,395 5,32 26 82
5,395 5,545 5,47 12 94
5,545 5,695 5,62 6 100
5,695 5,845 5,77 12 112
5,845 5,995 5,92 8 120
TOTAL 120
g1
gs = = ❑ =¿
6 6
√ √
n 120
Curtosis
El Coeficiente de Curtosis analiza el grado de concentración que
presentan los valores alrededor de la zona central de la distribución.
Se definen 3 tipos de distribuciones según su grado de curtosis:
• Distribución mesocúrtica: presenta un grado de concentración
medio alrededor de los valores centrales de la variable (el mismo
que presenta una distribución normal). g =0
2