Está en la página 1de 8

1.

Medidas de Dispersión
Rango es la diferencia entre el valor máximo y el valor mı́nimo.

Rango = valormax − valormin

1.1. Desviación media


P Media aritmética de los valores absolutos de las desviaciones con respecto a la media DM =
|X − X|
donde:
n
X valor de cada observación

X media aritmética

n número de observaciones en la muestra

1.2. Varianza y Desviación Estándar


Varianza: Media aritmética de las desviaciones elevadas al cuadrado
Desviación Estándar: Raı́z cuadrada de la varianza

1.3. Varianza de la Población


Se define como: Pn
2 i=1 (Xi − µ)2
σ =
N
donde:

σ 2 varianza de la población

X es el valor de una observación de la población

µ media poblacional

N número de observaciones

1.4. Varianza Muestral


Esta medida se base en la cuantificación de la distancia de los datos con respecto a la media.
Pn
2 (xi − x)2
S = i=1 Fórmula para el cálculo de la varianza
n−1
2
n ni=1 x2i − ( ni=1 xi )
P P
2
S = Fórmula alterna para la varianza
n(n − 1)

El motivo que en el denominador sea n − 1 en lugar de n se justifica en la estadı́stica inferencial.


Se llama Desviación Estándar Muestral a la raı́z cuadrada positiva de la varianza, se expresa
en las mismas unidades de los datos. √
S = + S2

1
1.5. Interpretación y usos de la Desviación Estándar
Teorema 1 Teorema de Chebyshev: En cualquier conjunto de observaciones (muestra o pobla-
ción), la proporción de valores que se encuentran a k desviaciones estándares de la media es
1
de por lo menos 1 − 2 , siendo k cualquier constante mayor que 1
k
Regla empı́rica: En una distribución de frecuencias simétricas en forma de campana, apro-
ximadamente el 68 % de las observaciones se encuentran entre más y menos una desviación
estándar de la media, cerca del 95 % de las observaciones se encuentran entre más y menos dos
desviaciones estándares de la media y, de hecho el 99.7 % de las observaciones estarán entre
más y menos tres desviaciones estándares.

2. Medidas Descriptivas para datos agrupados


Si se dispone de una tabla de frecuencias, se pueden usar sus valores para calcular aproxi-
madamente la media y la desviación de una muestra.

2.1. Media, Varianza, Mediana y Moda para datos agrupados


La media se calcula mediante la fórmula
k
1X
X= mi fi
n i=1

donde:

n número de datos

k número de clases

mi marcas de la clase i

fi frecuencia de la clase i

2
La varianza se calcula mediante la fórmula
k
2 1 X
S = fi (mi − X)2
n − 1 i=1

donde
n número de datos

k número de clases

mi marca de la clase i

fi frecuencia de la clase i
La mediana se calcula mediante la fórmula

La moda se calcula mediante la fórmula

3. Medidas de Posición
Son números que dividen a un grupo de datos ordenados, en grupos de aproximadamente
igual cantidad de datos con el propósito de resaltar su posición. Entre las más comunes son los
cuartiles, deciles y percentiles.

3.1. Cuartiles
Son números que dividen al grupo de datos en aproximadamente el 25 % de datos.
Primer Cuartil Q1 : A la izquierda de Q1 están el 25 % de los datos y a la derecha están el
75 % de los datos

3
Segundo Cuartil Q2 : Igual que la mediana, divide al grupo de datos en un 50 %
Tercer Cuartil Q3 : A la izquierda del cuatil están el 75 % de los datos y a la derecha el 25 %
de los datos ordenados.

Ejemplo: Suponer que una muestra tiene 40 datos ordenados X(1) , X(2) , . . . , X(40) . Calcular
Q1 , Q2 , Q3

Q1 : 25 % de 40=10
 
X(10) + X(11)
Ası́ que Q1 =
2

Q2 : 50 % de 40=20

X(20) + X(21)
Ası́ que Q2 =
2

Q3 : 75 % de 40=30

X(30) + X(31)
Ası́ que Q3 =
2

3.2. Deciles
Son números que dividen al grupo de datos ordenados en aproximadamente el 10 %
Primer Decil: A la izquierda está el 10 % de los datos y a la derecha el 90 % de los datos
aproximadamente
Segundo Decil: A la izquierda está el 20 % de los datos y a la derecha el 80 % de los datos
aproximadamente Y ası́ sucesivamente.
El Quinto Decil es la mediana.

3.3. Percentiles
Son números que dividen al grupo de datos en aproximadamente el 1 %, ası́ pues:
Primer Percentil: a la izquierda se tiene el 1 % de los datos, mientras que a la derecha el 99 %

4
de los datos ordenados. Segundo Percentil: a la izquierda se encuentra el 2 % de los datos y
a la derecha el 98 % de los datos ordenados, ası́ sucesivamente.

3.4. Cuartiles para datos agrupados


Los cuartiles para datos agrupados se tiene

3.5. Coeficiente de Variación


Es un número adimensional que representa cuan dispersos están los datos respecto a la
media, se puede expresar en porcentaje, se calcula mediante:
S
V =
X

Actividad 1

5
Actividad 2

4. Medidas de Forma
Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama
de barras de la distribución, con la distribución normalpara determinar si la distribución es
simétrica o no, las medidas de forma son dos básicamente: la asimetrı́a y la curtosis

4.1. Asimetrı́a
Sesgo: Existen cuatro formas de sesgo: simétrica, con sesgo positivo, con sesgo negativo y
bimodal. Un conjunto es simétrico si la media y mediana son iguales, y los datos se dispersan
alrededor de estos valores. Se tiene un conjunto con sesgo positivo, si existe un solo pico y
los valores se extienden mucho mas allá a la derecha del pico que a la izquierda, en este caso
la media es más grande que la mediana. Se tiene un conjunto con sesgo negativo si existe un
solo pico, pero las observaciones se extienden más a la izquierda, en la dirección negativa, en
este caso la media es menor que la mediana. Una distribución bimodal tendrá mas de un pico,
por lo general éste caso es cuando los datos provienen de dos o más poblaciones.

6
4.2. Coeficiente de sesgo de Pearson
Este coeficiente se basa entre la diferencia de la media y la mediana, mediante:

3(X − X)
e
sk =
S
de acuerdo a esto el sesgo puede variar entre -3 y 3, para valores cercanos a -3 como -2.57
indica que es sesgo negativo considerable, un valor como 1.63 indica que es un sesgo positivo
moderado, un valor de 0 indica que la distribución es simétrica

4.3. Curtosis
La curtosis (también conocida como medida de apuntamiento) es una medida estadı́stica,
que determina el grado de concentración que presentan los valores de una variable alrededor de
la zona central de la distribución de frecuencias.
Se distinguen tres tipos de curtosis:

1. Mesocúrtica

2. Leptocúrtica

3. Platicúrtica

Medición de la curtosis La curtosis se mide promediando la cuarta potencia de la diferencia


entre cada elemento del conjunto y la media, dividido entre la desviación tı́pica elevado también
a la cuarta potencia. Sea el conjunto X = (x1 , x2 , . . . , xN ), entonces el coeficiente de curtosis
será: PN
(xi − x)4
Curtosis = i=1 −3 Para datos no agrupados
N · Sx4
y si se tiene datos agrupados:
PN
− x)4 · ni
i=1 (xi
Curtosis = −3 Datos agrupados
N · Sx4

Mesocúrtica Esta nos indica que existe una concentración normal de los valores en torno a
su media

7
Leptocúrtica Indica que existe una gran concentración de los valores en torno a su media

Platicúrtica Indica que existe una baja concentración de los valores en torno a su media

También podría gustarte