Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Medidas de Dispersión
Rango es la diferencia entre el valor máximo y el valor mı́nimo.
X media aritmética
σ 2 varianza de la población
µ media poblacional
N número de observaciones
1
1.5. Interpretación y usos de la Desviación Estándar
Teorema 1 Teorema de Chebyshev: En cualquier conjunto de observaciones (muestra o pobla-
ción), la proporción de valores que se encuentran a k desviaciones estándares de la media es
1
de por lo menos 1 − 2 , siendo k cualquier constante mayor que 1
k
Regla empı́rica: En una distribución de frecuencias simétricas en forma de campana, apro-
ximadamente el 68 % de las observaciones se encuentran entre más y menos una desviación
estándar de la media, cerca del 95 % de las observaciones se encuentran entre más y menos dos
desviaciones estándares de la media y, de hecho el 99.7 % de las observaciones estarán entre
más y menos tres desviaciones estándares.
donde:
n número de datos
k número de clases
mi marcas de la clase i
fi frecuencia de la clase i
2
La varianza se calcula mediante la fórmula
k
2 1 X
S = fi (mi − X)2
n − 1 i=1
donde
n número de datos
k número de clases
mi marca de la clase i
fi frecuencia de la clase i
La mediana se calcula mediante la fórmula
3. Medidas de Posición
Son números que dividen a un grupo de datos ordenados, en grupos de aproximadamente
igual cantidad de datos con el propósito de resaltar su posición. Entre las más comunes son los
cuartiles, deciles y percentiles.
3.1. Cuartiles
Son números que dividen al grupo de datos en aproximadamente el 25 % de datos.
Primer Cuartil Q1 : A la izquierda de Q1 están el 25 % de los datos y a la derecha están el
75 % de los datos
3
Segundo Cuartil Q2 : Igual que la mediana, divide al grupo de datos en un 50 %
Tercer Cuartil Q3 : A la izquierda del cuatil están el 75 % de los datos y a la derecha el 25 %
de los datos ordenados.
Ejemplo: Suponer que una muestra tiene 40 datos ordenados X(1) , X(2) , . . . , X(40) . Calcular
Q1 , Q2 , Q3
Q1 : 25 % de 40=10
X(10) + X(11)
Ası́ que Q1 =
2
Q2 : 50 % de 40=20
X(20) + X(21)
Ası́ que Q2 =
2
Q3 : 75 % de 40=30
X(30) + X(31)
Ası́ que Q3 =
2
3.2. Deciles
Son números que dividen al grupo de datos ordenados en aproximadamente el 10 %
Primer Decil: A la izquierda está el 10 % de los datos y a la derecha el 90 % de los datos
aproximadamente
Segundo Decil: A la izquierda está el 20 % de los datos y a la derecha el 80 % de los datos
aproximadamente Y ası́ sucesivamente.
El Quinto Decil es la mediana.
3.3. Percentiles
Son números que dividen al grupo de datos en aproximadamente el 1 %, ası́ pues:
Primer Percentil: a la izquierda se tiene el 1 % de los datos, mientras que a la derecha el 99 %
4
de los datos ordenados. Segundo Percentil: a la izquierda se encuentra el 2 % de los datos y
a la derecha el 98 % de los datos ordenados, ası́ sucesivamente.
Actividad 1
5
Actividad 2
4. Medidas de Forma
Comparan la forma que tiene la representación gráfica, bien sea el histograma o el diagrama
de barras de la distribución, con la distribución normalpara determinar si la distribución es
simétrica o no, las medidas de forma son dos básicamente: la asimetrı́a y la curtosis
4.1. Asimetrı́a
Sesgo: Existen cuatro formas de sesgo: simétrica, con sesgo positivo, con sesgo negativo y
bimodal. Un conjunto es simétrico si la media y mediana son iguales, y los datos se dispersan
alrededor de estos valores. Se tiene un conjunto con sesgo positivo, si existe un solo pico y
los valores se extienden mucho mas allá a la derecha del pico que a la izquierda, en este caso
la media es más grande que la mediana. Se tiene un conjunto con sesgo negativo si existe un
solo pico, pero las observaciones se extienden más a la izquierda, en la dirección negativa, en
este caso la media es menor que la mediana. Una distribución bimodal tendrá mas de un pico,
por lo general éste caso es cuando los datos provienen de dos o más poblaciones.
6
4.2. Coeficiente de sesgo de Pearson
Este coeficiente se basa entre la diferencia de la media y la mediana, mediante:
3(X − X)
e
sk =
S
de acuerdo a esto el sesgo puede variar entre -3 y 3, para valores cercanos a -3 como -2.57
indica que es sesgo negativo considerable, un valor como 1.63 indica que es un sesgo positivo
moderado, un valor de 0 indica que la distribución es simétrica
4.3. Curtosis
La curtosis (también conocida como medida de apuntamiento) es una medida estadı́stica,
que determina el grado de concentración que presentan los valores de una variable alrededor de
la zona central de la distribución de frecuencias.
Se distinguen tres tipos de curtosis:
1. Mesocúrtica
2. Leptocúrtica
3. Platicúrtica
Mesocúrtica Esta nos indica que existe una concentración normal de los valores en torno a
su media
7
Leptocúrtica Indica que existe una gran concentración de los valores en torno a su media
Platicúrtica Indica que existe una baja concentración de los valores en torno a su media