Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADiSTICA DESCRIPTIVA
ESTADiSTICA DESCRIPTIVA
x
x 1 x 2 ... x n i 1
i
X
n n
• Característica de la Media
• Es intuitiva y fácil de calcular.
• Su valor puede que no coincida con ninguno de los
valores de la muestra
• La suma de las diferencias de cada valor de la muestra
con la media su resultado es cero, es decir,
n
(x x) 0
i 1
i
• La mediana se suele definir como el valor
“más intermedio” una vez que los datos
han sido ordenados en forma creciente.
Se suele denotar por Me. La forma más
general de calcular la mediana es la
siguiente:
x n 1 2 si n es impar
Me x
n 2 x ( n 2) 1
si n es par
2
• La mediana es aquel valor que deja el
cincuenta por ciento de los datos por
debajo y otro cincuenta por encima.
• Cabe destacar que es preferible el uso de
la mediana como medida descriptiva del
centro cuando se quiere reducir o eliminar
el efecto de valores extremos en un
conjunto de datos (muy grandes o muy
pequeños).
• Moda:
• Es una medida de tendencia central que
se puede utilizar sea cual sea el tipo de
variable a estudiar. La moda de un
conjunto de observaciones es el valor que
más se repite, aquel cuya frecuencia
absoluta es máxima. Puede ser única, que
haya más de una, o que no exista.
• Media Geométrica:
• Se define como la raíz n-ésima del producto
de todos los valores numéricos, es decir,
• n
X G x1.x2 ....xn n ( xi )
n
i 1
• La media armónica:
• Se define como el número de
observaciones de la muestra dividido por la
suma del inverso de cada una de las
observaciones, es decir,
n
XA n
(1 / x )
i 1
i
• La localización o tendencia central de un
conjunto de datos no necesariamente
proporciona información suficiente para
describirlos adecuadamente. Debido a que no
todos los valores son semejantes, la variación
entre ellos se considera importante. Se puede
decir que un conjunto de datos tiene una
dispersión reducida si los mismos se aglomeran
estrechamente en torno a alguna medida de
localización de interés y se dice que tiene una
dispersión grande si se esparcen ampliamente
alrededor de alguna medida de localización de
interés.
• Las medidas descriptivas más comunes
de dispersión son: el rango, la varianza,
la desviación estándar y el rango
intercuartílico.
• El rango de la muestra es la medida de
variabilidad más sencilla entre todas las
mencionadas; y se define como la diferencia
entre la observación más grande y la más
pequeña : r xmax xmin
• Aunque es una medida muy fácil de
calcular, ignora toda la información de la
muestra entre las observaciones más
grande y más pequeña. Sin embargo, vale
la pena resaltar que el rango se utiliza
mucho en aplicaciones estadísticas al
control de calidad, donde lo común es
emplear muestras con tamaños n = 4 o
• n = 5 ya que en estos casos la pérdida de
información no se considera relevante.
• En general, se desea una medida de
variabilidad que dependa de todas las
observaciones y no sólo de unas pocas;
así que parece razonable medir la
variación en términos de las desviaciones
relativas a alguna medida de localización
(generalmente esta medida es la media)
Para el conjunto de datos x1, x2,….,xn
Las diferencias ( x1 x ), ( x2 x ),....., ( xn x )
Determinan las desviaciones de la media.
Dado que la suma de estas desviaciones es
cero, se utiliza como medida de variabilidad
el promedio de los cuadrados de tales
desviaciones.
n
(x x)
i
2
s
2 i 1
n
Sin embargo, como sólo hay n-1
desviaciones independiente se
conviene en dividir entre n-1, es
decir,
n
(x i x) 2
S 2
i 1
n 1