Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADiSTICA DESCRIPTIVA
ESTADiSTICA DESCRIPTIVA
x
x 1 x 2 ... x n i 1
i
X
n n
Caracterstica de la Media
Es intuitiva y fcil de calcular.
Su valor puede que no coincida con ninguno de los
valores de la muestra
La suma de las diferencias de cada valor de la muestra
con la media su resultado es cero, es decir,
n
(x x) 0
i 1
i
La mediana se suele definir como el valor
ms intermedio una vez que los datos
han sido ordenados en forma creciente.
Se suele denotar por Me. La forma ms
general de calcular la mediana es la
siguiente:
x n 1 2 si n es impar
Me x
n 2 x ( n 2) 1
si n es par
2
La mediana es aquel valor que deja el
cincuenta por ciento de los datos por
debajo y otro cincuenta por encima.
Cabe destacar que es preferible el uso de
la mediana como medida descriptiva del
centro cuando se quiere reducir o eliminar
el efecto de valores extremos en un
conjunto de datos (muy grandes o muy
pequeos).
Moda:
Es una medida de tendencia central que
se puede utilizar sea cual sea el tipo de
variable a estudiar. La moda de un
conjunto de observaciones es el valor que
ms se repite, aquel cuya frecuencia
absoluta es mxima. Puede ser nica,
que haya ms de una, o que no exista.
Media Geomtrica:
Se define como la raz n-sima del producto
de todos los valores numricos, es decir,
n
X G n x1.x2 ....xn n ( xi )
i 1
La media armnica:
Se define como el nmero de
observaciones de la muestra dividido por la
suma del inverso de cada una de las
observaciones, es decir,
n
XA n
(1 / x )
i 1
i
La localizacin o tendencia central de un
conjunto de datos no necesariamente
proporciona informacin suficiente para
describirlos adecuadamente. Debido a que no
todos los valores son semejantes, la variacin
entre ellos se considera importante. Se puede
decir que un conjunto de datos tiene una
dispersin reducida si los mismos se aglomeran
estrechamente en torno a alguna medida de
localizacin de inters y se dice que tiene una
dispersin grande si se esparcen ampliamente
alrededor de alguna medida de localizacin de
inters.
Las medidas descriptivas ms comunes
de dispersin son: el rango, la varianza,
la desviacin estndar y el rango
intercuartlico.
El rango de la muestra es la medida de
variabilidad ms sencilla entre todas las
mencionadas; y se define como la diferencia
entre la observacin ms grande y la ms
pequea : r xmax xmin
Aunque es una medida muy fcil de
calcular, ignora toda la informacin de la
muestra entre las observaciones ms
grande y ms pequea. Sin embargo, vale
la pena resaltar que el rango se utiliza
mucho en aplicaciones estadsticas al
control de calidad, donde lo comn es
emplear muestras con tamaos n = 4 o
n = 5 ya que en estos casos la prdida de
informacin no se considera relevante.
En general, se desea una medida de
variabilidad que dependa de todas las
observaciones y no slo de unas pocas;
as que parece razonable medir la
variacin en trminos de las desviaciones
relativas a alguna medida de localizacin
(generalmente esta medida es la media)
Para el conjunto de datos x1, x2,.,xn
Las diferencias ( x1 x ), ( x2 x ),....., ( xn x )
Determinan las desviaciones de la media.
Dado que la suma de estas desviaciones es
cero, se utiliza como medida de variabilidad
el promedio de los cuadrados de tales
desviaciones.
n
(x x)
i
2
s
2 i 1
n
Sin embargo, como slo hay n-1
desviaciones independiente se
conviene en dividir entre n-1, es
decir,
n
(x i x) 2
S 2
i 1
n 1