Está en la página 1de 6

INTRODUCCIN DESCRIPTIVAS

LA

ESTADSTICA.

MEDIDAS

DE

RESUMEN

Despus de recopilar y resumir los datos, las medidas de resumen descriptivas son tiles para describir, analizar e interpretar datos cuantitativos. Un conjunto de datos pertenecientes a una variable aleatoria numrica, posee tres propiedades que lo describen: la posicin, la variabilidad y la forma. Se utilizan una gran variedad de medidas descriptivas (estadsticos) para resumir las caractersticas salientes de un conjunto de datos: Media Aritmtica Media Aritmtica Ponderada Mediana Moda Cuartiles Deciles Percentiles

Medidas de Posicin Central Medidas de Posicin Medidas de Posicin No Central

Medidas de Dispersin o Variabilidad

Rango Rango Modificado Varianza Desviacin Estndar Coeficiente de Variacin

Asimetra Medidas de Forma Apuntamiento o Kurtosis

Coeficientes de Asimetra Coeficientes de Kurtosis

MEDIDAS DE POSICIN CENTRAL La posicin o tendencia central es la caracterstica ms importante que describe o resume un conjunto de datos, es el punto alrededor del cual se agrupan la mayora de los datos de la distribucin. La Media ( ) La media o promedio formaliza el concepto de punto de equilibrio o centro de gravedad de las observaciones. Es un valor representativo de los datos. Como por ejemplo

Elaborado por la Profesora: Mariela Flores 4

la nota promedio obtenida por un grupo de estudiantes, el nmero de hijos promedio por familia en un pas. Dado un conjunto de n valores x1, x2, x3,xn, la media se representa mediante y se obtiene dividiendo la suma de todos los valores entre la cantidad de valores, es decir,
i n

+ + + 1 2 3 n

+ n

i =1

Ejemplo: Se tienen datos sobre el tiempo de arranque de un motor en segundos: 1.75; 1.92; 2.62; 2.35; 3.09; 3.15; 2.53; 1.91. Calcular la media.
= 1.75 + 1.92 + 2.62 + 2.35 + 3.09 + 3.15 + 2.53 + 1.91 19 .32 = = 2.42 segundos 8 8

MEDIDAS DE VARIABILIDAD La variabilidad o dispersin es la segunda caracterstica ms importante que describe un conjunto de datos, miden la cantidad de variacin o diseminacin de los datos. Dos conjuntos de datos pueden diferir tanto en tendencia central como en dispersin, o bien pueden tener la misma tendencia central y diferir en la variabilidad. El Rango (R) Para un conjunto de datos el recorrido o rango es la diferencia entre el dato mayor y el dato menor de dicho grupo de datos.
R = M - X m

Siendo XM = Dato mayor Xm = Dato menor

Elaborado por la Profesora: Mariela Flores 5

Una de las desventajas del rango es que no proporciona informacin sobre los datos que estn entre el dato mayor y el menor. Ejemplo: Calcular el rango para los datos de tiempo de arranque del motor.
R = 3 .1 5 1.7 = 1.4s g n o 5 euds

La Varianza (S2) y la Desviacin Estndar (S) Estas son las medidas de dispersin ms utilizadas y toman en cuenta como estn distribuidos los datos. La varianza (S2) de un conjunto de datos se define como el promedio del cuadrado de las diferencias entre cada dato individual con respecto a la media de stos.
i n

S2 =

i =1

)2

Siendo Xi = los datos individuales i = 1, 2, 3,..n = media de los datos n = nmero total de datos Las unidades en que viene expresada la varianza son el cuadrado de las unidades de la variable que se est estudiando, resultando difcil de interpretar. Por esta razn se prefiere trabajar con la Desviacin Estndar, que es la raz positiva de la Varianza y se expresa en las mismas unidades de la variable que se est estudiando.
S= + S2

La Varianza y la Desviacin Estndar miden la dispersin promedio en torno a la media, es decir, como fluctan los datos por encima o por debajo de la media. Mientras mayor sea la extensin de los datos mayor ser el Rango, la Varianza y la Desviacin Estndar. Ejemplo: Calcular la Varianza y la Desviacin Estndar para los datos de tiempo de arranque del motor. Se tiene que para los datos de arranque del motor
= 2.4 s gno 2 e uds

n=8
i

( i

)2

Elaborado por la Profesora: Mariela Flores 6

1.75 1.92 2.62 2.35 3.09 3.15 2.53 1.91

(1.75-2.42)2= 0.45 0.25 0.04 0.0049 0.45 0.53 0.01 0.26 = 2

S2 =

i =1

i n

)2
=

2 = 0.29 segundos 2 7

S= +

0 .2 9

= 0.5 s gno 3 e uds

MEDIDAS DE ASIMETRA (SESGO) El sesgo se define como el grado de asimetra de una distribucin con respecto a su media. Se dice que la distribucin es asimtrica positiva cuando tiene una cola ms larga a la derecha del mximo central que a la izquierda, si es al contrario se dice que tiene una asimetra negativa. Coeficiente de Asimetra (a3): puede estimarse a partir de un conjunto de n observaciones, usando la siguiente ecuacin:

(X
n i =1

X)

a3 =

n S3

Siendo: n = nmero total de observaciones = media de los datos

S=

(
i =1

i )

Elaborado por la Profesora: Mariela Flores 7

Para distribuciones simtricas a3 = 0, para distribuciones asimtricas positivas a3 > 0 y para distribuciones asimtricas negativas a3 < 0.

Asimtrica positiva a3 > 0

Simtrica a3 = 0

Asimtrica negativa a3 < 0

MEDIDAS DE APUNTAMIENTO (KURTOSIS) La kurtosis se refiere al grado de apuntamiento de una distribucin tomando como referencia la distribucin normal. Si el apuntamiento es relativamente alto se dice que la distribucin es leptokrtica, mientras que si el apuntamiento es relativamente bajo se dice que es platikurtica. La distribucin normal es denominada mesokrtica. Coeficiente de Kurtosis (a4): puede estimarse a partir de un conjunto de n observaciones, usando la siguiente ecuacin:

( X
n i =1

i X)

a3 =

n S4

Siendo: n = nmero total de observaciones = media de los datos

S=

(
i =1

Elaborado por la Profesora: Mariela Flores 8

Para distribuciones mesokurticas a4 = 0, para distribuciones leptokurticas a3 > 0 y para distribuciones platikurticas a3 < 0.

Leptokurticas a4 > 0

Mesokurticas a4 = 0

Platikurticas a4 < 0

Elaborado por la Profesora: Mariela Flores 9

También podría gustarte