Está en la página 1de 18

Estadstica descriptiva:

Describe, analiza y representa un grupo de datos


utilizando mtodos numricos y grficos que
resumen y presentan la informacin contenida en
ellos.
Base de datos SPSS, CASEN 2015
Otras bases de datos
Tabla 1: Condicin de actividad segn zona de residencia regin de La Araucana 2015
Condicin de actividad Total
Zona Ocupados % Desocupados % Nro %
Urbano 265.414 24.155
Rural 106.486 6.954
Total
Fuente: elaboracin propia en base a Casen 2015
Cuando se dispone de un grupo de datos
organizados en una distribucin de
frecuencias o una serie de observaciones no
elaboradas y dispersas, muchas veces es
interesante describirlos mediante una o dos
figuras sintticas. En este sentido pueden
examinarse varias caractersticas siendo las
ms comunes:
1) Posicin (tendencia central)
2) De dispersin o variacin.
3) De forma: simetra y de apuntamiento.
D1 D2

D3
Frecuencia

D4

Variable
Describen un conjunto de datos en funcin a medidas de
centralidad, dispersin y/o posicin relativa entre otras cosas.

I. En variables Cualitativas:
Moda y Mediana

II. En variables Cuantitativas:


Medidas de Posicin (Tendencia Central)
1. Moda (Mo): Categoras de la variable que presenta la
mayor frecuencia
__
2. Media o Promedio aritmtico (X ) :
3. Mediana (Md)
Promedio (mean) ( X )
Promedio: Se define como
n aquel valor que es promedio

__ x i
x1 x2 ... xn
o centro de gravedad de
todos los valores de la
X i 1
distribucin de datos
n n

Obs: Este estadgrafo no es una buena medida de tendencia


central si la distribucin de datos presenta una marcada
asimetra con valores fuera de lo comn.
Mediana (Md): Es aquel valor de la variable que deja a su
derecha y a su izquierda exactamente el mismo nmero de
observaciones (los datos deben estar ordenados)

Modo de clculo: Sea x (i) la observacin que ocupa la posicin i-


sima en la serie de n datos ordenados. x (1) x (2) x (3)
x (n)
n impar: Md x n 1

2

x n x n
n par: 1
2 2
Md
2
Ejemplo: Distribucin de 10 personas segn edad
18 18 20 20 21 21 19 19 20 21

x 19.7 Md=20 Mo=20 y 21

tab edad
edad | Freq. Percent Cum.
------------+-----------------------------------
18 | 2 20.00 20.00
19 | 2 20.00 40.00
20 | 3 30.00 70.00
21 | 3 30.00 100.00
------------+-----------------------------------
Total | 10 100.00
Percentiles, Deciles y cuartiles

Percentiles (Pp): Son valores de la variable que dividen la distribucin en


100 partes iguales, c/u de ellas conteniendo el 1% de las observaciones.
(p=1, 2, ...,99).

Deciles (Dd): Son valores de la variable que dividen la distribucin en


10 partes iguales, c/u de ellas conteniendo el 10% de las observaciones.
(d=1, 2, ...,9).

Cuartiles (Cc): Son valores de la variable que dividen la distribucin en


4 partes iguales, c/u de ellas conteniendo el 25% de las observaciones.
(c=1, 2 y 3).
Nos muestran que tan dispersos o variables estn los datos alrededor de
una medida de posicin.

1. Rango o Recorrido (Re) = Max - Min

2. Rango Intercuartlico (RI) = P75 P25

Se utiliza para conocer entre que valores o en que longitud se


distribuye el 50% central de las observaciones
2
n

xi
Obs: La unidad de
i 1
n n

( xi x ) 2
xi
2

n
medida est al
cuadrado
S
2 i 1
i 1
n 1 n 1

Desviacin estndar (S) : Medida de variabilidad ms usada, cuya


unidad de medida es la misma de la variable.

S S 2

V min X V max
Coeficiente de variacin (CV): Se utiliza para comparar la variabilidad de
dos o ms distribuciones de datos.

Entre menor sea el CV menor es la variabilidad relativa.

S
CV
X
Ej. Distribucin de la edad segn sexo

Sexo Obs Mean SD Min Max %CV


Mujer 160 55.7 20.352 16 91 36.54
Hombre 40 65.125 16.649 19 92 25.56
Total 200 57.6 19.99 16 92 -
Estadgrafos de Simetra (Skewness): a3
La simetra estadstica se deduce comparando la distribucin con la
forma de la curva normal que corresponde a una distribucin
simtrica. En general, toda distribucin que tiene que el
promedio=mediana=moda, se dice que es simtrica, en otro caso
ser asimtrica.
El coeficiente de asimetra de Karl Pearson, se basa en las relaciones que
existen entre la Media aritmtica, la Moda y la Mediana. Como
consecuencia una distribucin es asimtrica si la media se aleja de la
moda. Entre ellas tenemos:

AS1
xM 0
AS 2

3 xMd
s s
Observacin: Si la distribucin es
moderadamente asimtrica se tiene M 0 x 3 x Md
la siguiente relacin
De acuerdo al valor de a3 , se tiene:

1. Si a3 >0 . Tiene asimetra positiva. La distribucin extiende la


cola hacia los valores grandes de la variable

2. Si a3 <0. Tiene asimetra negativa. La distribucin extienda la


cola hacia los valores pequeos de la variable.

3. Si a3 = 0. La distribucin es simtrica
Estadgrafo de Apuntamiento (Kurtosis), a4
Entendemos como Kurtosis al grado de apuntamiento de una
distribucin. La Kurtosis se analiza comparando la distribucin
con la forma de la curva normal.
Un estadgrafo para medir Kurtosis es:

x x n
k
4


i i
m4 2 2
a4 4 3 donde S S y
4
m4 i1 3
S n

que se llama el cuarto momento respecto a la media


De acuerdo al valor de a4, se tiene:

1. Si a4 =3 La distribucin es Mesokrtica (Normal)

2. Si a4 >3 La distribucin es Leptukrtica (Apuntada)

3. Si a4 <3 La distribucin es Platikrtica (Achatada).

También podría gustarte