Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tipos de estadsticos
Posicin
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Entre ellos cabe destacar: Cuantiles, percentiles, cuartiles, deciles,...
Centralizacin
Indican valores con respecto a los que los datos parecen agruparse.
Entre ellos cabe destacar: Media, mediana y moda
Dispersin
Indican la mayor o menor concentracin de los datos con respecto a
las medidas de centralizacin.
Entre ellos : Desviacin tpica, coeficiente de variacin, rango, varianza
Forma
Dan una idea de cmo se distribuyen los datos
Entre ellos: Asimetra, Apuntamiento o curtosis
Estadsticos de posicin
Se define el cuantil de orden a como un valor de la variable por
debajo del cual se encuentra una frecuencia acumulada a.
Casos particulares son los percentiles, cuartiles, deciles, quintiles,...
Percentiles y cuantiles
Percentil de orden k = cuantil de orden k/100
.
La mediana se corresponde con el percentil 50
El percentil de orden 15 deja por debajo al 15% de las observaciones.
Por encima queda el 85%
Ejemplos
El 5% de los recin nacidos tiene un peso demasiado bajo. Qu
peso se considera demasiado bajo?
Percentil 5 o cuantil 0,05
25
50
75
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Total
Porcentaje
,3
,3
,4
,8
1,7
4,5
3,7
4,8
5,6
30,6
8,6
11,6
4,8
12,9
2,9
3,0
1,5
2,0
100,0
80
70
50
40
Estadsticos
90
60
60,00
70,00
80,00
Ejemplos
100
Porcentaje
acumulado
,3
,7
1,1
1,9
3,5
8,0
11,7
16,6
22,2
52,8
61,4
73,0
77,9
90,7
93,6
96,6
98,0
100,0
20%?
90%?
Medidas de centralizacin
Media (Mean) Es la media aritmtica (promedio) de los valores
de una variable. Suma de los valores dividido por el tamao
muestral.
La media es un promedio aritmtico: de 2,2,3,7 es (2+2+3+7)/4=3,5
Las formulas
Media (Para datos sin agrupar: x1, x2, ..., xn )
x=
x
i
n
Media (Para agrupados u organizados en tablas)
Variable
fr.
fr. ac.
L0 L1
x1
n1
N1
L1 L2
x2
n2
N2
xk
nk
Nk
...
Lk-1 Lk
x=
xn = N
i
i i
Altura mediana
40 50
45
50 60
55
10
15
60 70
65
21
36
70 - 80
75
11
47
80 - 90
85
52
90 - 100
95
55
100 130
115
58
Peso
Total
Marca
58
C = Li 1 +
Peso
n N i 1
ni
Marca
0,5 58 Ni 1
( Li Li 1 )
ni
)
0,5 58 15
(70 60) = 66,6
= 60 +
21
( Li Li 1 ) Mediana = C0,5 = Li 1 +
40 50
45
50 60
55
10
15
60 70
65
21
36
70 - 80
75
11
47
80 - 90
85
52
90 - 100
95
55
100 130
115
58
58
C0,5 = 60 +
)
0,5 58 15
(70 60) = 66,6
21
Variabilidad o Dispersin
La variabilidad de en los valores de un cualquier atributo que
evaluemos est presente siempre en la naturaleza y en cualquier
fenmeno social, su origen en ciencias sociales, es siempre mltiple.
EJEMPLO: Los estudiantes de Sociologa reciben diferentes
calificaciones en la asignatura (variabilidad). A qu puede deberse?
Diferencias individuales en el conocimiento de la materia.
Podra haber otras razones (fuentes de variabilidad)? . Supongamos
que todos los alumnos poseen el mismo nivel de conocimiento. Las
notas seran las mismas en todos? Seguramente No.
Dormir poco el da del examen, el croissant estaba envenenado...
Diferencias individuales en la habilidad para hacer un examen.
El examen no es una medida perfecta del conocimiento.
Variabilidad por error de medida.
En alguna pregunta difcil, se duda entre varias opciones, y al
azar se elige la mala.
Variabilidad por azar, aleatoriedad.
Medidas de Dispersin
Miden el grado de dispersin (variabilidad) de los datos,
independientemente de su causa.
Amplitud o Rango (range):
Es la diferencia entre las observacines
extremas.
Es muy sensible a valores extremos.
EJEMPLO: 2,1,4,3,8,4.
El rango es 8-1=7.
Rango intercuartlico
(interquartile range):
Es la distancia entre el primer y tercer
cuartil.
25%
25%
25%
Variabilidad o Dispersin
Varianza S2 (Variance): Mide el promedio de las desviaciones
(al cuadrado) de las observaciones con respecto a la media.
S2 =
1
( xi x ) 2
n i
Desviacin tpica
Desviacin tpica (standard deviation). Es la raz cuadrada de la
varianza
x 2
x + 2
S = S2
x +
50
40
30
20
3.
2.
2.
2.
1.
1.
30
90
50
10
70
30
50
90
10
Coeficiente de variacin
Es la razn entre la desviacin tpica y la media.
Mide la desviacin tpica en forma de qu tamao tiene con
respecto a la media o desviacin por unidad de media
CV =
S
x
Asimetra o sesgo
Una distribucin es simtrica
si la mitad izquierda de su
distribucin es la imagen
especular de su mitad
derecha.
En las distribuciones
simtricas media y mediana
coinciden. Si slo hay una
moda tambin coincide
La asimetra es positiva o
negativa en funcin de a qu
lado se encuentra la cola de la
distribucin
La media tiende a desplazarse
hacia las valores extremos
(colas). Discrepancias entre
las medidas de centralizacin
indican la asimetra.
10
Estadsticos de Asimetra
Basados en diferencia entre estadsticos de tendencia central, se utilizan:
Por diferencias intercuartlicas 1 y 2 cuartiles y 2 y 3.
Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribucin con respecto a la distribucin normal o gaussiana, que es
adimensional.
Las series que representan los siguientes grficos poseen la misma
media y desviacin tpica, pero con diferente grado de apuntamiento.
400
160
300
140
300
200
120
200
100
100
60
100
Frecuencia
Frecuencia
Frecuencia
80
0
3
40
45 48 51 54 57 60 63 66 69 72 75 78 81 84
Platicrtica
27
16
37
32
47
42
Leptocrtica
57
52
67
62
77
72
87
82
97
92
108
102
138
0
27
37
32
45
41
53
49
61
57
69
65
77
73
85
81
93
89
99
Mesocrtica
Se denomina:
Platicrtica: curtosis < 0
Mesocrtica: curtosis = 0
Leptocrtica: curtosis > 0
11
Estadstico
1,90
Lmite
inferior
Lmite
superior
Error tp.
,045
1,81
1,99
Media recortada al 5%
1,75
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
2,00
3,114
1,765
0
8
8
3,00
Asimetra
Curtosis
1,034
1,060
,063
,126
12