Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 1
Tema 1
DESCRIPCIÓN DE DATOS:
ESTADÍSTICA DESCRIPTIVA
1
1.1. Introducción : conceptos básicos
1 Recogida de datos
2 Ordenación, tabulación y gráficos*
3 Descripción de características*
4 Análisis formal
2
Variables estadísticas. Modalidades
Ejemplos:
- Estatura
- Salario
- Color del pelo
- Nivel de colesterol
- Nº de hijos de una familia
Ejemplo:
color del pelo:
- castaño
- rubio
- negro
3
Tipos de variables estadísticas
Ejemplos:
Grupo sanguineo
Profesión
Color del pelo
Ejemplos:
Nº de hijos de una familia
Nº de nidos de procesionarias por árbol
Nº de virus en un cultivo
Ejemplos:
Estatura
Salario
Nivel de colesterol
4
1.2. Tablas estadísticas y representaciones
gráficas
Variables discretas
Frecuencias
Absolutas, n (nº individuos modalidad i)
i
Absolutas acumuladas, N n n ... n
i 1 2 i
Relativas, f n n (proporcion indiv. modalidad i)
i i
Re lativas acumuladas, F f f ... f
i 1 2 i
Absolutas, ni
xi ni Ni fi Fi
Absolutas
x1 n1 N1 f1 F1 acumuladas, Ni
... ... ... ... ...
xi ni Ni fi Fi
... ... ... ... ... Relativas
xk nk Nk fk Fk fi = ni / n
n 1 Relativas
acumuladas
Fi = Ni / n
5
Variables continuas: Intervalos
Intervalo I i x i n i Ni fi Fi
e0 – e1 x1 n1 N1 f1 F1
... ... ... ... ... ...
e i-1 – ei xi n i Ni fi Fi
... ... ... ... ... ...
e k -1 – ek xk n k N k fk Fk
n 1
6
Gráficos estadísticos
20
10
7
V. E. Cualitativas: Gráfico de sectores
violeta
negro
rojo
blanco gris
8
V. E. Discretas: Gráfico de barras
Nº de crías Nº animales: n fi Fi
i
2 20 0.20 0.20
3 30 0.30 0.50
4 25 0.25 0.75
5 15 0.15 0.90
6 10 0.10 1
n = 100
35
30
25
20
15
10
0
2 3 4 5 6
9
V. E. Continuas: Histograma
Estatura ni hi = ni / ai
140 – 160 30 1.5
160 – 170 22 2.2
170 – 180 20 2
180 – 190 18 1.8
190 – 200 10 1
100
hi
2.2 El área de
2 cada rectángulo
1,8 es proporcional
a la frecuencia”
1,5
10
1.3. Características de variables
estadísticas unidimensionales
Media aritmética
k
k ni x i
x fi x i i 1
i 1
n
Variables discretas
Datos en serie
2, 2, 3, 3, 3, 3, 5, 6, 7 Mo = 3
Datos en tabla
♦ Ejemplo xi ni
1 34
2 36
3 45 Mo = 3
4 22
5 17
12
Variables continuas
h i h i 1
Mo ei 1 ai
h i h i1 hi h i1
♦ Ejemplo xi ni hi = ni / ai
140 – 160 30 1.5
160 – 170 22 2,2
170 – 180 20 2
180 – 190 18 1,8
190 – 200 10 1
100
Mo 160
2.2 1.5
10 167.777
2.2 1.5 2.2 2
Observaciones:
1. Puede utilizarse la frecuencia relativa
2. Si las amplitudes son iguales, la moda se puede
obtener directamente con las frecuencias
13
Mediana
Variables discretas
Datos en serie
Nº impar de observaciones:
2, 2, 2, 3, 5, 6, 7, 7, 8 → Me = 5
Nº par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9
→ Me = 6 – 7 Indeterminada entre 6 y 7
xi ni Ni fi Fi xi ni Ni fi Fi
2 3 3 0,333 0,333 3 1 1 0,1 0,1
3 1 4 0,111 0,444 4 1 2 0,1 0,2
5 1 5 0,111 0,555 6 3 5 0,3 0,5
6 1 6 0,111 0,666 7 1 6 0,1 0,6
7 2 8 0,222 0,888 8 2 8 0,2 0,8
8 1 9 0,111 0,999 9 2 10 0,2 1
9 1 10 1
14
Variables discretas
Datos en tabla
♦ Ejemplo
xi ni fi Fi n /2 = 14
Ni
Fi = 0,5
0 4 4 0.142 0.142
1 6 10 0.214 0.357
2 10 20 0.357 0.714
3 5 25 0.178 0.892
4 3 Me = 2
28 0.107 1
28 1
15
Variables continuas
50
n N i 1
0,5 Fi 1
Me ei 1 a i ei 1 100 ai
fi ni
♦ Ejemplo
Estatura ni Ni fi Fi n/2 = 50
0.5 0.45
Me 160 10 160 2 162
0.25
Q1 = P25 Cuartil 1º
Q2 = P50 Cuartil 2º = Me
Q3 = P75 Cuartil 3º
D1 = P10 Decil 1º
D2 = P20 Decil 2º
….
D9 = P90 Decil 9º
Cálculo para v.e. discretas:
Igual que la mediana, cambiando:
50 k
n por n
100 100
17
♦ Ejemplos percentiles v.e. discreta
xi ni Ni
2 20 20 k 40
n 124 49,6
100 100
3 30 50
4 44 94
k 95
5 20 114 n 124 117,8
100 100
6 10 124
124
n k /100 =
124x25/100 = 31 Percentil 25, P25 = 3 = Q1
n k /100 =
124x50/100 = 62 Percentil 50, P50 = 4 = Me = Q2
n k /100 =
124x75/100 = 93 Percentil 75, P75 = 4 = Q3
18
♦ Ejemplos percentiles v.e. continua
Tallas ni Ni fi Fi
140-150 15 15 0.15 0.15
P40
150-160 30 45 0.30 0.45
160-170 25 70 0.25 0.70 P75
170-180 20 90 0.20 0.90
180-200 10 100 0.10 1
100
k nk
Fi 1 Ni 1
Pk ei 1 100 a i ei 1 100 ai
fi ni
0.4 0.15 40 15
P40 150 10 150 10 158.33
0.30 30
0.75 0.70 75 70
P75 170 10 170 10 172.5 Q 3
0.20 20
19
1.3.2. Características de Dispersión
Rango o recorrido
Recorrido intercuartílico
Q 3 – Q1
20
Varianza
k k
2
ni x i x ii
n x 2
2
2
i 1 i 1 x
n n
Desviación típica
2
Coeficiente de variación
C. V .
x
21
♦ Ejemplo
xi ni nixi nixi2
4 20 80 320
6 40 240 1440
8 44 352 2816
10 36 360 3600
12 22 264 3168
162 1296 11344
k
ni x i 2 2
2 11344 1296
2 Var X i 1 x 6.02
n 162 162
2 6.02 2.4535
22
Momentos centrales (Respecto a la media)
k
ni x i x
r
r i 1
n
k
ni x i x
r 1 1 i 1 0
n
k
ni x i x
2
r 2 2 i 1 2
n
23
1.3.3 Características de forma
3
1
3
► Si 1 0 Distribución simétrica
24
Coeficiente de Curtosis (Aplastamiento)
4
2 3
4
25
1.4 Gráfico de caja
v.a.i. v.a.s.
mín F1 f1 Q1 Me Q3 f2 F2 máx
o o
** *
26
Ejemplo
1,2,0,0,2,4,3,0,1,1,1,2,3,4,8,3,0,1,1,3,2,1,0,4,10,5,1,0,2,4
mín = 0
máx = 10 Datos ordenados:
Q1 = 1 00000011111111222223333444458 10
Q3 = 3
Me = 2
f1 = -2
f2 = 6
F1 = -5
F2 = 9
Vai = 0
Vas = 5
Valores anómalos = 8, 10
0 1 2 3 4 5 6 7 8 9 10
*
o
27