Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 1
Tema 1
DESCRIPCIÓN DE DATOS:
ESTADÍSTICA DESCRIPTIVA
1
1.1. Introducción : conceptos básicos
1 Recogida de datos
2 Ordenación, tabulación y gráficos*
3 Descripción de características*
4 Análisis formal
2
Variables estadísticas. Modalidades
Ejemplos:
- Estatura
- Salario
- Color del pelo
- Nivel de colesterol
- Nº de hijos de una familia
Ejemplo:
color del pelo:
- castaño
- rubio
- negro
3
Tipos de variables estadísticas
Ejemplos:
Grupo sanguineo
Profesión
Color del pelo
Ejemplos:
Nº de hijos de una familia
Nº de nidos de procesionarias por árbol
Nº de virus en un cultivo
Ejemplos:
Estatura
Salario
Nivel de colesterol
4
1.2. Tablas estadísticas y representaciones
gráficas
Variables discretas
Frecuencias
Absolutas, n (nº individuos modalidad i)
i
Absolutas acumuladas, N n n ... n
i 1 2 i
Relativas, fi ni n (proporcion indiv. modalidad i)
Relativas acumuladas, F i f1 f 2 ... fi
Absolutas, ni
xi ni Ni fi Fi
Absolutas
x1 n1 N1 f1 F1 acumuladas, Ni
... ... ... ... ...
xi ni Ni fi Fi
... ... ... ... ... Relativas
f i = ni / n
xk nk Nk fk Fk
n 1 Relativas
acumuladas
Fi = Ni / n
5
Variables continuas: Intervalos
Intervalo I i x i n i Ni fi Fi
e0 – e1 x1 n1 N1 f1 F1
... ... ... ... ... ...
e i-1 – ei xi ni Ni fi Fi
... ... ... ... ... ...
e k-1 – ek xk nk Nk fk Fk
n 1
6
Gráficos estadísticos
20
10
7
V. E. Cualitativas: Gráfico de sectores
violeta
negro
rojo
blanco gris
8
V. E. Discretas: Gráfico de barras
Nº de crías Nº animales: n i fi Fi
2 20 0.20 0.20
3 30 0.30 0.50
4 25 0.25 0.75
5 15 0.15 0.90
6 10 0.10 1
n = 100
35
30
25
20
15
10
0
2 3 4 5 6
9
V. E. Continuas: Histograma
Estatura ni hi = ni / ai
140 – 160 30 1.5
160 – 170 22 2.2
170 – 180 20 2
180 – 190 18 1.8
190 – 200 10 1
hi 100
2.2 El área de
2 cada rectángulo
1,8 es proporcional
a la frecuencia”
1,5
10
1.3. Características de variables
estadísticas unidimensionales
Media aritmética
k
k ni x i
x fi x i i 1
i 1
n
k
ni x i
Media : x i 1
33900
161.42
n 210
11
Moda
Variables discretas
Datos en serie
2, 2, 3, 3, 3, 3, 5, 6, 7 Mo = 3
Datos en tabla
♦ Ejemplo xi ni
1 34
2 36
3 45 Mo = 3
4 22
5 17
12
Variables continuas
h i h i 1
Mo ei 1
h i h i1 hi h i1
ai
♦ Ejemplo xi ni hi = ni / ai
140 – 160 30 1.5
160 – 170 22 2,2
170 – 180 20 2
180 – 190 18 1,8
190 – 200 10 1
100
Mo 160
2.2 1.5
10 167.777
2.2 1.5 2.2 2
Observaciones:
1. Puede utilizarse la frecuencia relativa
2. Si las amplitudes son iguales, la moda se puede
obtener directamente con las frecuencias
13
Mediana
Variables discretas
Datos en serie
Nº impar de observaciones:
2, 2, 2, 3, 5, 6, 7, 7, 8 → Me = 5
Nº par de observaciones: 3, 4, 6, 6, 6, 7, 8, 8, 9, 9
→ Me = 6 – 7 Indeterminada entre 6 y 7
xi n N fi Fi xi n N fi Fi
i i i i
2 3 3 0,333 0,333 3 1 1 0,1 0,1
3 1 4 0,111 0,444 4 1 2 0,1 0,2
5 1 5 0,111 0,555 6 3 5 0,3 0,5
6 1 6 0,111 0,666 7 1 6 0,1 0,6
7 2 8 0,222 0,888 8 2 8 0,2 0,8
8 1 9 0,111 0,999 9 2 10 0,2 1
9 1 10 1
14
Variables discretas
Datos en tabla
♦ Ejemplo
xi ni Ni fi Fi n /2 = 14
Fi = 0,5
0 4 4 0.142 0.142
1 6 10 0.214 0.357
2 10 20 0.357 0.714
3 5 25 0.178 0.892
Me = 2
4 3 28 0.107 1
28 1
15
Variables continuas
50
n N i 1
0,5 Fi 1
Me ei 1 a i ei 1 100 ai
fi ni
♦ Ejemplo
Estatura ni Ni fi Fi n/2 = 50
Fi = 0,5
140 – 150 15 15 0.15 0.15
150 – 160 30 45 0.30 0.45
160 – 170 25 70 0.25 0.70
170 – 180 20 90 0.20 0.90
180 – 200 10 100 0.10 1
100
0.5 0.45
Me 160 10 160 2 162
0.25
16
Percentiles
Q1 = P25 Cuartil 1º
Q2 = P50 Cuartil 2º = Me
Q3 = P75 Cuartil 3º
D1 = P10 Decil 1º
D2 = P20 Decil 2º
….
D9 = P90 Decil 9º
17
♦ Ejemplos percentiles v.e. discreta
xi ni Ni
2 20 20 k 40
n 124 49,6
3 30 50 100 100
4 44 94
5 20 114 k 95
n 124 117,8
6 10 124 100 100
124
18
♦ Ejemplos percentiles v.e. continua
Tallas ni Ni fi Fi
140-150 15 15 0.15 0.15
P40
150-160 30 45 0.30 0.45
160-170 25 70 0.25 0.70
P75
170-180 20 90 0.20 0.90
180-200 10 100 0.10 1
100
k nk
Fi 1 N i 1
Pk ei 1 100 a i ei 1 100 ai
fi ni
0.4 0.15 40 15
P40 150 10 150 10 158.33
0.30 30
0.75 0.70 75 70
P75 170 10 170 10 172.5 Q 3
0.20 20
19
1.3.2. Características de Dispersión
Rango o recorrido
Recorrido intercuartílico
Q 3 – Q1
20
Varianza
k k
2
ni x i x ii
n x 2
2
2
i 1 i 1 x
n n
Desviación típica
2
Coeficiente de variación
C. V .
x
21
♦ Ejemplo
xi ni nixi nixi2
4 20 80 320
6 40 240 1440
8 44 352 2816
10 36 360 3600
12 22 264 3168
162 1296 11344
k
ni x i 2 2
11344 1296
2 Var X i 1
2
x 6.02
n 162 162
2 6.02 2.4535
22
Momentos centrales (Respecto a la media)
k
ni x i x
r
r i 1
n
k
ni x i x
r 1 1 i 1 0
n
k
ni x i x
2
r 2 2 i 1 2
n
23
1.3.3 Características de forma
3
1
3
► Si 1 0 Distribución simétrica
24
Coeficiente de Curtosis (Aplastamiento)
4
2 3
4
25
1.4 Gráfico de caja
v.a.i. v.a.s.
mín F1 f1 Q1 Me Q3 f2 F2 máx
o ** * o
26
Ejemplo
1,2,0,0,2,4,3,0,1,1,1,2,3,4,8,3,0,1,1,3,2,1,0,4,10,5,1,0,2,4
mín = 0
máx = 10 Datos ordenados:
00000011111111222223333444458 10
Q1 = 1
Q3 = 3
Me = 2
f1 = -2
f2 = 6
F1 = -5
F2 = 9
Vai = 0
Vas = 5
Valores anómalos = 8, 10
0 1 2 3 4 5 6 7 8 9 10
* o
27