Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema : Estadísticos
1
Parámetros y estadísticos
4
Estadísticos de posición
5
Estadísticos de posición
6
Ejemplos
El 5% de los recién nacidos tiene un peso demasiado bajo.
¿Qué peso se considera “demasiado bajo”?
Percentil 5 o cuantil 0,05
15
10
5
0
1 2 3 4 5
15
10
5
0
50 55 60 65 70 75 80 85
10
5
0
10
5
0
Diagramas de Tukey
0.08
0.06
Resumen con 5 números:
densidad
Mínimo, cuartiles y máximo.
0.04
Suelen dar una buena idea Mín. P25 P50 P75 Máx.
0.02
de la distribución.
0.00
La zona central, ‘caja’, 40 45 50 55 60 65
contiene al 50% central de Velocidad (Km/h) de 200 vehículos en ciudad
las observaciones.
Su tamaño se llama ‘rango
intercuartílico’ (R.I.)
Diagrama de cajas de Tukey: Resumen en 5 números
observaciones que se
densidad
se marcan.
80 90 100 110 120 130 140
11
Ejemplo Estadísticos
14
Algunas fórmulas
Datos sin agrupar: x1, x2, ..., xn
Media
x
x i i
n
Datos organizados en tabla
si está en intervalos usar como xi las marcas de
clase. Si no ignorar la columna de intervalos.
Media x
xn i i i
n
Variable fr. fr. ac.
Cuantil de orden α
L0 – L 1 x1 n1 N1
i es el menor intervalo que tiene
L1 – L 2 x2 n2 N2
frecuencia acumulada superior a α ·n
... α=0,5 es mediana
n N
Lk-1 – Lk xk nk Nk C Li 1 i 1
( Li Li 1 )
n ni
15
Ejemplo con variable en intervalos
16
Ejemplo (continuación)
Peso M. Clase Fr. Fr. ac.
40 – 50 45 5 5
x
xn i i i
45 5 55 10 115 3
69,3
50 – 60 55 10 15 n 58
60 – 70 65 21 36
70 - 80 75 11 47 0,5 58 N i 1
Mediana C0,5 Li 1 ( Li Li 1 )
80 - 90 85 5 52 ni
90 - 100 95 3 55 0,5 58 15
100 – 130 115 3 58
60 (70 60) 66,6
21
58
0,75 58 N i 1 43,5 36
P75 C0,75 Li 1 ( Li Li 1 ) 70 (80 70) 76,8
ni 11
Moda = marca de clase de (60,70] = 65
Cada libro ofrece una fórmula diferente para la moda (difícil estar al día.)
0.05
Mín. P25 P50 P75 Máx.
0.04
Diferencia entre observaciónes extremas.
2,1,4,3,8,4. El rango es 8-1=7
0.03
Es muy sensible a los valores extremos.
25% 25% 25% 25%
0.02
Rango intercuartílico
0.01
Rango intercuartílico (‘interquartile range’): Rango
Es la distancia entre primer y tercer cuartil.
0.00
Rango intercuartílico = P
75 - P25 150 160 170 180 190
Parecida al rango, pero eliminando las observaciones más extremas
inferiores y superiores.
1
S ( xi x )
2 2
n i
Es sensible a valores extremos (alejados de la media).
20
Desviación típica (‘standard deviation’)
Es la raíz cuadrada de la varianza
S S 2
Tiene las misma dimensionalidad 50
(unidades) que la variable. Versión
‘estética’ de la varianza.
40
10
A una distancia de una desv. típica de la Desv. típ. = 568,43
0.05
0.04
0.04
0.03
0.03
0.02
0.02
0.01
0.01
xs x 2s
68.5 % 95 %
0.00
0.00
150 160 170 180 190 150 160 170 180 190
22
Datos ‘casi normales’. Eje ‘x’ medido en desviaciones típicas…
¿Encuentras relación entre rango intercuartílico y desviación típica?
¿Y entre los ‘bigotes’ y dos desviaciones típicas? ¿Podrías
caracterizar las observaciones anómalas?
0.3
0.3
densidad
densidad
0.2
0.2
xs
0.1
x 2s
0.1
x s x 2s
66 % 95 % 71 % 94 %
0.0
0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
0.4
0.3
0.3
densidad
densidad
0.2
0.2
0.1
x s x 2s
0.1
xs x 2s
68 % 94 % 70 % 94 %
0.0
0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
0.20
0.5
0.20
0.4
0.15
0.15
0.3
0.10
0.10
0.2
0.05
0.05
0.1
xs xs
xs
66 % 78 %
78 %
0.00
0.00
0.0
8 10 12 14 16 18 20 -2 -1 0 1 2 3 0 2 4 6 8 10 12 14
26
x x x
Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una distribución
con respecto a la distribución normal o gaussiana. Es adimensional.
0.8
0.3
1.5
0.6
0.2
1.0
0.4
0.1
0.5
0.2
x s
xs x s
68 %
57 % 82 %
0.0
0.0
0.0
Porcentaje
superior 1,99 n=215
15%
Media recortada al 5% 8%
1,75 10%
n=127
4%
Mediana 2,00 n=54 2% 2% 1%
5%
Varianza 3,114 n=24 n=23 n=17
Desv. típ. 1,765
Mínimo 0
0 1 2 3 4 5 6 7 Ocho o más
Máximo 8
Número de hijos
Rango 8
Amplitud intercuartil Está sombreado lo que sabemos interpretar hasta ahora.
Verifica que comprendes todo. ¿Qué unidades tiene cada
3,00 estadístico? ¿Variabilidad relativa?
Asimetría 1,034 ,063 Calcula los estadísticos que puedas basándote sólo en el
Curtosis 1,060 ,126 gráfico de barras.
28
¿Qué hemos visto?
Parámetros
Estadísticos y estimadores
Clasificación
Posición (cuantiles, percentiles,...)
Diagramas de cajas
Medidas de centralización: Media, mediana y moda
Diferenciar sus propiedades.
Medidas de dispersión
con unidades: rango, rango intercuartílico, varianza, desv.
típica
sin unidades: coeficiente de variación
¿Qué usamos para comparar dispersión de dos poblaciones?
Asimetría
positiva
negativa
¿Podemos observar asimetría sin mirar la gráfica?
¿Cómo me gustan los datos?
Medidas de apuntamiento (curtosis)
¿Cómo me gustan los datos?
29