Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 3
Estadística descriptiva
3. Estadística descriptiva
• Tabla de frecuencias
• Frecuencia absoluta
• Frecuencia relativa
• Frecuencia (absoluta o relativa) acumulada
• Medidas estadísticas
• Medidas de tendencia central
• Medidas de posición
• Características de dispersión
• Características de forma
• Representación gráfica
• Variables cualitativas
• Variables cuantitativas
Tabla de frecuencias
Dada una variable (X), la frecuencia es contar cuantas veces se ha
dado cada valor o categoría diferente (x1, x2, … , xk) en una muestra
(de n elementos) o en una población (de N elementos).
Odds:
Las medidas estadísticas son funciones que, aplicadas a los datos, dan
valores que resumen la variable. Si disponemos de toda la población, el
resultado es un parámetro; si es una muestra es un estadístico.
Cuando los datos son muy similares, también serán muy similares a la
medida de tendencia central (que los representará bien).
σ𝑛
𝑖=1 𝑥𝑖 σ𝑘
𝑖=1 𝑥𝑖 ni
Población → 𝜇 = (𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑟𝑒𝑝𝑒𝑡𝑖𝑑𝑜𝑠) = (𝑣𝑎𝑙𝑜𝑟𝑒𝑠 sin 𝑟𝑒𝑝𝑒𝑡𝑖𝑟)
𝑁 𝑁
σ𝑛
𝑖=1 𝑥𝑖 σ𝑘
𝑖=1 𝑥𝑖 ni
Muestra → 𝑋ത = (𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑟𝑒𝑝𝑒𝑡𝑖𝑑𝑜𝑠) = (𝑣𝑎𝑙𝑜𝑟𝑒𝑠 sin 𝑟𝑒𝑝𝑒𝑡𝑖𝑟)
𝑛 𝑛
σ𝑛𝑖=1 𝑤𝑖 𝑥i
σ𝑛𝑖=1 𝑤𝑖
Medidas estadísticas
Medidas de posición
Las medidas de posición nos indican que posición ocupa un valor en una
variable.
Cuartiles (𝑸𝒊 ): Tres valores que dividen los datos en cuatro partes
“ordenadas” con un 25% de la muestra en cada una.
➢ Primer cuartil (𝑄1 ): valor de la variable que deja el 25% de las observaciones
por debajo.
➢ Segundo cuartil (𝑄2 ): valor que deja el 50% de las observaciones por debajo
(es equivalente a la mediana).
➢ Tercer cuartil (𝑄3 ): valor que deja el 75% de las observaciones por debajo.
Deciles (𝑫𝒊 ): Nueve valores (del primer al noveno decil) que dividen los
datos en 10 partes del mismo tamaño. El decil 5 (o D5) equivale a la
mediana.
Percentiles (𝑷𝒊 ): Noventa y nueve valores que dividen los datos en cien
partes del mismo tamaño. El P50 equivale a la mediana.
Medidas estadísticas
Medidas de posición
→ Si la variable es continua:
1. Se ordenan los datos, de menor a mayor.
𝑘 𝑛+1
2. Se calcula la posición: 100
3. Se obtiene la parte entera (e) y la parte decimal (d).
4. Percentil k = X[e]+d(X[e+1]- X[e])
Medidas estadísticas
Medidas de dispersión
Medidas de dispersión
2 σ𝑁
𝑖=1(𝑥𝑖 −µ)
2 σ𝑁 2
𝑖=1(𝑥𝑖 ) −𝑁𝜇
2
Población → 𝜎 = = = 𝐸 𝑥 2 − 𝜇2
𝑁 𝑁
σ𝑛 ҧ 2
𝑖=1(𝑥𝑖 −𝑥) σ𝑛 2
𝑖=1(𝑥𝑖 ) −𝑛𝑥ҧ
2
Muestra → 𝑠 2 = 𝑛−1
= 𝑛−1
Población → 𝜎 = 𝜎 2 Muestra →𝑠 = 𝑠 2
Medidas estadísticas
Medidas de dispersión
𝑠
𝐶𝑉 = × 100
𝑋ത
1
𝐷𝑚 = 𝑛 σ𝑛𝑖=1 𝑥𝑖 − 𝑋ത ;
𝑛
1
𝐷𝑀𝑑 = 𝑥𝑖 − 𝑀𝑑
𝑛
𝑖=1
𝐷𝑀𝑑 = 𝑀𝑑 𝑥𝑖 − 𝑋ത
Medidas estadísticas
Características de forma
❖ Asimetría
❖ Curtosis
Medidas estadísticas
Características de forma
❖ Asimetría
σ𝑛 ҧ 3
𝑖=1(𝑥𝑖 −𝑥)
CA= 𝑠3
Características de forma
❖ Asimetría
CA < 0 CA = 0 CA > 0
Medidas estadísticas
Características de forma
❖ Curtosis (o apuntamiento)
σ𝑛 ҧ 4
𝑖=1(𝑥𝑖 −𝑥)
Curtosis= 𝑠4
Medidas de forma
❖ Curtosis