Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. Estadística clásica
Estadística Avanzada y
Análisis de Datos
Javier Gorgas y Nicolás Cardiel
Curso 2006-2007
Introducción
En ciencia tenemos que tomar decisiones (¿son los datos compatibles con la teoría?
¿cuáles son los parámetros que mejor ajustan? ¿son las dos muestras similares?
¿qué ha fallado, cómo podemos mejorar el experimento?)
Para cada medida o parámetro derivado necesitamos una estimación del error que
nos diga, en términos de probabilidades, la confianza que tenemos en su valor.
La estadística es la herramienta, en la mayoría de los casos, inevitable para tomar las
decisiones (el método científico).
If your experiment needs statistics, you ought to have done a better experiment
(E. Rutherford)
En particular, en astrofísica:
Nuestras medidas están sujetas a (grandes) errores de medida.
Tenemos la manía de observar al límite de las capacidades instrumentales.
El método clásico de repetir los experimentos no es aplicable.
No podemos diseñar los experimentos (las muestras pueden ser muy pequeñas)
1-3
1. Estadística clásica
Introducción (II)
Programa
1. Estadística clásica
2. Introducción a la estadística bayesiana
3. Cálculo de errores
4. Regresión lineal
5. Correlación
6. Regresión múltiple
7. Contrastes de hipótesis para una muestra
8. Contrastes de hipótesis para varias muestras
9. Análisis de componentes principales
10. Estimación de parámetros
11. Detección de la señal – Surveys
12. Análisis de datos astrofísicos
1-5
1. Estadística clásica
Tema 1
Estadística clásica
Introducción
Estadística descriptiva
Distribuciones de probabilidad
Distribuciones discretas de probabilidad
Distribución normal
Estimación de parámetros poblacionales
Distribuciones muestrales de los estadísticos
Estimación por intervalos de confianza
Contrastes de hipótesis
Métodos no paramétricos
1-6
1. Estadística clásica
centralización Estadística descriptiva
Media aritmética Media armónica Media cuadrática
Media geométrica
Mediana Moda
Me: Valor central (con
los datos ordenados de
Mo: Valor con
mayor a menor) mayor frecuencia
Varianza
dispersión
Desviación media
Coeficientes de variación
Desviación típica
asimetría
curtosis
Momento de orden r
respecto a c
1-7
1. Estadística clásica
Distribuciones de probabilidad
Función de probabilidad para Función de
una variable discreta: distribución:
covarianza
1-8
1. Estadística clásica
Distribuciones discretas de probabilidad
Distribución Binomial
Probabilidad de obtener x éxitos en n ensayos (p = probabilidad de éxito en un ensayo)
donde
Distribución de Poisson
Probabilidad de que se den x sucesos (λ = número medio de sucesos)
donde
Normal
tipificada:
Teorema del límite central: Si X1, X2, …, Xn son variables aleatorias independientes con
medias µi, desviaciones típicas σi y distribuciones de probabilidad cualesquiera, y definimos la
variables Y = X1 + X2 + …+ Xn, entonces la variable:
cuando
nivel de confianza
α: nivel de
significación
VENTAJAS DESVENTAJAS
• En general no se conoce la distribución • No usan toda la información disponible.
de probabilidad (el teorema del límite • Al no haber parámetros, es difícil hacer
central puede no aplicarse). estimaciones cuantitativas.
• Menos suposiciones sobre los datos. • Son algo menos eficientes: (para
• Válidos para muestras muy pequeñas. rechazar la hipótesis nula con el mismo
• Sirven para datos no numéricos nivel de confianza se necesitan muestras
(variables cualitativas y de rango). mayores)
• Respuestas rápidas con menos cálculos. Eficiencia relativa asintótica:
• A veces no existe la población (no hay (Ante la duda es más seguro usar métodos
parámetros que estimar). no paramétricos)