Está en la página 1de 26

AST0212 2017-1

Introduccin al anlisis de datos


Instituto de Astrofsica
Facultad de Fsica
Pontificia Universidad Catlica de Chile
Nuestro Semestre 2017-1
C00 T00
Entrega de Tarea 1 C01
(3 ejercicios): Hard-copy enC03
C02 T01
C04 T03

T02
T04
clase. Programas en web.C05/Ctrl 1
Pesatn! T06
C05 C06 T07 T08
C07 Control 2
Feriado PUC Feriado
Feriado
I1 (M7-8)
Feriado

Control 3
Feriado

I2 (M7-8)
Control 4
Fin Clases
Ex (M1-2)
Anuncios:
1. Tarea 1: Datos completos en web.
1. (Qu paso con Grupo 9?)
2. Bibliografa:
1. Data reduction and error analysis for the
physical sciences (Bevington & Robinson)
2. Numerical Recipes (Press et al.)
3. Statistics in theory and practice (Lupton)
Clase previa (Clase 06):
1. Repaso de la clase anterior
1. Parmetros (, ) y distribucin de probabilidad
2. Comparacin entre un modelo de realidad y su
observacin.
1. Distribucin de probabilidad de Gauss
2.
Test 2
Esta clase (Clase 07):
1. Repaso de la clase anterior
1. Comparacin entre un modelo de realidad y su
observacin.
1. Distribucin de probabilidad constante
2. Distribucin de probabilidad de Gauss
2. Distribucin de probabilidad de Poisson
Realidad y observacin: Grado de certeza
Estrategia 1: Comparacin directa de histogramas
Probabilidad de la caracterstica

Frecuencia
Valor de la caracterstica
Valor de la caracterstica

Cmo puedo hacer una comparacin cuantitativa que me permita establecer cun
cierto es que el conjunto de observaciones obtenida representa la distribucin de
probabilidad subyacente?

REPASO
Realidad y observacin: Grado de certeza
Comparacin directa de histogramas: Requiere
1. Observacin sistematizada (e.g. histogramas)
Probabilidad de la caracterstica

2. Modelo cuantitativo de la realidad (fdps)


3. Tcnica para hacer histogramas tericos
4. Tcnica cuantitativa para compararlos

Frecuencia
Valor de la caracterstica
Valor de la caracterstica

Cmo puedo hacer una comparacin cuantitativa que me permita establecer cun
cierto es que el conjunto de observaciones obtenida representa la distribucin de
probabilidad subyacente?

(e.g. = Exempli gratia)


Funciones de distribucin de probabilidad
La fdp para una variable continua define la probabilidad de que sta se encuentre
en el intervalo 1 < < 2 como sigue:
2
1 < < 2 = ()
1
Si la variable existe en el intervalo [a, b], se tiene:

1 2 1
= ; 1 < < 2 =

Y puede mostrarse fcilmente que: Esta es la tcnica para hacer
un histograma terico

+ 2
= 2
; = ; =
2 12 2 3
REPASO
Aplicacin: FDP e histogramas de nmeros aleatorios
106 nmeros. FDP cte. entre 0 y 1. 106 nmeros. FDP cte. entre 0 y 1.
=0.5001, =0.2886, bin=0.0001 =0.5001, =0.2886, bin=0.00002
1 106 /1 104 = 100 1 106 /5 104 = 20

(1 + 0) (1 0)
= ; =
2 2 3

Aplicacin

REPASO
Introduccin de la segunda fdp terica

REPASO
Histogramas sumados
Imaginado Observado

REPASO
Suma de variables y FDP de Gauss
Qu sucede si los sumamos las distribuciones de nmeros con FDP constante?
Cmo es la FDP de = =1 , si cada uno de los tiene FDP constante,
distribuida en el intervalo (0,1)? Veamos los histogramas de _, con =1,2,,10.

Nmero aleatorio
REPASO
Los histogramas en todos los casos anteriores,
que son aproximaciones a las fdp de tres
variables a-priori diferentes, tienden a adoptar
una forma parecida.

Parece haber un secreto escondido no?


Teorema del lmite central y FDP de Gauss

Teorema del Lmite Central


Si 1 , 2 , , son variables aleatorias
independientes, y cada una de ellas
tiene una FDP arbitraria , con valor
medio y dispersin 2 entonces


=1 =1
= , se aproxima a
2
=1
una distribucin normal para .

1 2
lim = 2
2
El caso que mostr es un caso particular de esto, ya que las son siempre la misma
PDF, y por lo tanto = = 0.5 = = 1/ 12.
FDP de Gauss
Teorema del Lmite Central
Entonces, para el caso especfico de
nuestra variable = =1 ,

1
= =
2
=1


2 = =
12
=1

entonces
=1 12
=1 /2
= , se aproxima a una 1/2 = 0
/12
distribucin normal para .

2
1 1 (/2)2
lim = 2 2
2 /12 2
=1
Conclusin:
La suma de variables aleatorias, si sumo un
nmero suficientemente grande, tiende a
producirme una nueva variable aleatoria cuya
distribucin es normal.
FDP Normal o de Gauss: Propiedades

1 2
2
(0,1) =
2
FDP Normal o de Gauss: Propiedades
Las simetras e intervalos de
probabilidad se repiten para la
FDP gaussiana ms general, con
valor medio y dispersin , si
los intervalos se miden como
mltiplos de .

1 ()2

, = 22
2
FDP de Gauss
La ltima ecuacin es la forma ms general de la distribucin normal:

1 ()2

, = 22
2
forma que tambin est normalizada de forma que su integral en el espacio
completo de definicin de la probabilidad, , es 1:

1 ()2

< < = 22 =1
2
La FDP de Gauss puede usarse para predecir la probabilidad de que un valor de x
est en un cierto rango de la variable (1 , 2 ):

1 2 ()2 2

1 < < 2 = 22 = (, )
2 1 1
Esta es la tcnica para hacer un histograma terico en el caso de fdp = (, )
Introduccin de la tercera fdp terica
Aplicacin: FDP e histogramas de nmeros aleatorios
106 nmeros. FDP cte. entre 0 y 1. 106 nmeros. FDP cte. entre 0 y 1.
=0.5001, =0.2886, bin=0.0001 =0.5001, =0.2886, bin=0.00002
1 106 /1 104 = 100 1 106 /5 104 = 20

(1 + 0) (1 0)
= ; =
2 2 3

Aplicacin

REPASO
FDP e histogramas de histogramas

Qu pasa si hago
10.04 100
un histograma de
las frecuencias del
histograma?
FDP e histogramas de histogramas
Si clasifico a los nmeros aleatorios en bins ms chicos, el histograma que obtengo
ser el mismo, con parmetros diferentes:

4.48 20
FDP de Poisson
La FDP que est detrs de todo esto es la llamada Distribucin de Poisson, que
resulta de contar eventos que suceden en un intervalo (de tiempo o espacio) dado,
definido, cuando la probabilidad individual de cada evento es muy baja. Por
ejemplo:

1. Decaimiento radioactivo de ncleos atmicos por segundo.


2. Explosiones de SN en un volumen del universo en un intervalo de tiempo.
3. Cantidad de gotas de lluvia que caen en un vaso en un intervalo de tiempo.
4. Cantidad de nmeros aleatorios que caen en un bin especfico.
5. Nmero de fotones que llegan a un pixel de un CCD en una exposicin.

La FDP de Poisson, est dada por: Puede mostrarse que para esta FDP
= y 2 = , o sea = .

= ; con > 0 Entonces, si la tasa de ocurrencia es
! (1.000.000 en el caso anterior), entonces
que es, especficamente, la probabilidad = , donde es el largo del intervalo.
de contar eventos en el intervalo dado Estas ecuaciones aclaran todas las
(la ecuacin anterior est normalizada). coincidencias anteriores.
FDP de Poisson e histogramas
grande, grande,
La FDP de Poisson est detrs de la serrucho grande.
estadstica que describe como se llenan
los bins de un histograma.

La frecuencia asociada a cada bin es una


variable aleatoria descrita por (i.e.
cuyo valor medio es y su dispersin
).

En el caso de una variable con fdp


uniforme es el mismo para todos los
bins.

En el caso de una variable con fdp no


uniforme , y por lo tanto , sern
diferentes en cada intervalo.

(i.e. = id est)
pequeo, pequea, serrucho pequeo.
Fin de ppt de Clase 7

También podría gustarte