Está en la página 1de 16

Aproximación normal

Metodos descriptivos

Aproximacion normal

TLC

X1 + · · · + Xn − nm
P( √ ≤ x) → Φ(x)
σ n
o √
P(X1 + · · · + Xn ≤ nm + xσ n) → Φ(x)
y − nm
P(X1 + · · · + Xn ≤ y ) ≈ Φ( √ )

X1 + · · · + Xn ≈ N(nm, nσ 2 )
Ejemplos

1 / 16
Aproximación normal
Metodos descriptivos

Aproximacion normal
a la binomial

X1 , . . . , Xn ∼ Bern(p) , Sn = X1 + · · · + Xn ∼ Bin(n, p)
EX = m = p , VarX = σ 2 = p(1 − p)
Estandarizando
S − np
p n → N(0, 1), n→∞
np(1 − p)

Sn ≈ N(np, np(1 − p))


Es decir,
x − np
P(Sn ≤ x) ≈ Φ( p )
np(1 − p)

2 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Métodos descriptivos

Tienen por objetivo proveer información sobre los datos en


términos generales, sin referirse a ningún modelo en especial.
Métodos gráficos, numéricos.
Por mayorı́a, atrás de los métodos están los conceptos
probabilı́sticos, media, desviación estándar, cuantiles, frecuencias,
etc. a través de las leyes de las cuales se destaca la Ley de Los
Grandes números.
La utilidad de ésta la vamos a ver en lo que sigue.

3 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Media, varianza, momentos

X1 , X2 , . . . , Xn muestra de una distribución. Obtener información


sobre el valor promedio EX = m.
LaPLey de los Grandes Números:
1 n
n i=1 Xi → EX , n→∞
X̄ = m̂ media muestral, estimador de m
¿Varianza? ¿Momentos?
De manera parecida:
VarX = P σ 2 = EX 2 − (EX )2 (= E (X − EX )2 )
X = n ni=1 Xi2 → EX 2 , n → ∞
2 1

⇒σ c2 = 1 Pn X 2 − X̄ 2 = 1 (Pn X 2 − nX̄ 2 )
n i=1 i n i=1 i

4 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Varianza muestral
Pn 2
Suma de cuadrados
Pn SC = i=1 Xi
SCa = i=1 Xi2 − nX̄ 2 suma de cuadrados ajustada
Ajuste
( ni=1 Xi )2
P
2
nX̄ =
n
Xn
SCa = (Xi − X̄ )2 ,
i=1

efectivamente:
n
X n
X
(Xi − X̄ )2 = SC − 2 Xi X̄ + n(X̄ )2
i=1 i=1

= SC − 2nX̄ · X̄ + n(X̄ )2 = SC − n(X̄ )2 = SCa

5 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Varianza muestral

c2 = 1 SCa .
Total que σ n
Se usa
n
1 1 X 2
s2 = SCa = ( Xi − nX̄ 2 )
n−1 n−1
i=1

(varianza muestral)
Se prefiere éste por ser insesgado

Es 2 = σ 2

6 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Ejemplo: muestra de una distribucion uniforme

Muestra tamaño n=10 de la distribución uniforme en [0,1]


(distribución conocida para fines ilustrativos)

0.03 , 0.5 , 0.15 , 0.39 , 0.95 , 0.69 , 0.71 , 0.61 , 0.13 , 0.68
P P 2
xi = 4.84, xi = SC = 3.16,
2
x̄ = 4.84/10 = 0.484, ajuste = 4.84 10 = 2.34
SCa = SC − ajuste = 3.16 − 2.34 = 0.82
1
s 2 = n−1 SCa = 0.82/9 = 0.0911,
2
σ = VarX = 1/12 = 0.083 ¡conocida!
s = 0.3, σ = 0.29 para comparar.
Uso de software

7 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Estadı́sticas descriptivas en R

> x=c(0.03 , 0.5 , 0.15 , 0.39 , 0.95 , 0.69 , 0.71 , 0.61 , 0.13 , 0.68)
+ print(paste("media",mean(x)))
[1] "media 0.484"
+ print(paste("desv.est.",sd(x)))
[1] "desv.est. 0.3013008832085"
+ print(paste("varianza",var(x)))
[1] "varianza 0.0907822222222222"

8 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Metodos descriptivos
Frecuencias
∆ intervalo en R, f∆ frecuencia (# de x en ∆)
A través de función indicadora
(
1 si x ∈ ∆
I∆ (x) =
0 en otros casos
n
X
f∆ = I∆ (Xi )
i=1
I∆ (Xi ) v.a.i.i.d. ⇒ por la ley de los grandes números
Pn
i=1 I∆ (Xi )
→ EI∆ (X ) = P(X ∈ ∆), n → ∞
n
en probabilidad
Frecuencia relativa
f∆
n
9 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Tabla de frecuencias

Estimación de probabilidad
f∆
→ P(X ∈ ∆), n→∞
n

Para una partición ∆1 , ∆2 . . . , ∆k


se calculan frecuencias correspondientes f1 , f2 , . . . , fk
Tabla de frecuencias.
Clase ∆1 ∆2 ... ∆k
Frecuencia f1 f2 ... fk

10 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Tablas de frecuencias en R

Para la muestra anterior.


tab=hist(x,breaks=c(0,0.25,0.5,0.75,1),plot=FALSE)
tab
$breaks
[1] 0.00 0.25 0.50 0.75 1.00
$counts
[1] 3 2 4 1
$density
[1] 1.2 0.8 1.6 0.4
$mids
[1] 0.125 0.375 0.625 0.875
$xname
[1] "x"
$equidist
[1] TRUE
attr(,"class")
[1] "histogram"

11 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Histograma de frecuencias en R
hist(x)

Histogram of x

4
3
Frequency

2
1
0

0.0 0.2 0.4 0.6 0.8 1.0

Figura: Histograma de frecuencias


12 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Función de distribución empı́rica

X1 , X2 , . . . , Xn muestra de una distribución con f.d.a. F (x)


Estimar F (x), x ∈ R.
Aplicamos a ∆ = (−∞, x]: frecuencia relativa
Pn
i=1 I∆ (Xi )
→ EI∆ (X ) = P(X ∈ ∆), n → ∞
n
en probabilidad.
Pn Pn
i=1 I∆ (Xi ) i=1 I(−∞,x] (Xi )
=
n n
→ EI(−∞,x] (X ) = P(X ≤ x) = F (x), n → ∞

13 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Función de distribución empı́rica

Pn
i=1 I(−∞,x] (Xi )
Fn (x) =
n
La suma aumenta en uno en cada punto muestral Xi ,
i = 1, 2, . . . , n, ⇒ Fn (x) es una función escalonada. Corresponde a
la distribución empı́rica.
Los puntos en orden ascendente: x(1) , x(2) , . . . , x(n) ,
son llamados estadı́sticos de orden.
El valor de Fn en x(1) es 1/n,
en x(2) es 2/n, etc.
En general,
i
Fn (x(i) ) = , i = 1, 2, . . . , n.
n

14 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Función de distribución empı́rica

Fn (x): continua por la derecha, tiene lı́mites por la izquierda, saltos


de 1/n.
Función de distribución (discreta). Corresponde a la masa
concentrada en puntos muestrales de 1/n cada uno (distribución
empı́rica).
x̄ la media de distribución empı́rica , σˆ2 varianza de la distribución
empı́rica , etc.

15 / 16
Aproximación normal Histograma
Metodos descriptivos Función de distribución empı́rica

Función de distribución empı́rica en R


# para la misma muestra x
fde=ecdf(x)# ojo: es una función lo que produce
plot(fde)# ésta se puede graficar

produce
ecdf(x)
1.0


0.8


0.6


Fn(x)


0.4


0.2


0.0

0.0 0.2 0.4 0.6 0.8 1.0

x
16 / 16

También podría gustarte