Está en la página 1de 45

Distribuciones fundamentales

de Muestreo
Población: Consiste en la totalidad de
las observaciones en las que estamos
interesados.
Cada observación en una población es
un valor de una v. a. X que tiene
alguna distribución de probabilidad . f  x 
población normal
población f  x 

La media(valor esperado) de una


población

La varianza de la población
Población

Muestra
Muestra
INFERIR

Población
¿Qué información nos trasmiten los datos?

Muestra Aleatoria: ''observaciones realizadas


al azar en forma independiente''
Muestra Aleatoria
v. a. Xi i= 1,...,n Xi :''i_ésima medición
o valor de la muestra que observemos''

X ,, X n
1
muestra aleatoria de la población f (x)
x ,, xn
1
Estadístico
Cualquier función de las v. a. que forman
una muestra aleatoria.

n n

 Xi
2
 X
i 1
i X
2

X i 1 S 
n n 1
Distribución Muestral
La distribución de probabilidad de un
estadístico

Distribución Muestral de la Media

X ~. normal  ,  2

  2

X ~. normal   , 

 n 
3 4
1
2

E(X)=2.5 Var(X)=1.11803399
3 4
1 2 frec

0
1 2 3 4

E(X)=2.5 Var(X)=1.11803399
MUESTRA MEDIA
1 1 1 1 2 1 1 1.3333333
1 1 2 1.3333333 2 1 2 1.6666667
1 1 3 1.6666667 2 1 3 2
1 1 4 2 2 1 4 2.3333333
1 2 1 1.3333333 2 2 1 1.6666667
1 2 2 1.6666667 2 2 2 2
1 2 3 2 2 2 3 2.3333333
1 2 4 2.3333333 2 2 4 2.6666667
1 3 1 1.6666667 2 3 1 2
1 3 2 2 2 3 2 2.3333333
1 3 3 2.3333333 2 3 3 2.6666667
1 3 4 2.6666667 2 3 4 3
1 4 1 2 2 4 1 2.3333333
1 4 2 2.3333333 2 4 2 2.6666667
1 4 3 2.6666667 2 4 3 3
1 4 4 3 2 4 4 3.3333333
MUESTRA MEDIA 4 1 1 2
3 1 1 1.66667 4 1 2 2.33333
3 1 2 2 4 1 3 2.66667
3 1 3 2.33333
4 1 4 3
3 1 4 2.66667
4 2 1 2.33333
3 2 1 2
4 2 2 2.66667
3 2 2 2.33333
4 2 3 3
3 2 3 2.66667
3 2 4 3
4 2 4 3.33333
3 3 1 2.33333 4 3 1 2.66667
3 3 2 2.66667 4 3 2 3
3 3 3 3 4 3 3 3.33333
3 3 4 3.33333 4 3 4 3.66667
3 4 1 2.66667 4 4 1 3
3 4 2 3 4 4 2 3.33333
3 4 3 3.33333 4 4 3 3.66667
3 4 4 3.66667 4 4 4 4
Distribución de las medias de las
muestras
VALOR FREC
1 1
1.333333 3
1.666667 6
2 10
2.333333 12
2.666667 12
3 10
3.333333 6
3.666667 3
4 1
Distribución de las medias de las
muestras
14
12
10
8
6
4
2
0
1 1.33 1.67 2 2.33 2.67 3 3.33 3.67 4
Distribución de las medias de las
muestras
14
12
10
8
6
4
2
0
1 1.33 1.67 2 2.33 2.67 3 3.33 3.67 4

E(Xm)=2.5 Var(Xm)=0.645492722
Sea una población con media μ y
desviación típica σ.
La distribución de las medias de las
muestras aleatorias (con reposición)
de tamaño n,
tiene por media μ y desviación
típica σ/√n
Distribución de las medias de
las muestras
Teorema del límite central
Dada una población, con media μ y
desviación típica σ finitas, y
seleccionamos al azar muestras
aleatorias de tamaño n, entonces a
medida que n crece la distribución de las
medias muestrales se aproxima a una
distribución normal.
Teorema del límite central
Dada una población, con media μ y
desviación típica σ finitas, y
seleccionamos al azar muestras
aleatorias de tamaño n, entonces la
forma límite de la distribución de Z
conforme n crece indefinidamente
X 
Z ~ N ( z; 0 ,1)
 n
Distribución muestral de la media
Veremos primero el caso de que la distribución
subyacente sea normal, con media  y varianza  2
La media de la distribución muestral
de medias es 
La varianza de la distribución
muestral de medias es  2 / n

La forma de la distribución muestral de la


media muestral es normal.
Ejemplo 1
400
Distribución poblacional
subyacente (dist. Normal):
Media = 100
300 Varianza = 225
Desv. típica = 15

200

100 Distribución muestral de la


media:
Desv. típ. = 4.75
Media = 99.9 Tamaño muestral =10
0 N = 3600.00
Media = 100
82
84
86
88
90
92
94
96
98
10
10 .0
10 .0
10 .0
10 .0
11 .0
11 .0
11 .0
11 .0
.0
.0
.0
.0
.0
.0
.0
.0
.0
0
2
4
6
8
0
2
4
6.

Varianza = 225/10 =22.5


0

N10 Desv.típica = 22.5  4.74


En este y sucesivos gráficos: Número de muestras n
Ejemplo 2 Distribución poblacional
500 subyacente (dist. Normal):
Media = 100
400 Desv. Típica = 15

300

200

Distribución muestral de la
media:
100
Desv. típ. = 3.36 Tamaño muestral = 20
Media = 100.0
0 N = 3600.00
Media = 100
Varianza = 225/20 = 11.3
88

90

92

94

96

98

10

10

10

10

10

11

11

11
.0

0.

4.

2.

4.
.0

.0

.0

.0

.0

2.

6.

8.

0.
0
0

0
0

Desv. típica = 3.35


N20
Ejemplo 3 Distribución poblacional
700
subyacente (dist. Normal):
Media = 100
600
Desv. Típica = 15
500

400

300

200 Distribución muestral de la


media:
100 Desv. típ. = 2.12
Media = 99.95
Tamaño muestral = 50
0 N = 3600.00 Media = 100
93

95

97

99

10

10

10

10

10

Varianza = 225/50 = 4.5


.2

.2

1.

3.

5.

7.
.2

.2

9.
5

25

25

25
25
5

25

N50
Desv. típica = 2.12
Distribución muestral de la media
Veamos ahora el caso en que la distribución subyacente
sea arbitraria, con media  y varianza  2

La media de la distribución muestral de medias es 


La varianza de la distribución muestral de medias es  /n
2

La forma de la distribución muestral de la media


TAMBIÉN tiende a ser normal. En concreto, la
distribución muestral se acercará más y más a
la distribución normal (media  y varianza 2/n)
a medida que se aumente el tamaño de cada
muestra.
Ejemplo 4 q p p 1  qx
f ( x)  x e , x0
Distribución poblacional
subyacente (dist. Gamma):
( p)
Media = 100 E[ X ] 
p p
Var[ X ]  2
Varianza = 100 q q

0.045
0.04
0.035
0.03
0.025
0.02
0.015
0.01
0.005
0
80 85 90 95 100 105 110 115 120
Ejemplo 4
Distribución poblacional
subyacente (dist. Gamma):
500 Media = 100
Varianza = 100
400

300

200
Distribución muestral de la
media:
100
Desv. típ. = 3.12 Tamaño muestral = 10
Media = 100.0
0 N = 3600.00 Media = 100
Varianza = 100/10 = 10
90

92

94

96

98

10

10

10

10

10

11
.0

.0

.0

.0

.0

0.

2.

4.

6.

8.

0.
0

0
0

DISGAMMA Desv. típica = 10  3.16


Ejemplo 5
Distribución poblacional (dist.
EXPONENCIAL): La distribución EXPONENCIAL tiene 1
Media = 0.1 = 1/ parámetro: (en el ejemplo: 10)

Varianza = 0.01 = 1/2

12

10

0
0 0.1 0.2 0.3 0.4 0.5 0.6
Ejemplo 5
400 Distribución poblacional (dist.
EXPONENCIAL):
Media = 0.1 = 1/
300
Varianza = 0.01 = 1/2

200

100
Distribución muestral de la
Desv. típ. = .03 media:
Media = .100
0 N = 3600.00 Tamaño muestral = 10
Media = 0.1
.0
.0
.0
.0
.0
.0
.1
.1
.1
.1
.1
.1
.1
.1
.2
.2
.2
.2
56

94
06

69

19
31
44

69
81

19
31
44
56

81
94
06

31
44

EXPON10 Varianza = 0.01/10 = 0.001


Desv. típica = 0.03
Observad que la dist. muestral se aproxima a la normal
Ejemplo 5b
500 Distribución poblacional (dist.
EXPONENCIAL):

400
Media = 0.1 = 1/
Varianza = 0.01 = 1/2
300

200

Distribución muestral de la
100
Desv. típ. = .02 media:
Media = .099
Tamaño muestral = 20
0 N = 3600.00

Media = 0.1
.0

.0

.0

.0

.0

.1

.1

.1

.1

.1

.1

.1

.1
44

56

69

81

94

06

19

31

44

56

69

81

94

Varianza = 0.01/20 = 0.0005


EXPON20
Desv. típica = 0.022
Distribuciones usadas en inferencia
Distribución Ji-Cuadrado o Chi-cuadrado o 2 de
Pearson con “n” grados de libertad.
Sean X1 , X2 , ... ,Xn n variables aleatorias continuas
independientes tal que Xi = N (0,1)
con i = 1, ..., n (i.i.d.). Definamos la variable
aleatoria: n
Y   X i  n
2 2

i 1 n y
1 
y 2
e 2
Su densidad de probabilidad fY ( y )  n
, x0
será: n
2  
2

2

la función gamma es:   1   y e  y dy
0

E Y   n Var Y   2n
Distribución Muestral de S2
Si S2 es la varianza de una muestra
aleatoria de tamaño n que se toma de una
población normal que tiene la varianza
entonces el estadístico:

(n  1) S 2 n
 Xi  X  2
 
2
 2
 
i 1  2

tiene una distribución ji cuadrada con n -1


grados de libertad.
Distribución Muestral de ( n  1) s 2
*
 2

Probability Density Function


y =chi2(x,10)
0.175

0.131

0.087

0.044

0.000
0.00 6.25 12.50 18.75 25.00
Si X se distribuye como N (  ,  )
xx
Tipificando  se distribuye como N (0,1)

n

 i n
X  
2
2

 x  x
2
se distribuye como 12
i 1
2
n n
1
s* 
2
  x  x     x  x   (n  1)s*
2 2 2

n  1 i 1 i 1

(n  1) s
2
2
2
*
se distribuye como  n 1

TABLA DE 2
orden percentílico

n 0.99 0.975 0.025 0.01


p
1
2
3
4 2n
5

grados de libertad
valores acumulados de 2n
Usos de la Ji-Cuadrado
a) Para hacer inferencias acerca de la varianza
poblacional. Es decir, para calcular Intervalos
de Confianza y Prueba de hipótesis para la
varianza poblacional.
b) Para hacer pruebas de Bondad de Ajuste. O
sea, para probar si un conjunto de datos sigue
una distribución pre-determinada.
c) Para hacer análisis de tablas de contingencia.
Distribución t de Student
Student era el seudónimo de W.S. Gosset, un pionero
estadista que trabajó en la Cervecería Guiness de Dublín.
Sea X v.a.c. tal que X ~ N (0,1)
Y v.a.c. tal que Y ~ 2n X
tn 
Y
Con función de densidad de probabilidad:
n
n 1

 n 1  t 
2 2
 1  
 2  n
f T (t )  , t 
n
n 
2
Distribución t de Student

Supongamos que la población es normal con


media y varianza desconocida y que se
desea hacer inferencias acerca de , basada
en una muestra pequeña (n < 30) tomada de
la población. En este caso la distribución
X
de la media muestral ya no es normal,
sino que sigue la distribución t de Student.
Distribución t de Student

Si de una población Normal con media  y


desviación estándar  se extrae una muestra
de tamaño n, entonces el estadístico:
x 
t 
s
n
se distribuye como una t de Student con n-1
grados de libertad.
La distribución t de Student es bastante
similar a la Normal Estándar, con la
diferencia que se aproxima más lentamente
al eje horizontal.

El parámetro de esta distribución son los


grados de libertad.
Curva Normal Estandar y T con 5 grados de libertad

0.4
Curva Normal
Estandar
0.3

0.2
C2

0.1
t con 5gl.

0.0

-4 -3 -2 -1 0 1 2 3 4

x
Hecho por Edgar Acuna
n
Et   0 Var  t  
n2
x 
t 
s
n
Cuando la distribución de la población
de la que obtenemos las medias
muestrales no es normal, el estadístico
anterior, se distribuye como una normal
tipificada para valores de n > 30.
TABLA DE LA DISTRIBUCION t DE
STUDENT
orden percentílico

n t.55 t.60 t.99 t.995

1
2
3
4
5

tp
grados de libertad valores
acumulados de tp
Distribución F de Fisher o F-Snedecor
Sea X v.a.c. tal que X ~ 2n
Y v.a.c. tal que Y ~ 2m independientes
X
inamos Z n  F ( n, m )
Y
m
nm
n/2
n m 
n/2
 n 1 nm
 2  2 
f Z ( z)  z ( n  m) 2 , z0
n m
   
2  2 
m 2m ( n  m  2)
2
E Z   V Z  
m2 n( m  2 ) ( m  4 )
2

(m,n)
s / 2
x*
2
x
Distribución muestral del estimador s /  2 2
y* y

Cuando las distribuciones de la que obtenemos


las varianzas muestrales son normales:
N ( x , x ) y N ( y , y )
y extraemos dos muestras de tamaño n y m
respectivamente. El estadístico anterior se
distribuye según la distribución F de Fisher con
n - 1 grados de libertad en el numerador y m -1
grados de libertad en el denominador, Fn-1, m-1.

También podría gustarte