Está en la página 1de 26

UNIVERSIDAD DE SANTIAGO DE CHILE

FACULTAD DE CIENCIA
DEPARTAMENTO DE MATEMÁTICA Y CIENCIAS DE LA COMPUTACIÓN

ANÁLISIS ESTADÍSTICO PARA INGENIERÍA

FRANCISCO VALENZUELA ROJAS


Primer Semestre 2016
Presentación 08: Muestras Aleatorias y distribuciones de muestreo

FRANCISCO VALENZUELA ROJAS 0


CONCEPTO DE PARÁMETRO Y ESTADÍSTICO
Parámetro: Es una característica de una población. Matemáticamente, es una
constante que identifica por completo a una función de densidad de probabilidades.
Ejemplos:

1. En una distribución normal, la media µ y la varianza σ2 son sus parámetros.


2. En una distribución exponencial, su parámetro es λ.
Estadístico o Estimador: Es una función de la muestra. La inferencia estadística
se basa en él para estimar los parámetros desconocidos de una población,
modelada por una distribución de probabilidades. Naturalmente, un estadístico no
depende de parámetros desconocidos, y también un estadístico es una variable
aleatoria.

Ejemplos: n

X i

1. Media muestral: X  i 1
n

 X 
n
2
i  X
2. Varianza muestral: S 2  i 1
(pronto veremos por qué dividir por n-1)
n 1
3. Máximo de la muestra:
X n   maxX 1 , X 2 ,..., X n 
FRANCISCO VALENZUELA ROJAS 1
CONCEPTO DE MUESTRA ALEATORIA
Si X 1 , X 2 ,..., X n son n variables aleatorias independientes, donde cada una de ellas

tiene la misma distribución de probabilidad (es decir, X i ~ f x |   , para i=1,….n),

entonces  X 1 , X 2 ,..., X n  constituye una muestra aleatoria de la población

infinita, modelada por f. En base a este hecho, la distribución conjunta de f

puede escribirse como el producto de las densidades marginales de cada variable

aleatoria, esto es: n


f X1 , X 2 ,...,X n x1 , x2 ,..., xn |     f X i xi |  
i 1

Usamos la muestra para obtener información sobre el parámetro  . A la función


  n
L  ; x   f X i xi |  
~
i 1

llamaremos función de verosimilitud de  , correspondiente a la muestra

x   X 1 , X 2 ,..., X n  (Note que L es una función de  )


~

2
DISTRIBUCIÓN DE LA MEDIA

Si  X1, X 2 ,..., X n  es una muestra aleatoria de una población infinita, donde

E X i    y Var  X i    2 , entonces

  1 n  1 n
E X  E   X i    E  X i    n   
1
 n i 1  n i 1 n

  1 n  1 2
n
Var  X i   2  n 
1
Var X  Var   X i   2  2

 n i 1  n i 1 n n

Por independencia de las Xi, al ser m.a.(n)

FRANCISCO VALENZUELA ROJAS 3


ALGUNOS TEOREMAS PREVIOS IMPORTANTES

1. Si X 1 , X 2 ,..., X n es una muestra aleatoria de tamaño n de una distribución


normal con media µ y varianza σ2, entonces
n

X i
X i 1
n
2
Tiene distribución normal, con media  X   y varianza  
2
X
n

Demostración: Utilice la independencia de las Xi , y el hecho de que una combina-


ción lineal de variables aleatorias normales también es normal.

FRANCISCO VALENZUELA ROJAS 4


Ejemplo: Si las mediciones del peso específico de un metal puede considerarse
como una muestra aleatoria de una población normal cuya desviación estándar
es de 0,04 gramos, ¿Cuál es la probabilidad de que la media de una muestra aleatoria
de tamaño 25 difiera a lo sumo por 0,02 de la media poblacional?

Solución:
X = peso específico de un metal  X ~ N , 2
 0,04 gramos 2
2



 X ~ N  , 
2 0,04 2
2

gramos   Z ~ N 0,1, Z 
X 
 25   n

  
P X    0,02  P  0,02  X    0,02 
  0,02 X  0,02 
 P   
 Estandarizando
 0,04 25  n 0,04 25 
 P 2,5  Z  2,5
  2,5    2,5
 0,9938  0,0062
 0,9876
FRANCISCO VALENZUELA ROJAS 5
2. Si X 1 , X 2 ,..., X n es una muestra aleatoria de tamaño n de una distribución
normal con media µ y varianza σ2, entonces

Xi  
Zi  son n variables aleatorias normales estándar independientes, y

 Xi   
n n 2

 Z i
2
  
i 1  


tiene una distribución ji cuadrada (χ2 ) con υ=n grados de
i 1 libertad.

3. Si X 1 , X 2 ,..., X n es una muestra aleatoria de tamaño n de una distribución


normal con media µ y varianza σ2, entonces

n  1S   X i  X  
2
2 n  1 n
  ~  n21 ,donde  (varianza
2
S 
2
Xi  X
2    n  1 i 1 Muestral)
i 1  

Siendo en consecuencia X y S 2 variables aleatorias independientes

FRANCISCO VALENZUELA ROJAS 6


FRANCISCO VALENZUELA ROJAS 7
Ejemplo: Si X1,X2,.., Xn es una muestra aleatoria de tamaño 25 de una
distribución normal con varianza 6, calcule la probabilidad de que la
muestra, tenga una varianza muestral:

a) Mayor a 9,1
b) Entre 3,462 y 10,745
Solución:
n  1S 2 ~  2
a) Como sabemos que n 1 , tenemos que:
2

 n  1S 2 25  1  9,1 


 2

P S  9,1  P  
 
2
6 

 P 12 ; 24  36,4 
 0,05

b) P 3,462  S  10,745  P
2 
 25  1  3, 462

n  1S 2

25  110,745 
 2 
 6 6 

 P 13,848  12 ; 24  42,98 
 0.99  0,05
 0,94
FRANCISCO VALENZUELA ROJAS 8
4. Si Z es una variable aleatoria normal estándar, y W es una variable aleatoria con
distribución χ2 con υ = n grados de libertad. Siendo Z y W independientes,

Z
T tiene distribución t con υ grados de libertad
W


Aplicación importante:  X 1 , X 2 ,..., X n  m.a. (n), X i ~ N  ,  2 
Entonces Z 
X 
~ N 0,1 . Por teorema anterior, W 
n  1 S 2
~  n21
 n  2

En consecuencia:

X 
Z  n X  (usamos la distribución T para realizar
T   ~ t n 1
W n  1S 2 S n inferencia sobre la media de la población,
cuando tenemos varianza poblacional
 2 desconocida).
n  1
FRANCISCO VALENZUELA ROJAS 9
GRÁFICO DE LA DISTRIBUCIÓN T, PARA DIFERENTES GRADOS DE LIBERTAD
Y SU RELACIÓN CON LA DISTRIBUCIÓN NORMAL ESTÁNDAR

 1   1 
  2  2 
 2   t  
f (t )*  1  
    
, recuerde que     x 1e  x dx
   0
2
N(0,1)
v2

v 1

* (DEDUCCIÓN DE ESTA DISTRIBUCIÓN,


AL FINAL DE ESTA PRESENTACIÓN, en
ANEXO)

FRANCISCO VALENZUELA ROJAS 10


FRANCISCO VALENZUELA ROJAS 11
Ejemplo: Una organización independiente mide el contenido de nicotina de 16
cigarrillos de una cierta marca, donde la desviación estándar muestral es de 0,175
mg. Si se supone que la cantidad de nicotina en estos cigarrillos es una variable
aleatoria normal, ¿qué tan probable es que la media muestral, dado el dato
proporcionado por la organización exceda a la media poblacional en más de 0,1 mg?

Solución:
X = contenido de nicotina (mg) X ~N(µ,σ2) (note que media y
varianza son desconocidas)

X 
S  0,175mg T ~ t161
S n

   X 
P X    0,1  P 
0,1 


 S n 0,175 16 
 Pt1 ;15  2,286
 1  Pt1 ;15  2,286
 1  0,9825
 0,0175
FRANCISCO VALENZUELA ROJAS 12
5. Si W1 y W2 son variables aleatorias independientes, cada una con distribución
χ2 con ν1 y ν2 grados de libertad, respectivamente, se tiene que

W1  1 (es decir, F tiene distribución F con ν1 y ν2


F ~ F 1 , 2 grados de libertad en numerador y denominador,
W2  2 respectivamente)

Aplicación importante:  X1, X 2 ,..., X n  m.a. (n),  X i ~ N  X ,  X2 


Y1 , Y2 ,..., Ym  m.a. (m), Y ~ N  i Y ,  Y2 

n  1S X
2
~ 
m  1SY
2
~  m2 1
y
2
W1 n 1 W2
 X2  Y2

n  1S X2 n  1
W  X 2
S X2  Y2 S X2  Y2
F 1 1   2  2  2  2 ~ Fn 1,m1
W2  2 m  1SY2  X S Y SY  X
m  1
 Y2
1
Teorema: F ; 1 ; 2 
F1 ; 2 ;1
FRANCISCO VALENZUELA ROJAS 13
FRANCISCO VALENZUELA ROJAS 14
FRANCISCO VALENZUELA ROJAS 15
FRANCISCO VALENZUELA ROJAS 16
Ejemplo: Si S12 y S22 representan las varianzas de muestras aleatorias independientes
de tamaño n1=25 y n2 = 31, que se toman de poblaciones normales con varianzas

 12  10 y  22  15 , respectivamente, encuentre  S12 


P 2  1,26 
 S2 

 S12   S12  22
Solución: P 2  1,26   P 2  2  1,26 
15 
2
  PF1 ; 24;30  2,835
S  S  2 
10 
 2   2 1
 1  0,995  0,005

Otro ejemplo: Calculemos algunos valores de la Tabla F:

f 0,95;7;15  2,71 1 1
f 0,01; 28;12    0,3453
f 0,95;15;7  3,5108 f 0,99;12; 28 2,8959
f 0,99;24;19  2,9249
1 1
f 0,05;19; 24    0,4730
f 0,95; 24;19 2,1141
FRANCISCO VALENZUELA ROJAS 17
TEOREMA CENTRAL DEL LÍMITE

Si  X1, X 2 ,..., X n  es una muestra aleatoria de una distribución con media

µ y varianza σ2, si n es suficientemente grande, se tiene que la distribución de

es aproximadamente normal, con media  X   y varianza 


2
X
2
X

n
X 
Equivalentemente: bajo las condiciones impuestas, Z ~ N 0,1
 n
cuando n   (en la práctica, n  30 , sin importar la forma de la población)

Ejemplo: Una máquina de refrescos está arreglada, de tal modo que la cantidad
de bebida que sirve es una variable aleatoria con una media de 200 ml y una
desviación estándar de 15 ml. ¿Cuál es la probabilidad de que la cantidad promedio
servida en una muestra aleatoria de tamaño 36 sea al menos 204 litros?

Solución:

  
P X  204  P Z 
204  200 
15 36 
  PZ  1,6  1   1,6  1  0,9452  0,0548

FRANCISCO VALENZUELA ROJAS 18
Interpretación gráfica del Teorema Central del límite:

Distribución de probabilidad uniforme


en (0,1)
35000
30000
Frecuencia

25000
20000
15000
10000
5000
0 Frecuencia

Clase

Distribución de muestreo de la media


muestral X, X~U(0,1)
100
Frecuencia

80
60
40
20
0 Frecuencia

Clase

FRANCISCO VALENZUELA ROJAS 19


Frecuencia
Frecuencia

100

0
20
40
60
80
100000
150000
200000
250000

0
50000
0
0.516129032
1.032258065
1.548387097
2.064516129
2.580645161
3.096774194
3.612903226
4.129032258
4.64516129
5.161290323
5.677419355
6.193548387
6.709677419

Clase
7.225806452
7.741935484
8.258064516
Clase

8.774193548
(λ=4)

9.290322581
9.806451613
10.32258065
10.83870968
11.35483871
donde X~Poisson(λ=4)

11.87096774
12.38709677
12.90322581
13.41935484
13.93548387
Distribución de la media muestral X,

14.4516129
14.96774194
15.48387097
y mayor...
Histograma de una Distribución de Poisson
Interpretación gráfica del Teorema Central del límite:

Frecuencia
Frecuencia

FRANCISCO VALENZUELA ROJAS


20
DISTRIBUCIÓN DE p̂
Si X 1 , X 2 ,..., X n es una muestra aleatoria de tamaño n, de X, X ~ Bin 1, p 
0, si no se observa la característica de interés (fracaso)
Es decir: Xi  
 1, si se observa la característica de interés (éxito)

De lo anterior, se tiene que E(X)=p y Var(X)=p(1-p).


n

X i
número de éxitos
Definiendo la proporción muestral pˆ  i 1
 , se tiene que:
n n

 n X i  1  n X i  1 p1  p 
E  pˆ   E  i 1    np  p y Var  pˆ   Var  i 1   2  np1  p  
 n  n  n  n n
   
Utilizando el Teorema Central del límite, se tiene que la proporción muestral
n

X i
 p (1  p ) 
pˆ  i 1
~ N  p,  , para n suficientemente grande.
n  n 
pˆ  p
En consecuencia, Z  ~ N 0,1 , para n suficientemente grande.
p(1  p)
n FRANCISCO VALENZUELA ROJAS 21
ANEXO: DEDUCCIÓN DE LA DISTRIBUCIÓN T

Z ~ N 0,1
Z
Se define la variable aleatoria T como T , donde
W

y W ~  v2 . Necesitamos obtener la distribución de la variable aleatoria T.

Suponiendo que Z y W son variables aleatorias independientes, podemos


escribir la función de densidad conjunta de Z y W, como el producto de sus
densidades marginales, esto es:

 1 
z2
1
  v 2 1  w 2
f Z ,W  z , w  
2
e w e
2 2 v 2 
v 2  ,    z  , w  0

 0 , e.o.c

Z R
T Z T
W 
Definiendo  Despejando Z y W

R W W R

FRANCISCO VALENZUELA ROJAS 22


Mediante el Teorema de Transformación de Variables, tenemos que

 r 
fT , R t , r   f Z ,W  t , r   J J Es el Jacobiano de la Transformación,
 v  dado por:

z z
r t
J  t r  r
w w  2 r 
0 1

t r
Por lo tanto:

 r 
fT , R t , r   f Z ,W  t , r   J
  
1 t 2r
1   1 r
 2 1  r 2
 e 2 
 r e 
2 2 2  2  

FRANCISCO VALENZUELA ROJAS 23


Simplificando la expresión anterior, nos queda

r  t 2 

  1
fT , R t , r  
1 2    2 1

e r r
2 2  2 
 2

Como se desea obtener la distribución de la variable aleatoria t, calculamos


su función de densidad marginal:

r  t 2 

   1
fT t    f t , r dr 
1 2    2 1

 2  

 2
e r r dr
2 2
T ,R
0
Re c R

r  t2  ds
Haciendo el cambio de variable s  1     dr
2   1 t  2
1  
2   
2s
Además, 2
r De donde podemos escribir:
t
1

FRANCISCO VALENZUELA ROJAS 24
Luego, la integral anterior puede reescribirse como:
r  t2 
   1 
f T t   f T , R t , r dr 
1 2    2 1

Rec R 2 2  2
 2   0
e 
r r dr 

 1
1
 2s 
1  1
 

2

 2  
 e  s   2 1  t 2
  ds 
1 t  
 2
2 2  
0 2

  1 
    1
1   t 2
  2  1

 2  
 e 1 
s
 22 2  s 2 2
ds 
2 2  2 0
  
  1 
   1
1  t 2
  2   1
 1 
  2   


0
s 2
e  s ds 

  1 
 
   1
2  2 
1 t
 1    
  2      2 

 1   1 
Finalmente:
   
   t2   2 
 fT t  
2
T ~ T  1  
  2    
FRANCISCO VALENZUELA ROJAS 25

También podría gustarte