Está en la página 1de 16

Probabilidad y estadística

UNIDAD 6.
A - DISTRIBUCIÓN POR MUESTREO
B - ESTIMACIÓN DE PARÁMETROS
Probabilidad y estadística

UNIDAD 6.
A - DISTRIBUCIONES POR MUESTREO
Distribuciones por muestreo

Muestra aleatoria simple de tamaño n: {X1,X2,…,Xn}


- Todas las variables aleatorias son independientes entre si
- Todas tienen la misma distribución de probabilidades

Estadística/estadístico
Medida resumen que surge a partir de los datos de una
muestra
- Es una variable aleatoria
- Tiene una distribución por muestreo
Distribuciones por muestreo
Estadísticos más utilizados:
- Media muestral x
x  i
n
- Variancia y desvío estándar muestrales
2
( xi  x)
S  2
;S  S 2

- Proporción muestral
n  1
x
p
n
donde x es la suma de unidades que cumplen con una
característica de interés
Ejemplo
Un centro de servicio automotriz cobra $40, $45 y $50 por la
afinación de carros de cuatro, seis y ocho cilindros,
respectivamente.
Si 20% de sus afinaciones se realizan en carros de 4 cilindros,
30% en carros de 6 y 50% en carros de 8, entonces la
distribución de probabilidad de los ingresos por una
afinación seleccionada al azar está dada por:
Ejemplo
Si calculamos la media y la variancia de esta variable: ingresos
por una afinación:

   xi * p( xi )  (40 * 0,2)  (45 * 0,3)  (50 * 0,5)  46,5

 2   ( xi   ) 2 * p ( xi )  (40  46,5) 2 * 0,2  ...  15,25

   2  15,25  3,9
Ejemplo
Suponiendo que en un día particular sólo se realizan dos trabajos
de servicio que implican afinaciones, definimos X1 y X2 como
ingreso por primera y segunda afinación, entonces las posibles
muestras aleatorias de tamaño dos, son:

Muestra X1 X2 p(X1) p(X2) p(X1;X2)


1 40 40 0,2 0,2 =0,2*0,2=0,04
2 40 45 0,2 0,3 0,06
3 40 50 0,2 0,5 0,1
4 45 40 0,3 0,2 0,06
5 45 45 0,3 0,3 0,09
6 45 50 0,3 0,5 0,15
7 50 40 0,5 0,2 0,1
8 50 45 0,5 0,3 0,15
9 50 50 0,5 0,5 0,25
Ejemplo
Si en cada muestra de tamaño dos, calculamos la media que
resulta, tendremos que:
Muestra X1 X2 (X1+X2)/2 p(X1;X2) Pasando en
limpio:
1
2
40 40 =(40+40)/2=40
40 45 42,5
0,04
0,06 x
40
px 
0,04
3 40 50 45 0,1
4 45 40 42,5 0,06 42,5 =0,06+0,06=0,12
5 45 45 45 0,09 45 0,29
6 45 50 47,5 0,15
47,5 0,30
7 50 40 45 0,1
8 50 45 47,5 0,15 50 0,25
9 50 50 50 0,25 Total 1,0
Ejemplo
Ahora conocemos la distribución de probabilidad del estadístico
“media muestral”: X
x
40
px
0,04
Si calculamos la esperanza de la
media muestral:

   
42,5 =0,06+0,06=0,12

45 0,29 E X   X   xi * p x i 
47,5 0,30
 (40 * 0,04)  (42,5 * 0,12)  ...
50 0,25

Total 1,0  46,5  


La Esperanza de la media muestral es igual a la esperanza de la
variable original, y además se puede demostrar que la variancia 2
tiene relación con la variancia de la variable original: V X    2 X 

n
Distribución de la media muestral
Sea X la media muestral que surge de una muestra aleatoria de
tamaño n de una variable aleatoria X con E(X)=μ y Var(X)=σ2
se demuestra que:

Esperanza:  
E X  X  

  2
Variancia: V X   X 
2
n

Desvío estándar:  
sd X   X 

n
Teorema central de límite (TCL)
Sean X1, X2, . . . , Xn una muestra aleatoria de una
distribución con media μ y varianza σ2.
Entonces si n es suficientemente grande (n>30), X
tiene aproximadamente una distribución normal con:

 
E X  X  
y
 
V X   2X 
2
n

Es decir: 2

X ~ N(  , )
n
Distribución muestral de la proporción (p)

Proporción de éxitos: p=x/n

Por T.C.L, si el tamaño de muestra es suficientemente


grande:

E ( p)  
 (1   )
y V ( p) 
n
Donde π es la proporción poblacional, entonces:

 (1 -  )
p ~ N( , )
n
Distribución de la diferencia entre dos medias

Si se tiene una población con una variable X1 con


E(X1)=μ1 y Var(X1)=σ12 y otra población con una
variable X2con E(X2)=μ2 y Var(X2)=σ22 y se desea
estudiar la diferencia entre ambas medias:
Δμ=μ1-μ2
Tenemos que:
2 2
 
 X ~ N( ,  )1 2
n1 n 2
Distribución por muestreo de la diferencia
entre dos proporciones

 1 (1 -  1 )  2 (1 -  2 )
p ~ N( ;  )
n1 n2
Distribución t - Student
Distribución de la media muestral o de la diferencia de
medias cuando no se verifica T.C.L.
 No se conoce la distribución original de la variable
 Tamaño de la muestra pequeño (n<30)
 No se conoce el desvío de la población, sino que lo
estimamos a partir de una muestra:

X 
T ~ t(n-1 )
sx
n
Distribución de la varianza muestral

0.10
2

0.08
2 2
s n 1  n 1
n 1

0.06
d

0.04
0.02
2
(n  1) S
0.00
2
2
~  n -1
0 10 20

x
30 40

También podría gustarte