Está en la página 1de 33

DISTRIBUCIONES DE MUESTREO

Distribución de la media muestral


Distribución de la diferencia de medias muestrales
Distribución t de student
Distribución de la proporción muestral
Distribución de la diferencia de proporciones muestrales
Distribución chi cuadrada
Distribución F de Fisher
CONCEPTOS GENERALES
¢ En el campo de la inferencia estadística el estadístico se
interesa en llegar a conclusiones con respecto a la población
cuando es imposible o poco práctico observar todo el
conjunto de observaciones que constituyen la población.
Por tanto, debemos depender de un subconjunto de
observaciones de la población para ayudarnos a hacer
inferencias a la misma población. Esto nos lleva a
considerar la noción de muestreo.
¢ Una muestra es un subconjunto de una población , que
tiene las siguientes características:

å (x i - x) 2
x= åx
i
i /n ; S2 = i
n -1
CONCEPTOS GENERALES….

¢ El campo de la inferencia estadística trata


básicamente con generalizaciones y predicciones.
Un estadístico es una variable aleatoria que depende
sólo de la muestra observada, y debe tener una
distribución de probabilidad.

¢ La distribución de probabilidad de un estadístico se


llama distribución muestral.
DISTRIBUCION MUESTRAL DE LA MEDIA

¢ La primera distribución muestral importante a


considerar es la de la media x
¢ Suponga que una muestra aleatoria de “n”
observaciones se toma de una población normal
con media µ y varianza σ2 , cada observación xi
para i=1,2,3…n, de la muestra tendrá la misma
distribución normal que la población que se
muestrea.
DISTRIBUCION MUESTRAL DE LA MEDIA
La media y varianza de la distribución de medias
muestrales tiene las siguientes características:

x = ( x + x + x + ... + x ) / n
1 2 3 n

Tiene una distribución normal con media


µ + µ + µ + ... + µ
µ = 1 2
=µ 3 n
x
n
s
2

y var ianza s =
2
x
x
n
DISTRIBUCIÓN DE MEDIAS DE MUESTRAS
¢ Para comenzar el estudio de la distribución de medias de
muestras (distribución muestral), se considerará una
población finita y pequeña. Por ejemplo: se tienen cinco
agentes de ventas en una distribuidora de automóviles. A
continuación se enlistan los cinco agentes y el número de
automóviles que vendieron el mes pasado.

Automóviles vendidos por Cinco agentes


Agente de ventas Automóviles vendidos
Pedro Moreno 2
Fernando F. 3
Antonio Z. 6
César Gómez 8
Rogelio Márquez 9
DISTRIBUCIÓN DE MEDIAS MUESTRALES…
¢ Se tomará ahora a los cinco agentes como población de
origen y, dado que se trabajará en términos de muestras y
numéricamente, se puede representar a cada vendedor por
el número de automóviles vendidos. Si se asigna a cada
vendedor la misma probabilidad (1/5) de ser extraído para
una muestra, se tiene una población discreta (2,3,6,8,9), con
distribución de probabilidad uniforme y con parámetros µ =
5.6 , σ2 = 7.44 y σ = 2.728.
¢ Si se quiere hacer un muestreo de esta población el tamaño
de muestra puede estar entre 2 ≤ n ≤ N. Se tomará el
tamaño más pequeño posible, en este caso n = 2 y
considerando el muestreo con reemplazo.
¢ El número total de muestras que se pueden sacar de esta
población serán 25 muestras, las cuales se presentan a
continuación en el siguiente cuadro:
DISTRIBUCIÓN DE MEDIAS MUESTRALES…

Población de y sus medias, n=2


muestras
2 3 6 8 9

2 (2,2) (2,3) (2,6) (2,8) (2,9)


2 2.5 4 5 5.5
3 (3,2) (3,3) (3,6) (3,8) (3,9)
2.5 3 4.5 5.5 6
6 (6,2) (6,3) (6,6) (6,8) (6,9)
4 4.5 6 7 7.5
8 (8,2) (8,3) (8,6) (8,8) (8,9)
5 5.5 7 8 8.5
9 (9,2) (9,3) (9,6) (9,8) (9,9)
5.5 6 7.5 8.5 9
DISTRIBUCION DE MEDIAS MUESTRALES…
¢ La probabilidad de cada una de las muestras es
la misma e igual a 1/25, de modo que la
distribución de probabilidad de las medias
muestrales es :
Distribución de medias muestrales, n = 2

x 2 2.5 3 4 4.5 5 5.5 6 7 7.5 8 8.5 9

1/25 2/25 1/25 2/25 2/25 2/25 4/25 3/25 2/25 2/25 1/25 2/25 1/25
P(x)
DISTRIBUCIÓN DE MEDIAS MUESTRALES…

¢ La media y desviación estándar de la distribución


son, respectivamente:

2 + 2.5 * 2 + 3 + 4 * 2 + ... + 8.5 * 2 + 9


µx = = 5.6 = µ
25
( 2 - 5. 6) 2
+ 2( 2. 5 - 5. 6) 2
+ ... + (9 - 5. 6) 2
s x2 = = 3.72
25
s x = 1.929 = s / n = 2.728 / 2 = 1.9289873
HISTOGRAMA DE LA DISTRIBUCIÓN DE MEDIAS MUESTRALES

Histograma
10

6
Frecuencia

5
Series1
4

0
2.8 y menos 2.8 4.6 6.4 8.2 10 y mayor...
Clase
DISTRIBUCIÓN DE MEDIAS MUESTRALES
¢ En el histograma de la distribución de medias muestrales
se observa una distribución aproximadamente normal
(simetría). Cabe ahora hacer un análisis de los resultados
obtenidos:
¢ Análisis de la distribución de medias muestrales, n = 2
¢ La media de la distribución y la media de la población
original son iguales , µ = µx

¢ La varianza de la distribución es la mitad de la población


de origen, s = s y por lo tanto s
2

s
2

x
2 =
x
n
¢ De una distribución de probabilidad uniforme de la
población original, se pasa a una distribución,
aproximadamente normal , de medias de muestras
(distribución de medias muestrales).
TEOREMA DEL LIMITE CENTRAL

¢ Si x es la media de una muestra aleatoria de


tamaño n tomada de una población con media µ y
varianza σ2 , entonces la forma límite de la
distribución de
x-µ
z=
¢ s/ n

¢ Conforme n→α , es la distribución normal estándar


n (z; 0,1 )
DISTRIBUCION MUESTRAL DE LA MEDIA…

¢ Curva de distribución normal estándar con media 0 y


varianza 1.
TEOREMA DEL LIMITE CENTRAL…

¢ La aproximación normal para x por lo general


será buena si n ≥ 30 sin importar la forma de la
población. Si n < 30, la aproximación es buena si
la población no es muy diferente de una
distribución normal, y como se dijo antes, si se
sabe que la población es normal, la distribución
muestral de x seguirá una distribución normal
exacta, no importa qué tan pequeño sea el
tamaño de las muestras.
DISTRIBUCION DE MUESTREO DE LA PROPORCION
¢ Al tratar con una variable binomial, en la cual cada
resultado puede ser: masculino, femenino, satisfecho, no
satisfecho, a los resultados posibles se les podrían asignar
resultados de 1 a 0 para representar la presencia o
ausencia de la característica. Si en una muestra de n = 5
empleados, tres estuvieran satisfechos con su trabajo y dos
no lo estuvieran, se podría calcular la proporción de
empleados de la muestra que están satisfechos con su
trabajo ,como 0.60.
¢ La proporción de muestra p puede definirse como:
¢

x número de eventos éxitos


p= =
n tamaño de la muestra
DISTRIBUCION DE MUESTREO DE LA PROPORCION…

¢ La estadística p es un estimador de la proporción


de la población p.
np
µ = = p
p
n

npq pq
s = =
p
n n
DISTRIBUCION MUESTRAL DE LA PROPORCION…

¢ Se modifica la ecuación anterior de manera que


podamos utilizarla para derivar la media de la
distribución de muestreo de la proporción de
éxitos.
¢ La distribución de muestreo de la proporción en
realidad seguirá la distribución binomial. Sin
embargo, la distribución normal puede usarse
para aproximar la distribución binomial cuando
np y nq ≥ 5.
p- p p- p
z = =
s p
pq
n
DISTRIBUCION MUESTRAL DE LA PROPORCION
¢ Curva de distribución muestral de la proporción con media
de 0.40 y desviación estándar de 0.035
DISTRIBUCIÓN MUESTRAL DE S2
¢ Si se extrae una muestra aleatoria de tamaño n
de una población normal con media µ y varianza
σ2 , y se calcula la varianza muestral S2,
podemos considerar la distribución de la
estadística :
n n

å ( x - x) å ( x - x)
2 2
(n - 1) S 2

S = = =
i i
2 i =1 i =1

n -1 s 2
s 2
DISTRIBUCION MUESTRAL DE S2 …

¢ Si S2 es la varianza de una muestra aleatoria de


tamaño n que se toma de una población normal que
tiene la varianza σ2 , entonces la estadística

å ( x - x)
2
(n - 1) S 2

c = =
i
2 i =1

s 2
s 2

tiene una distriución ji cuadrada con v = n - 1 grados de libertad


DISTRIBUCIÓN MUESTRAL DE S2…
¢ Los valores de la variable aleatoria χ2 se calculan de cada
muestra mediante la fórmula:
¢ χ2= (n-1) S2/σ2
¢ La probabilidad de que una muestra aleatoria produzca un
valor χ2 mayor que algún valor específico es igual al área
bajo la curva a la derecha de este valor. Se acostumbra
representar con ca el valor c
2 2
por arriba del que
encontramos un área de α.

¢
DISTRIBUCIÓN T DE STUDENT

¢ El teorema del límite central se utiliza para


hacer inferencias acerca de la media de la
población o la proporción. Sin embargo, para
utilizar el teorema del límite central se supuso
que la varianza o desviación estándar de la
población se conoce.
¢ Sin embargo, en muchos casos no se conoce la
desviación estándar y se tiene que hacer una
estimación de S. Como resultado, una estadística
natural a considerar para tratar con las
inferencias sobre µ es :
x - µ
¢
t =
S
n
DISTRIBUCIÓN DE PROBABILIDAD DE T DE STUDENT
¢ La función de densidad de T es

¢ donde ν es igual a n − 1.
— La distribución de T se llama ahora la distribución t de
Student.
¢ El parámetro v representa el número de grados de
libertad. La distribución depende de v , pero no de µ o σ ,
lo cual es conveniente en la práctica.
DISTRIBUCIÓN T DE STUDENT…
¢ Para derivar la ecuación de esta distribución, W.S.
Gosset supone que las muestras se seleccionan de una
población normal. La distribución “t” es similar a la
distribución “z”, pues ambas son simétricas alrededor
de una media de cero.
¢ Ambas distribuciones tienen forma de campana, pero
la distribución “t” es más variable, debido al hecho de
que los valores de “t” dependen de las fluctuaciones de
dos cantidades, x y S2 , mientras que los valores de
“z” dependen sólo de los cambios de x de una
muestra a otra.
¢ Unicamente cuando el tamaño de la muestra tiende a
ser grande las dos distribuciones serán la misma.
DISTRIBUCION T DE STUDENT…
¢ Curva de distribución “t” para v = 10 grados de libertad
DISTRIBUCION T DE STUDENT…
¢ Se acostumbra representar con tα , el valor de “t”
por arriba del cual encontramos un área igual a
α. De aquí, el valor t con 10 grados de libertad
que deja un área de 0.025 a la derecha es, t =
2.228. Como la distribución t es simétrica
alrededor de una media de cero, tenemos:
¢ t1-α = - tα ; es decir, el valor t que deja un
área de 1-α a la derecha y por tanto un área de α
a la izquierda, es igual al valor “t” negativo que
deja un área de α en la cola derecha de la
distribución.
DISTRIBUCION F DE FISHER

¢ La distribución F de Fisher se utiliza cuando


comparamos dos o más medias muestrales.
Aunque es de interés que la información
muestral arroje luz sobre dos medias de
poblaciones, es frecuente el caso en el que una
comparación, de la variabilidad sea igual de
importante, si no es que más. La distribución F
encuentra enorme aplicación en la comparación
de varianzas muestrales.
DISTRIBUCION F DE FISHER…

La estadística F se define como la razón de dos


variables aleatorias independientes ji cuadradas,
divididas cada una entre su número de grados de
libertad.

c 1
2

( n - 1) S 2
S 2
1 1 1
n s (n - 1)
2
s 2

F= 1
= 1 1
= 1

c 2
2
( n - 1) S
2
2
2
S 2
2

n s (n - 1)
2
2 2
s 2
2
2
DISTRIBUCIÓN “F” DE FISHER

¢ Sean U y V dos variables independientes que


tienen distribuciones chi cuadradas con v1 y v2
grados de libertad, respectivamente. Entonces la
distribución de la variable F = U/v1 /V/ v2 está
dada por

G[(v1 + v2 ) / 2(v1 / v2 ) v1 / 2 f v1 / 2 -1
h( f ) = { 0< f <¥
G(v1 / 2)G(v2 / 2) (1 + v1 f / v2 ) ( v1 + v2 ) / 2
0, en cualquier otro caso
DISTRIBUCION F DE FISHER…
¢ Si S yS
2
1
2
2 son las varianzas de muestras aleatorias
independientes de tamaño n1 y n2 tomadas de
poblaciones normales con varianza
s 12 y s 22 respectivamente.
S 2

s S
1
s 2 2 2

F = 1
= 2 1

S sS
2 2 2
2
s 2 1 2

tiene una distribución F con v1 = n1 -1 y v2 = n2– 1


grados de libertad.
DISTRIBUCION F DE FISHER…
¢ La curva de la distribución “F” depende no sólo
de los parámetros v1 y v2 sino también del orden
en el que se establecen. Una vez que se dan estos
dos valores, podemos identificar la curva.
DISTRIBUCION F DE FISHER…

¢ En muchas tablas “F” de Fisher se dan los


valores para dos niveles de α = 0.05 y α = 0.01,
sin embargo, por medio del siguiente teorema
podemos utilizar las tablas “F” de Fisher para
encontrar valores de ƒ0.95 ƒ0.99.
Al escribir fa (n y n ) para fa con n y n grados de libertad ,
1 2 1 2

obtenemos :
1
f a (n ,n ) =
fa (n ,n )
1- 1 2
2 1

También podría gustarte