Está en la página 1de 17

Distribuciones Muestrales

Claudio Aguilar Bahamonde


Definiciones

Estadística descriptiva
Describe, analiza y representa un grupo de datos
utilizando métodos numéricos y gráficos que resumen y
presentan la información contenida en ellos.

Estadística inferencial
Apoyándose en el cálculo de probabilidades y a partir
de datos muestrales, efectúa estimaciones, decisiones,
predicciones u otras generalizaciones sobre un conjunto
mayor de datos.
Conceptos
Parámetro: es la caracterización numérica de una población. que describe parcialmente o
en forma completa la función de densidad (o de probabilidad) de la característica en
estudio
Estadígrafo o Estadístico: es una función de las variables aleatorias que se observan de
en una muestra

Estos estadísticos deben cumplir ciertas propiedades para ser elegidos


como un buen estimador del parámetro de la población.

La distribución de probabilidad de un estadístico recibe el nombre de


distribución muestral.
Distribución Muestral de un Estadístico
Al extraer de una población todas las muestras de un determinado tamaño y
calculando en cada una de ellas el parámetro de interés, se obtendrán muchos
valores diferentes de ese estadístico muestral, lo que se conoce como la
variabilidad natural del muestreo, todos estos valores posibles de un estadístico
generan lo que se denomina su distribución muestral.

Si se tiene una población de tamaño 1000 y se quiere tomar una muestra


aleatoria de tamaño 100, existen por tanto 1000 sobre 100 combinaciones
posibles de realizar esta elección

 1000  1000 !
   6,3850511926305130236698511142022  10139
 100  900 !100 !

que es el número total de muestras distintas de tamaño 100 que se pueden


escoger. Si a cada una de estas muestras se le calcula el estadístico de interés,
se tendrán igual número de resultados de este estadístico, con ellos se puede
obtener la distribución muestral del mismo.
Para explicar este concepto. se considera un universo de tamaño
N=5, integrado por los elementos P  25, 26, 27, 28, 29 en kilos.

Luego, =27 kilos , si se toman muestras de tamaño 3.

5 5!
existen     10 muestras distintas
 3  2 ! 3!

Muestra Valores en la muestra Promedio de la muestra


1 25 26 27 26.000
2 25 26 28 26.333
3 25 26 29 26.667
4 25 27 28 26.667
5 25 27 29 27.000
6 25 28 29 27.333
7 26 27 28 27.000
8 26 27 29 27.333
9 26 28 29 27.667
10 27 28 29 28.000
Luego, la distribución muestral de la media está dada por:

Promedio de la muestra frecuencia Probabilidad de la media


26 1 0.10
26.333 1 0.10
26.667 2 0.20
27 2 0.20
27.333 2 0.20
27.667 1 0.10
28 1 0.10

se puede verificar que :

1 1 2 2 2 1 1
E(x)  26   26.333   26.667   27   27.333   27.667   28   27 kg  
10 10 10 10 10 10 10

26  26.333  26.667  2  27  27.333  2  27.667  28


y X  27 kg
10
Distribución Muestral de la Media
Teorema central del límite : Sean x1, x2, ... , xn una muestra aleatoria de tamaño n, con
distribución de probabilidad no especificada, que tiene media  y varianza finita 2.

El promedio muestral __
x1  x2      xn
x
tiene una distribución con media  y varianza finita 2/n.
n
__
X~(, 2 )  X ~ N(  , 2 )
n
que tiende a una distribución normal cuando n tiende a infinito, es decir la variable
aleatoria

x
 N (0,1)
 n

si n es grande, sin importar cual sea la distribución de probabilidad a partir de la cual se


obtuvo la muestra.
Ejemplos

• Se tiene una máquina de llenado de cereales. La cantidad de cereales que


coloca en cada caja es una variable aleatoria X distribuida normalmente con
valor esperado de 500 gramos y una varianza de 400. Para verificar que el
peso promedio de cada caja se mantiene en lo especificado, se selecciona una
muestra aleatoria de 25 cajas y se pesa el contenido de ellas. El gerente de la
planta ha decidido detener el proceso y encontrar las fallas, cada vez que el
valor promedio de la muestra sea mayor que 510 gramos o menor que 490
gramos. Calcule la probabilidad de detener el proceso.
• Para una cierta prueba se sabe que el número promedio de aciertos es de
1000 con una desviación estándar de 125. De las personas que rinden la
prueba en un momento determinado, se selecciona una muestra aleatoria de
tamaño 100, calcule la probabilidad de que la media aritmética muestral sea:
a. mayor que 1020
b. mayor que 985 y menor que 1025
Distribución Muestral de la Media cuando  es
desconocida
En situaciones que no se conoce la varianza poblacional se estima con la varianza muestral,
resultando :

𝑥−𝜇
∼ 𝑡(𝑛−1)
𝑆Τ 𝑛

σ𝑛 2
ҧ 2
𝑖=1 𝑥𝑖 −𝑛(𝑥)
Siendo 𝑆2 =
𝑛−1

Una variable aleatoria tiene distribución t-Student si su función de


probabilidad está dada por:

 n  1
 
n 1
2  2
1  2  t 
f (t )   1   con (n-1) grados de libertad
n  
n
  
n
2
DISTRIBUCION t - STUDENT
n
La distribución t-Student tiene: E(X)=0 y V (x)  ,n>2
n2
La variable t-Student tiene mayor dispersión que la Normal estándar

2 n
 (x)  1
n2
Pero, su varianza tiende a 1 cuando n tiende a infinito.

A medida que aumentan los grados de libertad la distribución t-Student


tiende a la distribución Normal estándar, es decir:
tn 
 N(0,1) cuando n  

https://homepage.divms.uiowa.edu/~mbognar/
Ejemplos
• Se sabe que en una empresa del rubro de transportes el sueldo
de los empleados sigue una distribución normal con media
$240.000. Al tomar una muestra de 15 empleados, se
determinó que la desviación estándar de los sueldos es $88.000
Determinar la probabilidad que el sueldo promedio de estos 15
empleados sea menor que $280.000.
• Se realiza un estudio sobre los precios en los cuales fluctúan las
habitaciones individuales por noche, en los distintos hoteles de
la capital. Se sabe que estos precios distribuyen normal con un
promedio de US$28 y se consideran en el estudio a 22 hoteles
de los cuales se obtiene una varianza de (US$)2100. ¿Cuál es la
probabilidad que el precio promedio de las habitaciones en
estos hoteles sea mayor a US$33,37?
Distribución Muestral de la proporción
Sea x una v.a con distribución de Bernoulli de parámetro p con función de probabilidad:

 p si x  1
f ( x)  
 q si x  0

se toma una muestra aleatoria de tamaño n, se estima p por


n

x i
pˆ  i 1

n pq
E ( pˆ )  p , V ( pˆ ) 
n
luego pˆ  p
z ~ N(0,1)
pq
n
Conocida como la distribución muestral de una proporción.
Ejemplos
• En una determinada población el 30% votarían a favor del
partido X en caso de que se celebrasen mañana las
elecciones. Si seleccionamos al azar a una muestra de 200
personas y las encuestamos, obtenga la probabilidad que
las personas que expresen esa intención de voto superen
el 38%.
• En una Universidad, del cuerpo de académicos que
realizan clases sólo el 25% cuenta en su formación con un
post-doctorado. Si se elige al azar 28 profesores, ¿Cuál es
la probabilidad que la fracción de docentes que cuenta con
postdoctorado en aquel grupo supere el 30%?
Distribución Muestral de la Varianza

Si S2 es la varianza de una muestra


aleatoria de tamaño n tomada de una población
normal que tiene varianza 2. entonces el estadístico
(n  1)* S 2

2
~
 2 n 1

se distribuye 2 con = n-1 grados de libertad, con

 ( x
i
 x )2

*S 
2 i 1
n 1
2
DISTRIBUCION Chi- Cuadrado
Una variable aleatoria X tiene una distribución Chi-cuadrado (si su función
de probabilidad está dada por:)
 1

1 
x

  /2  x2  e 2 si x  0
 2 ( / 2)
f(x)   , ν es el número de grados de libertad

 0 si x  0

• E(x) = n
• V(x) = 2n

Gráficas de distribuciones 
2
para diferentes valores de ν
Ejemplo

• El gerente general de servipag ha determinado que la


cantidad de dinero que paga cada cliente es modelado
por una distribución normal con una desviación estándar
de 16(M$)
a) Si de manera aleatoria seleccionamos el pago realizado
por 26 clientes, determine la probabilidad que la varianza
del pago para este grupo fluctúe entre 149,6166 y
352,07168(m$)2
b) Para una muestra de 21 clientes, determine la
probabilidad que la desviación estándar obtenida se
ubique por sobre 20,051.

También podría gustarte