Está en la página 1de 9

Distribuciones Muestrales para muestras pequeñas (n<30)

1. Distribución Muestral de la media (Varianza Conocida)


Sea 𝑋̅ la media de una muestra aleatoria de tamaño “n” tomada de una población
normal con media µ y la varianza σ2 conocida, entonces la distribución de la media
muestral será normal con media µ y varianza σ2/n y la variable aleatoria viene dada
por:
𝑋̅ − 𝜇
𝑍=𝜎
⁄ 𝑛

Tiene una distribución normal estándar N(0,1)

2. Distribución Muestral de la Varianza.

Distribución Chi-Cuadrado χ².

En estadística, la distribución χ² (de Pearson), llamada Chi cuadrado o Ji cuadrado, es


una distribución de probabilidad continua con un parámetro k que representa los grados
de libertad de la variable aleatoria

Xi  
donde Z i  son variables aleatorias normales independientes de media cero y

varianza uno. El que la variable aleatoria X tenga esta distribución se representa
habitualmente así: .
1
Es un caso particular de la distribución gamma, si hacemos 𝛼 = 2 𝑦 𝑟 = 𝑛/2 donde
𝑛 ∈ Ζ + . Diremos que una variable Z⸞N(0,1) tiene una distribución Chi- Cuadrado con
“n” grados de libertad (g.l) si su función de densidad esta dada por:

1 𝑛
𝑓(𝑧) = 𝑛⁄ 𝑛 𝑧 ( 2)−1 𝑒 −𝑧/2 , 𝑧>0
2 2 Γ(2)
Teorema: Si X1, X2,…Xn una muestra aleatoria de tamaño “n” de una distribución
Xi  
normal con media µ y varianza σ2. Entonces Z i  son variables aleatorias

normales estándar independientes, i=1, 2,…, n

X 
n 2 n 2

Luego, Z i 1
i   i
i 1   
 tiene una distribución Chi-Cuadrado con n grados de

libertad.

En la tabla encontraremos valores como P(  2   )  


2

Su grafica viene dada por:

Esta gráfica como vemos no es simétrica, pero la parte rayada es el parámetro  en la


tabla lo encontremos este parámetro y los grados de libertad.

Sea X 1 , X 2 ,..., X n una muestra aleatoria de una distribución normal con


(n  1) S 2
media  y varianza  . Entonces,  
2 2

2
2 𝑋̅
Tiene una distribución con (n-1) grados de libertad, y S2 son también variables
aleatorias independientes.

Ejemplos:
1. Se toma una muestra aleatoria de 16 estudiantes de una población normal que tiene
una variación de 5 años por estudiantes. Encuentre la probabilidad de que la
variación de las edades de los estudiantes de muestra sea menor o igual 7.44

2. Suponga que una empresa de Jugo, mide el líquido de cada envase en onzas y que
está distribuido normalmente con varianza de 1 onza. Se selecciona una muestra
aleatoria de 12 envases de jugo y se mide la cantidad de líquido en cada una.
Calcular un intervalo útil para la variación del líquido de los envases de tal manera
que: P(b1<X<b2) =0.90
Teorema: Supóngase que Z⸞ N(0,1) y X2⸞χ(n)2 son variables aleatorias independientes
Z
sigue una distribución t de Student t  con “n” grados de libertad donde
2
n 1

 Z tiene una distribución normal de media nula y varianza 1


  2 tiene una distribución chi-cuadrado con n-1 grados de libertad

3. Distribución Muestral de la media (Varianza Desconocida)

Distribución T-Student.

En probabilidad y estadística, la distribución t (de Student) es una distribución de


probabilidad que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño.

Sea 𝑋̅ la media de una muestra aleatoria de tamaño “n” tomada de una población
normal con media µ y varianza σ2 desconocida, entonces la distribución de la variable
𝑋̅−𝜇
aleatoria viene dada por: 𝑇 = 𝑆 tiene una distribución t- student con (n-1) grados

√𝑛
de libertad (n<30).

Propiedades:

Como la función de densidad normal estándar, la función de densidad “t” es simétrica


con respecto a cero.

Una variable aleatoria normal estándar siempre tiene varianza 1 mientras que la
varianza de una variable aleatoria con una distribución t siempre es mayor que 1

En la tabla encontraremos valores como P(t  t )  


Su grafica viene dada por:
En la tabla encontraremos valores como

Se puede apreciar que la tabla es muy parecida a la normal, lo que pasa es que es mas
ancha en la parte de arriba, y se utiliza que la normal pero en este caso se buscan los
grados de libertad.

Nota: 𝑡𝛼;𝑛 = −𝑡1−𝛼;𝑛


Aparece de manera natural al realizar la prueba t de Student para la determinación de las
diferencias entre dos medias muéstrales y para la construcción del intervalo de
confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la
desviación típica de una población y ésta debe ser estimada a partir de los datos de una
muestra.

Ejemplos:

1. Se ha realizado un estudio sobre la edad de los estudiantes de una población


normal, llegando a la conclusión que su varianza es 4 años. Se toma una muestra
aleatoria de 10 estudiante ¿Cuál es la probabilidad que la diferencia entre la
media muestral y poblacional es menor a 1.2?

2. la resistencia de la tensión para un tipo de alambre se distribuye normalmente


con media  y varianza  2 . Selecciona 6 al azar de los segmentos de los
alambres de un rollo grande de alambre; la media poblacional  y la varianza se
pueden estimar con X y S 2 respectivamente. Obtener la probabilidad
aproximada de que X este a lo más 2S / n de la verdadera media
poblacional.

4. Distribución Muestral para la Diferencia de Medias.

1) Varianzas Desconocidas Comunes.

Si se extraen al azar muestras independientes de tamaños n1 y n2 de dos poblaciones que


se distribuyen normales con medias µ1 y µ2 y varianzas iguales desconocidas σ12 y σ22
respectivamente, entonces la distribución de las diferencias de medias muestrales
1 1
𝑋̅1 − 𝑋̅2, tiene media y varianza dada por: 𝜇 = 𝜇1 − 𝜇2 𝑦 𝜎 2 = 𝑆𝑝2 (𝑛 + 𝑛 ) donde
1 2
(𝑛1 −1)𝑆12 +(𝑛2 −1)𝑆22
𝑆𝑝2 = y la variable aleatoria es
𝑛1 +𝑛2 −2
(𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 )
𝑡=
1 1
𝑆𝑝 √𝑛 + 𝑛
1 2
Tiene distribución t- student con (𝑛1 + 𝑛2 − 2) grados de libertad (𝑛1 < 30 𝑦 𝑛2 < 30)

Ejemplo:

2) Varianzas Desconocidas Distintas.

Si se extraen al azar muestras independientes de tamaños n1 y n2 de dos poblaciones que


se distribuyen normales con medias µ1 y µ2 y varianzas distintas desconocidas σ12 y σ22
respectivamente, entonces la distribución de las diferencias de medias muestrales
𝑆2 𝑆2
𝑋̅1 − 𝑋̅2, tiene media y varianza dada por: 𝜇 = 𝜇1 − 𝜇2 𝑦 𝜎 2 = ( 1 + 2 ) y la variable
𝑛1 𝑛2
aleatoria es
(𝑋̅1 − 𝑋̅2 ) − (𝜇1 − 𝜇2 )
𝑡=
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2
𝑆2 𝑆 2 2
( 1+ 2)
𝑛1 𝑛2
Tiene distribución t- student con ʋ grados de libertad donde 𝜈 = 𝑆2 𝑆2
y
( 1) ( 2)
𝑛1 𝑛2
+
𝑛1 −1 𝑛2 −1
(𝑛1 < 30 𝑦 𝑛2 < 30)

Ejemplo:
5. Distribución Muestral para la Varianza de dos Poblaciones.

Distribución Fisher.

Si deseamos comparar las varianzas de dos poblaciones normales basados en la


información contenidas en muestras aleatorias independientes. Supongamos que una
muestra aleatoria de tamaño n1, de una v.a distribuida normalmente con varianza común
σ12 y que la otra contiene una muestra aleatoria de tamaño n2, de una v.a distribuida
normalmente con varianza común σ22. El estadístico F se define como el cociente de dos
variables aleatorias Chi-cuadrado independientes, dividida cada una entre su número de
grado de libertad.

Definición: sean U y V dos variables aleatorias independientes que tienen


distribuciones Chi- Cuadrado con (n1 y n2) grado de libertad, respectivamente. Entonces,
𝑈⁄
(𝑛1 −1)
la distribución de la variable aleatoria 𝐹 = 𝑉⁄ esta dada por la función de densidad
(𝑛2 −1)
𝑛1 −1⁄2
𝑛1 − 1
Γ[(𝑛1 + 𝑛2 − 2)] ( ⁄𝑛 − 1) 𝑓 (𝑛1 −1⁄2)−1
2
. 𝑛1 +𝑛2 −2 , 𝑓>0
ℎ(𝑓) = 𝑛1 − 1⁄ 𝑛2 − 1⁄
Γ( 2) Γ ( 2) (𝑛 − 1)𝑓 2
(1 + 𝑛1 − 1 )
2
{0 𝑓≤0
esta se conoce como distribución F con n1-1 y n2-1 grados de libertad (g.l)

Teorema: al escribir 𝑓∝ (𝑛1 − 1; 𝑛2 − 1) para 𝑓∝ con (𝑛1 − 1) 𝑦 (𝑛2 − 1) grados de


libertad, obtenemos:
1
𝑓1−∝ ((𝑛1 − 1; 𝑛2 − 1) = 𝑓 ((𝑛 −1;𝑛 −1).
∝ 2 1

Teorema: Sean  1 y  2 variables aleatorias Chi- cuadrado con n1, n2 grados de


2 2

libertad respectivamente, entonces sí  1 y  2 son independientes la Fisher es el


2 2

 12
1
cociente de Chi- cuadrados entre sus grados de libertad. Así, F=
2 2

2
Se dice que tiene una distribución F con n1-1 grado de libertad en el numerador y n2-
1 grado de libertad en el denominador. Además
12 S12
F= 2 n  1  2 1
 2
2 S2
n2  2 2
En la tabla encontraremos valores como P F  F   
Esta es la gráfica de la Fisher el cual no es simétrica y en la parte sombreada es
donde encontramos al 

Ejemplos:

1. Si tenemos dos varianzas muetrales de variables aleatorias independientes de


tamaño 10 y 15 respectivamente, tomadas de poblaciones normales con
varianzas iguales encuentre la probabilidad del que la varianza muestra uno sea
menor que 4 veces la varianza de la muestra 2.

2. Si tomamos dos muestras independientes de tamaño n1  6 y n2  10 de dos


poblaciones normales con la misma varianza poblacional, encuentre el numero
“b” tal que:
 S2 
P 12  b   0,95
 S2 

3. La variación en el numero de unidades diarias de cierto producto el cual


manejan dos operadores A y B debe ser la misma con base a la muestras de
tamaño n A =16 y nB  21 días el valor calculado de las desviaciones estándar es
de S A  8,2 y S B  5,8 unidades estas son independientes que se encuentran
aproximados por distribuciones normales.
¿Existe alguna razón para creer que las varianzas son iguales?
Definiciones básicas

Unidades de Muestreo: Son colecciones no solapadas de elementos de la población que


cubren la población completa. También es la unidad de donde tomamos la muestra.

Marco Muestral: es una lista de todas las unidades de muestreos.

Estimador (𝜽̂ ): Medida estadística que describe cierta característica numérica de una
Muestra siendo una magnitud variable de una muestra a otra.

Parámetro (θ): Medida estadística que describe cierta característica numérica de una
población y que se considera constante y desconocida.

Exactitud: Se refiere a la magnitud de las desviaciones respecto a la media verdadera.

Precisión: Se refiere a la magnitud de las desviaciones respecto a la media Muestral.

Error de Estimación (𝐵 = |𝜃̂ − 𝜃|) errores en el muestreo: se debe a que una muestra
no proporciona información completa sobre una población. Esta clase de error puede ser
controlado por un diseño cuidadoso de la encuesta.

Algunos métodos de Muestreo.

La idea de hacer inferencia sobre una población a partir de una muestra extraída de esta,
la muestra debe ser representativa de la población para poder realizar la inferencia y que
esta tenga sentido, esto da cavidad a lo que se llama Muestreo.

Muestreo: Es un proceso que nos permite determinar tanto el tamaño de la muestra


como la extracción de una o varias muestras de la población de acuerdo al tipo de
muestreo a utilizar.

Muestreo Probabilístico: En este tipo de Muestreo la probabilidad de aparición


en una muestra de cualquier elemento de la población es conocida. Es el único
científicamente valido, este garantiza que a la larga las muestras que se van
obteniendo de la población sean representativa de la misma. Existen varios tipos,
que son los siguientes:
- Muestreo Aleatorio Simple (De estudio)
- Muestreo Estratificado
- Muestreo Conglomerado
- Muestreo Por Etapas
- Muestreo Sistemático.
Muestreo Aleatorio Simple: Es una muestra aleatoria simple cada unidad o
elemento de la población tiene una probabilidad de selección conocida, se
emplea un método aleatorio para elegir las unidades en la muestra.

Los elementos o unidades podrán ser seleccionadas de dos formas: con o sin
reposición.

Estimadores
Estimador de la Media Poblacional
1
. 𝜇̂ = 𝑋̅ = ∑𝑛𝑖=1 𝑥𝑖
𝑛
𝜎 𝑁−𝑛 2
. 𝜎̂ = 𝑉𝑎𝑟(𝑋̅) = 𝑛 ∗ 𝑁−1 𝑠𝑖 𝜎 2 𝑒𝑠 𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎
2

𝑆 𝑁−𝑛 2
. 𝜎̂ 2 = 𝑉𝑎𝑟(𝑋̅) = 𝑛 ∗ 𝑁 𝑠𝑖 𝜎 2 𝑒𝑠 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎
. Límite del error 2√𝑉𝑎𝑟(𝑋̅)
𝑍𝛼/2 𝜎 2
. Tamaño de la Muestra 𝑛 = ( ) 𝑑𝑜𝑛𝑑𝑒 𝑒 𝑒𝑠 1 − 𝛼 𝑑𝑒 𝑒𝑠𝑡𝑢𝑑𝑖𝑜
𝑒

Estimador de un total Poblacional


𝑁
. 𝜏̂ = 𝑁𝑋̅ = ∑𝑛𝑖=1 𝑥𝑖
𝑛
𝑆2 𝑁−𝑛
. 𝑉𝑎𝑟(𝜏̂ ) = 𝑁 2 ∗ ∗
𝑛 𝑁
. Límite del error 2√𝑉𝑎𝑟(𝜏̂ )

Estimador de una Proporción Poblacional


𝑋
. 𝑝̂ = 𝑛 , 𝑑𝑜𝑛𝑑𝑒
𝑋 𝑟𝑒𝑝𝑟𝑠𝑒𝑛𝑡𝑎 𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑞𝑢𝑒 𝑡𝑖𝑒𝑛𝑒 𝑙𝑎 𝑐𝑎𝑟𝑎𝑐𝑡𝑒𝑟𝑖𝑠𝑡𝑖𝑐𝑎 𝑑𝑒𝑙 𝑒𝑥𝑖𝑡𝑜
𝑝̂𝑞̂ 𝑁−𝑛
. 𝜎̂ 2 = 𝑉𝑎𝑟(𝑝̂ ) = 𝑁 2 ∗ 𝑛−1 ∗ 𝑁
. Límite del error 2√𝑉𝑎𝑟(𝑝̂ )
𝑁𝑝̂𝑞̂
. Tamaño de la Muestra 𝑛 = 𝐵2
(𝑁−1)( )+𝑝̂𝑞̂
4

También podría gustarte