Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capitulo 3 DISTRIBUCIONES MUESTRALES PDF
Capitulo 3 DISTRIBUCIONES MUESTRALES PDF
Capítulo 3
DISTRIBUCIONES MUESTRALES
Página 1 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
3.1.1 Población.
Es el conjunto con referencia al cual se desea hacer alguna investigación determinada.
El número de elementos que forman la población y que indicaremos con la letra N, se
llama tamaño de la población. Recordemos que la población puede ser finita o infinita.
Si el número de elementos de una población es elevado se la considera para el
tratamiento estadístico, en algunos casos como infinita.
3.2.1 Parámetros
Página 2 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
Definición. Sea (X1, X2,…, Xn) una muestra aleatoria de una variable aleatoria
X. Cualquier función real Y = H(X1, X2,…, Xn) de las observaciones de la muestra se
llama estadístico o estadígrafo.
Sea (X1, X2,…, Xn) una muestra aleatoria de la v.a. X. Definiremos algunos estadísticos
importantes.
Media Muestral
1 n
X= Xi
n i=1
1 n
Es estadístico X toma el valor x xi
n i 1
cuando:
X1 = x1, X2 =x2,…, Xn = xn
En la práctica el término media muestral se aplica tanto al estadístico
X como a su valor calculado x .
Varianza Muestral
Página 3 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
1 n
S2 ( X i X )2
n 1 i 1
La razón para dividir por n-1 es que de esta forma, como veremos más adelante (cuando
se estudien los procedimientos de estimación), la medida de variabilidad resultante es el
mejor estimador de la varianza poblacional (desconocida).
Desviación Estándar
1 n
S ( X i X )2
n 1 i 1
Observar que la varianza muestral S2 se mide en término del cuadrado de las unidades
originales de las mediciones.
Así, si la varianza muestral se expresa en “kilogramos al cuadrado para datos originales
en kilogramos, al extraer la raíz cuadrada positiva de S2, obtenemos la desviación
estándar muestral, que regresa la medida de variabilidad a las unidades originales de las
mediciones.
Mínimo Muestral
X ( m ) mín( X 1 , X 2 ,..., X n )
Máximo Muestral
X ( M ) máx( X 1 , X 2 ,..., X n )
Rango Muestral
R X ( M ) X ( m)
3.3.1 Introducción
Usaremos los estadísticos para estimar los parámetros de una distribución. Dado que un
estadístico es una variable aleatoria por ser una función de n variables aleatorias, tiene
sentido hallar su distribución.
Como ya sabemos uno de los principales objetivos de la Estadística es el aprendizaje a
partir de las observaciones. La Estadística proporciona el método para poder conocer
como es el fenómeno real que ha generado los datos observados y que generará los
futuros.
Página 4 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
Supongamos por ejemplo que queremos saber cómo son los artículos fabricados
mediante un determinado proceso. Para ello tendremos en cuenta un conjunto de
variables medibles que sean representativas de las características de dicho artículo, por
ejemplo la longitud de alguna de sus dimensiones.
La longitud de los posibles artículos fabricados será una variable aleatoria, dado que
todo proceso productivo siempre tiene variabilidad, ya sea grande o pequeña.
Las longitudes de los distintos artículos serán, en general, distintas.
Llamaremos X = longitud de un artículo genérico.
X es una variable aleatoria cuya distribución desconocemos.
Para poder conocer algo sobre la distribución de X tomaremos una muestra aleatoria
simple de los artículos, y a partir de ella haremos un ejercicio de inducción, para
extrapolar las características de la muestra a toda la población.
En Estadística, este ejercicio de inducción por el cual a partir de la muestra intentamos
predecir o pronosticar cómo será el resto de la población que no se ha observado se
llama Inferencia estadística.
Supongamos que tenemos una muestra de n = 100 artículos y hemos medido sus
longitudes. Supongamos también que calculamos un conjunto de medidas
características de dicha muestra: la media, la varianza, etc.
¿Los valores de la media muestral, la varianza muestra, etc. calculados a partir de los
datos de la muestra, coinciden con la media poblacional, la varianza poblacional, etc.
es decir con los parámetros que caracterizan la distribución?
Para que coincidan necesitamos los datos necesarios (en este caso longitudes) de
TODOS los elementos de la población. Por tanto no tienen que coincidir.
Nos preguntamos ahora: ¿los valores de la media muestral, la varianza muestral, etc.
dependen de la muestra aleatoria utilizada?
Página 5 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
Siempre que estimemos un parámetro poblacional nos haremos preguntas tales como:
1. ¿Qué calidad tiene la estimación obtenida?
2. ¿Cuál es la magnitud de la diferencia entre el parámetro poblacional y el
estadístico muestral?
3. ¿Con que muestra, por ejemplo, de dos utilizadas se obtiene un mejor estimador
del parámetro poblacional?
4. ¿Cómo es la distribución de un estadístico particular?
Supongamos que (X1, X2,…,Xn) es una muestra aleatoria de la v.a. X. La media muestral
de esas n observaciones será:
X 1 X 2 ... X n
X
n
Queremos saber cual es la distribución de X , dado que se trata de una variable aleatoria
y podemos hallar su distribución.
1. Calcularemos primero la esperanza matemática de X . Si llamamos E(X) = µ
tendremos que E(Xi) = µ, i = 1, 2,…, n; dado que cada Xi (i = 1, 2,…, n) es una
v.a. idéntica a X (por definición de muestra aleatoria). Entonces:
X 2 ... X n E ( X 1 ) E ( X 2 ) ... E ( X n ) n
E( X ) E (X 1
n
)
n
n
Página 6 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
n
)
Entonces:
n n n n
O bien:
n n
c X c
i 1
i i
i 1
i i
Z para n grande tiene distribución Z N (0,1)
n
2 2
c
i 1
i i
Observación 1. Si consideramos:
todas las constantes ci = 1(i = 1, 2,…, n)
Todas las esperanzas µi = 1 (i = 1,2,…,n)
todas las varianzas (σi)2 = σ2 (i = 1,2,…,n)
el enunciado del teorema se reduce a:
Sean:
X1, X2,…,Xn una sucesión de variables aleatorias independientes con E(Xi) = µ y
V(Xi) = σ2 (i = 1, 2,…,n).
Página 7 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
n
X X i variable aleatoria
i 1
Entonces:
n n
X X i para n grande tiene distribución X X i N (n , n 2 )
i 1 i 1
O bien:
n n
X i n
i 1
X
i 1
i n
Z para n grande tiene distribución Z N (0,1)
n 2 n
Podemos escribir: Z
n
N (0,1)
media X
desviación estándar X
n
Equivalentemente:
X
Z tiene distribución aproximadamente N(0,1)
n
Página 8 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
n n
( 1n )( X i ) X i n
X i 1 i 1
Z Z
n
n n
Desviación Estándar: X
n
Desviación Estándar: X
n
En este caso n es grande o chico.
Página 9 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
Fig.1
Error estándar de la media
El error estándar o típico de la media juega un papel fundamental en la Estadística, ya
que mide la variabilidad de la distribución muestral de X ; esto es las variaciones
aleatorias de la media muestral con respecto a la verdadera media µ.
1. Si las observaciones se seleccionan aleatoriamente de una población grande
(infinita) o de una población finita pero con reemplazo el error estándar (o
típico) de la media es X
n
Página 10 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
Del error típico X obtenemos dos conclusiones importantes:
n
Cuanto mayor sea el tamaño de la muestra, menor será el error estándar,
entonces las variaciones aleatorias de la media muestral serán menores y puede
esperarse que ésta esté más cercana a la media de la población.
Si σ es grande, indica gran variabilidad en la población, entonces es de esperar
que la distribución muestral de X tenga una variación proporcional bastante
grande, reflejada por un error típico grande.
2. Cuando la población es finita y se hacen las extracciones sin reposición el error
estándar no es X sino una cantidad menor. Esto es evidente por el
n
hecho lógico que la desviación estándar de X debe tender a cero a medida que
el tamaño muestral “n” se aproxima al tamaño poblacional “N”. En este caso el
N n N n
error estándar (o típico) de la media es X . Al factor se
n N 1 N 1
lo denomina factor de corrección para una población finita (observar que
siempre será un número menor que 1). Convendremos en usar ésta corrección
cuando la población es finita y se hace un muestreo sin reemplazo; restringiendo
más aún cuando N ≥ 20n.
Como vemos es posible controlar las variaciones aleatorias haciendo variar el tamaño de
la muestra.
Ejemplo 1. Producción de petróleo crudo
Supóngase que el número de barriles de petróleo crudo que produce un pozo
diariamente es una variable aleatoria con una distribución no especificada. Si se observa
la producción de 64 días, seleccionados en forma aleatoria, y si se sabe que la
desviación estándar del número de barriles por día es σ = 16; determínese la
probabilidad de que la media muestral se encuentre a no más de 4 barriles del verdadero
valor de la producción por día.
Solución
n = 64; puesto que n es suficientemente grande, la distribución de X es, en forma
aproximada, normal con:
media= X
Página 11 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
16
desviación estándar= X 2
n 64
X
Luego la v.a. Z tiene distribución aproximadamente N(0,1).
n
La probabilidad pedida es:
P( X X 4) P (4 X X 4)
X X
P ( 2 2) P(2 Z 2)
2
(2) (2) 0,9772 0, 0228 0,9544
Ejemplo 2. Las estaturas de 1000 estudiantes están distribuidas aproximadamente en
forma normal con una media de 174,5 centímetros y una desviación estándar de 6,9
centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de esta
población, determinar:
a) ¿Cuántas medias muestrales caen entre 172,5 y 175,8 centímetros?
b) ¿Cuántas medias muestrales caen por debajo de 172 centímetros?
Solución
En este ejercicio contamos con una población finita y un muestreo sin reemplazo, por
tanto agregamos el factor de corrección.
P(172,5 X 175,8)
172,5 174,5 X 174,5 175,8 174,5
a) P( )
6,9 1000 25 6, 9 1000 25 6,9 1000 25
25 1000 1 25 1000 1 25 1000 1
P(1, 47 Z 0,96) 0, 7607
Gráficamente:
Página 12 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
2 2
1 2
X X X X n n
1 2 1 2 1 2
3) a) Si ambas distribuciones son normales entonces X + X y
1 2
X - X tienen distribución normal in importar que valores
1 2
tengan n1 y n2.
b) Si n1 ≥ 30 y n2 ≥ 30 la aproximación normal para la distribución de X 1 X 2 es
n1 n2 n1 n2
Tienen distribución N(0,1).
Página 13 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
( X 1 X 2 ) ( 1 2 ) 8,2 10
P ( X 1 X 2 8,2) P(
2 2
)
1 2 9 4
n n 5 4
1 2
X X 2 10
P( 1
1.08) 0,1401
2,8
3.3.5 Problemas
Problema 1
Una empresa fabrica elementos con una duración que se distribuye aproximadamente en
forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la
probabilidad de que una muestra aleatoria de 16 de tales elementos tenga una vida
promedio de por lo menos de 775 horas.
Solución
X 800 775 800
P ( X 775) P( ) P ( Z 2,75) 0,0062
40 40
16 16
Página 14 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
Página 15 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
X Z12 Z 22 ... Z n2
Tiene una distribución Chi Cuadrado con n grados de libertad.
v.a. 2 .
Página 16 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
¿Qué son los grados de libertad? Podemos definirlos como el número de valores que
podemos elegir libremente.
Por ejemplo, supongamos que estamos tratando con una muestra de tamaño 2, los
valores de muestra son a y b, y sabemos que tienen una media de 18. Simbólicamente la
situación es:
ab
18
2
¿Cómo podemos encontrar los valores que a y b pueden tomar en esta situación? La
respuesta es que a y b pueden ser cualquier valor cuya suma entre los dos sea 36, ya que
36 dividido 2 es 18.
Suponga que sabemos que a tiene el valor 10. Ahora b ya no es libre de tomar cualquier
valor, sino que debe de tomar el valor 26, ya que:
si a = 10
10 b
entonces 18
2
de modo que. 10+b = 36
por tanto: b = 26
La situación de este ejemplo se puede generalizar para cualquier (n) en donde dada la
media de los valores sólo quedan (n-1) elementos que pueden definirse libremente y uno
es función de la media y el resto de los elementos.
Observaciones.
Página 17 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
E(χ 2ν ) ν y Var(χ 2 ) 2ν
ν
La siguiente figura ilustra distribuciones 2 para distintos valores de ν.
infinito: χ12 0 y 2 0 .
2
Para el resto de los valores de ν, para x=0, la función vale 0.
La función de densidad de probabilidad acumulada es:
x x u ( 2) / 2 e u / 2
2 2
F ( x ) P( x) du du
/2
0 0 2 ( / 2)
Esta integral no tiene primitiva, se resuelve por métodos numéricos. Igualmente en este
curso nos manejaremos con tablas de probabilidad.
Página 18 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
Veamos algunos ejemplos que muestran como debe usarse la tabla Chi Cuadrado que
aparece en el Anexo.
Ejemplos. Hallar:
1. P( 42 1,2)
P( 42 1, 2) 0,121901
2. P( 62 3,4)
3. P (3,4 82 5,6)
Interpolación lineal. La función chi cuadrado es continua para x>0, pero en la tabla
solo se recogen algunos de sus valores (el número de valores existentes en la tabla
siempre es finito), para calcular los valores no encontrados en la tabla podemos usar
interpolación lineal.
La interpolación lineal parte de dos puntos conocidos e la función, y los valores
intermedios los determina por la recta que une estos dos puntos. Este método siempre
Página 19 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
añade un cierto error al sustituir la función y=f(x) por la recta r(x) que une los dos
puntos en cuestión.
La expresión:
x x1
y ( y 2 y1 ) y1
x2 x1
determina la ecuación de la recta y=r(x) que pasa por los puntos (x1,y1) y (x2,y2) siendo
x1<x< x2.
El valor 1,75 no está en la tabla, pero si encontramos los más próximos: 1,6<1,75<1,8 y
se observa:
P ( 52 1,6) 0,098751
P ( 52 1,8) 0,123932
x x1
sustituyendo en la expresión: y ( y 2 y1 ) y
x 2 x1 1
se obtiene:
1,75 1,6
y (0,123932 0,098751) 0,098751 0,117637
1,8 1,6
Página 20 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
¿Para una distribución Chi Cuadrado con k grados de libertad, cual es el valor de x que
deja a su izquierda una probabilidad p?
Página 21 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
(1 / 2)
Tomando (1) como la definición de (n) para n > 0, podemos generalizar la
función gamma para n < 0.
Existen tablas de valores para la función gamma. Actualmente es útil buscar
un valor de gamma en una calculadora científica.
3.4.2 Distribución de la Varianza Muestral
Introducción
Como definimos la varianza muestral por:
1 n
S2 (Xi X )
2
n 1 i 1
es natural esperar que se use esta v.a. como un estimador de la varianza poblacional σ2,
de una distribución normal, cuando no se conoce σ2.
El proceso de estimación puede considerarse como sigue:
la varianza de una distribución normal se desconoce, entonces se toma una muestra
aleatoria de n observaciones, se calcula la v.a. S2 y se usa este valor como un estimador
de σ2.
¿Se encuentra σ2 bien estimado por S2?
Una medida de la aproximación de S2 a σ2 está dada por:
S2
P(a b) sindo a y b números reales positivos.
σ2
Se usa S2/σ2 como una medida de aproximación, en vez de S2-σ2, porque la distribución
de S2/σ2 se obtiene fácilmente, mientras la distribución de S2-σ2 es difícil de obtener.
Página 22 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
Así como en el caso de una v.a. X con distribución N(μ,σ2) usamos una transformación
para obtener otra v.a. Z con distribución N(0,1), cuyos valores de probabilidad se
encuentran tabulados; en el caso de la v.a. S2 hacemos algo similar.
La transformación, en este caso, se hace pasando a la variable:
(n 1)S2
χ2 (chi - cuadrado) (1)
σ2
cuyas probabilidades están tabuladas.
Sin embargo, contrariamente a lo que ocurre con la distribución normal estándar; la
(n 1).S2
χ2
n 1 (2)
σ2
Una forma equivalente de escribir esta ecuación es:
n 2
(X i X)
χ2n 1
i1 (3)
σ2
Teorema. Si X1, X2,…, Xn son variables aleatorias independientes cada una con
2 2 (n 1).S2
distribución N(μ, σ ) entonces la v.a. χ n 1 tiene una distribución chi
σ2
cuadrado con “n-1” grados de libertad.
Página 23 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
(n 1) S 2 2 2
P(a n21 b) P[a b] P[a S2 b ]
2 (n 1) (n 1)
Página 24 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
desviación estándar
X n
X
o lo que es lo mismo: Z N (0,1)
n
Para calcular Z se requiere que σ sea conocida. Si σ no se conoce y tratamos con una
muestra pequeña se requiere un estadístico distinto de Z.
Es así que definimos:
X
T
S
n
Como vemos estamos introduciendo aquí más incertidumbre, dado que S es estimador
de σ. Esto nos indica que la distribución de T será más dispersa que la de Z.
T tiene distribución t de Student. Esta distribución tiene por función de densidad:
1 ( 1)
1 Γ( 2 ) x2
t (x) . (1 ) 2
π Γ( )
2
donde el parámetro ν de tν son los grados de libertad de la distribución.
Las principales características de la distribución t son:
1. Es una distribución continua.
2. E(T)=0
V (T ) para 2
2
3. La distribución tiene forma acampanada y es simétrica respecto de la media
E(T)=µ=0, -∞<t<+∞.
4. La V(T) es ligeramente mayor que 1, es decir es ligeramente mayor que la de la
distribución normal estandarizada. Cuando los grados de libertad son
suficientemente grandes la varianza de la distribución t tiendo a 1.
5. No hay una distribución t sino una “familia” de distribuciones t; todas con la
misma media 0, pero con su respectiva desviación estándar diferente de acuerdo
con el tamaño de la muestra. Existe una distribución t para una muestra de
tamaño 20, otra para una muestra de tamaño 22 y así sucesivamente.
6. La distribución t es más ancha y más plana en el centro que la distribución
normal estándar como resultado de ello se obtiene una mayor variabilidad en las
Página 25 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
Sea Z una variable aleatoria con distribución N(0,1) y sea 2 una variable Chi
Cuadrado con n grados de libertad, entonces:
Z
T (1)
χ 2
n
donde:
X 2 (n 1) S 2
Z y
2
n
Al sustituir en la fórmula (1):
X X X
n(X )
n n n n ( X ) X
T
S S S S
(n 1)S 2 S2 n
2 2
n 1
Por tanto:
X
T con ν = n-1 grados de libertad.
S
n
Página 26 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
donde:
x
t (u )du no tiene primitiva
Para el cálculo de la integral anterior existen distintos tipos de tablas de esta
distribución, en las que para distintos valores de ν y de x, se puede buscar su
probabilidad acumulada p.
Observación. Se acostumbra representar con t α el valor t por arriba del cual se encuentra
un área igual a . Como la distribución t es simétrica alrededor de E(T)=0, tenemos
t1 t ; es decir, el valor t que deja un área de 1 α a la derecha y por tanto un
área de a la izquierda, es igual al valor t negativo que deja un área de en la cola
derecha de la distribución.
Esto es: t 0,95 t 0,05 ; t 0,99 t 0,01; etc.
Ejemplos.
Solución
Solución
Página 27 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
Debemos tener en cuenta aquí que: para conocer P(t n x) siendo x>0, teniendo
en cuenta los dos principios:
P(t n x) P(t n x)
Página 28 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
0,85<0,87<0,90
Página 29 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
0,87 0,85
Por tanto: y (0,805 0,792) 0,792 0,7972
0,90 0,85
¿para una distribución t de Student con n grados de libertad, cuál es el valor de x que
deja a su izquierda una probabilidad p?
X µ
Z
σ
n
Página 30 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
X
T
S
n
Recordar que ν=n-1recibe el nombre de grados de libertad, y representa una medida del
número de observaciones independientes en la muestra.
Para verificar esta afirmación toma una muestra de 25 lotes cada mes. Si el valor de t
calculado cae entre –t0,05 y t0,05, queda conforme con su afirmación. ¿Qué conclusión
extraería de una muestra que tiene una media de 518 gramos por milímetro y una
desviación estándar de 40 gramos? Suponga que la distribución de rendimientos es
aproximadamente normal.
Solución
De la tabla encontramos que y t 0,05 para 24 grados de libertad es de 1,711. Por tanto, el
fabricante queda conforme con esta afirmación si una muestra de 25 lotes rinde un valor
t entre -1,711 y 1,711.
Calculando el valor de t:
X µ 518 500
t 2,25
S 40
n 25
Página 31 de 32
UNLP-Facultad de Ingeniería Cátedra: Estadística
Este es un valor muy por encima de 1,711. Si se desea obtener un valor de t con 24
grados de libertad igual o mayor a 2,25 e busca en la tabla y es aproximadamente igual a
0,02. Por tanto es probable que el fabricante concluya que el proceso produce un mejor
producto del que piensa.
3.6.1 Teorema 1
Sean:
Demost.
2. Derivando respecto de x:
3.6.2 Teorema 2
Sean:
Demost
Página 32 de 32