Está en la página 1de 27

UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA

DEPARTAMENTO DE CIENCIA Y TECNOLOGÍA


AREA: MATEMÁTICA
ASIGNATURA: ESTADÍSTICA II

GUÍA DE ESTUDIO Nº 2
DISTRIBUCIONES MUESTRALES

1. Introducción al tema

Cuando se estudia una población muy grande, muy dispersa o infinita, como
podría ser todos los usuarios de telefonía móvil, o los trabajadores públicos en
Venezuela, o las pequeñas y medianas empresas (Pymes) del país,
naturalmente se podrían obtener infinidad de muestras estadísticas. De allí,
que el campo de la Estadística Inferencial o Muestreo trata básicamente de
obtener la mejor muestra posible para generalizar (inferir) acerca de la
población en estudio.

Esta inferencia se obtiene calculando un estadístico a partir de una muestra (n)


tomada aleatoriamente de la población (N) y con base a tales estadísticos se
hacen estimaciones con relación a los parámetros de la población que pueden
ser ciertas o no. Por lo que la manera de tener confianza en los resultados
obtenidos con la muestra es a través del conocimiento de la probabilidad de
ocurrencia del estadístico. Si la probabilidad es alta, entonces se valida el
estadístico o medida calculada a partir de la muestra (es una muestra
significativa).

Cómo un estadístico es una variable aleatoria que depende sólo de la muestra


observada, debe tener una distribución de probabilidad o distribución muestral
del estadístico, la cual depende del tamaño de la población, del tamaño de las
muestras y del método de elección de éstas (Diseño muestral). En este
apartado se estudiarán las distribuciones muéstrales más importantes de los
estadísticos que se utilizan con frecuencia y las aplicaciones de tales
distribuciones muéstrales a problemas de inferencia estadística.
Las distribuciones muéstrales de estadísticos importantes nos permiten
conocer información sobre los parámetros. Por lo general, los parámetros son
las contrapartes del estadístico en cuestión. Por ejemplo, si un ingeniero se
interesa en la resistencia media de la población de cierto tipo de resistencia,
sacará provecho de la distribución muestral de Xˉ una vez que reúna la
información de la muestra. Por otro lado, si está estudiando la variabilidad en la
resistencia, evidentemente utilizará la distribución muestral de S2 para conocer
la contraparte paramétrica, la varianza de la población σ (Walpole, Myers,
Myers y Ye; 2012)

2. Parámetros y Estadísticos

El propósito fundamental de la Estadística Inferencial es la estimación de los


parámetros poblacionales a través de muestras aleatorias y representativas.
Estos parámetros son medidas constantes de la población y se denotan con
letras griegas. En cambio, los Estadísticos, aunque miden lo mismo son
variables aleatorias y se denotan con letras latinas.

Definición 1. Cualquier función de las variables aleatorias que forman una


muestra aleatoria se llama estadístico.

A continuación, las principales medidas utilizadas para datos no agrupados.

Medidas Parámetro (poblacional) Estadístico (muestral)

Media

Desviación
Estándar

Varianza
Proporción

3. Distribución Muestral

Cuando se estudia una población muy grande o infinita «N» cómo podría ser
todos los trabajadores de una Empresa Básica, naturalmente se obtienen
infinidad de muestras de tamaño «n» de esta población. Supongamos que se
desean tomar muestras aleatorias de n=300 trabajadores de una población
N=3000 trabajadores para estimar el salario promedio. Se obtendrían una
combinación muy grande de muestras de tamaño n=300. Si luego a cada
muestra posible de tamaño n=300 se le calcula la media del salario (Ẋ) y su
desviación estándar (S) se obtendría «La Distribución muestral» de estos
estadísticos.

Definición 2. La distribución de probabilidad de un estadístico se llama


distribución muestral.

Ejemplo 1. Para ejemplificar lo planteado anteriormente se tiene un ejemplo


«hipotético» en el cuál se considera una población compuesta por los 5
primeros dígitos impares, y de la cual se quiere averiguar la cantidad de
muestras que podrían obtenerse de tamaño 2, con reemplazamiento.
Como cada número se puede combinar, al ser remplazado con cada uno de los
5 dígitos, la respuesta sería:
(5)(5) = 25 muestras diferentes de tamaño 2, con reemplazo.

Estas muestras serían las siguientes:


1;1 1;3 1;5 1;7 1;9
3;1 3;3 3;5 3;7 3;9
5;1 5;3 5;5 5;7 5;9
7;1 7;3 7;5 7;7 7;9
9;1 9;3 9;5 9;7 9;9
Se calcula la media poblacional (μ) y la desviación estándar poblacional (σ)
para los 5 dígitos.

1  5    3  5    5  5    7  5    9  5 
2 2 2 2 2

 
5

16  4  0  4  16

5

Ahora se procede a calcular la media de la Distribución muestral de medias o


también llamada media de las medias, para las 25 muestras de tamaño 2.


   1  2  3  4  5  2  3  4  5  6  3  4  5  6  7  4  5  6  7  8  125  5
k 25 5

La media de las 25 muestras posibles de tamaño 2 son las siguientes:

1+1/2 =1 1+3/2 = 2 1+5/2 = 3 1+7/2 = 4 1+9/2 = 5


3+1/2 =2 3+3/2 = 3 3+5/2 = 4 3+7/2 = 5 3+9/2 = 6
5+1/2 =3 5+3/2 = 4 5+5/2 = 5 5+7/2 = 6 5+9/2 = 7
7+1/2 =4 7+3/2 = 5 7+5/2 = 6 7+7/2 = 7 7+9/2 = 8
9+1/2 =5 9+3/2 = 6 9+5/2 = 7 9+7/2 = 8 9+9/2 = 9

Así que la media de la Distribución muestral de las medias o llamada media


de las medias sería:
Nótese que la media de la Distribución muestral resulta exactamente igual a la
media poblacional:

El error estándar de la Distribución muestral de las medias con respecto a la


media poblacional, será igual a la desviación estándar de la población dividida
entre la raíz cuadrada del número de elementos «n» de cada muestra:

 2 ,83 2 ,83
 

n

2

1,41
2

En el caso del problema planteado de los 5 primeros dígitos impares, si se


tomaran muestras de tamaño n=2 pero sin reemplazo se tendrían una
combinatoria de:

Serían 10 muestras posibles de tamaño 2 tomadas sin reemplazo:

1;3 1;5 1;7 1;9 3;5 3;7 3;9 5;7 5;9 7;9

La media de la Distribución muestral sería la misma:

Si se relaciona cada estadístico obtenido con su probabilidad de ocurrencia


para las 25 muestras obtenidas con reemplazo, se tendría la Distribución de
Probabilidad o Distribución Muestral de la media (Tabla 1).

Estadístico media (Ẋ) Probabilidad

1 1/25
2 2/25
3 3/25
4 4/25
5 5/25
6 4/25
7 3/25
8 2/25
9 1/25
25/25=1

Si se quisiera saber la probabilidad de que se obtenga una media mayor e igual


a 7, entonces la respuesta sería: 3/25 + 2/25 + 1/25 = 6/25 = 0,24 ó 24%.

De allí, que la importancia del conocimiento de la Distribución muestral de un


estadístico radica en hallar la probabilidad de ocurrencia del mismo.

Sin embargo, en la práctica es imposible hallar la probabilidad de ocurrencia


del estadístico por esta vía debido a las infinidades de muestras que se pueden
tomar de tamaño n de una población dada. Tal es el caso del salario de los
trabajadores de una empresa ¿cuántas muestras posibles de tamaño n=300 se
podrían obtener sin reemplazo de una población N=3000 trabajadores? La
respuesta es: infinitas muestras de tamaño n=300.
Por esta razón se recurre al conocimiento de la Distribución muestral del
estadístico a través de un Teorema importante llamado Teorema del Límite
Central.

4. Teorema del Límite Central (TLC)

Definición 3: Si Ẋ es la media de una muestra aleatoria de tamaño n tomada


de una población con media μ y varianza finita σ 2, entonces la forma límite de
la distribución de

conforme es la distribución normal estándar n(z;0,1).


La importancia de este Teorema radica en que, si se tiene una muestra lo
suficientemente grande, independientemente de la Distribución Poblacional o
Distribución Madre, el Estadístico (Ẋ, p, S, S2) tendrá una Distribución Normal
(Z). Y a partir de este conocimiento se puede hallar su probabilidad de
ocurrencia.

También el Teorema demuestra que conforme n aumenta la Distribución del


estadístico se vuelve más normal (Z), por lo que la Distribución Z es la más
utilizada en el ámbito de la Estadística Inferencial. De igual manera, también se
ilustra que la media de Ẋ es igual a μ para cualquier tamaño de la muestra y la
varianza de Ẋ se vuelve más pequeña conforme n aumenta.

La aplicación de este Teorema se planteará en cada caso a continuación:

Caso 1. Distribución muestral del estadístico Ẋ, para n≥30 y σ conocido.

La Distribución muestral de la media Ẋ es el mecanismo a partir del cual se


realizan inferencias del parámetro μ. La distribución muestral de Ẋ con tamaño
muestral n es la distribución de probabilidad que resulta cuando un
experimento se lleva a cabo una y otra vez (siempre con tamaño de la muestra
n) y resultan los diversos valores de Ẋ. Esta distribución muestral, entonces,
describe la variabilidad de los promedios muestrales alrededor de la media de
la población μ.
Si se toman muestras de una población con distribución de probabilidad
desconocida, ya sea finita o infinita, la distribución muestral de Ẋ aún será
aproximadamente normal con media μ y varianza σ2/n siempre y cuando el
tamaño de la muestra sea grande (TLC). La aproximación normal para el
estadístico Ẋ es buena si n≥30.

Ejemplo 2. Un importante proceso de fabricación produce partes de


componentes cilíndricos para la industria automotriz. Es importante que el
proceso produzca partes que tengan una media de 5 milímetros. El ingeniero
implicado hace la conjetura de que la media de la población es de 5.0
milímetros. Se lleva a cabo un experimento donde se seleccionan al azar 100
partes elaboradas por el proceso y se mide el diámetro de cada una de ellas.
Se sabe que la desviación estándar de la población es σ=0.1. El experimento
indica un diámetro promedio de la muestra de Ẋ = 5.027 milímetros. ¿Esta
información de la muestra parece apoyar o refutar la conjetura del
ingeniero?

Aparentemente la media de la muestra obtenida parece refutar la hipótesis del


ingeniero. Sin embargo, antes de concluir que el proceso está fuera de control,
se procede hallar la probabilidad de ocurrencia de este estadístico.
P (Ẋ ≥ 5,027 milímetros) =?

Si la probabilidad resulta alta el proceso definitivamente está fuera de control; si


la probabilidad es baja, entonces se concluye que no existe suficiente evidencia
que indique que el diámetro de las piezas se encuentra por encima de los 5
milímetros.
El procedimiento a seguir para hallar la probabilidad es el siguiente:

 Se define cuál es el parámetro estimado. En este caso es μ o diámetro


promedio de la pieza.
 Se define el tamaño de la muestra. n = 100 partes o piezas.
 Se define cuál es la Distribución Muestral del estadístico Ẋ. Para este
estudio, dado que la muestra es mayor a 30 y se conoce la desviación
estándar poblacional, independientemente de la Distribución Madre o
Poblacional, la Distribución Muestral del Estadístico Media es Normal (Z)
(TLC).
 Se estandariza la variable utilizando la fórmula de acuerdo a la
Distribución Muestral definida.

 Se ubica en la Tabla o Distribución Muestral definida, el área de


probabilidad buscada en términos estándar.
P (Z ≥ 2,70) =?

Para ubicar el valor Z en la tabla se debe considerar 2 decimales, dado que


en la primera columna se ubica el primer decimal y en la primera fila se
ubica al segundo decimal.
Al interceptar fila-columna, el valor obtenido corresponde al área de
probabilidad sombreada en rojo, o mejor dicho de Z= 0 a Z= 2,70. En este
caso la probabilidad es de 0,49653.
Como el área bajo la curva o probabilidad bajo la curva es 1 y la distribución
es simétrica, entonces la mitad tiene un área de probabilidad de 0,5. En
este sentido, cómo la probabilidad que piden es de los mayores e iguales a
Z≥2,70, queda: 0,5 - 0,49653 = 0,00347 ó 0,347%

 Se concluye de acuerdo a la probabilidad obtenida. Para el caso de


estudio, se concluye que no se puede refutar la conjetura del ingeniero que
plantea que el diámetro medio de las partes es de 5,0 milímetros, dado que
la probabilidad del estadístico es muy baja (0,00347).

Caso 2. Distribución muestral del estadístico Ẋ, para n≥30 y σ


desconocido.

Ejemplo 3. Un contrato anual de manejo laboral en cierta industria, exige una


producción diaria promedio de 80 unidades de un producto específico. Una
muestra de 150 días reveló una media de 47 unidades diarias con una
desviación estándar de 5 unidades. ¿Cumple la industria con la exigencia del
contrato? Justifique su respuesta.

Aparentemente la media de la muestra obtenida indica que no se cumple con la


exigencia del contrato de producción de 80 piezas diarias en promedio. Sin
embargo, antes de concluir que no se cumple con el contrato anual, se procede
a hallar la probabilidad de ocurrencia de este estadístico.
P (Ẋ ≤ 47 unidades/día) =?

Si la probabilidad resulta alta, definitivamente no se está cumpliendo con el


contrato; si la probabilidad es baja, entonces se concluye que no existe
suficiente evidencia que indique que la producción promedio por día se
encuentra por debajo de 80 piezas.

El procedimiento a seguir para hallar la probabilidad es el siguiente:

 Se define cuál es el parámetro estimado. En este caso es μ o producción


diaria promedio.
 Se define el tamaño de la muestra. n = 150 días.
 Se define cuál es la Distribución Muestral del estadístico Ẋ. Para este
estudio, dado que la muestra es mayor a 30 y aunque se desconoce la
desviación estándar poblacional, independientemente de la Distribución
Madre o Poblacional, la Distribución Muestral del Estadístico Media es
Normal (Z) (TLC). En este caso, se utiliza la desviación estándar muestral
(S) como estimador de σ.
 Se estandariza la variable utilizando la fórmula de acuerdo a la
Distribución Muestral definida.

   47  80  33
Z    80,49
S 5 5
n 150 12,25
 Se ubica en la Tabla o Distribución Muestral definida, el área de
probabilidad buscada en términos estándar.

P (Z ≤ -80,49) =?
Este valor de Z (-80,49) no se encuentra en la Tabla, dado que el mayor valor
es para un Z = ±4,09. Además, como el valor de Z resultó negativo está
ubicado en la parte izquierda de la curva y la probabilidad buscada de P (Z ≤ -
80,49) =? sugiere un área de probabilidad aproximadamente de 0 (cola
izquierda).
 Se concluye de acuerdo a la probabilidad obtenida. Para el caso de
estudio, se concluye que no se puede afirmar que no se cumple con el
contrato, debido a que la probabilidad de que se esté produciendo 47 piezas
o menos diarias en promedio es aproximadamente nula.

Caso 3. Distribución muestral del estadístico Ẋ, para n<30 y σ conocido.

Ejemplo 4. Se fabrica tubería PVC con un diámetro promedio de 1.01 plg. y


desviación estándar de 0.003 plg. Encuentre la Probabilidad de que en una
muestra aleatoria de n = 9 secciones de tubería, el diámetro promedio de la
muestra sea mayor que 1.009 plg. y menor que 1.012 plg.

P (1,009 plg ≤ Ẋ ≤ 1,012 plg) =?

El procedimiento a seguir para hallar la probabilidad es el siguiente:

 Se define cuál es el parámetro estimado. En este caso es μ o diámetro


promedio de la tubería PVC.
 Se define el tamaño de la muestra. n = 9 secciones de tubería.
 Se define cuál es la Distribución Muestral del estadístico Ẋ. Para este
estudio, dado que la muestra es menor a 30, se conoce la desviación
estándar poblacional y además la Distribución Madre o Poblacional es
Normal, la Distribución Muestral del Estadístico Media es también Normal
(Z).
 Se estandariza la variable utilizando la fórmula de acuerdo a la
Distribución Muestral definida. Para este caso se calcula Z1 y Z2 dado a
que se trata de hallar la probabilidad en un intervalo.
 Se ubica en la Tabla o Distribución Muestral definida, el área de
probabilidad buscada en términos estándar.

P (-1 ≤ Z ≤ 2) =?
Para Z1 al interceptar fila-columna, el valor obtenido corresponde al área de
probabilidad sombreada en rojo, o mejor dicho de Z= 0 a Z= -1. En este caso la
probabilidad es de 0,34134.

Para Z2 al interceptar fila-columna, el valor obtenido corresponde al área de


probabilidad sombreada en rojo, o mejor dicho de Z= 0 a Z= 2. En este caso la
probabilidad es de 0,47725.

En este sentido, cómo la probabilidad que piden es el área entre Z 1 = -1 y Z2 =


2 queda: 0,34134 + 0,47725 = 0,81859 o 81,859%

 Se concluye de acuerdo a la probabilidad obtenida. La probabilidad de


que el diámetro promedio de la pieza sea mayor que 1.009 plg. y menor que
1.012 plg es de 0,81859.
Caso 4. Distribución muestral del estadístico Ẋ, para n<30, σ desconocido
y Distribución Poblacional Normal.

En este caso se está en presencia de una Distribución Muestral t Student. La


distribución t se usa de manera extensa en problemas que tienen que ver con
inferencia acerca de la media de la población o en problemas que implican
muestras comparativas (es decir, en casos donde se trata de determinar si las
medias de dos muestras son significativamente diferentes).

La distribución t es similar a la distribución de Z en que ambas son simétricas


alrededor de una media de cero. Ambas distribuciones tienen forma de
campana; pero la distribución t es más variable, debido al hecho de que los
valores T dependen de las fluctuaciones de dos cantidades, Ẋ y S2; mientras
que los valores de Z dependen de los cambios de Ẋ de una muestra a otra.

La distribución t difiere de Z en que la varianza de T depende del tamaño de la


muestra n y siempre es mayor a 1. Únicamente cuando la muestra es grande
las dos distribuciones serán las mismas. Por eso se utiliza cuando el tamaño de
las muestras es n< 30, se desconoce la desviación estándar poblacional y la
Distribución madre es normal.

Asimismo, esta distribución depende de un parámetro llamado grados de


libertad igual a (n-1) que se simboliza con la letra griega (nu).

Se acostumbra representar con tα el valor t por arriba del cual encontraremos


un área igual a α. De allí, el valor de t con 10 grados de libertad que deja un
área de 0,025 a la derecha de t=2,228.

Ejemplo 5. Determine los valores críticos de t para los que el área de la cola
derecha de la distribución t es 0.01. Si el número de grados de libertad (n-1) es
igual a:
a) 4 b) 12 c) 25

a) t0,01; 4 = 3,7469
b) t0,01; 12 = 2,6810
c) t0,01; 25 = 2,4851

Ejemplo 6. Dada una muestra aleatoria de tamaño 15 de una distribución


normal, encuentre k de tal forma que:
a) P (k < t < -1,7613) = 0,045

De la Tabla 2, se muestra que 1,7613 corresponde a t 0,05 con gl= 14. Por lo
tanto, por simetría -t0,05 = -1,7613. Como k en el enunciado está a la izquierda
de -t0,05 = -1,7613, entonces k= -tα. Encontrando el valor de α se puede ubicar
k que ya se sabe que es negativa también.

Se sabe que, según el enunciado del ejercicio, el área de probabilidad entre -k


y -1,761 es 0,045, por lo tanto, el α buscado para -k es igual a 0,05-0,045=
0,005.
Entonces k= - t0,005= - 2,9768

P ( -2,9768 < t < -1,7613) = 0,045

Ejemplo 7. Una fábrica de fusibles asegura que con una sobrecarga del 20%,
sus fusibles se fundirán al cabo de 12,40 min en promedio. Para probar esta
afirmación, una muestra de 20 de los fusibles fue sometida a una sobrecarga
de 20%, y los tiempos que tardaron en fundirse tuvieron una media de 10,63
min y desviación estándar de 2,48 min. Si se supone que los datos constituyen
una muestra aleatoria de una población normal ¿tienden a apoyar o a refutar la
afirmación del fabricante?
P (Ẋ ≤ 10,63 min) =?

El procedimiento a seguir para hallar la probabilidad es el siguiente:

 Se define cuál es el parámetro estimado. En este caso es μ o promedio


de tiempo en fundirse los fusibles con una sobrecarga de 20%.
 Se define el tamaño de la muestra. n = 20 fusibles.
 Se define cuál es la Distribución Muestral del estadístico Ẋ. Para este
estudio, dado que la muestra es menor a 30, se desconoce la desviación
estándar poblacional y además la Distribución Madre o Poblacional es
Normal, la Distribución Muestral del Estadístico Media es t Student (t).
X 
t ;
S n
 Se estandariza la variable utilizando la fórmula de acuerdo a la
Distribución Muestral definida. Para este caso se calcula t.
 Se ubica en la Tabla o Distribución Muestral definida, el área de
probabilidad buscada en términos estándar.

P (t ≤ -2,95) =?

Para un valor de t de 2,95 y para 19 grados de libertad (por simetría), el área


de probabilidad buscada es aproximadamente 0,005 (para un valor de tabla
exacto de 2,861). Esta área representa la cola izquierda o negativa.

 Se concluye de acuerdo a la probabilidad obtenida. La probabilidad de


que el promedio de tiempo en fundirse los fusibles con una sobrecarga de
20% sea de 10,63 min o menor es aproximadamente 0,005 o menos del
1%. Por lo tanto, no existe suficiente evidencia que indique que el proceso
está fuera de control.

Caso 5. Distribución muestral del estadístico diferencia de medias (Ẋ1-Ẋ2),


para n1 y n2 ≥30; σ1 y σ2 conocidos.

La Distribución muestral del estadístico diferencia de medias (Ẋ1-Ẋ2), es el


mecanismo a partir del cual se realizan inferencias del parámetro μ para dos
poblaciones (μ1- μ2). Por ejemplo, se utiliza cuando se requiere comparar la
producción promedio entre dos líneas o métodos de producción. O cuando se
requiere saber si existe diferencia en el tiempo promedio en segundos
necesarios para conectarse con internet con dos proveedores distintos.

Definición 4. Si se extraen al azar muestras independientes de tamaños n 1 y


n2 de dos poblaciones, discretas o continuas, con medias μ1 y μ2 y varianzas
σ12 y σ22 respectivamente, entonces la distribución muestral de las diferencias
de medias, (Ẋ1-Ẋ2), está distribuida aproximadamente de forma normal con
media y varianza dadas por:
μẊ1 - Ẋ2 = μ1 - μ2, y σ2 Ẋ1 - Ẋ2 = σ1 2 /n1 + σ2 2 /n2

De aquí,

es aproximadamente una distribución normal estándar.

Ejemplo 8. Los cinescopios de televisión del fabricante A tienen una duración


promedio de 6,5 años y una desviación estándar de 0,9 años, mientras que los
del fabricante B tienen una vida promedio de 6,0 años con una desviación
estándar de 0, 8 años. ¿Cuál es la probabilidad de que una muestra aleatoria
de 36 cinescopios del fabricante A tenga una duración promedio que sea al
menos un año más que la duración promedio de una muestra de 49
cinescopios del fabricante B.?

Se da la siguiente información.

Cinescopios marca A Cinescopios marca B


μ1= 6,5 μ2= 6,0
σ1= 0,9 σ2=0,8
n1=36 n2=49

Se pide hallar:
P (Ẋ1 - Ẋ2) ≥ 1año

El procedimiento a seguir para hallar la probabilidad es el siguiente:

 Se define cuál es el parámetro estimado. En este caso es μ1 - μ2 o


diferencia entre la duración promedio de los cinescopios del fabricante A y
B.
 Se define el tamaño de las muestras. n1 = 36 cinescopios marca A. n2 =
49 cinescopios marca B.
 Se define cuál es la Distribución Muestral del estadístico (Ẋ1 - Ẋ2). Para
este estudio, dado que las muestras son mayores a 30 y se conocen las
desviaciones estándar poblacionales, independientemente de las
Distribuciones Madres o Poblacional, la Distribución Muestral del Estadístico
diferencia de media es Normal (Z) (TLC).
 Se estandariza la variable utilizando la fórmula de acuerdo a la
Distribución Muestral definida.

μẊ1 - Ẋ2 = 6,5 - 6,0 = 0,5 y σ2 Ẋ1 - Ẋ2 = 0,812 /36 + 0,64 2 /49 = 0,189

 Se ubica en la Tabla o Distribución Muestral definida, el área de


probabilidad buscada en términos estándar.

P (Z ≥ 2,65) =?
Para ubicar el valor Z en la tabla se debe considerar 2 decimales, dado que en
la primera columna se ubica el primer decimal y en la primera fila se ubica al
segundo decimal. Al interceptar fila-columna, el valor obtenido corresponde al
área de probabilidad sombreada en rojo, o mejor dicho de Z= 0 a Z= 2,65. En
este caso la probabilidad es de 0,49598.
Como el área bajo la curva o probabilidad bajo la curva es 1 y la distribución es
simétrica, entonce la mitad tiene un área de probabilidad de 0,5. En este
sentido, cómo la probabilidad que piden es de los mayores e iguales a Z≥2,65,
queda: 0,5 - 0,49598 = 0,00402 ó 0,402%

 Se concluye de acuerdo a la probabilidad obtenida. La probabilidad de


que una muestra aleatoria de 36 cinescopios del fabricante A tenga una
duración promedio que sea al menos un año más que la duración promedio
de una muestra de 49 cinescopios del fabricante B es 0,00402.
Caso 6. Distribución muestral del estadístico diferencia de medias (Ẋ1-Ẋ2),
para n1 y n2 < 30; σ1 = σ2, pero desconocidas.

Definición 5. Si se extraen al azar muestras independientes de tamaños n 1 y


n2 < 30 de dos poblaciones normales con medias μ1 y μ2 y varianzas σ12 igual a
σ22, pero desconocidas, entonces la distribución muestral de las diferencias de
medias, (Ẋ1-Ẋ2), tiene la distribución t con gl= n1+n2 - 2.

μẊ1 - Ẋ2 = μ1 - μ2, y puesto que σ12 = σ22, pero es desconocida, debe estimarse
a partir de los datos. Ello se hace por medio de una varianza mancomunada o
agrupada Sp2:

Ejemplo 9. La resistencia a la tracción de un material es su propiedad de


resistir la deformación cuando se le aplica una fuerza o carga. Se efectúa un
estudio de la resistencia a la tracción de hierro dúctil templado o fortalecido a
dos temperaturas distintas. Se piensa que la temperatura inferior genera mayor
resistencia a la tracción y que σ12 = σ22. Resultan los datos siguientes:

Temperatura 1450°F Temperatura 1650 °F


Ẋ1= 18900 psi Ẋ2= 17500 psi
s12= 1600 psi s2 2=2500 psi
n1=10 n2=16
Se pide hallar la probabilidad de que la resistencia media a la tracción del
hierro templado a 1450°F es mayor a la obtenida a 1650 °F en 1400 psi.

P (Ẋ1 - Ẋ2) ≥ 1400 psi.

El procedimiento a seguir para hallar la probabilidad es el siguiente:

 Se define cuál es el parámetro estimado. En este caso es μ1 - μ2 ó


diferencia en la resistencia media a la tracción del hierro templado a 1450°F
con respecto a la obtenida a 1650 °F.
 Se define el tamaño de las muestras. n1 = 10 y n2 = 16 piezas de hierro.
 Se define cuál es la Distribución Muestral del estadístico (Ẋ1 - Ẋ2). Para
este estudio, dado que las muestras son menores a 30, se desconocen las
desviaciones estándar poblacionales, pero se conoce que σ 1 = σ2, dadas
Distribuciones Madres o Poblacionales Normales, la Distribución Muestral
del Estadístico diferencia de media es t Student.
 Se estandariza la variable utilizando la fórmula de acuerdo a la
Distribución Muestral definida.

μẊ1 - Ẋ2 = 18900 - 17500 = 1400 psi y

 Se ubica en la Tabla o Distribución Muestral definida, el área de


probabilidad buscada en términos estándar.

P (t ≥ 74,68) =?
Con base a un valor de T de 74,68 y 24 grados de libertad, no se puede ubicar
en la Tabla de la Distribución Muestral t Student el área de probabilidad porque
no se encuentra. Sin embargo, considerando el valor más grande de T (2,7970)
para 24 grados de libertad, se puede deducir que la probabilidad buscada está
por debajo a 0,005 ó aproximadamente 0.

 Se concluye de acuerdo a la probabilidad obtenida. La probabilidad


de que la resistencia media a la tracción del hierro templado a 1450°F es
mayor a la obtenida a 1650 °F en 1400 psi o mayor es aproximadamente
nula. Por lo tanto, los resultados de las muestras no son significativos para
inferir que las temperaturas estudiadas den una diferencia en la resistencia
promedio del hierro.

Caso 7. Distribución muestral del estadístico diferencia de medias (Ẋ1-Ẋ2),


para n1 y n2 < 30; σ1 ≠ σ2, pero desconocidas.

Definición 6. Si se extraen al azar muestras independientes de tamaños n 1 y


n2 < 30 de dos poblaciones normales con medias μ1 y μ2 y varianzas σ12 ≠ σ22,
pero desconocidas, entonces la distribución muestral de las diferencias de
medias, (Ẋ1-Ẋ2), tiene la distribución t

Con grados de libertad aproximados:


Caso 8. Distribución muestral del estadístico proporción (p) para
muestras grandes. Aproximación Normal a la Distribución binomial.

El conocimiento de la proporción (porcentaje %) que dentro de la población


representa una variable, puede ser tan relevante y significativa como conocer
una Ẋ u otro parámetro. Ejemplos de su aplicación es la de conocer la
proporción de piezas defectuosas generadas en un turno de trabajo. O la
proporción de usuarios satisfechos con el servicio prestado por la empresa. O
encuesta a compañías que usan robots para estimar la proporción de robots
usados en operaciones de carga y descarga.

La situación habitual en que se requiere estimar una proporción es la siguiente:


existe una población de interés (robots en uso), se estudia un rasgo específico
(robots usados en operaciones de carga y descarga) y se clasifica cada
elemento de la población según posee el rasgo o carezca de él. Se requiere
hacer inferencias de π, la proporción poblacional que tiene el rasgo.

A fin de desarrollar un estimador puntual lógico de π, note que la muestra


aleatoria de tamaño n extraída de la población se relaciona con un conjunto de
n variables aleatorias independientes X1, X2, X3, ..., Xn, donde:

si el i-ésimo elemento de la muestra tiene el rasgo


si el i-ésimo elemento de la muestra que no tiene el rasgo

Ejemplo 10. Si se tiene una muestra de 100 circuitos, se obtendría una


muestra como la siguiente:

x1= 1 x2= 0 x3= 0 x4= 1 x5= 0 x6= 1 x7= 0 x8= 0 x9= 0...x100= 0

En este caso, el primer circuito de la muestra funciona correctamente durante


las primeras 1000 h de uso, de modo que x1 = 1; el segundo circuito no, por lo
que x2=0, y así sucesivamente.
En general, indica el número de objetos de la muestra que poseen el rasgo,
mientras que la estadística X/n representa la proporción de la muestra que
tiene el rasgo. Esta estadística llamada proporción muestral, es un estimador
puntual lógico de π.

Donde X representa el número en la muestra con el rasgo y n es el tamaño de


la muestra.
Suponga que al realizar las 100 pruebas se observa que 91 de los 100 circuitos
probados funcionan correctamente durante las primeras 1000 horas de uso. Así
pues, 91 de las variables aleatorias tienen valor 1, y las otras 9 valor 0. Con
base en estos datos:

Por lo que la proporción (p) de circuitos que funcionan correctamente durante


las primeras horas es de 0,91 o 91% (0,91*100) y la proporción de circuitos que
no funcionan correctamente (q) es de 0,09 o 9% (0,9*100). La proporción
máxima es 1, por lo que p+q =1; q=1-p.

Si de la población «N» tomamos todas las muestras posibles de tamaño «n» se


obtendría su Distribución muestral de proporciones, cuyos parámetros son.

La Distribución muestral de p sigue una distribución binomial, sin embargo, por


el Teorema del Límite Central, si la muestra es lo suficientemente grande se
aproxima a una Dsitribución Normal (Z).
p
Z
 (1   ) / n

Las condiciones de n y π que afectan la calidad de la aproximación es:

 nπ ≥ 5 y n(1-π) ≥ 5
 En la medida que p se aproxime a 0,5 la aproximación a una Distribución
Normal será más confiable.

Ejemplo 11. Se ha encontrado que el 20% de las piezas fabricadas en una


cierta máquina son defectuosas. ¿Cuál es la probabilidad de que en un envío
de 300 piezas 25% o más sean defectuosas?

P (p ≥ 0,25) =?

El procedimiento a seguir para hallar la probabilidad es el siguiente:

 Se define cuál es el parámetro estimado. En este caso es π o proporción


de piezas defectuosas.
 Se define el tamaño de las muestras. n= 300 piezas.
 Se define cuál es la Distribución Muestral del estadístico (p). Para este
estudio, dado que la muestra es lo suficientemente grande (nπ≥5 y n (1-π)
≥5) (300*0,20 = 60; 300*0,80 = 240), la Distribución Muestral del Estadístico
proporción (p) es Normal (Z).
 Se estandariza la variable utilizando la fórmula de acuerdo a la
Distribución Muestral definida.

p 0,25  0,20 0,05


Z    2 ,17
1    0,201  0,20 0,16
n 300 300
 Se ubica en la Tabla o Distribución Muestral definida, el área de
probabilidad buscada en términos estándar.

P (Z ≥ 2,17) =?

Al interceptar fila-columna, el valor obtenido corresponde al área de


probabilidad sombreada en rojo, o mejor dicho de Z= 0 a Z= 2,17. En este caso
la probabilidad es de 0,48500.

Como el área bajo la curva o probabilidad bajo la curva es 1 y la distribución es


simétrica, entonce la mitad tiene un área de probabilidad de 0,5. En este
sentido, cómo la probabilidad que piden es de los mayores e iguales a Z≥2,17,
queda: 0,5 - 0,48500 = 0,015 ó 1,5%

 Se concluye de acuerdo a la probabilidad obtenida. La probabilidad de


que en un envío de 300 piezas 25% o más sean defectuosas es de 0,015 ó
15%.

Caso 9. Distribución muestral del estadístico desviación estándar o


varianza (σ, σ2) para muestras pequeñas n< 100 y Distribución
Poblacional normal.

Definición 6. Si S2 es la varianza de una muestra aleatoria de tamaño n que se


toma de una población normal que tiene la varianza σ 2, entonces el estadístico:

tiene una distribución chi cuadrada con gl=n-1.

La probabilidad de que una muestra aleatoria produzca un valor x2 mayor


que algún valoe específico es igual al área bajo la curva a la derecha de
este valor. Se acostumbra representar con x α2 el valor de x2 por arriba del
cual se encuentra un área de probabilidad α (ver tabla 3).

Ejemplo 12. Para una distribución Chi cuadrada con 12 grados de libertad,
calcule el valor de x2 tal que:

a) El área a la derecha de x2 es 0.05.


b) El área a la izquierda de x2 es 0.99
c) El área a la derecha de x2 es 0.025.

De la Tabla 3, se muestra los diversos valores de xα 2 para diversos valores de


probabilidad (α) y grados de libertad (n-1). Las áreas α son los encabezados
de las columnas; los grados de libertad (v) se dan en la columna izquierda, y
las entradas de la tabla son los valores x2. De allí, que el valor de x2 para 12
grados de libertad, que tiene un área de 0,05 a la derecha es:

a) x2 0,05 = 21,0

El valor de x2 para 12 grados de libertad, que tiene un área de 0,99 a la


izquierda, por lo que el área a la derecha es 1-0,99= 0,01

b) x2 0,01 = 26,2

El valor de x2 para 12 grados de libertad, que tiene un área de 0,025 a la


derecha es:
c) x2 0,025 = 23,3

Ejemplo 13. Encuentre los valores críticos de x2 para los que el área de la cola
derecha de la distribución x2 es 0.05 si el número de grados de libertad es igual
a:
a) 6
b) 15
c) 9
d) 2
a) x2 0,05; 6 = 12,6
b) x2 0,05; 15 = 25,0
a) x2 0,05; 9 = 16,9
a) x2 0,05; 2 = 6,0

Ejemplo 14. Un fabricante de baterías para automóvil garantiza que sus


baterías durarán, en promedio 3 años con una desviación estándar de 1 año. Si
5 de estas baterías tienen duraciones de 1,9, 2,4, 3,0, 3,5, y 4,2 años. ¿el
fabricante aún está convencido de que sus baterías tienen una desviación
estándar de 1 año? Suponga que la duración de la batería sigue una
distribución normal.

P (S2 ≤ 1) =?

El procedimiento a seguir para hallar la probabilidad es el siguiente:

 Se define cuál es el parámetro estimado. En este caso es σ o desviación


estándar en la duración de las baterías.
 Se define el tamaño de las muestras. n= 5 baterías.
 Se define cuál es la Distribución Muestral del estadístico (S). Para este
estudio, dado que la muestra es pequeña (n< 100) y Distribución
Poblacional es Normal, la Distribución Muestral del Estadístico (S) es Chi
Cuadrado.
 Se estandariza la variable utilizando la fórmula de acuerdo a la
Distribución Muestral definida.

Al calcular la varianza muestral S2 se tiene:

548,26  15
2

  0,815
2
S 54 
 Se ubica en la Tabla o Distribución Muestral definida, el área de
probabilidad buscada en términos estándar.

P (X2 ≤ 3,26) =?

De la Tabla 3, De allí, que el valor de x2 =3,26 (aproximado en Tabla 3,36)


para 4 grados de libertad, tiene un área de probabilidad aprox. 0,5 a la
derecha.

 Se concluye de acuerdo a la probabilidad obtenida. La probabilidad de


que la desviación estándar en la duración de la batería sea menor o igual a
0,815 año es aprox. a 0,5. Por lo tanto, el fabricante no tiene razón para
sospechar que la desviación estándar es diferente a 1 año.

También podría gustarte