Distribuciones de Muestreo

TEORIA DEL MUESTREO Estadística para Economistas
TEORIA DEL MUESTREO
Uno de los propósitos de la estadística inferencial es estimar las características

poblacionales desconocidas, examinando la información obtenida de una muestra, de
una población. El punto de interés es la muestra, la cual debe ser representativa de la
población objeto de estudio.
Se seguirán ciertos procedimientos de selección para asegurar de que las muestras

reflejen observaciones a la población de la que proceden, ya que solo se pueden hacer
observaciones probabilísticas sobre una población cuando se usan muestras
representativas de la misma.
Una población está formada por la totalidad de las observaciones en las cuales se
tiene cierto observa.
Una muestra es un subconjunto de observaciones seleccionadas de una población.
MUESTRAS ALEATORIAS
Cuando nos interesa estudiar las características de poblaciones grandes, se utilizan

muestras por muchas razones; una enumeración completa de la población, llamada
censo, puede ser económicamente imposible, o no se cuenta con el tiempo suficiente.
A continuación se verá algunos usos del muestreo en diversos campos:
1. Política. Las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinión pública y el apoyo en las elecciones.
2. Educación. Las muestras de las calificaciones de los exámenes de estudiantes se
usan para determinar la eficiencia de una técnica o programa de enseñanza.
3. Industria. Muestras de los productos de una línea de ensamble sirve para controlar
la calidad.
4. Medicina. Muestras de medidas de azúcar en la sangre de pacientes diabéticos
prueban la eficacia de una técnica o de un fármaco nuevo.
5. Agricultura. Las muestras del maíz cosechado en una parcela proyectan en la
producción los efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usaría para determinar los
criterios del público sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.
Daniel Guzmán Rojas

1
ERRORES EN EL MUESTREO
Cuando se utilizan valores muestrales, o estadísticos para estimar valores

poblacionales, o parámetros, pueden ocurrir dos tipos generales de errores: el error
muestral y el error no muestral.
EL ERROR MUESTRAL
Se refiere a la variación natural existente entre muestras tomadas de la misma

población.
Cuando una muestra no es una copia exacta de la población; aún si se ha tenido gran
cuidado para asegurar que dos muestras del mismo tamaño sean representativas de
una cierta población, no esperaríamos que las dos sean idénticas en todos sus detalles.
El error muestral es un concepto importante que ayudará a entender mejor la
naturaleza de la estadística inferencial.
Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, la media
poblacional µ , entonces la media muestral, como medida, conlleva algún error. Por
ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamaño 25 de una
población con media µ = 15 : si la media de la muestra es x = 12 , entonces a la diferencia
observada x − µ = - 3 se le denomina el error muestral. Una media muestral x puede
pensarse como la suma de dos cantidades, la media poblacional µ y el error muestral;
si e denota el error muestral, entonces:
x = µ +e
EJEMPLO
Se toman muestras de tamaño 2 de una población consistente en tres valores, 2, 4 y 6,

para simular una población "grande" de manera que el muestreo pueda realizarse un
gran número de veces, supondremos que éste se hace con reemplazo, es decir, el
número elegido se reemplaza antes de seleccionar el siguiente, además, se seleccionan
muestras ordenadas. En una muestra ordenada, el orden en que se seleccionan las
observaciones es importante, por tanto, la muestra ordenada (2,4) es distinta de la
muestra ordenada (4,2). En la muestra (4,2), se seleccionó primero 4 y después 2. La
siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2 que es
posible seleccionar con reemplazo y también contiene las medias muestrales y los
correspondientes errores muestrales. La media poblacional es igual a
µ = (2 + 4 + 6)/3 = 4 . Ver la tabla en la siguiente página.
Notese las interesantes relaciones siguientes contenidas en la tabla:

2
La media de la colección de medias muestrales es 4, la media de la población de la que

se extraen las muestras. Si µ x denota la media de todas las medias muestrales
entonces tenemos:
µx = ( 2 + 3 + 4 + 3 + 4 + 5 + 4 + 5 + 6 )/ 9 = 4
La suma de los errores muestrales es cero.
e1 + e2 + e3 + … + e9 = (-2 ) + (-1 ) + 0 + (-1 ) + 0 + 1 + 0 + 1 + 2 = 0
Muestras ordenadas x Error muestral (e = x − µ )
(2,2) 2 2 – 4 = -2
(2,4) 3 3 – 4 = -1
(2,6) 4 4–4=0
(4,2) 3 3 – 4 = -1
(4,4) 4 4–4=0
(4,6) 5 5–4=1
(6,2) 4 4–4=0
(6,4) 5 5–4=1
(6,6) 6 6–4=2
∑e i 0
En consecuencia, si x se usa para medir, estimar la media poblacional µ , el promedio

de todos los errores muestrales es cero.
ERROR NO MUESTRAL
Los errores que surgen al tomar las muestras no pueden clasificarse como errores
muestrales y se denominan errores no muestrales.
El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere

a una tendencia sistemática inherente a un método de muestreo que da estimaciones

3
de un parámetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo

positivo) que el parámetro real.
El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorización.
La aleatorización Se refiere a cualquier proceso de selección de una muestra de la

población en el que la selección es imparcial o no está sesgada; una muestra elegida
con procedimientos aleatorios se llama muestra aleatoria.
Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio
simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo
sistemático.
MUESTREO ALEATORIO SIMPLE
Si una muestra aleatoria se elige de tal forma que todos los elementos de la población
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria
simple.
EJEMPLO
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadística de 20 alumnos. 20C5 da el número total de formas de elegir una muestra no
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si
listamos las 15,504 en trozos separados de papel, una tarea tremenda, luego los
colocamos en un recipiente y después los revolvemos, entonces podremos tener una
muestra aleatoria de 5 si seleccionamos un trozo de papel con cinco nombres. Un
procedimiento más simple para elegir una muestra aleatoria sería escribir cada uno de
los 20 nombres en pedazos separados de papel, colocarlos en un recipiente,
revolverlos y después extraer cinco papeles al mismo tiempo.
Otro método parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20

utiliza una tabla de números aleatorios. Se puede construir la tabla usando una
calculadora o una computadora. También se puede prescindir de estas y hacer la tabla
escribiendo diez dígitos del 0 al 9 en tiras de papel, las colocamos en un recipiente y
los revolvemos, de ahí, la primera tira seleccionada determina el primer número de la
tabla, se regresa al recipiente y después de revolver otra vez se selecciona la seguida
tira que determina el segundo número de la tabla; el proceso continúa hasta obtener
una tabla de dígitos aleatorios con tantos números como se desee.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico,
imposible o no deseado; aunque sería deseable usar muestras aleatorias simples para

4
las encuestas nacionales de opinión sobre productos o sobre elecciones presidenciales,

sería muy costoso o tardado.
MUESTREO ESTRATIFICADO
El muestreo estratificado requiere de separar a la población según grupos que no se

traslapen llamados estratos, y de elegir después una muestra aleatoria simple en cada
estrato. La información de las muestras aleatorias simples de cada estrato
constituiría entonces una muestra global.
EJEMPLO
Suponga que nos interesa obtener una muestra de las opiniones de los profesores de
una gran universidad. Puede ser difícil obtener una muestra con todos los profesores,
así que supongamos que elegimos una muestra aleatoria de cada colegio, o
departamento académico; los estratos vendrían a ser los colegios, o departamentos
académicos.
MUESTREO POR CONGLOMERADOS
El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de

unidades heterogéneas entre sí de la población llamadas conglomerados. Cada
elemento de la población pertenece exactamente a un conglomerado, y los elementos
dentro de cada conglomerado son usualmente heterogéneos o disímiles.
EJEMPLO
Suponga que una compañía de servicio de televisión por cable está pensando en abrir
una sucursal en una ciudad grande; la compañía planea realizar un estudio para
determinar el porcentaje de familias que utilizarían sus servicios, como no es práctico
preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al azar,
la cual forma un conglomerado.
En el muestreo por conglomerados, éstos se forman para representar, tan fielmente

como sea posible, a toda la población; entonces se usa una muestra aleatoria simple de
conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias,
hospitales, escuelas y prisiones se realizan, generalmente, con base en el muestreo por
conglomerados.

5
MUESTREO SISTEMATICO
El muestreo sistemático es una técnica de muestreo que requiere de una selección

aleatoria inicial de observaciones seguida de otra selección de observaciones obtenida
usando algún sistema o regla.
EJEMPLO
Para obtener una muestra de suscriptores telefónicos en una ciudad grande, puede
obtenerse primero una muestra aleatoria de los números de las páginas del directorio
telefónico; al elegir el vigésimo nombre de cada página obtendríamos un muestreo
sistemático, también podemos escoger un nombre de la primera página del directorio y
después seleccionar cada nombre del lugar número cien a partir del ya seleccionado.
Por ejemplo, podríamos seleccionar un número al azar entre los primeros 100;
supongamos que el elegido es el 40, entonces seleccionamos los nombres del directorio
que corresponden a los números 40, 140, 240, 340 y así sucesivamente.

6
DISTRIBUCIONES MUESTRALES
Las muestras aleatorias obtenidas de una población son, por naturaleza propia,
impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y
tomadas de la misma población tenga la misma media muestral o que sean
completamente parecidas; puede esperarse que cualquier estadístico, como la media
muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de
una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores
posibles de un estadístico. Tales distribuciones serán muy importantes en el estudio
de la estadística inferencial, porque las inferencias sobre las poblaciones se harán
usando estadísticas muestrales. Como el análisis de las distribuciones asociadas con
los estadísticos muestrales, podremos juzgar la confiabilidad de un estadístico
muestral como un instrumento para hacer inferencias sobre un parámetro poblacional
desconocido.
Como los valores de un estadístico, tal como x , varían de una muestra aleatoria a otra,
se le puede considerar como una variable aleatoria con su correspondiente
distribución de frecuencias.
La distribución de frecuencia de un estadístico muestral se denomina distribución

muestral. En general, la distribución muestral de un estadístico es la de todos sus
valores posibles calculados a partir de muestras del mismo tamaño.
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población

grande. Se calcula la media muestral x para cada muestra; la colección de todas estas
medias muestrales recibe el nombre de distribución muestral de medias, lo que se
puede ilustrar en la siguiente figura:
Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y
se calcula la desviación estándar s de cada una. La colección de todas estas

7
desviaciones estándar muestrales se llama distribución muestral de la desviación

estándar, y lo podemos ver en la siguiente figura:
EJEMPLO
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores

0, 2, 4 y 6. Encuentre:
µ , la media poblacional.
σ , la desviación estándar poblacional.
µ x , la media de la distribución muestral de medias.
σ x , la desviación estándar de la distribución muestral de medias.
Además, grafique las frecuencias para la población y para la distribución muestral de

medias.
Solución:
a. La media poblacional es:
0+2+4+6
µ= =3
4

8
b. La desviación estándar de la población es:
( 0 − 3) + ( 2 − 3) + ( 4 − 3) + ( 6 − 3)
2 2 2 2
σ= = 2.236
4
c. A continuación se listan los elementos de la distribución muestral de la media y la

correspondiente distribución de frecuencias.
La media de la distribución muestral de medias es:
µX =
∑ ( fX ) = ( 0 )(1) + (1)( 2 ) + ( 2 )( 3) + ( 3)( 4 ) + ( 4 )( 3) + ( 5)( 2 ) + ( 6 )(1) + = 48 = 3
∑f 16 3
d. La desviación estándar de la distribución muestral de medias es:
∑( X − µ )
2
f
σX = X
∑f

9
( 0 − 3) 1 + (1 − 3) 2 + ( 2 − 3) 3 + ( 3 − 3) 4 + ( 4 − 3) 3 + ( 5 − 3) 2 + ( 6 − 3) 1 +
2 2 2 2 2 2 2
σX = = 1.58
16
De aquí que podamos deducir que:
σ 2.236
σX = = = 1.58
n 2
Como para cualquier variable aleatoria, la distribución muestral de medias tiene una
media o valor esperado, una varianza y una desviación estándar, se puede demostrar
que la distribución muestral de medias tiene una media igual a la media poblacional.
Esto es:
µX = E ( X ) = µ = 3
Después de haber realizado el ejercicio anterior se puede ver que una distribución
muestral se genera extrayendo todas las posibles muestras del mismo tamaño de la
población y calculándoles a éstas su estadístico.
Si la población de la que se extraen las muestras es normal, la distribución muestral

de medias será normal sin importar el tamaño de la muestra.
Si la población de donde se extraen las muestras no es normal, entonces el tamaño de

la muestra debe ser mayor o igual a 30, para que la distribución muestral tenga una
forma acampanada. Mientras mayor sea el tamaño de la muestra, más cerca estará la
distribución muestral de ser normal.
Para muchos propósitos, la aproximación normal se considera buena si se cumple n=30.

La forma de la distribución muestral de medias sea aproximadamente normal, aún en
casos donde la población original es bimodal, es realmente notable.

10
TEOREMA DEL LÍMITE CENTRAL
Si se seleccionan muestras aleatorias de n observaciones de una población con media

µ y desviación estándar σ , entonces, cuando n es grande, la distribución muestral de
medias tendrá aproximadamente una distribución normal con una media igual a µ y una
desviación estándar de σ n . La aproximación será cada vez más exacta a medida de
que n sea cada vez mayor.
EJEMPLO
Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores

0, 2, 4 y 6. Encuentre:
a. El error muestral de cada media

b. La media de los errores muestrales
c. La desviación estándar de los errores muestrales.
SOLUCIÓN
a. En la tabla siguiente se ven las muestras, las medias de las muestras y los errores
muestrales:

11
Error muestral
Muestras ordenadas x
(e = x − µ )
(0,0) 0 0 - 3 = -3
(0,2) 1 1 - 3 = -2
(0,4) 2 2 - 3 = -1
(0,6) 3 3–3=0
(2,0) 1 1 – 3 = -2
(2,2) 2 2 – 3 = -1
(2,4) 3 3–3=0
(2,6) 4 4–3=1
(4,0) 2 2 – 3 = -1
(4,2) 3 3–3=0
(4,4) 4 4–3=1
(4,6) 5 5–3=2
(6,0) 3 3–3=0
(6,2) 4 4–3=1
(6,4) 5 5–3=2
(6,6) 6 6–3=3
b. La media de los errores muestrales es µ e , es:
µe =
( −3) + ( −2 ) + ( −1) + 0 + ( −2 ) + ( −1) + 0 + 1 + ( −1) + 0 + 1 + 2 + 0 + 1 + 2 + 3 = 0
16
La desviación estándar de la distribución de los errores muestrales σ e , es entonces:
∑ (e − µ )
2
f
σe = e
∑f

12
( −3 − 0 )
1 + ( −2 − 0 ) 2 + ( −1 − 0 ) 3 + ( 0 − 0 ) 4 + (1 − 0 ) 3 + ( 2 − 0 ) 2 + ( 3 − 0 ) 1 + 1 + ( −1)
2 2 2 2 2 2 2
σe = = 1.58
16
La desviación estándar de la distribución muestral de un estadístico se conoce como
error estándar del estadístico. Para el ejercicio anterior el error estándar de la
media denotado por σ x , es 1.58. Con esto se puede demostrar que si de una población
se eligen muestras de tamaño n con reemplazo, entonces el error estándar de la
media es igual a la desviación estándar de la distribución de los errores muestrales.
En general se tiene: σ X −σe = 0
Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar
la formula siguiente para encontrar σ x .
σ N −n
σX =
n N −1
donde σ es la desviación estándar de la población de donde se toman las muestras, n

es el tamaño de la muestra y N el de la población.
Como regla de cálculo, si el muestreo se hace sin reemplazo y el tamaño de la población

n
es al menos 20 veces el tamaño de la muestra ( N ≤ 20n ó ≥ 0.05 ), entonces se puede
N
usar la fórmula del factor de corrección para una población finita:
N −n
N −1
EJEMPLO
Suponga que la tabla siguiente muestra la antigüedad en años en el trabajo de tres

maestros universitarios de matemáticas:
Maestro de matemáticas Antiguedad
A 6
B 4
C 2

13
Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo.

Calcule la antigüedad media para cada muestra, la media de la distribución muestral y
el error estándar, o la desviación estándar de la distribución muestral.
SOLUCIÓN
Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras posibles
de tamaño 2, con sus respectivas medias muestrales.
Media
Muestras Antigüedad
Muestral
A,B (6,4) 5
A,C (6,2) 4
B,C (4,2) 3
La media poblacional es:
2+4+6
µ= =4
3
La media de la distribución muestral es:
5+4+3
µX = =4
3
La desviación estándar de la población es:
( 6 − 4) + ( 4 − 4) + ( 2 − 4)
2 2 2
σ= = 1.633
3
El error estándar o la desviación estándar de la distribución muestral es:
(5 − 4) + ( 4 − 4) + (3 − 4)
2 2 2
σX = = 0.816
3
Si utilizamos la fórmula del error estándar sin el factor de corrección tendríamos

que:
σ 1.633
σX = = = 1.155
n 2

14
Por lo que observamos que este valor no es el verdadero. Agregando el factor de

corrección obtendremos el valor correcto:
σ N − n 1.633 3 − 2
σX = = = 0.816
n N −1 2 3 −1
El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el
valor del error estándar:
Comienzo
Si σ
¿Es la población σX =
Infinita? n
No
¿Se muestrea Si
con sustitución?
No
¿Es Si
N>20n?
No
σ N −n
σX =
n N −1

15
DISTRIBUCIÓN MUESTRAL DE MEDIAS
Si recordamos a la distribución normal, esta es una distribución continua, en forma de

campana en donde la media, la mediana y la moda tienen un mismo valor, y es simétrica
y mesokurtica.
Con esta distribución podíamos calcular la probabilidad de algún evento relacionado

con la variable aleatoria, mediante la siguiente fórmula:
X −µ
z=
σ
En donde z es una variable estandarizada con media igual a cero y varianza igual a uno.
Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier
ejercicio, utilizando la tabla de la distribución z .
Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier

tamaño de una población normal, la distribución muestral de medias tiene un
comportamiento aproximadamente normal, por lo que se puede utilizar la formula de la
distribución normal con µ = µ x y σ = σ x , entonces la fórmula para calcular la
probabilidad del comportamiento del estadístico, en este caso la media de la muestra ,
quedaría de la siguiente manera:
X −µ
z=
σX
σ
σX =
n
n
y para poblaciones finitas y muestreo sin reemplazo y ≥ 0.05 :
N
σ N −n
σX =
n N −1
SE DESCONOCE LA VARIANZA POBLACIONAL σ 2 , MUESTRA GRANDE ( n ≥ 30 )
Cuando se desconoce la desviación estándar, pero la muestra es grande ( n ≥ 30 ) se

utiliza como estimador de la desviación estándar poblacional σ la desviación estandar
muestral S , por lo tanto las formulas quedan de las siguiente manera:

16
X −µ
z=
σˆ X
S
σˆ X =
n
n
N
S N −n
σˆ X =
n N −1
EJEMPLO 1
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviación estándar de
40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga
una vida promedio de menos de 775 horas.
SOLUCIÓN
775 − 800
z= = −2.5
40
16
Este valor se busca en la tabla de z
P ⎡⎣ X ≤ 775⎤⎦ = P [ Z ≤ −2.5] = 1 − P [ Z ≤ 2.5] = 0.0062
0.0062
775 800
La interpretación sería que la probabilidad de que la media de la muestra de 16 focos

sea menor a 775 horas es de 0.0062.

17
EJEMPLO 2
Las estaturas de 1,000 estudiantes están distribuidas aproximadamente en forma

normal con una media de 174.5 centímetros y una desviación estándar de 6.9
centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de
esta población, determine:
a. El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
b. El número de medias muestrales que caen por debajo de 172 centímetros.
SOLUCIÓN
Como se puede observar en este ejercicio se cuenta con una población finita y un
muestreo sin reemplazo, por lo que se tendrá que agregar el factor de corrección. Se
procederá a calcular el denominador de z para sólo sustituirlo en cada inciso.
n 25
= = 0.025 < 0.05
N 1, 000
σ 6.9
σX = = = 1.38
n 25
a.
172.5 − 174.5
z= = −1.45
1.38
175.8 − 174.5
z= = 0.94
1.38
P ⎡⎣172.5 ≤ x ≤ 175.8⎤⎦ = P [ −1.45 ≤ z ≤ 0.94]
P [ −1.45 ≤ z ≤ 0.94] = P [ z ≤ 0.94] − P [ z ≤ −1.45]
P [ −1.45 ≤ z ≤ 0.94] = P [ z ≤ 0.94] − P [ z ≥ 1.45]
P [ −1.45 ≤ z ≤ 0.94] = P [ z ≤ 0.94] − {1 − P [ z ≤ 1.45]}
P [ −1.45 ≤ z ≤ 0.94] = 0.8269 − (1 − 0.9264 ) = 0.7533
P ⎡⎣172.5 ≤ x ≤ 175.8⎤⎦ = 0.7533

18
0.7533
172.5 174.5 175.8
(0.7533)(200)=151 medias muestrales
b.
172 − 174.5
z= = −1.81
1.38
P ⎡⎣ x ≤ 172 ⎤⎦ = P [ z ≤ −1.81] = P [ z ≥ 1.81]
P [ z ≤ −1.81] = 1 − P [ z ≤ 1.81] = 1 − 0.9650 = 0.0350
0.0350
172 174.5
(0.0350)(200)= 7 medias muestrales

19
DISTRIBUCIÓN MUESTRAL DE PROPORCIONES
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino

que queremos investigar la proporción de artículos defectuosos o la proporción de
alumnos reprobados en la muestra. La distribución muestral de proporciones es la
adecuada para dar respuesta a estas situaciones. Esta distribución se genera de igual
manera que la distribución muestral de medias, a excepción de que al extraer las
muestras de la población se calcula el estadístico proporción (p=X/n en donde “X” es el
número de éxitos u observaciones de interés y "n" el tamaño de la muestra) en lugar
del estadístico media.
Una población binomial está estrechamente relacionada con la distribución muestral

de proporciones; una población binomial es una colección de éxitos y fracasos,
mientras que una distribución muestral de proporciones contiene las posibilidades o
proporciones de todos los números posibles de éxitos en un experimento binomial, y
como consecuencia de esta relación, las afirmaciones probabilísticas referentes a la
proporción muestral pueden evaluarse usando la aproximación normal a la binomial,
siempre que np ≥ 5 y n(1 − p ) ≥ 5 . Cualquier evento se puede convertir en una proporción
si se divide el número obtenido entre el número de intentos.

20
GENERACIÓN DE LA DISTRIBUCIÓN MUESTRAL DE PROPORCIONES
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos.
Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la
distribución muestral de proporciones para el número de piezas defectuosas.
Como se puede observar en este ejercicio la Proporción de artículos defectuosos de

esta población es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este
lote están defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población de 12

elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera:
Número de
Proporción maneras en las
Artículos Artículos
de artículos que se puede
Buenos Malos
defectuoso obtener la
muestra
1 4 4/5=0.8 8C1*4C4=8
2 3 3/5=0.6 8C2*4C3=112
3 2 2/5=0.4 8C3*4C2=336
4 1 1/5=0.2 8C4*4C1=280
5 0 0/5=0 8C5*4C0=56
Total 12C5=792
Para calcular la media de la distribución muestral de proporciones se tendría que

hacer la sumatoria de la frecuencia por el valor de la proporción muestral y dividirla
entre el número total de muestras. Esto es:
µp =
( 0.8*8) + ( 0.6*112 ) + ( 0.4*336 ) + ( 0.2* 280 ) + ( 0*56 ) = 1 = 0.3333
792 3
Como podemos observar la media de la distribución muestral de proporciones es igual

a la proporción de la población.
µp = π

21
También se puede calcular la desviación estándar de la distribución muestral de

proporciones:
( 0.8 − 1 3) *8 + ( 0.6 − 1 3) *112 + ( 0.4 − 1 3) *336 + ( 0.2 − 1 3) * 280 + ( 0 − 1 3) *56

2 2 2 2 2
σp = = 0.1682
792
La varianza de la distribución binomial es σ 2 = npq , por lo que la varianza de la

distribución muestral de proporciones es σ p2 = π (1 − π ) n . Si se sustituyen los valores
en esta fórmula tenemos que:
σp =
(1 3)( 2 3) = 0.2108
5
este valor no coincide con el de 0.1682, ya que nos falta agregar el factor de
n
corrección para una población finita y un muestreo sin reemplazo y ≥ 0.05 :
N
π (1 − π ) N − n
σp =
n N −1
σp =
(1 3)( 2 3) 12 − 5
= 0.1682
5 12 − 1
La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral

de proporciones está basada en la aproximación de la distribución normal a la binomial.
Esta fórmula nos servirá para calcular la probabilidad del comportamiento de la
proporción en la muestra.
cc
p± −π
z= n
σp

22
π (1 − π )
σp =
n
cc = 0.5 n : corrección por Aproximación a la distribución normal de la binomial
1. Cuando P[ p ≥ p ] se requiere que p − 0.5 n

2. Cuando P[ p < p ] se requiere que p − 0.5 n
3. Cuando P[ p ≤ p ] se requiere que p + 0.5 n
4. Cuando P[ p > p ] se requiere que p + 0.5 n
N −n
A esta fórmula se le puede agregar el factor de corrección de si se
N −1
⎛n ⎞
cumple con las condiciones necesarias ⎜ ≥ 0.05 ⎟ .
⎝N ⎠
π (1 − π ) N − n
σp =
n N −1
Si utilizamos la siguiente formula:
x ± cc − nπ
z=
σ np
σ np = nπ (1 − π )
N −n
A esta fórmula se le puede agregar el factor de corrección de si se
N −1
⎛n ⎞
cumple con las condiciones necesarias ⎜ ≥ 0.05 ⎟ .
⎝N ⎠
N −n
σ np = nπ (1 − π )
N −1
cc = 0.5 : corrección por Aproximación a la distribución normal de la binomial
1. Cuando P[ X ≥ x ] se requiere que x − 0.5

2. Cuando P[ X < x ] se requiere que x − 0.5
3. Cuando P[ X ≤ x ] se requiere que x + 0.5
4. Cuando P[ X > x ] se requiere que x + 0.5

23
EJEMPLO 1
Se ha determinado que 60% de los estudiantes de una universidad grande fuman

cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad
de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que
0.55.
SOLUCIÓN
Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la
aproximación de la distribución normal a la binomial y el segundo utilizando la fórmula
de la distribución muestral de proporciones.
Aproximación de la distribución normal a la binomial
Datos:
n = 800 estudiantes
π = 0.60
p = 0.55
x = np = (800 )(0.55) = 440 estudiantes
P[ X < 440] = ?
µ p = nπ = (800)(0.60) = 480
x − 0.5 − nπ 400 − 0.5 − 480

z= = = −2.92
nπ (1 − π ) (800)(0.60)(0.40)
P[ X < 440] = P[z ≤ −2.92] = 1 − P[z ≤ 2.92] = 0.0017
Este valor significa que existe una probabilidad del 0.17% de que al extraer una
muestra de 800 estudiantes, menos de 440 fuman cigarrillos.

24
0.0017
440 480
440 − 0.5 = 439.5
Distribución Muestral de Proporciones
Datos:
n = 800 estudiantes
π = 0.60
p = 0.55
P[ p < 0.55] = ?
0.5 0.5
π− − π 0.55 − − 0.60
z= n = 800 = −2.92
π (1 − π ) (0.60)(0.40)
n 800
0.0017
0.55 0.60
0.5
0.55 − = 0.5494
800
Observe que este valor es igual al obtenido en el método de la aproximación de la

distribución normal a la binomial, por lo que si lo buscamos en la tabla de z nos da la

25
misma probabilidad de 0.0017. También se debe de tomar en cuenta que el factor de

corrección de 0.5 se esta dividiendo entre el tamaño de la muestra, ya que estamos
hablando de una proporción.
La interpretación en esta solución, estaría enfocada a la proporción de la muestra, por

lo que diríamos que la probabilidad de que al extraer una muestra de 800
estudiantes de esa universidad, la proporción de estudiantes que fuman cigarrillos
sea menor al 55% es del 0.17%.
EJEMPLO 2
Un medicamento para malestar estomacal tiene la advertencia de que algunos usuarios

pueden presentar una reacción adversa a él, más aún, se piensa que alrededor del 3%
de los usuarios tienen tal reacción. Si una muestra aleatoria de 150 personas con
malestar estomacal usa el medicamento, encuentre la probabilidad de que la
proporción de la muestra de los usuarios que realmente presentan una reacción
adversa, exceda el 4%.
a. Resolverlo mediante la aproximación de la normal a la binomial

b. Resolverlo con la distribución muestral de proporciones
SOLUCIÓN
a. Aproximación de la distribución normal a la binomial:
Datos:
n = 150 personas
π = 0.03
p = 0.04
x = np = (150 )(0.04 ) = 6 personas
P[ X > 6 ] = ?
µ p = nπ = (150)(0.03) = 4.5
x + 0.5 − nπ 6 + 0.5 − 4.5

z= = = 0.96
nπ (1 − π ) (150)(0.03)(0.07 )
P[ X > 6] = P[z ≥ 0.96] = 1 − P[z ≤ 0.96] = 0.1685

26
Este valor significa que existe una probabilidad del 16.85% de que al extraer una
muestra de 150 personas, más de 6 presentarán una reacción adversa.
0.1685
4.5 6
6 + 0.5 = 6.5
b. Distribución Muestral de Proporciones
Datos:
n = 150 personas
π = 0.03
p = 0.04
P[ p > 0.04] = ?
0.5 0.5
π+ − π 0.04 + − 0.03
z= n = 150 = 0.96
π (1 − π ) (0.03)(0.97 )
n 150
0.1685
0.03 0.04
0.5
0.04 + = 0.0433
150

27
Observe que este valor es igual al obtenido y la interpretación es: existe una
probabilidad del 16.85% de que al tomar una muestra de 150 personas se tenga una
proporción mayor de 0.04 presentando una reacción adversa.
EJEMPLO 3
Se sabe que la verdadera proporción de los componentes defectuosos fabricados por

una firma es de 4%, y encuentre la probabilidad de que una muestra aleatoria de
tamaño 60 tenga:
a. Menos del 3% de los componentes defectuosos.

b. Más del 1% pero menos del 5% de partes defectuosas.
SOLUCIÓN
a.
Datos:
n = 60 artículos
π = 0.04
p = 0.03
P[ p < 0.03] = ?
0.5 0.5
π− − π 0.03 − − 0.04
z= n = 60 = −0.73
π (1 − π ) (0.04)(0.96)
n 60
P[ p < 0.03] = P[z ≤ −0.73] = 1 − P[z ≤ 0.73] = 0.2327
0.2327
0.3 0.4
0.5
0.3 − = 0.0216
60

28
La probabilidad de que en una muestra de 60 artículos exista una proporción menor de

0.03 artículos defectuosos es de 0.2327.
b.
Datos:
n = 60 artículos
π = 0.04
p = 0.01 ∧ 0.05
P[0.01 < p < 0.05] = P[ p < 0.05] − P[ p ≤ 0.01] = ?
0.5 0.5
π− − π 0.05 − − 0.04
z= n = 60 = 0.07
π (1 − π ) ( 0.04 )( 0.96 )
n 60
0.5 0.5
π+ − π 0.01 + − 0.04
z= n = 60 = −0.86
π (1 − π ) (0.04)(0.96)
n 60
P [ 0.01 < p < 0.05] = P [ z ≤ 0.07 ] − P [ z ≤ −0.86] = P [ z ≤ 0.07 ] − {1 − P [ z ≤ 0.86]} =
P [ 0.01 < p < 0.05] = 0.5263 − (1 − 0.8041) = 0.3304
0.5
0.01 + = 0.0183
60
0.3304
0.01 0.04 0.05
0.5
0.05 − = 0.0417
60

29
DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE MEDIAS
Suponga que se tienen dos poblaciones distintas, la primera con media µ1 y desviación
estándar σ 1 , y la segunda con media µ 2 y desviación estándar σ 2 . Más aún, se elige una
muestra aleatoria de tamaño n1 de la primera población y una muestra independiente
aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada
muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se
llama distribución muestral de las diferencias entre medias o la distribución
muestral del estadístico x1 − x 2
La distribución es aproximadamente normal para n1 ≥ 30 y n2 ≥ 30 . Si las poblaciones

son normales, entonces la distribución muestral de medias es normal sin importar los
tamaños de las muestras.
En ejercicios anteriores se había demostrado que µ1 − µ 2 y que σ x = σ , por lo que no

n
σ 12 σ 22
es difícil deducir que µ x1 − µ x 2 = µ1 − µ 2 y que σ X1 − X 2 = + .
n1 n2
La fórmula que se utilizará para el cálculo de probabilidad del estadístico de

diferencia de medias es:
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
σ X −X
1 2
n1 n
Cuando se trata de poblaciones finitas, ≥ 0.05 Y 2 ≥ 0.05 se utiliza el factor de
N1 N2
corrección, quedando la formula de la desviación estándar de la diferencia de medias
de la siguiente manera:

30
⎛ σ 12 ⎞⎛ N1 − n1 ⎞ ⎛ σ 22 ⎞ ⎛ N 2 − n2 ⎞
σ X −X = ⎜ ⎟⎜ ⎟+⎜ ⎟⎜ ⎟
⎝ n1 ⎠⎝ N1 − 1 ⎠ ⎝ n2 ⎠ ⎝ N 2 − 1 ⎠
1 2
SE DESCONOCE LAS VARIANZAS POBLACIONALES σ 12 ∧ σ 22 , MUESTRAS

GRANDES ( n1 ≥ 30 ∧ n2 ≥ 30 )
Cuando se desconoce las desviaciones estándar, pero la muestras son grandes

( n1 ≥ 30 ∧ n2 ≥ 30 ) se utiliza como estimador de la desviaciones estándar poblacional
σ 1 ∧ σ 2 la desviaciones estandar muestral S1 ∧ S2 , por lo tanto las formulas quedan de
las siguiente manera:
S12 S22
σˆ X1 − X 2 = +
n1 n2
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
´
σˆ X − X
1 2
n1 n
N1 N2
⎛ S12 ⎞⎛ N1 − n1 ⎞ ⎛ S22 ⎞ ⎛ N 2 − n2 ⎞
σˆ X − X = ⎜ ⎟⎜ ⎟ + ⎜ ⎟⎜ ⎟
⎝ n1 ⎠⎝ N1 − 1 ⎠ ⎝ n2 ⎠ ⎝ N 2 − 1 ⎠
1 2
EJEMPLO 1
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en
una escuela primaria se usará una muestra aleatoria de 30 niños y otra de 35 niñas. Se
sabe que tanto para niños como para niñas los pesos siguen una distribución normal. El
promedio de los pesos de todos los niños de sexto grado de esa escuela es de 100
libras y su desviación estándar es de 14.142, mientras que el promedio de los pesos de
todas las niñas del sexto grado de esa escuela es de 85 libras y su desviación estándar
es de 12.247 libras. Si x1 representa el promedio de los pesos de 30 niños y x 2 es el
promedio de los pesos de una muestra de 35 niñas, encuentre la probabilidad de que el
promedio de los pesos de los 30 niños sea al menos 20 libras más grande que el de las
35 niñas.

31
SOLUCIÓN
Datos:
µ1 = 100 libras
µ1 = 85 libras
σ 1 = 14.142 libras
σ 2 = 12.247 libras
n1 = 30 niños
n2 = 35 niñas
P[x1 − x 2 > 20] = ?
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
=
20 − (100 − 85 )
= 1.51
σ 12 σ 22 (14.142 ) (12.247 )
2 2
+ +
n1 n2 20 25
P ⎡⎣ x1 − x 2 > 20 ⎤⎦ = P [ z ≥ 1.51] = 1 − P [ z ≤ 1.51] = 0.0654
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños

sea al menos 20 libras más grande que el de la muestra de las niñas es 0.0654.
0.0654
µ1 − µ2 = 15 X 1 − X 2 = 20
EJEMPLO 2
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos
a dos compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una
desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7

32
años con una desviación estándar de 0.7. Determine la probabilidad de que una
muestra aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos
un año más que la de una muestra aleatoria de 40 tubos de la compañía B.
SOLUCIÓN
Datos:
µ A = 7.2 años
µ B = 6.7 años
σ A = 0.8 años
σ B = 0.7 años
n A = 34 tubos
nB = 40 tubos
P[x A − x B > 1] = ?
z=
(X A − X B ) − ( µ A − µB )
=
1 − ( 7.2 − 6.7 )
= 2.84
σ A2 σ B2 ( 0.8) + ( 0.7 )
2 2
+
nA nB 34 40
P[x A − x B > 1] = P[z ≥ 2.84] = 1 − P[z ≤ 2.84] = 0.0023
0.0023
µ1 − µ2 = 0.5 X1 − X 2 = 1

33
EJEMPLO 3
Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrándose una

desviación estándar de 1.23km/L para la primera gasolina y una desviación estándar de
1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la
segunda en 42 autos.
a. ¿Cuál es la probabilidad de que la primera gasolina de un rendimiento promedio

mayor de 0.45km/L que la segunda gasolina?
b. ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se
encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?.
SOLUCIÓN
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos
poblaciones, por lo que se supondrán que son iguales.
Datos:
σ 1 = 1.23 Km/Lto
σ 2 = 1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos
a.
P[x1 − x 2 > 0.45] = ?
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
=
0.45 − 0
= 1.52
σ σ (1.23) (1.37 )
2 2 2 2
1
+ 2
+
n1 n2 35 42
P ⎡⎣ x1 − x 2 > 0.45⎤⎦ = P [ z ≥ 1.52] = 1 − P [ z ≤ 1.52] = 0.0645

34
0.0645
µ1 − µ 2 = 0 X 1 − X 2 = 0.45
La probabilidad de que la diferencia en rendimientos promedio en las muestras sean

mayores que 0.45 Km/Lto a favor de la gasolina 1 es de 0.0645.
b.
P[0.65 ≤ x1 − x 2 ≤ 0.83] = P[x1 − x 2 ≤ 0.83] − P[x1 − x 2 ≤ 0.65] = ?
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
=
0.65 − 0
= 2.19
σ σ (1.23) (1.37 )
2 2 2 2
1
+ 2
+
n1 n2 35 42
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
=
0.83 − 0
= 2.80
σ σ (1.23) (1.37 )
2 2 2 2
1
+ 2
+
n1 n2 35 42
P[0.65 ≤ x1 − x 2 ≤ 0.83] = P[x1 − x 2 ≤ 0.83] − P[x1 − x 2 ≤ 0.65] = P[z ≤ 2.80] − P[z ≤ 2.19]
P ⎡⎣0.65 ≤ x1 − x 2 ≤ 0.83⎤⎦ = 0.9974 − 0.9858 = 0.0116
0.0116
0 0.65 0.83
La probabilidad de que la diferencia en rendimientos promedio en las muestras se

encuentre entre 0.65 y 0.83 Km/Lto a favor de la gasolina 1 es de 0.0116.

35
DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE PROPORCIONES
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben

compararse utilizando proporciones o porcentajes. A continuación se citan algunos
ejemplos:
• Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas

que las de los que aprueban inglés?
• Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento A que
presentan una reacción adversa que el de los usuarios del fármaco B que también
presentan una reacción de ese tipo?
• Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales.
• Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que
genera la máquina A a los que genera la máquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos

proporciones muestrales, la distribución muestral de diferencia de proporciones es
aproximadamente normal para tamaños de muestra grande ( n1 p1 ≥ 5 , n1 (1 − p1 ) ≥ 5 ,
n2 p 2 ≥ 5 , n2 (1 − p2 ) ≥ 5 ). Entonces p1 y p2 tienen distribuciones muestrales
aproximadamente normales, así que su diferencia p1 − p2 también tiene una
distribución muestral aproximadamente normal.
Cuando se estudió a la distribución muestral de proporciones se comprobó que π = µ p

π (1 − π )
y que σ p = , por lo que no es difícil deducir que µ p1 − µ p2 = π 1 − π 2 y que
n
π 1 (1 − π 1 ) π 2 (1 − π 2 )
σ p −p = + .
1 2
n1 n2

36
La fórmula que se utilizará para el calculo de probabilidad del estadístico de

diferencia de proporciones es:
z=
( p1 − p2 ) ± cc − (π 1 − π 2 )
π 1 (1 − π 1 ) π 2 (1 − π 2 )
+
n1 n2
EJEMPLO 1
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en
sus opiniones sobre la promulgación de la pena de muerte para personas culpables de
asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de
muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos
muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación
de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a
favor sea al menos 3% mayor que el de las mujeres.
SOLUCIÓN
Datos:
π H = 0.12
π M = 0.10
nH = 100
nM = 100
P[ p H − pM ≥ 0.03] = ?
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una
distribución binomial y se está utilizando la distribución normal.
⎛ 0.5 ⎞ ⎛ 0.5 ⎞ ⎛ 0.5 ⎞ ⎛ 0.5 ⎞

( p H − pM ) − ⎜ ⎟⎜ ⎟ − (π H − π M ) 0.03 − ⎜ ⎟⎜ ⎟ − ( 0.12 − 0.10 )
⎝ nH ⎠ ⎝ nM ⎠ ⎝ 100 ⎠ ⎝ 100 ⎠
z= = = 0.11
π H (1 − π H ) π M (1 − π M ) ( 0.12 )( 0.88 ) ( 0.10 )( 0.90 )
+ +
nH nM 100 100
P [ pH − pM ≥ 0.03] = P [ z ≥ 0.11] = 1 − P [ z ≤ 0.11] = 0.4550

37
0.4550
0.02 0.03
⎛ 0.5 ⎞⎛ 0.5 ⎞
0.03 − ⎜ ⎟⎜ ⎟ = 0.025
⎝ 100 ⎠⎝ 100 ⎠
Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de

muerte, al menos 3% mayor que el de mujeres es de 0.4550.
EJEMPLO 2
Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron
despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo durante
por lo menos dos años. Supóngase que tuviera que seleccionar otra muestra aleatoria
de 320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984.
¿Cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo
durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de
Boston College, en 5% o más?
SOLUCIÓN
En este ejercicio se cuenta únicamente con una población, de la cual se están

extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los
porcentajes en esas dos muestras, por lo que se debe de utilizar la distribución
muestral de proporciones con π 1 = π 2 , ya que es una misma población.
Otra de las situaciones con la cual nos topamos es que desconocemos la proporción de
trabajadores despedidos entre 1979 y 1984 que estuvieron desempleados por un
período de por lo menos dos años, sólo se conoce la p1 = 0.20 ya que al tomar una
muestra de 320 trabajadores se observó esa proporción.
En la fórmula de la distribución muestral de proporciones para el cálculo de

probabilidad se necesita saber las proporciones de las poblaciones, las cuales en este
ejercicio las desconocemos, por lo que se utilizará el valor de 0.20 como una
estimación puntual de π . En el siguiente tema se abordará el tema de estimación
estadística y se comprenderá el porque estamos utilizando de esa manera el dato.

38
También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la
probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo
menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en
5% o más?, la palabra difiera quiere decir que puede existir una diferencia a favor de
la muestra uno, o a favor de la muestra dos, por lo que se tendrán que calcular dos
áreas en la distribución y al final sumarlas.
Datos:
p1 = 0.20
n1 = 320 trabajadores
n2 = 320 trabajadores
π1 = π 2
P[ p1 − p2 ≤ −0.05] + P[ p1 − p2 ≥ 0.05] = ?
⎛ 0.5 ⎞ ⎛ 0.5 ⎞ ⎛ 0.5 ⎞ ⎛ 0.5 ⎞

( p1 − p2 ) − ⎜ ⎟⎜ ⎟ − (π 1 − π 2 ) 0.05 − ⎜ ⎟⎜ ⎟ −0
⎝ n1 ⎠ ⎝ n2 ⎠ ⎝ 320 ⎠ ⎝ 320 ⎠
z= = = 1.53
π 1 (1 − π 1 ) π 2 (1 − π 2 ) ( 0.20 )( 0.8 ) ( 0.20 )( 0.8 )
+ +
n1 n2 320 320
⎛ 0.5 ⎞ ⎛ 0.5 ⎞ ⎛ 0.5 ⎞ ⎛ 0.5 ⎞

( p1 − p2 ) + ⎜ ⎟⎜ ⎟ − (π 1 − π 2 ) −0.05 + ⎜ ⎟⎜ ⎟ −0
⎝ n1 ⎠ ⎝ n2 ⎠ ⎝ 320 ⎠ ⎝ 320 ⎠
z= = = −1.53
π 1 (1 − π 1 ) π 2 (1 − π 2 ) ( 0.20 )( 0.8 ) ( 0.20 )( 0.8 )
+ +
n1 n2 320 320
P[ p1 − p2 ≤ −0.05] + P[ p1 − p2 ≥ 0.05] = {1 − P[z ≤ 1.53]}+ {1 − P[z ≤ 1.53]}
P [ p1 − p2 ≤ −0.05] + P [ p1 − p2 ≥ 0.05] = 0.0628 + 0.0628 = 0.1256
La probabilidad de que su proporción muestral de trabajadores sin empleo durante por

lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College,
en 0.05 o más es de 0.1260.

39
⎛ 0.5 ⎞⎛ 0.5 ⎞
−0.05 + ⎜ ⎟⎜ ⎟ = −0.0484
⎝ 320 ⎠⎝ 320 ⎠
0.0628 0.0628
−0.05 0 0.05
⎛ 0.5 ⎞ ⎛ 0.5 ⎞
0.05 − ⎜ ⎟⎜ ⎟ = 0.0484
⎝ 320 ⎠ ⎝ 320 ⎠
EJEMPLO 3
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que
2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras
de 120 objetos de cada máquina:
a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la

máquina 2 rebase a la máquina 1 en por lo menos 0.10?
b. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la
máquina 1 rebase a la máquina 2 en por lo menos 0.15?
SOLUCIÓN
Datos:
π 1 = 3 6 = 0 .5
π 2 = 2 5 = 0 .4
n1 = 120 objetos
n2 = 120 objetos
a.
P[ p2 − p1 ≥ 0.10] = ?

40
⎛ 0.5 ⎞ ⎛ 0.5 ⎞ ⎛ 0.5 ⎞ ⎛ 0.5 ⎞

( p2 − p1 ) − ⎜ ⎟⎜ ⎟ − (π 2 − π 1 ) 0.10 − ⎜ ⎟⎜ ⎟ − ( 0.4 − 0.5 )
⎝ n1 ⎠ ⎝ n2 ⎠ ⎝ 120 ⎠ ⎝ 120 ⎠
z= = = 3.06
π 2 (1 − π 1 ) π 1 (1 − π 1 ) ( 0.5 )( 0.5 ) ( 0.4 )( 0.6 )
+ +
n2 n1 120 120
P[ p2 − p1 ≥ 0.10] = P[z ≥ 3.06] = 1 − P[z ≤ 3.06] = 0.0011
0.0011
−0.10 0.10
⎛ 0.5 ⎞ ⎛ 0.5 ⎞
0.10 − ⎜ ⎟⎜ ⎟ = 0.0958
⎝ 120 ⎠ ⎝ 120 ⎠
b.
P[ p1 − p2 ≥ 0.15] = ?
⎛ 0.5 ⎞ ⎛ 0.5 ⎞ ⎛ 0.5 ⎞ ⎛ 0.5 ⎞

( p1 − p2 ) − ⎜ ⎟⎜ ⎟ − (π 1 − π 2 ) 0.15 − ⎜ ⎟⎜ ⎟ − ( 0.5 − 0.4 )
n
⎝ 1 ⎠⎝ 2 ⎠n ⎝ 120 ⎠ ⎝ 120 ⎠
z= = = 0.72
π 1 (1 − π 2 ) π 2 (1 − π 2 ) ( 0.4 )( 0.6 ) ( 0.5 )( 0.5 )
+ +
n1 n2 120 120
P[ p1 − p2 ≥ 0.15] = P[z ≥ 0.72] = 1 − P[z ≤ 0.72] = 0.2357
0.2357
0.10 0.15
⎛ 0.5 ⎞ ⎛ 0.5 ⎞
0.15 − ⎜ ⎟⎜ ⎟ = 0.1458
⎝ 120 ⎠ ⎝ 120 ⎠

41
La probabilidad de que exista una diferencia de proporciones de artículos defectuosos

de por lo menos 15% a favor de la máquina 1 es de 0.2357.
DISTRIBUCIÓN MUESTRAL DE NÚMERO DE DEFECTOS
En el control de calidad y específicamente en los gráficos de control c se aplica esta

distribución, la cual consiste en que al extraer un artículo contabilicemos el número de
defectos que tiene ese artículo.
Esta distribución muestral proviene de la distribución de Poisson, en la cual le media

es λ y que en este caso es el número promedio de defectos por unidad. Como ya es
conocido la varianza de la distribución de Poisson es igual a λ por lo que se puede
deducir la formula de la siguiente manera:
x ± 0 .5 − λ
z=
λ
Para la distribución muestral de número de defectos la nomenclatura utilizada es:
c = número defectos por unidad de inspección
C = número de defectos promedio por unidad de inspección
Se debe de recordar que la distribución de Poisson es una distribución discreta, y se

esta utilizando la aproximación de la normal a la Poisson, debiendo aplicar el factor de
corrección de cc = 0.5 según sea el caso. La formula para la dsitribución muestral de
número de defectos quedaría de la siguiente manera:
c ± 0 .5 − C
z=
C
EJEMPLO
En cierta empresa se fabrican productos con un promedio de 8 defectos por unidad.

Determine la probabilidad de que el próximo producto inspeccionado tenga un número
de defectos:
a. Mayor o igual a 6
b. Exactamente 7
c. Como máximo 9
C =8
a.

42
P[c ≥ 6] = ?
c − 0 .5 − C 6 − 0 .5 − 8
z= = = 0.88
C 8
P[c ≥ 6] = P[z ≥ 0.88] = 1 − P[z ≤ 0.88] = 0.8106
6 − 0.5 = 5.5
0.8106
6 8
La probabilidad de que el siguiente producto inspeccionado tenga por lo menos 6

defectos es de 0.8106.
b.
P[c = 7] = ?
c − 0 .5 − C 7 − 0 .5 − 8
z= = = −0.53
C 8
c + 0 .5 − C 7 + 0 .5 − 8
z= = = −0.17
C 8
P[c = 7] = P[z ≤ −0.17] − P[z ≤ −0.53] = {1 − P[z ≤ 0.17 ]}− {1 − P[z ≤ 0.53]}
P[c = 7 ] = 0.4325 − 0.2981 = 0.1344

43
7 − 0.5 = 6.5
0.1344
7 8
7 + 0.5 = 7.5
La probabilidad de que el siguiente producto inspeccionado tenga exactamente 7

defectos es de 0.1344.
c.
P[c ≤ 9] = ?
c + 0 .5 − C 9 + 0 .5 − 8
z= = = 0.53
C 8
P[c ≤ 9] = P[z ≤ 0.53] = 0.7019
9 + 0.5 = 9.5
0.7019
8 6
La probabilidad de que el siguiente producto inspeccionado tenga a lo más 9 defectos

es de 0.7019.

44
TEORÍA DE PEQUEÑAS MUESTRAS O

TEORÍA EXACTA DEL MUESTREO
En las unidades anteriores se manejó el uso de la distribución z, la cual se podía

utilizar siempre y cuando los tamaños de las muestras fueran mayores o iguales a 30 ó
en muestras más pequeñas si la distribución o las distribuciones de donde proviene la
muestra o las muestras son normales.
En esta unidad se podrán utilizar muestras pequeñas siempre y cuando la distribución

de donde proviene la muestra tenga un comportamiento normal. Esta es una condición
para utilizar las tres distribuciones que se manejarán en esta unidad; t de student, X 2
(ji-cuadrada) y F de Fisher.
A la teoría de pequeñas muestras también se le llama teoría exacta del muestreo, ya

que también la podemos utilizar con muestras aleatorias de tamaño grande.
En esta unidad se verá un nuevo concepto necesario para poder utilizar a las tres
distribuciones mencionadas. Este concepto es "grados de libertad".
Para definir grados de libertad se hará referencia a la varianza muestral:
∑( X −X)
2
i
S2 = i =1
n −1
Esta fórmula está basada en n − 1 grados de libertad (degrees of freedom). Esta

terminología resulta del hecho de que si bien S 2 está basada en n cantidades
X 1 − X , X 2 − X ,… , X n − X , éstas suman cero, así que especificar los valores de
cualquier n − 1 de las cantidades determina el valor restante. Por ejemplo, si n = 4 y
X 1 − X = 8, X 2 − X = −6 y X n − X = −4 , entonces automáticamente tenemos X 3 − X = 2 ,
así que sólo tres de los cuatro valores de xi − x están libremente determinamos 3
grados de libertad.
Entonces, en esta unidad la fórmula de grados de libertad será n − 1 y su simbología

υ = nu
DISTRIBUCION "t DE STUDENT"
Supóngase que se toma una muestra de una población normal con media µ y varianza
σ 2 . Si x es el promedio de las n observaciones que contiene la muestra aleatoria,
X −µ
entonces la distribución z = es una distribución normal estándar. Supóngase que
σ
n

45
la varianza de la población σ 2 es desconocida. ¿Qué sucede con la distribución de esta

estadística si se reemplaza σ por S ? La distribución t proporciona la respuesta a
esta pregunta.
La media y la varianza de la distribución t son µ = 0 y σ 2 = υ (υ − 2 ) para ν > 2 ,

respectivamente.
La siguiente figura presenta la gráfica de varias distribuciones t . La apariencia

general de la distribución t es similar a la de la distribución normal estándar: ambas
son simétricas y unimodales, y el valor máximo de la ordenada se alcanza en la media
µ = 0 . Sin embargo, la distribución t tiene colas más amplias que la normal; esto es, la
probabilidad de las colas es mayor que en la distribución normal. A medida que el
número de grados de libertad tiende a infinito, la forma límite de la distribución t es
la distribución normal estándar.
PROPIEDADES DE LAS DISTRIBUCIONES t :
1. Cada curva t tiene forma de campana con centro en 0.

2. Cada curva t , está más dispersa que la curva normal estándar z .
3. A medida que ν aumenta, la dispersión de la curva t correspondiente disminuye.
4. A medida que ν → ∞ , la secuencia de curvas t se aproxima a la curva normal
estándar, por lo que la curva z recibe a veces el nombre de curva t con gl = ∞ .
La distribución de la variable aleatoria t está dada por:
Γ ⎡⎣(ν + 1) 2 ⎤⎦
(1+ t2 ν )
−(ν +1) 2
f (t ) = , −∞ < t < ∞
Γ (ν 2 ) νπ
Esta se conoce como la distribución t con υ grados de libertad.
Sean X 1 , X 2 ,… , X n variables aleatorias independientes que son todas normales con

media µ y desviación estándar σ .

46
Entonces la variable aleatoria:
X −µ
t=
σX
S
σˆ X =
n
tiene una distribución t con ν = n − 1 grados de libertad.
n
N
S N −n
σˆ X =
n N −1
La distribución de probabilidad de t se publicó por primera vez en 1908 en un artículo

de W. S. Gosset. En esa época, Gosset era empleado de una cervecería irlandesa que
desaprobaba la publicación de investigaciones de sus empleados. Para evadir esta
prohibición, publicó su trabajo en secreto bajo el nombre de "Student". En
consecuencia, la distribución t normalmente se llama distribución t de Student, o
simplemente distribución t . Para derivar la ecuación de esta distribución, Gosset
supone que las muestras se seleccionan de una población normal. Aunque esto
parecería una suposición muy restrictiva, se puede mostrar que las poblaciones no
normales que poseen distribuciones en forma casi de campana aún proporcionan
valores de t que se aproximan muy de cerca a la distribución t .
La distribución t difiere de la de z en que la varianza de t depende del tamaño de la

muestra y siempre es mayor a uno. Únicamente cuando el tamaño de la muestra tiende
a infinito las dos distribuciones serán las mismas.
Se acostumbra representar con tα el valor t por arriba del cual se encuentra un área
igual a α . Como la distribución t es simétrica alrededor de una media de cero,
tenemos t1−α = −tα ; es decir, el valor t que deja un área de 1 − α a la derecha y por
tanto un área de α a la izquierda, es igual al valor t negativo que deja un área de α
en la cola derecha de la distribución. Esto es, t0.95 = −t0.05 , t0.99 = −t0.01 , etc.
Para encontrar los valores de t se utilizará la tabla de valores críticos de la

distribución t .

47
EJEMPLO 1
El valor t con υ = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por
tanto un área de 0.975 a la derecha, es
t0.975 = −t0.025 = −2.145
α = 0.025
t0.975 = −t0.025 = −2.145
Si se observa la tabla, el área sombreada de la curva es de la cola derecha, es por

esto que se tiene que hacer la resta de 1 − α . La manera de encontrar el valor de t es
buscar el valor de α en el primer renglón de la tabla y luego buscar los grados de
libertad en la primer columna y donde se intercepten α y ν se obtendrá el valor de t .
Ejemplo:
Encuentre la probabilidad de −t0.025 ≤ t ≤ t0.05 .
Solución:
1 − α = 0.925
α = 0.025 α = 0.05
−t0.025 = −2.145 t0.05 = 1.645
Como t0.05 deja un área de 0.05 a la derecha, y −t0.025 deja un área de 0.025 a la
izquierda, encontramos un área total de 1-0.05-0.025 = 0.925.
P [ −t0.025 ≤ t ≤ t0.05 ] = 0.925

48
EJEMPLO 2
Encuentre k tal que P [ k < t < −1.5231] = 0.05 , para una muestra aleatoria de tamaño 15
que se selecciona de una distribución normal.
Solución:
0.05
k t = −1.5231
Si se busca en la tabla el valor de t = 1.5231 con 14 grados de libertad nos damos

cuenta que a este valor le corresponde un área de 0.075 a la izquierda, por ser
negativo el valor. Entonces si se resta 0.075 y 0.045 se tiene un valor de 0.05, que
equivale a α . Luego se busca el valor de 0.05 ( P [t ≥ − k ] = 0.05 ) en el primer renglón con
14 grados de libertad y se obtiene un valor de t = 1.7613 , pero como el valor de α está
en el extremo izquierdo de la curva entonces la respuesta es t = −1.7613 por lo tanto:
P [ −1.7613 ≤ t ≤ −1.5231] = 0.05
EJEMPLO 3
Un ingeniero químico afirma que el rendimiento medio de la población de cierto

proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta
afirmación toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae
entre −t0.05 y t0.05 , queda satisfecho con su afirmación. ¿Qué conclusión extraería de
una muestra que tiene una media de 518 gramos por milímetro y una desviación
estándar de 40 gramos? Suponga que la distribución de rendimientos es
aproximadamente normal.
SOLUCIÓN
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.7109. Por tanto, el
fabricante queda satisfecho con esta afirmación si una muestra de 25 lotes rinde un
valor t entre –1.7109 y 1.7109.

49
0.90
0.05 0.05
−t0.05 = −1.7109 t0.05 = 1.7109
Se procede a calcular el valor de t:
x − µ 518 − 500
tc = = = 2.25
S 40
n 25
Este es un valor muy por arriba de 1.7109. Si se desea obtener la probabilidad de

obtener un valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la
tabla y es aproximadamente de 0.0174 (tomados de la interpolación de t24;0.02 = 2.1666 y
t24;0.01 = 2.4851 ). De aquí que es probable que el fabricante concluya que el proceso
produce un mejor producto del que piensa.
0.0174
tc = 2.25

50
PRUEBA t DE STUDENT PARA DATOS RELACIONADOS

(MUESTRAS DEPENDIENTES)
La prueba estadística t de Student para muestras dependientes es una extensión de

la utilizada para muestras independientes. De esta manera, los requisitos que deben
satisfacerse son los mismos, excepto la independencia de las muestras; es decir, en
esta prueba estadística se exige dependencia entre ambas, en las que hay dos
momentos uno antes y otro después. Con ello se da a entender que en el primer
período, las observaciones servirán de control o testigo, para conocer los cambios que
se susciten después de aplicar una variable experimental.
Con la prueba t se comparan las medias y las desviaciones estándar de grupo de datos
y se determina si entre esos parámetros las diferencias son estadísticamente
significativas o si sólo son diferencias aleatorias.
Consideraciones para su uso
9 El nivel de medición, en su uso debe ser de intervalo o posterior.

9 El diseño debe ser relacionado.
9 Se deben cumplir las premisas paramétricas.
En cuanto a la homogeneidad de varianzas, es un requisito que también debe

satisfacerse y una manera práctica es demostrarlo mediante la aplicación de la prueba
de Levene de Homogeneidad de Varianzas. Este procedimiento se define por medio de
la siguiente fórmula:
d − µd
t=
σˆ d
σˆ d
σˆ d =
n
n
N
σˆ d N −n
σˆ d =
n N −1
Donde:
t = valor estadístico del procedimiento.

51
d = Valor promedio o media aritmética de las diferencias entre los momentos antes y
después.
σˆ d = desviación estándar de las diferencias promedio entre los momentos antes y

después.
n = tamaño de la muestra.
La media aritmética de las diferencias se obtiene de la manera siguiente:
d=
∑d
n
La desviación estándar de las diferencias se logra como sigue:
∑ d − ∑n
d
∑(d − d )
2 2
σˆ d = =
n −1 n −1
Pasos:
1. Ordenar los datos en función de los momentos antes y después, y obtener las
diferencias entre ambos.
2. Calcular la media aritmética de las diferencias ( d ).
3. Calcular la desviación estándar de las diferencias promedio ( σˆ d ).
4. Calcular el valor de t por medio de la ecuación.
5. Calcular los grados de libertad ( gl ) gl = n − 1 .
6. Comparar el valor de t calculado con respecto a grados de libertad en la tabla
respectiva, a fin de obtener la probabilidad.
EJEMPLO
Un balneario de aguas curativas ha anunciado un programa de reducción de peso y

afirma que el participante promedio en el programa pierde más de 17 libras. Un
ejecutivo un tanto sobrado de peso está interesado en el programa, pero se muestra
escéptico sobre lo que afirma el anuncio y solicita una evidencia más fuerte. El
balneario le permite elegir aleatoriamente los registros de diez participantes y anotar
el peso que tenían antes y después de haber llevado a cabo el programa:
Antes 189 202 220 207 194 177 193 202 208 233
Después 170 179 203 192 172 161 174 187 186 204
¿Cuál es la probabilidad de que se baje de peso en un promedio mayor de 18 libras?

52
SOLUCIÓN
Datos:
Antes Después d d2
189 170 19 361
202 179 23 529
220 203 17 289
207 192 15 225
194 172 22 484
177 161 16 256
193 174 19 361
202 187 15 225
208 186 22 484
233 204 29 841
197 4,055
µd = 17
n = 10
∑ d − ∑n
(197 )
2
d
2
4, 055 −
σd = = 10 = 4.40
n −1 10 − 1
d − µd 18 − 17
t =t = = = 0.72
σd 4.40
n 10
P ⎡⎣ X A − X D ≥ 18⎤⎦ = P ⎡⎣ d ≥ 18⎤⎦ = P [t ≥ 0.72] = 0.2453
0.2453
µ d = 17 d = 18
La probabilidad de que se baje de peso en un promedio mayor de 19.7 libras es de

0.0421.

53
PRUEBA t DE STUDENT PARA DATOS NO RELACIONADOS

(MUESTRAS INDEPENDIENTES)
Todas las pruebas paramétricas, en las cuales se incluye la t de Student y la F de

Fischer, se basan en supuestos teóricos para utilizarse. Dichos supuestos matemáticos
las hacen válidas, pues al analizar las mediciones de las observaciones, se tienen
procedimientos de gran potencia-eficiencia para evitar error del tipo I.
En tales pruebas paramétricas se exige una serie de requisitos para aplicarlas como
instrumento estadístico:
1. Las observaciones deben ser independientes.

2. Las observaciones se deben efectuar en universos poblacionales distribuidos
normalmente.
3. Las mediciones se deben elaborar en una escala de intervalo, entendiendo que
una escala de intervalo exige que puedan efectuarse todas las operaciones
aritméticas admisibles. También se requiere que los intervalos entre las
mediciones tengan la misma magnitud.
4. Las varianzas de los grupos deben ser homogéneas, de modo que cabe aclarar
que en las mediciones realizadas en biomedicina, es poco probable encontrar
varianzas iguales. Por ello, se utiliza la prueba de la prueba de Levene de
Homogeneidad de Varianzas para decidir si las diferencias observables en la
magnitud de las varianzas son significativas o no.
El modelo matemático que en seguida se presenta, corresponde a dos muestras

independientes.
t=
( X 1 − X 2 ) − ( µ1 − µ2 )
σˆ X − X
1 2
1 1
σˆ X − X = σˆ +
1 2
n1 n2
σˆ =
( n1 − 1) S12 + ( n2 − 1) S22
n1 + n2 − 2
n1 n
N1 N2

54
⎛ 1 ⎞⎛ N1 − n1 ⎞ ⎛ 1 ⎞⎛ N 2 − n2 ⎞
σˆ X − X = σˆ ⎜ ⎟⎜ ⎟ + ⎜ ⎟⎜ ⎟
⎝ n1 ⎠⎝ N1 − 1 ⎠ ⎝ n2 ⎠⎝ N 2 − 1 ⎠
1 2
Pasos:
1. Determinar el promedio o media aritmética de cada grupo de población.

2. Calcular las varianzas de cada grupo, a fin de demostrar la homogeneidad de
varianzas mediante la prueba de la prueba de Levene de Homogeneidad de
Varianzas.
3. Calcular la desviación estándar de la diferencia de medias ( σˆ X1 − X 2 ).
4. Obtener la diferencia absoluta entre los grupos ( X 1 − X 2 ).
5. Aplicar la fórmula y obtener el valor estadístico de tc .
6. Calcular los grados de libertad ( gl ). gl = n1 + n2 − 2
7. Obtener la probabilidad del valor tc en la tabla.

55
EJEMPLO
El ministerio de salud afirma que los niños de cinco años de condición socioeconómica
alta tiene un promedio de estatura de 106.2 centímetros, y los de condición
socioeconómica baja 101.5 centímetros. Un investigador ha obtenido la talla (en
centímetros) de 20 niños de 5 años de edad, de dos condiciones socioeconómicas
contrastantes (alta y baja).
Condición
101 102 100 104 102 99 102 103 97 99
socioeconómica baja
Condición
103 105 104 106 108 100 108 104 105 107
socioeconómica alta
¿Cuál es la probabilidad de que los niños de condición socioeconómica baja tengan

entre 4 y 5 centímetros por debajo de los niños de condición socioeconómica alta?
SOLUCIÓN
Datos:
Condición Condición
socioeconomica socioeconomica
baja alta
101 103
102 105
100 104
104 106
102 108
99 100
102 108
103 104
97 105
99 107
Media 100.9 105.0
Desviación
2.13 2.45
estandar
µ A = 106.2
µ B = 101.5
S A = 2.45
S B = 2.13
nA = 10

56
nB = 10
gl = 10 + 10 − 2 = 18
( nA − 1) S A2 + ( nB − 1) S B2 (10 − 1)( 2.45) + (10 − 1)( 2.13)

2 2
σˆ = = = 2.30
nA + nB − 2 10 + 10 − 2
t=
( X A − X B ) − ( µ A − µ B ) = 4 − (106.2 − 101.5) = −1.52
1 1 1 1
σˆ + ( 2.30 ) +
nA nB 10 10
t=
( X A − X B ) − ( µ A − µ B ) = 5 − (106.2 − 101.5) = 0.65
1 1 1 1
σˆ + ( 2.30 ) +
nA nB 10 10
P ⎡⎣ 4 ≤ X A − X D ≤ 5⎤⎦ = P [ −1.52 ≤ T ≤ 0.65] = P [T ≥ −1.52] − P [T ≥ 0.65]
P ⎡⎣ 4 ≤ X A − X D ≤ 5⎤⎦ = (1 − P [T ≥ 1.52]) − P [T ≥ 0.65]
P ⎡⎣ 4 ≤ X A − X D ≤ 5⎤⎦ = (1 − 0.0724 ) − 0.2609 = 0.6667
0.6667
4 4.7 5

57
PRUEBA t DE STUDENT-WELCH PARA DOS MUESTRAS INDEPENDIENTES

CON VARIANZAS NO HOMOGÉNEAS
Esta prueba estadística es de utilidad para contrastar hipótesis en función de la

media aritmética, pero dada la heterogeneidad de las varianzas, no es aplicable la
prueba t de Student.
En este modelo estadístico, el agregado de Welch consiste en una ecuación para

calcular los grados de libertad, de manera que disminuye el error por la no
homogeneidad de las varianzas. Por otra parte, existe una modificación de la ecuación
original de la correspondiente t de Student, que es la siguiente:
t=
( X 1 − X 2 ) − ( µ1 − µ2 )
σˆ X − X
1 2
S12 S22
σˆ X1 − X 2 = +
n1 n2
El cálculo de los grados de libertad se realiza con la fórmula siguiente:
2
⎛ S12 S22 ⎞
⎜ + ⎟
n n2 ⎠
gl = ⎝ 12 2
¨
⎛ S12 ⎞ ⎛ S 22 ⎞
⎜ ⎟ ⎜ ⎟
⎝ n1 ⎠ + ⎝ n2 ⎠
n1 − 1 n2 − 1
n1 n
N1 N2
⎛ S12 ⎞⎛ N1 − n1 ⎞ ⎛ S 22 ⎞ ⎛ N 2 − n2 ⎞
σˆ X − X = σˆ ⎜ ⎟⎜ ⎟ + ⎜ ⎟⎜ ⎟
1 2
n
⎝ 1 ⎠⎝ 1 N − 1 ⎠ ⎝ n2 ⎠ ⎝ N 2 − 1 ⎠
Pasos:
1. Determinar el promedio, la varianza y el tamaño de la muestra de cada población

en el estudio.
2. Calcular las varianzas de cada grupo, a fin de demostrar la heterogeneidad de
2
varianzas mediante la prueba de X de Bartlett.
3. Aplicar la ecuación tc .

58
4. Calcular los grados de libertad ( gl ) de acuerdo con la ecuación dada.

5. Obtener la probabilidad del valor tc en la tabla.
EJEMPLO
Silueta Center afirma que las personas obesas que reciben tratamientos de obesidad
tienen un grado de ansiedad de 70 (dentro de la escala de estado de ansiedad IDARE)
y las personas obesas que no están en tratamiento tienen un grado de ansiedad de 52
(dentro de la escala de estado de ansiedad IDARE). Un investigador de dicho centro
realiza un estudio para mostrar que los niveles de ansiedad de las personas obesas que
asisten de manera constante a tratamiento para control de peso corporal es mayor
que el de los obesos que no asisten a tratamiento. Participaron 31 personas obesas
(hombres y mujeres). 14 personas obesas que no asistían a tratamiento y 17 que
asistían de manera regular a algún tipo de tratamiento. A los 31 participantes se les
solicitó que dieran respuesta a la escala de estado de ansiedad (IDARE), la cual está
diseñada para evaluar el grado de ansiedad ante situaciones cotidianas. Los puntajes
de la escala varían en un rango de 20 a 80 puntos, siendo los puntajes más altos los
indicativos de un mayor nivel de ansiedad.
¿Cuál es la probabilidad de que los obesos con tratamiento sobre la obesidad tengan
más de 15 niveles de ansiedad (dentro de la escala de estado de ansiedad IDARE) por
encima de los obesos sin tratamiento?
Con
65 70 75 75 70 70 60 65 70 70 70 75 65 75
tratamiento
Sin
35 40 60 40 55 45 50 55 50 50 60 55 70 60 55 50 30
tratamiento
SOLUCIÓN
Datos:
µCT = 70
µ ST = 52
SCT = 4.584
S ST = 10.137
nCT = 14
nST = 17

59
Con Sin
tratamiento tratamiento
65 35
70 40
75 60
75 40
70 55
70 45
60 50
65 55
70 50
70 50
70 60
75 55
65 70
75 60
55
50
30
Media 69.643 50.588
Desviación
4.584 10.137
Estandar
2
⎛ σ CT
2
σ ST
2
⎞
2 ⎛ ( 4.584 )2 (10.137 )2 ⎞
⎜ + ⎟ ⎜ + ⎟
nCT nST ⎠ ⎜ 14 17 ⎟
gl = ⎝ = ⎝ ⎠ = 23.175 ≅ 23
2 2 2 2
⎛ σ CT
2
⎞ ⎛ σ ST 2
⎞ ⎛ ( 4.584 )2 ⎞ ⎛ (10.137 )2 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝ nCT ⎠ + ⎝ nST ⎠ ⎜ 14 ⎟ ⎜ 17 ⎟
⎝ ⎠ +⎝ ⎠
nCT − 1 nST − 1 14 − 1 17 − 1
t=
( X CT − X ST ) − ( µCT − µST ) = 15 − ( 70 − 52 )
= −1.09
σ CT σ ST ( 4.584 ) (10.137 )
2 2 2 2
+ +
nCT nST 14 17
P ⎡⎣ X CT − X ST ≥ 15⎤⎦ = P [T ≥ −1.09] = 1 − P [T ≥ 1.09]
P ⎡⎣ X CT − X ST ≥ 15⎤⎦ = 1 − 0.1430 = 0.8570
0.8570
15 18

60
DISTRIBUCIÓN JI-CUADRADA (X2)
En realidad la distribución ji-cuadrada es la distribución muestral de S 2 . O sea que si

se extraen todas las muestras posibles de una población normal y a cada muestra se le
calcula su varianza, se obtendrá la distribución muestral de varianzas.
Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el

estadístico X 2 . Si se elige una muestra de tamaño n de una población normal con
varianza σ 2 , el estadístico:
( n − 1) S 2
σ2
tiene una distribución muestral que es una distribución ji-cuadrada con gl = n − 1

grados de libertad y se denota X 2 ( X es la minúscula de la letra griega ji). El
estadístico ji-cuadrada esta dado por:
X c2 =
( n − 1) S 2
σ2
donde n es el tamaño de la muestra, S 2 la varianza muestral y σ 2 la varianza de la

población de donde se extrajo la muestra. El estadístico ji-cuadrada también se puede
dar con la siguiente expresión:
∑( X − X )
2
X 2
=
c
σ2
Propiedades de las distribuciones ji-cuadrada
1. Los valores de X 2 son mayores o iguales que 0.

2. La forma de una distribución X 2 depende del gl = n − 1 . En consecuencia, hay un
número infinito de distribuciones X 2 .
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X 2 no son simétricas. Tienen colas estrechas que se
extienden a la derecha; esto es, están sesgadas a la derecha.
5. Cuando n > 2 , la media de una distribución X 2 es n − 1 y la varianza es 2 ( n − 1) .
6. El valor modal de una distribución X 2 se da en el valor ( n − 3) .
La siguiente figura ilustra tres distribuciones X 2 . Note que el valor modal aparece en
el valor ( n − 3) = gl − 2 .

61
La función de densidad de la distribución X 2 esta dada por:
1 ν −x
f (X ) = x 2 −1
e 2
para x > 0
( )
ν
2 Γν2
2
La tabla que se utilizará la de los valores críticos X gl2 ;α . Para denotar el valor crítico
de una distribución X 2 con gl grados de libertad se usa el símbolo X gl2 ;α ; este valor
crítico determina a su derecha un área de α bajo la curva X 2 y sobre el eje
horizontal. Por ejemplo para encontrar X 6;0.05
2
en la tabla se localiza gl = 6 en el lado
izquierdo y α = 0.05 a o largo del lado superior de la misma tabla.

62
1 − α = 0.95
α = 0.05
X 2
6;0.05 = 12.5916
CÁLCULO DE PROBABILIDAD:
El cálculo de probabilidad en una distribución muestral de varianzas nos sirve para

saber como se va a comportar la varianza o desviación estándar en una muestra que
proviene de una distribución normal.
EJEMPLO 1
Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus
destinos en una ciudad grande forman una distribución normal con una desviación
estándar σ = 1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la
probabilidad de que la varianza muestral sea mayor que 2.
SOLUCIÓN
Primero se encontrará el valor de ji-cuadrada correspondiente a S 2 = 2 como sigue:
X 2
=
( n − 1) S 2 (17 − 1)( 2 )
= = 32
σ2 (1)
c 2
El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad y se

encuentra que a este valor le corresponde un área a la derecha de 0.01. En
consecuencia, el valor de la probabilidad es P ⎡⎣σ 2 ≥ 2 ⎤⎦ .

63
α = 0.01
X = 32
2
16

64
EJEMPLO 2
Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una

población normal con varianza σ 2 = 6 , tenga una varianza muestral:
1. Mayor que 9.1

2. Entre 3.462 y 10.745
SOLUCIÓN
1. Primero se procederá a calcular el valor de la ji-cuadrada:
X c2 =
( n − 1) S 2 = ( 25 − 1)( 9.1) = 36.4
σ2 6
α = 0.05
X 2
24 = 36.4
Al buscar este número en el renglón de 24 grados de libertad nos da un área a la

derecha de 0.05. Por lo que la P ⎡⎣σ 2 ≥ 9.1⎤⎦ = 0.05
2. Se calcularán dos valores de ji-cuadrada:
X 2
=
( n − 1) S 2 ( 25 − 1)( 3.462 )
= = 13.848
c
σ2 6
X 2
=
( n − 1) S 2 ( 25 − 1)(10.745 )
= = 42.98
c
σ2 6
P ⎡⎣3.462 ≤ σ 2 ≤ 10.745⎤⎦ = P ⎡⎣σ 2 ≥ 3.462 ⎤⎦ − P ⎡⎣σ 2 ≥ 10.745⎤⎦

65
P ⎡⎣3.462 ≤ σ 2 ≤ 10.745⎤⎦ = P ⎡⎣ X 2 ≥ 13.85⎤⎦ − P ⎡⎣σ 2 ≥ 42.98⎤⎦
P ⎡⎣3.462 ≤ σ 2 ≤ 10.745⎤⎦ = 0.95 − 0.01 = 0.94
Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al
buscar el valor de 13.848 se encuentra un área a la derecha de 0.95. El valor de 42.98
da un área a la derecha de 0.01. Como se está pidiendo la probabilidad entre dos
valores se resta el área de 0.95 menos 0.01 quedando 0.94.
Por lo tanto la P ⎡⎣3.462 ≤ σ 2 ≤ 10.745⎤⎦ = 0.94
α = 0.94
X 242 = 13.848 X 242 = 42.98

66
DISTRIBUCION "F" FISHER
La necesidad de disponer de métodos estadísticos para comparar las varianzas de dos

poblaciones es evidente a partir del análisis de una sola población. Frecuentemente se
desea comparar la precisión de un instrumento de medición con la de otro, la
estabilidad de un proceso de manufactura con la de otro o hasta la forma en que varía
el procedimiento para calificar de un profesor universitario con la de otro.
Intuitivamente, podríamos comparar las varianzas de dos poblaciones, σ 12 y σ 22 ,

S12 S12
utilizando la razón de las varianzas muestrales . Si es casi igual a 1, se tendrá
S22 S22
poca evidencia para indicar que σ 12 y σ 22 no son iguales. Por otra parte, un valor muy
grande o muy pequeño para σ 12 y σ 22 , proporcionará evidencia de una diferencia en las
varianzas de las poblaciones.
La variable aleatoria F se define como el cociente de dos variables aleatorias ji-

cuadrada independientes, cada una dividida entre sus respectivos grados de libertad.
Esto es,
U
ν1
F=
V
ν2
donde U y V son variables aleatorias ji-cuadrada independientes con grados de

libertad ν 1 y ν 2 respectivamente.
Sean U y V dos variables aleatorias independientes que tienen distribución ji

cuadradas con ν 1 y ν 2 grados de libertad, respectivamente. Entonces la distribución
U
ν1
de la variable aleatoria F = está dada por:
V
ν2
ν1(ν
Γ ⎡⎣(ν 1 +ν 2 ) 2 ⎤⎦ (ν 1 ν 2 ) x 2
)−1
2
1
f (X ) = (ν1 +ν 2 )
Γ (ν 1 2 ) Γ (ν 2 2 )(1 +ν 1 x ν 2 )
2
0< x<∞
y se dice que sigue la distribución F con ν 1 grados de libertad en el numerador y ν 2

grados de libertad en el denominador.

67
La media y la varianza de la distribución F son:
ν1
µ= , para ν 2 > 2
ν2 − 2
2ν 22 (ν 1 +ν 1 − 2 )
σ =
2
, para ν 2 > 4
ν 1 (ν 2 − 2 ) (ν 2 − 4 )
2
La variable aleatoria F es no negativa, y la distribución tiene un sesgo hacia la

derecha. La distribución F tiene una apariencia muy similar a la distribución ji-
cuadrada; sin embargo, se encuentra centrada respecto a 1, y los dos parámetros ν 1 y
ν 2 proporcionan una flexibilidad adicional con respecto a la forma de la distribución.
Si S12 y S 22 son las varianzas muestrales independientes de tamaño n1 y n2 tomadas de

poblaciones normales con varianzas σ 12 y σ 22 , respectivamente, entonces:
S12 2 2
σ 12 S 2σ 2 ⎛ S ⎞ ⎛ σ ⎞
Fc = = 12 22 = ⎜ 1 ⎟ ⎜ 2 ⎟
S 22 S2 σ 1 ⎝ S2 ⎠ ⎝ σ 1 ⎠
σ 22
Para manejar las tablas de Fisher, se tendrá que buscar primero los grados de
libertad dos para luego localizar el área correspondiente, relacionándola con los
grados de libertad uno, para calcular el valor de F.

68
1 − α = 0.95
α = 0.05
F6;8;0.05 = 3.58

69
EJEMPLO
Si S12 y S 22 representan las varianzas de las muestras aleatorias independientes de

tamaño n1 = 25 y n2 = 31 , tomadas de poblaciones normales con varianzas σ 12 = 10 y
⎡ S12 ⎤
σ = 15 , respectivamente, encuentre P ⎢ 2 ≥ 1.26 ⎥ .
2
1
⎣ S2 ⎦
SOLUCIÓN
Calcular el valor de Fisher:
⎛ 15 ⎞
Fc = (1.26 ) ⎜ ⎟ = 1.89
⎝ 10 ⎠
Luego se va a la tabla de Fisher a buscar 24 grados de libertad uno con 30 grados de

libertad 2. Cuando se este en esta posición se busca adentro de la tabla el valor de
Fisher de 1.89. Al localizarlo y ver a la derecha de este valor se obtiene un área de
0.05.
α = 0.05
F24;30 = 1.89

70
PRUEBA DE LEVENE DE HOMOGENEIDAD DE VARIANZAS

Uno de los pasos previos a la comprobación de si existen diferencias entre las medias
de varias muestras es determinar si las varianzas en tales muestras son iguales (es
decir, si se cumple la condición de homogeneidad de varianzas o homoscedasticidad),
ya que de que se cumpla o no esta condición dependerá la formulación que empleemos
en el contraste de medias.
Existen varias pruebas que permiten comprobar la igualdad de varianzas (F de Fisher,
Fmax de Hartley, prueba de Bartlett, etc), pero aquí desarrollaremos la prueba de
Levene que es la que emplea SPSS. Para su cálculo se siguen los siguientes pasos:
1) Calcular la diferencia (en valor absoluto) entre cada valor y la media de su grupo:
Dki = X ki − X k
donde:
X ki : es la puntuación del sujeto i perteneciente al grupo k.

X k : es la media del grupo k.
2) Calcular la media de las diferencias de cada grupo:
nk
∑D ki
Dk = i =1
nk
donde:
nk
∑D
i =1
ki : es la suma de las puntuaciones Di en el grupo k.
nk : es el tamaño del grupo k.

3) Calcular la media total de las diferencias:
k nk
∑∑ D ki
DT = k =1 i =1

71
Donde:
Dki : es la suma de las puntuaciones Di de todos los sujetos.

n : es la suma de todos los sujetos.
4) Calcular Fc para la prueba de Homogeneidad de varianza:
2
( n − 2 ) ∑ nk ( Dk − DT )
2
Fc = 2
k =1
nk
∑∑ ( D ki − Dk )
2
k =1 i =1
5) Determinar el área para P [ F ≥ Fc ] para gl1 = 1 y gl2 = n − 2 , en donde

P [ F ≥ Fc ] ≤ α las variancias son heterogéneas:
F1;n − 2 = Fc
EJEMPLO
Determinar si las varianzas son homogéneas del ejemplo de la “PRUEBA t DE

STUDENT-WELCH PARA DOS MUESTRAS INDEPENDIENTES CON VARIANZAS
NO HOMOGÉNEAS”.
Silueta Center afirma que las personas obesas que reciben tratamientos de obesidad
tienen un grado de ansiedad de 70 (dentro de la escala de estado de ansiedad IDARE)
y las personas obesas que no están en tratamiento tienen un grado de ansiedad de 52
(dentro de la escala de estado de ansiedad IDARE). Un investigador de dicho centro

72
realiza un estudio para mostrar que los niveles de ansiedad de las personas obesas que
asisten de manera constante a tratamiento para control de peso corporal es mayor
que el de los obesos que no asisten a tratamiento. Participaron 31 personas obesas
(hombres y mujeres). 14 personas obesas que no asistían a tratamiento y 17 que
asistían de manera regular a algún tipo de tratamiento. A los 31 participantes se les
solicitó que dieran respuesta a la escala de estado de ansiedad (IDARE), la cual está
diseñada para evaluar el grado de ansiedad ante situaciones cotidianas. Los puntajes
de la escala varían en un rango de 20 a 80 puntos, siendo los puntajes más altos los
indicativos de un mayor nivel de ansiedad.
¿Cuál es la probabilidad de que los obesos con tratamiento sobre la obesidad tengan
más de 15 niveles de ansiedad (dentro de la escala de estado de ansiedad IDARE) por
encima de los obesos sin tratamiento?
Con
65 70 75 75 70 70 60 65 70 70 70 75 65 75
tratamiento
Sin
35 40 60 40 55 45 50 55 50 50 60 55 70 60 55 50 30
tratamiento
SOLUCIÓN
Datos:
(D 1i − D1 )
Con Sin
(D 2 i − D2 )
2 2
tratamiento tratamiento D1i D2i
(1) (2)
65 35 4.64 15.59 1.63 62.51
70 40 0.36 10.59 9.06 8.45
75 60 5.36 9.41 3.96 2.99
75 40 5.36 10.59 3.96 8.45
70 55 0.36 4.41 9.06 10.69
70 45 0.36 5.59 9.06 4.38
60 50 9.64 0.59 39.38 50.32
65 55 4.64 4.41 1.63 10.69
70 50 0.36 0.59 9.06 50.32
70 50 0.36 0.59 9.06 50.32
70 60 0.36 9.41 9.06 2.99
75 55 5.36 4.41 3.96 10.69
65 70 4.64 19.41 1.63 137.60
75 60 5.36 9.41 3.96 2.99
55 4.41 10.69
50 0.59 50.32
30 20.59 166.58
MEDIA 69.643 50.588 3.37 7.68
SUMA 114.47 640.98
n 14 17

73
n1
∑D 1i
4.64 + 0.36 + … + 4.64 + 5.36
D1 = i =1
= = 3.37
n1 14
n2
∑D 2i
15.59 + 10.59 + … + 0.59 + 20.59
D2 = i =1
= = 7.68
n2 17
2 nk
∑∑ D ki
4.64 + 0.36 + … + 0.59 + 20.59
DT = k =1 i =1
= = 5.73
n 14 + 17
2 nk
∑∑ ( D ki − Dk ) = ( 4.64 − 3.37 ) + ( 9.06 − 3.37 ) + …

2 2 2
k =1 i =1
… + ( 5.36 − 3.37 ) + (15.59 − 7.68 ) + …

2 2
… + ( 0.59 − 7.68 ) + ( 20.59 − 7.68 )

2 2
2 nk
∑∑ ( D ki − Dk ) = 114.47 + 640.98 = 755.45

2
k =1 i =1
2
( n − 2 ) ∑ nk ( Dk − DT ) = (14 + 17 − 2 ) ⎡(14 )( 3.37 − 5.73) + (17 )( 7.68 − 5.73) ⎤ = 4,144.16
2 2 2
k =1
⎣ ⎦
2
( n − 2 ) ∑ nk ( Dk − DT )
2
4,144.16
Fc = 2
k =1
nk
= = 5.486
755.45
∑∑ ( Dki − Dk )
2
k =1 i =1
P [ F ≥ 5.486] = 0.0000 , con gl1 = 1 y gl2 = 14 + 17 − 2 = 29 .

74
F1;29 = 5.486
Como ( P [ F ≥ 5.486] = 0.0000 ) < 0.05 , entonces podemos afirmar que las varianzas son
heterogéneas (diferentes).

75

Distribuciones de Muestreo

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Distribuciones de Muestreo

Cargado por

Copyright:

Formatos disponibles

TEORIA DEL MUESTREO Estadística para Economistas

TEORIA DEL MUESTREO

Uno de los propósitos de la estadística inferencial es estimar las características

Se seguirán ciertos procedimientos de selección para asegurar de que las muestras

Una muestra es un subconjunto de observaciones seleccionadas de una población.

Cuando nos interesa estudiar las características de poblaciones grandes, se utilizan

A continuación se verá algunos usos del muestreo en diversos campos:

Daniel Guzmán Rojas

Cuando se utilizan valores muestrales, o estadísticos para estimar valores

Se refiere a la variación natural existente entre muestras tomadas de la misma

Se toman muestras de tamaño 2 de una población consistente en tres valores, 2, 4 y 6,

Notese las interesantes relaciones siguientes contenidas en la tabla:

Daniel Guzmán Rojas

La media de la colección de medias muestrales es 4, la media de la población de la que

La suma de los errores muestrales es cero.

e1 + e2 + e3 + … + e9 = (-2 ) + (-1 ) + 0 + (-1 ) + 0 + 1 + 0 + 1 + 2 = 0

Muestras ordenadas x Error muestral (e = x − µ )

En consecuencia, si x se usa para medir, estimar la media poblacional µ , el promedio

El sesgo de las muestras es un tipo de error no muestral. El sesgo muestral se refiere

Daniel Guzmán Rojas

de un parámetro que son, en promedio, menores (sesgo negativo), o mayores (sesgo

El sesgo muestral puede suprimirse, o minimizarse, usando la aleatorización.

La aleatorización Se refiere a cualquier proceso de selección de una muestra de la

MUESTREO ALEATORIO SIMPLE

Otro método parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20

Daniel Guzmán Rojas

las encuestas nacionales de opinión sobre productos o sobre elecciones presidenciales,

El muestreo estratificado requiere de separar a la población según grupos que no se

MUESTREO POR CONGLOMERADOS

El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de

En el muestreo por conglomerados, éstos se forman para representar, tan fielmente

Daniel Guzmán Rojas

El muestreo sistemático es una técnica de muestreo que requiere de una selección

Daniel Guzmán Rojas

La distribución de frecuencia de un estadístico muestral se denomina distribución

Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población

Daniel Guzmán Rojas

desviaciones estándar muestrales se llama distribución muestral de la desviación

Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores

σ , la desviación estándar poblacional.

µ x , la media de la distribución muestral de medias.

σ x , la desviación estándar de la distribución muestral de medias.

Además, grafique las frecuencias para la población y para la distribución muestral de

a. La media poblacional es:

Daniel Guzmán Rojas

b. La desviación estándar de la población es:

c. A continuación se listan los elementos de la distribución muestral de la media y la

La media de la distribución muestral de medias es:

d. La desviación estándar de la distribución muestral de medias es:

Daniel Guzmán Rojas

De aquí que podamos deducir que:

Si la población de la que se extraen las muestras es normal, la distribución muestral

Si la población de donde se extraen las muestras no es normal, entonces el tamaño de

Para muchos propósitos, la aproximación normal se considera buena si se cumple n=30.

Daniel Guzmán Rojas

TEOREMA DEL LÍMITE CENTRAL

Si se seleccionan muestras aleatorias de n observaciones de una población con media

Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores

a. El error muestral de cada media

Daniel Guzmán Rojas

b. La media de los errores muestrales es µ e , es:

La desviación estándar de la distribución de los errores muestrales σ e , es entonces:

Daniel Guzmán Rojas

En general se tiene: σ X −σe = 0

( 0.8 − 1 3) 8 + ( 0.6 − 1 3) 112 + ( 0.4 − 1 3) 336 + ( 0.2 − 1 3) 280 + ( 0 − 1 3) *56