Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Una población está formada por la totalidad de las observaciones en las cuales se
tiene cierto observa.
MUESTRAS ALEATORIAS
1. Política. Las muestras de las opiniones de los votantes se usan para que los
candidatos midan la opinión pública y el apoyo en las elecciones.
2. Educación. Las muestras de las calificaciones de los exámenes de estudiantes se
usan para determinar la eficiencia de una técnica o programa de enseñanza.
3. Industria. Muestras de los productos de una línea de ensamble sirve para controlar
la calidad.
4. Medicina. Muestras de medidas de azúcar en la sangre de pacientes diabéticos
prueban la eficacia de una técnica o de un fármaco nuevo.
5. Agricultura. Las muestras del maíz cosechado en una parcela proyectan en la
producción los efectos de un fertilizante nuevo.
6. Gobierno. Una muestra de opiniones de los votantes se usaría para determinar los
criterios del público sobre cuestiones relacionadas con el bienestar y la seguridad
nacional.
ERRORES EN EL MUESTREO
EL ERROR MUESTRAL
Cuando una muestra no es una copia exacta de la población; aún si se ha tenido gran
cuidado para asegurar que dos muestras del mismo tamaño sean representativas de
una cierta población, no esperaríamos que las dos sean idénticas en todos sus detalles.
El error muestral es un concepto importante que ayudará a entender mejor la
naturaleza de la estadística inferencial.
Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, la media
poblacional µ , entonces la media muestral, como medida, conlleva algún error. Por
ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamaño 25 de una
población con media µ = 15 : si la media de la muestra es x = 12 , entonces a la diferencia
observada x − µ = - 3 se le denomina el error muestral. Una media muestral x puede
pensarse como la suma de dos cantidades, la media poblacional µ y el error muestral;
si e denota el error muestral, entonces:
x = µ +e
EJEMPLO
µx = ( 2 + 3 + 4 + 3 + 4 + 5 + 4 + 5 + 6 )/ 9 = 4
(2,2) 2 2 – 4 = -2
(2,4) 3 3 – 4 = -1
(2,6) 4 4–4=0
(4,2) 3 3 – 4 = -1
(4,4) 4 4–4=0
(4,6) 5 5–4=1
(6,2) 4 4–4=0
(6,4) 5 5–4=1
(6,6) 6 6–4=2
∑e i 0
ERROR NO MUESTRAL
Los errores que surgen al tomar las muestras no pueden clasificarse como errores
muestrales y se denominan errores no muestrales.
Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio
simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo
sistemático.
Si una muestra aleatoria se elige de tal forma que todos los elementos de la población
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria
simple.
EJEMPLO
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadística de 20 alumnos. 20C5 da el número total de formas de elegir una muestra no
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si
listamos las 15,504 en trozos separados de papel, una tarea tremenda, luego los
colocamos en un recipiente y después los revolvemos, entonces podremos tener una
muestra aleatoria de 5 si seleccionamos un trozo de papel con cinco nombres. Un
procedimiento más simple para elegir una muestra aleatoria sería escribir cada uno de
los 20 nombres en pedazos separados de papel, colocarlos en un recipiente,
revolverlos y después extraer cinco papeles al mismo tiempo.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco práctico,
imposible o no deseado; aunque sería deseable usar muestras aleatorias simples para
MUESTREO ESTRATIFICADO
EJEMPLO
Suponga que nos interesa obtener una muestra de las opiniones de los profesores de
una gran universidad. Puede ser difícil obtener una muestra con todos los profesores,
así que supongamos que elegimos una muestra aleatoria de cada colegio, o
departamento académico; los estratos vendrían a ser los colegios, o departamentos
académicos.
EJEMPLO
Suponga que una compañía de servicio de televisión por cable está pensando en abrir
una sucursal en una ciudad grande; la compañía planea realizar un estudio para
determinar el porcentaje de familias que utilizarían sus servicios, como no es práctico
preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al azar,
la cual forma un conglomerado.
MUESTREO SISTEMATICO
EJEMPLO
Para obtener una muestra de suscriptores telefónicos en una ciudad grande, puede
obtenerse primero una muestra aleatoria de los números de las páginas del directorio
telefónico; al elegir el vigésimo nombre de cada página obtendríamos un muestreo
sistemático, también podemos escoger un nombre de la primera página del directorio y
después seleccionar cada nombre del lugar número cien a partir del ya seleccionado.
Por ejemplo, podríamos seleccionar un número al azar entre los primeros 100;
supongamos que el elegido es el 40, entonces seleccionamos los nombres del directorio
que corresponden a los números 40, 140, 240, 340 y así sucesivamente.
DISTRIBUCIONES MUESTRALES
Las muestras aleatorias obtenidas de una población son, por naturaleza propia,
impredecibles. No se esperaría que dos muestras aleatorias del mismo tamaño y
tomadas de la misma población tenga la misma media muestral o que sean
completamente parecidas; puede esperarse que cualquier estadístico, como la media
muestral, calculado a partir de las medias en una muestra aleatoria, cambie su valor de
una muestra a otra, por ello, se quiere estudiar la distribución de todos los valores
posibles de un estadístico. Tales distribuciones serán muy importantes en el estudio
de la estadística inferencial, porque las inferencias sobre las poblaciones se harán
usando estadísticas muestrales. Como el análisis de las distribuciones asociadas con
los estadísticos muestrales, podremos juzgar la confiabilidad de un estadístico
muestral como un instrumento para hacer inferencias sobre un parámetro poblacional
desconocido.
Como los valores de un estadístico, tal como x , varían de una muestra aleatoria a otra,
se le puede considerar como una variable aleatoria con su correspondiente
distribución de frecuencias.
Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y
se calcula la desviación estándar s de cada una. La colección de todas estas
EJEMPLO
µ , la media poblacional.
Solución:
0+2+4+6
µ= =3
4
( 0 − 3) + ( 2 − 3) + ( 4 − 3) + ( 6 − 3)
2 2 2 2
σ= = 2.236
4
µX =
∑ ( fX ) = ( 0 )(1) + (1)( 2 ) + ( 2 )( 3) + ( 3)( 4 ) + ( 4 )( 3) + ( 5)( 2 ) + ( 6 )(1) + = 48 = 3
∑f 16 3
∑( X − µ )
2
f
σX = X
∑f
( 0 − 3) 1 + (1 − 3) 2 + ( 2 − 3) 3 + ( 3 − 3) 4 + ( 4 − 3) 3 + ( 5 − 3) 2 + ( 6 − 3) 1 +
2 2 2 2 2 2 2
σX = = 1.58
16
σ 2.236
σX = = = 1.58
n 2
Como para cualquier variable aleatoria, la distribución muestral de medias tiene una
media o valor esperado, una varianza y una desviación estándar, se puede demostrar
que la distribución muestral de medias tiene una media igual a la media poblacional.
Esto es:
µX = E ( X ) = µ = 3
Después de haber realizado el ejercicio anterior se puede ver que una distribución
muestral se genera extrayendo todas las posibles muestras del mismo tamaño de la
población y calculándoles a éstas su estadístico.
EJEMPLO
SOLUCIÓN
a. En la tabla siguiente se ven las muestras, las medias de las muestras y los errores
muestrales:
Error muestral
Muestras ordenadas x
(e = x − µ )
(0,0) 0 0 - 3 = -3
(0,2) 1 1 - 3 = -2
(0,4) 2 2 - 3 = -1
(0,6) 3 3–3=0
(2,0) 1 1 – 3 = -2
(2,2) 2 2 – 3 = -1
(2,4) 3 3–3=0
(2,6) 4 4–3=1
(4,0) 2 2 – 3 = -1
(4,2) 3 3–3=0
(4,4) 4 4–3=1
(4,6) 5 5–3=2
(6,0) 3 3–3=0
(6,2) 4 4–3=1
(6,4) 5 5–3=2
(6,6) 6 6–3=3
µe =
( −3) + ( −2 ) + ( −1) + 0 + ( −2 ) + ( −1) + 0 + 1 + ( −1) + 0 + 1 + 2 + 0 + 1 + 2 + 3 = 0
16
∑ (e − µ )
2
f
σe = e
∑f
( −3 − 0 )
1 + ( −2 − 0 ) 2 + ( −1 − 0 ) 3 + ( 0 − 0 ) 4 + (1 − 0 ) 3 + ( 2 − 0 ) 2 + ( 3 − 0 ) 1 + 1 + ( −1)
2 2 2 2 2 2 2
σe = = 1.58
16
La desviación estándar de la distribución muestral de un estadístico se conoce como
error estándar del estadístico. Para el ejercicio anterior el error estándar de la
media denotado por σ x , es 1.58. Con esto se puede demostrar que si de una población
se eligen muestras de tamaño n con reemplazo, entonces el error estándar de la
media es igual a la desviación estándar de la distribución de los errores muestrales.
Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar
la formula siguiente para encontrar σ x .
σ N −n
σX =
n N −1
N −n
N −1
EJEMPLO
A 6
B 4
C 2
SOLUCIÓN
Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras posibles
de tamaño 2, con sus respectivas medias muestrales.
Media
Muestras Antigüedad
Muestral
A,B (6,4) 5
A,C (6,2) 4
B,C (4,2) 3
2+4+6
µ= =4
3
5+4+3
µX = =4
3
( 6 − 4) + ( 4 − 4) + ( 2 − 4)
2 2 2
σ= = 1.633
3
(5 − 4) + ( 4 − 4) + (3 − 4)
2 2 2
σX = = 0.816
3
σ 1.633
σX = = = 1.155
n 2
σ N − n 1.633 3 − 2
σX = = = 0.816
n N −1 2 3 −1
El diagrama de flujo resume las decisiones que deben tomarse cuando se calcula el
valor del error estándar:
Comienzo
Si σ
¿Es la población σX =
Infinita? n
No
¿Se muestrea Si
con sustitución?
No
¿Es Si
N>20n?
No
σ N −n
σX =
n N −1
X −µ
z=
σ
En donde z es una variable estandarizada con media igual a cero y varianza igual a uno.
Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier
ejercicio, utilizando la tabla de la distribución z .
X −µ
z=
σX
σ
σX =
n
n
y para poblaciones finitas y muestreo sin reemplazo y ≥ 0.05 :
N
σ N −n
σX =
n N −1
X −µ
z=
σˆ X
S
σˆ X =
n
n
y para poblaciones finitas y muestreo sin reemplazo y ≥ 0.05 :
N
S N −n
σˆ X =
n N −1
EJEMPLO 1
Una empresa eléctrica fabrica focos que tienen una duración que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviación estándar de
40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga
una vida promedio de menos de 775 horas.
SOLUCIÓN
775 − 800
z= = −2.5
40
16
0.0062
775 800
EJEMPLO 2
a. El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.
b. El número de medias muestrales que caen por debajo de 172 centímetros.
SOLUCIÓN
Como se puede observar en este ejercicio se cuenta con una población finita y un
muestreo sin reemplazo, por lo que se tendrá que agregar el factor de corrección. Se
procederá a calcular el denominador de z para sólo sustituirlo en cada inciso.
n 25
= = 0.025 < 0.05
N 1, 000
σ 6.9
σX = = = 1.38
n 25
a.
172.5 − 174.5
z= = −1.45
1.38
175.8 − 174.5
z= = 0.94
1.38
0.7533
b.
172 − 174.5
z= = −1.81
1.38
0.0350
172 174.5
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos.
Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la
distribución muestral de proporciones para el número de piezas defectuosas.
Número de
Proporción maneras en las
Artículos Artículos
de artículos que se puede
Buenos Malos
defectuoso obtener la
muestra
1 4 4/5=0.8 8C1*4C4=8
2 3 3/5=0.6 8C2*4C3=112
3 2 2/5=0.4 8C3*4C2=336
4 1 1/5=0.2 8C4*4C1=280
5 0 0/5=0 8C5*4C0=56
Total 12C5=792
µp =
( 0.8*8) + ( 0.6*112 ) + ( 0.4*336 ) + ( 0.2* 280 ) + ( 0*56 ) = 1 = 0.3333
792 3
µp = π
σp = = 0.1682
792
σp =
(1 3)( 2 3) = 0.2108
5
este valor no coincide con el de 0.1682, ya que nos falta agregar el factor de
n
corrección para una población finita y un muestreo sin reemplazo y ≥ 0.05 :
N
π (1 − π ) N − n
σp =
n N −1
σp =
(1 3)( 2 3) 12 − 5
= 0.1682
5 12 − 1
cc
p± −π
z= n
σp
π (1 − π )
σp =
n
N −n
A esta fórmula se le puede agregar el factor de corrección de si se
N −1
⎛n ⎞
cumple con las condiciones necesarias ⎜ ≥ 0.05 ⎟ .
⎝N ⎠
π (1 − π ) N − n
σp =
n N −1
x ± cc − nπ
z=
σ np
σ np = nπ (1 − π )
N −n
A esta fórmula se le puede agregar el factor de corrección de si se
N −1
⎛n ⎞
cumple con las condiciones necesarias ⎜ ≥ 0.05 ⎟ .
⎝N ⎠
N −n
σ np = nπ (1 − π )
N −1
EJEMPLO 1
SOLUCIÓN
Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la
aproximación de la distribución normal a la binomial y el segundo utilizando la fórmula
de la distribución muestral de proporciones.
Datos:
n = 800 estudiantes
π = 0.60
p = 0.55
P[ X < 440] = ?
µ p = nπ = (800)(0.60) = 480
Este valor significa que existe una probabilidad del 0.17% de que al extraer una
muestra de 800 estudiantes, menos de 440 fuman cigarrillos.
0.0017
440 480
440 − 0.5 = 439.5
Datos:
n = 800 estudiantes
π = 0.60
p = 0.55
P[ p < 0.55] = ?
0.5 0.5
π− − π 0.55 − − 0.60
z= n = 800 = −2.92
π (1 − π ) (0.60)(0.40)
n 800
0.0017
0.55 0.60
0.5
0.55 − = 0.5494
800
EJEMPLO 2
SOLUCIÓN
Datos:
n = 150 personas
π = 0.03
p = 0.04
P[ X > 6 ] = ?
µ p = nπ = (150)(0.03) = 4.5
Este valor significa que existe una probabilidad del 16.85% de que al extraer una
muestra de 150 personas, más de 6 presentarán una reacción adversa.
0.1685
4.5 6
6 + 0.5 = 6.5
Datos:
n = 150 personas
π = 0.03
p = 0.04
P[ p > 0.04] = ?
0.5 0.5
π+ − π 0.04 + − 0.03
z= n = 150 = 0.96
π (1 − π ) (0.03)(0.97 )
n 150
0.1685
0.03 0.04
0.5
0.04 + = 0.0433
150
Observe que este valor es igual al obtenido y la interpretación es: existe una
probabilidad del 16.85% de que al tomar una muestra de 150 personas se tenga una
proporción mayor de 0.04 presentando una reacción adversa.
EJEMPLO 3
SOLUCIÓN
a.
Datos:
n = 60 artículos
π = 0.04
p = 0.03
P[ p < 0.03] = ?
0.5 0.5
π− − π 0.03 − − 0.04
z= n = 60 = −0.73
π (1 − π ) (0.04)(0.96)
n 60
0.2327
0.3 0.4
0.5
0.3 − = 0.0216
60
b.
Datos:
n = 60 artículos
π = 0.04
p = 0.01 ∧ 0.05
0.5 0.5
π− − π 0.05 − − 0.04
z= n = 60 = 0.07
π (1 − π ) ( 0.04 )( 0.96 )
n 60
0.5 0.5
π+ − π 0.01 + − 0.04
z= n = 60 = −0.86
π (1 − π ) (0.04)(0.96)
n 60
0.5
0.01 + = 0.0183
60
0.3304
0.5
0.05 − = 0.0417
60
Suponga que se tienen dos poblaciones distintas, la primera con media µ1 y desviación
estándar σ 1 , y la segunda con media µ 2 y desviación estándar σ 2 . Más aún, se elige una
muestra aleatoria de tamaño n1 de la primera población y una muestra independiente
aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada
muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se
llama distribución muestral de las diferencias entre medias o la distribución
muestral del estadístico x1 − x 2
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
σ X −X
1 2
n1 n
Cuando se trata de poblaciones finitas, ≥ 0.05 Y 2 ≥ 0.05 se utiliza el factor de
N1 N2
corrección, quedando la formula de la desviación estándar de la diferencia de medias
de la siguiente manera:
⎛ σ 12 ⎞⎛ N1 − n1 ⎞ ⎛ σ 22 ⎞ ⎛ N 2 − n2 ⎞
σ X −X = ⎜ ⎟⎜ ⎟+⎜ ⎟⎜ ⎟
⎝ n1 ⎠⎝ N1 − 1 ⎠ ⎝ n2 ⎠ ⎝ N 2 − 1 ⎠
1 2
S12 S22
σˆ X1 − X 2 = +
n1 n2
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
´
σˆ X − X
1 2
n1 n
Cuando se trata de poblaciones finitas, ≥ 0.05 Y 2 ≥ 0.05 se utiliza el factor de
N1 N2
corrección, quedando la formula de la desviación estándar de la diferencia de medias
de la siguiente manera:
⎛ S12 ⎞⎛ N1 − n1 ⎞ ⎛ S22 ⎞ ⎛ N 2 − n2 ⎞
σˆ X − X = ⎜ ⎟⎜ ⎟ + ⎜ ⎟⎜ ⎟
⎝ n1 ⎠⎝ N1 − 1 ⎠ ⎝ n2 ⎠ ⎝ N 2 − 1 ⎠
1 2
EJEMPLO 1
En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en
una escuela primaria se usará una muestra aleatoria de 30 niños y otra de 35 niñas. Se
sabe que tanto para niños como para niñas los pesos siguen una distribución normal. El
promedio de los pesos de todos los niños de sexto grado de esa escuela es de 100
libras y su desviación estándar es de 14.142, mientras que el promedio de los pesos de
todas las niñas del sexto grado de esa escuela es de 85 libras y su desviación estándar
es de 12.247 libras. Si x1 representa el promedio de los pesos de 30 niños y x 2 es el
promedio de los pesos de una muestra de 35 niñas, encuentre la probabilidad de que el
promedio de los pesos de los 30 niños sea al menos 20 libras más grande que el de las
35 niñas.
SOLUCIÓN
Datos:
µ1 = 100 libras
µ1 = 85 libras
σ 1 = 14.142 libras
σ 2 = 12.247 libras
n1 = 30 niños
n2 = 35 niñas
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
=
20 − (100 − 85 )
= 1.51
σ 12 σ 22 (14.142 ) (12.247 )
2 2
+ +
n1 n2 20 25
0.0654
µ1 − µ2 = 15 X 1 − X 2 = 20
EJEMPLO 2
Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos
a dos compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una
desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7
años con una desviación estándar de 0.7. Determine la probabilidad de que una
muestra aleatoria de 34 tubos de la compañía A tenga una vida promedio de al menos
un año más que la de una muestra aleatoria de 40 tubos de la compañía B.
SOLUCIÓN
Datos:
µ A = 7.2 años
µ B = 6.7 años
σ A = 0.8 años
σ B = 0.7 años
n A = 34 tubos
nB = 40 tubos
P[x A − x B > 1] = ?
z=
(X A − X B ) − ( µ A − µB )
=
1 − ( 7.2 − 6.7 )
= 2.84
σ A2 σ B2 ( 0.8) + ( 0.7 )
2 2
+
nA nB 34 40
0.0023
µ1 − µ2 = 0.5 X1 − X 2 = 1
EJEMPLO 3
SOLUCIÓN
En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos
poblaciones, por lo que se supondrán que son iguales.
Datos:
σ 1 = 1.23 Km/Lto
σ 2 = 1.37 Km/Lto
n1 = 35 autos
n2 = 42 autos
a.
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
=
0.45 − 0
= 1.52
σ σ (1.23) (1.37 )
2 2 2 2
1
+ 2
+
n1 n2 35 42
0.0645
µ1 − µ 2 = 0 X 1 − X 2 = 0.45
b.
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
=
0.65 − 0
= 2.19
σ σ (1.23) (1.37 )
2 2 2 2
1
+ 2
+
n1 n2 35 42
z=
(X 1 − X 2 ) − ( µ1 − µ2 )
=
0.83 − 0
= 2.80
σ σ (1.23) (1.37 )
2 2 2 2
1
+ 2
+
n1 n2 35 42
P[0.65 ≤ x1 − x 2 ≤ 0.83] = P[x1 − x 2 ≤ 0.83] − P[x1 − x 2 ≤ 0.65] = P[z ≤ 2.80] − P[z ≤ 2.19]
0.0116
0 0.65 0.83
z=
( p1 − p2 ) ± cc − (π 1 − π 2 )
π 1 (1 − π 1 ) π 2 (1 − π 2 )
+
n1 n2
EJEMPLO 1
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en
sus opiniones sobre la promulgación de la pena de muerte para personas culpables de
asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de
muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos
muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación
de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a
favor sea al menos 3% mayor que el de las mujeres.
SOLUCIÓN
Datos:
π H = 0.12
π M = 0.10
nH = 100
nM = 100
P[ p H − pM ≥ 0.03] = ?
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una
distribución binomial y se está utilizando la distribución normal.
0.4550
0.02 0.03
⎛ 0.5 ⎞⎛ 0.5 ⎞
0.03 − ⎜ ⎟⎜ ⎟ = 0.025
⎝ 100 ⎠⎝ 100 ⎠
EJEMPLO 2
Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron
despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo durante
por lo menos dos años. Supóngase que tuviera que seleccionar otra muestra aleatoria
de 320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984.
¿Cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo
durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de
Boston College, en 5% o más?
SOLUCIÓN
Otra de las situaciones con la cual nos topamos es que desconocemos la proporción de
trabajadores despedidos entre 1979 y 1984 que estuvieron desempleados por un
período de por lo menos dos años, sólo se conoce la p1 = 0.20 ya que al tomar una
muestra de 320 trabajadores se observó esa proporción.
También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la
probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo
menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en
5% o más?, la palabra difiera quiere decir que puede existir una diferencia a favor de
la muestra uno, o a favor de la muestra dos, por lo que se tendrán que calcular dos
áreas en la distribución y al final sumarlas.
Datos:
p1 = 0.20
n1 = 320 trabajadores
n2 = 320 trabajadores
π1 = π 2
P[ p1 − p2 ≤ −0.05] + P[ p1 − p2 ≥ 0.05] = ?
⎛ 0.5 ⎞⎛ 0.5 ⎞
−0.05 + ⎜ ⎟⎜ ⎟ = −0.0484
⎝ 320 ⎠⎝ 320 ⎠
0.0628 0.0628
−0.05 0 0.05
⎛ 0.5 ⎞ ⎛ 0.5 ⎞
0.05 − ⎜ ⎟⎜ ⎟ = 0.0484
⎝ 320 ⎠ ⎝ 320 ⎠
EJEMPLO 3
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que
2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras
de 120 objetos de cada máquina:
SOLUCIÓN
Datos:
π 1 = 3 6 = 0 .5
π 2 = 2 5 = 0 .4
n1 = 120 objetos
n2 = 120 objetos
a.
P[ p2 − p1 ≥ 0.10] = ?
0.0011
−0.10 0.10
⎛ 0.5 ⎞ ⎛ 0.5 ⎞
0.10 − ⎜ ⎟⎜ ⎟ = 0.0958
⎝ 120 ⎠ ⎝ 120 ⎠
b.
P[ p1 − p2 ≥ 0.15] = ?
0.2357
0.10 0.15
⎛ 0.5 ⎞ ⎛ 0.5 ⎞
0.15 − ⎜ ⎟⎜ ⎟ = 0.1458
⎝ 120 ⎠ ⎝ 120 ⎠
x ± 0 .5 − λ
z=
λ
c ± 0 .5 − C
z=
C
EJEMPLO
a. Mayor o igual a 6
b. Exactamente 7
c. Como máximo 9
C =8
a.
P[c ≥ 6] = ?
c − 0 .5 − C 6 − 0 .5 − 8
z= = = 0.88
C 8
6 − 0.5 = 5.5
0.8106
6 8
b.
P[c = 7] = ?
c − 0 .5 − C 7 − 0 .5 − 8
z= = = −0.53
C 8
c + 0 .5 − C 7 + 0 .5 − 8
z= = = −0.17
C 8
P[c = 7] = P[z ≤ −0.17] − P[z ≤ −0.53] = {1 − P[z ≤ 0.17 ]}− {1 − P[z ≤ 0.53]}
7 − 0.5 = 6.5
0.1344
7 8
7 + 0.5 = 7.5
c.
P[c ≤ 9] = ?
c + 0 .5 − C 9 + 0 .5 − 8
z= = = 0.53
C 8
9 + 0.5 = 9.5
0.7019
8 6
En esta unidad se verá un nuevo concepto necesario para poder utilizar a las tres
distribuciones mencionadas. Este concepto es "grados de libertad".
∑( X −X)
2
i
S2 = i =1
n −1
Supóngase que se toma una muestra de una población normal con media µ y varianza
σ 2 . Si x es el promedio de las n observaciones que contiene la muestra aleatoria,
X −µ
entonces la distribución z = es una distribución normal estándar. Supóngase que
σ
n
Γ ⎡⎣(ν + 1) 2 ⎤⎦
(1+ t2 ν )
−(ν +1) 2
f (t ) = , −∞ < t < ∞
Γ (ν 2 ) νπ
X −µ
t=
σX
S
σˆ X =
n
n
y para poblaciones finitas y muestreo sin reemplazo y ≥ 0.05 :
N
S N −n
σˆ X =
n N −1
Se acostumbra representar con tα el valor t por arriba del cual se encuentra un área
igual a α . Como la distribución t es simétrica alrededor de una media de cero,
tenemos t1−α = −tα ; es decir, el valor t que deja un área de 1 − α a la derecha y por
tanto un área de α a la izquierda, es igual al valor t negativo que deja un área de α
en la cola derecha de la distribución. Esto es, t0.95 = −t0.05 , t0.99 = −t0.01 , etc.
EJEMPLO 1
El valor t con υ = 14 grados de libertad que deja un área de 0.025 a la izquierda, y por
tanto un área de 0.975 a la derecha, es
α = 0.025
t0.975 = −t0.025 = −2.145
Ejemplo:
Solución:
1 − α = 0.925
α = 0.025 α = 0.05
−t0.025 = −2.145 t0.05 = 1.645
Como t0.05 deja un área de 0.05 a la derecha, y −t0.025 deja un área de 0.025 a la
izquierda, encontramos un área total de 1-0.05-0.025 = 0.925.
EJEMPLO 2
Encuentre k tal que P [ k < t < −1.5231] = 0.05 , para una muestra aleatoria de tamaño 15
que se selecciona de una distribución normal.
Solución:
0.05
k t = −1.5231
EJEMPLO 3
SOLUCIÓN
De la tabla encontramos que t0.05 para 24 grados de libertad es de 1.7109. Por tanto, el
fabricante queda satisfecho con esta afirmación si una muestra de 25 lotes rinde un
valor t entre –1.7109 y 1.7109.
0.90
0.05 0.05
−t0.05 = −1.7109 t0.05 = 1.7109
x − µ 518 − 500
tc = = = 2.25
S 40
n 25
0.0174
tc = 2.25
Con la prueba t se comparan las medias y las desviaciones estándar de grupo de datos
y se determina si entre esos parámetros las diferencias son estadísticamente
significativas o si sólo son diferencias aleatorias.
d − µd
t=
σˆ d
σˆ d
σˆ d =
n
n
y para poblaciones finitas y muestreo sin reemplazo y ≥ 0.05 :
N
σˆ d N −n
σˆ d =
n N −1
Donde:
d = Valor promedio o media aritmética de las diferencias entre los momentos antes y
después.
n = tamaño de la muestra.
d=
∑d
n
∑ d − ∑n
d
∑(d − d )
2 2
σˆ d = =
n −1 n −1
Pasos:
1. Ordenar los datos en función de los momentos antes y después, y obtener las
diferencias entre ambos.
2. Calcular la media aritmética de las diferencias ( d ).
3. Calcular la desviación estándar de las diferencias promedio ( σˆ d ).
4. Calcular el valor de t por medio de la ecuación.
5. Calcular los grados de libertad ( gl ) gl = n − 1 .
6. Comparar el valor de t calculado con respecto a grados de libertad en la tabla
respectiva, a fin de obtener la probabilidad.
EJEMPLO
Antes 189 202 220 207 194 177 193 202 208 233
Después 170 179 203 192 172 161 174 187 186 204
SOLUCIÓN
Datos:
Antes Después d d2
189 170 19 361
202 179 23 529
220 203 17 289
207 192 15 225
194 172 22 484
177 161 16 256
193 174 19 361
202 187 15 225
208 186 22 484
233 204 29 841
197 4,055
µd = 17
n = 10
∑ d − ∑n
(197 )
2
d
2
4, 055 −
σd = = 10 = 4.40
n −1 10 − 1
d − µd 18 − 17
t =t = = = 0.72
σd 4.40
n 10
0.2453
µ d = 17 d = 18
En tales pruebas paramétricas se exige una serie de requisitos para aplicarlas como
instrumento estadístico:
t=
( X 1 − X 2 ) − ( µ1 − µ2 )
σˆ X − X
1 2
1 1
σˆ X − X = σˆ +
1 2
n1 n2
σˆ =
( n1 − 1) S12 + ( n2 − 1) S22
n1 + n2 − 2
n1 n
Cuando se trata de poblaciones finitas, ≥ 0.05 Y 2 ≥ 0.05 se utiliza el factor de
N1 N2
corrección, quedando la formula de la desviación estándar de la diferencia de medias
de la siguiente manera:
⎛ 1 ⎞⎛ N1 − n1 ⎞ ⎛ 1 ⎞⎛ N 2 − n2 ⎞
σˆ X − X = σˆ ⎜ ⎟⎜ ⎟ + ⎜ ⎟⎜ ⎟
⎝ n1 ⎠⎝ N1 − 1 ⎠ ⎝ n2 ⎠⎝ N 2 − 1 ⎠
1 2
Pasos:
EJEMPLO
El ministerio de salud afirma que los niños de cinco años de condición socioeconómica
alta tiene un promedio de estatura de 106.2 centímetros, y los de condición
socioeconómica baja 101.5 centímetros. Un investigador ha obtenido la talla (en
centímetros) de 20 niños de 5 años de edad, de dos condiciones socioeconómicas
contrastantes (alta y baja).
Condición
101 102 100 104 102 99 102 103 97 99
socioeconómica baja
Condición
103 105 104 106 108 100 108 104 105 107
socioeconómica alta
SOLUCIÓN
Datos:
Condición Condición
socioeconomica socioeconomica
baja alta
101 103
102 105
100 104
104 106
102 108
99 100
102 108
103 104
97 105
99 107
Media 100.9 105.0
Desviación
2.13 2.45
estandar
µ A = 106.2
µ B = 101.5
S A = 2.45
S B = 2.13
nA = 10
nB = 10
gl = 10 + 10 − 2 = 18
σˆ = = = 2.30
nA + nB − 2 10 + 10 − 2
t=
( X A − X B ) − ( µ A − µ B ) = 4 − (106.2 − 101.5) = −1.52
1 1 1 1
σˆ + ( 2.30 ) +
nA nB 10 10
t=
( X A − X B ) − ( µ A − µ B ) = 5 − (106.2 − 101.5) = 0.65
1 1 1 1
σˆ + ( 2.30 ) +
nA nB 10 10
0.6667
4 4.7 5
t=
( X 1 − X 2 ) − ( µ1 − µ2 )
σˆ X − X
1 2
S12 S22
σˆ X1 − X 2 = +
n1 n2
2
⎛ S12 S22 ⎞
⎜ + ⎟
n n2 ⎠
gl = ⎝ 12 2
¨
⎛ S12 ⎞ ⎛ S 22 ⎞
⎜ ⎟ ⎜ ⎟
⎝ n1 ⎠ + ⎝ n2 ⎠
n1 − 1 n2 − 1
n1 n
Cuando se trata de poblaciones finitas, ≥ 0.05 Y 2 ≥ 0.05 se utiliza el factor de
N1 N2
corrección, quedando la formula de la desviación estándar de la diferencia de medias
de la siguiente manera:
⎛ S12 ⎞⎛ N1 − n1 ⎞ ⎛ S 22 ⎞ ⎛ N 2 − n2 ⎞
σˆ X − X = σˆ ⎜ ⎟⎜ ⎟ + ⎜ ⎟⎜ ⎟
1 2
n
⎝ 1 ⎠⎝ 1 N − 1 ⎠ ⎝ n2 ⎠ ⎝ N 2 − 1 ⎠
Pasos:
EJEMPLO
Silueta Center afirma que las personas obesas que reciben tratamientos de obesidad
tienen un grado de ansiedad de 70 (dentro de la escala de estado de ansiedad IDARE)
y las personas obesas que no están en tratamiento tienen un grado de ansiedad de 52
(dentro de la escala de estado de ansiedad IDARE). Un investigador de dicho centro
realiza un estudio para mostrar que los niveles de ansiedad de las personas obesas que
asisten de manera constante a tratamiento para control de peso corporal es mayor
que el de los obesos que no asisten a tratamiento. Participaron 31 personas obesas
(hombres y mujeres). 14 personas obesas que no asistían a tratamiento y 17 que
asistían de manera regular a algún tipo de tratamiento. A los 31 participantes se les
solicitó que dieran respuesta a la escala de estado de ansiedad (IDARE), la cual está
diseñada para evaluar el grado de ansiedad ante situaciones cotidianas. Los puntajes
de la escala varían en un rango de 20 a 80 puntos, siendo los puntajes más altos los
indicativos de un mayor nivel de ansiedad.
¿Cuál es la probabilidad de que los obesos con tratamiento sobre la obesidad tengan
más de 15 niveles de ansiedad (dentro de la escala de estado de ansiedad IDARE) por
encima de los obesos sin tratamiento?
Con
65 70 75 75 70 70 60 65 70 70 70 75 65 75
tratamiento
Sin
35 40 60 40 55 45 50 55 50 50 60 55 70 60 55 50 30
tratamiento
SOLUCIÓN
Datos:
µCT = 70
µ ST = 52
SCT = 4.584
S ST = 10.137
nCT = 14
nST = 17
Con Sin
tratamiento tratamiento
65 35
70 40
75 60
75 40
70 55
70 45
60 50
65 55
70 50
70 50
70 60
75 55
65 70
75 60
55
50
30
Media 69.643 50.588
Desviación
4.584 10.137
Estandar
2
⎛ σ CT
2
σ ST
2
⎞
2 ⎛ ( 4.584 )2 (10.137 )2 ⎞
⎜ + ⎟ ⎜ + ⎟
nCT nST ⎠ ⎜ 14 17 ⎟
gl = ⎝ = ⎝ ⎠ = 23.175 ≅ 23
2 2 2 2
⎛ σ CT
2
⎞ ⎛ σ ST 2
⎞ ⎛ ( 4.584 )2 ⎞ ⎛ (10.137 )2 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝ nCT ⎠ + ⎝ nST ⎠ ⎜ 14 ⎟ ⎜ 17 ⎟
⎝ ⎠ +⎝ ⎠
nCT − 1 nST − 1 14 − 1 17 − 1
t=
( X CT − X ST ) − ( µCT − µST ) = 15 − ( 70 − 52 )
= −1.09
σ CT σ ST ( 4.584 ) (10.137 )
2 2 2 2
+ +
nCT nST 14 17
0.8570
15 18
( n − 1) S 2
σ2
X c2 =
( n − 1) S 2
σ2
∑( X − X )
2
X 2
=
c
σ2
La siguiente figura ilustra tres distribuciones X 2 . Note que el valor modal aparece en
el valor ( n − 3) = gl − 2 .
1 ν −x
f (X ) = x 2 −1
e 2
para x > 0
( )
ν
2 Γν2
2
La tabla que se utilizará la de los valores críticos X gl2 ;α . Para denotar el valor crítico
de una distribución X 2 con gl grados de libertad se usa el símbolo X gl2 ;α ; este valor
crítico determina a su derecha un área de α bajo la curva X 2 y sobre el eje
horizontal. Por ejemplo para encontrar X 6;0.05
2
en la tabla se localiza gl = 6 en el lado
izquierdo y α = 0.05 a o largo del lado superior de la misma tabla.
1 − α = 0.95
α = 0.05
X 2
6;0.05 = 12.5916
CÁLCULO DE PROBABILIDAD:
EJEMPLO 1
Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus
destinos en una ciudad grande forman una distribución normal con una desviación
estándar σ = 1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la
probabilidad de que la varianza muestral sea mayor que 2.
SOLUCIÓN
X 2
=
( n − 1) S 2 (17 − 1)( 2 )
= = 32
σ2 (1)
c 2
α = 0.01
X = 32
2
16
EJEMPLO 2
SOLUCIÓN
X c2 =
( n − 1) S 2 = ( 25 − 1)( 9.1) = 36.4
σ2 6
α = 0.05
X 2
24 = 36.4
X 2
=
( n − 1) S 2 ( 25 − 1)( 3.462 )
= = 13.848
c
σ2 6
X 2
=
( n − 1) S 2 ( 25 − 1)(10.745 )
= = 42.98
c
σ2 6
Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al
buscar el valor de 13.848 se encuentra un área a la derecha de 0.95. El valor de 42.98
da un área a la derecha de 0.01. Como se está pidiendo la probabilidad entre dos
valores se resta el área de 0.95 menos 0.01 quedando 0.94.
α = 0.94
U
ν1
F=
V
ν2
ν1(ν
Γ ⎡⎣(ν 1 +ν 2 ) 2 ⎤⎦ (ν 1 ν 2 ) x 2
)−1
2
1
f (X ) = (ν1 +ν 2 )
Γ (ν 1 2 ) Γ (ν 2 2 )(1 +ν 1 x ν 2 )
2
0< x<∞
ν1
µ= , para ν 2 > 2
ν2 − 2
2ν 22 (ν 1 +ν 1 − 2 )
σ =
2
, para ν 2 > 4
ν 1 (ν 2 − 2 ) (ν 2 − 4 )
2
S12 2 2
σ 12 S 2σ 2 ⎛ S ⎞ ⎛ σ ⎞
Fc = = 12 22 = ⎜ 1 ⎟ ⎜ 2 ⎟
S 22 S2 σ 1 ⎝ S2 ⎠ ⎝ σ 1 ⎠
σ 22
Para manejar las tablas de Fisher, se tendrá que buscar primero los grados de
libertad dos para luego localizar el área correspondiente, relacionándola con los
grados de libertad uno, para calcular el valor de F.
1 − α = 0.95
α = 0.05
F6;8;0.05 = 3.58
EJEMPLO
SOLUCIÓN
⎛ 15 ⎞
Fc = (1.26 ) ⎜ ⎟ = 1.89
⎝ 10 ⎠
α = 0.05
F24;30 = 1.89
Dki = X ki − X k
donde:
∑D ki
Dk = i =1
nk
donde:
nk
∑D
i =1
ki : es la suma de las puntuaciones Di en el grupo k.
∑∑ D ki
DT = k =1 i =1
Donde:
2
( n − 2 ) ∑ nk ( Dk − DT )
2
Fc = 2
k =1
nk
∑∑ ( D ki − Dk )
2
k =1 i =1
F1;n − 2 = Fc
EJEMPLO
Silueta Center afirma que las personas obesas que reciben tratamientos de obesidad
tienen un grado de ansiedad de 70 (dentro de la escala de estado de ansiedad IDARE)
y las personas obesas que no están en tratamiento tienen un grado de ansiedad de 52
(dentro de la escala de estado de ansiedad IDARE). Un investigador de dicho centro
realiza un estudio para mostrar que los niveles de ansiedad de las personas obesas que
asisten de manera constante a tratamiento para control de peso corporal es mayor
que el de los obesos que no asisten a tratamiento. Participaron 31 personas obesas
(hombres y mujeres). 14 personas obesas que no asistían a tratamiento y 17 que
asistían de manera regular a algún tipo de tratamiento. A los 31 participantes se les
solicitó que dieran respuesta a la escala de estado de ansiedad (IDARE), la cual está
diseñada para evaluar el grado de ansiedad ante situaciones cotidianas. Los puntajes
de la escala varían en un rango de 20 a 80 puntos, siendo los puntajes más altos los
indicativos de un mayor nivel de ansiedad.
¿Cuál es la probabilidad de que los obesos con tratamiento sobre la obesidad tengan
más de 15 niveles de ansiedad (dentro de la escala de estado de ansiedad IDARE) por
encima de los obesos sin tratamiento?
Con
65 70 75 75 70 70 60 65 70 70 70 75 65 75
tratamiento
Sin
35 40 60 40 55 45 50 55 50 50 60 55 70 60 55 50 30
tratamiento
SOLUCIÓN
Datos:
(D 1i − D1 )
Con Sin
(D 2 i − D2 )
2 2
tratamiento tratamiento D1i D2i
(1) (2)
65 35 4.64 15.59 1.63 62.51
70 40 0.36 10.59 9.06 8.45
75 60 5.36 9.41 3.96 2.99
75 40 5.36 10.59 3.96 8.45
70 55 0.36 4.41 9.06 10.69
70 45 0.36 5.59 9.06 4.38
60 50 9.64 0.59 39.38 50.32
65 55 4.64 4.41 1.63 10.69
70 50 0.36 0.59 9.06 50.32
70 50 0.36 0.59 9.06 50.32
70 60 0.36 9.41 9.06 2.99
75 55 5.36 4.41 3.96 10.69
65 70 4.64 19.41 1.63 137.60
75 60 5.36 9.41 3.96 2.99
55 4.41 10.69
50 0.59 50.32
30 20.59 166.58
MEDIA 69.643 50.588 3.37 7.68
SUMA 114.47 640.98
n 14 17
n1
∑D 1i
4.64 + 0.36 + … + 4.64 + 5.36
D1 = i =1
= = 3.37
n1 14
n2
∑D 2i
15.59 + 10.59 + … + 0.59 + 20.59
D2 = i =1
= = 7.68
n2 17
2 nk
∑∑ D ki
4.64 + 0.36 + … + 0.59 + 20.59
DT = k =1 i =1
= = 5.73
n 14 + 17
2 nk
k =1 i =1
2 nk
k =1 i =1
2
( n − 2 ) ∑ nk ( Dk − DT ) = (14 + 17 − 2 ) ⎡(14 )( 3.37 − 5.73) + (17 )( 7.68 − 5.73) ⎤ = 4,144.16
2 2 2
k =1
⎣ ⎦
2
( n − 2 ) ∑ nk ( Dk − DT )
2
4,144.16
Fc = 2
k =1
nk
= = 5.486
755.45
∑∑ ( Dki − Dk )
2
k =1 i =1
F1;29 = 5.486
Como ( P [ F ≥ 5.486] = 0.0000 ) < 0.05 , entonces podemos afirmar que las varianzas son
heterogéneas (diferentes).