Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Muestreo aleatorio simple (MAS): Este tipo de muestreo se caracteriza porque cualquier mues-
tra de tamaño n de la población en estudio, tiene la misma probabilidad de ser seleccionada
que cualquier otra muestra del mismo tamaño. Es decir, con el MAS estamos eliminando cual-
quier problema en el que se sobreestime o subestime de forma consciente o inconsciente alguna
característica de la población y por lo tanto, las observaciones que se realizan son de forma in-
dependiente y al azar.
Muestra aleatoria (m.a.): Una muestra aleatoria de tamaño n de una población con distribución
fX (x), es una colección de n variables aleatorias independientes X1 , ..., Xn , que tienen la misma
distribución fX (x). fX (x) representa la función de probabilidad de una v.a. discreta o la función
de densidad de una v.a. continua, segun sea el caso.
Antes de obtener los datos, X1 , ..., Xn son variables aleatorias; una vez que se obtienen las obser-
vaciones x1 , , ..., xn son realizaciones de dichas v.a.’s. Una realización es una muestra observada,
un valor particular de la muestra teórica.
Por ejemplo: Si tenemos una m.a. X1 , ..., Xn , entonces,
1 P
X= n
Xi es una media muestral, pero de las v.a´s. (Media teórica).
x = n1 xi es una media muestral, basada en las realizaciones de las v.a.´s.
P
Ejemplo (∗): Se tiene la m.a. X1 , , ..., X5 , donde Xi ∼ N (µ, σ 2 ), i = 1, 2, ..., 5. Supongamos que
una realización de las v.a.´s es 3.5 2.2 3.3 2.6 3.4,
La media basada en las v.a.’s es X = 15 Xi
P
Estimación puntual: Su objetivo es producir un número a partir de la muestra, que tendrá una
alta probabilidad de ser muy parecido al valor desconocido del parámetro.
Estadística o estadístico: Es una función de los valores de la muestra que no depende de pará-
2
metros desconocidos. Por ejemplo: T = 2 Xi , W = X , etc.
P
Estimador o estimador puntual de θ: Es una estadística construida con el fin de conocer el pará-
metro. Notación: θ.
b Ejemplos: µ b 2 = Sn2 , etc.
b = X, σ
Distribuciones Muestrales
Se llama distribución muestral a la distribución de probabilidad de la estadística en estudio.
Ejemplos:
La estadística µb = X tiene alguna distribución de probabilidad.
La estadística σb 2 = Sn2 tiene alguna distribución de probabilidad.
Resultado 1: Si se tiene una m.a. X1 , ..., Xn de una población con distribución de probabilidad
cualquiera, con media µ y varianza σ 2 , entonces, la distribución muestral de X tendra:
µX = µ media
2 σ2
V ar X = σX = n
varianza
r
V ar X = σX = √σ error estándar
n
Demostración:
Resultado 3. Teorema del Límite Central: Si se tiene una m.a. X1 , , ..., Xn de una población con
distribución de probabilidad cualquiera, con media µ y varianza σ 2 , a medida que
el2 tamaño de
muestra n aumenta, la distribución muestral de X se aproxima a una normal µ, σn . Y, por lo
Resultado 4. Si se toma una m.a. X1 , ..., Xn , de una población con distribución de probabilidad
Bernoulli (P ) con el objeto de conocer su media poblacional P , la media muestral que servirá
para estimar la media poblacional es la proporción de éxitos en la muestra y se denota por
Pb = N úmero de éxitos
n
en la muestra
= número de
elementos de la muestra que poseen la caracterı́stica de interés
tamaño de la muestra .
La varianza poblacional se estima con P 1 − P = P Q. Luego, por el teorema del límite central,
b b b b
si n es grande, la distribución muestral de Pb es N P, PnQ .
Ejemplo 2. Se tiene una m.a. X1 , ..., Xn de una población con distribución de probabilidad cual-
quiera, con media µ y varianza σ 2 . Se desea estimar la varianza poblacional. Se proponen dos
estimadores Sn2 y Sn−1
2
. Determina cual de los dos es mejor de acuerdo a la definición de insesga-
dez.
Se van a determinar las propiedades de insesgadez de ambos estimadores.
2 2 2
P h i nP o
E (Sn2 ) = n1 E Xi2 − nX 1
Xi2 ) − E nX 1
E (Xi2 ) − nE X
P
= n
E( = n
2
Se van a calcular de manera separada las expresiones E (Xi2 ) y E X .
P
2
Ahora para E X :
2
P 2
1 1
E ( Xi )2
P
E X =E n
Xi = n2
= n12 E (X12 + X22 + ... + Xn2 + 2X1 X2 +
2X1 X3 + ... + 2Xn−1 Xn )
1 P 2
= n2 E { Xi + 2 (X1 X2 + X1 X3 + ... + Xn−1 Xn )}
= n12 {E [ Xi2 ] + E [2 (X1 X2 + X1 X3 + ... + Xn−1 Xn )]}
P
= n12 { E [Xi2 ] + 2 [E (X1 ) E (X2 ) + E (X1 ) E (X3 ) + ... + E (Xn−1 ) E (Xn )]}.
P
n
= n12 { (σ 2 + µ2 ) + 2 [µ2 + µ2 + ... + µ2 ]}. Se tienen combinaciones de productos Xi Xj ,
P
2
i 6= j.
n
n 2
o 2
= n12 (nσ 2 + nµ2 ) + 2 n 2−n µ2 , debido a que = n(n−1)(n−2)!
2!(n−2)!
= n(n−1)
2
= n 2−n
2
1 2 2 2 2
= n2 {(nσ + nµ ) + (n − n) µ }
= n12 {nσ 2 + nµ2 + n2 µ2 − nµ2 }
= n12 [nσ 2 + n2 µ2 ] = n1 [σ 2 + nµ2 ]
Finalmente, regresando a calcular E (Sn2 ),
n o
1
E (Sn2 ) = n
(nσ 2 + nµ2 ) − n n1 (σ 2 + nµ2 ) = 1
n
{nσ 2 + nµ2 − σ 2 − nµ2 }
1 σ 2 (n−1) σ2
= n
{nσ 2 − σ 2 } = n
= σ2 − n
Nótese lo siguiente:
Despejando n−1 n
de la ecuación anterior,
n 2 2
n−1
E (Sn ) = σ
2
h P i
n 1
n−1
E n
Xi2 − nX = σ2
2
hP i
n 1
n−1 n
E Xi2 − nX = σ2
2
hP i
1
n−1
E Xi2 − nX = σ2
2
h P i
1
E n−1
Xi2 − nX = σ2
h i
2
E Sn−1 = σ 2 por lo tanto Sn−1
2
es un estimador insesgado de σ 2 .
Sesgo de un estimador: Es una función que representa la diferencia entre el valor esperado
de un estimador y el parámetro que estima. Dada una muestra X1 , ..., Xn y un estimador θb del
parámetro poblacional θ, el sesgo es:
S (θ) = E θb − θ
2
Ejemplo 3. Usando los datos del ejemplo 2, determina el sesgo de Sn2 y de Sn−1 con respecto a σ 2 .
σ2 2
S (Sn2 ) = E (Sn2 ) − σ 2 = σ 2 − n
− σ 2 = − σn
2 2
S Sn−1 = E Sn−1 − σ 2 = σ 2 − σ 2 = 0. Sn−1
2
es mejor que Sn2 porque su sesgo es cero.
c) Cuando los estimadores son sesgados el error cuadrado medio nos dice cual de ellos es mejor,
ya que a menor error cuadrado medio el estimador es mejor.
Ejemplo 4. Sea X1 , ..., Xn una m.a. de N (µ, σ 2 ). Se tienen los siguientes estimadores de µ:
T1 = X
T2 = 12 (2X1 + X2 − X3 )
Calcula el ecm de ambos estimadores con respecto a µ y determina cual es el mejor.
h i2 h i
σ2
ecm (T1 ) = V ar (T1 ) + [S (T1 )]2 = V ar X + S X = 1
n
(σ 2 + nµ2 ) − µ2 + 0 = n
Eficiencia
Suponga que se usa una muestra aleatoria simple de n elementos para obtener dos estimadores
puntuales insesgados de un mismo parámetro poblacional. En estas circunstancias preferirá usar
el estimador puntual que tenga el menor error estándar (o desviación estándar), ya que dicho
estimador tenderá a dar estimaciones más cercanas al parámetro poblacional (más preciso). Se
dice que el estimador puntual con menor error estándar tiene mayor eficiencia relativa que los
otros.
Seanθb1 y θb2 dos estimadores
insesgados. Se dice que
θ1 es más
b
eficiente que θ2 si se verifica que
b
La eficiencia de los estimadores está limitada por las características de la distribución de proba-
bilidad de la muestra de la que proceden.
Ejemplo 5. Usando los datos del ejemplo 4. Calcular el error estándar de los estimadores y deter-
minar cual es el mas eficiente.
r q
σ2 √σ
EE (T1 ) = EE X = V ar X = n
= n
h i r h i q
1 1 3 2
EE (T2 ) = EE 2
(2X1 + X2 − X3 ) = V ar 2
(2X1 + X2 − X3 ) = 2
σ = 1.22474σ
Se puede ver que T1 es el más eficiente.
Ejercicio:
Considere una m.a de N (µ, σ 2 ). Demuestre que la media muestral es consistente en media cua-
drática.
h i2 q
σ2
lim ecm X = lim V ar X + S X = n→∞
lim n
+0 =0
n→∞ n→∞
Observe que en el caso de la media muestral, la varianza (o error estándar) de X está dado por σX = σ/√n.
Puesto que σX está vinculado con el tamaño de la muestra, de manera que muestras mayores dan valores
menores de σX , entonces muestras de tamaño grande tienden a proporcionar estimadores puntuales más
cercanos a la media poblacional µ.
Mediante un razonamiento similar, concluya que la proporción muestral Pb es un estimador con-
sistente de la proporción poblacional P .
Precisión: La precisión es lo cerca que los valores medidos están unos de otros. Se refiere a la
dispersión del conjunto de valores obtenidos de mediciones repetidas de una magnitud. Cuanto
menor es la dispersión mayor la precisión. Una medida común de la variabilidad es la desvia-
ción estándar de las mediciones y la precisión se puede estimar como una función de ella. Esta
relacionada con el error estándar.
Confiabilidad: Está referida al grado en que un método estadístico produce estimaciones con-
sistentes si se realizan mediciones repetidas.
Un método estadístico es confiable si tiene la capacidad de proporcionar resultados similares
cuando se aplica reiteradas veces al mismo fenómeno. Un instrumento confiable proporciona
medidas confiables.
X ± M argen de Error
q
σ2
Para una realización de X1 , ..., Xn , el I.C. es: x ± Z α2 n
Ejemplo de aplicación:
Cada semana, la empresa Lloyd’s Department Store selecciona una muestra aleatoria simple de
100 clientes con objeto de conseguir información acerca de la cantidad que gastan en cada visita a
la tienda. Lloyd’s ha estado realizando estudios semanales durante varios años. Con base en sus
datos anteriores, Lloyd´s supone que el valor conocido de la desviación estándar poblacional es
σ = $20. Los datos anteriores (históricos) indican también que la población tiene una distribución
normal. En la última semana, en su estudio de 100 clientes, Lloyd’s obtuvo como media muestral
x = $82. La media muestral de la cantidad gastada permite una estimación puntual de la media
poblacional de la cantidad gastada en cada visita, µ.
q
400
82 ± 1.96 100
=82 ± 1.96 (2)= 82 ± 3.92 → (78.08 , 85.92)
r
2
Sn−1
(n−1)
X ± tα n
2
2 (n−1)
Donde Sn−1 es la varianza muestral, (1 − α) es el coeficiente de confianza y t α es el valor de
2
α
t que proporciona un área de 2 en la cola superior de la distribución t para n − 1 grados de
libertad.
r
(n−1) s2n−1
Para una realización de X1 , ..., Xn , el I.C. es: x ± t α n
2
Ejemplo de aplicación:
Scheer Industries está considerando un nuevo programa asistido por computadora con el fin
de capacitar a los empleados de mantenimiento para realizar la reparación de las máquinas.
Con objeto de evaluar este programa, el director de manufactura solicita una estimación de la
media poblacional del tiempo requerido para que los empleados de mantenimiento completen la
capacitación asistida por computadora. Considerando una muestra de 20 empleados que siguen
el programa de capacitación se tiene una media muestral de x = 51.5 días y una desviación
estándar de sn−1 = 6.84 dias.
q
46.7856
El I.C del 95 % de confianza está dado por 51.5 ± 2.093 20
= 51.5 ± 3.2 → (48.3 , 54.7)
El margen de error es 3.2 días y el intervalo de confianza de 95 % va de 48.3 días a 54.7 días.
r r !
S12 S22 S12 S22
X − Y − Z α2 n1
+ n2
< µ1 − µ2 < X − Y + Z α2 n1
+ n2
r
S12 S22
X − Y ± Z α2 n1
+ n2
r
s21 s22
Para una realización de las m.a.´s el I.C. es (x − y) ± Z α2 n1
+ n2
Donde S12 y S22 son las varianzas muestrales; es decir, son los estimadores de σ12 y σ22 , respectiva-
mente.
Nota: Para el caso de muestras pequeñas con σ12 y σ22 desconocidas se usa la fórmula:
r
S12 S22
(g.l)
X − Y ± tα n1
+ n2
2
2 2
2
S1 S2
n1 + n2
donde g.l. = 2 2
1 S2 S2
n1−1
1
n1 +n 1 2
n2
2−1
Ejemplo de aplicación:
El salario medio semanal en una muestra de n = 30 empleados de una empresa grande es x =
$280.00 y la desviación estándar muestral es s = $14.00. En otra empresa grande en una muestra
aleatoria de n = 40 empleados el salario medio semanal es $270.00 y la desviación estándar
muestral es s = $10.00. Obtenga un I.C. del 99 % de confianza para estimar la diferencia entre los
niveles de los salarios medios semanales en las dos empresas.
Asi, es posible afirmar que el salario promedio semanal en la primera empresa es mayor que
el salario promedio semanal en la segunda empresa, en una cantidad entre 2.23 y 17.77, con
una confianza de 99 % en esta estimación de intervalo. Oserve que los tamaños de muestra son
suficientemente grandes para permitir el uso de Z.
r r !
P
bQ P
bQ
Pb − Z α2 , Pb + Z α2
b b
n n
r
P
bQ
Pb ± Z α2
b
n
q
pq
El I.C. para una realización de una m.a. es: pb ± Z α2 bb
n
.
Ejemplo de aplicación:
Una empresa de investigación de mercado establece contacto con una muestra aleatoria de 100
hombres de una comunidad grande y encuentra que una proporción muestral de 0.40 prefiere
las hojas de rasurar fabricadas por la empresa cliente a las de otras marcas. A continuación, se
calcula un I.C. de 95 % de confianza para la proporción de hombres en toda la comunidad que
prefieren las hojas de rasurar de la empresa cliente.
q
Pb = 0.40 0.40 ± 1.96 0.24
100
Qb = 1 − Pb = 0.60 0.40 ± 1.96 (0.05)
Pb Qb = 0.40 (0.60) = 0.24 0.40 ± 0.098
Z α2 = Z0.025 = 1.96 (0.30 , 0.50)
Por tanto, con 95 % de confianza se estima que la proporción de todos los hombres de la comu-
nidad que prefieren las hojas de la empresa cliente está aproximadamente entre 0.30 y 0.50.
y Y1 , ..., Yn2 (de tamañosn1 y n2 ) con estimadores Pb1 y Pb2 , respectivamente. El intervalo al (1 − α)×
100 % de confianza para (P1 − P2 ) esta dado por:
r r !
P
b1 Q P
b2 Q P
b1 Q P
b2 Q
Pb1 − Pb2 − Z α2 + , Pb1 − Pb2 − Z α2 +
b1 b2 b1 b2
n1 n2 n1 n2
r
b1 Q
P b2 Q
P
Pb1 − Pb2 ± Z α2 +
b1 b2
n1 n2
r
p q1
Para una realización de las m.a.’s. el I.C. es: (pb1 − pb2 ) ± Z α2 b1 b
n1
+ pbn2 bq22
Ejemplo de aplicación:
Se considera cierto cambio en un proceso de fabricación de partes componentes. Se toman mues-
tras del procedimiento existente y del nuevo para determinar si éste tiene como resultado una
mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual son defectuosos y 80
de 2000 artículos del procedimiento nuevo también lo son, encuentre un intervalo de confianza
de 90 % para la diferencia real en la fracción de defectuosos entre el proceso actual y el nuevo.
n1 = 1500, n2 = 2000
75 80
pb = 1500 = 0.05, pb1 = 2000 = 0.04
qb1 = 0.95, qb2 = 0.96
Z0.05 = 1.64 o 1.65
q
(0.05)(0.95) 0.04(0.96)
(0.05 − 0.04) ± 1.64 + con 1.64 1500 2000
√
0.01 ± 1.64 0.0000316 + 0.0000192 con 1.64
(−0.00168 , 0.02168) con 1.64
(−0.001748 , 0.021748) con 1.65
Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo procedimiento
producirá una disminución significativa en la proporción de artículos defectuosos comparado
con el método existente.
Z 2α P (1−P )
n= 2
E2
En donde,
E =Es el margen de error deseado
Z α2 =Es el nivel de confianza
P =Es un valor planeado de P
2. Utilizar un estudio piloto y elegir una muestra preliminar. La proporción muestral de esta
muestra se usa como valor planeado, P .
4. Si no aplica ninguna de las alternativas anteriores, emplear como valor planeado P = 0.5.
Ejemplo de aplicación:
En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Cana-
dá, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se requiere que sea una muestra
si se quiere tener 95 % de confianza de que la estimación de P esté dentro de 0.02?
Se tratarán a las 500 familias como una muestra preliminar que proporciona una estimación de
P = 340/500 = 0.68.
2
n = (1.96)(0.02)
(0.68)(0.32)
2
Por lo tanto si basamos nuestra estimación de P sobre una muestra aleatoria de tamaño 2090, se
puede tener una confianza de 95 % de que nuestra proporción muestral no diferirá de la propor-
ción real por más de 0.02.