Documentos de Académico
Documentos de Profesional
Documentos de Cultura
estadística y muestreo
para economía y administración
de empresas
JOSÉ MIGUEL CASAS SÁNCHEZ CARMELO GARCÍA PÉREZ
CATEDRÁTICO DE ESTADÍSTICA ECONÓMICA Y EMPRESARIAL PROFESOR DE ESTADÍSTICA ECONÓMICA Y EMPRESARIAL
DE LA UNIVERSIDAD DE ALCALÁ DE LA UNIVERSIDAD DE ALCALÁ
Ejercicios de inferencia
estadística y muestreo
para economía y administración
de empresas
EDICIONES PIRÁMIDE
COLECCIÓN «ECONOMÍA Y EMPRESA»
Director:
Miguel Santesmases Mestre
Catedrático de la Universidad de Alcalá
© José Miguel Casas Sánchez, Carmelo García Pérez, Luis Felipe Rivera Galicia
y Ana Isabel Zamora Sanz, 2016
© Primera edición electrónica publicada por Ediciones Pirámide (Grupo Anaya, S. A.), 2016
Para cualquier información pueden dirigirse a piramide_legal@anaya.es
Juan Ignacio Luca de Tena, 15. 28027 Madrid
Teléfono: 91 393 89 89
www.edicionespiramide.es
ISBN digital: 978-84-368-3549-6
Estadística Descriptiva
Índice
Prólogo ...................................................................................................................................... 9
© Ediciones Pirámide 7
Ejercicios de estadística descriptiva y probabilidad
Índice
8 © Ediciones Pirámide
Estadística Descriptiva
Prólogo
Los ejercicios y problemas contenidos en este libro pretenden ser un complemento
práctico de los desarrollos teóricos sobre inferencia estadística y teoría de la decisión con-
tenidos en los manuales de Estadística para Economía y Administración de Empresas de
los profesores J. M. Casas Sánchez y J. Santos Peñas, catedráticos en la Universidad
de Alcalá y la Universidad Nacional de Educación a Distancia (UNED), respectivamente.
Los diferentes capítulos del libro se dedican, por este orden, a distribuciones en
el muestreo, estimación puntual y por intervalos, contrastes de hipótesis paramétricos,
contrastes de hipótesis no paramétricos, análisis de la varianza, muestreo en poblaciones
finitas y teoría de la decisión.
Hemos querido enfocar la resolución de cada ejercicio desde una perspectiva didácti-
ca, buscando la comprensión de los conceptos teóricos a través de la explicación detalla-
da y secuencial de los pasos que conducen a la solución final y de continuas referencias
a los conceptos teóricos que se utilizan en la resolución del problema. Por otra parte, se
ha procurado también que los enunciados respondan a situaciones reales de la actividad
económica y empresarial.
Con el fin de facilitar la selección de los diferentes tipos de ejercicios, presentamos
un índice temático en el que se identifica cada problema con dos números representati-
vos del capítulo en el que aparece y de su orden dentro del mismo. En las páginas fina-
les del libro se incluyen las tablas estadísticas que se han utilizado a lo largo del texto.
Por último, queremos dedicar este texto a nuestras familias y amigos, por su apoyo
constante.
© Ediciones Pirámide 9
1
Distribuciones en el muestreo. Estimación
Distribuciones
en el muestreo. Estimación
n n
∑ Xi ∑ Xi2
i =1 i =1
pˆ1 = ; pˆ 2 =
n n
E[ Xi ] = p y Var [ Xi ] = pq
Además:
por tanto:
© Ediciones Pirámide 11
Ejercicios de inferencia estadística y muestreo
y así:
⎡ n ⎤
⎢ ∑ Xi ⎥ n
E[ pˆ1 ] = E ⎢
i =1 ⎥ = 1 ∑ E[ X ] = np = p
⎢⎣ n ⎥⎦ n i = 1 i
n
⎡ ∑ Xi2 ⎤ 1 n np
E[ pˆ 2 ] = E ⎢ ⎥ = ∑ E[ Xi ] = = p
2
⎣ n ⎦ n i =1 n
n
1 1 pq
Var [ pˆ 2 ] =
n2
∑ Var [ Xi2 ] = n2 npq = n
i =1
donde:
Como las varianzas son iguales, ambos estimadores son igualmente eficientes.
c) Como los dos estimadores son insesgados, si su varianza tiende a cero al aumen-
tar el tamaño muestral, ambos estimadores serían consistentes1.
pq
lím Var [ pˆ1 ] = lím =0 y E[ pˆ1 ] = p
n→∞ n→∞ n
pq
lím Var [ pˆ 2 ] = lím =0 y E[ pˆ 2 ] = p
n→∞ n→∞ n
Por tanto, se verifica la consistencia de p̂1 y p̂2.
1
Una sucesión de estimadores {q̂ n} es consistente si, y sólo si, ∀ e > 0
Cada elemento de {q̂ n} se dice que es un estimador consistente. Ahora bien, una condición suficiente para la con-
sistencia de un estimador es que se verifiquen las dos condiciones siguientes:
1. lím E[θˆn ] = θ .
n→∞
12 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
X ~ N ( μ, σ )
Dada una muestra aleatoria simple de tamaño n, (X1, ..., Xn), el error mensual medio
se define como:
1 n
Xn = ⋅ ∑ Xi
n i =1
Para probar que este estimador es consistente para el parámetro m, debemos compro-
bar que:
Xn ⎯⎯→ μ
P
X ~ N 冢 μ, σ
冣
n
X−μ
Z= ~ N (0, 1)
σ/ n
© Ediciones Pirámide 13
Ejercicios de inferencia estadística y muestreo
pudiendo escribir:
ε⋅ n
lím =∞
n→∞ σ
resulta que:
—
y, por tanto, X n es consistente para m.
1 n
S′2 = ⋅ ∑ ( Xi − X )2
n i =1
14 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
E[ X ] = μ
Var [ X ] = σ 2
a) Si se extrae una muestra aleatoria simple de tamaño n, (X1, ..., Xn), la media
muestral:
1 n
X= ∑ Xi
n i =1
será un estimador consistente para la media poblacional si, y sólo si, converge en proba-
bilidad al verdadero valor de m.
X ⎯⎯→ μ
P
es decir, si ∀ e > 0:
lím P(冟 X − μ冟 ε ) = 0
n→∞
⎡1 n ⎤ 1 n 1 n nE[ X ]
E[ X ] = E ⎢ ∑ Xi ⎥ = ∑ E[ Xi ] = ∑ E[ X ] = = E[ X ] = μ
⎢⎣ n i = 1 ⎥⎦ n i = 1 n i =1 n
⎡1 n ⎤ 1 n
1 n
n Var [ X ] Var [ X ] σ 2
Var [ X ] = Var ⎢ ∑ Xi ⎥ = 2 ∑ Var [ Xi ] = n 2 ∑ Var [ X ] = = =
⎢⎣ n i = 1 ⎥⎦ n i =1 i =1 n2 n n
2
Si Y es una variable aleatoria con media y varianza finitas, entonces ∀ k > 0 se verifica:
Var [Y ]
P(冟Y − E[Y ]冟 k )
k2
© Ediciones Pirámide 15
Ejercicios de inferencia estadística y muestreo
Var [ X ] σ 2 / n
0 P(冟 X − μ冟 ε ) = P(冟 X − E[ X ]冟 ε ) = 2
ε2 ε
es decir:
σ2
0 P(冟 X − μ冟 ε )
nε 2
Como:
σ2
lím =0
n → ∞ nε 2
entonces:
lím P(冟 X − μ冟 ε ) = 0
n→∞
—
y, por tanto, X es consistente para m en una población cualquiera.
b) Una condición suficiente para la consistencia de un estimador es que sea asintó-
ticamente insesgado y que su varianza tienda a cero. Sabemos que la varianza muestral:
1 n
S2 = ∑
n − 1 i =1
( Xi − X )2
E[ S 2 ] = σ 2
y como:
1 n n −1 2
S′2 = ∑
n i =1
( Xi − X ) 2 =
n
S
16 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
resulta que3:
n −1 n −1 2
E[ S ′ 2 ] = E[ S 2 ] = σ
n n
(n − 1)2 (n − 1)2 ⎡ μ 4 3−n ⎤
Var [ S ′ 2 ] = Var [ S 2
] = ⎢ + σ 4⎥
⎣ n n(n − 1) ⎦
2 2
n n
y, por tanto:
n −1 2
lím E[ S ′ 2 ] = lím σ = σ2
n→∞ n→∞ n
(n − 1)2 ⎡ 3 − n 4⎤
lím Var [ S ′ 2 ] = lím
n→∞ n→∞ n3 ⎢⎣ μ 4 + n − 1 σ ⎥⎦ = 0
Sea (X1, X2, X3) una muestra aleatoria simple procedente de una pobla-
Ejercicio 1.4
ción que sigue una distribución normal con media m y varianza s2.
Consideremos los siguientes estimadores de m:
X1 + 2 X2 + 3 X3 X1 − 4 X2
μˆ 1 = ; μˆ 2 =
6 −3
⎡ X + 2 X2 + 3 X3 ⎤ 1 1
E[ μˆ 1 ] = E ⎢ 1 ⎥ = E[ X1 + 2 X2 + 3 X3 ] = ( E[ X1 ] + 2 E[ X2 ] + 3E[ X3 ]) =
⎣ 6 ⎦ 6 6
1 1
= ( μ + 2 μ + 3μ ) = 6 μ = μ
6 6
3
Véase Casas Sánchez, J. M.: Inferencia estadística, para las expresiones de E [S2] y Var [S2].
© Ediciones Pirámide 17
Ejercicios de inferencia estadística y muestreo
⎡ X − 4 X2 ⎤ 1 1
E[ μˆ 2 ] = E ⎢ 1 ⎥ = − E[ X1 − 4 X2 ] = − ( E[ X1 ] − 4 E[ X2 ]) =
⎣ −3 ⎦ 3 3
1 1
= − ( μ − 4 μ ) = − ( − 3μ ) = μ
3 3
⎡ X + 2 X2 + 3 X3 ⎤ 1
Var [ μˆ 1 ] = Var ⎢ 1 ⎥⎦ = 36 Var [ X1 + 2 X2 + 3 X3 ] =
⎣ 6
1
= (Var [ X1 ] + 4 Var [ X2 ] + 9 Var [ X3 ]) =
36
1 2 14 2 7σ 2
= [σ + 4σ 2 + 9σ 2 ] = σ =
36 36 18
⎡ X − 4 X2 ⎤ 1 1
Var [ μˆ 2 ] = Var ⎢ 1 ⎥ = Var [ X1 − 4 X2 ] = (Var [ X1 ] − 16 Var [ X2 ]) =
⎣ −3 ⎦ 9 9
1 2 17σ 2
= [σ + 16σ 2 ] =
9 9
Como Var [m̂1] < Var [m̂2], m̂1 es la más eficiente de los dos.
c) En una muestra aleatoria simple obtenida de una población que sigue una distri-
bución normal, la media muestral es un estimador insesgado y eficiente.
—
Verifiquemos que X cumple estas dos propiedades:
⎡ X + X2 + X3 ⎤ 1
E[ X ] = E ⎢ 1 ⎥⎦ = 3 E[ X1 + X2 + X3 ] =
⎣ 3
1 1
= ( E[ X1 ] + E[ X2 ] + E[ X3 ]) = ( μ + μ + μ ) = μ
3 3
18 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
—
Se ha comprobado así que X es un estimador insesgado para m:
⎡ X + X2 + X3 ⎤ 1
Var [ X ] = Var ⎢ 1
⎣ 3 ⎥⎦ = 9 Var [ X1 + X2 + X3 ] =
1 1 σ2
= (Var [ X1 ] + Var [ X2 ] + Var [ X3 ]) = (σ 2 + σ 2 + σ 2 ) =
9 9 3
—
Para comprobar la eficiencia de X , vista su insesgadez, hay que verificar que su
varianza coincide con la cota de Frechet-Cramer-Rao para un estimador insesgado. Para
ello calculamos dicha cota:
1
Cota de Frechet-Cramer-Rao =
冤冢 ∂ ln f ( x; θ )
冣冥
2
nE
∂θ
1 ( x − μ )2
1 −
f ( x; μ ) = e 2 σ2
σ 2π
1 ( x − μ )2 1
ln f ( x; μ ) = − + ln
2 σ 2
σ 2π
∂ ln f ( x; μ ) ( x − μ )
=
∂μ σ2
冤冢 ∂ ln f ( x; μ )
冣冥 冤冢 X−μ
冣冥 nσ 2
2 2
n n
nE = nE = E[( X − μ ) 2
] = = 2
∂μ σ2 σ 4
σ 4
σ
Por tanto:
1 σ2
Cota de Frechet-Cramer-Rao = =
n /σ 2 n
© Ediciones Pirámide 19
Ejercicios de inferencia estadística y muestreo
Así pues, cualquier estimador de m insesgado tiene una varianza mayor o igual que
s2 /n. Como la muestra aleatoria simple que hemos considerado tiene tamaño tres, cual-
—
quier estimador de m tiene una varianza superior o igual a s2 /3. En nuestro caso, X es
insesgado y de mínima varianza, porque su varianza coincide con la cota de Frechet-
—
Cramer-Rao; por tanto, X es un estimador eficiente.
Sea (X1, X2, ..., Xn) una muestra aleatoria simple procedente de una po-
Ejercicio 1.5
blación con distribución uniforme U(a, b). Obtenga los estimadores de
a y b según el método de los momentos y el método de máxima verosimilitud.
⎧ 1
⎪ si a x b
f ( x) = ⎨ b − a
⎪⎩0 en otro caso
冮
b
b
1 ⎡ x2 ⎤ b2 − a2 b+a
α1 = E[ X ] = x⋅ dx = ⎢ ⎥ = =
a b−a ⎣ 2( b − a ) ⎦ a 2( b − a ) 2
冮
b
b
1 ⎡ x3 ⎤ b3 − a3 a 2 + ab + b 2
α 2 = E[ X 2 ] = x2 ⋅ dx = ⎢ ⎥ = =
a b−a ⎣ 3(b − a) ⎦ a 3(b − a) 3
n
∑ Xi
i =1
a1 = =X
n
n
∑ Xi2
i =1
a2 =
n
20 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
n
⎫
b + a i =1
∑ Xi ⎪
= = a1 ⎪
2 n ⎪
n ⎬
⎪
a + ab + b
2 2 ∑ X i
2
⎪
i =1
= = a2 ⎪
3 n ⎭
b = 2 a1 − a
a 2 + a(2 a1 − a) + (2 a1 − a)2
= a2
3
a 2 + 2 a1a − a 2 + 4 a12 + a 2 − 4 a1a
= a2
3
a 2 − 2 a1a + 4 a12 = 3a2
2 a1 ± 4 a12 − 16 a12 + 12 a2
a= = a1 ± − 3a12 + 3a2
2
luego:
n
∑ Xi2
i =1
â = X ± 3 − 3 X 2 = X ± 3S ′ 2 = X ± 3 S ′
n
n
∑ Xi2
i =1
b̂ = X 3 − 3 X 2 = X 3S ′ 2 = X 3 S ′
n
© Ediciones Pirámide 21
Ejercicios de inferencia estadística y muestreo
y como a < b, se tiene que la estimación por el método de los momentos es:
aˆ = X − 3S ′
bˆ = X + 3S ′
冢 冣
n n
1
L( x1 ,..., xn ; a, b) = ∏ f ( xi ; a, b) =
i =1 b−a
si a xi b, ∀ i = 1, ..., n.
Tomando el logaritmo neperiano:
ln L( x1 ,..., xn ; a, b) = − n ln(b − a)
∂ ln L( x1 ,..., xn ; a, b) n
=
∂a b−a
∂ ln L( x1 ,..., xn ; a, b) n
=−
∂b b−a
Al igualar estos cocientes a cero, se observa que b – a debería ser infinito, pero esto
no es posible, pues los parámetros de la distribución uniforme proporcionan un intervalo
finito. Este hecho se produce porque el campo de variación X depende de los parámetros
(a x b). Por tanto, no se puede aplicar el proceso anterior y habrá que encontrar el
máximo de la función de verosimilitud de otra forma.
Como se ha encontrado que:
⎧ 1
⎪ si a xi b , ∀ i = 1,..., n
L( x1 ,..., xn ; a, b) = ⎨ (b − a)n
⎪⎩0 en caso contrario
22 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
a xi b , ∀ i = 1,..., n
es decir, cuando:
a mín{xi}
i
máx{xi} b
i
aˆ = mín{Xi}
i
bˆ = máx{Xi}
i
Analíticamente:
1
máx L( x1 ,..., xn ; a, b) ≡
a, b mín (b − a)n
a, b
pero como:
xi b, ∀ i = 1,..., n ⇔ máx{xi} b
i
a xi , ∀ i = 1,..., n ⇔ a mín{xi}
i
4
entonces:
b − a máx{xi} − mín{xi}
i i
4
X (i) es el estadístico de orden i. Es decir, una vez ordenadas de forma creciente las observaciones muestrales X (i),
tomará el valor de la que ocupe el lugar i-ésimo.
© Ediciones Pirámide 23
Ejercicios de inferencia estadística y muestreo
y, por tanto:
[ ]
n
mín (b − a)n máx{xi} − mín{xi}
a, b i i
con lo cual:
1 1
máx L( x1 ,..., xn ; a, b) ≡
mín (b − a)
[ ]
n
a, b n
máx{xi} − mín{xi}
a, b i i
y, por tanto:
aˆ = mín{Xi} ; bˆ = máx{Xi}
i i
Sea (X1, ..., Xn) una muestra aleatoria simple procedente de una B(p).
Solución
La función de probabilidad de una B(p) para cada Xi es:
P( xi ; p) = p xi (1 − p)1 − xi , xi = 0, 1, i = 1,..., n
i =1
冢 冣 冢 冣
n n
ln L( x1 ,..., xn ; p) = ∑ xi ln p + n − ∑ xi ln (1 − p)
i =1 i =1
n n
∂ ln L( x1 ,..., xn ; p)
∑ xi n − ∑ xi
i =1 i =1
= − =0
∂p p 1− p
n n
∑ xi n − ∑ xi n n n
i =1 i =1
p
=
1− p
⇒ ∑ xi − p∑ xi = pn − p∑ xi
i =1 i =1 i =1
24 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
∂ 2 ln L( x1 ,..., xn ; p)
∑ xi n − ∑ xi
i =1 i =1
=− 2 −
∂p 2 p (1 − p)2
n
∑ xi
i =1
y comprobamos cuánto vale en p = :
n
n n n
∑ xi n − ∑ xi
n2
n − ∑ xi
n2 n2
i =1 i =1 i =1
− − =− − =− − =
冢 冣 冢 冣 冢 冣
n 2 n 2 n n 2 n n
∑ xi ∑ xi ∑ xi n − ∑ xi ∑ xi n − ∑ xi
i =1 i =1 i =1 i =1 i =1 i =1
1−
n n n
n n
− n 3 + n 2 ∑ xi − n 2 ∑ xi
i =1 i =1 n3
= =− <0
∑ xi 冢n − ∑ xi 冣 ∑ xi 冢n − ∑ xi 冣
n n n n
i =1 i =1 i =1 i =1
es el estimador máximo-verosimil de p.
© Ediciones Pirámide 25
Ejercicios de inferencia estadística y muestreo
⎡ n ⎤
⎢ ∑ Xi ⎥ n n
E[ pˆ ] = E ⎢
i =1 ⎥ = 1 ∑ E[ X ] = 1 ∑ p = 1 np = p
⎢⎣ n ⎥⎦ n i = 1 i
n i =1 n
La varianza de p̂ es:
⎡ n ⎤
⎢ ∑ Xi ⎥ n
Var [ pˆ ] = Var ⎢
i =1 ⎥= 1 ∑ Var [ Xi ] = n 2 npq =
1 pq
——→ 0
⎢⎣ n ⎥⎦ n 2 i =1 n n→∞
Sea (X1 ,..., Xn) una muestra aleatoria simple procedente de una pobla-
Ejercicio 1.7
ción B(m, p), donde p es desconocido. Obtenga el estimador de máxima
verosimilitud y el estimador por el método de los momentos para el parámetro p.
∂ ln L( x1 ,..., xn ; p)
=0
∂p
冢 x 冣 p (1 − p) 冢x 冣 p 冢x 冣 p
m m m
= x1 m − x1
⋅ x2
(1 − p) m − x2 ⋅…⋅ xn
(1 − p) m − xn =
1 2 n
n n
冤∏ 冢 冣冥 p
n m ∑ xi mn − ∑ xi
= i =1
(1 − p) i =1
i =1 xi
26 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
冢冣 冢 冣
n n n
m
ln L( x1 ,..., xn ; p) = ∑ ln xi
+ ∑ xi ln p + mn − ∑ xi ln (1 − p)
i =1 i =1 i =1
n n
∂ ln L( x1 ,..., xn ; p)
∑ xi mn − ∑ xi
i =1 i =1
= − =0
∂p p 1− p
Por tanto:
n n
∑ xi mn − ∑ xi n n n
i =1 i =1
p
=
1− p
⇒ ∑ xi − p∑ xi = mnp − p∑ xi
i =1 i =1 i =1
luego:
n
∑ xi X
i =1
p̂ = =
mn m
Para comprobar que en x– /m la función de verosimilitud tiene un máximo, volvemos
a derivar su logaritmo:
n n
∂ 2 ln L( x1 ,..., xn ; p)
∑ xi mn − ∑ xi
i =1 i =1
=− 2 −
∂p 2 p (1 − p)2
冢 冣 冢 冣
n n n n
冢 冣 冢 冣
x 2 x 2 2 2
m
1−
m
∑ xi mn − ∑ xi ∑ xi mn − ∑ xi
i =1 i =1 i =1 i =1
mn mn
n n
− m 3 n 3 + m 2 n 2 ∑ xi − m 2 n 2 ∑ xi
i =1 i =1 − m 3n 3
= n n
= n n
<0
冢∑ x 冣 ∑ xi ⋅ 冢mn − ∑ xi 冣
2
mn ∑ xi − i
i =1 i =1 i =1 i =1
© Ediciones Pirámide 27
Ejercicios de inferencia estadística y muestreo
porque:
n
∑ xi < mn
i =1
—
con lo que queda probado que p̂ = X /m es estimador máximo-verosímil de p.
E[ X ] = mp
1 n
a1 = ∑ Xi = X
n i =1
a1 = E[ X ]
1 n
∑ Xi = mp
n i =1
n
∑ Xi X
i =1
p̂ = =
nm m
28 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
Sea (X1, ..., Xn) una muestra aleatoria simple de la variable X. Cada Xi
Solución
tiene la siguiente función de densidad:
n
− ∑ ( xi − α )
− ( x1 − α ) − ( x2 − α ) − ( xn − α )
L( x1 ,..., xn ; α ) = e ⋅e ⋅ ... ⋅ e =e i =1
n n
ln L( x1 ,..., xn ; α ) = − ∑ ( xi − α ) = − ∑ xi + nα
i =1 i =1
n=0
© Ediciones Pirámide 29
Ejercicios de inferencia estadística y muestreo
n
En este caso, hay que maximizar − ∑ ( xi − α ) directamente5, y conviene observar
i =1
que xi a, ∀ xi; luego esta expresión es máxima si:
α = mín{xi}
i
por tanto:
αˆ = mín{Xi}
i
y como:
xi α , ∀ i = 1,..., n ⇔ mín{xi} α
i
entonces:
n mín{xi }
e nα e i
y, por tanto:
n mín{xi }
máx e nα e i
α
Con lo cual:
αˆ = mín{xi}
i
30 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
Por tanto:
X ~ N ( μ; 0,5)
a) La mejor estimación puntual para la media poblacional se calcula mediante la
media muestral. Así:
n
∑ xi 7.500
i =1
μˆ = = = 150 cm 3
n 50
b) Como la cantidad de café que es suministrada en cada taza sigue una distribu-
ción normal con s = 0,5 centímetros cúbicos, conocida, el estadístico:
X−μ
σ/ n
© Ediciones Pirámide 31
Ejercicios de inferencia estadística y muestreo
冢
P − zα / 2
X−μ
σ/ n 冣
zα / 2 = 1 − α
En este caso, 1 – a = 0,95, luego a = 0,05, por lo que, mirando la tabla 7, se obtiene
que z a/2 = 1,96. Por tanto:
冢
P − 1,96
X−μ
0,5 / 50 冣
1,96 = 0,95
冢
P X − 1,96
0,5
50
μ X + 1,96
0,5
50 冣 = 0,95
y como x– = 150, el intervalo de confianza al 95 % será:
[149,8614; 150,1386]
X ~ N ( μ; σ )
32 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
X−μ
S/ n
冤X − t α /2
S
n
; X + tα / 2
S
n 冥
Calculemos t a/2:
t a/2 es un valor tal que P(t t a/2) = a/2, con t una distribución t de Student de n – 1 = 24
grados de libertad. Si se busca en la tabla 10, se obtiene:
t0,05;24 = 1,711
Se puede afirmar, con una confianza del 95 %, que los condensadores que produce
este fabricante tienen una duración media de entre 504,312 horas y 531,688 horas, mayor,
por tanto, de 500 horas.
Si se tomara una serie de muestras de tamaño 25, aproximadamente el 95 % de
ellas proporcionarían intervalos que contendrían el verdadereo valor de parámetro que
se prentende estimar, mientras que un 5 % de dichas muestras darían lugar a intervalos
que no contendrían el verdadero valor de la duración media poblacional. Por tanto, el
intervalo numérico obtenido puede ser de cualquiera de los dos tipos.
© Ediciones Pirámide 33
Ejercicios de inferencia estadística y muestreo
682, 553, 555, 666, 657, 649, 522, 568, 700, 552
X ~ N ( μ; σ )
A partir de la información que se suministra en el enunciado, se puede calcular la
media y la desviación típica muestral:
n
∑ xi 6.104
i =1
x= = = 610, 4 miles de espectadores/ programa
n 10
s′2 =
∑ xi2 − ( x )2 =
3.765.176
− (610,4)2 = 3.929, 44
n 10
luego:
10 2 10
s2 = s′ = 3.929, 44 = 4.366,0444
9 9
y, por tanto:
34 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
冤
Iμ = X − tα / 2
S
n
; X + tα / 2
S
n 冥
donde t a/2 es tal que P(tn – 1 t a/2) = a/2.
Se ha elegido este intervalo porque tenemos una muestra pequeña (n = 10).
Como 1 – a = 0,95, entonces a = 0,05, luego a/2 = 0,025. El valor t a/2 es 2,262, puesto
que tiene nueve grados de libertad (se ha buscado dicho valor en la tabla 10). Por tanto:
冤
Iμ = 610, 4 − 2,262
66,0761
10
; 610, 4 + 2,262
66,0761
10
= 冥
= [610, 4 − 47,2647; 610, 4 + 47,2647] = [563,1353; 657,6647]
Como el valor 600 se encuentra dentro del intervalo de confianza construido, po-
demos decir, con un 95 % de confianza, que la audiencia media del programa es de
600.000 espectadores (o, lo que es lo mismo, no se podría rechazar esta afirmación).
Este apartado se podría resolver igualmente mediante un contraste de hipótesis bi-
lateral.
b) Se calcula ahora un intervalo de confianza para s2:
Iσ 2 = 冤 (n − 1)S 2 (n − 1)S 2
;
χ n2 − 1;1 − α / 2 χ n2 − 1; α / 2 冥
donde:
χ 92;1 − α / 2 = 19,02
χ 92; α / 2 = 2,7
© Ediciones Pirámide 35
Ejercicios de inferencia estadística y muestreo
Por tanto:
Iσ 2 = 冤 9 ⋅ 4 ⋅19366,02,0444 ; 9 ⋅ 4 ⋅ 366
2,7
,0444
冥 = [2.065,9516; 14.553,4813]
El intervalo de confianza para s será:
Este intervalo no contiene el valor 15, por lo que no queda probada la afirmación de
que la audiencia tenga una desviación típica de 15.000 espectadores con una confianza
del 95 %.
Iσ 2 = 冤 (n − 1)S 2 (n − 1)S 2
;
χ n2 − 1;1 − α / 2 χ n2 − 1; α / 2 冥
con 1 – a = 0,90 fi a/2 = 0,05:
P( χ n2 − 1 χ n2 − 1;1 − α / 2 ) = 1 − α / 2 = 0,95
P( χ n2 − 1 χ n2 − 1; α / 2 ) = α / 2 = 0,05
36 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
2
9
0,90
0,05
0,05
0 3,325 16,92
© Ediciones Pirámide 37
Ejercicios de inferencia estadística y muestreo
X → N ( μ x , 100 )
Y → N ( μ y , 80 )
Se han tomado dos muestras que han producido los siguientes resultados:
nx = 15 x = 27 litros
ny = 10 y = 23 litros
σ x2 σ y2 σ x2 σ y2
冤( X − Y ) − zα / 2
nx
+
ny
; ( X − Y ) + zα / 2
nx
+
ny 冥
donde za/2 es tal que:
α
P[ Z > zα / 2 ] = y Z → N (0, 1)
2
Como 1 – a = 0,99, a = 0,01, luego a/2 = 0,005. Si se mira la tabla 7, se obtiene que
za/2 = 2,575, puesto que P(Z 2,57) = 0,0051 y P(Z 2,58) = 0,0049, y por interpola-
ción entre esos dos valores se tiene que P(Z 2,575) = 0,005.
En este caso, y con la información muestral recogida, el intervalo queda:
38 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
冤 冥
ˆˆ
pq ˆˆ
pq
I p = pˆ − zα / 2 ; pˆ + zα / 2
n n
ˆˆ
pq
eˆ p = zα / 2
n
de donde:
zα2 / 2 pq
ˆˆ
n= 2
eˆ p
1
pˆ = qˆ = = 0,5
2
© Ediciones Pirámide 39
Ejercicios de inferencia estadística y muestreo
Al considerar estos valores para p̂ y q̂, obtenemos un tamaño muestral máximo, váli-
do para garantizar el error fijado por la compañía sea cual sea el valor del parámetro p.
Luego:
0,74 ⋅ 0,26
eˆ p = 1,96 = 0,02631
1.068
Luego p pertenece al intervalo [0,74 – 0,02631; 0,74 + 0,02631], con una confianza
del 95 %.
El error de estimación es más pequeño (0,02631), y eso se debe a que disponemos
de información sobre p̂ y q̂, que consideramos como conocidos y que no representan el
peor de los casos.
La intención de voto de cada persona sigue una distribución B(1, p). Sean
Solución
p1 = «Proporción de votantes del partido 1» y p2 = «Proporción de votantes
del partido 2», el intervalo de confianza para la diferencia de proporciones es:
冤( pˆ − pˆ ) − z
1 2 α /2
pˆ1qˆ1 pˆ 2 qˆ2
n
+
n
; ( pˆ1 − pˆ 2 ) + zα / 2
pˆ1qˆ1 pˆ 2 qˆ2
n
+
n 冥
en donde za/2 = 1,96, ya que 1 – a = 0,95.
40 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
Como no se tiene información sobre p1 y p2, salvo que los partidos están igualados,
se toma el peor de los casos: p̂1 = p̂2 = 0,5.
Despejando, se tiene:
Sea:
Solución
Esta variable sigue una distribución B(1, p), con p = P(X = 1), la proporción de con-
sumidores dispuestos a adquirir el ordenador.
a) Sabemos que el intervalo al nivel de confianza 100(1 – a) % para el paráme-
tro p es:
冤 pˆ − z 冥
ˆˆ
pq ˆˆ
pq
α /2 ; pˆ + zα / 2
n n
© Ediciones Pirámide 41
Ejercicios de inferencia estadística y muestreo
ˆˆ
pq
eˆ = zα / 2
n
se pretende que:
ˆˆ
pq
0,005 < zα / 2
n
en los dos casos. Como el nivel de confianza es del 90 %, a/2 = 0,05, luego, buscando
en la tabla 7, se obtiene:
zα / 2 = 1,645
por interpolación entre los dos valores de Z cuya probabilidad acumulada se encuentra
más próxima a 0,95:
P( Z 1,64) = 0,9495
P( Z 1,65) = 0,9505
zα2 / 2 pq
ˆˆ
n= 2
e
(1,645)2 ⋅ 0, 45 ⋅ 0,55
n1 = = 26.789,6475 ≈ 26.790 personas
(0,005)2
(1,645)2 ⋅ 0,6 ⋅ 0, 4
n2 = = 25.977,84 ≈ 25.978 personas
(0,005)2
42 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
Por tanto, para garantizar un error inferior al 0,5 % con un nivel de confianza del
90 %, el tamaño de la muestra que habría de ser elegida para garantizar la cota de error
en cualquiera de los casos será de 26.790 personas.
b) El intervalo de confianza para p será:
冤 冥
ˆˆ
pq ˆˆ
pq
I p = pˆ − zα / 2 ; pˆ + zα / 2
n n
Empresas
1 2 3 4 5 6
© Ediciones Pirámide 43
Ejercicios de inferencia estadística y muestreo
X ~ N(μx , σ x )
Y ~ N(μy , σ y )
con X e Y independientes y sx = sy = s.
a) Para ver si 22 es un valor admisible para sy2, obtenemos el correspondiente in-
tervalo de confianza al 95 %:
χ25
1– = 0,90
/2 = 0,025
/2 = 0,025
χ25; /2 χ25; 1– /2
44 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
yi 18 19 20 22 31 26
ny
1 136
y=
ny
∑ yi = 6
= 22,6667
i =1
冢 冣 ⎤⎥⎥
ny
⎡ 2
1 ny
1 ⎢ ny ∑ yi
i =1
sy2 = ∑ i
ny − 1 i = 1
( y − y ) 2
= ⎢∑ y 2 −
ny − 1 ⎢⎣i = 1 i
=
ny ⎥⎦
1⎡ 136 2 ⎤
= 3. 206 − = 24,6667
5 ⎢⎣ 6 ⎥⎦
⎡ (6 − 1)24,6667 (6 − 1)24,6667 ⎤
Iσ 2 = ⎢ ; ⎥ = [9,6129; 148,3801]
y
⎣ 12,83 0,8312 ⎦
Iσ y = [3,1005; 12,1811]
α 0,01
P(t10 > tα / 2 ) = = = 0,005
2 2
Entonces:
tα / 2 = 3,169
xi 13 14 21 19 15 15
nx
1 97
x=
nx
∑ xi = 6
= 16,1667
i =1
冢 ∑ xi 冣
nx
⎡ 2
⎤
1 ⎢ nx ⎥ 1⎡ 972 ⎤
i =1
s x2 = ⎢∑ x 2 − ⎥ = ⎢1.617 − = 9,7667
nx − 1 ⎢⎣i = 1 i nx ⎥⎦ 5 ⎣ 6 ⎥⎦
冤
Iμ x − μ y = (16,1667 − 22,6667) − 3,169
5 ⋅ 9,7667 + 5 ⋅ 24,6667
6+6−2
6+6
6⋅6
;
46 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
Como el valor 0 está dentro de Imx – my, entonces puede admitirse la similitud en la
creación de puestos de trabajo en estos dos sectores.
c) El intervalo de confianza para estimar una proporción es:
冤
I p = pˆ − zα / 2
pˆ (1 − pˆ )
n
; pˆ + zα / 2
pˆ (1 − pˆ )
n 冥
con za/2 el cuantil de orden 1 – a/2 en una N(0, 1), es decir, tal que:
P( Z > zα / 2 ) = α / 2
o bien:
P( Z zα / 2 ) = 1 − α / 2
pˆ (1 − pˆ )
L = 2 zα / 2
n
4 ⋅ zα2 / 2 ⋅ pˆ (1 − pˆ )
n=
L2
p̂(1 – p̂)
1/4
p̂
0 1/2 1
© Ediciones Pirámide 47
Ejercicios de inferencia estadística y muestreo
n 1.537
X ~ N (23, 6)
a) Seleccionada una muestra aleatoria simple, X1, ..., Xn, de tamaño 9, n = 9, la me-
dia muestral:
1 n
X = ∑ Xi
n i =1
P(18,72 X 25,76)
48 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
X ~ N (23, 6) ⇒ X ~ N 冢23; 6
冣 冢
≡ N 23;
6
冣
n 9
y entonces:
X − 23
Z= ~ N (0, 1)
6/ 9
por tanto:
donde las probabilidades han sido buscadas en la tabla 7 de una distribución N(0, 1).
b) La varianza muestral se define como:
1 n
S2 = ∑ ( Xi − X )2
n − 1 i =1
Se sabe que:
(n − 1)S 2
~ χ n2 − 1
σ2
(9 − 1)S 2
~ χ 82
36
© Ediciones Pirámide 49
Ejercicios de inferencia estadística y muestreo
0,95 = P( S 2 > k )
0,95 = 1 − P( S 2 k )
de donde:
0,05 = P( S 2 k ) = P 冢 8 ⋅ S2
36
8k
36 冣
y, de nuevo, de la tabla 9 se deduce que:
8k
= 2,733
36
y, por tanto:
36 ⋅ 2,733
k= = 12,2985
8
X ~ N (23, σ )
50 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
La desviación típica muestral del rendimiento del producto en las nueve entidades
ha sido de 4,5 %, por tanto:
s = 4,5
Utilizando que:
X−μ
~ tn − 1 ≡ t8
S/ n
16 16
∑ xi = 276 ; ∑ xi2 = 4.826
i =1 i =1
© Ediciones Pirámide 51
Ejercicios de inferencia estadística y muestreo
1 n 276
x= ∑
n i =1
xi =
16
= 17, 25 cientos de monturas/día
1 n
冤∑ xi2 − n 冢∑ xi 冣 冥 =
n n 2
1 1
s x2 = ∑
n − 1 i =1
( xi − x ) 2 =
n −1 i =1 i =1
=
1
15 冤 1
4.826 − (276)2 = 4,3333
16 冥
El intervalo de confianza para la varianza, como m es desconocida y n = 20 (peque-
ña), será:
Iσ 2 =
x 冤 (nx − 1)Sx2 (nx − 1)Sx2
;
χ n2 − 1;1 − α / 2 χ n2 − 1; α / 2 冥
donde los denominadores son los cuantiles de órdenes 1 – a/2 y a/2, tales que en una
c2 con n – 1 = 15 grados de libertad verifican que:
χ215
1–
/2
/2
χ215; /2 χ215; 1– /2
52 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
Como 1 – a = 0,95, a/2 = 0,025, entonces, utilizando la tabla 9, estos valores serán:
χ15
2
;1 − α / 2 = 27, 49
χ15
2
; α / 2 = 6,262
Sustituyendo en el intervalo:
Iσ 2 =
x 冤1527⋅ 4,,493333 ; 156⋅ ,4262
,3333
冥 = [2,3645; 10,3800]
Por tanto, para sx, el intervalo lo podemos obtener tomando raíces cuadradas:
Iσ x = [1,5377; 3,2218]
Iσ 2 /σ 2 =
x y 冤 Sx2
2
⋅
1
;
Sx2
2
⋅
1
Sy Fnx − 1,ny − 1;1 − α / 2 Sy Fnx − 1,ny − 1; α / 2 冥
siendo:
1
Fnx − 1,ny − 1;1 − α / 2 =
Fny − 1,nx − 1; α / 2
© Ediciones Pirámide 53
Ejercicios de inferencia estadística y muestreo
Ᏺ15,25
/2
/2
F15,25; /2 F15,25; 1 – /2
es decir:
0,05
P(Ᏺ 15,25 F15,25;1 − α / 2 ) = 1 − α / 2 = 1 − = 0,975
2
F15,25;1 − α / 2 = 2, 41
冢
P Ᏺ 25,15
1
F15,25; α / 2 冣 = 1 − 0,025 = 0,975
54 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
1
= F25,15;1 − α / 2 = F25,15; 0,975 = 2,69
F15,25; α / 2
entonces:
1 1
F15,25; α / 2 = = = 0,3717
F25,15;1 − α / 2 2,69
Sustituyendo en el intervalo:
Iσ 2 /σ 2 =
x y 冤 4,33333
,86 2, 41 3,86 0,3717 冥
⋅
1 4,3333
; ⋅
1
= [0, 4658; 3,0202]
t40
0,975
/2 = 0,025
t /2
t a/2 = 2,021
© Ediciones Pirámide 55
Ejercicios de inferencia estadística y muestreo
冤
Iμ x − μ y = (17,25 − 12,5) − 2,021
(16 − 1)4,3333 + (26 − 1)3,86 16 + 26
16 + 26 − 2 16 ⋅ 26
;
X Observados
0 8
1 5
2 3
3 4
X=x 0 1 2 3
1 5 q–4 1
P(x) = P(X = x)
q 2q q 2q
56 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
i) P( x ) 0, ∀ x
ii ) ∑ P( x ) = 1
x
En este caso, como q > 4, entonces, en particular también q > 0 y, por tanto, se
tiene que:
1
P( X = 0) = >0
θ
5
P( X = 1) = >0
2θ
θ−4
P( X = 2) = > 0, pues θ > 4 ⇒ θ − 4 > 0
θ
1
P( X = 3) = >0
2θ
1 5 θ−4 1
∑ P( x ) = P( X = 0) + P( X = 1) + P( X = 2) + P( X = 3) = θ + 2θ + θ
+
2θ
=
x
6 θ − 3 3+θ − 3 θ
= + = = =1
2θ θ θ θ
F( x ) = P( X x )
© Ediciones Pirámide 57
Ejercicios de inferencia estadística y muestreo
Entonces:
⎧0 si x < 0
⎪
⎪1 si 0 x < 1
⎪θ
⎪
⎪⎪ 1 + 5 = 7 si 1 x < 2
F( x ) = P( X x ) = ⎨θ 2θ 2θ
⎪
⎪ 7 + θ − 4 = 2θ − 1 si 2 x < 3
⎪ 2θ θ 2θ
⎪
⎪ 2θ − 1 + 1 = 2θ = 1 si x 3
⎪⎩ 2θ 2θ 2θ
F(x)
1 F(x)
(2 – 1)
———
2
7
—–
2
1
––
0 1 2 3 x
E[ X ] = ∑ x ⋅ P( X = x )
x
58 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
3
1 5 θ−4 1
E[ X ] = ∑ x ⋅ P( X = x ) = 0 ⋅ θ + 1⋅
2θ
+ 2⋅
θ
+ 3⋅
2θ
=
x=0
0 + 5 + 4θ − 16 + 3 4θ − 8 2θ − 4
= = =
2θ 2θ θ
Var [ X ] = E[ X 2 ] − [ E[ X ]]2
donde:
3
1 5 θ−4 1
E[ X 2 ] = ∑ x 2 ⋅ P( X = x ) = 0 2 ⋅ θ + 12 ⋅ 2θ + 2 2 ⋅ θ
+ 32 ⋅
2θ
=
x=0
5 8θ − 32 9 8θ − 18 4θ − 9
= + + = =
2θ 2θ 2θ 2θ θ
Así:
4θ − 9
冢
2θ − 4
冣 4θ − 9 4θ 2 + 16 − 16θ
2
Var [ X ] = − = − =
θ θ θ θ2
4θ 2 − 9θ − 4θ 2 − 16 + 16θ 7θ − 16
= =
θ2 θ2
7q – 16 > 0
5 θ − 4 5 + 2θ − 8
d) P(0,5 X < 3) = P( X = 1) + P( X = 2) = + = =
2θ θ 2θ
2θ − 3 3
= = 1−
2θ 2θ
© Ediciones Pirámide 59
Ejercicios de inferencia estadística y muestreo
α1 = a1
y en nuestro caso:
2θ − 4 ⎫
α1 = E[ X ] =
θ ⎪⎪
1 n ⎬
a1 = ∑ Xi = X ⎪
n i =1 ⎪⎭
Con lo cual:
2θ − 4
X =
θ
θX = 2θ − 4
4 = θ (2 − X )
4
θˆ =
2−X
1 0 ⋅ 8 + 1 ⋅ 5 + 2 ⋅ 3 + 3 ⋅ 4 23
x= ∑
n xi
xi ni =
20
=
20
entonces:
4 4 ⋅ 20 80
θˆ = = = = 4,706
23 40 − 23 17
2−
20
60 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
20
L( x1 ,..., x20 ; θ ) = P( x1 ,..., x20 ; θ ) = ∏ P( xi ; θ ) =
i =1
冢 冣冢 冣冢 θ−4
冣冢 冣 3.125 ⋅ (θ − 4)3
1 8 5 5 3 1 4
= =
θ 2θ θ 2θ 515 ⋅ θ 20
Debemos hallar el valor que hace máxima esta función o, lo que es equivalente, el
valor que maximiza su logaritmo neperiano:
⎡ 3.125 ⎤
ln L( x1 ,..., x20 ; θ ) = ln ⎢ + 3 ln (θ − 4) − 20 ln θ
⎣ 512 ⎥⎦
∂ ln L( x1 ,..., x20 ; θ ) 3 20
=0+ −
∂θ (θ − 4) θ
∂ ln L( x1 ,..., x20 ; θ ) 3 20
=0 ⇒ =
∂θ (θ − 4) θ
3θ = 20θ − 80
80 = 17θ
80
θˆ = = 4,706
17
X ~ N ( μ, σ = 10)
© Ediciones Pirámide 61
Ejercicios de inferencia estadística y muestreo
entonces:
X ~ N 冢 μ, σ
冣 冢
≡ N μ,
10
冣
n n
y, por tanto:
X−μ
Z= ~ N (0, 1)
10 / n
0,803 = P( μ − 5 < X < μ + 5) = P 冢 μ10− /5 −nμ < 10X /− μn < μ10+ /5 −nμ 冣 =
= P( − 0,5 n < Z < 0,5 n ) = P( Z < 0,5 n ) − P( Z − 0,5 n ) =
= P( Z < 0,5 n ) − P( Z 0,5 n ) = P( Z < 0,5 n ) − 1 + P( Z < 0,5 n ) =
= 2 P( Z < 0,5 n ) − 1
P( Z 1,29) = 0,9015
0,5 n = 1,29
Con lo cual:
冢 冣 = 6,6564 ⯝ 7
1,29 2
n=
0,5
62 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
—
Por el teorema de Fisher, se sabe que X y S2 son variables aleatorias inde-
Solución
pendientes y, por tanto, la probabilidad conjunta pedida será el producto
de las probabilidades marginales:
P(0 < X < 6; 65,25 < S 2 < 151,75) = P(0 < X < 6) ⋅ P(65,25 < S 2 < 151,75)
X ~ N 冢3; 10
冣
≡ N (3, 2)
25
y así:
X −3
Z= ~ N (0, 1)
2
P(0 < X < 6) = P 冢 0 2− 3 < Z < 6 2− 3冣 = P(− 1,5 < Z < 1,5) =
= P( Z < 1,5) − P( Z − 1,5) =
= 0,9332 − 0,0668 = 0,8664
Para el segundo factor, se puede utilizar un resultado del teorema de Fisher, que
indica que:
(n − 1)S 2 24 S 2
= ~ χ n2 − 1 ≡ χ 242
σ2 100
© Ediciones Pirámide 63
Ejercicios de inferencia estadística y muestreo
y así:
= P( χ 24
2
< 36, 42) − P( χ 24
2
15,66) =
= 0,95 − 0,1 = 0,85
P(0 < X < 6; 65,25 < S 2 < 151,75) = 0,8664 ⋅ 0,85 = 0,73644
Sea X = «Cantidad de sustancia tóxica que aparece durante las dos sema-
Solución
nas siguientes a la fecha de caducidad en un producto de la marca A» y
sea Y una variable que recoge la misma información para un producto de la marca B:
X ~ N ( μ x = 5; σ x = 4)
Y ~ N ( μ y = 6; σ y = 3)
Como estas variables son independientes, si tomamos dos muestras aleatorias simples,
(X1, ..., X15) e (Y1, ..., Y30), la distribución de la diferencia de medias muestrales será:
σ x2 σ y2
X −Y ~ N 冢μ x − μ y ; + 冣
nx ny
64 © Ediciones Pirámide
Distribuciones en el muestreo. Estimación
X −Y ~ N 冢5 − 6; 16 9
+ 冣
≡ N ( − 1; 117
, )
15 30
X − Y +1
Z= ~ N (0, 1)
117
,
= 1 − 0,8023 = 0,1977
En una ciudad existen dos discotecas de gran capacidad que son muy
Ejercicio 1.25
populares. Se sabe que, en la situada en el centro de la ciudad, el 70 %
de los clientes tienen, cuando marchan de la fiesta, un grado de alcohol en sangre mayor
que el permitido por ley para conducir un vehículo. En la que está situada a las afueras
de la ciudad, este porcentaje viene a ser del 60 %. Para tratar de informar y concienciar
a la población, durante un fin de semana, la policía pretende llevar a cabo un simulacro
de control de alcoholemia situándose en las salidas de los dos lugares. Si se decide ele-
gir aleatoriamente a 45 personas en la discoteca del centro y 38 en la otra, calcule la
probabilidad de que la proporción muestral de personas que superan el nivel de alcohol
permitido por ley descienda en más de un 5 % de la zona centro a las afueras.
© Ediciones Pirámide 65
Ejercicios de inferencia estadística y muestreo
Análogamente, se define la variable Y para los clientes de la otra discoteca. Por tanto:
X ~ B(1; px = 0,70)
Y ~ B(1; py = 0,60)
pˆ x − pˆ y ~ N 冢 px − py ; px q x py q y
+ 冣
nx ny
pˆ x − pˆ y ~ N (0,1; 0,105)
pˆ x − pˆ y − 0,1
Z= ~ N (0, 1)
0,105
冢
P( pˆ x − pˆ y > 0,05) = P Z >
0,05 − 0, 1
0,105 冣
= P( Z > − 0,48) = 1 − P( Z − 0,48) =
= 1 − 0,6844 = 0,3156
66 © Ediciones Pirámide
2
Contraste de hipótesis paramétrico
Contraste de hipótesis
paramétrico
X ~ N(m, 10)
Las hipótesis que desea contrastar el departamento de marketing son las siguientes:
H0 : μ = 30
H1: μ = 40
© Ediciones Pirámide 67
Ejercicios de inferencia estadística y muestreo
X ~ N 冢 μ, σ
冣 冢
≡ N μ,
10
冣
≡ N ( μ, 2)
n 25
⎡ ⎤
= P[ X > 35 / X ~ N (30, 2)] = P ⎢ X − 30 > 35 − 30 X ~ N (30, 2)⎥ =
⎣ 2 2 ⎦
= P[ Z > 2,5] = 1 − P[ Z 2,5] = 1 − 0,9938 = 0,0062
–
pues si X ~ N(30, 2), entonces:
X − 30
Z= ~ N (0, 1)
2
68 © Ediciones Pirámide
Contraste de hipótesis paramétrico
N(30, 2) N(40, 2)
= 0,0062 = 0,0062
= 30 35 = 40
Se acepta H0 Se rechaza H0
⎧ P[ X > 35 /μ = 30]
Pc ( μ ) = P[ rechazar H0 /μ ] = P[ X > 35 /μ ] = ⎨
⎩ P[ X > 35 /μ = 40]
Por tanto:
⎧α si μ = 30 ⎧0,0062 si μ = 30
Pc ( μ ) = ⎨ =⎨
⎩1 − β si μ = 40 ⎩0,9938 si μ = 40
Pc( )
1
0,9938
1–
0,0062
α
μ
30 40
H0 : μ = 30
H1: μ = 40
© Ediciones Pirámide 69
Ejercicios de inferencia estadística y muestreo
con un nivel de significación a = 0,01, debemos encontrar un valor, x–c, tal que:
Si X xc , aceptamos μ = 30 (aceptamos H0 )
Si X > xc , aceptamos μ = 40 (rechazamos H0 )
–
Si m = 30, entonces la distribución de X será:
X ~ N (30, 2)
y, por tanto:
X − 30
Z= ~ N (0, 1)
2
Entonces:
⎡ X − 30 xc − 30 ⎤ ⎡ x − 30 ⎤
0,01 = P[ X > xc /μ = 30] = P ⎢ > μ = 30 ⎥ = P ⎢ Z > c =
⎣ 2 2 ⎦ ⎣ 2 ⎥⎦
⎡ x − 30 ⎤
P⎢Z c = 0,99
⎣ 2 ⎥⎦
xc − 30
= 2,33
2
xc = 30 + 2 ⋅ 2,33 = 34,66
70 © Ediciones Pirámide
Contraste de hipótesis paramétrico
⎡ X − 40 34,66 − 40 ⎤
= P[ X 34,66 /μ = 40] = P ⎢ μ = 40 ⎥ =
⎣ 2 2 ⎦
= P[ Z − 2,67] = 0,0038
X − 40
Z= ~ N (0, 1)
2
N(30, 2) N(40, 2)
= 0,0038 = 0,01
x–
= 30 34,66 = 40
Aceptamos H0 Rechazamos H0
© Ediciones Pirámide 71
Ejercicios de inferencia estadística y muestreo
Sea una variable aleatoria que toma el valor 1 cuando un juicio defendido
Solución
por Lader ha sido ganado, y el valor 0 en caso contrario. Por tanto, se trata
de una variable con distribución B(1, p). Las hipótesis que se desea contrastar son:
H0 : p = 0, 40
H1: p = 0,50
Para decidir entre ellas, se elige una muestra aleatoria simple X1, ..., Xn de esta po-
blación y se toma la siguiente regla de decisión:
1 n
Si pˆ = ∑ Xi < k ⇒ se acepta H0 : p = 0,40
n i =1
1 n
Si pˆ = ∑ Xi k ⇒ se rechaza H0 y se acepta H1: p = 0,50
n i =1
teniendo en cuenta que tanto H0 como H1 son simples (W 0 = {0,40}; W1 = {0,50}) y que
la distribución de la proporción muestral se puede aproximar por la distribución:
冢
N p,
pq
n 冣
se tiene que:
冢 冢
0,05 = α = P( pˆ k / p = 0, 40) = P pˆ k / pˆ ~ N 0, 40;
0,24
n 冣冣 =
=P Z冢 k − 0, 40
0,24 / n 冣
= P( Z zα )
冢 冢
0,15 = β = P( pˆ < k / p = 0,50) = P pˆ < k / pˆ ~ N 0,50;
0,25
n 冣冣 =
=P Z<冢 k − 0,50
0,25 / n 冣
= P( Z < − zβ )
72 © Ediciones Pirámide
Contraste de hipótesis paramétrico
Utilizando las tablas de una N(0, 1) para buscar los valores za y – zb, tales que:
P( Z zα ) = α = 0,05
P( Z < − zβ ) = β = 0,15
se obtienen:
zα = 1,645
− zβ = − 1,03
k − 0,40 0,24
= 1,645 ⇒ k = 0,40 + 1,645
0,24 n
n
k − 0,50 0,25
= − 1,03 ⇒ k = 0,50 − 1,03
0,25 n
n
0,25
k = 0,50 − 1,03 = 0, 46
175
© Ediciones Pirámide 73
Ejercicios de inferencia estadística y muestreo
X ~ ᏼ(λ )
donde se tiene que E[X] = l.
a) El informe de la torre de control afirma que E[X] = l = 55. Con los resultados
de una muestra aleatoria simple X1, ..., X150 se pretende contrastar esta afirmación, por lo
que el contraste que se debe realizar será:
H0 : λ = 55 = λ0
H1: λ ≠ 55
r
C = {( X1 ,..., Xn ) ∈ ⺢ n / se rechaza H0} = {( X1 ,..., Xn ) ∈ ⺢ n / λ ( x ) < c}
siendo:
r
r máx L( x ; λ )
r L*( x ; λ ) λ ∈Ω 0
λ( x) = 0 r = r
L*( x ; λ ) máx L( x ; λ )
λ ∈Ω
r
con L( x ; λ ) la función de verosimilitud y c un valor constante, tal que:
r
α = P( rechazar H0 / H0 cierta ) = P(λ ( x ) < c /λ ∈ Ω 0 )
74 © Ediciones Pirámide
Contraste de hipótesis paramétrico
L( x ; λ ) = ∏ P( X = xi ; λ ) = ∏ e = n
i = 1 xi !
i =1
∏ ( xi !)
i =1
Ω = {λ ∈ ⺢ / λ > 0}
Ω 0 = {λ0 = 55}
Ω1 = {λ ∈ ⺢ + / λ ≠ 55} = ⺢ + − {55}
entonces:
n
∑ xi
r r r λ0 i =1
0 x ; λ ) = máx L( x ; λ ) = L( x ; λ 0 ) = n
L*( e − nλ 0
λ ∈Ω 0
∏ ( xi !)
i =1
y
r r r
L*( x ; λ ) = máx L( x ; λ ) = L( x ; λˆ )
λ ∈Ω
r
冢∑ xi 冣 ln λ − nλ − ln 冤∏ ( xi!)冥
n n
ln L( x ; λ ) =
i =1 i =1
n
r
∂ ln L( x ; λ )
∑ xi
i =1
= −n−0
∂λ λ
n
∑ xi 1 n
i =1
λ
−n= 0 ⇒ λ = ∑ xi = x
n i =1
r
∂ 2 ln L( x ; λ )
冷 冢 ∑ xi 冣 − 0 < 0
n
1
=−
∂λ2 λ=x λ2 i =1
© Ediciones Pirámide 75
Ejercicios de inferencia estadística y muestreo
λ̂ = X
y así:
n
∑ Xi
r r r X i =1
L*( x ; λ ) = máx L( x ; λ ) = L( x ; λˆ ) = n e − nX
λ ∈Ω
∏ ( Xi !)
i =1
r
Sustituyendo L*0 y L* en la expresión del estadístico l(x), tenemos:
n
∑ xi n
e − nλ0 ∏ ( Xi !)
n
r λ0 i =1
∑ Xi
r L*( x ; λ )
冢 λX 冣
i =1
i =1
λ(x) = 0 r = = 0
e n( X − λ0 )
L*( x ; λ )
n
∑ Xi n
X i = 1 e − nX ∏ ( Xi !)
i =1
n
∑ Xi
r
冦 冢 λX 冣 冧
i =1
C = {( X1 ,..., Xn ) ∈ ⺢ n / λ ( x ) < c} = ( X1 ,..., Xn ) ∈ ⺢ n 0
e n( X − λ0 ) < c
76 © Ediciones Pirámide
Contraste de hipótesis paramétrico
Gráficamente:
χ21
1–
– 2 ln c
de donde:
− 2 ln c = χ12;1 − α
con c21; 1 – a el cuantil de orden 1 – a en una c2 con 1 grado de libertad, que podría ob-
tenerse de la tabla 9, cuando a sea una cantidad concreta.
Despejando c en la igualdad anterior:
1
− χ12− α
c= e 2
冦 冤冢 λX 冣 冥 冧
i =1
= ( X1 ,..., Xn ) ∈ ⺢ n / − 2 ln 0
e n( X − λ0 ) > χ12;1 − α
© Ediciones Pirámide 77
Ejercicios de inferencia estadística y muestreo
150
∑ Xi
冦 冤冢 冣
55
冥 冧
i =1
C = ( X1 ,..., X150 ) ∈ ⺢ 150
/ − 2 ln e150 ( X − 55) > χ12;1 − α
X
150
∑ Xi
r
冤冢 冣
55
冥
i =1
«Si − 2 ln λ ( x ) = − 2 ln e150 ( X − 55) > χ12;1 − α , entonces se rechaza H0 »
X
150
∑ xi = 6.000 aterrizajes
i =1
con lo cual:
1 150 6.000
x= ∑
150 i = 1
xi =
150
= 40
Así pues:
r
冤冢 4055 冣 冥
6.000
− 2 ln λ ( x ) = − 2 ln e150 ( 40 − 55) =
冤
= − 2 6.000 ln 冢 4055 冣 + 150(40 − 55)冥 = 678,5552
que será el valor experimental.
La región crítica, para a = 0,10, se obtendrá utilizando la tabla 9, y se representará
como:
78 © Ediciones Pirámide
Contraste de hipótesis paramétrico
χ21
0,90 = 0,10
X ~ N ( μ; 2)
© Ediciones Pirámide 79
Ejercicios de inferencia estadística y muestreo
a) Se eligió una muestra aleatoria de tamaño 25, x1, ..., x25, y la media muestral fue
x– = 0,5. Para construir el intervalo de confianza de esta situación, sustituimos la infor-
mación muestral en:
冤
Iμ = X − zα / 2
σ
n
; X + zα / 2
σ
n 冥
Para niveles de confianza del 90 % y 95 %, los valores za/2 correspondientes serán
tales que:
Al 90 % de confianza
Al 95 % de confianza
冤
Iμ = 0,5 − 1,645
2
25
; 0,5 + 1,645
2
25 冥
= [ − 0,158; 1158
, ]
冤
Iμ = 0,5 − 1,96
2
25
; 0,5 + 1,96
2
25 冥
= [ − 0,284; 1,284]
H0 : μ 0 = μ 0
H1: μ > 0
80 © Ediciones Pirámide
Contraste de hipótesis paramétrico
X − μ0
Z= ~ N (0, 1)
σ/ n H0
x −0 0,5 − 0
zexp = = = 1,25
σ / n 2 / 25
N(0,1)
1–
N(0,1)
1– = 0,95 = 0,05
z = 1,645
© Ediciones Pirámide 81
Ejercicios de inferencia estadística y muestreo
N(0,1)
1– = 0,9 = 0,1
z = 1,28
冤
Iμ = X − zα / 2
σ
n
; X + zα / 2
σ
n 冥
tiene por amplitud:
L = X + zα / 2
σ
n 冢
− X − zα / 2
σ
n
= 2 ⋅ zα / 2冣σ
n
Por tanto, el tamaño muestral necesario para conseguir una amplitud determinada,
L, con un nivel de confianza (1 – a) %, será:
4 ⋅ zα2 / 2 ⋅ σ 2
n=
L2
82 © Ediciones Pirámide
Contraste de hipótesis paramétrico
Si se quiere que la amplitud sea de dos millones de euros con una confianza del
90 %, entonces:
L=2
z0,05 = 1, 645
4 ⋅ 1,6452 ⋅ 2 2
n= = 10,8241 ≈ 11 empresas
22
X ~ N ( μ, 21.200)
a) El Ministerio de Energía sostiene que m no es inferior a 100.000 euros, es decir,
que m 100.000. Para contrastar esta afirmación, planteamos las hipótesis del contraste
como:
H0 : μ 100.000
H1: μ < 100.000
© Ediciones Pirámide 83
Ejercicios de inferencia estadística y muestreo
X − μ0
Z= ~ N (0, 1)
σ/ n H0
N(0,1)
= 0,02 0,98
– z = – 2,05
P( Z < − zα ) = α = 0,02
zα = 2,05
− zα = − 2,05
x − μ 0 125.600 − 100.000
zexp = = = 12,0755
σ/ n 21.200 / 100
84 © Ediciones Pirámide
Contraste de hipótesis paramétrico
es decir:
X ~ N 冢 μ, 21.200 冣
n
X ~ N 冢75.000; 21.200 冣
n
y tipificando:
X − 75.000
Z= ~ N (0, 1)
21.200 / n
Por tanto:
冢
0,995 = P X < μ 0 − 2,05 ⋅
σ
n
μ1 = 75.000 = 冣
冢
= P X < 100.000 − 2,05 ⋅
21.200
n
X ~ N 冢75.000; 21.200 冣冣 =
n
冢 冣
21.200
100.000 − 2,05 ⋅ − 75.000
n
=P Z<
21.200
n
© Ediciones Pirámide 85
Ejercicios de inferencia estadística y muestreo
P( Z z ) = 0,995 ⇒ z = 2,575
Así pues:
21.200
25.000 − 2,05 ⋅
n
= 2,575
21.200
n
21.200
25.000 = (2,05 + 2,575)
n
( zα + zβ )σ
冤 冥
2
n=
μ1 − μ 0
51 51
∑ xi = 8.640 miles de euros ; ∑ xi2 = 1.517.600 (miles de euros)2
i =1 i =1
86 © Ediciones Pirámide
Contraste de hipótesis paramétrico
X ~ N ( μ, σ )
La campaña publicitaria se lanzará si m < 170, luego las hipótesis a contrastar son:
H0 : μ 170 = μ 0
H1: μ < 170
X − μ0
t= ~ t
H0 n − 1
≡ t51 − 1 ≡ t50
S/ n
t50
= 0,05 1– = 0,95
– t = – 1,676
© Ediciones Pirámide 87
Ejercicios de inferencia estadística y muestreo
pues:
1 n 8.640
x= ∑
n i =1
xi =
51
= 169, 4118 miles de euros
冤∑ xi2 − n 冢∑ xi 冣 冥 =
n n 2
1 1
s2 =
n −1 i =1 i =1
=
1
51 − 1 冤 1
冥
1.517.600 − (8.640)2 = 1.077,6471 (miles de euros)2
51
Vemos que el valor experimental del estadístico es mayor que el valor crítico
(texp = – 0,128 > – t a = – 1,676), por tanto, no se rechaza la hipótesis nula (m 170),
con lo cual no se considerará oportuno o necesario lanzar una nueva campaña publi-
citaria.
b) Para contrastar si la desviación típica de las ventas por establecimiento en el
último año es de 20.000 euros (s = 20), planteamos las hipótesis:
H0 : σ 2 = 20 2 = 400 = σ 02
H1: σ 2 ≠ 400
(n − 1)S 2
χ2 = ~ χ n2 − 1 ≡ χ 512 − 1 ≡ χ 502
σ 02 H0
88 © Ediciones Pirámide
Contraste de hipótesis paramétrico
Los valores críticos y la región crítica para a = 0,05 aparecen en el siguiente gráfico:
χ250
0,95
/2 = 0,025
0,025
P( χ 50
2
χ n2 − 1; α / 2 ) = 0,025 ⇒ χ n2 − 1; α / 2 = 32,357
P( χ 50
2
χ n2 − 1;1 − α / 2 ) = 0,975 ⇒ χ n2 − 1;1 − α / 2 = 71, 42
Según este valor calculado, la muestra es de las que se sitúa en la región crítica del
contraste; entonces rechazamos la hipótesis nula (s2 = 400) y, por tanto, no admitimos
una desviación típica igual a 20.000 euros.
© Ediciones Pirámide 89
Ejercicios de inferencia estadística y muestreo
un importe medio orientativo sujeto a pocos cambios. Compruebe si cada una de las
afirmaciones es cierta a un nivel de significación del 1 %, suponiendo que los importes
de las facturas siguen una distribución normal.
X ~ N ( μ, σ )
H0 : μ 4.000 = μ 0
H1: μ > 4.000
X − μ0
t= ~ t
H0 n − 1
≡ t20 − 1 ≡ t19
S/ n
x − μ 0 4.225 − 4.000
texp = = = 25,9586
s/ n 38,7629 / 20
pues:
1 n 1
x= ∑
n i =1
xi =
20
8.450 = 4.225 euros
s 2 = 15.025,625 (euros)2
s= s 2 = 38,7629 euros
90 © Ediciones Pirámide
Contraste de hipótesis paramétrico
t19
1– = 0,99 = 0,01
t = 2,539
H0 : σ 2 (100)2 = 10.000 = σ 02
H1: σ 2 < (100)2 = 10.000
(n − 1)S 2
χ2 = ~ χ n2 − 1 ≡ χ 202 − 1 ≡ χ192
σ 02 H0
© Ediciones Pirámide 91
Ejercicios de inferencia estadística y muestreo
El valor crítico que determina la región crítica se obtiene utilizando la tabla 9, te-
niendo en cuenta que:
P( χ19
2
χ n2 − 1; α ) = α = 0,01
por lo que:
χ19
2
; 0 , 01 = 7,633
Gráficamente:
χ219
0,99
= 0,01
χ exp
2
χ19
2
; 0 , 01 = 7,633
χ exp
2
= 2,8549 < 7,633 = χ19
2
; 0 , 01
92 © Ediciones Pirámide
Contraste de hipótesis paramétrico
H0 : p 0,03 = p0
H1: p > 0,03
pˆ − p0 ~
Z= N (0, 1)
p0 (1 − p0 ) H0
n→∞
n
pues el tamaño muestral, n = 300, puede considerarse suficientemente grande para que
la aproximación a la distribución asintótica sea aceptable.
Como el nivel de significación es del 1 %, obtendremos, en la tabla 7, el siguiente
valor crítico y la correspondiente región crítica:
N(0,1)
1– = 0,99 = 0,01
z = 2,33
© Ediciones Pirámide 93
Ejercicios de inferencia estadística y muestreo
1 n 17
pˆ = ∑
n i =1
xi =
300
17
− 0,03
300
zexp = = 2,7076
0,03 ⋅ (1 − 0,03)
300
Por tanto, al ser zexp = 2,7076 > 2,33 = za, se rechaza la hipótesis nula (p 0,03) y,
según los resultados de la muestra y con un nivel de significación del 1 %, debería revi-
sarse el sistema de producción.
¿Se podría admitir, con un 5 % de significación, que ambos niveles de audiencia son
iguales?
X ~ N ( μ x ; 0,1)
Y ~ N ( μ y ; 0,21)
94 © Ediciones Pirámide
Contraste de hipótesis paramétrico
Las hipótesis que deben plantearse para contrastar la igualdad de audiencias son:
H0 : μ x − μ y = 0
H1: μ x − μ y ≠ 0
X − Y − d0
Z= ~ N (0, 1)
σ x2 σ y2
H0
+
nx ny
N(0,1)
–z /2 = – 1,96 z /2 = 1,96
x − y − d0 2,345 − 2,249
zexp = = = 11674
,
σ x2 σ y2 0,12 0,212
+ +
nx ny 8 8
pues:
nx
1 1
x=
nx
∑ xi = 8 18,76 = 2,345
i =1
ny
1 1
y=
ny
∑ yi = 8 17,99 = 2,249
i =1
© Ediciones Pirámide 95
Ejercicios de inferencia estadística y muestreo
Como zexp = 1,1674 está comprendida entre los valores críticos – 1,96 y 1,96, el valor
experimental se sitúa en la región de aceptación; por tanto, puede decirse que no hay
evidencia, al 5 % de significación, para rechazar la hipótesis de igualdad de medias y
entonces admitimos que los niveles de audiencia son similares.
Para realizar un estudio sobre los salarios mensuales pagados por una
Ejercicio 2.10
entidad financiera española a sus empleados, se selecciona aleatoria-
mente una muestra de hombres y otra de mujeres. De dichas muestras se obtienen los
siguientes resultados a partir de los salarios expresados en euros:
10 10 10 10
Se supone que los salarios mensuales siguen una distribución normal en ambas po-
blaciones de hombres y mujeres y que son independientes:
a) ¿Se podría afirmar, con un 5 % de significación, que el salario medio de los
hombres que trabajan en la entidad es de 1.400 euros?
b) Obtenga un intervalo de confianza al 95 % para el cociente de varianzas pobla-
cionales de los salarios de hombres y mujeres.
c) ¿Podemos admitir que el salario pagado por la entidad a los hombres es superior
al de las mujeres con un 5 % de significación?
X ~ N(μx , σ x )
Y ~ N(μy , σ y )
H0 : μ x = 1.400
H1: μ x ≠ 1.400
96 © Ediciones Pirámide
Contraste de hipótesis paramétrico
X − μx0
t= ~ t
H0 n x − 1
≡ t10 − 1 ≡ t9
Sx / n x
t9
–t /2 = – 2,262 t /2 = 2,262
nx
1 1
x=
nx
∑ xi = 10 17.100 = 1.710 euros
i =1
= 47.666,6667 (euros)2
sx = s x2 = 218,33 euros
x − μ x 0 1.710 − 1.400
texp = = = 4,490
s x / nx 218,33 / 10
© Ediciones Pirámide 97
Ejercicios de inferencia estadística y muestreo
Como texp > t a/2 = 2,262, el valor experimental se sitúa en la región crítica del con-
traste; por tanto, al 5 % de significación, los datos muestrales presentan evidencia sufi-
ciente para rechazar la hipótesis nula, con lo cual, no podemos afirmar que el salario
medio de los hombres que trabajan en la entidad sea de 1.400 euros. Hay que observar
que este apartado se podría haber resuelto también obteniendo el correspondiente inter-
valo de confianza.
b) El intervalo correspondiente al cociente de varianzas poblacionales cuando las
medias poblacionales son desconocidas será:
Iσ 2 / σ 2 =
x y 冤 Sx2
2
⋅
1
;
Sx2
2
⋅
1
Sy Fnx − 1, ny − 1;1 − α / 2 Sy Fnx − 1, ny − 1; α / 2 冥
donde Fnx – 1, ny – 1; 1 – a/2 y Fnx – 1, ny – 1; a/2 son los cuantiles que en una F de Snedecor con
nx – 1, ny – 1 grados de libertad verifican que:
P( Fnx − 1, ny − 1 Fnx − 1, ny − 1; α / 2 ) = α / 2
P( Fnx − 1, ny − 1 Fnx − 1, ny − 1;1 − α / 2 ) = 1 − α / 2
/2 = 0,025
/2 = 0,025
98 © Ediciones Pirámide
Contraste de hipótesis paramétrico
Para obtener el cuantil Fnx – 1, ny – 1; a/2 = F9, 9; 0,025, utilizamos la siguiente propiedad de
la distribución F de Snedecor con n1, n2 grados de libertad:
1
Fn1 , n2 ; p =
Fn2 , n1 ;1 − p
1 1
F9, 9; 0,025 = = = 0,2481
F9, 9; 0,975 4,03
Gráficamente:
Ᏺ9,9
1– = 0,95
/2 = 0,025
/2 = 0,025
Calculamos ahora sy2, pues del apartado anterior tenemos sx2 = 47.666,6667:
= 20.555,5556
© Ediciones Pirámide 99
Ejercicios de inferencia estadística y muestreo
Iσ 2 / σ 2 =
x y 冤 s x2
2
⋅
1
;
s x2
2
⋅
1
sy Fnx − 1, ny − 1;1 − α / 2 sy Fnx − 1, ny − 1; α / 2 冥
=
= [0,5754; 9,3467]
c) Hay que someter a contrastación la hipótesis mx > my, es decir, que el salario
medio de los hombres es superior al de las mujeres. Por tanto, las hipótesis se plantearán
como:
H0 : μ x − μ y 0
H1: μ x − μ y > 0
X − Y − d0
t= ~ t
H0 n x + n y − 2
≡ t10 + 10 − 2 ≡ t18
(nx − 1)Sx2 + (ny − 1)Sy2 1 1
+
nx + ny − 2 nx ny
t18
1– = 0,95 = 0,05
t = 1,734
como:
X ~ N(μx , σ x )
Y ~ N(μy , σ y )
con X e Y independientes y sx = sy = s.
a) Se pretende contrastar según la información muestral si mx > my. Por tanto, plan-
teamos las hipótesis:
H0 : μ x − μ y 0
H1: μ x − μ y > 0 (ingresos superiores con nuevos métodos)
X − Y − d0
t= ~ t
H0 n x + n y − 2
≡ t6 + 9 − 2 ≡ t13
(nx − 1)Sx2 + (ny − 1)Sy2 1 1
+
nx + ny − 2 nx ny
nx = 6 ; x = 9,972 ; s x2 = 7,740
ny = 9 ; y = 6,098 ; s x2 = 10,834
9,972 − 6,098 − 0
texp = = 2,3669
(6 − 1)7,740 + (9 − 1)10,834 1 1
+
6+9−2 6 9
t13
1– = 0,90 = 0,10
t = 1,350
rechazándose H0 si:
P(t13 > tα / 2 ) = α / 2
tα / 2 = 1,771
Sustituyendo en el intervalo:
冤
Iμ x − μ y = (9,972 − 6,098) − 1,771
5 ⋅ 7,740 + 8 ⋅ 10,834
6+9−2
6+9
6⋅9
;
1 3,2 3,1
2 3,3 3,5
3 3,4 3,6
4 2,1 3
5 4,1 4,2
6 3,1 3,3
7 2,9 2,5
8 4,2 4
9 3,5 3,6
10 2,8 2,9
X ~ N(μx , σ x )
Y ~ N(μy , σ y )
Di = Xi − Yi
Profesor 1 2 3 4 5 6 7 8 9 10
di 0,1 – 0,2 – 0,2 – 0,9 – 0,1 – 0,2 0,4 0,2 – 0,1 – 0,1
H0 : μ x − μ y 0
H1: μ x − μ y < 0 (los resultados mejoran)
D − d0
t= ~ t
H0 n − 1
≡ t9
Sd / n
con
1 n
D= ∑ Di
n i =1
1 n
Sd2 = ∑
n − 1 i =1
( Di − D )2
t9
= 0,025 1– = 0,975
– t = – 2,262
Para calcular el valor del estadístico de prueba obtenemos primero la media y la des-
viación típica de las diferencias di:
1 n 1
d = ∑
n i =1
di =
10
( − 11
, ) = − 0,11
1 n
冤 冢∑ di 冣 冥 = 9 冤117 ( − 11
冥
n n
1 1 2 1 , )2
sd2 = ∑
n − 1 i =1
( di − d )2 =
n −1
∑ di2 − n
, −
10
= 0,1166
i =1 i =1
sd = + sd2 = 0,3414
d − d0 − 0,11 − 0
texp = = = − 1,0189
sd / n 0,3414 / 10
Como:
Provincia A Provincia B
x̄ = 14 ȳ = 9
sx2 = 25 sy2 = 0,25
X ~ N(μx , σ x )
Y ~ N(μy , σ y )
H0 : μ x − μ y 2
H1: μ x − μ y > 2
X − Y − d0
t= ~ t
H0 v
Sx2 Sy2
+
nx ny
siendo:
⎡ ⎤
⎢
⎢
v=⎢
冢
Sx2 Sy2 2 ⎥
+
nx ny ⎥
⎥ +1
冣
⎢ 冢 冣 冢 冣
⎢ Sx2 2
⎢ nx + ny ⎥
Sy2 2 ⎥
⎥
⎢ nx − 1 ny − 1 ⎥
⎣ ⎦
⎡ 25 0,25 2 ⎤
v=
⎢
⎢
冢 10
+
10 冣 ⎥
⎥ + 1 = [9,18] + 1 = 9 + 1 = 10
⎢ 25 2 0,25 2 ⎥
⎢ 冢 冣 冢 冣
⎢ 10 + 10
⎥
⎥
⎢⎣ 10 − 1 10 − 1 ⎥⎦
Por tanto, el estadístico de prueba seguirá bajo H0 una distribución t de Student con
10 grados de libertad. Utilizando la tabla correspondiente a esta distribución, obtenemos
el valor crítico de la región de rechazo de este contraste. Su representación gráfica es:
t10
1– = 0,99 = 0,01
t = 2,764
x − y − d0 14 − 9 − 2
texp = = = 1,888
Sx2 Sy2 25
+
0,25
+
nx ny 10 10
Como:
Capital de la provincia 6 8 9 5 0 1 4 2 0 1
Resto de la provincia 3 4 2 2 1 0 5 0 1 3
Suponiendo que las cifras de bajas por accidentes laborales pudieran considerarse
normalmente distribuidas:
a) Contraste la afirmación realizada por la asociación utilizando un 5 % de signi-
ficación.
b) ¿Podría afirmarse, al 10 % de significación, que el número medio de bajas por
accidentes laborales en las empresas constructoras que realizan su actividad en
la capital de la provincia es superior a cuatro?
X ~ N(μx , σ x )
Y ~ N(μy , σ y )
H0 : μ x − μ y 5
(1)
H1: μ x − μ y > 5
H0 : σ x2 = σ y2
(2)
H1: σ x2 ≠ σ y2
Sx2
F= ~ Ᏺ n − 1, n − 1 ≡ Ᏺ 10 − 1,10 − 1 ≡ Ᏺ 9, 9
Sy2 H0 x y
Ᏺ9,9
/2 = 0,025
/2 = 0,025
F /2 F1– /2
donde Fa/2 y F1 – a/2 son, respectivamente, los cuantiles de órdenes a/2 y 1 – a/2, que
verifican:
1
Fn1 , n2 ; p =
Fn2 , n1 ;1 − p
1 1 1
Fα / 2 = F0,025 = F9, 9; 0,025 = = = = 0,2481
F9, 9;1 − 0,025 F9, 9; 0,975 4,03
o si:
10 10
Capital de la provincia: ∑ xi = 36 ∑ xi2 = 228
i =1 i =1
10 10
Resto de la provincia: ∑ yi = 21 ∑ yi2 = 69
i =1 i =1
冤∑ xi2 − n 冢∑ xi 冣 冥 = 10 − 1 冤228 − 冥
10 10
1 1 2 1 36 2
s x2 = = 10,9333
nx − 1 i =1 x i =1 10
冤∑ yi2 − n 冢∑ yi 冣 冥 = 10 − 1 冤69 − 冥
10 10
1 1 2 1 212
sy2 = = 2,7666
ny − 1 i =1 y i =1 10
Por tanto, el valor experimental del estadístico del contraste (2) quedaría como:
s x2 10,9333
Fexp = = = 3,95
sy2 2,7666
y, puesto que:
X − Y − d0
t= ~ t
H0 n x + n y − 2
≡ t18
(nx − 1)Sx2 + (ny − 1)Sy2 1 1
+
nx + ny − 2 nx ny
t18
0,95 = 0,05
t = 1,734
nx
1 1
x=
nx
∑ xi = 10 ⋅ 36 = 3,6
i =1
ny
1 1
y=
ny
∑ yi = 10 ⋅ 21 = 2,1
i =1
3,6 − 2,1 − 5
texp = = − 2,9903
9 ⋅ 10,9333 + 9 ⋅ 2,7666 1 1
+
10 + 10 − 2 10 10
112 © Ediciones Pirámide
Contraste de hipótesis paramétrico
y como:
H0 : μ x 4
H1: μ x > 4
X − μ0
t= ~ t
H0 n − 1
≡ t10 − 1 ≡ t9
S/ n
t9
1– = 0,90 = 0,10
t = 1,383
3,6 − 4
texp = = − 0,3825
10,9333 / 10
que verifica:
texp < tα
Grupo 1 (etiquetadoras antiguas) 305 312 300 248 290 264 272 301 275
Grupo 2 (etiquetadoras nuevas) 303 301 310 303 309 296 315 282 272
Suponiendo que el número de etiquetas colocadas cada cinco minutos sigue una dis-
tribución normal, y utilizando un nivel de significación del 5 %, ¿mejoran las nuevas má-
quinas significativamente la eficiencia de los empleados?
X ~ N(μx , σ x )
Y ~ N(μy , σ y )
H0 : μ x − μ y 0
(1)
H1: μ x − μ y < 0 (μy > μx )
H0 : σ x2 = σ y2
H1: σ x2 ≠ σ y2
Sx2
F= ~ Ᏺ n − 1, n − 1 ≡ Ᏺ 9 − 1, 9 − 1 ≡ Ᏺ 8, 8
Sy2 H0 x y
pues las medias poblacionales, mx y my, son desconocidas. Para un nivel de significación
del 5 %, la región crítica bilateral que se obtiene es:
Ᏺ8,8
1– = 0,95
/2 = 0,025
/2 = 0,025
Fexp > F1 − α / 2 = 4, 43
o si
Estos dos valores críticos han sido obtenidos a partir de la tabla 11 de una Ᏺ8, 8,
teniendo en cuenta que:
0,05
P[Ᏺ 8, 8 F1 − α / 2 ] = 1 − α / 2 = 1 − = 1 − 0,025 = 0,975
2
lo que implica:
F1 − α / 2 = 4, 43 = F0,975
P[Ᏺ 8, 8 Fα / 2 ] = 0,025
y, utilizando que en una F de Snedecor con n1, n2 grados de libertad, se verifica que:
1
Fn1 , n2 ; p =
Fn2 , n1 ;1 − p
1 1
F8, 8; 0,025 = = = 0,226
F8, 8; 0,975 4, 43
冤∑ xi2 − n 冢∑ xi 冣 冥 = 冤 冥
nx nx 2
1 1 1 1
s x2 = 735.879 − (2.567)2 = 464,1944
nx − 1 i =1 x i =1 9 −1 9
冤∑ yi2 − n 冢∑ yi 冣 冥 = 冤 冥
ny ny 2
1 1 1 1
sy2 = 806.149 − (2.691)2 = 192,5
ny − 1 i =1 y i =1 9 −1 9
s x2 464,1944
Fexp = = = 2, 4114
sy2 192,5
y como:
0,226 = Fα / 2 < Fexp = 2, 4114 < F1 − α / 2 = 4, 43
X − Y − d0
t= ~ t
H0 n x + n y − 2
≡ t9 + 9 − 2 ≡ t16
(nx − 1)Sx2 + (ny − 1)Sy2 1 1
+
nx + ny − 2 nx ny
= 0,05 1– = 0,95
– t = – 1,746
nx
1 2.567
x=
nx
∑ xi = 9
= 285,2222 , s x2 = 464,1944
i =1
ny
1 2.691
y=
ny
∑ yi = 9
= 299 , sy2 = 192,5
i =1
285,2222 − 299
texp = = − 1,6129
(9 − 1)464,1944 + (9 − 1)192,5 1 1
+
9+9−2 9 9
luego, como:
no se rechaza la hipótesis nula (mx – my 0). Por tanto, no podemos decir que las nuevas
máquinas etiquetadoras mejoran la eficiencia significativamente.
X ~ B(1, px )
Y ~ B(1, py )
siendo:
px > py + 0,04
Por tanto, para contrastar esta afirmación, debemos plantear las hipótesis:
H0 : px − py 0,04
H1: px − py > 0,04
Como los tamaños muestrales se pueden considerar grandes, utilizaremos como es-
tadístico del contraste:
pˆ x − pˆ y − p0 ~
Z= N (0, 1)
nx + ny H0
nx , ny → ∞
ˆˆ
pq
nx ny
siendo:
nx pˆ x + ny pˆ y
pˆ =
nx + ny
N(0,1)
1– = 0,95 = 0,05
z = 1,645
como:
X ~ B(1, px )
500
∑ xi = 280
i =1
H0 : px 0,5
H1: px > 0,5
pˆ x − p0 pˆ x − 0, 5 ~
Z= = N (0, 1)
p0 (1 − p0 ) 0,5(1 − 0,5) H0
n 500
N(0,1)
0,99 = 0,01
z = 2,33
1 n 280
pˆ x = ∑
n i =1
xi =
500
= 0,56
0,56 − 0, 5
zexp = = 2,6833
0,5(1 − 0,5)
500
y como:
entonces, al 1 % de significación, y con estos datos, existe evidencia suficiente para re-
chazar H0 ; por tanto, no puede afirmarse que el porcentaje de aceptación de los yogures
no superaría el 50 % del nuevo mercado.
b) Para que el test anterior detecte un porcentaje real de compradores del 60 % con
probabilidad 0,9, habría que rechazar la hipótesis nula cuando el verdadero valor de px
fuese igual a 0,6 con la probabilidad anterior:
冢 冣
pˆ x − 0,5
0,9 = P( rechazar H0 / px = 0,6) = P > 2,33 px = 0,6
0,5 ⋅ 0, 5
n
pˆ x =
1 n
∑ Xi
n i =1
~
n→∞ 冢
N px ,
px q x
n 冣
tenemos que, para px = 0,6, la distribución de p̂x es:
~ pˆ x − 0,6 ~
pˆ x n→∞
N (0,6; 0,24 / n ) ⇒ Z = n→∞
N (0, 1)
0,24
n
y así:
冢
=P Z>
0,5 + 2,33 0,25 / n − 0,6
0,24 / n 冣
con
Z ~ N (0, 1)
Utilizando la tabla 7 para buscar un valor z tal que:
se tiene que:
z = – 1,28
con lo cual:
y despejando el valor de n:
1
(2,33 0,25 + 1,28 0,24 ) = 0,6 − 0,5
n
c) Definimos una variable aleatoria similar a la anterior, pero que refleje la infor-
mación sobre la aceptación de los yogures más líquidos en el mercdado actual. Sea:
H0 : p x py
H1: px < py
pˆ x − pˆ y ~
Z= N (0, 1)
nx + ny H0
nx , ny → ∞
ˆˆ
pq
nx ny
con
x+y
冢 冣
nx ny
1
pˆ = =
nx + ny nx + ny
∑ xi + ∑ yi
i =1 i =1
qˆ = 1 − pˆ
N(0,1)
= 0,01 0,99
– z = – 2,33
280
pˆ x = = 0,56
500
230
pˆ y = = 0,77
300
x+y 280 + 230 510
pˆ = = = = 0,6375
nx + ny 500 + 300 800
qˆ = 1 − 0,6375 = 0,3625
0,56 − 0,77
zexp = = − 5,9817
500 + 300
⋅ 0,6375 ⋅ 0,3625
150.000
y al ser:
X ~ B(1, px )
Y ~ B(1, py )
y se quiere probar si los datos presentan evidencia suficiente para afirmar que px > py.
Planteamos el contraste como:
H0 : p x py
H1: px > py
pˆ x − pˆ y ~
Z= N (0, 1)
nx + ny H0
nx , ny → ∞
ˆˆ
pq
nx ny
con
x+y
pˆ = y qˆ = 1 − pˆ
nx + ny
N(0,1)
0,90 = 0,1
z = 1,28
7.228
pˆ x = = 0,308
23.500
6.150
pˆ y = = 0,246
25.000
7.228 + 6.150
pˆ = = 0,276
23.500 + 25.000
Así:
0,308 − 0,246
zexp = = − 15,27
23.500 + 25.000
(0,276) ⋅ (0,724)
23.500 ⋅ 25.000
muestra aleatoria de 16 botes del refresco antiguo, obteniéndose una media de 28 calo-
rías por bote con desviación típica muestral 5.
Suponiendo que la cantidad de calorías por bote sigue una distribución normal en
ambos refrescos, pero con desviaciones típicas diferentes, ¿existe alguna razón para no
creer en la afirmación de la compañía con un nivel de significación del 2,5 %?
X ~ N(μx , σ x )
Y ~ N(μy , σ y )
H0 : μ x − μ y 0
H1: μ x − μ y < 0 (el nuevo producto posee menos calorías que el antiguo)
X − Y − d0
t= ~ t
H0 v
Sx2 Sy2
+
nx ny
con
冢 冣
Sx2 Sy2 2
冢 冣
9 25 2
+ +
nx ny 14 16
v= = = 24,999
冢 冣 冢 冣 冢 冣 冢 冣
Sx2 2 2Sy2 9 2 25 2
nx ny 14 16
+ +
nx − 1 ny − 1 13 15
Tomando como grados de libertad la parte entera de v más una unidad, se tiene que:
texp ~ t
H0 25
t25
= 0,025 1–
–t
texp − 2,06 = − tα
20 − 28 − 0
texp = = − 5,387
9 25
+
14 16
Como texp = – 5,387 < – 2,06 = – t a , entonces se rechaza H0 y, por tanto, con estos
datos y un 2,5 % de significación no existen razones para no creer en la afirmación de
la compañía.
X ~ N(μx , σ x )
Y ~ N(μy , σ y )
H0 : μ x − μ y 3
H1: μ x − μ y > 3
d − d0
t= ~ t n − 1 ≡ t5
sd / n
t5
0,975 0,025
t = 2,571
Calculamos las diferencias di = xi – yi, que representan el peso perdido por cada una
de las personas:
1 n 60,36
d = ∑
n i =1
di =
6
= 10,06
1 n
sd2 = ∑ (di − d )2 = 32,29
n − 1 i =1
10,06 − 3
texp = = 3,04
32,29 / 6
Por tanto, texp = 3,04 > 2,571 = t a, con lo cual rechazamos H0 al 2,5 % de significa-
ción. Es decir, con los datos de la muestra no puede concluirse que el peso medio perdi-
do no supera los tres kilogramos, pues se está aceptando la hipótesis alternativa H1.
Contraste de hipótesis
no paramétrico
Almendra duro 90
Almendra blando 72
Yema tostada 52
Otros 36
Se pretende contrastar si las frecuencias obtenidas con las observaciones de los 250
clientes presentan diferencias significativas con las que cabría esperar si la afirmación de
la asociación fuera cierta; es decir, se trata de un contraste de bondad de ajuste:
k
(ni − Ei )2 k
(ni − npi )2
χ2 = ∑ E = ∑ np ~ χ k2 − h − 1
H0
i =1 i i =1 i
donde
k: Número de categorías de X (después de agrupar si fuera necesario).
h: Número de parámetros estimados con la muestra.
k
n: ∑ ni > 30.
i =1
Ei : npi > 5, ∀ i.
Se observa que todas las Ei son mayores que cinco, por lo que no hay que realizar
agrupaciones. Así, la distribución del estadístico bajo H0 será:
χ 2 H~ χ k2 − h − 1 ≡ χ 42 − 0 − 1 ≡ χ 32
0
χ exp
2
> χ12− α
de donde:
χ12− α = 7,81
χ exp
2
= 0,33 < χ12− α = 7,81
0 15
1 5
2 25
3 40
4 2
5 1
6 o más 2
¿Indican estos datos que se trata de una distribución de Poisson con media tres clien-
tes por hora? Nivel de significación: 1 %.
Sea X = «Número de clientes por hora que acuden a este cajero». Se trata
Solución
de contrastar:
H0 : X~ ᏼ(3)
/ ᏼ(3)
H1: X ~
k
(ni − npi )2
χ2 = ∑ np ~ χ k2 − h − 1
H0
i =1 i
Número Número
de clientes de horas pi H= P(X = xi) Ei = npi (ni – npi)2 (ni – npi)2/npi
0
xi ni
0
冥 冥 冥
15 0,0498 4,482
1 20 17,928 (20 – 17,928)2 0,2395
1 5 0,1494 13,446
2 25 0,2240 20,160 (25 – 20,160) 2
1,1620
3 40 0,2240 20,160 (40 – 20,160)2 19,5251
4 2 0,1680 15,120 (2 – 15,120)2 11,3846
5 1 0,1008 9,072 (1 – 9,072)2 7,1822
6 2 0,0839 7,551 (2 – 7,551)2 4,0807
n = 90 43,5741
χ 2 H~ χ k2 − h − 1 ≡ χ 62 − 0 − 1 ≡ χ 52
0
χ25
0,99
= 0,01
χ21– = 15,09
y como el valor experimental, c2exp = 43,5741, es superior al valor crítico, c21 – a = 15,09,
entonces, al 1 % de significación, los datos de la muestra presentan evidencia suficiente
para rechazar H0, con lo cual no se admite que el número de clientes por hora siga una
distribución de Poisson con media 3.
Cuantía de la beca
Número de becas
(euros por semana)
[40, 50] 9
(50, 60] 24
(60, 65] 28
(65, 70] 35
(70, 75] 30
(75, 80] 21
(80, 100] 3
H0 : X~ N ( μ, σ )
/ N ( μ, σ )
H1: X ~
Puesto que los datos están agrupados por intervalos, este contraste puede realizarse
utilizando el test c2 de Pearson de bondad de ajuste; para ello, necesitamos estimar los
parámetros poblacionales, m y s, mediante sus estimadores de máxima verosimilitud:
1 k
μˆ = X = ∑ Xi ni
n i =1
1 k
σˆ 2 = S ′ 2 = ∑ ( Xi − X )2 ni
n i =1
1 k 9.910
x= ∑
n i =1
xi ni =
150
= 66,07
1 k 1 k
冢 冣 = 87,11
1 9.910 2
s′2 = ∑
n i =1
( xi − x )2 ni = ∑ xi2 ni − x 2 =
n i =1 150
⋅ 667.787,5 −
150
s′ = 87,11 = 9,33
H0 : X ~ N (66,07; 9,33)
/ N (66,07; 9,33)
H1: X ~
donde:
Ei : npi > 5, ∀ i = 1, ..., 7.
n: n1 + L + nk = 150 > 30.
pi: Probabilidad de cada intervalo bajo H0 cierta.
k: Número de intervalos o categorías de X después de agrupar si fuera preciso.
h: Número de parámetros estimados con la misma muestra que utilizamos para rea-
lizar el contraste. En este caso, h = 2, pues se han estimado los parámetros m y s.
Para calcular las frecuencias esperadas necesitamos las probabilidades teóricas obte-
nidas, suponiendo que H0 fuera cierta:
pi H= P( Li < X Li + 1 ) , i = 1,..., 7
0
X − 66,07
Z= ~ N (0, 1)
H0
9,33
p2 = P(50 < X 60) = P 冢 50 −9,3366,07 < Z 60 −9,3366,07 冣 = P(− 1,72 < Z − 0,65) =
= P( Z − 0,65) − P( Z − 1,72) H= 0,2578 − 0,0427 = 0,2151
0
Como todos los valores Ei son mayores que cinco, no se han realizado agrupaciones
de los intervalos. Por tanto, k = 7, y la distribución del estadístico de prueba, si la hipó-
tesis nula es cierta, será:
χ 2 H~ χ k2 − h − 1 ≡ χ 72 − 2 − 1 ≡ χ 42
0
χ exp
2
> χ12− α
utilizando la tabla 9:
χ12− α = 13,28
Como:
χ exp
2
= 12,5316 < χ12− α = 13,28
Número de Número
suscripciones de días
0 4
1 15
2 30
3 43
4 31
5 18
6 5
7 3
8 1
H0 : X~ B(n, p)
/ B(n, p)
H1: X ~
donde n = 8 (pues cada día visita ocho hogares) y p es el parámetro que representa la
probabilidad de conseguir una suscripción, cuyo estimador de máxima verosimilitud es:
X X
p̂ = =
n 8
Como:
1 r 477
x= ∑
150 i = 1
xi ni =
150
= 3,18
entonces:
477
150 3,18
pˆ = = = 0,3975 ≈ 0, 40
8 8
H0 : X~ B(8; 0,40)
/ B(8; 0,40)
H1: X ~
k
(ni − npi )2
χ2 = ∑ np ~ χ k2 − h − 1
H0
i =1 i
Para calcular su valor experimental obtenemos las probabilidades teóricas, pi, bajo la
hipótesis nula, es decir, en la tabla de probabilidades de una B(8; 0,40), y comprobamos
que las frecuencias esperadas, Ei = npi, sean todas superiores a cinco; en caso contrario,
se realizará una agrupación. Los cálculos necesarios aparecen en la tabla siguiente:
Número de Número
suscripciones de días pi = P(X = xi) Ei = npi (ni – npi)2 (ni – npi)2/npi
H0
xi ni
冥 冥 冥
0 4 0,0168 2,520
1 19 15,96 (19 – 15,96)20 0,5790
1 15 0,0896 13,440
2
2 30 0,2090 31,350 (30 – 31,35) 0 0,0581
3 43 0,2787 41,805 (43 – 41,805)2 0,0342
4 31 0,2322 34,830 (31 – 34,83)20 0,4212
5 18 0,1239 18,585 (18 – 18,585)2 0,0184
冥 冥 冥
6 5 0,0413 6,195
7 6 3 9 0,0079 1,185 7,485 (9 – 7,485)20 0,3066
8 1 0,0007 0,105
n = 150 1,4175
χ 2 H~ χ 62 − 1 − 1 ≡ χ 42
0
y la región crítica viene determinada por los valores mayores que c20,90, donde se tiene:
χ exp
2
= 1, 4175 < χ 02,90 = 7,78
no hay motivos suficientes para rechazar la hipótesis nula, por lo que admitimos la dis-
tribución B(8; 0,40) como válida para el número de suscripciones diarias conseguidas
por el agente.
5 25
(5, 10] 42
(10, 20] 30
(20, 30] 15
Más de 30 3
f ( x ) = ae − ax , x>0
F( x ) = 1 − e − ax , x>0
con
1 1
E[ X ] = y Var [ X ] =
a a2
El contraste que se pretende realizar es:
H0 : X ~ Exp (a)
/ Exp (a)
H1: X ~
n
ln L( x1 ,..., xn ; a) = n ln a − a ∑ xi
i =1
∂ ln L( x1 ,..., xn ; a) n n
= − ∑ xi
∂a a i =1
n
n − a ∑ xi = 0
i =1
n 1
aˆ = n =
x
∑ xi
i =1
Por tanto, calculamos la media muestral para las observaciones obtenidas, teniendo
en cuenta que el tiempo entre llegadas es superior o igual a cero e inferior o igual a 300
minutos (5 horas · 60 = 300).
(Li, Li + 1] ni xi xini
n = 115 1.697,5
1 k 1.697,5
x= ∑
n i =1
xi ni =
115
≈ 14,76
1 1
aˆ = = = 0,07
x 14,76
H0 : X~ Exp (0,07)
/ Exp (0,07)
H1: X ~
k
(ni − Ei )2
χ2 = ∑ Ei
~ χ k2 − h − 1
H0
i =1
donde:
Ei : npi > 5, ∀ i.
n: n1 + L + nk = 115 > 30.
pi: Probabilidades asignadas a los intervalos bajo la hipótesis nula.
h: Número de parámetros estimados con la muestra; en este caso, h = 1.
k: Número de categorías después de agrupar si ocurriera que Ei 5 para algún Ei.
Calculemos las probabilidades teóricas de los intervalos:
≈ 1 − 0,8775 = 0,1225
χ 2 H~ χ k2 − h − 1 ≡ χ 52 − 1 − 1 ≡ χ 32
0
χ23
1– = 0,90
= 0,10
χ21–
χ exp
2
> χ12− α
χ12− α = 6,25
como
χ exp
2
= 24,8236 > χ12− α = 6,25
En una comunidad de vecinos, los gastos de agua caliente y fría son cos-
Ejercicio 3.6
teados hasta el momento con el dinero de la comunidad. En la última
reunión celebrada, algunos vecinos propusieron modificar este sistema, de manera que
la comunidad pagase sólo hasta una determinada cantidad anual de agua caliente por vi-
vienda, debiendo abonar el propietario el gasto por la cantidad restante. Para determinar
cuál debería ser la cantidad máxima anual por vivienda que pagaría la comunidad, se
seleccionaron al azar 15 viviendas, contabilizándose en ellas la cantidad de agua caliente
gastada (en m3) al año. Los resultados obtenidos fueron:
78 73 132 66 102
96 82 67 79 75
85 68 85 92 68
Para realizar este contraste a partir de la información de X1, ..., X15, calculamos, en
primer lugar, la media y la varianza muestral:
1 n 1.248
x= ∑
n i =1
xi =
15
= 83,2
⎡ 2⎤
冢∑ x 冣 ⎥⎥
n
⎢ i
冤 冥
n
1 1 ⎢n 2 i =1 1 (1.248)2
s =
2
∑ ( xi − x ) = n − 1 ⎢ ∑ xi −
n − 1 i =1
2
n
=
⎥ 14 108. 054 −
15
=
⎣i = 1 ⎦
= 301, 4571
s= s2 = 301, 4571 = 17,3625
xi − x xi − 83,2
zi = = , i = 1,..., 15
s 17,3625
Dα′ = 0,257
Para calcular el valor experimental del estadístico de prueba, ordenamos las observa-
ciones muestrales de menor a mayor, calculamos F0 (zi), Fn (zi) y obtenemos los valores:
ai = 冟F0 ( zi ) − Fn ( zi )冟
bi = 冟F0 ( zi ) − Fn ( zi − 1 )冟
15
A partir de la tabla:
Dn′, exp = máx{ai , bi} = 0,1935 < 0,257 = Dα′
i
i =1
W= n
∑ ( Xi − X ) 2
i =1
donde:
n − 1 15 − 1
k= = = 7 ( pues n = 15 impar; si n fuera par, el valor de k sería igual a
2 2
n / 2).
ai, i = 1, ..., k son los coeficientes de normalidad de Shapiro-Wilks.
X (i) es el estadístico ordenado de orden i (la observación i-ésima más pequeña).
Con este estadístico, rechazaremos H0 si:
Ŵ < Wα
siendo Wa el valor, tal que:
P[W < Wα / H0 ] = α
Wa = 0,835
X(1) = 66 ; X( 2 ) = 67 ; X( 3) = 68 ; X( 4 ) = 68 ; X( 5) = 73
X( 6 ) = 75 ; X( 7) = 78 ; X(8) = 79 ; X( 9 ) = 82 ; X(10 ) = 85
X(11) = 85 ; X(12 ) = 92 ; X(13) = 96 ; X(14 ) = 102 ; X(15) = 132
59,7310
∑ ( xi − x )2 = ∑ xi2 − nx 2 = 108.054 − 15 ⋅ 冢 冣
n n
1.248 2 (1.248)2
D= = 108.054 − = 4.220, 4
i =1 i =1 15 15
Por tanto:
冤∑ a ( X 冥
k 2
i ( n − i + 1) − X( i ) )
i =1 [59,731]2
Wˆ = n = = 0,8454
4.220, 4
∑ ( xi − x ) 2
i =1
Como:
⎧6 x (1 − x ) si 0 x 1
f ( x) = ⎨
⎩0 en caso contrario
50, 80, 42, 95, 80, 52, 40, 82, 56, 85, 46, 60
¿Existen motivos para sospechar que esta persona está equivocada al suponer la fun-
ción de densidad anterior como modelo de distribución para la proporción de respuestas
acertadas? Nivel de significación: 1 %.
H0 : F( x ) = F0 ( x )
H1: F( x ) ≠ F0 ( x )
⎧0 si x < 0
冮
x
⎪ 2
F0 ( x ) = f (t ) dt = ⎨ x (3 − 2 x ) si 0 x < 1
−∞ ⎪1 si x 1
⎩
Dn = máx 冟F0 ( x ) − Fn ( x )冟
x
con
Para un nivel de significación a = 0,01, la región crítica está determinada por aquellos
valores de Dn que superen a un valor crítico D a, tal que:
P( Dn > Dα / H0 ) = α
D a = 0,449
Dn
D = 0,449
ai = 冟F0 ( xi ) − Fn ( xi )冟
bi = 冟F0 ( xi ) − Fn ( xi − 1 )冟
Puntuación(i )
xi =
100
n = 12
Como:
entonces:
A 300 150 50
B 110 125 90
C 325 350 100
Suponiendo que estos datos pudieran ser considerados como procedentes de una
muestra aleatoria, ¿se podría afirmar que existe alguna relación entre el centro de estu-
dio y el tiempo que un estudiante tarda en terminar su carrera en Economía? Nivel de
significación: 10 %.
H0 : X , Y son independientes
H1: X , Y no son independientes
冢 冣
ni.n. j 2
r s nij −
n
χ2 = ∑∑ ni.n. j
~ χ (2r − 1)( s − 1)
H0
i =1 j =1
n
Para que esta distribución asintótica sea aceptable, el valor de n debe ser grande y
las frecuencias esperadas, Eij = ni. n. j /n, no demasiado pequeñas (n > 30 y Eij > 5). Puesto
que n = 1.600 > 30, calculemos los valores de las Eij de acuerdo al siguiente esquema
dentro de cada casilla:
nij Eij
(nij − Eij )2
Eij
que posee todas las frecuencias esperadas superiores a cinco, por lo que no es preciso
realizar ninguna agrupación, siendo, por tanto, la distribución del estadístico de prueba:
χ2 ~ χ (23 − 1)(3 − 1) ≡ χ 42
H0
χ24
1– = 0,90
= 0,10
χ21– = 7,78
χ exp
2
= 21,524 + 10,513 + 8,333 + 10,344 + 0,030 + 34,904 +
+ 2,702 + 7,380 + 2,272 = 98,002
con
r s
ni.n. j
n= ∑ ∑ nij > 30 y Eij =
n
>5
i =1 j =1
En este caso, n = 1.500 > 30 y calculamos las Eij en la tabla adjunta de acuerdo con
el siguiente esquema para cada una de las celdas:
nij Eij
(nij − Eij )2
Eij
Como se aprecia en la tabla, todas las frecuencias esperadas, Eij, son superiores a
cinco, por lo que no es preciso agrupar. Por tanto, la distribución del estadístico c2 de
Pearson será:
χ2 ~ χ (24 − 1)(3 − 1) ≡ χ 62
H0
χ exp
2
= 6,77 + 9,36 + 2,31 + 22,16 + … + 0,20 = 109,01
χ26
1– = 0,99
= 0,01
χ21– = 16,81
P( χ 62 χ12− α ) = α = 0,01
χ exp
2
= 109,01 > 16,81 = χ12− α
por lo que cabe pensar que el nivel de estudios de los padres influye a la hora de elegir
la actividad extraescolar de sus hijos.
(0, 15] 2 85 14
(15, 30] 3 80 14
(30, 90] 10 75 17
¿Se encuentra apoyada por estos datos la creencia del encargado con una significa-
ción del 1 %?
H0 : X , Y son independientes
H1: X , Y no son independientes
r s
(nij − Eij )2
χ2 = ∑∑ Eij
~ χ (2r − 1)( s − 1)
H0
i =1 j =1
con
r s
ni.n. j
n= ∑ ∑ nij = 300 > 30 y Eij =
n
>5
i =1 j =1
nij Eij
(nij − Eij )2
Eij
Así:
n. j 15 240 45 300
n2.n.1 97 ⋅ 15
E21 = = = 4,85
n 300
Por tanto, habrá que realizar agrupaciones hasta que todas las Eij superen a cinco.
Para tratar de discriminar, por ejemplo, entre los que tienen un tiempo de viaje mode-
rado y los que emplean mucho tiempo, agruparemos la primera y la segunda fila, resul-
tando que la nueva tabla quedará:
n. j 15 240 45 300
n11 = 2 + 3 = 5
E11 = 5,05 + 4,85 = 9,9
χ2 ~ χ (22 − 1)(3 − 1) ≡ χ 22
H0
Con los datos de esta segunda tabla calculamos el valor experimental del estadístico:
χ exp
2
= 2, 43 + 0,275 + 0,10 + 4,71 + 0,53 + 0,19 = 8,235
χ22
0,99 = 0,01
χ21– = 9,21
P( χ 22 χ12− α ) = 1 − α = 0,99
Porcentaje de accidentes
Sector
Menos del 10 % Mayor o igual al 10 %
Construcción 98 27
Siderometalurgia 54 21
r s
(nij − Eij )2
χ = 2
∑∑ Eij
~ χ (2r − 1)( s − 1)
H0
i =1 j =1
donde:
ni m j
Eij = >5
n
n = n1 + n2 = 125 + 75 = 200 > 30
Para calcular las frecuencias teóricas, Eij, y comprobar que efectivamente son superio-
res a cinco, construimos la tabla adjunta, en la que cada celda posee la siguiente estructura:
nij Eij
(nij − Eij )2
Eij
Porcentaje de accidentes
Sector ni
Menos del 10 % Mayor o igual al 10 %
98 95 27 30 125
Construcción
0,09 0,3
54 57 21 18 75
Siderometalurgia
0,16 0,5
mj 152 48 n = 200
n11 = 98
Se observa que todos los valores Eij son superiores a cinco. Por tanto, la distribución
del estadístico de prueba bajo la hipótesis nula será:
y su valor experimental se obtiene como suma de las cantidades centrales de las celdas:
χ exp
2
= 0,09 + 0,3 + 0,16 + 0,5 = 1,05
χ21
0,99 = 0,01
χ21– = 6,63
Edades
Distritos
Menores de 14 14-24 25-34 35-44 45-64 65 o más
冢 冣
ni m j 2
r s nij −
n
χ2 = ∑∑ ni m j
~ χ (2r − 1)( s − 1)
H0
i =1 j =1
n
Para que esta distribución asintótica sea aceptable, el valor de n debe ser grande y
las frecuencias esperadas, Eij = nimj /n, no demasiado pequeñas (n > 30 y Eij > 5). Ahora
bien, n = 1.000 + 1.200 + 900 = 3.100, con lo que se cumple la condición sobre el nú-
mero de individuos. Para calcular las frecuencias esperadas nos ceñiremos al siguiente
esquema:
ni m j
nij Eij =
n
(nij − Eij )2
Eij
Así pues:
Edades
ni
<14 14-24 25-34 35-44 45-64 65
298 277,097 120 117,097 105 91,935 283 269,032 134 169,677 60 75,161 1.000
III
1,577 0,072 1,857 0,725 7,502 3,058
324 332,516 149 140,516 97 110,323 321 322,839 217 203,613 92 90,194 1.200
III
0,218 0,512 1,609 0,010 0,880 0,036
237 249,387 94 105,387 83 82,742 230 242,129 175 152,71 81 67,645 900
III
0,615 1,230 0,0008 0,608 3,254 2,637
1.200 ⋅ 285
E23 = = 110,323
3.100
Como todas las frecuencias esperadas son superiores a cinco, no hay que realizar
ninguna agrupación y, por tanto, la distribución asintótica del estadístico será:
con lo cual la región crítica se puede obtener utilizando la tabla 9 con 10 grados de
libertad:
P( χ10
2
χ12− α ) = α = 0,05 ⇒ χ12− α = 18,31
χ exp
2
= 1,577 + 0,072 + … + 3,254 + 2,637 = 26,4008
y al ser esta cantidad mayor que c21 – a = 18,31, entonces se rechaza H0, es decir, al 5 %
de significación, las observaciones presentan evidencia suficiente para rechazar la hipó-
tesis de homogeneidad de las muestras, existiendo, por tanto, diferencias en cuanto a las
distribuciones por edades de las poblaciones en esos tres distritos.
15,00; 13,50; 17,25; 19,30; 20,00; 12,65; 14,50; 18,40; 21,00; 17,75
Se quiere comparar estos valores con la media de las cotizaciones alcanzadas duran-
te el mes de mayo, que fue de 18,00 euros. Con una significación del 10 %:
a) ¿Podría decirse que es aleatoria la dirección de las desviaciones de estas cotiza-
ciones con respecto a esta media histórica?
b) Contraste si las cotizaciones de estas acciones pueden considerarse normalmente
distribuidas.
III冟SS冟II冟SS冟I
H0 : La muestra es aleatoria
H1: La muestra no es aleatoria
/2 /2
k′ /2 k /2
α
P( R kα′ / 2 ) = 0,05
2
α
P( R kα / 2 ) = 0,05
2
ya que a no debe superar el nivel de significación fijado (10 %). Utilizando la tabla 20 con:
n1 = Número de signos S = 4
n2 = Número de signos I = 6
tenemos que:
P( R 3) = 0,0476 0,05
P( R 4) = 0,1905 > 0,05
3 9
1 n 169,35
x= ∑
n i =1
xi =
10
= 16,935
⎡ 2⎤
冢∑ x 冣 ⎥⎥
n
⎢ i
冤 冥
n
1 1 ⎢n 2 i =1 1 (169,35)2
s =
2
∑ ( xi − x ) = n − 1 ⎢ ∑ xi −
n − 1 i =1
2
n
=
⎥ 9 2. 942,1975 −
10
=
⎣i = 1 ⎦
74,25525
= = 8,250583
9
s= s 2 = 2,8724
xi − x xi − 16,935
zi = =
s 2,8724
N ( z ) Número de observaciones z
Fn ( z ) = =
n n
Dα′ = 0,239
ai = 冟F0 ( zi ) − Fn ( zi )冟
bi = 冟F0 ( zi ) − Fn ( zi − 1 )冟
con X la variable aleatoria que representa las cotizaciones de las acciones y F(x) su
función de distribución, que es desconocida.
El estadístico W de Shapiro-Wilks se obtendrá a partir de la fórmula:
i =1
W= n
∑ ( Xi − X ) 2
i =1
con
n 10
k= = = 5 (pues n es par)
2 2
X (i), el estadístico ordenado de orden i
ai, i = 1, ..., k, los coeficientes del test de Shapiro-Wilks, que se obtienen a partir de
la tabla 16:
Ŵ < Wα
172 © Ediciones Pirámide
Contraste de hipótesis no paramétrico
8,395005
y calculamos el denominador de W:
冢∑ x 冣
n 2
n n i
i =1 (169,35)2
D= ∑ ( xi − x ) 2 = ∑ xi2 − n
= 2.942,1975 −
10
= 74,25525
i =1 i =1
Así pues:
[8,395005]2
Wˆ = = 0,949
74,25525
Como:
Número de turistas
Año
(miles)
1980 28.900
1981 29.450
1982 25.405
1983 30.125
1984 33.361
1985 31.608
1986 32.950
1987 33.104
1988 33.912
1989 32.342
1990 34.085
1991 34.553
1992 39.897
1993 36.724
1994 38.430
1995 39.324
1996 41.295
H0 : La muestra es aleatoria
H1: Los datos muestrales presentan tendencia
k′
P( R kα′ ) α = 0,01
Para determinar este valor crítico y el valor experimental del estadístico de prueba
(R = número total de rachas), transformamos los datos en dicotómicos, asignándoles el
signo correspondiente al valor de las diferencias con respecto a la mediana de la muestra
e ignorando aquellas observaciones cuya diferencia sea nula.
Como en nuestro caso hay 17 observaciones, la mediana será la que ocupe el lugar
noveno ((17 + 1)/2) en la muestra ordenada de menor a mayor:
Por tanto:
Me = 33.361
冟– – – – 0 – – –冟+冟–冟+ + + + + + +冟
Como hay una observación cuya diferencia es cero, ignoramos la observación corres-
pondiente y reducimos en una unidad el tamaño muestral, es decir,
n = 16
Sea:
n1 = «Número de signos +» = 8
n2 = «Número de signos −» = 8
r = «Número de rachas» = 4
P( R 4) = 0,0089 0,01 = α
P( R 5) = 0,0317 > 0,01 = α
kα′ = 4
R̂ 4
R̂ = r = 4
entonces rechazamos H0, al 1 % de significación, con lo cual los datos indican que existe
tendencia en la serie del número de turistas que visitaron España entre 1980 y 1996.
e = 2,71828182845905
H0 : La muestra es aleatoria
H1: La muestra no es aleatoria
que puede resolverse con el test de rachas de Wald-Wolfowitz utilizando como estadís-
tico de prueba:
P( R kα′ / 2 ) α / 2 = 0,05
P( R kα / 2 ) α / 2 = 0,05
011222455788889
冟 – 冟 + 冟 – 冟 + 冟 – 冟 + 冟 – 冟 + 冟 – 冟 + 冟 – 0冟 + 冟 – 0冟
Como hemos obtenido dos diferencias iguales a cero, reducimos el tamaño muestral
en dos unidades, con lo cual, n = 13, n1 = 6 (número de signos +) y n2 = 7 (número de
signos –). Con estas cantidades buscamos los valores críticos en la tabla 20, donde en-
contramos:
P( R 4) = 0,0425 0,05⎫
⎬ ⇒ kα′ / 2 = 4
P( R 5) = 0,1212 > 0,05 ⎭
y, además, como:
entonces:
R
k′ /2 = 4 k /2 = 11
R̂ = 13
Con un nivel de significación del 10 %, ¿indican los datos que la mitad de los clientes
gastaron como mucho 150,00 euros en el supermercado de este centro comercial?
50% 50%
Gasto
Me
Por tanto, se pretende contrastar si este valor poblacional es o no 150 euros. Es decir,
la formulación de las hipótesis será:
H0 : Me = 150 = m
H1: Me ≠ 150
S+ ~ B(n, 1/ 2)
H0
– – + – – + – + –
S+ ~ B(n = 9, 1/ 2)
H0
Ŝ + = 3
/2 /2
k′ /2 k /2
donde k¢a/2 y k a/2 son el mayor y el menor entero, respectivamente, tales que, para un
nivel de significación a = 0,10:
P( S + kα′ / 2 ) α / 2 = 0,05
P( S + kα / 2 ) α / 2 = 0,05
Utilizando la tabla 2 de la función de distribución para una B(9, 1/2), tenemos que:
P( S + 1) = 0,0195 0,05
P( S + 2) = 0,0898 > 0,05
por tanto:
kα′ /2 = 1
Como además:
P( S + 6) = 0,9102
P( S + 7) = 0,9805
entonces:
con lo cual:
kα /2 = 8
Hay que observar que este último valor puede obtenerse también utilizando la sime-
tría de una B(n, 1/2); por tanto:
kα / 2 = n − kα′ / 2 = 9 − 1 = 8
Sˆ + kα′ / 2 = 1 o Sˆ + kα / 2 = 8
H0 : Me = 150,00 = m
H1: Me ≠ 150,00
utilizamos el estadístico:
diferencias, que serán utilizadas para asignar los rangos correspondientes. Así, obtendre-
mos la siguiente tabla:
149,99 – 0,01 – 1
95,38 – 54,62 – 7
154,20 4,20 + 2
123,00 – 27,00 – 4
85,58 – 64,42 – 8
203,42 53,42 + 6
105,00 – 45,00 – 5
164,00 14,00 + 3
82,00 – 68,00 – 9
Para calcular los rangos se han ordenado las diferencias en valor absoluto, 冟 di 冟, y se le
ha asignado rango 1 a la menor de ellas y rango 9 a la mayor. Hay que observar que, en
este caso, no existen valores de 冟 di 冟 repetidos ni iguales a cero. Con los datos de la tabla:
T̂ + = 2 + 6 + 3 = 11
/2 = 0,05 /2 = 0,05
k′ /2 k /2
siendo a = 0,10 el nivel de significación y k¢a/2, k a/2 el mayor y menor entero, respecti-
vamente, tales que:
Para obtener estos valores críticos utilizamos la tabla 21 con n = 9, de forma que:
Telefónica 10,810
BBVA 6,290
BSCH 3,980
Banesto 2,560
Aceralia 3,000
Dragados y Construcciones 4,120
Endesa 3,440
Repsol 6,610
Carrefour 3,000
50% 50%
Cotizaciones
3 Me
H0 : Me 3
H1: Me > 3
Suponemos que los valores de las cotizaciones son continuos en un entorno alrede-
dor de su mediana. El contraste de signos de la mediana se basa en el estadístico:
donde los signos + o – vienen dados en función del signo de las diferencias Di:
+ + + – 0 + + + 0
S+ ~ B(7, 1/ 2)
H0
= 0,10
0 k n=7
Utilizando la tabla 2 para una distribución B(7, 1/2), el valor crítico se obtendrá
teniendo en cuenta que:
y así:
ka = 6
Para poder aplicar este contraste supondremos que la variable X es continua y si-
métrica con respecto a su mediana. El test de rangos-signos de Wilcoxon utiliza como
estadístico de prueba:
donde los valores de Di y los signos que se les asignan se definen de la misma forma
que en el contraste de signos de la mediana. Para obtener los rangos, se ordenan de
menor a mayor los valores absolutos de las diferencias, es decir, los 冟 di 冟, y se asignan
los rangos o números de orden desde 1 hasta n. Si existen valores de 冟 di 冟 repetidos, el
rango correspondiente será el promedio de los que se les asignarían si fueran diferentes.
En nuestro caso:
xi di = xi – 3
10,810 7,810
6,290 3,290
3,980 0,980
2,560 – 0,440
3,000 0,000
4,120 1,120
3,440 0,440
6,610 3,610
3,000 0,000
Como hay dos diferencias nulas, entonces, el tamaño muestral se reduce en dos ob-
servaciones:
n=9–2=7
冟 di 冟 Signo Rango
0,440 – 1,5
0,440 + 1,5
0,980 + 3,0
1,120 + 4,0
3,290 + 5,0
3,610 + 6,0
7,810 + 7,0
Tˆ + = 1,5 + 3 + 4 + 5 + 6 + 7 = 26,5
= 0,10
k T+
donde k a se busca en la tabla 21 de manera que sea el menor entero que verifique:
k a = 23
y como:
Tˆ + = 26,5 > kα = 23
1 155 156
2 227 235
3 175 175
4 135 150
5 167 163
6 450 455
7 148 150
8 182 180
9 155 163
10 165 170
11 254 263
12 129 130
Podemos considerar los datos correspondientes a los 12 inmuebles como una mues-
tra apareada:
Las diferencias entre los valores de tasación oficiales y los realizados por el perito
se definen como:
Di = Xi – Yi , i = 1, ..., 12
Para contrastar la existencia de diferencias entre las tasaciones, planteamos las hipótesis:
H0 : MeD = 0
H1: MeD ≠ 0
S+ ~ B(n, 1/ 2)
H0
⎧> 0 ⇒ Asignamos +
⎪
Di = Xi − Yi − 0 ⎨< 0 ⇒ Asignamos −
⎪= 0 ⇒ Ignoramos el par ( X , Y ) y reducimos el tamaño muestral
⎩ i i
En este caso:
1 –1
2 –8
3 0
4 – 15
5 4
6 –5
7 –2
8 2
9 –8
10 –5
11 –9
12 –1
Como la tasación oficial del tercer inmueble coincide con la del perito de la agencia,
entonces, reducimos el tamaño de la muestra:
n = 12 – 1 = 11
y, por tanto:
S+ ~ B(11, 1/ 2)
H0
/2 /2
k′ /2 k /2
P( S + kα′ / 2 ) α / 2 = 0,05
P( S + kα / 2 ) α / 2 = 0,05
P( S + 2) = 0,0327 0,05 = α / 2
P( S + 3) = 0,1133 > 0,05
por tanto:
kα′ /2 = 2
kα / 2 = n − kα′ / 2 = 11 − 2 = 9
Sˆ + kα′ / 2 = 2
o si:
Sˆ + kα / 2 = 9
Sˆ + = 2 kα′ / 2 = 2
S + − E[ S + ] 2S + − n
Z= = N (0, 1)
Var [ S + ] n H0
n→∞
2 ⋅ 2 − 11
zexp = = − 2,11
11
N(0,1)
/2 = 0,05 /2 = 0,05
–z /2 = – 1,645 z /2 = 1,645
31 26 25 30 34 40 29 24 24 28
31 29 28 25 42 27 36 29 29 34
32 31 32 27 35 31 23 37 28 20
23 34 23 26
Utilizando un 5 % de significación:
a) ¿Debe admitirse en esta serie de edades la aleatoriedad?
b) ¿Señalan los datos que la mitad de las personas que compran este modelo de
coche tienen al menos 30 años?
c) Suponiendo normalidad en las edades de los compradores, ¿puede admitirse que
su edad media supera los 35 años?
Sea la variable aleatoria X = «Edad de una persona que compra este mode-
Solución
lo de coche».
a) Para comprobar si la sucesión de edades es aleatoria, realizamos el siguiente
contraste:
H0 : La muestra es aleatoria
H1: La muestra no es aleatoria
Como las observaciones son cuantitativas, construimos una sucesión dicotómica asig-
nando a cada observación el signo de su desviación con respecto a la mediana muestral,
me, es decir, el signo de:
Di = Xi − me
Como tenemos 34 datos (par), la mediana de esta muestra será el valor medio de
las observaciones que ocupen los lugares 17 y 18 en la sucesión de edades ordenada de
menor o mayor; una vez hecho esto, se obtendrá que el valor mediano es:
29 + 29
me = = 29
2
n = 34 − 4 = 30
n1 = «Número de signos +» = 15 > 10
n2 = «Número de signos −» = 15 > 10
R − E[ R]
Z= N (0, 1)
Var [ R] H0
n→∞
Utilizando este estadístico de prueba, podemos buscar los valores críticos de la re-
gión de rechazo en la tabla 7:
N(0,1)
0,025 /2 = 0,025
– 1,96 = – z /2 z /2 = 1,96
Rˆ = 16
2 n1n2 2 ⋅ 15 ⋅ 15
E[ R] = +1 = + 1 = 16
n 30
2 n1n2 (2 n1n2 − n) 2 ⋅ 15 ⋅ 15(2 ⋅ 15 ⋅ 15 − 30)
Var [ R] = = = 7,241
n 2 (n − 1) 30 2 (30 − 1)
y así:
Rˆ − E[ R] 16 − 16
zexp = = =0
Var [ R] 7,241
Como:
podemos decir que, al 5 % de significación, los datos de esta muestra no presentan evi-
dencia suficiente para rechazar la hipótesis de aleatoriedad (H0), por lo que admitiremos
la aleatoriedad de esta serie de edades.
b) Si llamamos ahora Me a la mediana poblacional, se quiere saber si este valor
coincide con 30:
50%
Me = 30
H0 : Me = 30 = m
H1: Me ≠ 30
S+ ~ B(n, 1/ 2)
H0
Para obtener los signos + y –, se calculan las diferencias de cada observación con
respecto al valor propuesto m:
+––0++––––+–––+–+––++++–++–+–––+––
n = 34 – 1 = 33 > 10
S + − E[ S + ] S+ − n/2 2S + − n
Z= = = N (0, 1)
Var [ S + ] n/ 4 n H0
n→∞
y la región de rechazo bilateral con a = 0,05 se obtiene buscando los valores críticos en
la tabla 7:
N(0,1)
/2 = 0,025 /2 = 0,025
–z /2 = – 1,96 z /2 = 1,96
2 Sˆ + − n 2 ⋅ 14 − 33
zexp = = = − 0,87
n 33
por lo que, con un 5 % de significación, los datos muestrales no presentan evidencia sufi-
ciente para rechazar H0 : Me = 30. Por tanto, los datos no contradicen la hipótesis de que
la mitad de las personas que compran este modelo de coche tienen al menos 30 años.
Para aplicar este contraste, suponemos que la variable aleatoria X es continua y si-
métrica respecto a su mediana. El estadístico de prueba de este contraste es:
donde:
Como sólo hay una observación igual a 30, entonces el tamaño muestral será:
n = 33 = 34 – 1
T + − E[T + ]
Z= N (0, 1)
Var [T + ] H0
n→∞
N(0,1)
/2 = 0,025 /2 = 0,025
– 1,96 = – z /2 z /2 = 1,96
Para calcular el valor experimental del estadístico, obtenemos E[T +], Var [T +] y T̂ +:
n(n + 1) 33 ⋅ 34
E[T + ] = = = 280,5
4 4
n(n + 1)(2 n + 1) 33 ⋅ 34(2 ⋅ 33 + 1)
Var [T + ] = = = 3.132,25
24 24
xi di = xi – 30 xi di = xi – 30 xi di = xi – 30
31 1 28 –2 35 5
26 –4 25 –5 31 1
25 –5 42 12 23 –7
30 0 27 –3 37 7
34 4 36 6 28 –2
40 10 29 –1 20 – 10
29 –1 29 –1 23 –7
24 –6 34 4 34 4
24 –6 32 2 23 –7
28 –2 31 1 26 –4
31 1 32 2
29 –1 27 –3
1+ 2 + 3+…+ 8
= 4,5
8
es decir, asignándoles el rango medio de los rangos que les corresponderían si fueran
diferentes. Del mismo modo, para 冟 di 冟 = 2, el rango asignado se calcula como:
9 + 10 + 11 + 12 + 13
= 11
5
y así sucesivamente.
Con los datos de la segunda tabla, tenemos que:
y, por tanto:
verificándose que:
X ~ N ( μ, σ )
con m y s desconocidos.
Se pretende contrastar si la edad media supera los 35 años, es decir, si m > 35. Por
tanto, se formulan las hipótesis como:
H0 : μ 35 = μ 0
H1: μ > 35
X − μ0
t= ~ tn − 1 ≡ t34 − 1 ≡ t33
H0
S/ n
con
1 n 1.003
x= ∑
n i =1
xi =
34
= 29,5
冢 ∑ xi 冣
n 2
1 n
冤∑ xi2 − 冥 冤 冥
n
1 i =1 1 (1.003)2
s2 = ∑
n − 1 i =1
( xi − x ) 2 =
n −1 n
=
33
30.429 −
34
=
i =1
840,5
= = 25, 47
33
29,5 − 35
texp = = − 6, 45
25, 47 / 35
t33
= 0,05
entonces, el valor de t a deberá ser mayor que 0, y como texp = – 6,45 < 0, se tiene que:
texp = − 6, 45 < tα
I冟AA冟II冟AA冟IIII冟AA冟IIIIIII冟AA冟IIIIIIIII冟AAA冟IIII
H0 : La muestra es aleatoria
H1: La muestra no es aleatoria
P( R kα′ / 2 ) α / 2 = 0,05
P( R kα / 2 ) α / 2 = 0,05
podemos utilizar la aproximación normal (pues, n1 = 11 > 10; n2 = 27 > 10) y emplear
como estadístico de prueba:
R − E[ R]
Z= N (0, 1)
Var [ R] H0
n→∞
N(0,1)
/2 = 0,05 /2 = 0,05
–z /2 z /2
zα / 2 = 1,645
− zα / 2 = − 1,645
y, por tanto:
Rˆ − E[ R] 11 − 16,632
zexp = = = − 2,265 < − zα / 2 = − 1,645
Var [ R] 6,181
con lo cual, rechazamos H0, es decir, al 10 % de significación, los datos de esta muestra
presentan evidencia suficiente para decir que la sucesión del público infantil/adulto en
la primera sesión no es aleatoria.
b) Definimos la variable aleatoria X como la edad de un espectador de esta pelí-
cula. Consideramos las observaciones procedentes de las dos sesiones como si constitu-
yeran una muestra aleatoria de la variable X, que suponemos continua alrededor de su
mediana (P(X = Me) = 0).
50%
Edad
15 Me
Más del 50%
Así pues, las hipótesis que hay que contrastar pueden formularse como:
H0 : Me 15 = m
H1: Me > 15 = m
Los signos + o – son asignados a las observaciones en función del signo resultante
de las diferencias con respecto a m:
– + + – – +0– – – – + + – – – – – – – +0– – – – – – – – – + + + – – – –
+ + – +0+ + + + + + – + + + – + + + + – + – + + + + + +
n = 64
n
+ + S+ −
S − E[ S ] 2 2S + − n
Z= = = N (0, 1)
Var [ S + ] n n H0
n→∞
4
N(0,1)
= 0,10
z = 1,28
donde el valor crítico za ha sido buscado en la tabla 7 de una distribución normal es-
tándar. Como:
Ŝ + = 32
2 Sˆ + − n 2 ⋅ 32 − 64
zexp = = =0
n 64
y al ser:
donde, de nuevo:
para asignar los rangos, se ordenan de menor a mayor los valores 冟 di 冟 y se les asocia su
número de orden. Si se tienen valores absolutos repetidos, entonces se les asignaría un
rango igual al promedio de los rangos que les corresponderían si fueran diferentes. Los
valores di obtenidos son:
xi di = xi – 15 xi di = xi – 15 xi di = xi – 15 xi di = xi – 15 xi di = xi – 15
11 –4 13 –2 14 –1 18 3 14 –1
20 5 12 –3 17 2 19 4 35 20
16 1 10 –5 18 3 16 1 19 4
12 –3 10 –5 16 1 16 1 23 8
10 –5 9 –6 13 –2 14 –1 26 11
25 10 18 3 9 –6 17 2 31 16
15 0 15 0 7 –8 19 4 32 17
13 –2 8 –7 11 –4 32 17
9 –6 11 –4 18 3 13 –2
10 –5 12 –3 18 3 20 5
11 –4 11 –4 12 –3 18 3
34 19 9 –6 25 10 21 6
27 12 9 –6 15 0 24 9
14 –1 11 –4 17 2 13 –2
10 –5 11 –4 19 4 27 12
n = 64
Signo 兩di兩 ri Signo 兩di兩 ri Signo 兩di兩 ri Signo 兩di兩 ri Signo 兩di兩 ri
1+ 2 +…+ 8
= 4,5
8
9 + 10 + … + 16
= 12,5
8
y así sucesivamente.
El valor experimental de T + será:
y como n = 64 > 15, podemos utilizar la aproximación normal y considerar como esta-
dístico de prueba:
T + − E[T + ]
Z= N (0, 1)
Var [T + ] H0
n→∞
donde:
1 64(65)
E[T + ] = n(n + 1) = = 1.040
4 4
n(n + 1)(2 n + 1) 64 ⋅ 65(2 ⋅ 64 + 1)
Var [T + ] = = = 22.360
24 24
N(0,1)
= 0,10
z = 1,28
H 0 : F ( z ) G( z )
H1: F( z ) > G( z )
X1 ~ f(x) X2 ~ g(x)
F(z)
G(z)
z
F(z) > G(z)
Contraste de la U de Wilcoxon-Mann-Whitney
Para aplicar este test se ordenan los datos muestrales de menor a mayor y se asigna a
cada observación su correspondiente rango desde 1 hasta n = n1 + n2. En caso de empates
en varias observaciones, se les asignará a cada una de ellas el rango promedio de los que
les correspondería si hubieran sido diferentes.
Una vez hecho esto, se utilizará como estadístico del contraste la expresión:
n1 (n1 + 1)
U = U X1 = n1n2 + − WX1
2
siendo:
U = U X1
H0
n1 , n2 > 10
N 冢 n 2n ,
1 2 n1n2 (n1 + n2 + 1)
12 冣
o bien, podemos utilizar como estadístico de prueba:
n1n2
U−
2
Z= N (0, 1)
n1n2 (n1 + n2 + 1) H0
n1 , n2 > 10
12
zexp zα
donde:
P( Z zα ) = α = 0,10
N(0,1)
1– = 0,90 = 0,10
z ≅ 1,28
x1 7 1, x1 14 30,5 x1 24 57,0
x1 8 2, x1 14 30,5 x1 25 58,5
x1 9 5, x2 14 30,5 x2 25 58,5
x1 9 5, x2 14 30,5 x2 26 60,0
x1 9 5, x1 15 34,0 x1 27 61,5
x1 9 5, x1 15 34,0 x2 27 61,5
x1 9 5, x2 15 34,0 x2 31 63,0
x1 10 10,0 x1 16 37,5 x2 32 64,5
x1 10 10,0 x1 16 37,5 x2 32 64,5
x1 10 10,0 x2 16 37,5 x1 34 66,0
x1 10 10,0 x2 16 37,5 x2 35 67,0
x1 10 10,0 x1 17 41,0
x1 11 16,0 x2 17 41,0
x1 11 16,0 x2 17 41,0
x1 11 16,0 x1 18 45,5
x1 11 16,0 x1 18 45,5
x1 11 16,0 x2 18 45,5
x1 11 16,0 x2 18 45,5
x1 11 16,0 x2 18 45,5
x1 12 21,5 x2 18 45,5
x1 12 21,5 x2 19 50,5
x1 12 21,5 x2 19 50,5
x2 12 21,5 x2 19 50,5
x1 13 26,0 x2 19 50,5
x1 13 26,0 x1 20 53,5
x1 13 26,0 x2 20 53,5
x2 13 26,0 x2 21 55,0
x2 13 26,0 x2 23 56,0
38(38 + 1)
Uˆ = Uˆ X1 = 38 ⋅ 29 + − 908 = 935
2
38 ⋅ 29
935 −
2
zexp = = 4,8593
38 ⋅ 29(38 + 29 + 1)
12
Contraste de la mediana
V − E[V ]
Z= N (0, 1)
Var [V ] H0
n1 , n2 > 10
siendo:
n1
E[V ] = k
n
n1 n2 n − k
Var [V ] = k ⋅ ⋅
n n n −1
con
n = n1 + n2 = 38 + 29 = 67
n − 1 66
k= = = 33
2 2
pues n es impar.
me = 15
Vˆ = 29
38
E[V ] = 33 ⋅ = 18,7164
67
38 29 67 − 33
Var [V ] = 33 ⋅ ⋅ ⋅ = 4,1733
67 67 67 − 1
29 − 18,7164
zexp = = 5,0339
4,1733
zexp zα
con
P( Z zα / H0 ) = α = 0,10
N(0,1)
0,90 = 0,10
z ≅ 1,28
y como:
rechazamos H0 al 10 % de significación.
con
N1 ( x ) N2 ( x )
Fn1 ( x ) = y Gn2 ( x ) =
n1 n2
n1 + n2
Dn1 , n2 ; α = ⋅ 1,0730 =
n1n2
38 + 29
= ⋅ 1,0730 = 0,2646
38 ⋅ 29
En la siguiente tabla aparecen los cálculos necesarios para obtener el valor experi-
mental del estadístico del contraste.
x1i n1i x2i n2i Fn1(x) = N1(x)/38 Gn2(x) = N2(x)/29 Fn1(x) – Gn2(x)
7 1 1/38 0 0,0263
8 1 2/38 0 0,0526
9 5 7/38 0 0,1842
10 5 12/38 0 0,3158
11 7 19/38 0 0,5000
12 3 12 1 22/38 1/29 0,5445
13 3 13 2 25/38 3/29 0,5544
14 2 14 2 27/38 5/29 0,5381
15 2 15 1 29/38 6/29 0,5563
16 2 16 2 31/38 8/29 0,5399
17 1 17 2 32/38 10/29 0,4973
18 2 18 4 34/38 14/29 0,4120
19 4 34/38 18/29 0,2740
20 1 20 1 35/38 19/29 0,2659
21 1 35/38 20/29 0,2314
23 1 35/38 21/29 0,1969
24 1 35/38 22/29 0,1624
25 1 25 1 36/38 23/29 0,1543
26 1 36/38 24/29 0,1198
27 1 27 1 37/38 25/29 0,1116
31 1 37/38 26/29 0,0771
32 2 37/38 28/29 0,0082
34 1 38/38 = 1 28/29 0,0345
35 1 1 29/29 = 1 0,0000
n1 = 38 n2 = 29
Así:
cadas por cada una de ellas a los trabajos del hogar. Las respuestas obtenidas aparecen
en la tabla siguiente:
1992 1996
22 16
17 20
26 15
13 19
16 13
25 12
18 17
21 10
19 13
14 17
20 11
23 26
15
fy fx
⇒F<G
H 0 : F ( z ) G( z )
H1: F( z ) < G( z )
o bien:
H0 : Mex Mey
H1: Mex > Mey
Contraste de la mediana
V N ( E[V ], Var [V ])
H0
n1 , n2 > 10
con
n1
E[V ] = k
n
n1 n2 n − k
Var [V ] = k ⋅ ⋅ ⋅
n n n −1
siendo:
n = n1 + n2 = 13 + 12 = 25
n − 1 25 − 1
k= = = 12
2 2
pues n es impar.
V − E[V ]
Z= → N (0, 1)
Var [V ]
zexp − zα
con
P( Z − zα ) = α = 0,01
N(0,1)
= 0,05
– z = – 2,33
y y y x y y x x y x y x y y x x y x y x x x x x y
10 11 12 13 13 13 14 15 15 16 16 17 17 17 18 19 19 20 20 21 22 23 25 26 26
n +1
= 13
2
es decir:
me = 17
Vˆ = 5
13
E[V ] = 12 ⋅ = 6,24
25
13 12 25 − 12
Var [V ] = 12 ⋅ ⋅ ⋅ = 1,6224
25 25 25 − 1
5 − 6,24
zexp = = − 0,9735
1,6224
y como:
Contraste de la U de Wilcoxon-Mann-Whitney
Utilizaremos como estadístico de prueba para realizar el contraste:
n1 (n1 + 1)
U = U X = n1n2 + − WX
2
siendo:
WX = ∑ ri = Suma de rangos de las observaciones de X
xi
U N ( E[V ], Var [U ])
H0
n1 , n2 > 10
con
n1n2 13 ⋅ 12
E[U ] = = = 78
2 2
U − E[U ]
Z= N (0, 1)
Var [U ] H0
n1 , n2 > 10
zexp − zα = − 2,33
Obs. ri
y 10 1,0
y 11 2,0
y 12 3,0
x 13 5,0
y 13 5,0
y 13 5,0
x 14 7,0
x 15 8,5
y 15 8,5
x 16 10,5
y 16 10,5
x 17 13,0
y 17 13,0
y 17 13,0
x 18 15,0
x 19 16,5
y 19 16,5
x 20 18,5
y 20 18,5
x 21 20,0
x 22 21,0
x 23 22,0
x 25 23,0
x 26 24,5
y 26 24,5
n (n + 1) 13 ⋅ 14
Uˆ = Uˆ X = n1n2 + 1 1 − WX = 13 ⋅ 12 + − 204,5 = 42,5
2 2
Entonces:
42,5 − 78
zexp = = − 1,93 > − 2,33
338
siendo:
N1 ( x ) N2 ( x )
Fn1 ( x ) = ; Gn2 ( x ) =
n1 n2
con
N1 = mín (n1 , n2 ) = 12
N2 = máx (n1 , n2 ) = 13
n1 + n2 13 + 12
Dn1 , n2 ; α ≈ ⋅ 1,5174 = ⋅ 1,5174 = 0,6074
n1n2 13 ⋅ 12
13 12
Por tanto:
Marca
Horas de duración
de las pilas
B 87 100 85 65 115 83
C 55 50 78 93 60 78
H0 : F1 ( x ) = F2 ( x ) = F3 ( x )
H1: Al menos dos son diferentes
k
12 Ri2
H= ∑
n(n + 1) i = 1 ni
− 3(n + 1)
siendo:
k
n= ∑ ni = n1 + n2 + n3 = 5 + 6 + 6 = 17
i =1
ni
Ri = ∑ rij
j =1
rij = Rango de la observación j -ésima de la muestra i
Ĥ hα
donde
P( H hα / H0 ) = α
C 50 1 1
C 55 2 2
C 60 3 3
B 65 4 4
C 78 6 6
C 78 6 6
A 78 6 6
B 83 8 8
B 85 9 9
B 87 10 10
C 93 11 11
A 98 12 12
B 100 13 13
B 115 14 14
A 125 15 15
A 140 16 16
A 218 17 17
Ri R1 = 66 R2 = 58 R3 = 29
Hˆ =
12
冤66 2 582 292
17(17 + 1) 5
+
6
+
6 冥
− 3(17 + 1) = 7,648
y como:
冟Ri − Rl 冟 cil
siendo:
cil = z p
12
冉
n(n + 1) 1 1
+
ni nl
冊
con
α
P( Z z p ) = p =
k ( k − 1)
66 58 29
R1 = ; R2 = ; R3 =
5 6 6
0,05
p= = 0,0083
3(3 − 1)
P( Z z p ) = 0,0083 ⇒ z p = 2,395
c12 = 2,395
17(18) 1 1
12
+
5 6
冉 冊
= 7,3234
c13 = 2,395
17(18) 1 1
12
+
5 6
冉 冊
= 7,3234
c23 = 2,395
17(18) 1 1
12
+
6 6
冉 冊
= 6,9826
H0 : F1 ( x ) = F2 ( x ) = F3 ( x )
H1: Fi ( x ) ≠ Fj ( x ) para algún i ≠ j
k
12 Ri2
H= ∑
n(n + 1) i = 1 ni
− 3(n + 1)
con
n = n1 + n2 + n3 = 6 + 6 + 6 = 18
ni
Ri = ∑ rij
j =1
H χ k2 − 1 ≡ χ 32− 1 ≡ χ 22
H0
ni > 5
χ22
0,95
χ21 – = 5,99
Barcelona 0,25 1 1
Bilbao 0,30 2 2
Madrid 0,35 3 3
Barcelona 0,46 4 4
Bilbao 0,48 5 5
Bilbao 0,50 6 6
Madrid 0,54 7 7
Barcelona 0,58 8 8
Madrid 0,60 9 9
Madrid 0,65 10 10
Barcelona 0,70 11 11
Barcelona 0,74 12 12
Madrid 0,75 13 13
Madrid 0,84 14 14
Bilbao 0,87 15 15
Barcelona 0,95 16 16
Bilbao 0,96 17 17
Bilbao 0,98 18 18
Hˆ =
12
冤56 2 52 2 632
18(18 + 1) 6
+
6
+
6 冥
− 3(18 + 1) = 0,3626
y como:
hα = 5,801
Hˆ = 0,3626 < 5,801 = hα
Cadena A Cadena B
6,4 8,
8,9 5,9
9, 10,0
2,7 15,0
4,5 17,5
10,0 9,
9, 3,
4,9 3,2
3, 6,
7, 8,
15,0 16,0
H0 : F ( x ) = G( x )
H1: F( x ) ≠ G( x )
donde:
N1 ( x )
Fn1 ( x ) =
n1
N2 ( x )
Gn2 ( x ) =
n2
6
Dn1 , n2 ; α = = 0,5455
11
n1 = 11 n2 = 11
2
Dn1 , n2 , exp = máx 冟Fn1 ( x ) − Gn2 ( x )冟 = = 0,1818
11
6
Dn1 , n2 , exp = 0,1818 < = 0,5455 = Dn1 , n2 ; α
11
H0 : F ( x ) = G( x )
H1: F( x ) ≠ G( x )
con
Sn − E[ Sn ]
Z= N (0, 1)
Var [ Sn ] H0
n1 , n2 → ∞
con
n1 (n + 1) 11(22 + 1)
E[ Sn ] = = = 126,5
2 2
n1n2 (n + 1) 11 ⋅ 11(22 + 1)
Var [ Sn ] = = = 231,92
12 12
N(0,1)
–z /2 = – 1,96 z /2 = 1,96
Observaciones ai zi aizi
x 2,7 1 1 1
x 3,0 4 1 4
y 3,0 5 0 —
y 3,2 8 0 —
x 4,5 9 1 9
x 4,9 12 1 12
y 5,9 13 0 —
y 6,0 16 0 —
x 6,4 17 1 17
x 7,0 20 1 20
y 8,0 21 0 —
y 8,0 22 0 —
x 8,9 19 1 19
x 9,0 18 1 18
x 9,0 15 1 15
y 9,0 14 0 —
x 10,0 11 1 11
y 10,0 10 0 —
x 15,0 7 1 7
y 15,0 6 0 —
y 16,0 3 0 —
y 17,5 2 0 —
Sˆn = 1 + 4 + 9 + 12 + 17 + 20 + 19 + 18 + 15 + 11 + 7 = 133
133 − 126,5
zexp = = 0,4268
23,92
y como:
X ~ N(μx , σ x )
Y ~ N(μy , σ y )
para ver si las ventas en la cadena A presentan más dispersión, planteamos las hipótesis:
H0 : σ x2 σ y2
H1: σ x2 > σ y2
Sx2
F= ~ Ᏺ n − 1, n − 1 ≡ Ᏺ 10,10
Sy2 H0 x y
Ᏺ10,10
0,95
= 0,05
F1– = 2,98
冤 冢 冣冥 冤 冥
nx nx
1 1 2 1 80, 4 2
s x2 =
nx − 1
∑ xi2 − nx
∑ xi =
11 − 1
716,72 −
11
= 12,9069
i =1 i =1
sy2 =
1
11 − 1 冤
1.186,3 −
(101,6)2
11
= 24,7885 冥
232 © Ediciones Pirámide
Contraste de hipótesis no paramétrico
y así:
12,9069
Fexp = = 0,5207 < F1 − α = 2,98
24,7885
Durante los meses de mayo y junio, las entidades bancarias suelen dis-
Ejercicio 3.25
poner de personal que facilita la realización de la declaración de la renta
a sus clientes. Ante la gran cantidad de clientes que solicitan este servicio, una sucursal
bancaria decidió dar cita previa con el fin de evitar las largas esperas que se producían.
A pesar de la medida, los clientes tenían que seguir esperando un tiempo medio de cinco
minutos antes de ser atendidos. Una mañana elegida al azar se decidió contabilizar los
tiempos de espera de cada uno de los clientes, que fueron los siguientes:
¿Podría decirse que el tiempo de espera se distribuye según una ley exponencial?
Nivel de significación: 1 %.
1
5 = E[ X ] =
a
1
a= = 0,2
5
H0 : X ~ Exp 冢 1 冣
5
H1: X ~/ Exp 冢 1 冣
5
o equivalentemente:
H0 : F( x ) = F0 ( x )
H1: F( x ) ≠ F0 ( x )
⎧1 − e − ax si x > 0 ⎫ ⎧1 − e − x / 5 si x > 0
F0 ( x ) = ⎨ ⎬=⎨
⎩0 si x 0 ⎭ ⎩0 si x 0
Dn = máx
−∞<x<+∞
冟F0 ( x ) − Fn ( x )冟 = máx{ai , bi}
con
ai = 冟F0 ( xi ) − Fn ( xi )冟
bi = 冟F0 ( xi ) − Fn ( xi − 1 )冟
y Fn la distribución empírica:
N( x)
Fn ( x ) =
n
N ( x ) = «Número de observaciones muestrales inferiores o iguales a x »
Este test rechaza H0 si el valor observado del estadístico, Dn,exp es superior al valor
crítico:
P( Dn > Dα / H0 ) = α = 0,01
234 © Ediciones Pirámide
Contraste de hipótesis no paramétrico
Dα = 0,513
n=9
Así:
y como:
En una facultad se decidió formar un solo grupo para impartir una asig-
Ejercicio 3.26
natura que es común a las licenciaturas de Economía y de Dirección y
Administración de Empresas. En un examen tipo test de 100 preguntas, se encontró que
la calificación media de los estudiantes de una y otra licenciatura era la misma. Sin em-
Dirección
Economía y Administración
de Empresas
56 60
85 58
23 50
64 32
75 69
92 83
45 36
38 48
67 55
40 88
73 70
13 20
52
n
Sn = ∑ ai Zi
i =1
siendo:
Sn − E[ Sn ]
Z= N (0, 1)
σ [ Sn ] H0
n1 , n2 → ∞
con
nx (n + 1) 13(25 + 1)
E[ Sn ] = = = 169
2 2
nx ny (n + 1) 13 ⋅ 12(25 + 1)
Var [ Sn ] = = = 338
12 12
N(0,1)
–z /2 = – 1,645 z /2 = 1,645
a ai zi a i zi
x 13 1 1 1
y 20 4 0 —
x 23 5 1 5
y 32 8 0 —
y 36 9 0 —
x 38 12 1 12
x 40 13 1 13
x 45 16 1 16
y 48 17 0 —
y 50 20 0 —
x 52 21 1 21
y 55 24 0 —
x 56 — 1 —
y 58 23 0 —
y 60 22 0 —
x 64 19 1 19
x 67 18 1 18
y 69 15 0 —
y 70 14 0 —
x 73 11 1 11
x 75 10 1 10
y 83 7 0 —
x 85 6 1 6
y 88 3 0 —
x 92 2 1 2
Por tanto:
n
Sˆn = ∑ ai zi = 1 + 5 + 12 + 13 + 16 + 21 + 19 + 18 + 11 + 10 + 6 + 2 = 134
i =1
134 − 169
zexp = = − 1,9037
338
y como:
zexp = − 1,9037 < − 1,645 = − zα / 2
H0 : F1 ( x ) = F2 ( x ) = F3 ( x )
H1: ∃ (i, j ), i ≠ j / Fi ( x ) ≠ Fj ( x )
k
12V 12 Ri2
H= = ∑ − 3(n + 1)
n(n + 1) n(n + 1) i = 1 ni
siendo:
ni
Ri = ∑ rij
j =1
y se rechaza H0 si:
Ĥ hα
P( H hα / H0 ) = α = 0,10
hα = 4,56
Hˆ 4,56
Para calcular el valor experimental, asignamos los rangos, en orden creciente, a cada
uno de los importes:
B 1,128 1 — 1 —
B 1,141 2 — 2 —
A 1,225 3 3 — —
A 1,411 4 4 — —
A 1,624 5 5 — —
B 1,823 6 — 6 —
B 3,121 7 — 7 —
A 3,151 8 8 — —
B 4,622 9 — 9 —
C 4,625 10 — — 10
A 4,626 11 11 — —
C 5,521 12 — — 12
C 6,225 13 — — 13
C 9,524 14 — — 14
C 15,629 15 — — 15
Hˆ =
12
15(15 + 1) 5冢
312 252 64 2
+
5
+
5 冣
− 3(15 + 1) = 8,82
como:
cil = z p
12
冉
n(n + 1) 1 1
+
ni nl
冊 , i, l = 1, 2, 3
con
α 0,10
p= = = 0,0167
k ( k − 1) 3(3 − 1)
P( Z z p ) = p = 0,0167
Utilizando la tabla 7:
N(0,1)
0,9833 p = 0,0167
zp = 2,13
Así, como n1 = n2 = n3 = 5
cil = 2,13
12
冉 冊
15 ⋅ 16 1 1
+
5 5
= 6,0245 , ∀ i, l
y diremos que las diferencias entre los importes de la comunidad i y la comunidad l son
significativas si:
冟Ri − Rl 冟 cil
Por tanto:
45 7 23 15 30 16 28 40 50 32
Utilizando un 10 % de significación:
a) ¿Indican estos datos que el 50 % de las ventas se entregan durante el tiempo de
compromiso?
b) Para comparar con el servicio de venta telefónica de otra empresa de la compe-
tencia, se realizaron seis compras similares en esta última, en la que el período
de compromiso de entrega resultó ser el mismo. Los tiempos reales de entrega
en este caso fueron:
10 15 20 17 30 22
15 días
H0 : Me = 15 días = m
H1: Me ≠ 15 días
S+ ~ B(n, 1/ 2)
H0
+ – + 0 + + + + + +
Puesto que hay una diferencia nula, entonces el tamaño muestral se reduce en una
unidad y, así:
S+ ~ B(n = 9, 1/ 2)
H0
/2 /2
k′ /2 k /2
siendo k¢a/2 y k a/2 el mayor y menor entero, respectivamente, tales que, para un nivel de
significación del 10 % (a = 0,10), verifican:
P( S + kα′ / 2 ) α / 2 = 0,05
P( S + kα / 2 ) α / 2 = 0,05
P( X 0) = P( X = 0) = 0,0020 α / 2 = 0,05
P( X 1) = 0,0195 0,05
P( X 2) = 0,0898 > 0,05
Por tanto, k¢a/2 = 1; utilizando la simetría de una B(n, 1/2) obtenemos también el otro
valor crítico:
kα / 2 = n − kα′ / 2 = 9 − 1 = 8
k′ /2 = 1 k /2 =8
45 30 + 8,0
7 –8 – 2,5
23 8 + 2,5
15 0
30 15 + 5,0
16 1 + 1,0
28 13 + 4,0
40 25 + 7,0
50 35 + 9,0
32 17 + 6,0
Para calcular los rangos, se ordenan los valores 冟 di 冟 y se asignan sus números de
orden de menor a mayor. Como hay dos valores 冟 di 冟 repetidos (correspondientes a las
observaciones 7 y 23), se les asigna a cada una el rango medio de los rangos que les
corresponderían si fueran diferentes.
Así:
/2 = 0,05 /2 = 0,05
k′ /2 k /2
k′ /2 = 8 k /2 = 37
H 0 : F ( z ) = G( x )
H1: F( z ) ≠ G( x )
siendo:
N1 ( x ) N2 ( x )
Fn1 ( x ) = y Gn2 ( x ) =
n1 n2
= 0,10
Dn1, n2,
Utilizando la tabla 18 con n1 = 10, n2 = 6, N1 = mín (n1, n2) = 6 y N2 = máx (n1, n2) = 10,
tendremos el valor crítico:
17
Dn1 , n2 ; α = = 0,567
30
Para calcular el valor experimental del estadístico de prueba organizamos los cálcu-
los en la siguiente tabla:
17
Dˆ n1 , n2 = 0,533 < = 0,567
30
entonces, con un nivel de significación del 10 %, no se tiene evidencia para rechazar H0.
No puede rechazarse la hipótesis correspondiente a tiempos de entrega similares.
Análisis de la varianza
H0 : μ1 = μ2 = μ3
H1: μi ≠ μ j para algún i ≠ j
para lo que pueden utilizarse los métodos del análisis de la varianza, pues las variables
verifican los supuestos previos exigidos. El estadístico de prueba para realizar el con-
traste es:
CME
F= ~ Ᏺ k − 1, n − k ≡ Ᏺ 3 − 1,15 − 3 ≡ Ᏺ 2,12
H0
CM D
pues k = 3 y n = 15.
La región crítica puede representarse gráficamente1 como:
1 Ᏺ2,12
0,95 = 0,05
Ᏺn1, n2
en cada uno de los ejercicios se ha representado su forma correspondiente a los grados de libertad concretos.
k ni
T= ∑ ∑ xij = 11.340 + 13.300 + 9.440 = 34.080
i =1 j =1
k ni
∑ ∑ xij2 = 28.436.200 + 49.204.800 + 19.559.200 = 97.200.200
i =1 j =1
k ni
Ti 2 34.080 2
SCT = ∑ ∑ xij2 − n
= 97.200.200 −
15
= 19.770.440
i =1 j =1
冤 冥
k ni k
Ti 2 11.340 2 13.300 2 9.440 2
SCD = ∑ ∑ xij2 − ∑ = 97.200.200 − + + = 18.280.360
i =1 j =1 i = 1 ni 5 5 5
SCD
Dentro de los par- CM D = =
tidos (error aleato- SCD = 18.280.360 n – k = 15 – 3 = 12 n−k
CME
rio) = 1.523.363,33 =
CM D
SCE = 0, 4891
CME = =
Entre partidos SCE = 1.490.080 k–1=3–1=2 k −1
= 745.040
Como:
Suponiendo que los porcentajes de propinas sobre el importe total de la factura pueden
considerarse normalmente distribuidos, y utilizando un nivel de significación del 10 %:
a) ¿Puede aceptarse la hipótesis de homocedasticidad de las distribuciones corres-
pondientes al porcentaje de propina entregado a cada uno de los camareros?
b) ¿Puede decirse que los cuatro candidatos están igualmente cualificados para este
tipo de trabajo?
H0 : σ 12 = σ 22 = σ 32 = σ 42
H1: σ i2 ≠ σ 2j para algún i ≠ j
χ 32, 1 − α = 6,25
χ23
1– = 0,90
= 0,10
χ23, 1 – = 6,25
1 n
冤∑ xi2 − n 冢∑ xi 冣 冥
n n 2
1 1
s2 = ∑
n − 1 i =1
( xi − x ) 2 =
n −1 i =1 i =1
entonces:
s12 =
1
7 −1 冤
625,31 −
(64,9)2
7
= 3,9324 冥
s22 =
1
5 −1 冤
570,3 −
(53,2)2
5
= 1,063 冥
s32 =
1
7 −1 冤
725,71 −
(68,1)2
7
= 10,5324 冥
s42 =
1
6 −1 冤
833,5 −
(69)2
6
=8 冥
SCD
CM D =
n−k
k ni k
Ti 2
SCD = ∑ ∑ xij2 − ∑
i =1 j =1 i = 1 ni
y así:
k ni
∑ ∑ xij2 = 625,31 + 570,3 + 725,71 + 833,5 = 2.754,82
i =1 j =1
SCD 131,0406
CM D = = = 6,24
n−k 25 − 4
con
k
n= ∑ ni = 7 + 5 + 7 + 6 = 25
i =1
k=4
Como:
igualmente cualificados si los porcentajes medios de propinas son iguales para todos
ellos. Por tanto, debemos contrastar las hipótesis:
H0 : μ1 = μ2 = μ3 = μ 4
H1: ∃ (i, j ), i ≠ j /μi ≠ μ j
CME
F= ~ Ᏺ k − 1, n − k ≡ Ᏺ 4 − 1, 25 − 4 ≡ Ᏺ 3, 21
H0
CM D
pues k = 4 y n = 25.
La región crítica del contraste se puede representar gráficamente como:
Ᏺ3, 21
1– = 0,90
= 0,10
donde el valor crítico ha sido obtenido a partir de la tabla 11, de manera que verifique:
Para obtener el valor experimental calculamos en primer lugar las sumas de cuadrados
y construimos la tabla ANOVA. Algunos de los cálculos necesarios ya han sido realiza-
dos en el apartado anterior:
k
T= ∑ Ti = 64,9 + 53,2 + 68,1 + 69 = 255,2
i =1
k ni
T2 (255,2)2
SCT = ∑ ∑ xij2 − n
= 2.754,82 −
25
= 149,7384
i =1 j =1
k ni k
Ti
SCD = ∑ ∑ xij2 − ∑ = 131,0406
i =1 j =1 i = 1 ni
SCE
CME = =
Entre grupos SCE = 18,6978 k–1=3 k −1
CME
= 6,2326 =
CM D
SCD = 0,9988
CM D = =
Dentro de grupos SCD = 131,0406 n – k = 21 n−k
= 6,2400
Como:
ejecutara cierto programa con cinco conjuntos similares de datos. Los tiempos de ejecu-
ción, en minutos, aparecen en la siguiente tabla:
Distribuidor
Conjunto
de datos Infomat, S. A. Servired, S. A. Compumat, S. A.
1 67 52 40
2 50 56 52
3 55 43 44
4 72 66 47
5 67 68 35
Suponiendo que los tiempos de ejecución de este programa pueden considerarse nor-
malmente distribuidos, y utilizando un nivel de significación del 1 %, ¿pueden apreciarse
diferencias significativas en los ordenadores de estos tres distribuidores?
Xi ~ N ( μi , σ i ), i = 1, 2, 3
H0 : σ 12 = σ 22 = σ 32
H1: σ i2 ≠ σ 2j para algún i ≠ j
k
(n − k ) ln CM D − ∑ (ni − 1) ln Si2
i =1
B=
冢∑ n 1− 1 − n −1 k 冣
k
1
1+
3( k − 1) i =1 i
B ~ χ k2 − 1 ≡ χ 32− 1 ≡ χ 22
H0
La región crítica, con un 1 % de significación, viene determinada por los valores del
estadístico, tales que:
χ22
0,99 = 0,01
χ22,1– = 9,21
Calculemos ahora el valor experimental del estadístico. Para calcular las varianzas
muestrales, utilizamos que:
1 n
冤 冢∑ x 冣 冥
n n 2
1 1
s2 = ∑
n − 1 i =1
( xi − x ) 2 =
n −1
∑ xi2 − n
i
i =1 i =1
Así:
s12 =
1
4 冤
19.678 −
(311)2
5
= 85,7 冥
s22 =
1
4 冤
16.669 −
(285)2
5
= 106 冥
s32 =
1
4 冤
9.674 −
(218)2
5
= 42,3 冥
冤 冥
k ni k
Ti 2 3112 2852 2182
SCD = ∑ ∑ xij2 − ∑ = 46.030 − + + = 936
i =1 j =1 i = 1 ni 5 5 5
SCD 936
CM D = = = 78
n−k 12
y como:
Xi ~ N ( μi , σ i ),
i = 1, 2, 3
Xi independientes
Xi homocedásticas (σ 12 = σ 22 = σ 32 = σ 2 )
H0 : μ1 = μ2 = μ3
H1: ∃ (i, j ), i ≠ j, tal que μi ≠ μ j
CME
F= ~ Ᏺ k − 1, n − k ≡ Ᏺ 3 − 1,15 − 3 ≡ Ᏺ 2,12
H0
CM D
Por tanto:
k ni
T= ∑ ∑ xij = 311 + 285 + 218 = 814
i =1 j =1
k ni
∑ ∑ xij2 = 19.687 + 16.669 + 9.674 = 46.030
i =1 j =1
k ni
T2 814 2
SCT = ∑ ∑ xij2 − n
= 46.030 −
15
= 1.856,9333
i =1 j =1
k
Ti 2 T 2 3112 2852 2182 814 2
SCE = ∑ − = + + − = 920,9333
i = 1 ni n 5 5 5 15
SCE
Entre distribuido- CME = =
SCE = 920,9333 k–1=3–1=2 k −1
res CME
= 460, 4667 =
CM D
SCD = 5,9034
Dentro de distribui- CM D = =
SCD = 936 n – k = 15 – 3 = 12 n−k
dores
= 78
Total SG = 1.856,9333 n – 1 = 15 – 1 = 14
Ᏺ2,12
0,99 = 0,01
Como:
anotado el precio medio semanal, en euros, del litro de gasolina sin plomo. Los datos
recogidos aparecen en la siguiente tabla:
X1 ~ N ( μ1, σ 1 )
X2 ~ N ( μ 2 , σ 2 )
X3 ~ N ( μ3 , σ 3 )
σ 12 = σ 22 = σ 32 = σ 2
μ1 = μ2 = μ3
H0 : μ1 = μ2 = μ3
H1: ∃ (i, j ), i ≠ j /μi ≠ μ j
CME
F= ~ Ᏺ k − 1, n − k ≡ Ᏺ 3 − 1,17 − 3 ≡ Ᏺ 2,14
H0
CM D
Ᏺ2,14
0,975 = 0,025
donde el valor crítico F2,14; 1 – a ha sido obtenido a partir de la tabla 11, de tal forma que
verifique:
Para obtener el valor experimental, calculamos en primer lugar las sumas de cua-
drados:
k ni k ni
T2
SCT = ∑ ∑ ( xij − x )2 = ∑ ∑ xij2 − n
i =1 j =1 i =1 j =1
k ni k ni k
Ti 2
SCD = ∑ ∑ ( xij − xi )2 = ∑ ∑ xij2 − ∑
i =1 j =1 i =1 j =1 i = 1 ni
k ni k
Ti 2 T 2
SCE = ∑ ∑ ( xi − x ) 2 = ∑ − = SCT − SCD
i =1 j =1 i = 1 ni n
k ni
∑ ∑ xij2 = 8,534829 + 5,329319 + 7,665247 = 21,529395
i =1 j =1
19,1252
SCT = 21,529395 − = 0,01377
17
SCD
Dentro de los gru- CM D = =
SCD = 0,00716244 n – k = 17 – 3 = 14 n−k
pos CME
= 0,00051160 =
CM D
SCE = 6, 4577
CME = =
Entre grupos SCE = 0,00660756 k–1=3–1=2 k −1
= 0,003303780
Como
Fexp = 6, 4577 > 4,86 = F2, 14;1 − α
Ᏺ2,14
0,975 = 0,025
Fexp =
(a)
冢7,729 4,617 2
7
−
4
= 6,2460
冣
(3 − 1)
0,00716244 1 1
17 − 3
+
7 4 冢 冣
Fexp =
(b)
冢 7,729 6,779 2
7
−
6
= 2,0839
冣
(3 − 1)
0,00716244 1 1
17 − 3
+
7 6 冢 冣
(c)
Fexp =
冢 4,617 6,779 2
4
−
6
= 1,3984
冣
(3 − 1)
0,00716244 1 1
17 − 3
+
4 6 冢 冣
© Ediciones Pirámide 267
Ejercicios de inferencia estadística y muestreo
(a)
Fexp = 6,2460 > 4,86 = F2, 14;1 − α
(b)
Fexp = 2,0839 < 4,86 = F2, 14;1 − α
(c)
Fexp = 1,3984 < 4,86 = F2, 14;1 − α
Campañas publicitarias
30 85 40
20 73 28
35 92 39
42 86 41
60 75 50
H0 : F1 ( x ) = F2 ( x ) = F3 ( x )
H1: ∃ (i, j )/ Fi ( x ) ≠ Fj ( x ) ; i≠j
que puede resolverse mediante el test de Kruskall-Wallis suponiendo que las variables
aleatorias son continuas y las muestras han sido obtenidas independientemente unas de
otras. El estadístico de prueba de este contraste es:
k
12 Ri2
H= ∑ − 3(n + 1)
n(n + 1) i = 1 ni
con
n = n1 + n2 + n3 = 5 + 5 + 5 = 15
ni
Ri = ∑ rij = Suma de rangos de la muestra i, i = 1, 2, 3
j =1
Hˆ hα = h0,10
P( H hα ) = α = 0,10
P( H 4,56) = 0,10
A 20 01 01
C 28 02 2
A 30 03 03
A 35 04 04
C 39 05 5
C 40 06 6
C 41 07 7
A 42 08 08
C 50 09 9
A 60 10 10
B 73 11 11
B 75 12 12
B 85 13 13
B 86 14 14
B 92 15 15
R = 120 R1 = 26 R2 = 65 R3 = 29
Entonces:
Hˆ =
12
冤
26 2 652 29 2
15(15 + 1) 5
+
5
+
5 冥
− 3(15 + 1) = 9, 42
y como:
Xi ~ N ( μi , σ i )
Xi independientes
Xi homocedásticas (σ 12 = σ 22 = σ 32 = σ 2 )
H0 : μ1 = μ2 = μ3
H1: ∃ (i, j ), i ≠ j /μi ≠ μ j
CME
F= ~ Ᏺ k − 1, n − k ≡ Ᏺ 3 − 1,15 − 3 ≡ Ᏺ 2,12
H0
CM D
con
k=3
n = n1 + n2 + n3 = 15
Gráficamente:
Ᏺ2,12
0,99 = 0,01
k
T1 = 187 ; T2 = 411 ; T3 = 198 ; T= ∑ Ti = 796
i =1
k ni
∑ ∑ xij2 = 7.889 + 34.039 + 8.086 = 50.014
i =1 j =1
k ni
T2 796 2
SCT = ∑ ∑ xij2 − n
= 50.014 −
15
= 7.772,9333
i =1 j =1
冤 冥
k ni k
Ti 2 1872 4112 1982
SCD = ∑ ∑ xij2 − ∑ = 50.014 − + + = 1.395,2
i =1 j =1 i = 1 ni 5 5 5
k
Ti 2 T 2
SCE = ∑ − n = SCT − SCD = 7.772,9333 − 1.395,2 = 6.377,7333
i = 1 ni
Como:
Fexp = 27, 4272 > F2, 12, 1 − α = 6,93
( Xi − X j )2
F= ~ Ᏺ k − 1, n − k ≡ Ᏺ 2,12
冢 冣
H0
SCD 1 1
( k − 1) +
n − k ni n j
Ᏺ2,12
0,99 = 0,01
冢 5 冣
187 198 2
−
5
(b)
Fexp = = 0,0520
15 − 3 冢 5 5 冣
1.395,2 1 1
(3 − 1) +
(b)
Fexp = 0,0520 < F2, 12, 1 − α = 6,93
Ᏺ2,12
0,95 = 0,05
y de nuevo:
(b)
Fexp = 0,0520 < 3,89 = F2, 12, 1 − α
Suponiendo normalidad, ¿se puede admitir la influencia del tipo de escuela elegido
en los salarios de los titulados a un 5 % de significación?
Xi ~ N ( μi , σ i )
Si, además, fueran homocedásticas (s12 = s22 = s32 = s2), bastaría contrastar las hipótesis:
H0 : μ1 = μ2 = μ3 ( no hay influencia )
H1: μi ≠ μ j para algún i ≠ j (sí hay influencia )
utilizando las técnicas del análisis de la varianza para una clasificación simple.
Por tanto, veamos primero si es admisible la hipótesis de homocedasticidad, es decir,
contrastemos las hipótesis:
H0 : σ 12 = σ 22 = σ 32
H1: σ i2 ≠ σ 2j para algún i ≠ j
k
(n − k ) ln CM D − ∑ (ni − 1) ln Si2
i =1
B= ~ χ k2 − 1 ≡ χ 32− 1 ≡ χ 22
冢 冣
k H0
1 1 1
1+
3( k − 1)
∑ n −1 − n − k
i =1 i
χ 22, 1 − α = 5,99
Gráficamente:
χ22
0,95 = 0,05
χ22, 1– = 5,99
1 ni
冤 ∑ xij2 − n 冢 ∑ xij 冣 冥
ni ni 2
1 1
si2 = ∑
ni − 1 j = 1
( xij − xi )2 =
ni − 1 j =1 i j =1
siendo n1 = 4, n2 = 5 y n3 = 6.
Sustituyendo en la expresión correspondiente a B:
Entonces, al 5 % de significación, no hay motivos para rechazar H0 : s21 = s22 = s23, por
lo que admitiremos la hipótesis de homocedasticidad de las variables Xi, i = 1, 2, 3.
H0 : μ1 = μ2 = μ3
H1: μi ≠ μ j para algún i ≠ j
CME
F= ~ Ᏺ k − 1, n − k ≡ Ᏺ 3 − 1,15 − 3 ≡ Ᏺ 2,12
H0
CM D
Ᏺ2,12
0,95 = 0,05
s12 =
1
4 −1冤589.465 −
1.3932
4
= 34.784,25 冥
s22 =
1
5 −1冤507.756 −
1.550 2
5
= 6.814 冥
278 © Ediciones Pirámide
Análisis de la varianza
s32 =
1
6 −1 冤
873.933 −
2.139 2
6
= 22.275,9 冥
k ni
∑ ∑ xij2 = 589.465 + 507.756 + 873.933 = 1.971.154
i =1 j =1
冤 冥
k ni k
Ti 2 1.3932 1.550 2 2.139 2
SCD = ∑ ∑ xij2 − ∑ = 1.971.154 − + + = 242.988,25
i =1 j =1 i = 1 ni 4 5 6
SCD 242.988,25
CM D = = = 20.249,0208
n − k ( 4 + 5 + 6) − 3
k ni k
T= ∑ ∑ xij = ∑ Ti = 1.393 + 1.550 + 2.139 = 5.082
i =1 j =1 i =1
k ni
T2 5.082 2
SCT = ∑ ∑ xij2 − n
= 1.971.154 −
15
= 249.372,4
i =1 j =1
SCD = 242.988,25
SCE
CME = =
Entre escuelas SCE = 6.384,15 k–1=3–1=2 k −1
CME
= 3.192,075 =
CM D
SCD = 0,1576
Dentro de escuelas CM D = =
SCD = 242.988,25 n – k = 15 – 3 = 12 n−k
(error aleatorio)
= 20.249,0208
Al ser:
1 6 1
2 5 2
3 8 1
5 9 5
1 7 4
3 3 3
5 5 2
Dα′ = 0,300
Calculemos ahora los valores experimentales para cada contraste que hay que realizar.
Empresa A
n1
1 20
x1 =
n1
∑ x1 j = 7
j =1
冤 ∑ x12j − n 冢 ∑ x1 j 冣 冥 = 7 − 1 冤74 − 冥
n1 n1
1 1 2 1 20 2
s12 = = 2,8095
n1 − 1 j =1 1 j =1 7
s1 = 2,8095 = 1,6762
20
x1 j −
x1 j − x1 7
z1 j = = , j = 1,..., 7
s1 1,6762
el valor de Fn1 y F0 en cada uno de ellos, así como las diferencias en valor absoluto:
a1 j = 冟F0( z1 j ) − Fn( z1 j )冟
b1 j = 冟F0( z1 j ) − Fn( z1 j − 1 )冟
N(z1j)
x1j n1j z1j Fn1(z1j) = —–— F0(z1j) = P(Z z1j) a1j b1j
n1
n1 = 7
Por tanto:
Empresa B
n2
1 43
x2 =
n2
∑ x2 j = 7
j =1
冤 ∑ x22 j − n 冢 ∑ x2 j 冣 冥 = 7 − 1 冤289 − 冥
n2 n2
1 1 2 1 432
s22 = = 4,1429
n2 − 1 j =1 2 j =1 7
s2 = 4,1429 = 2,0354
N(z2j)
x2j n2j z2j Fn2(z2j) = —–— F0(z2j) = P(Z z2j) a2j b2j
n2
n2 = 7
Siendo:
Empresa C
n3
1 18
x3 =
n3
∑ x3 j = 7
j =1
冤 冢 冣冥 冤 冥
n3 n3
1 1 2 1 182
s32 =
n3 − 1
∑ x32j − n3
∑ x3 j =
7 −1
60 −
7
= 2,2857
j =1 j =1
s3 = 2,2857 = 1,5119
N(z3j)
x3j n3j z3j Fn3(z3j) = —–— F0(z3j) = P(Z z3j) a3j b3j
n3
n3 = 7
Como:
por lo que tampoco se rechaza la normalidad de los datos que empleamos de la empre-
sa C.
Entonces, sí admitiremos la normalidad de las variables X1, X2 y X3.
b) Si las variables Xi fuesen homocedásticas, se trataría de variables normales, in-
dependientes y con la misma varianza:
Xi ~ N ( μi , σ )
Por tanto, para ver si existen diferencias significativas en el número de ausencias por
empleado según las empresas consideradas, contrastaríamos las hipótesis:
H0 : σ 12 = σ 22 = σ 32 = σ 2
H1: σ i2 ≠ σ 2j para algún i ≠ j
k
(n − k ) ln CM D − ∑ (ni − 1) ln Si2
i =1
B= ~ χ k2 − 1 ≡ χ 32− 1 ≡ χ 22
冤∑ n 1− 1 − n −1 k 冥
k H0
1
1+
3( k − 1) i =1 i
χ22
0,95 = 0,05
χ22; 1– = 5,99
1 6 1 1 36 1
2 5 2 4 25 4
3 8 1 9 64 1
5 9 5 25 81 25
1 7 4 1 49 16
3 3 3 9 9 9
5 5 2 25 25 4
20 43 18 74 289 60
s12 =
1
7 −1
74 − 冤
20 2
7 冥
= 2,8095
s22 =
1
7 −1
289 −冤432
7
= 4,1429 冥
s32 =
1
7 −1
60 − 冤
182
7 冥
= 2,2857
冤 冥
k ni k
Ti 2 20 2 432 182
SCD = ∑ ∑ xij2 − ∑ = ( 74 + 289 + 60) − + + = 55, 4286
i =1 j =1 i = 1 ni 7 7 7
H0 : μ1 = μ2 = μ3
H1: μi ≠ μ j para algún i ≠ j
utilizando las técnicas del ANOVA para una clasificación simple, puesto que admitimos
que las variables Xi son normales, homocedásticas (Xi ~ N(mi, s), i = 1, 2, 3) e indepen-
dientes.
El estadístico del contraste, su distribución bajo H0 y la región crítica son:
CME
F= ~ Ᏺ k − 1, n − k ≡ Ᏺ 3 − 1, 21 − 3 ≡ Ᏺ 2,18
H0
CM D
Ᏺ2,18
0,95 = 0,05
Se observa que:
H0 : μ i = μ j
H1: μi ≠ μ j
( Xi − X j )2
F= ~ Ᏺ k − 1, n − k ≡ Ᏺ 2,18 ; i = 1, 2, 3; j = 1, 2, 3
冢 冣
H0
SCD 1 1
( k − 1) +
n − k ni n j
Ᏺ2,18
0,95 = 0,05
Por tanto:
III. H0 : m1 = m2 ; H1: m1 π m2
冢 冣
20 43 2
−
7 7
I
Fexp = = 6,1352 > 3,55 = F2, 18;1 − α
(3 − 1)3,0794
1 1
+
7 7 冢 冣
entonces, se rechaza H0 : m1 = m2, y diremos que se aprecian diferencias signifi-
cativas, al 5 %, entre las empresas A y B en cuanto al número de ausencias por
empleado.
III. H0 : m1 = m3 ; H1: m1 π m3
(3 − 1)3,0794 冢 + 冣
1 1
7 7
III. H0 : m2 = m3 ; H1: m2 π m3
(3 − 1)3,0794 冢 + 冣
1 1
7 7
Número de alumnos
Zona norte Zona centro Zona sur
por aula
Se trata de estudiar la cantidad mensual que los colegios reciben por cada
Solución
alumno de enseñanza primaria considerando los factores A, número de
alumnos por aula, y B, zona en la que está situado el colegio. Definimos las variables
aleatorias:
Xij = «Cantidad diaria que un colegio del bloque i, j recibe por un alumno de Ense-
ñanza Primaria»,
siendo i = 1 (menos de 25 alumnos por aula), 2 (25 o más alumnos por aula); j = 1 (zona
norte), 2 (zona centro), 3 (zona sur).
Estas variables son normales, homocedásticas:
Xij ~ N ( μij , σ ) , i = 1, 2; j = 1, 2, 3
y, además, independientes.
Si estos colegios no presentaran diferencias significativas en cuanto a la variable
estudiada, las distribuciones de Xij serían idénticas y, por tanto, las medias mij serían
iguales. Entonces, para tratar de ver si existen tales diferencias, planteamos el siguiente
contraste:
con
Xijk: observación k-ésima en el bloque (i, j).
ai : efecto del i-ésimo nivel del factor A.
bj : efecto del j-ésimo nivel del factor B.
(ab) ij: efecto de interacción del i-ésimo nivel del factor A y el j-ésimo nivel del
factor B.
eijk: k-ésimo error aleatorio en los tratamientos (i, j).
Rechazaremos la hipótesis H0 anterior cuando se rechace alguna de las hipótesis
nulas de los siguientes contrastes:
Los estadísticos de prueba, las distribuciones que éstos siguen bajo la hipótesis nula, y
las correspondientes regiones críticas obtenidas utilizando la tabla 11 son, respectivamente:
CM A
F′ = ~ Ᏺ r − 1, rs( n − 1) ≡ Ᏺ 1,12
H0
CME
CM B
F ′′ = ~ Ᏺ s − 1, rs( n − 1) ≡ Ᏺ 2,12
H0
CME
CM AB
F ′′′ = ~ Ᏺ ( r − 1)( s − 1), rs( n − 1) ≡ Ᏺ 2,12
H0
CME
Realizamos a continuación las operaciones para construir la tabla ANOVA para una
clasificación doble:
= 14.215,8125
T..2 ( 478,25)2
SCT = ∑ ∑ ∑ xijk2 − rsn
= 14.215,8125 −
2 ⋅3⋅3
= 1.508,9757
i j k
1 T..2 1 ( 478,25)2
SCA = ∑ i. rsn 3 ⋅ 3
ns i
T 2
− = [( 289, 95) 2
+ (188, 3) 2
] −
2 ⋅3⋅3
= 574,0401
1 T2 1 ( 478,25)2
SCB =
nr
∑ T. 2j − rsn
..
=
3⋅2
172,05)2 + (151,3)2 + (154,9)2 ] −
[(172
2 ⋅3⋅3
= 40,9803
j
1
SCE = ∑ ∑ ∑ xijk2 − n ∑ ∑ Tij2 =
i j k i j
1
= 14.215,8125 − [106, 452 + 85,6 2 + 97,9 2 + 65,6 2 + 65,72 + 572 ] = 845,0717
3
SCA CM A
CM A = = ′ =
Fexp =
Factor A SCA = 574,0401 r–1=2–1=1 r −1 CME
= 574,0401 = 8,1514
SCB CM B
CM B = = ′′ =
Fexp =
Factor B SCB = 40,9803 s–1=3–1=2 s −1 CME
= 20, 49015 = 0,2910
SCAB CM AB
Factor AB (r – 1)(s – 1) = CM AB = = ′′′ =
Fexp =
SCAB = 48,8836 (r − 1)( s − 1) CME
(interacción) =1·2=2
= 24, 4418 = 0,3471
SCE
rs(n – 1) = CME = =
Error aleatorio SCE = 845,0717 rs(n − 1)
= 2 · 3(3 – 1) = 12
= 70, 4226
rsn – 1 =
Total SCT = 1.508,9757
= 2 · 3 · 3 – 1 = 17
Como:
No rechazamos H¢¢¢,
0 por lo que los datos no indican una interacción entre los factores
A y B al 5 % de significación.
Por todo lo anterior, y al rechazarse H¢0, debemos rechazar también la hipótesis H0 :
m11 = … = m23, por lo que se puede afirmar que hay diferencias significativas entre los
precios de los colegios y que éstas son debidas al factor A.
180 400
Director A
230 450
280 630
Director B
290 515
350 608
Director C
400 580
Utilizando un nivel de significación del 1 %, y suponiendo que los ingresos por se-
sión pueden considerarse independientes, normales y homocedásticos, ¿confirman los
datos la existencia de diferencias significativas entre dichas sesiones?
Xij ~ N ( μij , σ )
pues se pueden considerar normales, homocedásticas y, además, independientes.
Se trata de contrastar las siguientes hipótesis:
H0 : μ11 = … = μ23
H1: μij ≠ μ hk para algún (i, j ) ≠ (h, k )
Del mismo modo que en el ejercicio anterior, la hipótesis nula será rechazada si se
rechaza alguna de las hipótesis nulas en los contrastes que evalúan los efectos de los
factores y su posible interacción.
CM A
F′ = ~ Ᏺ r − 1, rs( n − 1) ≡ Ᏺ 2, 6
H0′
CME
CM B
F ′′ = ~ Ᏺ s − 1, rs( n − 1) ≡ Ᏺ 1, 6
H0′′
CME
CM AB
F ′′′ = ~ Ᏺ ( r − 1)( s − 1), rs( n − 1) ≡ Ᏺ 2, 6
H0′′′
CME
pues r = 3, s = 2 y n = 2.
Para obtener los valores experimentales de estos estadísticos tendremos que realizar to-
das las operaciones encaminadas a construir la tabla ANOVA para una clasificación doble:
T2 ( 4.913)2
SCT = ∑ ∑ ∑ xijk2 − rsn
..
= 2.260.989 −
3⋅2 ⋅2
= 249.524,92
i j k
1 T2 1 ( 4.913)2
SCA = ∑
ns i
Ti.2 − .. =
rsn 2 ⋅ 2
[1.260 2 + 1.7152 + 1.9382 ] −
3⋅2 ⋅2
= 59.703,17
1 T2 1 ( 4.913)2
SCB =
nr
∑ T. 2j − rsn
..
=
2⋅3
[1.730 2 + 3.1832 ] −
3⋅2 ⋅2
= 175.934,08
j
1
SCE = ∑ ∑ ∑ xijk2 − n ∑ ∑ Tij2 =
i j k i j
1
= 2.260.989 − [ 410 2 + 850 2 + 570 2 + 1.1452 + 750 2 + 1.1882 ] = 10.804,5
2
SCAB = SCT − SCA − SCB − SCE =
= 249.524,92 − 59.703,17 − 175.934,08 − 10.804,5 = 3.083,17
SCA CM A
CM A = = ′ =
Fexp =
Factor A SCA = 59.703,17 r–1=3–1=2 r −1 CME
= 29.851,585 = 16,58
SCB CM B
CM B = = ′′ =
Fexp =
Factor B SCB = 175.934,08 s–1=2–1=1 s −1 CME
= 175.934,08 = 97,70
SCAB CM AB
Factor AB (r – 1)(s – 1) = CM AB = = ′′′ =
Fexp =
SCAB = 3.083,17 (r − 1)( s − 1) CME
(interacción) =2·1=2
= 1.541,585 = 0,856
SCE
rs(n – 1) = CME = =
Error aleatorio SCE = 10.804,5 rs(n − 1)
= 3 · 2(2 – 1) = 6
= 1.800,75
rsn – 1 =
Total SCT = 249.524,92
= 3 · 2 · 2 – 1 = 11
Xij = «Puntuación obtenida por una persona de sexo i con licenciatura j».
i = 1 (mujer), 2 (hombre).
j = 1 (económicas y empresariales), 2 (derecho).
Estas variables son normales, homocedásticas y también independientes:
Xij ~ N ( μij , σ )
que pueden ser contrastadas mediante un análisis de la varianza para una clasificación
doble. La hipótesis nula H0 no será rechazada si ninguna de las hipótesis nulas siguientes
es rechazada:
Los estadísticos de prueba, las distribuciones seguidas bajo las hipótesis nulas y las
regiones críticas son, teniendo en cuenta que r = 2, s = 2, n = 5:
CM A
F′ = ~ Ᏺ r − 1, rs( n − 1) ≡ Ᏺ 1,16
H0′
CME
CM B
F ′′ = ~ Ᏺ s − 1, rs( n − 1) ≡ Ᏺ 1,16
H0′′
CME
CM AB
F ′′′ = ~ Ᏺ ( r − 1)( s − 1), rs( n − 1) ≡ Ᏺ 1,16
H0′′′
CME
Licenciados en económicas
Licenciados en derecho Ti.
o empresariales
Mediante las fórmulas de los ejercicios anteriores, calculamos las sumas de cuadra-
dos, teniendo en cuenta que r = 2, s = 2 y n = 5:
( 4.659)2
SCT = 1.114.439 − = 59.124,95
2⋅2⋅5
1 ( 4.659)2
SCA = [2.5712 + 2.0882 ] − = 11.664, 45
5⋅2 2⋅2⋅5
1 ( 4.659)2
SCB = [2.584 2 + 2.0752 ] − = 12.954,05
5⋅2 2⋅2⋅5
1
SCE = 1.114.439 − [1.4132 + 1.1582 + 1.1712 + 9172 ] = 34.506, 4
5
SCAB = 59.124,95 − 11.664, 45 − 12.954,05 − 34.506, 4 = 0,05
SCA ′ = 5, 4085
CM A = = Fexp
Factor A SCA = 11.664,45 r–1=2–1=1 r −1
= 11.664, 45
SCB ′′ = 6,0066
CM B = = Fexp
Factor B SCB = 12.954,05 s–1=2–1=1 s −1
= 12.954,05
SCAB
Factor AB (r – 1)(s – 1) = CM AB = = ′′′ = 2,3 ⋅ 10 −5
Fexp
SCAB = 0,05 (r − 1)( s − 1)
(interacción) =1·1=1
= 0,05
SCE
rs(n – 1) = CME = =
Error aleatorio SCE = 34.506,4 rs(n − 1)
= 2 · 2(5 – 1) = 16
= 2.156,65
rsn – 1 =
Total SCT = 59.124,95
= 2 · 2 · 5 – 1 = 19
a) Como:
Como se ha obtenido:
1.746
H0 : μ I = μ II = μ III = μ IV
H1: Al menos dos son diferentes
SCE /( k − 1)
F= Ᏺ k − 1, n − k ≡ Ᏺ 4 − 1, 12 − 4 ≡ Ᏺ 3, 8
SCD /(n − k ) H0
Ᏺ3, 8
0,90
= 0,10
2,92
Para calcular el valor experimental del estadístico de prueba, calculamos primero las
sumas de cuadrados y construimos la tabla ANOVA:
k
Ti 2 T 2 384 2 480 2 402 2 480 2 1.746 2
SCE = ∑ − = + + + − =
i = 1 ni n 3 3 3 3 12
Como:
15 12 20
17 15 22
15 22 27
14 14 25
18 17 19
14 19
Total 93 99 113
H0 : μ1 = μ2 = μ3
H1: ∃ i, j con i ≠ j, tal que μi ≠ μ j
Para ello, aplicaremos el análisis de varianza, que utiliza como estadístico de prueba:
SCE /( k − 1)
F= Ᏺ k − 1, n − k ≡ Ᏺ 2, 14
SCD /(n − k ) H0
Ᏺ2,14
0,95 0,05
3,74
Tenemos que calcular el valor experimental, para lo que necesitamos las sumas de
cuadrados y la tabla ANOVA:
T = T1 + T2 + T3 = 93 + 99 + 113 = 305
k =3
Ti 2 T 2 932 99 2 1132 3052
SCE = ∑ ni
−
n
=
6
+
6
+
5
−
17
= 156,741
i =1
k ni
T2 3052
SCT = ∑ ∑ Xij2 − = 152 + 172 + … + 252 + 19 2 − = 280,94
i =1 j =1 n 17
741 = 124,199
SCD = SCT − SCE = 280,94 − 156,741
Como:
⎧ H0 : μ1 − μ2 = 0
a) ⎨
⎩ H1: μ1 − μ2 ≠ 0
⎧ H0 : μ1 − μ3 = 0
b) ⎨
⎩ H1: μ1 − μ3 ≠ 0
⎧ H0 : μ 2 − μ 3 = 0
c) ⎨
⎩ H1: μ2 − μ3 ≠ 0
( Xi − X j )2
F= Ᏺ k − 1, n − k ≡ Ᏺ 2, 14
冢 冣
SCD 1 1 H0
( k − 1) +
n − k ni n j
(15,5 − 16,5)2
(a)
Fexp = = 0,17
2⋅
124,199 1 1
14
+
6 6 冢 冣
(15,5 − 22,6)2
(b)
Fexp = = 7,75
2⋅
124,199 1 1
14
+
6 5 冢 冣
(16,5 − 22,6)2
(c)
Fexp = = 5,72
2⋅
124,199 1 1
14
+
6 5 冢 冣
© Ediciones Pirámide 305
Ejercicios de inferencia estadística y muestreo
Ᏺ2,14
0,95 0,05
F(a)
exp 3,74 F(c) (b)
exp Fexp
H0 : σ 12 = σ 22 = σ 32
H1: σ i2 ≠ σ 2j para algún i ≠ j
y para ello utilizaremos el estadístico del test de Bartlett, utilizado anteriormente. Grá-
ficamente, la región crítica se representa como:
χ2k – 1 ≡ χ22
0,95 = 0,05
Para calcular el valor experimental necesitamos las varianzas muestrales para cada
grupo de observaciones:
Método de enseñanza
61 80 77
Ingeniería A1 456
70 86 82
59 79 76
Economía A2 439
65 89 71
56 78 68
Biología A3 396
52 67 75
54 66 63
Empresariales A4 380
59 72 66
45 72 66
Otras A5 357
40 69 65
es decir, se trata de comprobar la influencia del factor «licenciatura» (A), del factor
«método de enseñanza» (B) y de la interacción entre ambos (AB).
Para ello, los estadísticos de prueba a utilizar con la distribución seguida (siendo
r = 5, s = 3, n = 2) son:
CM A
F′ = Fr − 1, rs( n − 1) ≡ F4, 15
CME H 0′
CM B
F ′′ = Fs − 1, rs ( n − 1) ≡ F2, 15
CME H 0′′
CM AB
F ′′′ = F( r − 1)( s − 1), rs ( n − 1) ≡ F8, 15
CME H 0′′′
y las regiones críticas para contrastar las distintas influencias son, al 5 % de significación:
Factor A
Ᏺ4, 15
0,95
0,05
H0′ : α1 = … = α 5 = 0
H1′: ∃ i, α i ≠ 0
Factor B
Ᏺ2,15
0,95 0,05
F′′
2,15; 0,95 = 3,68
H0′′: β1 = … = β3 = 0
H1′′: ∃ j, β j ≠ 0
Interacción (AB)
Ᏺ8, 15
0,95
0,05
F′′′
8, 15; 0,95 = 2,64
T..2 2.0282
SCT = ∑ ∑ ∑ xijn
2
− = 140.830 − = 3.737,2
i j k rsn 30
1 1
SCE = ∑ ∑ ∑ xijk
2
− ∑ ∑ Tij2 = 140.830 − (1312 + 166 2 + 159 2 + 124 2 + 1682 +
i j k n i j 2
+ 1472 + 1082 + 1452 + 1432 + 1132 + 1382 + 129 2 + 852 + 1412 + 1312 ) = 297
1 T2 1 2.0282
SCA = ∑
ns i
Ti.2 − .. = ( 456 2 + 439 2 + 396 2 + 380 2 + 3572 ) −
rsn 6 30
= 1.127,53
1 T2 1 2.0282
SCB = ∑
rn j
T. 2j − .. =
rsn 10
(5612 + 7582 + 709 2 ) −
30
= 2.103,8
SCAB = SCT − SCA − SCB − SCE = 3.737,2 − 1.127,53 − 2.103,8 − 297 = 208,87
Como:
Entonces rechazamos H0 : m11 = L = m53, con lo cual podemos decir que existen di-
ferencias entre las puntuaciones medias de los grupos, aunque no hay interacción entre
los dos factores.
Fertilizante
Tipo
Total
de manzano F1 F2 F3
74 75 72
M1 78 78 80 712
84 83 88
79 80 85
M2 75 90 77 715
69 84 76
92 77 87
M3 87 78 83 744
85 76 83
H0 : μ11 = … = μ33
H1: μij ≠ μ hk para algún (i, j ) ≠ (h, k )
o equivalentemente:
H0′ : α1 = α 2 = α 3 = 0
H1′: ∃ i, α i ≠ 0
H0′′: β1 = β 2 = β3 = 0
H1′′: ∃ j, β j ≠ 0
CM A
F′ = Ᏺ r − 1, rs ( n − 1) ≡ Ᏺ 2, 18
CME H 0′
CM B
F ′′ = Ᏺ s − 1, rs ( n − 1) ≡ Ᏺ 2, 18
CME H 0′′
CM AB
F ′′′ = Ᏺ ( r − 1)( s − 1), rs ( n − 1) ≡ Ᏺ 4, 18
CME H 0′′′
Ᏺ4,18
Ᏺ2,18 Ᏺ2,18
0,90
0,1 0,1 0,1
0,90 0,90
T..2 2.1752
SCT = ∑ ∑ ∑ xijk
2
− = 176.049 − = 840,67
i j k rsn 27
1 T2 1 2.1752
SCA = ∑
ns i
Ti.2 − .. = (712 2 + 7152 + 7482 ) −
rsn 9 27
= 88,67
1 T2 1 2.1752
SCB = ∑
rn j
T. 2j − .. = (7232 + 7212 + 7312 ) −
rsn 9 27
= 6,22
1 1
SCE = ∑ ∑ ∑ xijk
2
− ∑ ∑ Tij2 = 176.049 − (236 2 + 236 2 + 240 2 + 2232 +
i j k n i j 3
Como:
Muestreo
en poblaciones finitas
Número de concejales
Número de municipios
obtenidos por municipio
0 2
1 7
2 5
3 7
4 8
5 10
6 5
7 3
8 2
9 1
Con un 99 % de confianza:
a) Obtenga la información requerida con estos datos muestrales indicando el error
de muestreo cometido.
b) Si se hubiera querido un error de muestreo inferior a 150 concejales, ¿cuántos
municipios habrían sido necesarios seleccionar?
T̂ = N x
S
eT = zα / 2 N ( N − n)
n
donde S es la desviación típica muestral, n el tamaño de muestra y za/2 el valor tal que,
en una distribución N(0, 1), deja a su derecha una probabilidad de a/2, siendo 1 – a el
nivel de confianza.
En este caso:
1 − α = 0,99 ⇒ α / 2 = 0,005
P( Z zα / 2 ) = 1 − α / 2 = 0,995 ⇒ zα / 2 = 2,575
xi ni xi n i xi2 ni
0 2 0 0
1 7 7 7
2 5 10 20
3 7 21 63
4 8 32 128
5 10 50 250
6 5 30 180
7 3 21 147
8 2 16 128
9 1 9 81
n = 50 196 1.004
N = 300 ; n = 50
1 k 196
x= ∑
n i =1
xi ni =
50
= 3,92
( ∑ xi ) 2
冤∑ xi2ni − 冥 冤 冥
k
1 1 196 2
s2 = = = 1.004 − = 4,8098
n −1 i =1 n 49 50
s 4,8098
eT = zα / 2 N ( N − n) = 2,575 ⋅ 300(300 − 50) = 218,7189
n 50
N 2 zα2 / 2 S 2
n=
eT2 + Nzα2 / 2 S 2
10.000
T= ∑ Xi
i =1
1
En este capítulo, las aproximaciones en el cálculo de tamaños muestrales se realizan por exceso para garantizar
un error de muestreo inferior o igual al fijado.
N n
T̂ = N x = ∑ xi
n i =1
S
eT = zα / 2 N ( N − n)
n
P( Z zα / 2 ) = α / 2 = 0,025 ⇒ zα / 2 = 1,96
x = 7.500
s = 3.000
冤
IT = [ N x − eT ; N x + eT ] = 10.000 ⋅ 7.500 − 1,96 10.000(10.000 − 36)
3.000
36
;
b) Para conseguir una estimación de la cantidad total que se le adeuda, con un error
inferior a eT = 2.500.000, se debería haber elegido una muestra de tamaño superior a:
100 100
∑ xi = 2.500 euros ; ∑ xi2 = 64.975 (euros)2
i =1 i =1
冤
Iμ = x − zα / 2
N−n S
N n
; x + zα / 2
N−n S
N n 冥
siendo za/2 el cuantil 1 – a/2 de una distribución N(0, 1), es decir:
P( Z zα / 2 ) = 1 − α / 2
1 n 2.500
x= ∑
n i =1
xi =
100
= 25 euros
i =1 i =1
s= s2 = 25 = 5 euros
y así, el intervalo de confianza para el gasto medio por persona adulta es, en euros:
冤
Iμ = 25 − 1,96
500 − 100
500
5
100
; 25 + 1,96
500 − 100
500
5
100 冥=
= [24,123; 25,877]
zα2 / 2 ⋅ N ⋅ S 2
n=
eμ2 N + zα2 / 2 S 2
1,96 2 ⋅ 500 ⋅ 25
n= = 127,2761 ≈ 128
0,752 ⋅ 500 + 1,96 2 ⋅ 25
Por tanto, para que el error no supere los 75 céntimos de euro, debería haberse en-
trevistado al menos a 128 personas.
Otra forma de obtener este valor sería calculando, en primer lugar, el tamaño mues-
tral que correspondería a una población infinita y, luego, realizar la corrección por fini-
tud si ésta fuera necesaria, es decir, si la fracción de muestreo obtenida con este tamaño
superase el 1 %:
zα2 / 2 s 2 1,96 2 ⋅ 25
n∞ = = = 170,7378 ≈ 171
eμ2 0,752
n∞ 171
f = = = 0,342 > 0,01
N 500
n∞ 171
n= = = 127, 4218 ≈ 128
n∞ 1 + 0,342
1+
N
c) Si se desea estimar una proporción al 95 % de confianza y con un error de
muestreo:
eP 0,10
zα2 / 2 Npq
n=
eP2 ( N − 1) + zα2 / 2 pq
pq
1/4
0 0,5 1 p
2
Algunos autores prefieren utilizar el estimador de varianza Vâr[P̂] en lugar de Var[P̂] a la hora de calcular el
error de muestreo; así:
N−n pq
eP = zα / 2 Vâr [ Pˆ ] = zα / 2
N n −1
y, despejando de esta fórmula, quedaría:
N (eP2 + zα2 / 2 pq )
n=
NeP2 + zα2 / 2 pq
y así:
Del mismo modo que en el apartado anterior, también aquí podría haberse obtenido
el tamaño muestral correspondiente a una población infinita, n • , y realizar, en caso
necesario, la corrección por finitud:
zα2 / 2 pq 1,96 2 ⋅ 0, 5 ⋅ 0, 5
n∞ = = = 96,04 ≈ 97
eP2 0,10 2
n∞ 97
f = = = 0,194 > 0,01
N 500
n∞ 97
n= = = 81,24 ≈ 82 personas
n∞ 1 + 0,194
1+
N
zα2 / 2 Npq
n=
eP2 ( N − 1) + zα2 / 2 pq
1 − α = 0,90 ⇒ α = 0,10
α 0,10
P( Z zα / 2 ) = 1 − = 1− = 0,95
2 2
zα / 2 = 1,645
pq = p(1 – p)
0 1/2 1 p
3
También se puede utilizar, según se ha explicado en el problema 5.3, la fórmula:
N (eP2 + zα2 / 2 pq )
n=
NeP2 + zα2 / 2 pq
y así:
Por tanto:
1,6452 ⋅ 1.250 ⋅ 0,5 ⋅ 0,5
n= = 45,2968 ≈ 46
0,12 2 ⋅ 1.249 + 1,6452 ⋅ 0,5 ⋅ 0,5
n∞ 47
n= = = 45,2968 ≈ 46
n∞ 1 + 0,0376
1+
N
b) Si se estima que la proporción oscilará entre el 75 % y el 85 %, entonces, en la
fórmula para obtener el tamaño muestral:
zα2 / 2 Npq
n=
eP2 ( N − 1) + zα2 / 2 pq
se utilizará el valor p = 0,75, pues es el que proporciona mayor variabilidad entre los
posibles:
pq = p(1 – p)
0,25
0,1875
0,1275
n∞ 36
n= = = 34,9922 ≈ 35
n∞ 1,0288
1+
N
1 n
P̂ = p = ∑ ai
n i =1
siendo:
n = 100
100
∑ ai = 100 − 35 = 65
i =1
4
Sustituyendo en la otra fórmula, quedaría:
65
Pˆ = p = = 0,65
100
Media muestral
Tamaños Tamaños del consumo Varianza muestral
Estratos
poblacionales muestrales anual de leche (litros)2
(litros)
Utilizando un 95 % de confianza:
a) Estime la cantidad total de leche consumida al año entre los menores de 25
años, indicando el error de muestreo cometido.
b) Calcule el tamaño muestral necesario para estimar el consumo medio de leche
al año entre los mayores de 50 años con un error de muestreo de cinco litros.
c) Estime, mediante un intervalo de confianza, el consumo anual de leche por
habitante.
d) Para realizar un estudio similar, se va a permitir triplicar el tamaño de la mues-
tra. Reparta la nueva muestra entre los tres estratos según los diferentes crite-
rios, indicando qué reparto es el más eficiente.
5
O bien:
s1 15.876
eT1 = zα / 2 N1 ( N1 − n1 ) = 1,96 48.000( 48.000 − 1.460) =
n1 1.460
= 305.480,8545 litros
P( Z zα / 2 ) = 1 − α / 2 = 0,975 ⇒ zα / 2 = 1,96
c) Para estimar el consumo medio anual por habitante en esta ciudad, utilizaremos
el estimador de la media global en el muestreo estratificado y, por tanto, el intervalo de
confianza será:
Iμ = [ μˆ ST − eμ ; μˆ ST + eμ ]
siendo
L L
1
μˆ ST = ∑ Wh xh = N
∑ Nh xh
h =1 h =1
L
Sh2
eμ = zα / 2 ∑ Wh2 (1 − fh ) nh
h =1
Así pues:
1
μˆ ST = ( 48.000 ⋅ 102,7 + 38.000 ⋅ 71,4 + 24.000 ⋅ 73,2) = 85,451 litros
110.000
冤冢110 冣 ⋅ 冢1 − 冣 +冢 冣 ⋅ 冢1 − 冣
48.000 2 1.460 15.876 38.000 1.160 2
48.841
eμ = 1,96 ⋅ ⋅ +
.000 48.000 1.460 110.000 38.000 1.160
冢 冣冢
24.000 2
冣 冥
1.730 23.409 1/ 2
+ ⋅ 1− ⋅ = 5,35 litros
110.000 24.000 1.730
y, por tanto:
nh wh n wh · 13.050 ; h 1, 2, 3
Afijación uniforme
1 1
wh = = , h = 1, 2, 3
L 3
1 13.050
n1 = n2 = n3 = n= = 4.350
L 3
es decir, en cada estrato se tomaría una muestra aleatoria simple de 4.350 personas.
Afijación proporcional
Nh
wh = , h = 1, 2, 3
N
N1 48.000
n1 = n= 13.050 = 5.694,5455 ≈ 5.695
N 110.000
N2 38.000
n2 = n= 13.050 = 4.508,1818 ≈ 4.508
N 110.000
N3 24.000
n3 = n= 13.050 = 2.847,2727 ≈ 2.847
N 110.000
Nh Sh
wh = L , h = 1, 2, 3
∑ Ni Si
i =1
L
∑ Ni si = 48.000 15.876 + 38.000 48.841 + 24.000 23.409 = 18.118.000
i =1
48.000 ⋅ 15.876
n1 = ⋅ 13.050 = 4.356,2424 ≈ 4.356
18.118.000
38.000 ⋅ 48.841
n2 = ⋅ 13.050 = 6.048,8961 ≈ 6.049
18.118.000
24.000 ⋅ 23.409
n3 = ⋅ 13.050 = 2.644,8615 ≈ 2.645
18.118.000
y este último es el reparto más eficiente entre los estratos, pues minimiza la varianza
del estimador.
zα2 / 2 N2 p2 q2
n=
eP22 ( N2 − 1) + zα2 / 2 p2 q2
pq = p(1 – p)
0,25
0 0,5 1 p
Así:
1,96 2 ⋅ 38.000 ⋅ 0,5 ⋅ 0,5
n= = 380,3251 ≈ 381 personas
0,052 ⋅ (37.999) + 1,96 2 ⋅ 0,5 ⋅ 0,5
pq = p(1 – p)
0,25
0,24
0 0,5 0,6 1 p
6
Si se utiliza la fórmula:
N (eP22 + zα2 / 2 p2 q2 )
n=
NeP22 + zα2 / 2 p2 q2
7
Utilizando la fórmula de la nota anterior obtendríamos n = 366,24 ≈ 367.
冤
IT1 = N1 X1 − zα / 2 N1 ( N1 − n1 )
S1
n1
; N1 X1 + zα / 2 N1 ( N1 − n1 )
S1
n1 冥
donde, para una confianza del 99 %, el valor za/2 es tal que:
冤
IT1 = 2.900 ⋅ 1.205 − 2,575 2.900(2.900 − 666)
380
666
;
b) En este caso, al tratarse del salario medio global, deberemos aplicar el estimador
del muestreo aleatorio estratificado:
L
μ̂ ST = ∑ Wh xh
h =1
N1 2.900
W1 = = = 0,29
N 10.000
N2 4.700
W2 = = = 0, 47
N 10.000
N3 2.400
W3 = = = 0,24
N 10.000
μˆ ST = 0,29 ⋅ 1.205 + 0, 47 ⋅ 1.630 + 0,24 ⋅ 1.950 = 1.583,55 euros
332 © Ediciones Pirámide
Muestreo en poblaciones finitas
L
S2
eμ = zα / 2 ∑ Wh2 (1 − fh ) nh
h =1 h
eμ = 2,575 0,29 2 1 − 冉 冊
666 380 2
2.900 666
+ 0, 472 1 − 冉
754 350 2
4.700 754
冊
+ 0,24 2 1 −
580 400 2
2.400 580
冉= 冊
= 19,31 euros
c) El reparto muestral más eficiente será el que se obtenga por medio del criterio
de afijación óptima de mínima varianza. Veamos si los tamaños muestrales que tenemos
en cada estrato coinciden con los que proporcionará este criterio:
Nh Sh
nh = wh n = L ⋅n
∑ Ni Si
i =1
con
2.900 ⋅ 380
n1 = ⋅ 2.000 = 594,5508 ≈ 595
3.707.000
4.700 ⋅ 350
n2 = ⋅ 2.000 = 887,5101 ≈ 887
3.707.000
2.400 ⋅ 400
n3 = ⋅ 2.000 = 517,9390 ≈ 518
3.707.000
L
P̂ST = pST = ∑ Wh ph
h =1
375
p1 = = 0,5631
666
150
p2 = = 0,1989
754
90
p3 = = 0,1552
580
L
Nh − nh ph qh
eP = zα / 2 ∑ Wh2 ⋅
Nh − 1 nh
=
h =1
2.900 − 666 0,5631 ⋅ 0, 4369 4.700 − 754 0,1989 ⋅ 0,8011 2.400 − 580 0,1552 ⋅ 0,8448
= 2,575 0,29 2 ⋅ + 0, 472 ⋅ + 0,24 2 ⋅ =
2.899 666 4.699 754 2.399 580
= 0,022
8
Otros autores consideran:
L
Nh − nh ph qh
eP = zα / 2 Vâr [ p] = zα / 2 ∑ Wh2 Nh
⋅
nh − 1
h =1
donde se ha utilizado como valor de p3 = 0,5, puesto que no se tiene información anterior
sobre la proporción de trabajadores de más de 50 años que padecieron enfermedades por
motivos laborales.
Por tanto, para estimar esta proporción con un error de muestreo no superior al 6 %
habrá que seleccionar al menos 387 trabajadores entre el grupo de los mayores de 50
años. Otra forma de llegar al mismo resultado es obteniendo primero el tamaño muestral
que correspondería a una población infinita:
n∞ 3 461
f3 = = = 0,1921 > 0,01
N3 2.400
n∞ 3 461
n3 = = = 386,7125 ≈ 387
n∞ 3 11921
,
1+
N3
9
O bien con la expresión:
Número total Número de fincas Superficie media Desviación típica Número de fincas
Zonas
de fincas seleccionadas muestral (Ha.) muestral (Ha.) barbecho
Utilizando un 99 % de confianza:
a) Obtenga la superficie total del terreno agrícola en cada una de las zonas, esti-
mando en cada caso su error de muestreo.
b) ¿Qué tamaños muestrales habrían sido necesarios para realizar las estimaciones
anteriores con unos errores de muestreo estimados inferiores a 1.000 hectáreas?
c) Estime la superficie media de las fincas de la comunidad autónoma mediante el
correspondiente intervalo de confianza.
d) ¿Cuál sería el reparto más eficiente de la muestra anterior en las tres zonas para
realizar la estimación de la superficie media?
e) ¿Qué tamaño muestral y qué reparto por zona se debería haber realizado para
estimar, del modo más eficiente posible, la superficie total del terreno agrícola de
la comunidad autónoma con un error de muestreo no superior a 1.000 hectáreas?
f) Calcule el porcentaje global de fincas en barbecho indicando su error de mues-
treo.
Tˆh = Nh xh
Sh
eTh = zα / 2 Nh ( Nh − nh ) , h = 1, 2, 3
nh
α 0,01
P( Z zα / 2 ) = = = 0,005 ⇒ zα / 2 = 2,575
2 2
Zona A
3,5
eT1 = 2,575 3.200(3.200 − 380) = 1.388,8426 hectáreas
380
Zona B
6,7
eT2 = 2,575 5.600(5.600 − 800) = 3.162, 4355 hectáreas
800
Zona C
8
eT3 = 2,575 1.200(1.200 − 200) = 1.595,6691 hectáreas
200
Zona A
Zona B
Zona C
1.200 2 ⋅ 2,5752 ⋅ 82
n3 = = 404,8936 ≈ 405
1.000 2 + 1.200 ⋅ 2,5752 ⋅ 82
L
μˆ ST = x = ∑ Wh xh
h =1
L
S2
eμ ST = zα / 2 ∑ Wh2 (1 − fh ) nh
h =1 h
siendo:
xh = media muestral del estrato h.
Nh
Wh = = ponderación del estrato h.
N
nh
fh = = fracción de muestreo en el estrato h.
Nh
L
N= ∑ Nh = 3.200 + 5.600 + 1.200 = 10.000
h =1
N1 3.200 n1 380
W1 = = = 0,32 ; f1 = = = 0,1188
N 10.000 N1 3.200
N2 5.600 n2 800
W2 = = = 0,56 ; f2 = = = 0,1429
N 10.000 N2 5.600
N3 1.200 n3 200
W3 = = = 0,12 ; f3 = = = 0,1667
N 10.000 N3 1.200
Así:
3,52 6,72 82
eμ ST = 2,575 0,32 2(1 − 0,1188) ⋅ + 0,56 2(1 − 0,1429) ⋅ + 0,12 2(1 − 0,1667) ⋅ =
380 800 200
= 0,3805 hectáreas
Nh Sh
nh = wh n = L ⋅n , h = 1,..., L
∑ Ni Si
i =1
L
∑ Ni Si = 3.200 ⋅ 3,5 + 5.600 ⋅ 6,7 + 1.200 ⋅ 8 = 58.320
i =1
los tamaños muestrales que corresponderían a cada estrato, teniendo en cuenta que el
tamaño muestral global ha de ser:
serán:
3.200 ⋅ 3,5
n1 = ⋅ 1.380 = 265,0205 ≈ 265
58.320
5.600 ⋅ 6,7
n2 = ⋅ 1.380 = 887,8189 ≈ 888
58.320
1.200 ⋅ 8
n3 = ⋅ 1.380 = 227,1605 ≈ 227
58.320
L
Nh2 Sh2
∑
h = 1 wh
n= L
eT2
+ ∑ Nh Sh2
zα2 / 2 h = 1
donde las cantidades wh serán las correspondientes al criterio de afijación óptima de mí-
nima varianza para que el reparto de la muestra por zonas sea el más eficiente posible:
Nh Sh
wh = L , h = 1,..., L
∑ Nh Sh
i =1
3.200 ⋅ 3,5
w1 = = 0,1920
58.320
5.600 ⋅ 6,7
w2 = = 0,6433
58.320
1.200 ⋅ 8
w3 = = 0,1646
58.320
Entonces:
nh = wh ⋅ n , h = 1,..., L
f) Para h = 1, 2, 3, definimos:
L L
N Nh Nh
P= ∑ Nh Ph = ∑ ∑ aih
h =1 h =1 N i =1
L
pST = ∑ Wh ph
h =1
L
Nh − nh ph qh
eP = zα / 2 Var [ pST ] = zα / 2 ∑ Wh2 ⋅
Nh − 1 nh
h =1
1 n1 124
p1 = ∑ ai1 = 380 = 0,3263
n1 i = 1
n2
1 250
p2 =
n2
∑ ai 2 = 800 = 0,3125
i =1
n3
1 17
p3 =
n3
∑ ai3 = 200 = 0,085
i =1
10
Otros autores consideran:
L
Nh − nh ph qh
eP = zα / 2 Vâr [ pST ] = zα / 2 ∑ Wh2 Nh
⋅
n
−1
h =1
124 250 17
pST = 0,32 ⋅ + 0,56 ⋅ + 0,12 ⋅ = 0,2896
380 800 200
eP =
3.200 − 380 0,3263 ⋅ 0,6737 5.600 − 800 0,3125 ⋅ 0,6875 1.200 − 200 0,085 ⋅ 0,915
= 2,575 0,32 2 ⋅ + 0,56 2 ⋅ + 0,12 2 ⋅ =
3.200 − 1 380 5.600 − 1 800 1.200 − 1 200
= 0,0293
Definimos:
Solución
11
Puede comprobarse que utilizando la fórmula de la nota 10 se obtiene, aproximadamente, el mismo valor para
el error de muestreo.
L
P= ∑ Wh Ph
h =1
Nh
1
Ph =
Nh
∑ aih
i =1
L
P̂ST = pST = ∑ Wh ph
h =1
L
Nh − nh ph qh
eP = zα / 2 Var [ pST ] = zα / 2 ∑ Wh2 ⋅
Nh − 1 nh
h =1
800
p1 = = 0,7619
1.050
600
p2 = = 0,6667
900
1.300
p3 = = 0,7647
1.700
12
Algunos autores prefieren, como ya se comentó en la nota 8:
L
Nh − nh ph qh
eP = zα / 2 Vâr [ pST ] = zα / 2 ∑ Wh2 Nh
⋅
nh − 1
h =1
N1 N n
n1 = ⋅ n ⇒ W1 = 1 = 1
N N n
N2 N n
n2 = ⋅ n ⇒ W2 = 2 = 2
N N n
N3 N n
n3 = ⋅ n ⇒ W3 = 3 = 3
N N n
donde:
Por tanto:
N1 n1 1.050 1.050
W1 = = = ⇒ N1 = ⋅ 10.000 = 2.877
N n 3.650 3.650
N2 n2 900 900
W2 = = = ⇒ N2 = ⋅ 10.000 = 2.466
N n 3.650 3.650
N3 n3 1.700 1.700
W3 = = = ⇒ N3 = ⋅ 10.000 = 4.658
N n 3.650 3.650
y así:
Por tanto, el 73,97 % de los apartamentos estarían disponibles para ser alquilados al
menos un mes al año, con un error de muestreo estimado en13:
13
Utilizando la fórmula de la nota anterior se obtiene aproximadamente el mismo resultado.
eP = 1,645 冤冢 3.650冣
1.050 2 2.877 − 1.050 0,7619 ⋅ 0,2381
⋅
2.876
⋅
1.050
+
冢 3900
.650 冣
2.466 − 900 0,6667 ⋅ 0,3333
2
+ ⋅ ⋅ +
2.465 900
Centro Número Gasto semanal medio Número de alumnos que han probado drogas
de ESO de alumnos en tabaco (euros) alguna vez (excluidos tabaco y alcohol)
a) Obtenga, con una confianza del 90 %, una estimación para el gasto semanal
medio en tabaco entre los estudiantes de Enseñanza Secundaria Obligatoria del
municipio, mediante el correspondiente intervalo de confianza.
b) Estime, con la misma confianza anterior, el número total de alumnos de ESO
que han consumido drogas alguna vez (excluyendo tabaco y alcohol) indicando
el error de muestreo cometido.
I μ = [ X c − e μ ; X c + eμ ]
–
siendo Xc y e m el estimador puntual y el error de muestreo correspondiente al muestreo
por conglomerados:
1 m Ni 1 m 1 m
μˆ c = Xc = ∑ ∑
n i =1 j =1
xij = ∑ ti = ∑ Ni Xi
n i =1 n i =1
m
n= ∑ Ni
i =1
eμ = zα / 2 Vâr [ Xc ] = zα / 2
m
n2
冉 M−m 2
M
St冊
1 m 2
St2 = ∑ Ni ( Xi − Xc )2
m − 1 i =1
Por tanto:
– – –
Ni Xi Xi – Xc
9.363
1
St2 = [2.000 2 (0,94)2 + 1.5312 ( − 2,06)2 + 1.8972 ( − 2,56)2 + 2.5352 (2,44)2 +
5 −1
+ 1.400 2 ( − 0,06)2 ] = 18.832.826,5
za/2 = 1,645
y, por tanto:
5 15 − 5
eμ = 1,645 2
⋅ ⋅ 18.832.826,5 = 1,39 euros
9.363 15
M m
T̂c = Mt = ∑ ti
m i =1
Ni
ti = ∑ yij
j =1
eT = zα / 2 Vâr (Tˆc ) = zα / 2 M 2
M
冉
M − m St2
⋅
m
冊
donde:
1 m
冤∑ ti2 − m 冢∑ ti 冣 冥
m m 2
1 1
St2 = ∑
m − 1 i =1
( ti − t ) 2 =
m −1 i =1 i =1
ti ti2
480 230.400
225 50.625
238 56.644
300 90.000
128 16.384
1.371 444.053
15
Tˆc = ⋅ 1.371 = 4.113 alumnos
5
st2 =
1
5 −1 冤 1
444.053 − (1.371)2 = 17.031,2
5 冥
15 − 5 17.031,2
eT = 1,645 152 ⋅ ⋅ = 1.175,8425
15 5
Número de institutos
Número Número total
Distrito en los que los alumnos
de institutos de ordenadores
tienen acceso a Internet
III 15 666 12
III 10 525 6
III 13 585 9
IV 20 1.160 19
1 m
μ̂c = Xc = ∑ ti
n i =1
m
n= ∑ Ni = 15 + 10 + 13 + 20 = 58
i =1
m M−m 2
eμ = zα / 2 Vâr [ Xc ] = zα / 2 ⋅ ⋅ St
n2 M
1 m 2
St2 = ∑ Ni ( Xi − Xc )2
m − 1 i =1
Por tanto:
1
μˆ c = Xc = (666 + 525 + 585 + 1.160) = 50,62
58
– – –
Ni ti Xi = ti /Ni Xi – Xc
2.936
1
st2 = [152 ( − 6,22)2 + 10 2 (1,88)2 + 132 ( − 5,62)2 + 20 2 (7,38)2 ] = 12.060,6179
4 −1
Para una confianza del 95 %, tenemos que:
P( Z zα / 2 ) = 1 − α / 2 = 0,025 ⇒ zα / 2 = 1,96
4 10 − 4
eμ = 1,96 ⋅ ⋅ 12.060,6179 = 5,7493
582 10
Así pues, la estimación del número medio de ordenadores por instituto es de 50,62
con un error de muestreo de ± 5,7493.
b) Sea ahora la variable aleatoria Y la que toma el valor 1 si en un instituto los
alumnos tienen acceso a Internet, y 0 en otro caso. Se trata de estimar la proporción
poblacional mediante la información proporcionada por una muestra obtenida mediante
un muestreo aleatorio por conglomerados. Entonces, el estimador puntual y el error de
muestreo cometido serán:
1 m
Pˆc = ∑ Ni Pi
n i =1
eP = zα / 2
m
n2
冉 M−m 2
M
S pˆ冊
siendo:
m
n= ∑ Ni
i =1
1 m 2
S p2ˆ = ∑
m − 1 i =1
Ni ( Pi − Pˆc )2
Por tanto:
Ni
Ni ∑ yij p̂i Pi – P̂c
j =1
15 12 0,80 0,01
10 6 0,60 – 0,19
13 9 0,69 – 0,10
20 19 0,95 0,16
n = 58
1
Pˆc = [15 ⋅ 0,8 + 10 ⋅ 0,6 + 13 ⋅ 0,69 + 20 ⋅ 0,95] = 0,79
58
1
s 2pˆ = [152 (0,01)2 + 10 2 ( − 0,19)2 + 132 ( − 0,1)2 + 20 2 (0,16)2 ] = 5,1875
4 −1
4 10 − 4
eP = 1,96 ⋅ ⋅ 5,1875 = 0,1192
582 10
N 2 (1 − f ) 2
eT = zα / 2 S
n
siendo:
1 n
冤∑ xi2 − n 冢∑ xi 冣 冥
n n 2
1 1
S2 = ∑
n − 1 i =1
( xi − x ) 2 =
n −1 i =1 i =1
P( Z zα / 2 ) = 1 − α / 2
0,05
P( Z zα / 2 ) = 1 − = 0,975
2
zα / 2 = 1,96
15
∑ xi = 18 miles de litros
i =1
15
∑ xi2 = 263,1 (miles de litros)2
i =1
Así pues:
15
Tˆ = k ∑ xi = 10 ⋅ 18 = 180 miles de litros
i =1
s2 =
1
14 冤 1
冥
263,1 − (18)2 = 17,25 (miles de litros)2
15
eT = 1,96 150 1 − 冉 冊
15 17,25
150 15
= 24, 42 miles de litros
10 10
∑ xi = 65 ; ∑ xi2 = 532,75
i =1 i =1
N 300
k= = = 30
n 10
pues elige un alumno de cada hoja (n = 10). Para estimar la media poblacional utiliza-
remos la media muestral:
1 n
μ̂ = x = ∑ xi
n i =1
S2
eμ = zα / 2 (1 − f )
n
65
μˆ = = 6,5
10
15
Recordemos que en el muestreo sistemático no existe un estimador insesgado para Var [x–].
s2 =
1
10 − 1 冤
532,75 −
652
10 冥
= 12,25
eμ = 1,96 冉1−
300
冊
10 12,25
⋅
10
= 2,13
donde za/2 = 1,96 ha sido obtenido a partir de la tabla 7, teniendo en cuenta que:
P( Z zα / 2 ) = 1 − α / 2 = 1 − 0,025 = 0,975
14 30 17 8 10 23 6 19 15 12
冤
Iμ = x − zα / 2
N−n S
N n
; x + zα / 2
N−n S
N n 冥
354 © Ediciones Pirámide
Muestreo en poblaciones finitas
P( Z zα / 2 ) = 1 − α / 2
P( Z zα / 2 ) = 0,975 ⇒ zα / 2 = 1,96
1 n 154
X = ∑
n i =1
xi =
10
= 15, 4 euros
冤∑ xi2 − n 冢∑ xi 冣 冥 = 9 冤2.844 − 冥
n n
1 1 2 1 154 2
S2 = = 52, 49 (euros)2
n −1 i =1 i =1 10
Sustituyendo en el intervalo anterior para evaluar el gasto medio diario de los alum-
nos de este centro, tenemos:
冤
Iμ = 15, 4 − 1,96
1.200 − 10 7,24
1.200 10
; 15, 4 + 1,96
1.200 − 10 7,24
1.200 10
= 冥
= [15, 4 − 4, 47; 15, 4 + 4, 47] = [10,93; 19,87]
Definimos:
1 n
P̂ = p = ∑ ai
n i =1
b) Puesto que de los 10 encuestados hay seis que gastan una cantidad inferior o
igual a 15 euros, entonces S ai = 6 y:
6
p= = 0,6 ⇒ 60 %
10
c) El tamaño muestral necesario para estimar el gasto medio con un error de mues-
treo de ± 2 euros se obtiene mediante la expresión:
zα2 / 2 ⋅ N ⋅ S 2
n=
eμ2 N + zα2 / 2 S 2
zα2 / 2 Npq
n=
e 2p ( N − 1) + zα2 / 2 pq
Para que el error en la estimación sea como máximo del 10 % habría que entrevistar
al menos a 89 alumnos de este centro.
200 200
∑ xi = 30,25 miles de euros ; ∑ xi2 = 112,3 (miles de euros)2
i =1 i =1
10.000
T= ∑ Xi
i =1
IT = [Tˆ − eT ; Tˆ + eT ]
siendo:
N n
Tˆ = N x = ∑ xi
n i =1
S
eT = zα / 2 N ( N − n)
n
y za/2 es el percentil 1 – a/2 de una N(0, 1). Para un nivel de confianza 1 – a = 0,95:
P( Z zα / 2 ) = 1 − α / 2 = 0,975 ⇒ zα / 2 = 1,96
200
10.000
∑ xi = 30,25 ⇒ Tˆ =
200
⋅ 30,25 = 1.512,5
i =1
( ∑ xi ) 2
冤∑ xi2 − 冥 冤 冥
n
1 1 30,252
s2 = = 112,3 − = 0,5413
n −1 i =1 n 199 200
Entonces:
0,5413
eT = 1,96 10.000(10.000 − 200) = 1.009, 42
200
b) Para obtener el tamaño muestral necesario para estimar una proporción con un
error de muestreo fijado (ep = 0,12) podemos utilizar la expresión:
zα2 / 2 Npq
np =
e 2p ( N − 1) + zα2 / 2 pq
d) ¿Cuál hubiera sido el reparto muestral más eficiente entre las distintas zonas
para evaluar el importe medio de las sanciones?
zα2 / 2 N A pA q A
nA =
e 2pA ( N A − 1) + zα2 / 2 pA q A
Puesto que el nivel del confianza es del 95 %, el valor za/2, tal que:
0,05
P( Z zα / 2 ) = 1 − α / 2 = 1 − = 0,975
2
pA = 0,55
y, por tanto:
qA = 0,45
50
PˆC = = 0,17
300
= 0,0403
Iμ ST = [ μˆ ST − eμ ST ; μˆ ST + eμ ST ]
siendo:
L L
Nh 5.200 1.800 3.000
μˆ ST = ∑ Wh xh = ∑ xh = ⋅ 75 + ⋅ 150 + ⋅ 90 =
h =1 h =1 N 10.000 10.000 10.000
eμ ST = zα / 2 Vâr [ μˆ ST ]
L
S2
Vâr [ μˆ ST ] = ∑ Wh2 (1 − fh ) nh
h =1 h
nh
fh =
Nh
Así:
10 2 252 152
Vâr [ μˆ ST ] = 0,52 2 (1 − 0,1) ⋅ + 0,182 (1 − 0,1) ⋅ + 0,32 (1 − 0,1) ⋅ =
520 180 300
= 0,2088
Por tanto, el intervalo de confianza para el importe medio de las sanciones será:
nh = wh n; h = 1,..., L = 3
donde
n = n1 + n2 + n3 = 1.000
Nh Sh
wh = L
∑ Ni Si
i =1
Puesto que:
Nh Sh Nh S h wh
142.000
entonces tendremos:
nh = wh n = wh ⋅ 1.000
n1 = 0,366 ⋅ 1.000 = 366 expedientes sancionadores
n2 = 0,317 ⋅ 1.000 = 317 expedientes sancionadores
n3 = 0,317 ⋅ 1.000 = 317 expedientes sancionadores
Teoría de la decisión
10.000 10 10 2
20.000 25 5 – 10
30.000 40 –5 – 20
m
VME( ai ) = ∑ rij ⋅ P(θ j )
j =1
y llamando:
a1: «Producir 10.000 unidades».
a2: «Producir 20.000 unidades».
a3: «Producir 30.000 unidades».
q1: «Estabilidad».
q2: «Baja conflictividad».
q3: «Alta conflictividad».
tenemos:
P(θ1 ) = 0,6
P(θ 2 ) = 0,3
P(θ 3 ) = 0,1
y así:
3
VME( a1 ) = ∑ r1 j ⋅ P(θ j ) = 10 ⋅ 0,6 + 10 ⋅ 0,3 + 2 ⋅ 0,1 = 9,2 millones de euros
j =1
3
VME( a2 ) = ∑ r2 j ⋅ P(θ j ) = 25 ⋅ 0,6 + 5 ⋅ 0,3 − 10 ⋅ 0,1 = 15,5 millones de euros
j =1
3
VME( a3 ) = ∑ r3 j ⋅ P(θ j ) = 40 ⋅ 0,6 − 5 ⋅ 0,3 − 20 ⋅ 0,1 = 20,5 millones de euros
j =1
Como:
entonces:
a* = a3
3
VMEIP = ∑ V *(θ j ) ⋅ P(θ j )
j =1
donde V*(qj) = máx rij = Resultado óptimo bajo el estado qj. En este caso:
i
V *(θ 2 ) = 10
V *(θ 3 ) = 2
con lo cual:
Como el valor monetario esperado máximo era el de a3, 20,5 millones de euros, se
tiene que:
siendo ésta la cantidad que estaría dispuesta a pagar, como máximo, la empresa por el
informe sobre la futura situación del país.
A las mismas conclusiones sobre los apartados a) y b) se podría haber llegado uti-
lizando el criterio de la Pérdida de Oportunidad Esperada (POE), que también se aplica
en situaciones bajo riesgo. Para aplicar este criterio, calculamos las pérdidas relativas
asociadas a cada alternativa y estado de la naturaleza:
R(ai, qj) q1 q2 q3
a1 30 0 0
a2 15 5 12
a3 0 15 22
donde:
R( a1 , θ1 ) = V *(θ1 ) − r11 = 40 − 10 = 30
R( a2 , θ1 ) = V *(θ1 ) − r21 = 40 − 25 = 15
R( a3 , θ1 ) = V *(θ1 ) − r31 = 40 − 40 = 0
y así sucesivamente.
A partir de esta tabla calculamos las pérdidas de oportunidad esperadas asociadas
a cada alternativa:
m
POE( ai ) = ∑ R(ai , θ j ) ⋅ P(θ j )
j =1
3
POE( a1 ) = ∑ R(a1, θ j ) ⋅ P(θ j ) = 30 ⋅ 0,6 + 0 ⋅ 0,3 + 0 ⋅ 0,1 = 18 millones de euros
j =1
es decir:
La cantidad máxima que la empresa estaría dispuesta a pagar por el informe será de
nuevo el valor esperado de la información perfecta, que ahora se puede obtener como:
,6) R1 = 10
idad (0
Estabil
Conflictividad baja (0,3)
A R2 = 10
des Confli
nida ctivida
d alta (
0u 0,1) R3 = 2
.00
10
u cir
od ,6) R4 = 25
Pr idad (0
Estabil
Producir 20.000 unidades Conflictividad baja (0,3)
I B R5 = 5
Pr
od Confli
uc ctivida
ir 3 d alta (
0.0 0,1) R6 = –10
00
un
ida
de ,6) R7 = 40
s idad (0
Estabil
Conflictividad baja (0,3)
C R8 = –5
Confli
ctivida
d alta (
0,1) R9 = –20
En el único punto de decisión (I) del árbol, debemos elegir la alternativa que dé
lugar al beneficio esperado máximo; por esta razón habrá que calcular el valor esperado
de los nodos de acontecimientos A, B y C:
Resultado final
Predicción
Reducido Medio Grande
Reducido 15 10 1
Medio 2 25 9
Grande 0 10 28
Se pide que:
a) Analice si BRD debe pedir el informe e indique, en cualquier caso, la secuencia
de decisiones que debe seguir.
b) Determine la cantidad máxima que BRD estaría dispuesta a pagar por el informe.
rme
ar info
So licit
I
No
soli
cita
r inf
orm
e
P( R) = 0, 4
P( M ) = 0,2
P(G) = 0, 4
Nos serán útiles las probabilidades de aciertos y fallos de ALPROSP al emitir este
tipo de informes. Éstas son las siguientes:
15 2 0
P( PR / R) = ; P( PM/ R) = ; P( PG / R) = =0
17 17 17
10 25 10
P( PR / M ) = ; P( PM/ M ) = ; P( PG / M ) =
45 45 45
1 9 28
P( PR / G) = ; P( PM/ G) = ; P( PG / G) =
38 38 38
Además, por medio del teorema de la probabilidad total y del teorema de Bayes,
podemos obtener las probabilidades a posteriori, que servirán para calcular los valores
esperados de cada nodo de decisión del árbol que se construirá. Así, obtenemos las si-
guientes probabilidades a partir del teorema de la probabilidad total:
P( PR) = P( PR / R) ⋅ P( R) + P( PR / M ) ⋅ P( M ) + P( PR / G) ⋅ P(G) =
15 10 1
= ⋅ 0, 4 + ⋅ 0,2 + ⋅ 0, 4 = 0, 408
17 45 38
2 25 9
= ⋅ 0, 4 + ⋅ 0,2 + ⋅ 0, 4 = 0,253
17 45 38
P( PG) = P( PG / R) ⋅ P( R) + P( PG / M ) ⋅ P( M ) + P( PG / G) ⋅ P(G) =
10 28
= 0 ⋅ 0, 4 + ⋅ 0,2 + ⋅ 0, 4 = 0,339
45 38
o bien:
15
⋅ 0, 4
P( PR / R) ⋅ P( R) 17
P( R / PR) = = = 0,865
P( PR) 0, 408
10
⋅ 0,2
P( PR / M ) ⋅ P( M ) 45
P( M/ PR) = = = 0,109
P( PR) 0, 408
2
⋅ 0, 4
P( PM/ R) ⋅ P( R) 17
P( R / PM ) = = = 0,186
P( PM ) 0,253
25
⋅ 0,2
P( PM/ M ) ⋅ P( M ) 45
P( M/ PM ) = = = 0, 439
P( PM ) 0,253
P( PG / R) ⋅ P( R) 0 ⋅ 0, 4
P( R / PG ) = = =0
P( PG ) 0,339
10
⋅ 0,2
P( PG / M ) ⋅ P( M ) 45
P( M / PG ) = = = 0,131
P( PG) 0,339
dic D
m
n
nf
) = ient
lic
39 an P(M/PR) = 0,131
de E
aA R14 = 1.700
form
Plata 3.611,8 P(G/PR) = 0,
869 R15 = 3.900
I IV
Plata P(R/PR) = 0 R16 = –100
4.476
No
4.476 P(G/PR) = 0,
ita
P(M) = 0,2
e
aA G R20 = 1.700
Plataform P(G) = 0,4
2.380 R21 = 3.900
© Ediciones Pirámide
V
P(R) = 0,4 R22 = –100
2.380 Plataform P(M) = 0,2
aB H R23 = 1.000
2.160 P(G) = 0,4
R24 = 5.000
Teoría de la decisión
ar
sult
Con
No
con
sult
ar
El precio sube
un 10% R1 = 747,6
7
) = 0,85
Comprar para P(S/PS
un mes A P(B/P
S) = 0,1
43
737,4184 R2 = 676,4
El precio baja
II Com un 10%
Predice subida prar
de precios 712 para
dos meses
,42 R3 = 712
) =0
PS
P(
D El precio sube
Predice bajada un 10% R4 = 747,6
694,2014 de precios ) = 0,0
69
ar
PB B
)= un mes P(B/P
ns
B) = 0
0,5 ,931
Co
8 681,3128 R5 = 676,4
El precio baja
III Com un 10%
prar
681,3128 para
dos meses
I R6 = 712
694,2014
R7 = 747,6
No
be un 10 %
El precio su P(S) = 0,4
co
Comprar para
C
ns
un mes
ult
R8 = 676,4
IV Com
prar
704,88 para
dos meses
R9 = 712
En el caso en que se decidiera comprar para los dos meses, el coste sería:
Por la evolución del mercado internacional de esta materia prima, se sabe que, en
el próximo mes:
P( S ) = 0, 4
P( B) = 0,6
se tendrá que:
P( PS /S ) = 0,90 ⇒ P( PB / S ) = 0,10
P( PB / B) = 0,90 ⇒ P( PS / B) = 0,10
P( PS /S ) ⋅ P( S ) 0,90 ⋅ 0, 4
P( S / PS ) = = = 0,857
P( PS ) 0, 42
P( B / PS ) = 1 − 0,857 = 0,143
P( PB /S ) ⋅ P( S ) 0,10 ⋅ 0,4
P( S / PB) = = = 0,069
P( PB) 0,58
P( PB / B) ⋅ P( B) 0,90 ⋅ 0,6
P( B / PB) = = = 0,931
P( PB) 0,58
o bien:
y, como los resultados son costes, en los nodos de decisión habrá que obtener el mínimo
valor de sus ramas:
VME = 694,2014
ltar
Co nsu
I
No
con
sult
ar
VME = 704,88
cantidad que corresponde a lo que la empresa se podría ahorrar con respecto al resultado
que obtendría sin consultar al laboratorio.
Esta cantidad de 10,6786 miles de euros coincide con el concepto de VEIM, pero
aplicado para un caso en el que los resultados son costes:
Porcentaje de días
Número de períodos
lluviosos en el período
en los últimos 20 años
considerado
Menos de un 10 % 14
Entre un 10 % y un 20 % 4
Más de un 20 % 2
Los gastos a los que tendrá que hacer frente la empresa son los siguientes:
— Salario bruto mensual medio por empleado: 1.500 euros.
— Alquiler mensual medio por máquina: 160.000 euros.
— Coste de materiales: 75.800.000 euros.
En caso de no terminar la obra en el plazo fijado, la empresa deberá paralizar la
ejecución, pagar una indemnización de 25 millones de euros, y sólo se le reembolsará el
coste de los materiales. Según un acuerdo fijado entre las partes, independientemente de
la finalización de la obra, el tiempo mínimo que la empresa debe contratar a los traba-
jadores y alquilar la maquinaria es de ocho meses.
a) ¿De qué forma debe plantear la empresa la construcción del aeropuerto?
b) ¿Le interesaría a esta empresa un estudio más riguroso sobre las condiciones
meteorológicas en la zona cuyo coste fuera de un millón y medio de euros?
14
P(θ1 ) = = 0,7
20
4
P(θ 2 ) = = 0,2
20
2
P(θ 3 ) = = 0,1
20
( a1 , θ1 ) ⇒ r11
Gastos:
Salarios: 5.000 · 1.500 · 8 = 60.000.000 euros
Máquinas: 10 · 160.000 · 8 = 12.800.000 euros
Materiales: 75.800.000 euros
148.600.000 euros
Gastos:
Salarios: 60.000.000 euros
Máquinas: 12.800.000 euros
Materiales: 75.800.000 euros
Indemnización: 25.000.000 euros
173.600.000 euros
En este caso, con los 5.000 trabajadores y las 10 máquinas, tampoco se acaba la obra
en el plazo fijado si hay más de un 20 % de días lluviosos; por tanto, nos encontramos
en la situación anterior, y así, r13 = – 97,8 millones de euros.
Gastos:
Salarios: 7.500 · 1.500 · 8 = 90.000.000 euros
Máquinas: 15 · 160.000 · 8 = 19.200.000 euros
Materiales: 75.800.000 euros
185.000.000 euros
q2 :
q3 :
Ingresos: 75,8 millones de euros
Gastos:
Salarios: 90.000.000 euros
Máquinas: 19.200.000 euros
Materiales: 75.800.000 euros
Indemnización: 25.000.000 euros
210.000.000 euros
Estados de la naturaleza
Alternativas q1 q2 q3
Menos de 10 % Entre 10 % y 20 % Más de 20 %
días lluviosos días lluviosos días lluviosos
Según el criterio del valor monetario esperado, para cada alternativa calculamos:
m
VME( ai ) = ∑ rij ⋅ P(θ j )
j =1
3
VME( a1 ) = ∑ r1 j ⋅ P(θ j ) = 351,4 ⋅ 0,7 + ( − 97,8) ⋅ 0,2 + ( − 97,8) ⋅ 0,1 = 216,64
j =1
3
VME( a2 ) = ∑ r2 j ⋅ P(θ j ) = 351 ⋅ 0,7 + 315 ⋅ 0,2 − 134,2 ⋅ 0,1 = 270,08
j =1
3
VME( a3 ) = ∑ r3 j ⋅ P(θ j ) = 272,2 ⋅ 0,7 − 272,2 ⋅ 0,2 − 272,2 ⋅ 0,1 = 272,2
j =1
VME( a3 ) = 272,2
entonces a* = a3, es decir, la alternativa elegida por la empresa debería ser comenzar la
obra con 10.000 trabajadores y un parque de 25 máquinas.
A la misma conclusión se llegaría utilizando el criterio de la pérdida de oportunidad
esperada. Para ello, obtenemos la tabla Regret de pérdidas de oportunidad:
R( ai , θ j ) = V *(θ j ) − rij
siendo:
En este caso:
V *(θ 2 ) = 315
V *(θ 3 ) = 272,2
R(ai, qj) q1 q2 q3
a1 0, 412,8 370,0
a2 36,4 0 406,4
a3 79,2 42,8 0
donde:
y así sucesivamente.
Ahora calculamos la pérdida de oportunidad esperada asociada a cada una de las
alternativas:
m
POE( ai ) = ∑ R(ai , θ j ) ⋅ P(θ j )
j =1
Como:
a* = a3
donde:
m
VMEIP = ∑ V *(θ j ) ⋅ p(θ j ) = 351,4 ⋅ 0,7 + 315 ⋅ 0,2 + 272,2 ⋅ 0,1 = 336,2
j =1
y, por tanto:
Es decir, la empresa estaría dispuesta a pagar hasta 64 millones de euros; por tanto,
si el estudio cuesta 1,5 millones, sí le interesaría realizarlo.
c) Si no se conoce información sobre las probabilidades de los estados de la natu-
raleza, se tratará de un problema de decisión bajo incertidumbre.
Si pretendemos utilizar un criterio optimista, éste será el criterio maximax. A cada
alternativa se le asocia:
k ( ai ) = máx rij
j
a1 351,4
a2 315,0
a3 272,2
k ( ai ) = mín rij
j
es decir, el peor de los resultados posibles para ai, y la alternativa óptima, a*, verificará:
a1 – 97,8
a2 – 134,2
a3 272,2
Gastos:
Alquiler de la plaza de toros = 75.000 euros
Devolución mitad de la entrada: 22,50 · 5.000 = 112.500 euros
Discos-obsequio firmados: 12 · 5.000 = 60.000 euros
Total gastos: 247.500 euros
k ( ai ) = máx rij
j
Por tanto:
ai k ( ai ) = máx rij
j
k ( a*) = máx k ( ai ) = 15 = k ( a1 )
i
k ( ai ) = mín rij
j
ai k ( ai ) = mín rij
j
a* = a2 = «Alquilar el auditorio»
Criterio de Hurwicz
Representamos con a (0 a 1) el coeficiente de pesimismo del decisor y asocia-
mos a cada alternativa la combinación convexa:
pues los resultados rij son, en este caso, beneficios. La alternativa óptima, a*, para un
valor de a fijo sería tal que:
k ( a*, α ) = máx k ( ai , α )
i
k ( a1 , α ) = k ( a2 , α )
− 2,25 + 15(1 − α ) = 8,5
− 17,25α = − 6,5
65
α= = 0,3768
172,5
y su representación gráfica:
k(ai, )
15
10
8,5
5 k(a1, )
k(a2, )
0 0,3768 α
– 2,25 1
Por tanto, según el grado de pesimismo del decisor (criterio de Hurwicz), la ordena-
ción de las alternativas por preferencia será:
Si 0 a 0,3768 ⇒ a* = a1 Ɑ a2
Si a = 0,3768 a* = a1 ~ a2
Si 0,3768 < a 1 a* = a2 Ɑ a1
1
P(θ j ) = , j = 1, 2,..., m
m
1
P(θ1 ) = P(θ 2 ) =
2
2
1
VME( a1 ) = ∑ r1 j ⋅ P(θ j ) = 2 ( − 2,25 + 15) = 6,375
j =1
2
1
VME( a2 ) = ∑ r2 j ⋅ P(θ j ) = 2 (8,5 + 8,5) = 8,5
j =1
como:
Criterio de Savage
con
Así:
Rij q1 q2
k ( ai ) = máx Rij
i
ai k ( ai ) = máx Rij
i
a1 10,75
a2 6,5
Entonces:
P(θ1 ) = 0,30
P(θ 2 ) = 1 − 0,30 = 0,70
se trata de un problema de decisión bajo riesgo que puede ser resuelto mediante el cri-
terio del Valor Monetario Esperado (VME) o el criterio de la Pérdida de Oportunidad
Esperada (POE).
2
VME( a1 ) = ∑ r1 j ⋅ P(θ j ) = − 2,25 ⋅ 0,30 + 15 ⋅ 0,70 = 9,825
j =1
2
VME( a2 ) = ∑ r2 j ⋅ P(θ j ) = 8,5 ⋅ 0,30 + 8,5 ⋅ 0,70 = 8,5
j =1
con lo cual la alternativa óptima será a1, es decir, celebrar el concierto en la plaza de
toros.
R(ai, qj) q1 q2
a1 10,75 0,0
a2 0,0 6,5
2
POE( a1 ) = ∑ R(a1, θ j ) ⋅ P(θ j ) = 10,75 ⋅ 0,3 + 0 ⋅ 0,7 = 3,225
j =1
2
POE( a2 ) = ∑ R(a2 , θ j ) ⋅ P(θ j ) = 0 ⋅ 0,3 + 6,5 ⋅ 0,7 = 4,55
j =1
Por tanto:
a* = a1
que, como vemos, coincide con la alternativa óptima encontrada según el criterio del
valor monetario esperado, pues estos dos son equivalentes.
P(θ1 ) = p
P(θ 2 ) = 1 − p
q1 q2
a1 – 2,25 15,0
a2 8,5 8,5
P(qj) p 1–p
Para que a1 y a2 fueran indiferentes al empresario tendría que ocurrir que sus valo-
res monetarios esperados fueran iguales:
VME( a1 ) = VME( a2 )
es decir, que:
6,5 650 26
p= = =
17,25 1.725 69
Estados de la naturaleza
Alternativas Construcción Construcción Construcción
de la primera fase de la segunda fase de la tercera fase
Restaurante de lujo 12 35 56
Hotel-restaurante 30 25 38
Complejo – 10 8 120
Obtenga la decisión óptima que debe adoptar la empresa según los diferentes crite-
rios de decisión.
k ( ai ) = máx rij
j
Beneficios máximos
Alternativas k ( ai ) = máx rij
j
Luego como:
a* = a3
y se elegiría como óptima la alternativa a3, que nos podría proporcionar los mayores
beneficios: 120 millones de euros anuales. Así pues, desde el punto de vista del crite-
rio maximax, la empresa construiría un complejo integrado por restaurante, discoteca e
instalaciones deportivas.
k ( ai ) = mín rij
j
Así:
Beneficios mínimos
Alternativas k ( ai ) = mín rij
j
y, por tanto;
a* = a2
Con lo cual, según el criterio maximin, la empresa debería elegir la alternativa a2,
es decir, construir un hotel con servicio de restaurante.
Criterio de Hurwicz
Este criterio pondera los resultados extremos de tal manera que los coeficientes de
ponderación reflejen el nivel de optimismo o pesimismo del decisor.
Si con a representamos el coeficiente de pesimismo relativo (0 a 1), para cada
alternativa calcularemos la combinación convexa:
k ( a*, α ) = máx k ( ai , α )
i
k ( a1 , α ) = k ( a2 , α )
12α + (1 − α )56 = 25α + (1 − α )38
− 31α = − 18
18
α = = 0,581
31
k ( a1 , α ) = k ( a3 , α )
12α + (1 − α )56 = − 10α + (1 − α )120
86α = 64
64
α = = 0,744
86
k ( a2 , α ) = k ( a3 , α )
25α + (1 − α )38 = − 10α + (1 − α )120
117α = 82
82
α = = 0,701
117
k(ai, )
120
100
80
60
40
k(a2, )
20
k(a1, )
1
0 α
0,581 0,701 0,744
k(a3, )
– 20
Por tanto, las alternativas que se elegirán según los valores de a, serán:
Si 0 a < 0,701 a* = a3
Si 0 a < 0,581 a* = a3 Ɑ a1 Ɑ a2
Si a = 0,581 a* = a3 Ɑ a1 ~ a2
Si 0,581 < a < 0,701 a* = a3 Ɑ a2 Ɑ a1
Si a = 0,701 a* = a3 ~ a2 Ɑ a1
Si 0,701 < a 1 a* = a2
Si 0,701 < a < 0,744 a* = a2 Ɑ a3 Ɑ a1
Si a = 0,744 a* = a2 Ɑ a1 ~ a3
Si 0,744 < a 1 a* = a2 Ɑ a1 Ɑ a3
1
P(θ j ) = , ∀ j = 1, 2, 3
3
Así:
3
1
VME( a1 ) = ∑ r1 j ⋅ P(θ j ) = 3 (12 + 35 + 56) = 34,333
j =1
3
1
VME( a2 ) = ∑ r2 j ⋅ P(θ j ) = 3 (30 + 25 + 38) = 31
j =1
3
1
VME( a3 ) = ∑ r3 j ⋅ P(θ j ) = 3 (− 10 + 8 + 120) = 39,333
j =1
entonces:
a3 Ɑ a1 Ɑ a2
Criterio de Savage
En este caso:
y, por tanto:
Rij q1 q2 q3
a1 18 0 64
a2 0 10 82
a3 40 27 0
donde:
k ( ai ) = máx Rij
j
ai k ( ai ) = máx Rij
j
a1 k(a1) = 64
a2 k(a2) = 82
a3 k(a3) = 40
mín k ( ai ) = 40 = k ( a3 )
i
Estados de la naturaleza
Alternativas
q1 q2 q3 q4
a1 10 – 30 15 40
a2 –5 5 10 30
a3 –5 – 20 20 40
a4 – 10 –5 50 70
k ( a1 , α ) = k ( a2 , α )
− 30α + 40(1 − α ) = − 5α + 30(1 − α )
10
α = = 0,29
35
k ( a1 , α ) = k ( a3 , α )
− 30α + 40(1 − α ) = − 20α + 40(1 − α )
α =0
k ( a1 , α ) = k ( a4 , α )
− 30α + 40(1 − α ) = − 10α + 70(1 − α )
30
α = = 3 ∉ [0, 1]
10
k ( a2 , α ) = k ( a3 , α )
− 5α + 30(1 − α ) = − 20α + 40(1 − α )
10
α = = 0, 4
25
k ( a2 , α ) = k ( a4 , α )
− 5α + 30(1 − α ) = − 10α + 70(1 − α )
40 8
α = = = 0,89
45 9
k ( a3 , α ) = k(( a4 , α )
− 20α + 40(1 − α ) = − 10α + 70(1 − α )
30
α = = 1,5 ∉ [0, 1]
20
70
60
50
40 k(a1, )
k(a2, )
30
k(a3, )
20 k(a4, )
10
0
0,29 0,4 1 α
0,89
– 10
– 20
– 30
Por tanto:
8
Si 0 α < = 0,89 , el asesor recomendará comprar el paquete de acciones corres-
9
pondiente a la cuarta alternativa (a4).
8
Si α = = 0,89 , el asesor recomendará como igualmente rentables los paquetes de
9
acciones de las alternativas a2 y a4.
8
Si < α 1 , el asesor presentará como más favorable la alternativa a2.
9
La clasificación de las alternativas por orden de preferencia en los distintos tramos
de dominancia sería la siguiente:
Si 0 a < 0,89 ⇒ a* = a4
Si 0 = a ⇒ a* = a4 Ɑ a1 ~ a3 Ɑ a2
Si 0 < a < 0,29 ⇒ a* = a4 Ɑ a3 Ɑ a1 Ɑ a2
Si a = 0,29 ⇒ a* = a4 Ɑ a3 Ɑ a1 ~ a2
Situación económica
Alternativa
No próspera Próspera
a) ¿Qué rama de actividad debería escoger para la consultora que se pretende crear?
b) Si la situación económica de prosperidad tiene triple posibilidad de presentarse
que la otra, ¿qué decisión sería la óptima en este caso?
ai k ( ai ) = máx rij
j
a1 800
a2 800
a3 600
a4 1.000
y la óptima, a*, será aquella con la que se obtenga el máximo de los beneficios máxi-
mos, es decir:
k ( a*) = máx k ( ai ) = máx máx rij = 1.000 = k ( a4 )
i i j
por tanto, según este criterio totalmente optimista, se elegiría la rama de tecnología bio-
sanitaria (a4), pues nos puede llevar al máximo de los resultados más favorables.
ai k ( ai ) = mín rij
j
a1 100
a2 300
a3 400
a4 100
Por tanto:
a* = a3
es decir, desde un punto de vista totalmente pesimista, se debería escoger la rama corres-
pondiente al hardware informático (a3), que conduce al mejor de los peores resultados.
Criterio de Hurwicz
Para cada valor de a, la alternativa óptima será aquella a*, tal que:
k ( a*, α ) = máx k ( ai , α )
i
Como a no está fijado, representamos gráficamente las cuatro rectas k(ai, a). Previa-
mente, calculamos sus puntos de corte en el intervalo [0, 1].
k ( a1 , α ) = k ( a2 , α )
100α + 800(1 − α ) = 300α + 800(1 − α )
− 200α = 0
α =0
k ( a1 , α ) = k ( a3 , α )
100α + 800(1 − α ) = 400α + 600(1 − α )
− 500α = − 200
2
α =
5
k ( a1 , α ) = k ( a4 , α )
100α + 800(1 − α ) = 100α + 1.000(1 − α )
200α = 200
α =1
© Ediciones Pirámide 409
Ejercicios de inferencia estadística y muestreo
k ( a2 , α ) = k ( a3 , α )
300α + 800(1 − α ) = 400α + 600(1 − α )
− 300α = − 200
2
α=
3
k ( a2 , α ) = k ( a4 , α )
300α + 800(1 − α ) = 100α + 1.000(1 − α )
400α = 200
2 1
α= =
4 2
k ( a3 , α ) = k ( a4 , α )
400α + 600(1 − α ) = 100α + 1.000(1 − α )
700α = 400
4
α=
7
k(ai, )
1.000
900
800
700 k(a1, )
k(a2, )
600
k(a3, )
500 k(a4, )
400
300
200
100
0
2/5 1/2 4/7 2/3 1 α
En vista de este gráfico, podemos ordenar las alternativas según el nivel de pesimis-
mo. Así:
1
Si 0 α < ⇒ a* = a4 = «Tecnología biosanitaria».
2
1
Si α = ⇒ a* = a4 ~ a2 .
2
1 2
Si <α < ⇒ a* = a2 = «Software informático».
2 3
2
Si α = ⇒ a* = a2 ~ a3 .
3
2
Si < α 1 ⇒ a* = a3 = «Hardware informático».
3
Si α = 0 ⇒ a* = a4 Ɑ a1 ~ a2 Ɑ a3
1
Si 0 < α < ⇒ a* = a4
2
2
Si 0 < α < ⇒ a* = a4 Ɑ a2 Ɑ a1 Ɑ a3
5
2
Si α = ⇒ a* = a4 Ɑ a2 Ɑ a1 ~ a3
5
2 1
Si <α < ⇒ a* = a4 Ɑ a2 Ɑ a3 Ɑ a1
5 2
1
Si α = ⇒ a* = a4 ~ a2 Ɑ a3 Ɑ a1
2
1 2
Si <α < ⇒ a* = a2
2 3
1 4
Si <α < ⇒ a* = a2 Ɑ a4 Ɑ a3 Ɑ a1
2 7
4
Si α = ⇒ a* = a2 Ɑ a4 ~ a3 Ɑ a1
7
4 2
Si <α < ⇒ a* = a2 Ɑ a3 Ɑ a4 Ɑ a1
7 3
2
Si α = ⇒ a* = a2 ~ a3 Ɑ a4 Ɑ a1
3
2
Si < α < 1 ⇒ a* = a3 Ɑ a2 Ɑ a4 Ɑ a1
3
Si α = 1 ⇒ a* = a3 Ɑ a2 Ɑ a4 ~ a1
Consiste en aplicar el criterio del valor monetario esperado (decisión bajo riesgo)
a una situación de incertidumbre considerando que todos los estados de la naturaleza
tienen las mismas posibilidades de presentarse:
1
P(θ j ) = ; j = 1, 2, ..., m
m
1
P(θ j ) = ; j = 1, 2
2
m
VME( ai ) = ∑ rij ⋅ P(θ j )
j =1
1
VME( a1 ) = (800 + 100) = 450
2
1
VME( a2 ) = (300 + 800) = 550
2
1
VME( a3 ) = ( 400 + 600) = 500
2
1
VME( a4 ) = (100 + 1.000) = 550
2
entonces las alternativas óptimas bajo este criterio serán a2 y a4 (son, por tanto, indife-
rentes según el criterio de Laplace).
Criterio de Savage
donde:
En este caso:
V *(θ1 ) = 800
V *(θ 2 ) = 1.000
a1 0 900 900
a2 500 200 500
a3 400 400 400
a4 700 0 700
k ( ai ) = máx Rij
i
a* = a3 = «Hardware informático».
Como se ve, la rama de actividad elegida será diferente según el criterio de decisión
bajo incertidumbre que se utilice para tomar la decisión.
b) Sea:
P(θ1 ) = p
entonces:
P(θ 2 ) = 3 p
y como:
P(θ1 ) + P(θ 2 ) = 1
p + 3p = 1
1
p= = 0,25
4
con lo cual:
rij q1 q2
a1 800 100
a2 300 800
a3 400 600
a4 100 1.000
m
VME( ai ) = ∑ rij ⋅ P(θ j )
j =1
Por tanto:
a* = a4
m
POE( ai ) = ∑ R(ai , θ j ) ⋅ P(θ j )
j =1
En este caso, la matriz Regret había sido obtenida en el apartado anterior al utilizar
el criterio de Savage, y quedaba como:
Rij q1 q2
a1 0 900
a2 500 200
a3 400 400
a4 700 0
Por tanto:
Con lo cual:
a* = a4
la misma que habíamos obtenido con el criterio del VME, pues sabemos que ambos son
equivalentes.
1
Se han considerado 30 días por mes para realizar los cálculos.
Duración de la reparación
Alternativas
q1: 1 mes q2: 2 meses q3: 3 meses
entonces deberemos elegir como alternativa óptima, a*, aquella, tal que:
k ( a*, α ) = mín k ( ai , α )
i
k ( a1 , α ) = k ( a2 , α )
19,5α + 10,5(1 − α ) = 27α + 9(1 − α )
− 9α = − 1,5
15 1
α= = = 0,167
90 6
k ( a1 , α ) = k ( a3 , α )
19,5α + 10,5(1 − α ) = 14, 4α + 12,8(1 − α )
7,4α = 2,3
23
α= = 0,311
74
k ( a2 , α ) = k ( a3 , α )
27α + 9(1 − α ) = 14, 4α + 12,8(1 − α )
16, 4α = 3,8
38
α= = 0,232
164
30
25
20
k(a1, )
15 k(a2, )
k(a3, )
10
0
0,167 0,232 0,311 1 α
Demanda
Alternativas
q1: alta q2: media q3: baja
Indique qué alternativa debería seguir la directiva del centro de idiomas si se supone
que la probabilidad de demanda media es triple que la de demanda baja y ésta la mitad
que la de demanda alta.
P(θ 2 ) = 3P(θ 3 )
1
P(θ 3 ) = P(θ1 )
2
P(θ1 ) + P(θ 2 ) + P(θ 3 ) = 1
1
P(θ1 ) =
3
1
P(θ 2 ) =
2
1
P(θ 3 ) =
6
3
1 1 1 31,5
VME( a1 ) = ∑ r1 j ⋅ P(θ j ) = 7 ⋅ 3 + 6,5 ⋅ 2 − 2 ⋅ 6 = 6
= 5,25
j =1
3
1 1 1 33,5
VME( a2 ) = ∑ r2 j ⋅ P(θ j ) = 10 ⋅ 3 + 5 ⋅ 2 − 1,5 ⋅ 6 = 6
= 5,583
j =1
3
1 1 1 28
VME( a3 ) = ∑ r3 j ⋅ P(θ j ) = 6,5 ⋅ 3 + 6 ⋅ 2 − 3 ⋅ 6 = 6
= 4,667
j =1
Por tanto, la alternativa óptima según el criterio del VME es realizar un convenio
con la universidad, a2, pues es la que presenta el mayor valor monetario esperado.
V *(θ1 ) = 10
V *(θ 2 ) = 6,5
V *(θ 3 ) = − 1,5
Con ellos calculamos las pérdidas de oportunidad para las diferentes alternativas y
estados de la naturaleza:
R( ai , θ j ) = V *(θ j ) − rij
y obtenemos la tabla:
R(ai, qj) q1 q2 q3
3
1 1 1 6,5
POE( a1 ) = ∑ R(a1, θ j ) ⋅ P(θ j ) = 3 ⋅ 3 + 0 ⋅ 2 + 0,5 ⋅ 6 =
6
= 1,083
j =1
3
1 1 1
POE( a2 ) = ∑ R(a2 , θ j ) ⋅ P(θ j ) = 0 ⋅ 3 + 1,5 ⋅ 2 + 0 ⋅ 6 = 0,75
j =1
3
1 1 1
POE( a3 ) = ∑ R(a3 , θ j ) ⋅ P(θ j ) = 3,5 ⋅ 3 + 0,5 ⋅ 2 + 1,5 ⋅ 6 = 1,667
j =1
y, por tanto, a2, que presenta la menor pérdida de oportunidad esperada, es la alternativa
óptima.
Verano
Alternativas
q1: caluroso q2: moderado q3: fresco
a) Elija la alternativa óptima que deberían tomar los dueños del parque acuático.
b) ¿Cuánto estarían dispuestos a pagar los responsables del parque acuático por un
informe meteorológico que indicara con precisión el tipo de verano que se va a
presentar?
c) Calcule las pérdidas de oportunidad asociadas a cada una de las alternativas y
compruebe que, utilizando este criterio, se obtiene la misma alternativa óptima
que con el criterio del valor monetario esperado.
Por tanto, la alternativa óptima según el criterio del VME es aquella a*, tal que:
Entonces:
a* = a2
Como:
3
VMEIP = ∑ V *(θ j ) P(θ j ) = 2,5 ⋅ 0,25 + 1 ⋅ 0,45 + 0 ⋅ 0,3 = 1,075
j =1
Por tanto:
es decir, 390.000 euros sería la cantidad máxima que estarían dispuestos a pagar por un
informe meteorológico preciso.
Recordamos que esta cantidad debe coincidir con la pérdida de oportunidad esperada
de la alternativa óptima, es decir, con POE( a*) = POE( a2 ) .
R( ai , θ j ) = V *(θ j ) − rij
Verano
R(ai, qj)
q1 q2 q3
Calculamos ahora la pérdida de oportunidad esperada para cada una de las alter-
nativas:
Por tanto, a* = a2, que, efectivamente, coincide con la alternativa óptima elegida
según el criterio del valor monetario esperado.
qj
q1 q2 q3
ai
a1 9 8 –3
a2 –5 10 11
a3 1 1 1
a1 –3 9 k(a1, a) = – 3a + 9(1 – a)
a2 –5 11 k(a2, a) = – 5a + 11(1 – a)
a3 1 1 k(a3, a) = 1
1
K ( a1 , α ) = K ( a2 , α ) ⇒ α = = 0,5
2
8
K ( a1 , α ) = K ( a3 , α ) ⇒ α = = 0,667
12
10
K ( a2 , α ) = K ( a3 , α ) ⇒ α = = 0,625
16
11
K(a1, )
K(a2, )
K(a3, )
–3
–5
Si 0 a < 0,5 ⇒ a* = a2 Ɑ a1 Ɑ a3
Si a = 0,5 ⇒ a* = a2 ~ a1 Ɑ a3
Si 0,5 < a < 0,667 ⇒ a* = a1
Si 0,5 < a < 0,625 ⇒ a* = a1 Ɑ a2 Ɑ a3
Si a = 0,625 ⇒ a* = a1 Ɑ a2 ~ a3
Si 0,625 < a < 0,667 ⇒ a* = a1 Ɑ a3 Ɑ a2
Si a = 0,667 ⇒ a* = a1 ~ a3 Ɑ a2
Si 0,667 < a 1 ⇒ a* = a3 Ɑ a1 Ɑ a2
Los beneficios o pérdidas que se obtendrán a partir de los datos del enun-
Solución
ciado se calculan como:
Demanda
Camisetas adquiridas
q1: 100 q2: 150 q3: 200
Según el criterio de Laplace, se supone que todos los estados de la naturaleza son
equiprobables, por tanto:
1
P(θ1 ) = P(θ 2 ) = P(θ 3 ) =
3
1
VME( a1 ) = (300 + 262,50 + 225) = 262,50
3
1
VME( a2 ) = (0 + 450 + 900) = 450
3
1
VME( a3 ) = ( − 225 + 225 + 675) = 225
3
a* = a2
Demanda
Editorial
Alta Media Baja
Demanda
R(ai, qj)
Alta: q1 Media: q2 Baja: q3
Aplicando el criterio minimax a esta matriz, hay que obtener para cada alternativa
el valor:
K ( ai ) = máx R( ai , θ j )
j
K ( a1 ) = 2,5
K ( a2 ) = 1,25
K ( a3 ) = 2
entonces:
a* = a2
por tanto, aplicando el criterio de Savage, se debería elegir la editorial B para publicar
el libro.
b) Utilizaremos el criterio de Hurwicz y, por tanto, tenemos que calcular para cada
alternativa la combinación:
2
K ( a1 , α ) = K ( a2 , α ) ⇒ α = ⯝ 0,67
3
1
K ( a1 , α ) = K ( a3 , α ) ⇒ α = = 0,5
2
8
K ( a2 , α ) = K ( a3 , α ) ⇒ α = ⯝ 0,73
11
5
4,5
4
K(a1, )
3 K(a2, )
K(a3, )
2
Si 0 a < 0,5 ⇒ a* = a2 Ɑ a3 Ɑ a1
Si a = 0,5 ⇒ a* = a2 Ɑ a3 ~ a1
Si 0,5 < a < 0,67 ⇒ a* = a2 Ɑ a1 Ɑ a3
Si a = 0,67 ⇒ a* = a2 ~ a1 Ɑ a3
Si 0,67 < a < 0,73 ⇒ a* = a1 Ɑ a2 Ɑ a3
Si a = 0,73 ⇒ a* = a1 Ɑ a2 ~ a3
Si 0,73 < a 1 ⇒ a* = a1 Ɑ a3 Ɑ a2
Tablas estadísticas1
TABLA 1
Función de probabilidad binomial
Esta tabla proporciona la probabilidad de obtener x éxitos cuando se realizan n
repeticiones independientes de un experimento o prueba de Bernoulli con probabilidad
de éxito p:
冢冣
n x
P( X = x ) = p ⋅ (1 − p)n − x donde X ~ B(n, p)
x
1
Estas tablas proceden de Casas Sánchez, J. M.: Inferencia estadística, 2.a ed., CERA, 1997.
TABLA 1 (continuación)
冢x冣 p
n
P( X = x ) = x
⋅ (1 − p)n − x donde X ~ B(n, p)
TABLA 1 (continuación)
冢x冣 p
n
P( X = x ) = x
⋅ (1 − p)n − x donde X ~ B(n, p)
TABLA 1 (continuación)
冢x冣 p
n
P( X = x ) = x
⋅ (1 − p)n − x donde X ~ B(n, p)
TABLA 1 (continuación)
冢x冣 p
n
P( X = x ) = x
⋅ (1 − p)n − x donde X ~ B(n, p)
TABLA 1 (continuación)
冢x冣 p
n
P( X = x ) = x
⋅ (1 − p)n − x donde X ~ B(n, p)
TABLA 2
Función de distribución binomial
Esta tabla proporciona los valores de la función de distribución de una B(n, p), es
decir:
∑ 冢i 冣 pi ⋅ (1 − p)n − i
x n
F( x ) = P( X x ) =
i=0
para:
TABLA 2 (continuación)
冢冣
x n
F( x ) = P( X x ) = ∑ pi ⋅ (1 − p)n − i
i=0 i
TABLA 2 (continuación)
冢冣
x n
F( x ) = P( X x ) = ∑ pi ⋅ (1 − p)n − i
i=0 i
TABLA 2 (continuación)
冢冣
x n
F( x ) = P( X x ) = ∑ pi ⋅ (1 − p)n − i
i=0 i
TABLA 2 (continuación)
冢冣
x n
F( x ) = P( X x ) = ∑ pi ⋅ (1 − p)n − i
i=0 i
TABLA 2 (continuación)
冢冣
x n
F( x ) = P( X x ) = ∑ pi ⋅ (1 − p)n − i
i=0 i
TABLA 3
Función de probabilidad hipergeométrica
Esta tabla proporciona la probabilidad de obtener x elementos que pertenezcan a la
primera subpoblación cuando se toma una muestra aleatoria sin reemplazamiento de
tamaño n de la población total:
N1 N − N1
P( x ) = P( X = x ) =
冢 x 冣冢 n − x 冣 donde X ~ H ( N , N1, n)
冢n冣
N
TABLA 3 (continuación)
N1 N − N1
冢 冣冢 冣
P( x ) = P( X = x ) =
x n−x
donde X ~ H ( N , N1, n)
冢冣
N
n
TABLA 3 (continuación)
N1 N − N1
冢 冣冢 冣
P( x ) = P( X = x ) =
x n−x
donde X ~ H ( N , N1, n)
冢冣
N
n
TABLA 3 (continuación)
N1 N − N1
冢 冣冢 冣
P( x ) = P( X = x ) =
x n−x
donde X ~ H ( N , N1, n)
冢冣
N
n
TABLA 3 (continuación)
N1 N − N1
冢 冣冢 冣
P( x ) = P( X = x ) =
x n−x
donde X ~ H ( N , N1, n)
冢冣
N
n
TABLA 4
Función de distribución hipergeométrica
Esta tabla proporciona los valores de la función de distribución de una H(N, N1, n),
es decir:
N1 N − N1
∑ 冢 x 冣冢 n − x 冣
xi x i i
F( x ) = P( X x ) =
冢n冣
N
TABLA 4 (continuación)
N1 N − N1
∑ 冢 x 冣冢 n − x 冣
xi x i i
F( x ) = P( X x ) =
冢n冣
N
TABLA 4 (continuación)
N1 N − N1
∑ 冢 x 冣冢 n − x 冣
xi x i i
F( x ) = P( X x ) =
冢n冣
N
TABLA 4 (continuación)
N1 N − N1
∑ 冢 x 冣冢 n − x 冣
xi x i i
F( x ) = P( X x ) =
冢n冣
N
TABLA 4 (continuación)
N1 N − N1
∑ 冢 x 冣冢 n − x 冣
xi x i i
F( x ) = P( X x ) =
冢n冣
N
TABLA 5
Función de probabilidad de Poisson
Esta tabla proporciona la probabilidad de obtener x éxitos para diferentes valores de l:
λx − λ
P( X = x ) = e donde X ~ ᏼ (λ )
x!
TABLA 5 (continuación)
λx − λ
P( X = x ) = e donde X ~ ᏼ (λ )
x!
TABLA 5 (continuación)
λx − λ
P( X = x ) = e donde X ~ ᏼ (λ )
x!
TABLA 5 (continuación)
λx − λ
P( X = x ) = e donde X ~ ᏼ (λ )
x!
TABLA 5 (continuación)
λx − λ
P( X = x ) = e donde X ~ ᏼ (λ )
x!
TABLA 5 (continuación)
λx − λ
P( X = x ) = e donde X ~ ᏼ (λ )
x!
TABLA 6
Función de distribución de Poisson
Esta tabla proporciona los valores de la función de distribución de una P(l), es decir:
x
λi − λ
F( x ) = P( X x ) = ∑ e
i = 0 i!
TABLA 6 (continuación)
x
λi − λ
F( x ) = P( X x ) = ∑ e
i = 0 i!
TABLA 6 (continuación)
x
λi − λ
F( x ) = P( X x ) = ∑ e
i = 0 i!
TABLA 6 (continuación)
x
λi − λ
F( x ) = P( X x ) = ∑ e
i = 0 i!
TABLA 6 (continuación)
x
λi − λ
F( x ) = P( X x ) = ∑ e
i = 0 i!
TABLA 7
Función de distribución N(0, 1)
Esta tabla proporciona los valores de la función de distribución de una N(0, 1), es
decir, el área bajo la curva N(0, 1):
z
冮
1
e−z
2
F ( z ) = P( Z z ) = /2
dz
2π −∞
–∞ z 0
TABLA 7 (continuación)
冮
1
e−z
2
F ( z ) = P( Z z ) = /2
dz
2π −∞
–∞ 0 z
TABLA 8
Función de distribución gamma incompleta
Esta tabla contiene los valores de la función gamma incompleta:
冮y
y
1 p −1
F*( y) = ⋅ e − y dy
Γ ( p) 0
TABLA 8 (continuación)
冮y
y
1 p −1
F*( y) = ⋅ e − y dy
Γ ( p) 0
TABLA 9
Función de distribución c2 de Pearson
Esta tabla proporciona los valores c2n, p, tales que:
f(x)
χ n2, p
冮
n
1 −1
p = P( X χ n2, p ) = x 2 ⋅ e − (1/ 2 ) x dx
冉冊
p
n 0
2n/2 Γ
2 0 χ2n, p
TABLA 9 (continuación)
f(x)
χ n2, p
冮
n
1 −1
p = P( X χ n2, p ) = x 2 ⋅ e − (1/ 2 ) x dx
冉冊
p
n 0
2n/2 Γ
2 0 χ2n, p
Tablas estadísticas
TABLA 10
Función de distribución t-Student
Esta tabla proporciona los valores tp, tales que:
Γ冉 冊
n +1 1
− ( n + 1)
冮 冢 冣
tp
2 t2 2
p = P(T t p ) = 1+
冉冊
dt p
n −∞ n
Γ nπ 0 tp
2
para p > 0,5, y siendo T una variable aleatoria t de Student con n-grados de libertad (n = 1, 2, ..., 30, ..., ∞).
Cuando p 0,5, entonces, como la función de densidad es simétrica respecto al origen, t = 0, tenemos:
p = (T t p ) = 1 − P(T − t p )
© Ediciones Pirámide
© Ediciones Pirámide
TABLA 10 (continuación)
p = (T t p ) = 1 − P(T − t p ) 0 tp
Tablas estadísticas
475
476
Tablas estadísticas
TABLA 11
Función de distribución F de Snedecor
Esta tabla proporciona los valores Fn1, n2; p, tales que:
Γ 冉 冊n1 + n2
−
n1 + n2
冢 冣 冮 冢 冣
n1 / 2 Fn1 , n2 ; p n1
2 n1 −1 n 2
p = P( X Fn1 , n2 ; p ) = 1+ 1 x
冉 冊冉 冊
0,90
x2 dx
n n n2 0 n2
Γ 1 Γ 2 0 Fn1, n2; 0,90
2 2
siendo X una variable aleatoria F de Snedecor con n1, n2 grados de libertad (n1, n2 = 1, 2, ..., 120):
TABLA 11 (continuación)
Tablas estadísticas
477
478
Tablas estadísticas
TABLA 11 (continuación)
TABLA 11 (continuación)
Tablas estadísticas
479
480
Tablas estadísticas
TABLA 11 (continuación)
TABLA 11 (continuación)
Tablas estadísticas
481
482
Tablas estadísticas
TABLA 11 (continuación)
TABLA 11 (continuación)
Tablas estadísticas
483
484
Tablas estadísticas
TABLA 11 (continuación)
TABLA 11 (continuación)
Tablas estadísticas
485
Tablas estadísticas
TABLA 12
Números aleatorios
TABLA 12 (continuación)
TABLA 12 (continuación)
TABLA 13
Gráfica de intervalos de confianza del parámetro p de una distribución binomial
(nivel de confianza 99 %)
TABLA 13
Gráfica de intervalos de confianza del parámetro p de una distribución binomial
(nivel de confianza 95 %)
TABLA 13
Gráfica de intervalos de confianza del parámetro p de una distribución binomial
(nivel de confianza 80 %)
TABLA 14
Valores críticos del test de Kolmogorov-Smirnov para una muestra
Esta tabla contiene los valores críticos D a del test de Kolmogorov-Smirnov:
Fuente: «Table of percentage points of Kolmogorov Statistics», J. Amer. Statist. Assoc., 51:
111-121 (1956).
TABLA 15
Valores críticos del test de Lilliefors de normalidad
Esta tabla contiene los valores críticos D¢a del estadístico:
TABLA 16
Coeficientes ai del test W de Shapiro-Wilks de normalidad
Esta tabla proporciona los valores de los coeficientes ai del estadístico de Shapiro-
Wilks de normalidad:
2
⎡k ⎤
⎢∑ ai ( X( n − i + 1) − X( i ) ⎥
⎢⎣i = 1 ⎥⎦
W= n
∑ ( Xi − X ) 2
i =1
TABLA 16 (continuación)
2
⎡k ⎤
⎢∑ ai ( X( n − i + 1) − X( i ) ⎥
⎢⎣i = 1 ⎥⎦
W= n
∑ ( Xi − X ) 2
i =1
TABLA 16 (continuación)
2
⎡k ⎤
⎢∑ ai ( X( n − i + 1) − X( i ) ⎥
⎢⎣i = 1 ⎥⎦
W= n
∑ ( Xi − X ) 2
i =1
TABLA 17
Valores críticos del test W de Shapiro-Wilks de normalidad
Esta tabla contiene los valores críticos Wa del test W de Shapiro-Wilks, tales que:
P[W < Wα ] = α
TABLA 18
Valores críticos del test de Kolmogorov-Smirnov para dos muestras de distintos
tamaños n1 ≠ n2
Esta tabla contiene los valores críticos Dn1, n2; a del test de Kolmogorov-Smirnov1:
1
Es válido para contrastes unilaterales y bilaterales.
TABLA 18 (continuación)
Fuente: «Distribution table for the deviation between two samples cumulatives», Ann.
Math. Statist., 23: 435-441 (1952).
TABLA 19
Valores críticos del test de Kolmogorov-Smirnov para dos muestras del mismo
tamaño, n1 = n2 = n
Esta tabla contiene los valores críticos Dn, n; a del test de Kolmogorov-Smirnov:
Fuente: «Small sample distribution for multisample statistics of the Smirnov type»,
Ann. Math. Statist., 31: 710-720 (1960).
TABLA 20
Distribución de probabilidades para el test de rachas de aleatoriedad
Esta tabla contiene la función de distribución del número total de rachas R; P(R r) en una muestra de tamaño
n = n1 + n2, para el test de rachas de aleatoriedad de Wald-Wolfowitz:
Tablas estadísticas
501
Tablas estadísticas
TABLA 20 (continuación)
TABLA 21
Valores críticos para el test de rangos-signos de Wilcoxon
Esta tabla contiene los valores críticos k a del estadístico de rangos-signos de Wil-
coxon:
n
T+ = ∑ Zi ⋅ r(兩Di 兩)
i =1
1
El valor de a no tiene por qué coincidir con el nivel de significación.
Fuente: Kraft, C. H., y Van Eeden, A. Nonparametric Introduction to Statistics, Macmi-
llan Publishing, 1968.
TABLA 22
Función de distribución del estadístico U de Mann-Whitney
Esta tabla contiene las probabilidades:
TABLA 22 (continuación)
TABLA 22 (continuación)
TABLA 22 (continuación)
TABLA 22 (continuación)
Fuente: Mann, H., y Whitney, D. R.: «On a test of whether one of two random variables
is stochastically larger than the other», Annals of Mathematical Statistics, Vol. 18, 1947.
TABLA 23
Valores críticos para el test de Kruskal-Wallis2 para k = 3
Esta tabla contiene los valores críticos h a, tales que: P( H hα ) = α
de manera que si el estadístico H que se calcula a partir de las observaciones muestrales
es mayor que h a, se rechaza la hipótesis nula H0 al nivel de significación a.
2
Esta tabla fue elaborada inicialmente por Kruskal y Walllis en 1952 en su trabajo «Use of ranks in one-criterion
variance analysis», JASA, vol. 47, p. 614, y un año más tarde hicieron algunas correcciones, JASA, vol. 48, p. 910;
correcciones que ya aparecen recogidas aquí.
TABLA 23 (continuación)
TABLA 24
Valores críticos para el test de Kruskal-Wallis3 para diferentes valores de k
Esta tabla contiene los valores críticos h a, tales que:
P( H hα ) = α
para distintos tamaños muestrales y niveles de significación 0,05 y 0,01.
3
Esta tabla es análoga a la anterior, pero introduce valores de k = 4 y k = 5.
Bibliografía
Aranda, J., y Gómez, J.: Fundamentos de estadística para la economía y administración de empre-
sas, DM-PPU, 1992.
Aranda, J., Gómez, J., Faura, U., y Molera, L.: Problemas de estadística para economía y adminis-
tración de empresas, DM-PPU, 1994.
Arnaiz, G.: Introducción a la estadística teórica, Lex Nova, 1986.
Baró, J.: Cálculo de probabilidades: aplicaciones económico-empresariales, Parramón, 1985.
Baró, J.: Estadística descriptiva, Parramón, 1985.
Baró, J.: Estadística descriptiva. Aplicaciones económico-empresariales, Parramón, 1985.
Baró, J.: Inferencia estadística: aplicaciones económico-empresariales, Parramón, 1993.
Cacoullos, T.: Exercises in Probability, Springer-Verlag, 1989.
Calot, G.: Exercises de Calcul des Probabilités, Dunod, 1976.
Calot, G.: Curso de estadística descriptiva, Paraninfo, 1982.
Canavos, G. C.: Probabilidad y estadística: aplicaciones y métodos, McGraw-Hill, 1992.
Casa Aruta, E.: 200 problemas de estadística descriptiva, Vicens Vives, 1990.
Casas, J. M.: Inferencia estadística, 2.a ed., CERA, 1997.
Casas, J. M.: Estadística I. Probabilidad y distribuciones, CERA, 2000.
Casas, J. M.: Fórmulas y tablas estadísticas, CERA, 2004.
Casas, J. M., y Santos, J.: Estadística empresarial, CERA, 1999.
Casas, J. M., y Santos, J.: Introducción a la estadística para economía, 2.a ed., CERA, 2002.
Casas, J. M., y Santos, J.: Introducción a la estadística para la administración y dirección de em-
presas, 2.a ed., CERA, 2002.
Casas, J. M., Callealta, J., Núñez, J., Toledo, I., y Ureña, C.: Curso básico de estadística descripti-
va, Instituto Nacional de Administración Pública, 1986.
Cuadras, C. M.: Problemas de probabilidades y estadística, vols. I y II, PPU, 1991.
Degroot, M. H.: Probabilidad y estadística, Addison-Wesley, 1988.
Feller, W.: Introducción a la teoría de probabilidades y sus aplicaciones, vols. I y II, Limusa, 1973
y 1978.
Fernández-Abascal, H. y otros: Cálculo de probabilidades y estadística, Ariel, 1994.
Fernández, H., Guijarro, M., Rojo, J. L., y Sanz, J. A.: Cálculo de probabilidades y estadística,
Ariel, 1994.
García Barbancho, A.: Ejercicios de estadística descriptiva para economistas, Ariel, 1975.
Gnedenko, B. V.: The Theory of Probability, Mir, 1978.
INE: Índice de precios de consumo, Base, 1992. Metodología.
Kazmier-Díaz, M.: Estadística aplicada en administración y economía, McGraw-Hill, 1992.
López de la Manzanara, J.: Problemas de estadística, Pirámide, 1982.
López Ortega, J.: Problemas de estadística para ciencias económicas y empresariales: cálculo de
probabilidades, Tébar, 1994.
Martín Pliego, F. J.: Introducción a la estadística económica y empresarial, AC, 1994.
Martín Pliego, F. J., y Ruiz-Maya, L.: Estadística I. Probabilidad, AC, 1995.
Mendenhall, W.: Estadística matemática con aplicaciones, Editorial Iberoamérica, 1993.
Montero, J., Pardo, L., Morales, D., y Quesada, V.: Ejercicios y problemas de cálculo de probabi-
lidades, Díaz de Santos, 1988.
Montiel, A. M., Rius, F., y Barón, F. J.: Elementos básicos de estadística económica y empresarial,
Prentice-Hall, 1997.
Mood, A., y Graybill, F.: Introducción a la teoría de la estadística, Aguilar, 1978.
Muñoz Vázquez, A. y otros: Problemas de estadística descriptiva, 1992.
Murgui, J. S., Aybar, C. y otros: Estadística para economía y administración de empresas: aplica-
ciones y ejercicios, Puchades, 1992.
Newbold, P.: Estadística para los negocios y la economía, 4.a ed., Prentice-Hall, 1996.
Peña, D.: Estadística. Modelos y métodos, vol. I, Alianza Universidad, 1991.
Quesada, V., Isidoro, A., y López, L. J.: Curso y ejercicios de estadística, Alhambra, 1983.
Rohatgi, V.: An Introduction to Probability Theory and Mathematical Statistics, John Wiley, 1977.
Ruiz-Maya, L.: Problemas de estadística, AC, 1989.
Sierra, M.: Ejercicios resueltos de estadística, CEURA, 1987.
Toledo, I., y Arnaiz, G.: Problemas de estadística, Lex Nova, 1989.
Tussel, F., y Garín, A.: Problemas de probabilidad e inferencia estadística, Tébar Flores, 1991.
Uriel, E., y Muñiz, M.: Estadística económica y empresarial, AC, 1988.
Análisis cuantitativo de la actividad turística, J. Alegre Martín, M. Cladera Munar, C. N. Juaneda Sam-
pol.
Análisis de datos económicos II. Métodos inferenciales, R. Pérez Suárez y A. J. López Méndez.
Análisis y adopción de decisiones, M. López Cachero.
Cien ejercicios de econometría, J. B. Pena Trapero, J. A. Estavillo Dorado, M.ª E. Galindo Frutos, M.ª J.
Leceta Rey y M.ª del M. Zamora Sanz.
Curso básico de matemáticas para la economía y dirección de empresas I, M. López Cachero y A. Vegas Pé-
rez.
Curso básico de matemáticas para la economía y dirección de empresas II, M. López Cachero y A. Vegas
Pérez.
Curso de matemática financiera, M.ª J. Vázquez Cueto.
Decisiones empresariales con criterios múltiples. Ayudas prácticas para la dirección, A. Leal Millán, M.
Sánchez-Apellániz García, J. L. Roldán Salgueiro y A. E. Vázquez Sánchez.
Econometría. M.ª M. Díaz Fernández y M.ª del M. Llorente Marrón.
Ejercicios de econometría I y II. A. Aznar Grasa, A. García Ferrer y A. Martín Arroyo.
Ejercicios de estadística descriptiva y probabilidad para economía y administración de empresas. J. M.
Casas Sánchez, C. García Pérez, L. F. Rivera Galicia y A. I. Zamora Sanz.
Ejercicios de inferencia estadística y muestreo para economía y administración de empresas. J. M. Casas
Sánchez, C. García Pérez, L. F. Rivera Galicia y A. I. Zamora Sanz.
Estadística. Problemas resueltos, M.ª J. Peralta Astudillo, A. Rúa Vieytes, R. Redondo Palomo y C. del Campo
Campos.
Estadística aplicada a la historia y a las ciencias sociales. S. Coll Martínez y M. Guijarro Garvi.
Estadística aplicada para ordenadores personales. A. Pulido San Román y J. Santos Peñas.
Fundamentos y métodos de estadística. M. López Cachero.
Grafos neuronales para la economía y la gestión de empresas. A. Kaufmann y J. Gil Aluja.
Informática aplicada al turismo. A. Guevara Plaza (coord.).
Introducción a la econometría. F. J. Trívez Bielsa.
Introducción a las matemáticas financieras. S. Cruz Rambaud y M.ª del C. Valls Martínez.
Introducción a las matemáticas financieras. Problemas resueltos, M.ª del C. Valls Martínez y S. Cruz
Rambaud.
Invertir en la incertidumbre. J. Gil Aluja.
Manual de álgebra lineal para la economía y la empresa. F. M.ª Guerrero Casas y M.ª J. Vázquez Cueto
(coords.).
Manual de cálculo diferencial e integral para la economía y la empresa. F. M.ª Guerrero Casas y M.ª
J. Vázquez Cueto (coords.).
Matemática de los seguros de vida. R. Moreno Ruiz, O. Gómez Pérez-Cacho y E. Trigo Martínez.
Matemáticas aplicadas a la economía y a la empresa. 434 ejercicios resueltos y comentados, R. E. Caba-
llero Fernández, A. C. González Pareja, S. Calderón Montero, M.ª L. Rey Borrego, T. P. Galache Laza y F.
Ruiz de la Rúa.
Métodos de valoración de empresas. V. Caballer Mellado.
Métodos operativos de gestión empresarial. M. Martín Dávila.
Microeconometría y decisión. B. Cabrer Borrás, A. Sancho Pérez y G. Serrano Domingo.
Modelos econométricos. A. Pulido San Román y J. Pérez García.
Predicción y simulación aplicada a la economía y gestión de empresas. A. Pulido San Román y A. M.ª
López García.
Problemas de estadística. J. López de la Manzanara Barbero.
Problemas de matemáticas financieras. E. Camacho Peñalosa, D. Gómez Domínguez, M. A. Hinojosa Ra-
mos, V. Rubiales Caballero y M.ª J. Vázquez Cueto.
Técnicas de programación y control de proyectos. C. Romero López.
www.edicionespiramide.es