Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejercicios Examen Teorica PDF
Ejercicios Examen Teorica PDF
EJERCICICOS EXAMEN ESTADÍSTICA TEÓRICA
1. Se desea determinar si en una zona rural el 60% o el 70% de los hogares dispone de conexión
a internet, que sigue una ley normal; para dilucilarlo se toma al azar una muestra de 400
hogares, adoptando el criterio de que si en la muestra hay menos de 260 hogares con conexión a
internet, se rechaza que el 60% de los hogares poseen conexión. Se pide:
a) Nivel de significación del test
b) Potencia del test
c) Riesgo tipo II
2. Una variable aleatoria continua X tiene por función de distribución:
⎧ 0 x<1
⎪
F(x) = ⎨ x − 1 1 ≤ x < 2
⎪ 1 x≥2
⎩
a) Calcular la función de densidad o función de cuantía
b) Calcular la media, mediana y coeficiente de variación
3. Un vendedor mayorista de paquetes de viajes afirma que como máximo el 2% presenta algún
tipo de problemas. Analizando una muestra de 200 paquetes vendidos resultó que sólo 191 de
ellos no presentaron problemas. Con un nivel de significación del 1%, ¿se puede seguir
manteniendo la hipótesis del vendedor?. Calcular la potencia del test para el valor 0,1 de la
proporción poblacional.
4. Los ingresos de las agencias de viajes siguen una ley normal, seleccionados al azar los ingresos
mensuales de 10 administrativos del sector se obtiene:
1250, 1230, 1210, 1200, 1240, 1185, 1190, 1220, 1260, 1195 euros.
¿Puede aceptarse la hipótesis, a un nivel de significación del 5%, que los ingresos medios de los
administrativos de las agencias de viajes son superiores a 1200 euros?
6. La renta disponible mensualmente de una familia rural es una variable aleatoria que sigue una
distribución normal N(905, 450) , expresados en euros. Para realizar un estudio sobre los hábitos
de esta comunidad rural, se ha tomado una muestra aleatoria simple de 1000 familias. Calcular
la probabilidad de que la cuasidesviación típica de la muestra sea superior a 430 euros.
2
7. Las compañías de seguros de automóviles suelen penalizar en sus primas a los conductores
más jóvenes, con el criterio que éstos son más propensos a tener un mayor número de
accidentes. En base a la tabla adjunta, con un nivel de significación del 5%, contrastar si el
número de accidentes es independiente de la edad del conductor.
Nota: eij ≡ frecuencia esperada
Número de accidentes al año
Edad del conductor
0 1 2 3 4
10 40 70
25 o menos 10 20
e11 = 33,75 e14 = 26,25 e15 = 39,37
20 10 15 20 30
26 ‐ 35
e22 = 16,62 e23 = 15,44 e25 = 24,94
60 50 30 10 5
más de 36
e31 = 34,87 e32 = 27,12 e33 = 25,19
8. En una región se cobra a los visitantes de los parques naturales, estimando que la variable
aleatoria número de personas que visitan el parque en coche sigue la siguiente distribución:
xi 1 2 3 4 5
P(X = x i ) 0,15 0,2 0,35 0,2 0,1
a) Hallar el número medio de visitantes por vehículos.
b) Hallar cuánto debe pagar cada visitante para que la ganancia por coche sea 2 euros.
c) Si cada persona paga p euros, ¿cuál es la ganancia esperada en un día en que entran mil
vehículos?
3
9. Una variable aleatoria continua X tiene por función de densidad
⎧1 − x 0 ≤ x < 1
⎪
f(x) = ⎨ x − 1 1 ≤ x ≤ 2
⎪ 0 otros casos
⎩
Se pide:
a) Representa la función de densidad
b) Hallar la función de distribución y su gráfica
⎛1 ⎞
c) P(0 ≤ X ≤ 1) P(−2 ≤ X ≤ 2) P ⎜ ≤ X < ∞ ⎟
⎝2 ⎠
10. La probabilidad de que un banco reciba un cheque sin fondos es 0.01
a) Si en una hora reciben 20 cheques, ¿cuál es la probabilidad de que tenga algún cheque sin
fondos?
b) El banco dispone de 12 sucursales en la ciudad, ¿cuál es la probabilidad de que al menos
cuatro sucursales reciban algún cheque sin fondos?
c) La media del valor de los cheques sin fondos es de 600 euros. Sabiendo que el banco trabaja 6
horas diarias, ¿qué cantidad no se espera pagar?
d) Si se computasen los 500 primeros cheques, ¿cuál es la probabilidad de recibir entre 3 y 6
(inclusive) cheques sin fondos?
11. Una compañía de seguros garantiza pólizas de seguros individuales contra retrasos aéreos
de más de doce horas. Una encuesta ha permitido estimar a lo largo de un año que cada persona
tiene una probabilidad de una de cada de mil de ser víctima de un retraso aéreo que esté
cubierto por este tipo de póliza y que la compañía aseguradora podrá vender una media de
cuatro mil pólizas al año.
Se pide hallar las siguientes probabilidades:
a) Que el número de retrasos cubiertos por la póliza no pase de cuatro por año
b) Número de retrasos esperados por año
c) Que el número de retrasos sea superior a dos por año
d) Que ocurran doce retrasos por año
4
12. Una variable aleatoria continua X tiene por función de distribución:
⎧ 0 x<0
⎪ 2
⎪ x 0≤x≤1
⎪ 2
F(x) = ⎨ 2
⎪2 x − x − 1 1 < x ≤ 2
⎪ 2
⎪ 1 x>2
⎩
Se pide:
a) Hallar la función de distribución y representarla
b) Media, varianza, desviación típica y coeficiente de variación
⎛1 3⎞
c) P ⎜ < X ≤ ⎟
⎝2 2⎠
13. Un estudiante busca información del sector aeronáutico en tres manuales, las
probabilidades de que esa información se encuentre en el primero, segundo o tercer manual,
respectivamente, son iguales a 0,6 , 0,7 y 0,8.
¿Cuál es la probabilidad de que la información figure sólo en dos manuales?.
14. En el gráfico se presenta la evaluación del estado general de salud de una muestra de
personas adultas mayores, según sea su peso normal o sobrepeso.
Analizar la existencia de una relación significativa entre el peso y el estado general de salud en el
adulto mayor, con un nivel de significación del 5%.
5
15. El peso en kilos de los jamones vendidos por una empresa sigue una distribución normal con
varianza 4 y peso medio desconocido. Se conoce que el peso medio de los jamones vendidos es
superior a 5 kg, y se toman m.a.s. de tamaño 4 para estimar θ . ¿Cuál de los dos estimadores
sería el mejor respondiendo a la insesgadez y eficiencia?
x + x2 + x3 x + x2
θˆ 1 = 1 θˆ 2 = 1
4 2
16. En un estacionamiento el número de veces que se abre la barrera en un intervalo de 10
minutos, para que pasen vehículos en un sector de seguridad, se considera una variable
aleatoria con distribución de Poisson de parámetro λ desconocido.
a) En una muestra aleatoria de 8 intervalos de 10 minutos cada uno, elegidos de forma
independiente, se registra para cada intervalo el valor que toma la variable en estudio.
3 5 8 7 4 5 6 2
Encontrar la estimación máximo verosímil de λ
b) Sea (x 1 , , x n ) una muestra aleatoria de tamaño n que sigue una distribución de Poisson.
x 1 + 3x n
n
∑ n , λˆ
xi
Sí λˆ 1 = 2 = son estimadores. Determinar el mejor estimador del parámetro λ
i=1
4
17. En una muestra aleatoria de personas se analizan algunos hábitos de la vida, habiendo
recogido datos de las siguientes variables:
X1 ≡ Estado general de salud: muy bueno (3), bueno (2), regular (1), malo (0)
X 2 ≡ Sexo: mujer (1), hombre (0)
X 3 ≡ Nivel del ejercicio diario: intenso (2), moderado (1), ninguno (0)
Realizadas las tablas de contingencia correspondientes, se calcularon los siguientes estadísticos
para contrastar la asociación: a) χ 2 (X1 , X 2 ) = 8 b) χ 2 (X 2 , X3 ) = 4,5 c) χ 2 (X1 , X3 ) = 6,1
Con la información facilitada, a un nivel de significación del 5%, elaborar un diagnóstico para
cada una de las parejas de variables.
18. Para analizar el peso promedio de niños y niñas, siguiendo ambos pesos una distribución
normal, se utiliza una muestra aleatoria de 20 niños y 25 niñas. El promedio de los pesos de los
niños es 45 kg. con una desviación típica de 6,4 kg., mientras que el promedio del peso de las
niñas es 38 kg. y una desviación típica de 5,6 kg. ¿Cuál es la probabilidad de que en la muestra el
peso promedio de los niños sea al menos 10 kg. mayor que el de las niñas?.
6
19. Un banco quiere analizar si las comisiones que cobra a sus clientes por operaciones en el
mercado bursátil difieren significativamente de las que cobra la competencia, cuya media es de
12 euros mensuales con una desviación estándar de 4.3 euros. Este banco toma una muestra de
64 operaciones bursátiles y observa que la comisión promedio es de 13,6 euros. Contrastar, al
nivel de significación del 5%, que este banco no difiere significativamente en el cobro de
comisiones por operaciones en la Bolsa con respecto a la competencia.
20. Calcular el estimador máximo verosímil del parámetro 'a' de las siguientes funciones:
a) f(x; a) = a 2 e − ax siendo x ≥ 0 en muestras aleatorias simples de tamaño n.
b) f(x; a) = ae − ax para x ≥ 0 , a > 0 en muestras aleatorias simples de tamaño 2.
23. En una cadena de televisión se hizo una encuesta a 3000 personas para saber la audiencia
de un debate y de una película que se emitieron en horas distintas: 2400 personas vieron la
película, 1600 vieron el debate y 400 no vieron ninguno de los dos programas. Se elegimos al
azar uno de los encuestados:
a) ¿Cuál es la probabilidad de que viera la película y el debate?.
b) ¿Cuál es la probabilidad de que viera la película, sabiendo que vio el debate?.
c) Sabiendo que vio la película, ¿Cuál es la probabilidad de que viera el debate?.
24. El flujo de demanda de teléfonos móviles (en miles a la hora) de una determinada fábrica se
ajusta a una variable aleatoria con la siguiente función de densidad:
⎧k − x si 0 ≤ x ≤ 1
f(x) = ⎨
⎩ 0 en el resto
a) Hallar k para que f(x) sea función de densidad
b) Hallar la función de distribución F(x)
c) Hallar la esperanza y la varianza
⎡1 3⎤
d) P ⎢ ≤ x ≤ ⎥
⎣2 4⎦
7
25. El peso (en gramos) de las cajas de cereales de una determinada marca sigue una
distribución N(μ , 5). Se han tomado los pesos de 16 cajas seleccionadas aleatoriamente, y los
resultados obtenidos han sido:
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.
a) Obtener el intervalo de confianza del 95% para la media poblacional.
b) Determinar cuál sería el tamaño muestral necesario para conseguir, con un 95% de confianza,
un intervalo de longitud igual a 2 gramos.
c) Suponiendo ahora que σ es desconocida, calcular el intervalo de confianza para la media al
99%.
26. Con un nivel de significación del 4,72%, se desea contrastar la hipótesis nula de igualdad de
medias de dos poblaciones N(μ1 , 4) y N(μ 2 , 4,5) . Para ello, se han tomado dos muestras
aleatorias simples e independientes, respectivamente, obteniéndose los siguientes valores:
27. Una entidad bancaria por experiencias anteriores ha estimado que la probabilidad de que
una persona falle en los pagos de un préstamo personal es de 0,25. También ha estimado que el
45% de los préstamos no pagados a tiempo se han hecho para financiar viajes de vacaciones y el
55% de los préstamos pagados a tiempo se han hecho para financiar viajes de vacaciones.
Se pide:
a) Probabilidad de que un préstamo que se haga para financiar un viaje de vacaciones no se
pague a tiempo.
b) Probabilidad de que si el préstamo se hace para propósitos distintos a viajes de vacaciones
sea pagado a tiempo.
28. El número de defectos en las tarjetas de circuito impreso sigue una distribución Poisson. Se
reúne una muestra aleatoria de 60 tarjetas de circuito impreso y se observa el número de
defectos. Los resultados obtenidos son los siguientes:
Número de defectos 0 1 2 3 o más
Frecuencia observada 32 15 9 4
¿Muestran los datos suficiente evidencia para decir que provienen de una distribución de
Poisson con una fiabilidad del 95%?
8
29. Sea una variable aleatoria X procedente de una población con densidad de probabilidad
N(μ , 4). Se quiere contrastar la hipótesis nula H0 : μ = μ 0 = 10 frente a la hipótesis alternativa
H1 : μ = μ 1 = 12 , con un nivel de significación α = 0,05 , con un muestreo simple de tamaño 25.
Determinar:
a) La probabilidad de cometer el error tipo II
b) La potencia del contraste
30. En cierta población, en una muestra de tamaño 100, la media muestral x de una
característica sigue una distribución normal. Se conoce que P ( x ≤ 75 ) = 0,58 y
P ( x > 80 ) = 0,04 . Hallar la media y la desviación típica poblacional.
31. Una encuesta del periódico constó de 320 trabajadores de una multinacional que fueron
despedidos entre 2017‐2018, encontrando que el 20% habían estado sin trabajo por lo menos
durante dos años. Si el periódico tuviera que seleccionar otra muestra aleatoria de 320
empleados despedidos entre 2017‐2018.
¿Cuál sería la probabilidad de que el porcentaje muestral de trabajadores sin empleo durante
por lo menos dos años, difiera del porcentaje obtenido en la primera encuesta, en un 5% o
más?.
32. En los días previos a unas elecciones municipales, el candidato de un partido político está
convencido de obtener el 60% de los votos electorales. No obstante, su partido encarga una
encuesta entre 100 votantes potenciales, resultando que el 52% de ellos dijeron tener intención
de votar a dicho candidato. Con un nivel de significación del 5%, se pide contrastar:
a) H0 : p = 0,60 frente a H1 : p = 0,50
b) H0 : p = 0,60 frente a H1 : p ≠ 0,60
c) Potencia del contraste efectuado en el apartado (a).
33. El análisis laboral que la U.E ha realizado para toda Europa, señala que en España, el salario
mensual de los varones, en algunos sectores económicos, supera en más de 100 euros el salario
de las mujeres que desempeñan las mismas tareas.
El Ministerio de Trabajo español decide considerar el salario mensual como una variable
aleatoria normalmente distribuida con desviación típica de 39,6 euros para los trabajadores
masculinos y de 36 euros para las trabajadoras de dichos sectores, siendo el salario de cada
población independiente del de la otra. Para tratar de verificar lo publicado, se elige una
muestra aleatoria simple de 500 trabajadores y de 700 trabajadoras, obteniéndose unos salarios
medios mensuales de 1.500 y 1.370 euros respectivamente.
¿Está fundamentada las conclusiones de la U.E al 1% de significación?
9
34. En el punto de partida de un laberinto hay tres orificios iguales A, B y C. Si una rata elige A
vuelve al punto de partida después de recorrer dos metros. Si elige B recorre cinco metros y
vuelve al mismo punto. Si elige C sale al exterior recorriendo un metro. ¿Por término medio que
distancia recorre una rata antes de salir, si siempre elige un orificio distinto de los seleccionados
en veces anteriores?
35. En una población con distribución N (μ , σ) , con un nivel de significación del 1%, para
contrastar la hipótesis nula H0 : σ 20 = 25 frente a la hipótesis alternativa H1 : σ12 = 36 , se toma
una muestra aleatoria de tamaño 16, con varianza igual a 27. Hallar la potencia del contraste.
38. El jefe de recursos humanos de una empresa realiza un test de diez ítems a los aspirantes a
un puesto, teniendo en cada ítems cuatro posibles respuestas, de las que sólo una es correcta.
Suponiendo que los aspirantes teniendo la misma probabilidad de responder. Se pide hallar las
probabilidades para el aspirante:
a) Conteste todos los ítems mal
b) Conteste al menos cuatro ítems bien
c) Conteste entre cuatro y seis ítems bien
d) Conteste todos los ítems bien
e) Conteste menos de tres ítems bien
10
39. El tiempo de revisión del motor de un avión sigue aproximadamente una distribución
exponencial, con media 22 minutos.
a) Hallar la probabilidad de que el tiempo de la revisión sea menor de 10 minutos.
b) El costo de la revisión es de 200 euros por cada media hora o fracción. ¿Cuál es la
probabilidad de que una revisión cueste 400 euros?
c) Para efectuar una programación sobre las revisiones del motor, ¿cuánto tiempo se debe
asignar a cada revisión para que la probabilidad de que cualquier tiempo de revisión mayor que
el tiempo asignado sea solo de 0,1?
40. El consumo familiar de cierto artículo se distribuye uniformemente con esperanza 10 y
varianza unidad. Determinar la probabilidad de que el consumo de dicho artículo se encuentre
comprendido entre 8 y 12 unidades.
41. Una fábrica aeronáutica produce en cada turno 100000 bolas para rodamientos, siendo la
probabilidad de bola defectuosa 0,04. Las bolas se supervisan todas, depositando las
defectuosas en un recipiente que se vacía al final de cada turno. ¿Cuántas bolas ha de contener
el recipiente para que la probabilidad de que su capacidad no sea rebasada sea 0,95?
43. Una empresa produce un artículo que sigue una distribución uniforme entre 25000 y 30000
unidades. Sabiendo que vende cada unidad a 10 euros y la función de costes viene dada por
C = 100000 + 2X , ¿cuál será el beneficio esperado?
44. La duración de vida de una pieza de un motor sigue una distribución exponencial, sabiendo
que la probabilidad de que sobrepase las 100 horas de uso es 0,9. Se pide:
a) Probabilidad de que sobrepase las 200 horas de uso.
b) ¿Cuántas horas se mantiene funcionando con probabilidad 0,95?
46. Un corredor de bolsa adquiere 50 acciones diferentes, concertando con sus clientes una
ganancia de 1200 euros por acción. Por experiencias anteriores, se sabe que los beneficios de
cada acción son independientes y se distribuyen uniformemente en el intervalo ⎡⎣1000, 2000 ⎤⎦ .
¿Qué probabilidad tiene el corredor de no perder dinero?.
11
47. Un individuo juega con probabilidad de ganar igual a 1 2 en cada partida. Si gana en una
partida obtiene 5 euros y si pierde paga 5 euros. En una tarde juega 400 partidas. ¿Qué cantidad
debe llevar si quiere tener una probabilidad de 0,95 de hacer frente a posibles pérdidas?
48. Para aprobar la asignatura de estadística teórica se realiza un test con veinte ítems.
Sabiendo que una persona determinada tiene una probabilidad de 0,8 de contestar bien cada
ítem. Se pide:
a) Probabilidad de que la primera pregunta que contesta bien sea la tercera que hace.
b) Para aprobar el test es necesario contestar diez ítems bien. ¿Cuál es la probabilidad de que
apruebe al contestar el doceavo ítem?.
49. En una caja hay 5 triángulos, 3 círculos y 2 rectángulos. Realizando extracciones con
reemplazamiento, se piden las siguientes probabilidades:
a) Al realizar 8 extracciones, se obtengan en 4 ocasiones un círculo.
b) Se necesiten 8 extracciones para obtener 4 círculos.
c) Que aparezca el primer círculo en la 8 extracción.
d) Al realizar 8 extracciones aparezcan 3 triángulos, 3 círculos y 2 rectángulos.
e) Al realizar 6 extracciones sin remplazamiento aparezcan en 2 ocasiones un círculo.
50. Por prescripción médica, un enfermo debe hacer una toma de tres píldoras de un
determinado medicamento. De las doce píldoras que contiene el envase hay cuatro en malas
condiciones. Se pide:
a) Probabilidad de que tome sólo una buena.
b) Probabilidad de que de las tres píldoras de la toma al menos una esté en malas condiciones.
c) ¿Cuál es el número de píldoras que se espera tome el enfermo en buenas condiciones en cada
toma?
d) Si existe otro envase que contenga cuarenta píldoras, de las que diez se encuentran en malas
condiciones. ¿qué envase sería más beneficiosos para el enfermo?
51. El número promedio de recepción de solicitudes en una ventanilla de atención al cliente es
de tres al día.
a) ¿Cuál es la probabilidad de que el tiempo antes de recibir una solicitud exceda cinco días?
b) ¿Cuál es la probabilidad de que el tiempo antes de recibir una solicitud sea menor de diez
días?
c) ¿Cuál es la probabilidad de que el tiempo antes de recibir una solicitud sea menor de diez
días, si ya han pasado cinco días sin recibir solicitudes?
52. Una web tiene un número promedio de 5 visitantes por hora. Se piden las probabilidades:
a) Sea visitada por un mínimo de 6 personas.
b) Qué pase más de una hora sin que sea visitada.
12
53. Sea X la variable aleatoria que describe el número de clientes que llega a un supermercado
durante un día (24 horas). Sabiendo que la probabilidad de que llegue un cliente en un día es
equivalente a 100 veces la que no llegue ningún cliente en un día, se pide:
a) Probabilidad de que lleguen al menos 3 clientes al día.
b) Si acaba de llegar un cliente, calcular la probabilidad que pase más de 25 minutos hasta que
llegue el siguiente cliente (o hasta que llegue el primer cliente).
c) En dos semanas, ¿cuál es la probabilidad aproximada de que lleguen como mucho 1300
clientes al supermercado?
54. Calcular la media, varianza y coeficiente de variación de la variable aleatoria discreta que
tiene como función de distribución:
⎧ 0 x<2
⎪ 0,2 2 ≤ x < 4
⎪⎪
F(x) = ⎨ 0,55 4 ≤ x < 6
⎪ 0,85 6 ≤ x < 8
⎪
⎪⎩ 1 x≥8
55. La variable aleatoria discreta X tiene como distribución de probabilidad
X = xi 1 2 3 4
P(X = x i ) 0,30 0,25 0,10 0,35
Se realiza un cambio de origen hacia la izquierda de dos unidades y un cambio de escala de tres
unidades. Calcular y razonar propiedades:
a) Media y varianza de la X.
b) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
origen.
c) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
escala.
d) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
origen y escala.
13
56. Sea (X, Y) una variable aleatoria bidimensional con función de densidad:
a) Hallar k para que sea función de densidad.
b) Hallar las funciones de densidad marginales. ¿Son X e Y independientes?
c) Hallar las funciones de distribución marginales.
d) Hallar las funciones de densidad condicionadas.
57. Sea (X, Y) una variable aleatoria bidimensional con función de densidad:
58. La función de densidad asociada a la emisión de billetes de una compañía área es:
a) Hallar la función de distribución.
b) Hallar las funciones de densidad marginales de X e Y.
c) ¿Son X e Y independientes?
59. La función de distribución asociada a un fenómeno de la naturaleza es:
a) Hallar la función de densidad.
b) Hallar las funciones de densidad marginales de X e Y.
c) Hallar las funciones de densidad condicionadas.
d) Calcular el coeficiente de correlación.
14
60. La venta en un mercado de abastos lleva asociada la función:
⎧ ⎡xy ⎤
⎪k ⎢ + 1 ⎥ 0<x<1 −1< y <1
f(x, y) = ⎨ ⎣ 2 ⎦
⎪ 0 en el resto
⎩
a) Hallar k para que sea función de densidad
b) Hallar la función de distribución
c) Funciones de densidad marginales y condicionadas
d) Se considera la transformación Z = X − Y y T = X + 2Y , hallar la función de densidad de la
variable (Z , T)
62. El estacionamiento de corta estancia en el Aeropuerto Adolfo Suárez está cerca de la
terminal, de modo que al recoger a un pasajero solo hay que caminar una corta distancia al área
de recuperación de equipajes. Para decidir si el estacionamiento tiene suficientes lugares, el
gerente del aeropuerto necesita saber si el tiempo medio de permanencia es superior a 40
minutos. Una muestra aleatoria de una población normal mostró que 12 clientes estuvieron en
el estacionamiento los siguientes lapsos de tiempo, en minutos:
55 47 27 64 53 56
49 53 39 48 48 37
Con un nivel de significación 0,05, ¿se puede afirmar que el tiempo medio en el estacionamiento
es superior a 40 minutos?
63. El gerente de un centro comercial de Madrid desea estimar la cantidad media que gastan los
clientes que visitan el centro comercial. Sabiendo que el gasto sigue una distribución normal,
una muestra de 20 clientes señala las siguientes cantidades en euros:
37,9 46,9 41,8 46,8 49,2 52,7 50,8
52,6 61,8 23,7 42,2 61,5 58,8 54,8
48,5 61,9 51, 4 48,1 51,3 43,9
Determinar un intervalo de confianza del 95% e interpretar el resultado. ¿Se podría afirmar que
la media poblacional es de 50 o 60 euros?
15
64. Una empresa de neumáticos afirma que una nueva gama en promedio 28.000 km. Las
pruebas con 64 neumáticos dan como resultado una duración media de 27.800 km, con una
desviación típica de 1.000 km.
a) Si se usa un nivel de significación del 5%, comprobar si hay evidencia suficiente para rechazar
la afirmación de la empresa.
b) ¿Cuál es el p‐valor?
65. Un estudio de la DGT estima que el número de horas prácticas necesarias para la obtención
del permiso de conducir sigue una distribución normal N(24, 3). Se sabe que la autoescuela
Fuenterrebollo ingresa por alumno una parte fija de 250 euros, más 23 euros por hora de
práctica.
a) ¿Qué probabilidad hay de obtener el permiso de conducir con 20 horas de prácticas o menos?
b) ¿Cuántas horas de prácticas ha necesitado un conductor para obtener el permiso si el 68% de
los conductores ha necesitado más horas de prácticas que él?
c) Calcular el ingreso por alumno esperado.
d) Calcular la desviación típica del ingreso por alumno.
66. Se ha medido el perímetro craneal a niños de edad comprendida entre los dos y tres años,
obteniéndose los siguientes datos en centímetros:
Intervalos 38 − 40 40 − 42 42 − 44 44 − 46 46 − 48
Frecuencia observada 11 7 7 6 4
Comprobar si las observaciones craneales son o no distribuidas según una ley normal con un
nivel de confianza del 99%.
67. Un fabricante de televisores está desarrollando un nuevo modelo de televisor en color, y
para este fin se pueden utilizar dos tipos de esquemas transistorizados. El fabricante selecciona
una muestra de esquemas transistorizados del primer tipo de tamaño 16, y otra del segundo
tipo de tamaño 13. Los datos muestrales respecto a la vida media de cada esquema son los
⎧ x1 = 1400 horas s1 = 30 horas n1 = 16
siguientes: ⎨
⎩ x2 = 1500 horas s2 = 17 horas n2 = 13
Construir un intervalo de confianza del 90% para la diferencia de vida media de cada tipo de
esquema.
16
68. Un instituto de investigaciones agronómicas siembra, en cinco parcelas diferentes, dos tipos
de maíz híbrido. Las producciones en quintales métricos por hectárea son:
Híbrido I 90 85 95 76 80
Híbrido II 84 87 90 92 90
Construir un intervalo de confianza del 90% para la diferencia entre las producciones medias.
69. Un equipo de investigación biológica está interesado en ver si una nueva droga reduce el
colesterol en la sangre. Con tal fin toma una muestra de diez pacientes y determina el contenido
de colesterol en la sangre antes y después del tratamiento. Los datos muestrales expresados en
miligramos por 100 mililitros son los siguientes:
Antes 217 252 229 200 209 213 215 260 232 216
Después 209 241 230 208 206 211 209 228 224 203
Construir un intervalo de confianza del 95 por 100 para la diferencia del contenido medio de
colesterol en la sangre antes y después del tratamiento.
70. Según los dirigentes del partido A, la intención de voto del partido rival B, en Andalucía, es
la misma que la que tiene en Madrid. Se realiza una encuesta a 100 personas en Andalucía de los
que 25 mostraron su apoyo al partido B, y a otras 100 personas en Madrid de las que 30 se
inclinaron por el partido B.
a) Construir un intervalo de confianza del 90% para la proporción de personas que votarían al
partido B en Andalucía.
b) ¿A cuántas personas habría que encuestar para obtener un margen de error o error de
estimación ± 2%, al nivel de confianza anterior?.
c) Construir un intervalo de confianza al 90% para la diferencia de proporciones en la estimación
del voto del partido B en las dos comunidades. ¿Podemos afirmar que los dirigentes del partido
A tienen razón?.
71. Para comprobar si los operarios encontraban dificultades con una prensa manual de
imprimir, se hizo una prueba a cuatro operarios anotando el número de atascos sufridos al
introducir el mismo número de hojas, dando lugar a la siguiente tabla:
Operario A B C D Total
Obstrucciones 6 7 9 18 40
Con un nivel de significación del 5%, ¿existe diferencia entre los operarios?
17
72. Para una muestra aleatoria simple de 350 días, el número de urgencias tratadas diariamente
en un hospital queda reflejado en la siguiente tabla:
Número urgencias 0 − 5 5 − 10 10 − 15 15 − 20 20 − 25 25 − 30 Total días
Número de días 20 65 100 95 60 10 350
Contrastar con un nivel de significación del 5% si la distribución del número de urgencias
tratadas diariamente en el hospital se ajusta a una distribución normal.
73. Una empresa ubicada en Madrid tiene dos conductores para trasladar a los empleados a
Segovia. Los conductores deben anotar la duración de cada trayecto. En una muestra aleatoria
simple de 50 partes de incidencias por conductor, el conductor A registra un tiempo medio de
trayecto de 62,30 minutos con una desviación típica de 10,325 minutos, mientras que el
conductor B tiene un tiempo medio de trayecto de 60,02 minutos con una desviación típica de
8,625 minutos.
El tiempo medio empleado por el conductor A en el trayecto sigue una ley normal N(μ1 ,9) y el
empleado por el conductor B se distribuye según una ley N(μ 2 ,8) . Con un nivel de significación
del 5%, se pide contrastar:
a) H0 : μ 1 = μ 2 frente a H1 : μ 1 ≠ μ 2
b) H0 : μ1 − μ 2 ≥ 2 frente a H1 : μ 1 − μ 2 < 2
74. La directora del departamento de personal de una corporación está buscando empleados
para un puesto en el extranjero Durante el proceso de selección, la administración le pregunta
cómo va la incorporación de empleados, y ella contesta que sigue una ley normal y que la
puntuación promedio en la prueba de aptitudes será de 90 puntos.
Cuando la administración revisa 19 de los resultados de la prueba, encuentra que la puntuación
media es de 83,25 puntos con una desviación estándar de 11.
Con un nivel de confianza del 90%, ¿lleva razón la directora?. Calcula su p‐valor.
75. La tabla refleja el número de accidentes mortales de tráfico que se producen en una
carretera a lo largo de un período de tiempo.
Accidentes mortales por día 0 1 2 3 4 5
Número de días 132 195 120 60 24 9
¿Se ajustan los datos a una distribución de Poisson?. Utilizar un nivel de significación 0,05
18
76. Se sabe que las peras siguen una distribución N(θ, 1) . En una muestra de peras, con peso
medio de 300 gramos, se realizó un contraste con un nivel de significación del 5% y una potencia
de 0,6443, en donde la hipótesis nula era de H0 : θ = 0, 4 kg frente a la hipótesis alternativa de
H1 : θ = 0,3 kg. Se desea saber:
a) ¿Cuál es el tamaño de la muestra?
b) Hallar la hipótesis aceptada.
77. Las especificaciones de un tipo de báscula aseguran que los errores en las pesadas siguen
una distribución normal con esperanza nula y varianza unidad. Se desea contrastar la afirmación
sobre la varianza frente a la hipótesis alternativa de que la varianza es 4. En este sentido, se
realizan cinco pesadas en las que el error cometido resultó ser:
1 0,9 − 0,2 1, 4 − 0,7
Para un nivel de significación del 5%, se pide:
a) Obtener la mejor región crítica.
b) Obtener la potencia del contraste.
c) Indicar qué hipótesis resultada aceptada.
78. El precio de los productos vendidos por una empresa es una variable aleatoria con función
de densidad f(x) = θ x θ − 1 , donde 0 < x < 1 , θ > 0 , que depende del parámetro desconocido θ .
Se quiere contrastar sobre el valor de dicho parámetro la hipótesis nula H0 : θ = 1 frente a la
alternativa H1 : θ = 2 . Para ello, se toma una muestra aleatoria simple de tamaño dos.
Determinar el nivel de significación y la potencia del contraste, si se toma como región crítica
x 1 x 2 ≤ 0,6
79. El volumen diario de ventas de una empresa, en cien mil euros, es una variable aleatoria X
sobre cuya función de densidad se establece la hipótesis nula H0 : f (x) = x 2 , 0 < x < 2 , frente a
la hipótesis alternativa H1 : f (x) = 1 2 , 0 < x < 2. Para realizar el contraste se toma una muestra
aleatoria simple de dos días en los que los volúmenes de venta fueron de 50.000 euros y 100.000
euros. Con un nivel de significación del 5 por ciento, se pide:
a) Hallar la mejor región crítica.
b) Calcular la potencia del contraste.
c) Qué hipótesis se acepta.
19
80. La variable aleatoria X representa los gastos mensuales de una empresa, cuya función de
densidad es f (θ, x) = θ x θ − 1 con θ> 0 y 0 < x < 1 . Se realiza una m.a.s. de tamaño 3, y se
proponen tres estimadores:
x 12 + 2 x 22 + 3 x 23 x 3 − 2x 1 + 4 x 2
θˆ 1 = x θˆ 2 = θˆ 3 =
6 6
a) Calcule los sesgos.
b) Si la muestra que se obtiene es (0,7 , 0,1 , 0,3), calcule las estimaciones puntuales.
c) ¿Cuáles son las funciones estimadas para las estimaciones anteriores?
81. La variable aleatoria poblacional "renta de las familias" del municipio de Madrid se
distribuye siguiendo un modelo N(μ , σ 2 ) . Se extraen muestras aleatorias simples de tamaño 4.
Como estimadores del parámetro μ se proponen los siguientes:
x + 2 x2 + 3 x3 x − 4 x2
μˆ 1 = 1 μˆ 2 = 3 μˆ 3 = x Se pide:
6 −3
a) Comprobar si los estimadores son insesgados
b) ¿Cuál es el más eficiente?
c) Si tuviera que escoger entre ellos, ¿cuál escogería?. Razone su respuesta a partir del Error
Cuadrático Medio.
82. La distribución del peso de las manzanas de una determinada cosecha sigue una distribución
normal, cuyo peso medio es desconocido y cuya desviación típica es 7 gramos. Se pide:
a) Analizar cuál de los estimadores μ̂1 y μ̂ 2 del peso medio es mejor respecto del sesgo y de la
eficiencia, para una muestra aleatoria simple de tamaño cinco.
5
∑X
i=1
i
83. Una muestra aleatoria (x 1 , , x n ) de la población tiene como función de densidad
⎧ θ x θ − 1 si x∈ (0,1)
fθ (x) = ⎨ θ > 0
⎩ 0 en el resto
a) Hallar un estadístico suficiente.
b) Estimador de máxima verosimilitud de θ .
c) Estimador de θ por el método de los momentos.
20
84. Una muestra aleatoria (x 1 , , x n ) de la población tiene como función de densidad
⎧⎪ − x + θ si x > 0
fθ (x) = ⎨ e Se pide:
⎪⎩ 0 en el resto
a) Hallar un estimador por el método de los momentos de θ
b) Estudiar si el estimador encontrado en el apartado anterior es insesgado para estimar el
parámetro θ .
85. El coseno X del ángulo con el que se emiten los electrones en un proceso radioactivo es una
⎧(1 + θ x ) 2 −1 ≤ x ≤ 1 − 1 ≤ θ≤ 1
variable aleatoria con función de densidad fθ (x) = ⎨
⎩ 0 en el resto
Considando una muestra aleatoria (x 1 , , x n ) de esta variable aleatoria, se pide:
a) Obtener el estimador θ por el método de los momentos.
b) Calcular la varianza de este estimador y demostrar que es consistente.
21
EJERCICICOS RESUELTOS EXAMEN ESTADÍSTICA TEÓRICA
1. Se desea determinar si en una zona rural el 60% o el 70% de los hogares dispone de conexión
a internet, que sigue una ley normal; para dilucilarlo se toma al azar una muestra de 400
hogares, adoptando el criterio de que si en la muestra hay menos de 260 hogares con conexión a
internet, se rechaza que el 60% de los hogares poseen conexión. Se pide:
a) Nivel de significación del test
b) Potencia del test
c) Riesgo tipo II
Solución:
⎧ 260 ⎫
La región crítica que define el test es: RC α = ⎨pˆ pˆ ≥ = 0,65 ⎬
⎩ 400 ⎭
Para hallar el nivel de significación, bajo la hipótesis nula, se recurre al error tipo I:
400
∑ x , donde:
1
Para calcular esta probabilidad interesa conocer la distribución de p̂ = i
n i=1
⎧ 1 hogares con conexión internet
xi = ⎨
⎩ 0 hogares sin conexión internet
pq
ˆ = p y V(p)
Se conoce que E(p) ˆ =
n
Como el tamaño de la muestra es sufientemente grande y estar definido p̂ como suma de
variables aleatorias independientes según una distribución de Bernouilli B(1, p) se puede
⎛ pq ⎞
aproximar la distribución exacta de p̂ por una distribución normal p̂ ∼ N⎜⎜ p , ⎟
⎝ n ⎟⎠
⎛ 0,6 x 0, 4 ⎞
Bajo la hipótesis nula, p̂ ∼ N⎜⎜ 0,6 , ⎟ ≡ N(0,6 , 0,0245)
⎝ 400 ⎟⎠
22
b) Pot = 1 − β = P(Rechazar H0 siendo falsa) = P(pˆ ≥ 0,65 p = 0,7)
⎛ 0,7 x 0,3 ⎞
Bajo la hipótesis alternativa, p̂ ∼ N⎜⎜ 0,7 , ⎟ ≡ N(0,7, 0,023)
⎝ 400 ⎟⎠
2. Una variable aleatoria continua X tiene por función de distribución:
⎧ 0 x<1
⎪
F(x) = ⎨ x − 1 1 ≤ x < 2
⎪ 1 x≥2
⎩
a) Calcular la función de densidad o función de cuantía
b) Calcular la media, mediana y coeficiente de variación
Solución:
a) La función de densidad o función de cuantía es la derivada de la función de distribución en
los puntos donde exista la derivada, entonces:
⎧0 x<1
dF(x) ⎪ ⎧1 1 ≤ x < 2
f(x) = = ⎨1 1 ≤ x < 2 ⎯⎯
→ f(x) = ⎨
dx ⎪0 ⎩ 0 en otro caso
⎩ x≥2
∞ 2
⎡ x2 ⎤
∫ ∫
2
1 3
b) Media: α1 = μ X = E(X) = x f(x)dx = x dx = ⎢ ⎥ = 2 − = = 1,5
−∞ 1 ⎣ 2 ⎦1 2 2
♦ La Mediana de una distribución es el valor que deja el 50% de la distribución a la derecha y el
otro 50% a la izquierda, por lo que:
23
⎧ F(Me ) = 0,5 ⇒ Me − 1 = 0,5 ⇒ Me = 1,5
⎪
⎪
⎨
∫ ∫
Me Me
⎪ f(x) = 0,5 ⇒ dx = 0,5 ⇒ [ x ]1 e = 0,5 ⇒ Me − 1 = 0,5 ⇒ Me = 1,5
M
⎪⎩ 1 1
σX
♦ Coeficiente de variación: CVX =
μX
∞ 2
⎡ x3 ⎤
∫ ∫
2
8 1 7
α2 = E(X ) = 2
x f(x)dx =
2
x dx = ⎢ ⎥ = − =
2
−∞ 1 ⎣ 3 ⎦1 3 3 3
2
7 ⎛3⎞ 7 9 1 1
σ = α 2 − α = − ⎜ ⎟ = − = ⇒ σ x =
2
X
2
1 = 0,08
3 ⎝ 2 ⎠ 3 4 12 12
σ X 0,08
CVX = = = 0,05
μX 1,5
3. Un vendedor mayorista de paquetes de viajes afirma que como máximo el 2% presenta algún
tipo de problemas. Analizando una muestra de 200 paquetes vendidos resultó que sólo 191 de
ellos no presentaron problemas. Con un nivel de significación del 1%, ¿se puede seguir
manteniendo la hipótesis del vendedor?. Calcular la potencia del test para el valor 0,1 de la
proporción poblacional.
Solución:
Se trata de un contraste unilateral a la derecha o de cola a la derecha.
p̂ − p
Se acepta la hipótesis nula sí zexp = ≤ zα
pq
n
191
proporción muestral que presenta problemas p̂ = 1 − = 1 − 0,995 = 0,045
200
24
0,045 − 0,02
estadístico experimental: zexp = = 2,5253
0,02 x 0,98
200
En este test, la hipótesis nula se rechaza cuando la proporción muestral es:
pˆ − p pq 0,02 x 0,98
> zα → pˆ > p + zα ≡ pˆ > 0,02 + 2,33 pˆ > 0,043
pq n 200
n
⎛ pq ⎞ ⎛ 0,1 x 0,9 ⎞
p̂ ∼ N⎜⎜ p , ⎟⎟ ≡ N⎜⎜ 0,1, ⎟ ≡ N( 0,1, 0,0212 )
⎝ n ⎠ ⎝ 200 ⎟⎠
25
4. Los ingresos de las agencias de viajes siguen una ley normal, seleccionados al azar los ingresos
mensuales de 10 administrativos del sector se obtiene:
1250, 1230, 1210, 1200, 1240, 1185, 1190, 1220, 1260, 1195 euros.
¿Puede aceptarse la hipótesis, a un nivel de significación del 5%, que los ingresos medios de los
administrativos de las agencias de viajes son superiores a 1200 euros?
Solución:
Se trata de un contraste unilateral a la derecha o de cola a la derecha.
x −μ
Se acepta la hipótesis nula sí texp = ≤ tα , (n − 1)
s/ n
Con los datos muestrales:
10 10
∑ ∑
1 12180 1 6210
a1 = x = xi = = 1218 s2 = (x i − x)2 = = 690
10 i = 1 10 9 i=1 9
s = 690 = 26,26
x − μ 1218 − 1200
Bajo la hipótesis nula, texp = = = 2,1675
s / n 26,26 / 10
26
5. Sea X una variable aleatoria que se distribuye según una normal N(μ , 4) . Suponiendo que el
tamaño muestral n = 10 . Se pide:
a) Determinar el número k tal que, exista una probabilidad de 0,99 de que el estadístico
desviación tipica muestral, sea mayor que él.
b) Determinar el número k tal que, exista una probabilidad de 0,99 de que el estadístico
cuasidesviación tipica muestral, sea mayor que él.
Solución:
⎪⎧ σ x ≡ varianza muestral
2
n σ 2x (n − 1)s2x
La distribución 2 = ∼ χn−1 , donde ⎨ 2
2
σ σ2 ⎪⎩ sx ≡ cuasivarianza muestral
⎛ n σ2 n k2 ⎞ ⎛ n k2 ⎞
P(σ x > k) = 0,99 → P(σ 2x > k 2 ) = 0,99 → P ⎜ 2x > 2 ⎟ = P ⎜ χn2 − 1 > 2 ⎟ = 0,99
⎝ σ σ ⎠ ⎝ σ ⎠
por tanto,
⎛ n k2 ⎞ ⎛ 10 k 2 ⎞ 10 k 2
P ⎜ χn2 − 1 > 2 ⎟ = P ⎜ χ 29 > ⎟ = 0,99 → = 2,09 → k = ± 1,82
⎝ σ ⎠ ⎝ 16 ⎠ 16
⎛ (n − 1)s2x (n − 1) k 2 ⎞
b) P(sx > k) = 0,99 → P(s2x > k ) = 0,99 → P ⎜
2
> ⎟ = 0,99
⎝ σ σ2
2
⎠
⎛ (n − 1)k 2 ⎞ ⎛ 2 9k 2 ⎞ 9k 2
P ⎜ χn2 − 1 > ⎟ = P χ
⎜ 9 > ⎟ = 0,99 → = 2,09 → k = ± 1,928
⎝ σ 2
⎠ ⎝ 16 ⎠ 16
27
6. La renta disponible mensualmente de una familia rural es una variable aleatoria que sigue una
distribución normal N(905, 450) , expresados en euros. Para realizar un estudio sobre los hábitos
de esta comunidad rural, se ha tomado una muestra aleatoria simple de 1000 familias. Calcular
la probabilidad de que la cuasidesviación típica de la muestra sea superior a 430 euros.
Solución:
Por otra parte, siendo la muestra aleatoria simple, y procediendo de una población normal, se
(n − 1)s2x
tiene: ∼ χn2 −1
σ 2
999 s2x
con lo cual, ∼ χ 2999
4502
⎝ 450 450 ⎠
En las tablas de la χ 2 no se encuentran tantos grados de libertad, teniendo que recurrir al
comportamiento asintótico de la normal proporcionado por Fisher:
= P(z > −1,97) = P(z < 1,97) = 1 − P(z > 1,97) = 1 − 0,0244 = 0,9756
28
7. Las compañías de seguros de automóviles suelen penalizar en sus primas a los conductores
más jóvenes, con el criterio que éstos son más propensos a tener un mayor número de
accidentes. En base a la tabla adjunta, con un nivel de significación del 5%, contrastar si el
número de accidentes es independiente de la edad del conductor.
Nota: eij ≡ frecuencia esperada
Número de accidentes al año
Edad del conductor
0 1 2 3 4
10 40 70
25 o menos 10 20
e11 = 33,75 e14 = 26,25 e15 = 39,37
20 10 15 20 30
26 ‐ 35
e22 = 16,62 e23 = 15,44 e25 = 24,94
60 50 30 10 5
más de 36
e31 = 34,87 e32 = 27,12 e33 = 25,19
Solución:
Hipótesis nula H 0 ≡ El número de accidentes sufridos por los conductores no depende de la edad
del conductor
k m
(n i j − e ij ) 2 k m
n ij2
Se acepta H 0 : χ 2
(k − 1) . (m − 1) = ∑∑
i=1 j=1
e ij
= ∑∑ ei= 1 j=1 ij
− n < χ 2α ; (k − 1) . (m − 1)
{
Región de rechazo de la hipótesis nula: R rechazo = χ 2(k − 1) . (m − 1) ≥ χ 2α ; (k − 1) . (m − 1) }
Se forma la tabla de contingencia 3 x 5 donde cada frecuencia observada
(n ij ) i = 1, , k ; j = 1, ,m tiene una frecuencia teórica o esperada en caso de independencia
n i • x n• j
e ij =
n
29
Número de accidentes por año
m
Edad del
0 1 2 3 4
∑n
j=1
i•
conductor
10 10 20 40 70 150
25 o menos
e11 = 33,75 e12 = 26,25 e13 = 24,37 e14 = 26,25 e15 = 39,37 (150)
20 10 15 20 30 95
26 ‐ 35
e21 = 21,37 e22 = 16,62 e23 = 15,44 e24 = 16,62 e25 = 24,94 (95)
60 50 30 10 5 155
más de 36
e31 = 34,87 e32 = 27,12 e33 = 25,19 e34 = 27,12 e35 = 40,69 (155)
∑n
i=1
•j 90 70 65 70 105 400
95 . 90 95 . 70 95 . 65 95 . 70 95 . 105
e21 = = 21, 37 e22 = = 16, 62 e23 = = 15, 44 e24 = = 16, 62 e25 = = 24,94
400 400 400 400 400
3 5
( n i j − e ij ) 2 3 5
n i2j
Estadístico observado: χ 2
(3 − 1) . (5 − 1) =χ =
2
8 ∑∑
i=1 j=1
e ij
= ∑∑ e
i=1 j=1 ij
−n=
⎛ 10 2 10 2 20 2 40 2 70 2 ⎞ ⎛ 20 2 10 2 15 2 20 2 30 2 ⎞
= ⎜ + + + + +
⎟ ⎜ + + + + ⎟+
⎝ 33,75 26,25 24,37 26,25 39,37 ⎠ ⎝ 21,37 16,62 15, 44 16,62 24,94 ⎠
⎛ 60 2 50 2 30 2 10 2 52 ⎞
+ ⎜ + + + + ⎟ − 400 = 143,51
⎝ 34,87 27,12 25,19 27,12 40,69 ⎠
30
Estadístico teórico: χ 20,05 ; (3 − 1) . (5 − 1) = χ 20,05 ; 8 = 15,507
En consecuencia, la edad influye significativamente en el número de accidentes al año.
8. En una región se cobra a los visitantes de los parques naturales, estimando que la variable
aleatoria número de personas que visitan el parque en coche sigue la siguiente distribución:
xi 1 2 3 4 5
P(X = x i ) 0,15 0,2 0,35 0,2 0,1
a) Hallar el número medio de visitantes por vehículos.
b) Hallar cuánto debe pagar cada visitante para que la ganancia por coche sea 2 euros.
c) Si cada persona paga p euros, ¿cuál es la ganancia esperada en un día en que entran mil
vehículos?
Solución:
a) X = "número de personas que visitan el parque en coche"
5
E(X) = ∑ x P(X = x ) = 1
i=1
i i x 0,15 + 2 x 0,2 + 3 x 0,35 + 4 x 0,2 + 5 x 0,1 = 2,9 visitante/vehículo
b) Sea la variable aleatoria Y = "ganancia por coche"
2
E(Y) = E(pX) = pE(X) = p x 2,9 = 2 p= = 0,689
2,9
c) Sea la variable aleatoria U = "ganancia de un día"
31
9. Una variable aleatoria continua X tiene por función de densidad
⎧1 − x 0 ≤ x < 1
⎪
f(x) = ⎨ x − 1 1 ≤ x ≤ 2
⎪ 0 otros casos
⎩
Se pide:
a) Representa la función de densidad
b) Hallar la función de distribución y su gráfica
⎛1 ⎞
c) P(0 ≤ X ≤ 1) P(−2 ≤ X ≤ 2) P ⎜ ≤ X < ∞ ⎟
⎝2 ⎠
Solución:
a) Se observa que el área encerrada es igual a la
unidad.
∫
x
b) La función de distribución se define F(x) = f(t)dt
−∞
∫ ∫
x x
x
⎡ t2 ⎤
∫ ∫ f(t)dt = ∫
0 x x
x2
0≤x<1 F(x) = f(t)dt + (1 − t)dt = ⎢ t − ⎥ = x −
−∞ 0 0 ⎣ 2 ⎦0 2
1 2
⎡ t2 ⎤ ⎡ t2 ⎤
∫ (1 − t)dt + ∫
1 2
32
⎧ 0 x<0
⎪ 2
⎪ x− x 0≤x<1
⎪ 2
F(x) = ⎨ 2
⎪x − x +1 1≤ x ≤ 2
⎪2
⎪ 1 x>2
⎩
⎛1 ⎞
c) P(0 ≤ X ≤ 1) P(−2 ≤ X ≤ 2) P⎜ ≤ X < ∞ ⎟
⎝2 ⎠
⎛1 ⎞ 1
P(0 ≤ X ≤ 1) = F(1) − F(0) = ⎜ − 1 + 1 ⎟ − 0 =
⎝2 ⎠ 2
⎛4 ⎞
P(− 2 ≤ X ≤ 2) = F(2) − F(− 2) = ⎜ − 2 + 1 ⎟ − 0 = 1
⎝2 ⎠
⎛1 ⎞ ⎛1⎞ ⎛1 1 4⎞ 5
P ⎜ ≤ X < ∞ ⎟ = F(∞) − F ⎜ ⎟ = 1 − ⎜ − ⎟=
⎝2 ⎠ ⎝2⎠ ⎝2 2 ⎠ 8
33
10. La probabilidad de que un banco reciba un cheque sin fondos es 0.01
a) Si en una hora reciben 20 cheques, ¿cuál es la probabilidad de que tenga algún cheque sin
fondos?
b) El banco dispone de 12 sucursales en la ciudad, ¿cuál es la probabilidad de que al menos
cuatro sucursales reciban algún cheque sin fondos?
c) La media del valor de los cheques sin fondos es de 600 euros. Sabiendo que el banco trabaja 6
horas diarias, ¿qué cantidad no se espera pagar?
d) Si se computasen los 500 primeros cheques, ¿cuál es la probabilidad de recibir entre 3 y 6
(inclusive) cheques sin fondos?
Solución:
⎛ 20 ⎞
P [ X ≥ 1] = 1 − P [ X < 1] = 1 − P [ X = 0 ] = 1 − ⎜ ⎟ .0,01 0 .0,9920 = 1 − 0,980 = 0,182
⎝0⎠
⎡ ⎛ 12 ⎞ ⎛ 12 ⎞ ⎛ 12 ⎞
= 1 − ⎢⎜ ⎟ .0,1820 .0,81812 + ⎜ ⎟ .0,1821 .0,81811 + ⎜ ⎟ .0,1822 .0,81810 +
⎣⎝ 0 ⎠ ⎝1⎠ ⎝2⎠
⎛ 12 ⎞ ⎤
+ ⎜ ⎟ .0,1823 .0,818 9 ⎥ = 1 − [ 0,0897 + 0,2396 + 0,2932 + 0,2174 ] = 0,16
⎝3⎠ ⎦
1 hora 6 horas
c) = n = 120 cheques
20 cheques n cheques
P [ 3 ≤ U ≤ 6 ] = P [U = 3] + P [U = 4 ] + P [U = 5] + P [U = 6 ] =
⎡ 53 5 4 55 56 ⎤
= ⎢ + + + ⎥ .e−5 = [ 20,833 + 26,042 + 26,042 + 21,701] .e−5 = 0,6375
⎣ 3! 4! 5! 6! ⎦
34
11. Una compañía de seguros garantiza pólizas de seguros individuales contra retrasos aéreos
de más de doce horas. Una encuesta ha permitido estimar a lo largo de un año que cada persona
tiene una probabilidad de una de cada de mil de ser víctima de un retraso aéreo que esté
cubierto por este tipo de póliza y que la compañía aseguradora podrá vender una media de
cuatro mil pólizas al año.
Se pide hallar las siguientes probabilidades:
a) Que el número de retrasos cubiertos por la póliza no pase de cuatro por año
b) Número de retrasos esperados por año
c) Que el número de retrasos sea superior a dos por año
d) Que ocurran doce retrasos por año
Solución:
Sea X = "número de retrasos por año", la variable sigue una distribución binomial
1
n = 4000 , p = = 0,001 , B(4000 , 0,001)
1000
⎛ 4000 ⎞ 4000 − k
con lo que, P(X = k) = ⎜ k
⎟ . 0,001 . 0,999 k = 0,1, , 4000
⎝ k ⎠
Es necesario buscar una distribución que sea una buena aproximación de ésta. La distribución de
Poisson es una buena aproximación de la binomial B(4000 , 0,001) , ya que p = 0,001 es muy
pequeña y n.p = 4000.0,001 = 4 < 5 .
4 k −4
Por tanto, X ∼ B(4000 , 0,001) ≈ X ∼ P(λ = n.p = 4) P(X = 4) = .e
k!
⎡ 4 0 41 4 2 4 3 4 4 ⎤
= ⎢ + + + + ⎥ .e−4 = [1 + 4 + 8 + 10,667 + 10,667] .e−4 = 0,6289
⎣ 0! 1! 2! 3! 4! ⎦
b) El número de retrasos esperado por año es la media μ x = λ = 4
⎡ 4 0 41 4 2 ⎤
= 1 − ⎢ + + ⎥ .e−4 = 1 − [1 + 4 + 8 ] .e−4 = 1 − 0,381 = 0,7619
⎣ 0! 1! 2! ⎦
412 −4
d) P(X = 12) = .e = 0,035.e−4 = 0,00064
12!
35
12. Una variable aleatoria continua X tiene por función de distribución:
⎧ 0 x<0
⎪ 2
⎪ x 0≤x≤1
⎪ 2
F(x) = ⎨ 2
⎪2 x − x − 1 1 < x ≤ 2
⎪ 2
⎪ 1 x>2
⎩
Se pide:
a) Hallar la función de distribución y representarla
b) Media, varianza, desviación típica y coeficiente de variación
⎛1 3⎞
c) P ⎜ < X ≤ ⎟
⎝2 2⎠
Solución:
a) La función de densidad es la derivada de la función de distribución en los puntos donde exista
la derivada, entonces:
⎧0 x<0
⎪x 0≤x≤1
dF(x) ⎪
f(x) = =⎨
dx ⎪2 − x 1 < x ≤ 2
⎪⎩ 0 x>2
⎧ x 0≤x≤1
⎪
f(x) = ⎨2 − x 1 < x ≤ 2
⎪ 0 otros valores
⎩
b) Media
∞
∫ ∫ ∫ ∫ ∫
1 2 1 2
α1 = μ X = E(X) = x f(x)dx = x.x. dx + x.(2 − x). dx = x dx +
2
(2 x − x 2 ).dx =
−∞ 0 1 0 1
1 2
⎡ x3 ⎤ ⎡ x3 ⎤ 1 ⎛ 8⎞ ⎛ 1⎞
= ⎢ ⎥ + ⎢ x 2 − ⎥ = + ⎜ 4 − ⎟ − ⎜ 1 − ⎟ = 1
⎣ 3 ⎦0 ⎣ 3 ⎦1 3 ⎝ 3⎠ ⎝ 3⎠
Varianza: σ 2X = α 2 − α12
36
∞
∫ ∫ ∫ ∫ ∫ (2 x − x ).dx =
1 2 1 2
α2 = E(X 2 ) = x 2 f(x)dx = x 2 .x. dx + x 2 .(2 − x). dx = x 3 dx + 2 3
−∞ 0 1 0 1
1 2
⎡ x 4 ⎤ ⎡ 2x 3 x 4 ⎤ 1 ⎛ 16 16 ⎞ ⎛ 2 1 ⎞ 14 7
= ⎢ ⎥ + ⎢ − ⎥ = +⎜ − ⎟−⎜ − ⎟= =
⎣ 4 ⎦o ⎣ 3 4 ⎦1 4 ⎝ 3 4 ⎠ ⎝ 3 4 ⎠ 12 6
7 2 1
σ 2X = α 2 − α12 = −1 =
6 6
1
Desviación típica: σ X = = 0, 41
6
σ X 0,41
Coeficiente variación: CVX = = = 0, 41
μX 1
⎛1 3 ⎞ ⎛ 3 ⎞ ⎛ 1 ⎞ ⎛ 3 (3 2)2 ⎞ ⎛ (1 2)2 ⎞ 9 1 3
c) P ⎜ < X ≤ ⎟ = F ⎜ ⎟ − F ⎜ ⎟ = ⎜ 2. − − 1⎟ − ⎜ ⎟ = 3 − − 1 − = = 0,75
⎝2 2⎠ ⎝2⎠ ⎝2⎠ ⎝ 2 2 ⎠ ⎝ 2 ⎠ 8 8 4
13. Un estudiante busca información del sector aeronáutico en tres manuales, las
probabilidades de que esa información se encuentre en el primero, segundo o tercer manual,
respectivamente, son iguales a 0,6 , 0,7 y 0,8.
¿Cuál es la probabilidad de que la información figure sólo en dos manuales?.
Solución:
Sean A, B y C los tres sucesos en cuestión tales que
P(A) = 0,6 , P(B) = 0,7 y P(C) = 0,8 .
Cada uno de los sucesos A, B y C es independiente con los
otros dos, además los sucesos (A ∩ B ∩ C) , (A ∩ B ∩ C) y
(A ∩ B ∩ C) son incompatibles.
P [ (A ∩ B ∩ C) ∪ (A ∩ B ∩ C) ∪ (A ∩ B ∩ C)] =
= P [ (A ∩ B ∩ C)] + P [ (A ∩ B ∩ C)] + P [ (A ∩ B ∩ C)] =
= P(A) P(B) P(C) + P(A) P(B) P(C) + P(A) P(B) P(C) =
= 0,6.0,7.0,2 + 0,6.0,3.0,8 + 0, 4.0,7.0,8 = 0,452
37
14. En el gráfico se presenta la evaluación del estado general de salud de una muestra de
personas adultas mayores, según sea su peso normal o sobrepeso.
Analizar la existencia de una relación significativa entre el peso y el estado general de salud en el
adulto mayor, con un nivel de significación del 5%.
Solución:
Se trata de dos variables dicotómicas con datos de frecuencia, pudiéndose aplicar una prueba
de contraste de asociación con la Chi‐cuadrado.
La hipótesis nula H0 : El estado de salud y el peso son independientes
Llevando la información a una tabla de contingencia de 2 x 2
Peso
Estado de Salud ni•
Normal Sobrepeso
12 8 20
Bueno
e11 = 9, 41 e12 = 10,59 20
4 10 14
Malo
e21 = 6,59 e22 = 7, 41 14
n• j 16 18 34
38
Como la frecuencia esperada e21 = 6,59 , todas las celdas cumplen con el mínimo aconsejable de
5 en su valor esperado. En la práctica se acepta hasta un 20% de las celdas que no cumplen con
el requisito de que la frecuencia esperada sea ≥ 5
Se calculan los valores de χ 2 correspondientes a las dos observaciones, siendo la frecuencia
n i • x n• j
esperada e ij =
n
20 . 16 14 . 16
e11 = = 9, 41 e21 = = 6,59
34 34
20 . 18 14 . 18
e12 = = 10,59 e22 = = 7, 41
34 34
Estadístico de contraste:
2 2
n2i j
∑∑
122 82 42 102
χ 2
(2 − 1) . (2 − 1) =χ =
2
1 −n= + + + − 34 = 3,265
i=1 j=1
ei j 9, 41 10,59 6,59 7, 41
39
15. El peso en kilos de los jamones vendidos por una empresa sigue una distribución normal con
varianza 4 y peso medio desconocido. Se conoce que el peso medio de los jamones vendidos es
superior a 5 kg, y se toman m.a.s. de tamaño 4 para estimar θ . ¿Cuál de los dos estimadores
sería el mejor respondiendo a la insesgadez y eficiencia?
x + x2 + x3 x + x2
θˆ 1 = 1 θˆ 2 = 1
4 2
Solución:
Para estudiar la insesgadez de los estimadores se calculan sus esperanzas:
⎡ x + x2 + x3 ⎤ 1 3
E(θˆ 1 ) = E ⎢ 1 ⎥ = ⎡⎣ E(x1 ) + E(x 2 ) + E(x 3 ) ⎤⎦ = θ
⎣ 4 ⎦ 4 4
3 1
El sesgo del estimador θ̂1 será: b(θˆ 1 ) = E(θˆ 1 ) − θ = θ − θ = − θ
4 4
⎡ x + x2 ⎤ 1 2
E(θˆ 2 ) = E ⎢ 1 ⎥ = ⎡
⎣ E(x 1 ) + E(x 2 ) ⎤
⎦ = θ = θ
⎣ 2 ⎦ 2 2
Atendiendo al sesgo se elige θ̂2
Para analizar la eficiencia relativa de los dos estimadores se calculan las respectivas varianzas
⎡ x + x2 + x3 ⎤ 1
V(θˆ 1 ) = V ⎢ 1 ⎥ = [ V(x1 + x 2 + x 3 )] =
⎣ 4 ⎦ 16
Observaciones
♦ independientes
1 1 12 3
= ⎡ V(x 1 ) + V(x 2 ) + V(X3 ) ⎦⎤ =
⎣ 12 = =
16 V (xi ) = 4 16 16 4
⎡ x + x2 ⎤ 1 1 1
♦ V(θˆ 2 ) = V ⎢ 1 ⎥ = [ V(x 1 + x 2 )] = ⎡ V(x 1 ) + V(x 2 ) ⎦⎤ = 8 = 2
⎣
⎣ 2 ⎦ 4 4 4
Aparecen decisiones contrapuestas, de modo que el estimador se elige en base al error
cuadrático medio: ECM = Varianza + (sesgo) 2
40
2
ˆ 3 ⎛ θ⎞ θ 2 + 12
ECM(θ1 ) = + ⎜ − ⎟ = ECM(θˆ 2 ) = 2 + 0 = 2
4 ⎝ 4⎠ 16
Se analiza cuando es mayor el ECM el primer estimador θ̂1 :
θ 2 + 12
ECM(θˆ 1 ) > ECM(θˆ 2 ) > 2 ⇒ θ 2 > 20 ⇒ θ > 20 ≈ 4, 47
16
Se conoce que el peso medio de los jamones es superior a 5 kg, no queda duda que el estimador
a elegir (con menor error cuadrático medio) es θ̂2
16. En un estacionamiento el número de veces que se abre la barrera en un intervalo de 10
minutos, para que pasen vehículos en un sector de seguridad, se considera una variable
aleatoria con distribución de Poisson de parámetro λ desconocido.
a) En una muestra aleatoria de 8 intervalos de 10 minutos cada uno, elegidos de forma
independiente, se registra para cada intervalo el valor que toma la variable en estudio.
3 5 8 7 4 5 6 2
Encontrar la estimación máximo verosímil de λ
b) Sea (x 1 , , x n ) una muestra aleatoria de tamaño n que sigue una distribución de Poisson.
x 1 + 3x n
n
∑ n , λˆ
xi
Sí λˆ 1 = 2 = son estimadores. Determinar el mejor estimador del parámetro λ
i=1
4
Solución:
a) X = "número de veces que se abre la barrera en un intervalo de 10 minutos", X ∼ P(λ )
⎧ λx
⎪ e− λ x = 0, 1, 2, ...
P(X, λ ) = ⎨ x!
⎪ 0 otro caso
⎩
Función de verosimilitud:
n
n
∑ xi
λ x1 − λ λ xn −λ λ i=1
L(λ ) = L(X , λ ) = ∏ P(x i , λ ) = e e = n e− n λ
∏x!
i=1
x1 ! xn !
i
i=1
41
⎛ ∑ xi ⎞
n
n
⎜ λ i=1 ⎟ ∑ ⎛ n
⎞
∏
xi
−nλ
⎜
lnL(X , λ ) = ln n e ⎟ = ln(λ i=1
) − ln ⎜ x i ! ⎟ + ln(e− n λ ) =
⎜ ⎟ ⎜ ⎟
⎜⎜
⎝ i=1
∏
xi ! ⎟⎟
⎠
⎝ i=1 ⎠
n n
= ∑
i=1
x i ln λ − ∑ ln(x !) − n λ
i=1
i
n n
lnL(X , λ ) = ∑ x ln λ − ∑ ln(x !) − n λ
i=1
i
i ∈= 1
i
El estimador de máxima verosimilitud viene dado por la media muestral EMV(λˆ ) = x
Utilizando la muestra aleatoria de ocho intervalos de 10 minutos, se obtiene el estimador
máximo verosímil:
En consecuencia, en una muestra aleatoria de ocho intervalos de 10 minutos cada uno, elegidos
de forma independiente, la estimación máxima verosímil corresponde a que la barrera se abre 5
veces.
b) Se analizan si los estimadores son o no insesgados, esto es, si la esperanza del estimador
coincide con el parámetro a estimar.
⎛ n
xi ⎞ 1
n
nλ
E(λˆ 1 ) = E ⎜
⎜
⎝
∑
i=1
⎟=
n ⎟⎠ n ∑ E(x ) =
i=1
i
n
=λ
⎛ x + 3 xn ⎞ 1 λ + 3λ
E(λˆ 2 ) = E ⎜ 1 ⎟ = [E(x 1 ) + 3E(x 2 )] = =λ
⎝ 4 ⎠ 4 4
Ambos estimadores son insesgados.
42
Varianza de cada estimador:
⎛ n
xi ⎞ 1
n
nλ λ
V(λˆ 1 ) = V ⎜
⎜
⎝
∑
i=1
⎟=
n ⎟⎠ n2 ∑ V(x ) = n
i=1
i 2
=
n
⎛ x + 3 xn ⎞ 1 λ + 9 λ 10 λ 5 λ
V (λˆ 2 ) = V ⎜ 1 ⎟ = [ V(x 1 ) + 9 V(x 2 )] = = =
⎝ 4 ⎠ 16 16 16 8
La efectividad de los estimadores depende del tamaño de la muestra:
♦ Si la muestra es igual a 1 (n = 1) el estimador más eficiente es λ̂ 2
17. En una muestra aleatoria de personas se analizan algunos hábitos de la vida, habiendo
recogido datos de las siguientes variables:
X1 ≡ Estado general de salud: muy bueno (3), bueno (2), regular (1), malo (0)
X 2 ≡ Sexo: mujer (1), hombre (0)
X 3 ≡ Nivel del ejercicio diario: intenso (2), moderado (1), ninguno (0)
Realizadas las tablas de contingencia correspondientes, se calcularon los siguientes estadísticos
para contrastar la asociación: a) χ 2 (X1 , X 2 ) = 8 b) χ 2 (X2 , X3 ) = 4,5 c) χ 2 (X1 , X3 ) = 6,1
Con la información facilitada, a un nivel de significación del 5%, elaborar un diagnóstico para
cada una de las parejas de variables.
Solución:
αp = P(χp,3
2
≥ 8). Interpolando en la tabla de la Chi‐cuadrado:
43
Siendo αp = 0,0469 < 0,05 se rechaza la hipótesis nula, concluyendo que el estado general de
salud está asociado al sexo.
αp = P(χp,2
2
≥ 4,5). Interpolando en la tabla de la Chi‐cuadrado:
αp = P(χp,6
2
≥ 6,1). Interpolando en la tabla de la Chi‐cuadrado:
44
18. Para analizar el peso promedio de niños y niñas, siguiendo ambos pesos una distribución
normal, se utiliza una muestra aleatoria de 20 niños y 25 niñas. El promedio de los pesos de los
niños es 45 kg. con una desviación típica de 6,4 kg., mientras que el promedio del peso de las
niñas es 38 kg. y una desviación típica de 5,6 kg. ¿Cuál es la probabilidad de que en la muestra el
peso promedio de los niños sea al menos 10 kg. mayor que el de las niñas?.
Solución:
Sean las variables aleatorias X = "Peso de los niños" e Y= "Peso de las niñas", X ∼ N ( μ x , σ x ) e
Y ∼ N ( μ y , σ y ) , independientes entre sí.
En las muestras respectivas:
⎛ σ ⎞ ⎛ 6, 4 ⎞ ⎛ σ ⎞ ⎛ 5,6 ⎞
x ∼ N⎜ μ x , x ⎟ ≡ N⎜ 45, ⎟ e y ∼ N ⎜ μ y , y ⎟ ≡ N⎜ 38, .
⎝ n⎠ ⎝ 20 ⎠ ⎝ m⎠ ⎝ 25 ⎠⎟
⎛ 2 ⎞
⎛
⎛ σx ⎞ ⎛ σy ⎞ ⎟ σ 2x σ y ⎞
2 2
ξ = (x − y) ∼ N⎜ μ x − μ y , +
⎜ n⎟ ⎜ m⎟ ⎟ ≡ N ⎜ μx − μy , + ⎟
⎜ ⎝ ⎠ ⎝ ⎠ ⎠ ⎝ n m⎠
⎝
⎛ 6, 42 5,62 ⎞
La variable ξ = (x − y) ∼ N ⎜ 45 − 38, + ⎟ = N(7, 1,82)
⎝ 20 25 ⎠
⎛ ξ − 7 10 − 7 ⎞
P(ξ ≥ 10) = P ⎜ ≥ ⎟ = P(z ≥ 1,648) = 0,05
⎝ 1,82 1,82 ⎠
19. Un banco quiere analizar si las comisiones que cobra a sus clientes por operaciones en el
mercado bursátil difieren significativamente de las que cobra la competencia, cuya media es de
12 euros mensuales con una desviación estándar de 4.3 euros. Este banco toma una muestra de
64 operaciones bursátiles y observa que la comisión promedio es de 13,6 euros. Contrastar, al
nivel de significación del 5%, que este banco no difiere significativamente en el cobro de
comisiones por operaciones en la Bolsa con respecto a la competencia.
Solución::
X = "Comisiones que se cobran por operaciones en el mercado bursátil", X ∼ N ( μ , 4,3 )
Se establecen las hipótesis: H0 : μ = 12 H1 : μ ≠ 12
45
⎧⎪ Si x > k se rechaza H 0 (R.C.)
Regla decisión ⎨
⎪⎩ Si x ≤ k se acepta H 0 (R.A.)
⎡ 4,3 ⎤
Bajo la hipótesis nula, x ∼ N ⎢12 , ⎥ ≡ N(12, 0,5375)
⎣⎢ 64 ⎥⎦
El valor crítico k se calcula mediante el nivel de significación α = 0,05 :
⎡ x − 12 k1 − 12 ⎤ ⎡ k − 12 ⎤ ⎡ k − 12 ⎤
♦ P(x < k 1 ) = P ⎢ < ⎥ = P ⎢z < 1 ⎥ = P ⎢z > − 1 = 0,025
⎣ 0,5375 0,5375 ⎦ ⎣ 0,5375 ⎦ ⎣ 0,5375 ⎥⎦
k 1 − 12
− = 1,96 k 1 = 10,9465
0,5375
⎡ x − 12 k 2 − 12 ⎤ ⎡ k 2 − 12 ⎤
♦ P(x > k 2 ) = P ⎢ > ⎥ = P ⎢ z > 0,5375 ⎥ = 0,025
⎣ 0,5375 0,5375 ⎦ ⎣ ⎦
k 2 − 12
= 1,96 k 2 = 13,0535
0,5375
Como la comisión promedio muestral es de 13,6 euros, no se encuentra dentro de la región de
aceptación. En consecuencia existe evidencia estadística de que la comisión promedio que cobra
el banco difiere significativamente de la competencia.
αp = P ⎡⎣ x > 13,6 N(12, 0,5375)⎤⎦ = P ⎣⎡(x < −13,6) ∪ (x > 13,6)⎦⎤ = P(x < −13,6) + P(x > 13,6) =
⎡ x − 12 13,6 − 12 ⎤
= 2 P(x > 13,6) = 2 P ⎢ > = 2 P(z > 2,98) = 2 x 0,00144 = 0,0028
⎣ 0,5375 0,5375 ⎥⎦
46
Como αp = 0,0028 < 0,05 = α , se rechaza la hipótesis nula a un nivel de significación del 5%.
Por tanto, existe evidencia estadística de que la comisión promedio que cobra este banco difiere
significativamente de la competencia.
20. Calcular el estimador máximo verosímil del parámetro 'a' de las siguientes funciones:
a) f(x; a) = a 2 e − ax siendo x ≥ 0 en muestras aleatorias simples de tamaño n.
b) f(x; a) = ae − ax para x ≥ 0 , a > 0 en muestras aleatorias simples de tamaño 2.
Solución::
n
−a ∑ xi
La función de verosimilitud L = L(x 1 , x 2 , , x n ; a) = (a 2 e − ax1 ).(a 2 e − ax2 ) (a 2 e − axn ) = a 2n e i=1
n
−a ∑ xi n
aplicando logaritmos neperianos: Ln L = Ln (a 2n e i=1
) = 2n Lna − a ∑ x i
i=1
derivando respecto de 'a' e igualando a cero:
d(Ln L) 2n n 2n 2 2
= − ∑ x i = 0 → aˆ = n = → aˆ =
da a i=1 ∑ xi x x
i=1
47
aplicando logaritmos neperianos: Ln L = Ln (a 2 e − a (x1 + x2 ) ) = 2Lna − a(x 1 + x 2 )
derivando respecto de 'a' e igualando a cero:
d(Ln L) 2 2 1
= − (x 1 + x 2 ) = 0 → aˆ = =
da a x1 + x 2 x
Solución::
La función de verosimilitud es:
⎡ ⎤ ⎡ ⎤ ⎡ (x n −μ ) ⎤
2
(x −μ ) 2
(x −μ ) 2
− 1 2 − 2 2 −
1 1 ⎢ 1 ⎥=
L(X; μ , σ ) = ⎢ e 2σ ⎥ ⎢ e 2σ ⎥ e 2σ
2
2
⎢ 2πσ 2
⎥ ⎢ 2πσ 2
⎥ ⎢ 2πσ 2 ⎥
⎣ ⎦ ⎣ ⎦ ⎣ ⎦
n
∑ (xi −μ ) 2
i=1
−
1 2 σ2
= n n
e
(2 π) (σ )
2 2 2
tomando logaritmos neperianos, se tiene:
⎡ ∑ (xi −μ ) 2 ⎤
n
n
⎢ −
i=1 ⎥ ∑ (x i − μ) 2
1 n n
Ln ⎡⎣ L(X; μ , σ 2 )⎤⎦ = Ln ⎢ e 2 σ ⎥ = − Ln(2 π) − Ln(σ 2 ) −
2 i = 1
⎢ n n
⎥ 2 2 2 σ2
⎢ (2 π ) 2
(σ 2 2
) ⎥
⎣ ⎦
y derivando respecto a σ 2 e igualando a cero:
n
∑ (x i − μ)
2
d Ln ⎡⎣ L(X; μ , σ 2 )⎤⎦ n i=1
=− + =0
dσ 2 2σ 2 2σ 4
n
∑ (x i − μ)
2
i=1
como σ 2 > 0 , el estimador máximo verosímil de σ 2 será: σˆ 2 =
n
Conviene observar que el estimador no es la varianza muestral, dado que las desviaciones de los
valores muestrales lo son con respecto a la media poblacional μ y no respecto a la media
muestral x .
48
22. Sean A, B y C tres sucesos mutuamente independientes con P(A) = P(B) = P(C) = p , donde
0 < p < 1 . Calcular la probabilidad de que ocurran exactamente dos de los tres sucesos
considerados.
Solución::
Sea el suceso E = 'ocurran exactamente dos de los sucesos A, B , C'
E = (A ∩ B ∩ C) ∪ (A ∩ B ∩ C) ∪ (A ∩ B ∩ C)
P(E) = P ⎡⎣ (A ∩ B ∩ C) ∪ (A ∩ B ∩ C) ∪ (A ∩ B ∩ C) ⎤⎦ =
= P(A ∩ B ∩ C) + P(A ∩ B ∩ C) + P(A ∩ B ∩ C)
⎧ A , B, C son independientes
⎪
♦ como son independientes A, B y C → ⎨ A , B, C son independientes
⎪ A , B, C son independientes
⎩
49
23. En una cadena de televisión se hizo una encuesta a 3000 personas para saber la audiencia
de un debate y de una película que se emitieron en horas distintas: 2400 personas vieron la
película, 1600 vieron el debate y 400 no vieron ninguno de los dos programas. Se elegimos al
azar uno de los encuestados:
a) ¿Cuál es la probabilidad de que viera la película y el debate?.
b) ¿Cuál es la probabilidad de que viera la película, sabiendo que vio el debate?.
c) Sabiendo que vio la película, ¿Cuál es la probabilidad de que viera el debate?.
Solución:
Se organizan los datos en una tabla de doble entrada, completando los que faltan.
D D
1400 7
a) P(P ∩ D) = = = 0, 466
3000 15
P(P ∩ D) 1400 7
b) P(P / D) = = = = 0,875
P(D) 1600 8
P(D ∩ P) 1400 7
c) P(D / P) = = = = 0,583
P(P) 2400 12
50
24. El flujo de demanda de teléfonos móviles (en miles a la hora) de una determinada fábrica se
ajusta a una variable aleatoria con la siguiente función de densidad:
⎧k − x si 0 ≤ x ≤ 1
f(x) = ⎨
⎩ 0 en el resto
a) Hallar k para que f(x) sea función de densidad
b) Hallar la función de distribución F(x)
c) Hallar la esperanza y la varianza
⎡1 3⎤
d) P ⎢ ≤ x ≤ ⎥
⎣2 4⎦
Solución:
1
∫
⎡ x2 ⎤
1
1 3
a) (k − x) dx = ⎢k x − ⎥ = k − = 1 k=
0 ⎣ 2 ⎦0 2 2
⎧3
⎪ − x si 0 ≤ x ≤ 1
Función de densidad: f(x) = ⎨ 2
⎪⎩ 0 en el resto
∫ f(t) dt = ∫
x x x
⎡3 ⎤ ⎡3 1 2⎤ 3 1 2
b) 0 ≤ x < 1 F(x) = ⎢⎣ 2 − t ⎥⎦ dt = ⎢⎣ 2 t − 2 t ⎥⎦ = 2 x − 2 x
0 0 0
∫ ∫
1 x 1
⎡3 ⎤ ⎡3 ⎤ ⎡3 1 2⎤ 3 1
x ≥ 1 F(x) = ⎢⎣ 2 − t ⎥⎦ dt + ⎢⎣ 2 − t ⎥⎦ dt = ⎢⎣ 2 t − 2 t ⎥⎦ = 2 − 2 = 1
0 1 0
⎧ 0 si x < 0
⎪
⎪3 x2
Función de distribución F(x) = ⎨ x − si 0 ≤ x < 1
⎪2 2
⎪⎩ 1 si x ≥ 1
∫ x . f(x) dx = ∫ ∫
⎡ 3 2 x3 ⎤
1 1 1
⎡3 ⎤ ⎡3 2⎤ 3 1 5
c) μ = E ( x ) = x . ⎢ − x ⎥ dx == ⎢⎣ 2 x − x ⎥⎦ dx = ⎢ 4 x − 3 ⎥ = 4 − 3 = 12
0 0 ⎣2 ⎦ 0 ⎣ ⎦0
1
)=∫ ∫ ∫
⎡ 3 3 x4 ⎤
1 1 1
⎡3 ⎤ ⎡3 2 3⎤
d) E ( x
1 1 1
2
x . f(x) dx =
2
x . ⎢ − x ⎥ dx ==
2
⎢⎣ 2 x − x ⎥⎦ dx = ⎢ x − ⎥ = − =
0 0 ⎣2 ⎦ 0 ⎣6 4 ⎦0 2 4 4
2
1 ⎛ 5 ⎞ 36 − 25 11
σ = Var(x) = E(x ) − [E(x)] = − ⎜ ⎟ =
2
2 2
=
4 ⎝ 12 ⎠ 144 144
51
3 3 3
∫ ∫
⎡1 3⎤ 4 4 ⎡3 ⎤ ⎡3 1 2 ⎤ 4 17
d) P ⎢ ≤ x ≤ ⎥ = f(x) dx = ⎢⎣ 2 − x ⎥⎦ dx = ⎢⎣ 2 x − x =
⎣2 4⎦ 1 1 2 ⎥⎦ 1 32
2 2 2
25. El peso (en gramos) de las cajas de cereales de una determinada marca sigue una
distribución N(μ , 5). Se han tomado los pesos de 16 cajas seleccionadas aleatoriamente, y los
resultados obtenidos han sido:
506, 508, 499, 503, 504, 510, 497, 512, 514, 505, 493, 496, 506, 502, 509, 496.
a) Obtener el intervalo de confianza del 95% para la media poblacional.
b) Determinar cuál sería el tamaño muestral necesario para conseguir, con un 95% de confianza,
un intervalo de longitud igual a 2 gramos.
c) Suponiendo ahora que σ es desconocida, calcular el intervalo de confianza para la media al
99%.
Solución:
a) Se trata de construir un intervalo de confianza para la media poblacional μ de varianza
conocida σ 2 = 25 . El intervalo de confianza de nivel (1 − α) viene dado por:
media
Error
muestral ⎧ σ ⎛ 2 zα 2 σ ⎞
2
16
∑x
i=1
i
El intervalo de confianza solicitado será:
⎡ 5 ⎤ ⎡ 5 5 ⎤
I 0,95 (μ) = ⎢503,75 ± 1,96 ⎥ = ⎢ 503,75 − 1,96 , 503,75 + 1,96 ⎥
⎣ 16 ⎦ ⎣ 16 16 ⎦
⎡ σ ⎤
b) La amplitud o longitud vendrá dado por la fórmula: I 1−α (μ) = ⎢ x ± z α 2 ⎥
⎢⎣ n ⎥⎦
52
⎛ amplitud o ⎞ ⎛ σ ⎞ ⎛ σ ⎞
2
σ ⎛ 2 zα 2 σ ⎞
⎜ =
⎟ ⎜⎜ x + z ⎟ − ⎜ x − z ⎟ = 2 zα 2 n=⎜ ⎟
n ⎠⎟ ⎝⎜ n ⎠⎟
α2 α2
⎝ longitud ⎠ ⎝ n ⎝ amplitud ⎠
2
⎛ 2.1,96. 5 ⎞
siendo, n = ⎜ ⎟ ≈ 96 cajas de cereales
⎝ 2 ⎠
c) Se trata de construir un intervalo de confianza para la media poblacional μ de varianza
poblacional desconocida, con muestras pequeñas (n ≤ 30). El intervalo de confianza de nivel
(1 − α) , viene dado por:
⎡ sx ⎤
I 1−α (μ) = ⎢ x ± t (α 2),n−1 ⎥ 1 − α = 0,99 α = 0,01 t0,005;15 = 2,947
⎢⎣ n ⎥⎦
16
∑ (x − x )
i=1
i
2
El intervalo de confianza solicitado será:
⎡ 6 ⎤ ⎡ 6 6 ⎤
I 0 ,99 (μ) = ⎢ 503,75 ± 2,947 ⎥ = ⎢ 503,75 − 2,947 , 503,75 + 2,947 ⎥
⎣⎢ 16 ⎥⎦ ⎢⎣ 16 16 ⎦⎥
53
26. Con un nivel de significación del 4,72%, se desea contrastar la hipótesis nula de igualdad de
medias de dos poblaciones N(μ1 , 4) y N(μ 2 , 4,5) . Para ello, se han tomado dos muestras
aleatorias simples e independientes, respectivamente, obteniéndose los siguientes valores:
Solución:
En el contraste bilateral se establecen las hipótesis: H0 : μ 1 − μ 2 = 0 H1 : μ 1 − μ 2 ≠ 0
⎪⎧ Si x − y > k se rechaza H0
Regla de decisión ⎨
⎪⎩ Si x − y ≤ k se acepta H0
Para analizar el contraste, se realizan los cálculos muestrales:
6 5
∑xi=1
i ∑y
j=1
j
x= = 12, 25 y= = 13,64 n1 = 6 n2 = 5
6 5
⎡ σ ⎤ ⎡ σ ⎤
x ∼ N ⎢μ1 , 1 ⎥ y ∼ N ⎢μ2 , 2 ⎥
⎢⎣ n1 ⎥⎦ ⎢⎣ n2 ⎥⎦
Bajo la hipótesis nula H 0 : μ 1 − μ 2 = 0 , la diferencia de medias muestrales se distribuye:
⎡ σ 12 σ 22 ⎤ ⎡ 4 2 4,5 2 ⎤
(x − y) ∼ N ⎢ 0 , + ⎥ ≡ N ⎢0 , + ⎥ = N⎡⎣ 0 , 2,59⎤⎦
⎢⎣ n1 n2 ⎥⎦ ⎢⎣ 6 5 ⎥⎦
Se determina el valor de k mediante el nivel de significación α :
⎡ ( x − y) − 0 ⎤ ⎡⎛ x−y ⎞ ⎛ x−y ⎞⎤
= P ⎢ >K⎥ =P⎢⎜ < − K ⎟∪ ⎜ > K ⎟⎥ =
⎣ 2,59 ⎦ ⎣ ⎝ 2,59 ⎠ ⎝ 2,59 ⎠⎦
⎡ x−y ⎤ ⎡ x−y ⎤ α α
= P ⎢ < − K⎥ + P ⎢ > K ⎥ = + = 0,05 por simetría N(0,1)
⎣ 2,59 ⎦ ⎣ 2,59 ⎦ 2 2
54
x−y ⎧ x − y > 5, 17
La región crítica es > 1,995 = z0, 0236 ⎨
2,59 ⎩ x − y < − 5, 17
En consecuencia, la región de aceptación: − 5, 17 ≤ x − y ≤ 5, 17
• Se podría haber resuelto considerando la región de rechazo de la hipótesis nula H0 :
⎪⎧ σ 12 σ 22 ⎪⎫ ⎪⎧ 4 2 4,5 2 ⎪⎫
R = ⎨ x − y > zα 2 + ⎬ → R = ⎨ 12,25 − 13,64 > (1,995) + ⎬
⎪⎩ n1 n2 ⎪⎭ ⎪⎩ 6 5 ⎭⎪
Abscisas Áreas
1,98 − 1,99 0,0239 − 0,0233 0,01.0,0003
x = 1,99 + = 1,995
x − 1,99 0,0236 − 0,0233 0,0006
27. Una entidad bancaria por experiencias anteriores ha estimado que la probabilidad de que
una persona falle en los pagos de un préstamo personal es de 0,25. También ha estimado que el
45% de los préstamos no pagados a tiempo se han hecho para financiar viajes de vacaciones y el
55% de los préstamos pagados a tiempo se han hecho para financiar viajes de vacaciones.
Se pide:
a) Probabilidad de que un préstamo que se haga para financiar un viaje de vacaciones no se
pague a tiempo.
b) Probabilidad de que si el préstamo se hace para propósitos distintos a viajes de vacaciones
sea pagado a tiempo.
Solución:
Sean los sucesos:
A = 'una persona falla en los pagos de su préstamo personal'
B = 'una persona recibe un préstamo para financiar viajes de vacaciones'
55
P(B / A) = 1 − P(B / A) = 1 − 0,55 = 0, 45
28. El número de defectos en las tarjetas de circuito impreso sigue una distribución Poisson. Se
reúne una muestra aleatoria de 60 tarjetas de circuito impreso y se observa el número de
defectos. Los resultados obtenidos son los siguientes:
Número de defectos 0 1 2 3 o más
Frecuencia observada 32 15 9 4
¿Muestran los datos suficiente evidencia para decir que provienen de una distribución de
Poisson con una fiabilidad del 95%?
Solución:
H0 : Los datos provienen de una distribución de Poisson P(λ = x)
H1 : Los datos no provienen de una distribución de Poisson P(λ = x)
La distribución de Poisson se caracteriza porque sólo depende de un parámetro λ que coincide
con la media. En este sentido, para ajustar la distribución observada a la de Poisson es necesario
calcular la media. Denotando por X = ' número de defectos en tarjetas impresas' y
ni = ' frecuencia observada', se tiene:
xi 0 1 2 3 o más
ni 32 15 9 4
x i . ni 0 15 18 12
x=
∑x .n i i
=
45
= 0,75 → λ = 0,75 → P(x = k) =
0,75k −0,75
e k = 0, 1, 2, 3
n 60 k!
56
0,750 − 0,75 0,75 − 0,75
P(x = 0) = e = 0, 472 P(x = 1) = e = 0,354
0! 1!
0,752 − 0,75
P(x = 2) = e = 0,133 P(x ≥ 3) = 1 − P(x < 3) = 1 − [ 0,472 + 0,354 + 0,133] = 0,041
2!
xi ni pi ei = n . p i
0 32 0,472 28,32
Es necesario que las frecuencias esperadas de
1 15 0,354 21,24
las distintas modalidades ei ≥ 5 ∀ i , teniendo
2 9 0,133 7,98 que agrupar las dos últimas modalidades.
60
n2i
xi ni ei = n . p i n 2
i
ei
60 62,9392
xi 0 1 2 o más
32 15 13
ni
(e1 = 28,32) (e2 = 21,24) (e3 = 10,44)
Los grados de libertad son (k − p − 1) = 3 − 1 − 1 = 1
3
n2i 1024 225 169
Estadístico observado: χ 23 −1−1 = ∑ −n= + + − 60 = 2,9392
i = 1 ei 28,32 21,24 10, 44
57
Como χ12 = 2,9392 < χ 20,05; 1 = 3,841 se acepta la hipótesis nula, concluyendo que los datos
proceden de una población de Poisson de parámetro λ = 0,75 , a un nivel de significación de
0,05
29. Sea una variable aleatoria X procedente de una población con densidad de probabilidad
N(μ , 4). Se quiere contrastar la hipótesis nula H0 : μ = μ 0 = 10 frente a la hipótesis alternativa
H1 : μ = μ 1 = 12 , con un nivel de significación α = 0,05 , con un muestreo simple de tamaño 25.
Determinar:
a) La probabilidad de cometer el error tipo II
b) La potencia del contraste
Solución:
a) La media muestral x , bajo la hipótesis nula, sigue una distribución:
⎛ σ ⎞ ⎛ 4 ⎞
x ∼ N⎜ μ 0 , ⎟ = N⎜ 10 , ⎟ ≡ N(10 ; 0,8)
⎜ n ⎟⎠ ⎜ 25 ⎟⎠
⎝ ⎝
La media muestral x , bajo la hipótesis alternativa, sigue una distribución
⎛ σ ⎞ ⎛ 4 ⎞
x ∼ N⎜ μ1 , ⎟ = N⎜ 12, ⎟ ≡ N(12; 0,8)
⎜ n ⎟ ⎜ 25 ⎟
⎝ ⎠ ⎝ ⎠
Las hipótesis sobre la media poblacional (contraste unilateral):
Para hallar el valor crítico 'k' se recurre al nivel de significación α = 0,05
58
⎛ x − 10 k − 10 ⎞ ⎛ k − 10 ⎞
α = P(ET I) = P ( x > k μ 0 = 10 ) = P ⎜ > ⎟ = P⎜ z > = 0,05
⎝ 0,8 0,8 ⎠ ⎝ 0,8 ⎟⎠
k − 10
= 1,645 → K = 11,316
0,8
⎛ x − 12 11,316 − 12 ⎞ ⎛ 11,316 − 12 ⎞
β = P(ET II) = P ( x ≤ 11,316 μ 1 = 12 ) = P ⎜ ≤ ⎟ = P⎜ z ≤ ⎟=
⎝ 0,8 0,8 ⎠ ⎝ 0,8 ⎠
= P(z ≤ − 0,855) = P(z ≥ 0,855) = 0,1963
b) Potencia del Contraste:
59
30. En cierta población, en una muestra de tamaño 100, la media muestral x de una
característica sigue una distribución normal. Se conoce que P ( x ≤ 75 ) = 0,58 y
P ( x > 80 ) = 0,04 . Hallar la media y la desviación típica poblacional.
Solución:
⎛ σ ⎞ ⎛ σ ⎞ ⎛ σ⎞
La media muestral x ∼ N⎜ μ , ⎟ ≡ N⎜ μ , ⎟ ≡ N⎜ μ , ⎟
⎜ n ⎟⎠ ⎜ 100 ⎟⎠ ⎝ 10 ⎠
⎝ ⎝
⎛ ⎞ ⎛ ⎞
TCL ⎜ x − μ 75 − μ ⎟ ⎜ x − μ 75 − μ ⎟ 75 − μ
P ( x ≤ 75 ) = P⎜ ≤ ⎟ = 0,58 → P ⎜ ≥ ⎟ = 0, 42 → = 0,20
σ σ σ σ σ
⎜ ⎟ ⎜ ⎟
⎝ 10 10 ⎠ ⎝ 10 10 ⎠ 10
⎛ ⎞
TCL⎜ x − μ 80 − μ ⎟ 80 − μ
P ( x > 80 ) = P⎜ > ⎟ = 0,04 = 1,75
⎜ σ σ ⎟ σ
⎝ 10 10 ⎠ 10
⎧ 750 − 10 μ = 0,20 . σ
De las ecuaciones ⎨ → 50 = 1,55 . σ → σ = 32,26 μ = 74,35
⎩ 800 − 10 μ = 1,75 . σ
31. Una encuesta del periódico constó de 320 trabajadores de una multinacional que fueron
despedidos entre 2017‐2018,, encontrando que el 20% habían estado sin trabajo por lo menos
durante dos años. Si el periódico tuviera que seleccionar otra muestra aleatoria de 320
empleados despedidos entre 2017‐2018.
¿Cuál sería la probabilidad de que el porcentaje muestral de trabajadores sin empleo durante
por lo menos dos años, difiera del porcentaje obtenido en la primera encuesta, en un 5% o
más?.
Solución:
En la situación descrita hay una sola población, de la que se extraen dos muestras, queriendo
conocer la diferencia de porcentajes de esas dos muestras, por lo que se debe utilizar la
distribución muestral de diferencias de proporciones con p1 = p2 al tratarse de una misma
población.
60
Otra cuestión a plantearse es que se desconoce la proporción poblacional p1 = p2 , sólo se
conoce que la proporción muestral en 320 trabajadores es p̂1 = 0,20 .
Analizando la pregunta: ¿Cuál sería la probabilidad de que el porcentaje muestral de
trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la
primera encuesta, en un 5% o más?.
Con diferir debe entenderse que la diferencia puede ser a favor de la muestra uno, o a favor de
la muestra dos, por lo que se deben calcular dos áreas en la distribución y sumarlas.
n = m = 320 p1 − p2 = 0
⎡ p1 .q1 p .q ⎤
(pˆ 1 − pˆ 2 ) ∼ N ⎢ (p1 − p2 ) , + 2 2⎥
⎣ n m ⎦
⎡ 0,5 ⎤ ⎡ ˆ 0,5 ⎤
= P ⎢ ( pˆ 1 − pˆ 2 ) ≥ 0,05 − + P ( p − ˆ
p ) ≤ − 0,05 + =
320 ⎥⎦ ⎢⎣ 320 ⎥⎦
1 2
⎣
= P ⎡⎣ ( pˆ 1 − pˆ 2 ) ≤ − 0,0484 ⎤⎦ + P ⎡⎣ ( pˆ 1 − pˆ 2 ) ≥ 0,0484 ⎤⎦ =
⎡ ( pˆ − pˆ 2 ) − 0 − 0,0484 − 0 ⎤ ⎡ ( pˆ 1 − pˆ 2 ) − 0 0,0484 − 0 ⎤
= P⎢ 1 ≤ ⎥ + P⎢ ≥ ⎥=
⎣ 0,0316 0,0316 ⎦ ⎣ 0,0316 0,0316 ⎦
⎡ 0,0484 − 0 ( pˆ 1 − pˆ 2 ) − 0 − 0,0484 − 0 ⎤
= P⎢ ≤ ≤ ⎥ = P [1,53 ≤ z] + P [ z ≤ −1,53] =
⎣ 0,0316 0,0316 0,0316 ⎦
61
32. En los días previos a unas elecciones municipales, el candidato de un partido político está
convencido de obtener el 60% de los votos electorales. No obstante, su partido encarga una
encuesta entre 100 votantes potenciales, resultando que el 52% de ellos dijeron tener intención
de votar a dicho candidato. Con un nivel de significación del 5%, se pide contrastar:
a) H0 : p = 0,60 frente a H1 : p = 0,50
b) H0 : p = 0,60 frente a H1 : p ≠ 0,60
c) Potencia del contraste efectuado en el apartado (a).
Solución:
a) Sea la variable X = 'porcentaje de votos al candidato'
Se trata de un contraste de hipótesis nula simple frente a una hipótesis alternativa simple:
H0 : p = 0,60 frente a H1 : p = 0,50
⎧ 1 vota Si
100
∑ x siendo x = ⎨⎩ 0
1
La distribución en el muestreo de p̂ = i i
100 i=1
vota No
p(1 − p)
ˆ = p y V(p)
donde se conoce E(p) ˆ = .
n
⎡ 0,60.(1 − 0,60) ⎤
Bajo la hipótesis nula: p̂ ∼ N ⎢ 0,60 , ⎥ ≡ N(0,60 , 0,049)
⎣ 100 ⎦
El valor crítico K se determina, bajo la hipótesis nula, por el nivel de significación:
62
α = P(ET I) = P(Rechazar H 0 / H 0 cierta) = 0,05
⎡ 0,60 − k ⎤ 0,60 − k
= P ⎢z ≥ = 0,05 = 1,645 k = 0,5186
⎣ 0,049 ⎥⎦ 0,049
b) En este caso, se trata de un contraste bilateral con hipótesis nula simple frente a
⎧⎪ p̂ ≥ k Se acepta H0 (R.A.)
Regla de decisión: ⎨
⎪⎩ p̂ < k Se rechaza H0 (R.C.)
Para determinar el crítico K, bajo la hipótesis nula, con el nivel de significación:
63
Como p̂ = x = 52 100 = 0,52 , se encuentra en la
región de aceptación, se concluye que se acepta la
hipótesis nula.
Análogamente, se podría haber resuelto considerando el intervalo de confianza para el
parámetro p de una distribución binomial B(n, p)
⎡ pˆ . qˆ ⎤
I1−α (p) = ⎢pˆ ± zα /2 ⎥
⎣ n ⎦
pˆ . qˆ pˆ . qˆ pˆ . qˆ pˆ . qˆ pˆ − p
pˆ − zα /2 ≤ p ≤ pˆ + zα /2 → − zα /2 ≤ p − pˆ ≤ zα /2 → ≤ zα /2
n n n n pˆ . qˆ
n
⎪⎧ p̂ − p ⎪⎫
Región de rechazo Rrechazo = ⎨ > zα /2 ⎬
⎪⎩ pˆ . qˆ / n ⎪⎭
Como no se verifica la región de rechazo, se acepta la hipótesis nula.
⎡ 0,5.0,5 ⎤
Con la hipótesis alternativa H1 : p = 0,50 : p̂ ∼ N ⎢ 0,5 , ⎥ = N(0,5 , 0,05)
⎣ 100 ⎦
Abscisas Áreas
64
Potencia = 1 − β = 1 − 0,35496 = 0,6450
También se podía haber realizado por la definición de potencia de un contraste:
33. El análisis laboral que la U.E ha realizado para toda Europa, señala que en España, el salario
mensual de los varones, en algunos sectores económicos, supera en más de 100 euros el salario
de las mujeres que desempeñan las mismas tareas.
El Ministerio de Trabajo español decide considerar el salario mensual como una variable
aleatoria normalmente distribuida con desviación típica de 39,6 euros para los trabajadores
masculinos y de 36 euros para las trabajadoras de dichos sectores, siendo el salario de cada
población independiente del de la otra. Para tratar de verificar lo publicado, se elige una
muestra aleatoria simple de 500 trabajadores y de 700 trabajadoras, obteniéndose unos salarios
medios mensuales de 1.500 y 1.370 euros respectivamente.
¿Está fundamentada las conclusiones de la U.E al 1% de significación?
Solución:
Sean las variables aleatorias, respectivamente, X = 'Salario mensual de los varones' e
Y = 'Salario mensual de las mujeres', donde X ∼ N(μ x , 39,6) e Y ∼ N(μ y , 36)
⎧ x = 1.500 € nx = 500
⎪
En las muestras se obtuvieron los resultados: ⎨
⎪ y = 1.370 € n = 700
⎩ y
En el contraste se establecen las hipótesis:
⎧ Si (x − y) ≤ k se acepta H0 (RA)
La regla de decisión será: ⎨
⎩ Si (x − y) > k se rechaza H0 (RC)
La diferencia de medias muestrales (x − y) , siendo las varianzas muestrales conocidas, bajo la
hipótesis nula, sigue una distribución:
65
⎡ σ 2x σ 2y ⎤ ⎡ 39,6 2 36 2 ⎤
N ⎢(μ x − μ y ), + ⎥ ≡ N ⎢100 , + ⎥ = N(100 , 2,23)
⎢ nx ny ⎥ ⎢⎣ 500 700 ⎥⎦
⎣ ⎦
Se determina el valor de k mediante el nivel de significación α :
⎡ (x − y) − 100 k − 100 ⎤
α = P(Rechazar H0 H0 Cierta) = P ⎡⎣(x − y) > k N(100 , 2,23)⎤⎦ = P ⎢ > ⎥=
⎣ 2,23 2,23 ⎦
⎡ k − 100 ⎤ k − 100
= P ⎢ z > ⎥ = 0,01 → = 2,32 = z0,01 → k = 105,2 €
⎣ 2,23 ⎦ 2,23
Afirmando que con el mismo trabajo, las diferencias salarias entre hombres y mujeres en
algunos sectores económicos españoles, son superiores a 100 euros mensuales
66
34. En el punto de partida de un laberinto hay tres orificios iguales A, B y C. Si una rata elige A
vuelve al punto de partida después de recorrer dos metros. Si elige B recorre cinco metros y
vuelve al mismo punto. Si elige C sale al exterior recorriendo un metro. ¿Por término medio que
distancia recorre una rata antes de salir, si siempre elige un orificio distinto de los seleccionados
en veces anteriores?
Solución:
Las distancias recorridas son:
d[ ABC ] = 8 m d[BAC ] = 8 m d[ AC ] = 3 m
d[BC ] = 6 m d[ C ] = 1 m
Las probabilidades de las distancias recorridas:
1 1 1
P [ ABC ] = P [ A ] . P [B / A ] . P [ C ] = . .1 =
3 2 6
1 1 1
P [ BAC ] = P [B ] . P [ A / B ] . P [ C ] = . .1 =
3 2 6
1 1 1
P [ AC ] = P [ A ] . P [ C / A ] = . =
3 2 6
1 1 1
P [BC ] = P [B ] . P [ C / B ] = . =
3 2 6
1
P[ C] =
3
La distribución de probabilidad:
ABC BAC AC BC C
di 8 8 3 6 1
1 1 1 1 1
pi
6 6 6 6 3
La distancia media recorrida es:
4
∑ d . p = 8 . 6 + 8 . 6 + 3 . 6 + 6 . 6 + 1 . 3 = 6 = 4,5 m
1 1 1 1 1 27
μ = E [ d] = i i
i=1
67
35. En una población con distribución N (μ , σ) , con un nivel de significación del 1%, para
contrastar la hipótesis nula H0 : σ 20 = 25 frente a la hipótesis alternativa H1 : σ12 = 36 , se toma
una muestra aleatoria de tamaño 16, con varianza igual a 27. Hallar la potencia del contraste.
Solución:
⎧ H0 : σ 20 = 25
Hipótesis sobre σ : ⎨ 2
σ 12 > σ 20
⎩ H1 : σ 1 = 36
2
⎪⎧ Si σ x ≤ k
2
R.A: Aceptar H0
Regla de decisión: ⎨
⎪⎩ Si σ x > k
2
R.C: Rechazar H0
n σ 2 (n − 1) s2x σ 0 . χ n− 1
2 2
H0
σ .χ
2 2
n−1 25 . χ 215
σ ≈ =
2 0
x
n 16
La determinación del valor crítico k a partir del nivel de significación α (Error Tipo I):
⎡ 25 . χ2 ⎤
⎢ 15 ⎥ ⎛ 16 ⎞ χ2 Pearson 16
= P⎢ > k ⎥ = P ⎜ χ2 > k ⎟ = 0,01 ⎯⎯⎯⎯→ k = 30,578 → k = 47,778
⎢
16
⎥ ⎝ 15 25 ⎠ 25
⎣ ⎦
De otra parte, la potencia del contraste será:
68
H1
σ 20 . χ 2n−1 36 . χ 215
σx ≈ =
n 16
⎡ 36 . χ 2 ⎤
⎢ 15 ⎥
Potencia = P ⎢ > 47,778 / H 1 Cierta⎥ = P ⎡⎣ χ 15
2
≥ 21,235 ⎤⎦ = 0,162
16
⎢ ⎥
⎣ ⎦
Abscisas Áreas
Solución:
a) Sea la variable aleatoria X = 'peso en kg. de las patatas". X ∼ N(μ , 1)
Hipótesis sobre μ: H0 : μ 0 = 0, 4 H1 : μ1 = 0,3
Regla de decisión:
⎧ Si x ≥ k → R.A: Aceptar H0
⎨
⎩ Si x < k → R.C: Rechazar H0
⎛ 1 ⎞
La distribución de la media muestral, bajo la hipótesis nula, sigue una ley N⎜ 0, 4 , ⎟
⎜ n ⎟
⎝ ⎠
• A partir del nivel de significación, se tiene:
⎡ x − 0, 4 k − 0, 4 ⎤
α = P(Rechazar H0 H0 Cierta) = P(x ≤ k H 0 Cierta) = P(x ≤ k μ = 0, 4) = P ⎢ ≤ ⎥ = 0,05
⎢⎣ 1 n 1 n ⎥⎦
69
k − 0, 4
= −1,64
1 n
• Por otro lado, como la potencia del contraste es 0,6406:
⎛ 1 ⎞
La media muestral, bajo la hipótesis alternativa, sigue una ley N⎜ 0,3, ⎟ , con lo cual,
⎜ n ⎟⎠
⎝
⎧ 1,64
⎪k − 0, 4 = − n
⎪ 2
Resolviendo el sistema: ⎨ → n= → n = 400
⎪ k − 0,3 = 0,36 0,1
⎪⎩ n
k − 0, 4
Se determina el valor crítico k: = −1,64 → k = 0,318
1 / 400
70
37. Sea (x 1 , x 2 , , x n ) una muestra aleatoria de tamaño n, distribuida según f(x , θ) con θ
desconocido, donde X representa el tiempo máximo necesario para determinar un proceso en
⎧(θ + 1)x θ 0 ≤ x ≤ 1 , θ > −1
segundos: f(X , θ) = ⎨
⎩ 0 otro caso
a) Determinar el estimador máximo verosímil de θ
b) Determinar la estimación máximo verosímil de θ en una muestra aleatoria simple
constituida por los datos: 0,7 0,9 0,6 0,8 0,9 0,7 0,9.
Estimar la probabilidad del tiempo máximo necesario para terminar un proceso, que no
exceda de 0,25 segundos ni supere los 0,75 segundos.
2θ + 1
c) Determinar el estimador máximo verosímil de: θ + 1 y
θ−1
Solución:
n
Calculando el logaritmo natural de L(x 1 , x 2 , , x n ; θ) :
⎛ n
⎞ ⎛ n
⎞
Ln [L(x 1 , x 2 , , x n ; θ)] = Ln ⎜ (θ + 1)n
⎜
⎝
∏i=0 ⎠
θ
x ⎟ = Ln(θ + 1)n + Ln ⎜
⎟ i
⎜
⎝
∏i=0
x iθ ⎟
⎟
⎠
n
ϑ Ln [L(x 1 , x 2 , , x n ; θ)] n n
∑ ∑
n n
= + Lnx i = 0 → = − Lnx i
ϑθ θ = θˆ
ˆθ + 1
i=0
ˆθ + 1
i=0
n
θˆ = EMV(θ) = − n
−1
∑ Lnx
i=0
i
b) El estimador máximo verosímil de θ con los datos de la muestra:
8
θˆ = − − 1 = 4,027 − 1 = 3,027
Ln0,7 + Ln0,9 + Ln0,6 + Ln0,8 + Ln0,9 + Ln0,7 + Ln0,9 + Ln0,8
71
El estimador máximo verosímil EMV(θ) = θˆ = 3,027
De otra parte,
ˆ 0,75
0,75 0,75 x θ+ 1
∫ ∫
0,75
θˆ ˆ
P(0,25 ≤ X ≤ 0,75) = f(X, θˆ )dx = (θˆ + 1)x dx = (θˆ + 1) = x θ+ 1 0,25
0,25 0,25 (θˆ + 1) 0,25
La probabilidad del tiempo máximo necesario para terminar el proceso (entre 0,25 y 0,75
segundos) es 0,31
2θ + 1
c) El estimador máximo verosímil de θ + 1 y
θ−1
⎛ 2 θ + 1 ⎞ 2 EMV ( θ ) + 1 2 θˆ + 1 2 x 3,027 + 1
EMV ⎜ ⎟= = = = 2,493
⎝ θ − 1 ⎠ EMV ( θ ) − 1 θˆ − 1 3,027 − 1
38. El jefe de recursos humanos de una empresa realiza un test de diez ítems a los aspirantes a
un puesto, teniendo en cada ítems cuatro posibles respuestas, de las que sólo una es correcta.
Suponiendo que los aspirantes teniendo la misma probabilidad de responder. Se pide hallar las
probabilidades para el aspirante:
a) Conteste todos los ítems mal
b) Conteste al menos cuatro ítems bien
c) Conteste entre cuatro y seis ítems bien
d) Conteste todos los ítems bien
e) Conteste menos de tres ítems bien
Solución:
Sea X = "contestar ítems bien en el test", la variable sigue una distribución binomial
1 ⎛ 10 ⎞
n = 10 , p = = 0,25 , B(10 , 0,25) , P(X = k) = ⎜ ⎟ .0,25 k .0,7510 −k k = 0,1, ,10
4 ⎝k⎠
⎛ 10 ⎞
a) P(X = 0) = ⎜ ⎟ .0,250 .0,7510 = 0,25 0 .0,7510 = 0,0563
⎝0⎠
72
b) P(X ≥ 4) = 1 − P(X < 4) = 1 − ( P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3)) =
⎡ ⎛ 10 ⎞ ⎛ 10 ⎞ ⎛ 10 ⎞ ⎛ 10 ⎞ ⎤
= 1 − ⎢ ⎜ ⎟ .0,250 .0,7510 + ⎜ ⎟ .0,251 .0,759 + ⎜ ⎟ .0,252 .0,758 + ⎜ ⎟ .0,253 .0,757 ⎥ =
⎣⎝ 0 ⎠ ⎝1⎠ ⎝2⎠ ⎝3⎠ ⎦
= 1 − [ 0,0563 + 0,1877 + 0,2816 + 0,2503] = 0,2241
⎛ 10 ⎞
d) P(X = 10) = ⎜ ⎟ .0,2510 .0,750 = 0
⎝ 10 ⎠
39. El tiempo de revisión del motor de un avión sigue aproximadamente una distribución
exponencial, con media 22 minutos.
a) Hallar la probabilidad de que el tiempo de la revisión sea menor de 10 minutos.
b) El costo de la revisión es de 200 euros por cada media hora o fracción. ¿Cuál es la
probabilidad de que una revisión cueste 400 euros?
c) Para efectuar una programación sobre las revisiones del motor, ¿cuánto tiempo se debe
asignar a cada revisión para que la probabilidad de que cualquier tiempo de revisión mayor que
el tiempo asignado sea solo de 0,1?
Solución:
a) Sea X = "tiempo de revisión del motor de un avión en minutos"
1 1
μ x = E(X) = = 22 minutos → λ = X ∼ Exp ⎡⎣1 22⎤⎦
λ 22
Función de densidad: Función distribución:
⎧ 1 − x 22
⎪ e x≥0 ⎧1 − e− x 22 x≥0
f(x) = ⎨ 22 F(x) = P(X ≤ x) = ⎨
⎪⎩ 0 ⎩ 0 x<0
x<0
73
o bien,
∫ ∫
10 10
⎡ 1 − x 22 ⎤
P [ X < 10 ] = f(x)dx = ⎢⎣ 22 e ⎥⎦ dx = − ⎡⎣ e
− x 22 10
⎤⎦ = − e− 10 22 + 1 = 1 − e− 5 11 = 0,365
0
0 0
b) Como el costo de la revisión del motor es de 200 euros por cada media hora o fracción, para
que la revisión cueste 400 euros la duración de la revisión debe de ser inferior o igual a 60
minutos. Es decir, se tendrá que calcular P [ 30 < X ≤ 60 ]
∫ ∫
60 60
⎡ 1 − x 22 ⎤
P [ 30 < X ≤ 60 ] = f(x)dx = ⎢⎣ 22 e ⎥⎦ dx = − ⎡⎣ e
− x 22 60
⎤⎦ = − e− 60 22 + e− 30 22 =
30
30 30
= e− 15 11 − e− 30 11 = 0,19
∞ ∞
∫ ∫
⎡ 1 − x 22 ⎤ − x 22 ∞
P [ X > t] = f(x)dx = ⎢⎣ 22 e ⎥⎦ dx = − ⎡⎣ e ⎤⎦ = 0 + e− t 22 = 0,1
t
t t
40. El consumo familiar de cierto artículo se distribuye uniformemente con esperanza 10 y
varianza unidad. Determinar la probabilidad de que el consumo de dicho artículo se encuentre
comprendido entre 8 y 12 unidades.
Solución:
a+ b (b − a)2
Se tiene: μ = E(X) = = 10 σ 2 = =1
2 12
⎧ a + b = 20 ⎪⎧b = 10 + 3 = 11,73
⎨ [b − (20 − b)]2 = 12 (2b − 20) = 12 ⇒ ⎨
⎩(b − a) = 12
2
⎪⎩ a = 10 − 3 = 8,27
La distribución es uniforme entre 8,27 y 11,73, en consecuencia la probabilidad de que el
consumo del artículo se encuentre comprendido entre 8 y 12 es la unidad.
74
41. Una fábrica aeronáutica produce en cada turno 100000 bolas para rodamientos, siendo la
probabilidad de bola defectuosa 0,04. Las bolas se supervisan todas, depositando las
defectuosas en un recipiente que se vacía al final de cada turno. ¿Cuántas bolas ha de contener
el recipiente para que la probabilidad de que su capacidad no sea rebasada sea 0,95?
Solución:
C − 4000
= 1,645 ⇒ C = 4000 + 1,645.61,96 = 4101,92 4102 bolas
61,96
Solución:
Función de distribución:
Función de densidad:
⎧ 0 x<2
⎧ 1 1 ⎪x−2
⎪ = 2≤x≤4 ⎪
f(x) = ⎨ 4 − 2 2 F(x) = P(X ≤ x) = ⎨ 2≤ x≤ 4
⎪⎩ 0 otros valores ⎪4 −2
⎪⎩ 1 x>4
2,5 − 2
a) P(X < 2,5) = F(2,5) = = 0,25
2
∫ ∫
2,5 − 2
2,5 2,5
1 1
dx = [ x ]2 =
2,5
o también, P(X < 2,5) = f(x)dx = = 0,25
2 2 2 2 2
3,2 − 2 4 − 3,2
b) P(X > 3,2) = 1 − P(X ≤ 3,2) = 1 − F(3,2) = 1 − = = 0, 4
2 2
75
∫ ∫
4 − 3,2
4 4
1 1
dx = [ x ]3,2 =
4
o también, P(X > 3,2) = f(x)dx = = 0, 4
3,2 3,2 2 2 2
∫ ∫
3,5 − 2,2
3,5 3,5
1 1
dx = [ x ]2,2 =
3,5
o también, P(2,2 < X < 3,5) = f(x)dx = = 0,65
2,2 2,2 2 2 2
2+ 4 (4 − 2)2 4 1
d) E(X) = =3 σ2 = = =
2 12 12 3
43. Una empresa produce un artículo que sigue una distribución uniforme entre 25000 y 30000
unidades. Sabiendo que vende cada unidad a 10 euros y la función de costes viene dada por
C = 100000 + 2X , ¿cuál será el beneficio esperado?
Solución:
X ∼ U(25000, 30000)
⎧ 1 1
⎪ = 25000 ≤ x ≤ 30000
Función de densidad f(x) = ⎨ 30000 − 25000 5000
⎪⎩ 0 otros valores
25000 + 30000
siendo, μ = E(X) = = 27500
2
76
44. La duración de vida de una pieza de un motor sigue una distribución exponencial, sabiendo
que la probabilidad de que sobrepase las 100 horas de uso es 0,9. Se pide:
a) Probabilidad de que sobrepase las 200 horas de uso.
b) ¿Cuántas horas se mantiene funcionando con probabilidad 0,95?
Solución:
a) Sea v.a. X = "tiempo de vida de la pieza del motor" , donde X ∼ Exp(λ )
Respectivamente, la función de densidad y la función de distribución:
Por tanto, X ∼ Exp(0,00105) f(x) = 0,00105.e− 0,00105. x F(x) = 1 − e− 0,00105. x ∀ x > 0
∞ ∞
∫ ∫
∞
o bien, P [ X > 200 ] = f(x)dx = 0,00105.e− 0,00105. x dx = − ⎡⎣ e− 0,00105. x ⎤⎦ 200 = 0,81
200 200
77
45. La cabina de un avión tiene 30 dispositivos electrónicos (E1 , E2 , ,E30 ) , tan pronto como
falla E1 se activa E2 , y así sucesivamente. El tiempo de fallo de cualquier dispositivo electrónico
E1 es de tipo exponencial con parámetro λ = 0,1 hora.
Hallar la probabilidad de que el tiempo total de funcionamiento de todos los dispositivos
supere las 350 horas.
Solución:
1 1 1
μ i = E[ Xi ] = = = 10 σ i = = 10
λ 0,1 λ
30
Por el Teorema Central del Límite, X = ∑ X sigue una distribución normal de media
i=1
i
30
μ = 30 . μ i = 300 y desviación típica σ = ∑σ
i=1
2
i = 30.102 = 3000 ,
30
X= ∑ X ∼ N ⎡⎣300,
i=1
i 3000 ⎤⎦
46. Un corredor de bolsa adquiere 50 acciones diferentes, concertando con sus clientes una
ganancia de 1200 euros por acción. Por experiencias anteriores, se sabe que los beneficios de
cada acción son independientes y se distribuyen uniformemente en el intervalo ⎡⎣1000, 2000 ⎤⎦ .
¿Qué probabilidad tiene el corredor de no perder dinero?.
Solución:
Denotando por X = "Ganancia por acción" y G ="Ganancia total del corredor de bolsa"
1 1 x − 1000
X ∼ U(1000, 2000) f(x) = = F(x) = 1000 ≤ x ≤ 2000
2000 − 1000 1000 2000 − 1000
78
P [ G ≥ 0 ] = P ⎡⎣50.X − 60000 ≥ 0 ⎤⎦ = P ⎡⎣50.X ≥ 60000 ⎤⎦ = P [ X ≥ 1200 ] =
∫ ∫
2000 2000
1 1 800
[ x ]1200 =
2000
= f(x)dx = dx = = 0,8
1200 1200 1000 1000 1000
47. Un individuo juega con probabilidad de ganar igual a 1 2 en cada partida. Si gana en una
partida obtiene 5 euros y si pierde paga 5 euros. En una tarde juega 400 partidas. ¿Qué cantidad
debe llevar si quiere tener una probabilidad de 0,95 de hacer frente a posibles pérdidas?
Solución:
Sea la v.a. X = "número de partidas ganadas de 400" , donde X ∼ B(400, 1 2)
⎡ 2000 − C − 2000 ⎤ ⎡ −C ⎤ ⎡ C ⎤
= P ⎢z ≥ ⎥ = P ⎢z ≥ ⎥ = P ⎢z ≤ = 0,95
⎣ 100 ⎦ ⎣ 100 ⎦ ⎣ 100 ⎥⎦
⎡ C ⎤ C
P ⎢z ≥ = 0,05 = 1,65 ⇒ C = 165 euros
⎣ 100 ⎥⎦ 100
79
48. Para aprobar la asignatura de estadística teórica se realiza un test con veinte ítems.
Sabiendo que una persona determinada tiene una probabilidad de 0,8 de contestar bien cada
ítem. Se pide:
a) Probabilidad de que la primera pregunta que contesta bien sea la tercera que hace.
b) Para aprobar el test es necesario contestar diez ítems bien. ¿Cuál es la probabilidad de que
apruebe al contestar el doceavo ítem?.
Solución:
a) La variable X = "número de ítems que tiene que hacer hasta que responda uno bien" sigue
una distribución de Pascal o geométrica, siendo p = 0,8 , q = 0,2 . X ∼ G(0,8)
b) La variable X = "número de ítems que tiene que realizar hasta contestar 10 bien" sigue una
distribución binomial negativa
⎛ 12 − 1 ⎞ ⎛ 11 ⎞ 11! 11 . 10
P(X = 12) = ⎜ ⎟ 0,8 . 0,2 = ⎜ ⎟ 0,8 . 0,2 =
10 2 10 2
0,810 . 0,22 = 0,810 . 0,22 = 0,24
⎝ 10 − 1 ⎠ ⎝ ⎠9 2! 9! 2
49. En una caja hay 5 triángulos, 3 círculos y 2 rectángulos. Realizando extracciones con
reemplazamiento, se piden las siguientes probabilidades:
a) Al realizar 8 extracciones, se obtengan en 4 ocasiones un círculo.
b) Se necesiten 8 extracciones para obtener 4 círculos.
c) Que aparezca el primer círculo en la 8 extracción.
d) Al realizar 8 extracciones aparezcan 3 triángulos, 3 círculos y 2 rectángulos.
e) Al realizar 6 extracciones sin remplazamiento aparezcan en 2 ocasiones un círculo.
Solución:
a) Hay dos situaciones (círculo, no‐círculo), se trata de una distribución binomial,
⎛8⎞ 8! 8.7. 6 .5
P(X = 4) = ⎜ ⎟ 0,3 4 0,7 4 = 0,214 = 0,214 = 70.0,214 = 0,136
⎝ 4⎠ 4! 4! 4. 3. 2 .1
b) X = "número de extracciones hasta que aparece la cuarta extracción de círculo"
80
⎛ 8 − 1⎞ ⎛ 7⎞ 7! 7.6.5
P(X = 8) = ⎜ ⎟ 0,3 . 0,7 = ⎜ ⎟ 0,21 =
4 4 4
0,214 = 0,214 = 0,0681
⎝ 4 − 1⎠ ⎝ 3⎠ 4! 3! 3.2
c) X = "aparece el primer círculo en la octava extracción"
Es una distribución geométrica o de Pascal X ∼ G(0,3)
d) X = "número de veces que se extrae triángulo, círculo o rectángulo en ocho extracciones".
Se trata de una distribución polinomial, es decir, en cada prueba se consideran k sucesos
independientes.
3 3 2
8! ⎛ 5 ⎞ ⎛ 3 ⎞ ⎛ 2 ⎞
P(T = 3 ; C = 3 ; R = 2) = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ = 560 . 0,5 . 0,3 . 0,2 = 0,0756
3 3 2
3! 3! 2! ⎝ 10 ⎠ ⎝ 10 ⎠ ⎝ 10 ⎠
e) Hay dos situaciones excluyentes (círculo, no‐círculo).
X = "número de veces que se extrae círculo en una muestra de tamaño ocho"
⎛ N.p ⎞ ⎛ N.q ⎞ ⎛ 3⎞ ⎛ 7⎞
⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟
⎝ k ⎠ ⎝n−k⎠ 2 4
P(X = 2) = ⎝ ⎠ ⎝ ⎠ =
3 . 35
P(X = k) = = 0,5
⎛ N⎞ ⎛ 10 ⎞ 210
⎜ ⎟ ⎜ ⎟
⎝n⎠ ⎝6⎠
81
50. Por prescripción médica, un enfermo debe hacer una toma de tres píldoras de un
determinado medicamento. De las doce píldoras que contiene el envase hay cuatro en malas
condiciones. Se pide:
a) Probabilidad de que tome sólo una buena.
b) Probabilidad de que de las tres píldoras de la toma al menos una esté en malas condiciones.
c) ¿Cuál es el número de píldoras que se espera tome el enfermo en buenas condiciones en cada
toma?
d) Si existe otro envase que contenga cuarenta píldoras, de las que diez se encuentran en malas
condiciones. ¿qué envase sería más beneficiosos para el enfermo?
Solución:
a) Hay dos situaciones excluyentes (buena, no‐buena).
La variable X = "número de píldoras buenas al tomar tres" sigue una distribución
hipergeométrica X ∼ H(3, 12, 8) , en donde
2 q
N. p = 12. = 8 N. q = 12. = 4 n=3
3 3
⎛ N.p ⎞ ⎛ N.q ⎞ ⎛ 8⎞ ⎛ 4⎞ 4!
⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟ 8.
k ⎠ ⎝n−k⎠ 1 2
P(X = k) = ⎝ P(X = 1) = ⎝ ⎠ ⎝ ⎠ =
2! 2! 24
→ = = 0,22
⎛ N⎞ ⎛ 12 ⎞ 12! 110
⎜ ⎟ ⎜ ⎟ 3! 9!
⎝n⎠ ⎝3⎠
b) La probabilidad de que al menos una esté en malas condiciones equivale a la probabilidad de
que a lo sumo dos píldoras sean buenas. Por tanto:
2 24 56 82
P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) = + + = = 0,75
110 110 110 110
⎛ 8⎞ ⎛ 4⎞
⎜ ⎟⎜ ⎟
0 3
P(X = 0) = ⎝ ⎠ ⎝ ⎠ =
1 . 4 4 . 3! 9! 4 . 3 .2 2
= = = = 0,02
⎛ 12 ⎞ 12! 12! 12 . 11 . 10 110
⎜ ⎟ 3! 9!
⎝3⎠
⎛8⎞ ⎛ 4⎞ 8!
⎜ ⎟⎜ ⎟ . 4 8 . 7 . 4 .3! 9!
2 1
P(X = 2) = ⎝ ⎠ ⎝ ⎠ =
2! 6! 56
= 2 = = 0,51
⎛ 12 ⎞ 12! 12! 110
⎜ ⎟ 3! 9!
⎝3⎠
82
c) El número de píldoras que se espera que tome es la media de la distribución:
2
μ X = n.p = 3 . = 2 píldoras
3
d) Para tomar una decisión, hay que calcular el número de píldoras esperado en buenas
condiciones al tomar tres del segundo envase.
El segundo envase es más beneficioso para el enfermo.
51. El número promedio de recepción de solicitudes en una ventanilla de atención al cliente es
de tres al día.
a) ¿Cuál es la probabilidad de que el tiempo antes de recibir una solicitud exceda cinco días?
b) ¿Cuál es la probabilidad de que el tiempo antes de recibir una solicitud sea menor de diez
días?
c) ¿Cuál es la probabilidad de que el tiempo antes de recibir una solicitud sea menor de diez
días, si ya han pasado cinco días sin recibir solicitudes?
Solución:
X = "días antes de recibir una solicitud", es una distribución exponencial con λ = 3
P(5 < X < 10) F(10) − F(5) 1 − e−30 − (1 − e−15 ) e−15 − e−30
P(X < 10 X > 5) = = = −15
= −15
= 1 − e−15
P(X > 5) 1 − F(5) e e
83
52. Una web tiene un número promedio de 5 visitantes por hora. Se piden las probabilidades:
a) Sea visitada por un mínimo de 6 personas.
b) Qué pase más de una hora sin que sea visitada
Solución:
a) X = "número promedio de visitantes", distribución de Poisson de parámetro λ = 5
5 5
5 k −5
P(X ≥ 6) = 1 − P(X ≤ 5) = 1 − ∑ P(X = k) = 1 − ∑ e
k=0 K = 0 k!
b) X = "horas sin ser visitada la web", distribución exponencial de parámetro λ = 5
53. Sea X la variable aleatoria que describe el número de clientes que llega a un supermercado
durante un día (24 horas). Sabiendo que la probabilidad de que llegue un cliente en un día es
equivalente a 100 veces la que no llegue ningún cliente en un día, se pide:
a) Probabilidad de que lleguen al menos 3 clientes al día.
b) Si acaba de llegar un cliente, calcular la probabilidad que pase más de 25 minutos hasta que
llegue el siguiente cliente (o hasta que llegue el primer cliente).
c) En dos semanas, ¿cuál es la probabilidad aproximada de que lleguen como mucho 1300
clientes al supermercado?
Solución:
λk −λ
a) Se trata de una distribución de Poisson: P(X = k) = e
k!
λ −λ λ0 −λ
P(X = 1) = 100 . P(X = 0) e = 100 . e λ . e− λ = 100 . e− λ λ = 100
1! 0!
⎡ 3 − 100 ⎤
P(X ≥ 3) = P ⎢ z ≥ = P(z ≥ −9,7) = P(z ≤ 9,7) ≈ 1
⎣ 10 ⎥⎦
b) Es una función exponencial, es decir, el tiempo de espera hasta que ocurre un suceso (que
llegue el siguiente cliente), donde λ es el número de sucesos de Poisson por unidad de tiempo.
X ∼ Exp(λ )
Para calcular el parámetro λ se establece una proporción:
100 λ 10 0 . 25 250
= λ= = = 1,736
24 . 60 25 24 . 6 0 144
84
P(X ≤ x) = F(x) = 1 − e− λ . x P(X ≤ 1) = F(1) = 1 − e−1,736 . 1 = 0,8238
⎡ 1300 − 1400 ⎤
P(X ≤ 1300) = P ⎢ z ≤ ⎥ = P(z ≤ −2,67) = P(z ≥ 2,67) = 0,00379
⎣⎢ 1400 ⎦⎥
54. Calcular la media, varianza y coeficiente de variación de la variable aleatoria discreta que
tiene como función de distribución:
⎧ 0 x<2
⎪ 0,2 2 ≤ x < 4
⎪⎪
F(x) = ⎨ 0,55 4 ≤ x < 6
⎪ 0,85 6 ≤ x < 8
⎪
⎪⎩ 1 x≥8
Solución:
La ley de probabilidad o función de cuantía:
X = xi 2 4 6 8
P(X = 2) = F(2) − F(0) = 0,2 P(X = 4) = F(4) − F(2) = 0,55 − 0,2 = 0,35
P(X = 6) = F(6) − F(4) = 0,85 − 0,55 = 0,30 P(X = 8) = F(8) − F(6) = 1 − 0,85 = 0,15
Cálculo de la esperanza matemática y varianza
X = xi 2 4 6 8
P(X = x i ) 0,2 0,35 0,30 0,15
4
x . P(X = x i )
2
i 0, 8 5,6 10,8 9,6 ∑ x . P(X = x ) = 26,8
i=1
2
i i
85
4 4
i =1
2
i i
σ x 1,94
Coeficiente variación: CV = = = 0, 40
μ x 4,8
55. La variable aleatoria discreta X tiene como distribución de probabilidad
X = xi 1 2 3 4
P(X = x i ) 0,30 0,25 0,10 0,35
Se realiza un cambio de origen hacia la izquierda de dos unidades y un cambio de escala de tres
unidades. Calcular y razonar propiedades:
a) Media y varianza de la X.
b) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
origen.
c) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
escala.
d) Media, varianza y coeficiente de variación de la variable transformada por el cambio de
origen y escala.
Solución:
X = xi P(X = x i ) = pi x i . pi x 2i x 2i . pi
1 2,5 7,8
86
4 4
Media: α1 = μ X = E(X) = ∑
i=1
x i .P(X = x i ) = ∑ x . p = 2,5
i=1
i i
4 4
α2 = E(X ) =
2
∑ x .P(X = x ) = ∑ x . p = 7,8
i=1
2
i i
i=1
2
i i
σ X 1,245
Coeficiente de variación: CVX = = = 0, 498
μX 2,5
b) Sea Y la variable transformada, al realizar un cambio de origen hacia la izquierda de dos
unidades hay que restar 2, quedando: Y = X − 0' = X − (−2) = X + 2 .
σY σX 1,245
Coeficiente de variación: CVY = = = = 0,28 ≠ CVx
μY μX + 2 4,5
El cambio de origen afecta a la media y, en consecuencia, al coeficiente de variación.
X
c) Al realizar un cambio de escala de 3 unidades, la variable transformada es Y =
3
⎡X⎤ 1 1 2,5
Media: μ Y = E(Y) = E ⎢ ⎥ = . E(X) μ Y = .μ X =
⎣3⎦ 3 3 3
⎡X⎤ 1 1 1 1,55
Varianza: σ 2Y = Var ⎢ ⎥ = .Var(X) = . σ 2X σ 2Y = .1,55 =
⎣3⎦ 9 9 9 9
1,55 1 1
Desviación típica: σ Y = = . 1,55 = . σ X
9 3 3
1
.σ
σY 3 X σX
Coeficiente de variación: CVY = = = = CVX = 0, 498
μY 1 .μ μX
3 X
87
El cambio de escala afecta a la media y a la desviación típica de la misma forma, en
consecuencia deja invariante al coeficiente de variación.
X
Resultados que se observan en la tabla, donde Y =
3
Y = y j P(Y = y j ) = p j y j . pj y 2j y 2j . p j
x 2 = 2 3 0,25 0,5 3 49 19
x 4 = 4 3 0,35 1, 4 3 16 9 5,6 9
1 2,5 3 7,8 9
4 4
∑ y .P(Y = y ) = ∑ y . p =
2,5 1
Media: α1 = μ Y = E(Y) = j j j j = . μX
j=1 j=1
3 3
4 4
∑ ∑y . p =
7,8 1
α2 = E(Y 2 ) = y 2j . P(Y = y j ) = 2
j j = . E(Y 2 )
j=1 j=1
9 9
2
7,8 ⎛ 2,5 ⎞ 1 2 1,55
Varianza: σ 2Y = α 2 − α12 = −⎜ ⎟ = . σX =
9 ⎝ 3 ⎠ 9 9
1,55 1 1
Desviación típica: σ Y = = . 1,55 = . σ X
9 3 3
1
.σ
σY 3 X σX
Coeficiente de variación: CVY = = = = CVX = 0, 498
μY 1 .μ μX
3 X
d) Al realizar simultáneamente un cambio de origen de 2 unidades a la izquierda y un cambio de
X+2
escala de 3 unidades, la variable transformada es Y =
3
⎡X + 2⎤ 1 1 2
Media: μ Y = E(Y) = E ⎢ ⎥ = . E(X + 2) = . E(X) +
⎣ 3 ⎦ 3 3 3
88
1 2 1 2 4,5
con lo que, μ Y = E(Y) = . E(X) + = . 2,5 + = = 1,5
3 3 3 3 3
⎡X + 2⎤ 1 1 1
Varianza: σ 2Y = Var(Y) = Var ⎢ ⎥ = . Var(X + 2) = . Var(X) = . σ 2X
⎣ 3 ⎦ 9 9 9
1,55 1 1
Desviación típica: σ Y = = . 1,55 = . σ X
9 3 3
1
.σX
σY σX 1,245
Coeficiente de variación: CVY = = 3 = = = 0,28 ≠ CVx
μ Y 1 .μ + 2 μX + 2 4,5
3 X 3
El cambio de origen y de escala afecta a la media y desviación típica de distinta forma, en
consecuencia también queda afectado el coeficiente de variación.
X+2
Resultados que se observan en la tabla, donde Y =
3
Y = y j P(Y = y j ) = p j y j . pj y 2j y 2j . p j
x 2 = 4 3 0,25 13 16 9 49
1 4,5 3 21,8 9
4 4
∑ y .P(Y = y ) = ∑ y . p =
4,5
Media: α1 = μ Y = E(Y) = j j j j = 1,5
j=1 j=1
3
4 4
∑ y .P(Y = y ) = ∑ y . p =
21,8
α2 = E(Y ) = 2 2
j j
2
j j
j=1 j=1
9
2
21,8 ⎛ 4,5 ⎞ 1 2 1,55
Varianza: σ = α 2 − α =
2
Y −⎜ ⎟ = . σX =
2
1
9 ⎝ 3 ⎠ 9 9
89
1,55 1 1
Desviación típica: σ Y = = . 1,55 = . σ X
9 3 3
1
.σ
σY 3 X σ 1,245
Coeficiente de variación: CVY = = = X = = 0,28 ≠ CVx
μ Y 1 . 4,5 4,5 4,5
3
56. Sea (X, Y) una variable aleatoria bidimensional con función de densidad:
a) Hallar k para que sea función de densidad.
b) Hallar las funciones de densidad marginales. ¿Son X e Y independientes?
c) Hallar las funciones de distribución marginales.
d) Hallar las funciones de densidad condicionadas.
Solución:
∞ ∞
a) Para que f(x, y) sea función de densidad tiene que verificarse:
∫ ∫
−∞ −∞
f(x, y) dx dy = 1
1
⎛ ⎞ ⎡ x2 ⎤ k
∫∫ ∫ ∫ ∫ k [ y] dx = k∫
1 x 1 x 1 1
x
k dx dy = k ⎜ dy ⎟ dx = 0
x dx = k ⎢ ⎥ = = 1 → k = 2
0 0 0 ⎝ 0 ⎠ 0 0 ⎣ 2 ⎦0 2
por tanto,
b) Funciones de densidad marginales:
∞
∫ ∫
x
2dy = 2 [ y ]0 = 2 x 0 < x < 1
x
f1 (x) = f(x, y)dy =
−∞ 0
∫ ∫
1
2dx = 2 [ x ]y = 2 − 2 y 0 < y < 1
1
f2 (y) = f(x, y)dx =
−∞ y
90
f1 (x) . f2 (y) = 2 x . (2 − 2 y) = 4 x − 4 x y ≠ 2 = f(x, y) luego no son independientes
c) Funciones de distribución marginales:
∫ ∫ ∫
x x x
x
F1 (x) = f1 (t)dt = f1 (t)dt = 2 tdt = ⎡⎣ t2 ⎤⎦ 0 = x 2 0 < x < 1
−∞ 0 0
∫ ∫ ∫
y y y
y
F2 (y) = f2 (t)dt = f2 (t)dt = (2 − 2 t)dt = ⎡⎣ 2 t − t2 ⎤⎦ 0 = 2 y − y 2 0 < y < 1
−∞ 0 0
d) Funciones de densidad condicionadas:
f(x , y) 2
f(x / y) = = 0< y<1 0<x<1
f2 (y) 2 − 2 y
f(x , y) 2
f(y / x) = = 0<x<1 0< y<1
f1 (x) 2 x
57. Sea (X, Y) una variable aleatoria bidimensional con función de densidad:
Solución:
∞ ∞
a) f(x, y) es función de densidad si se verifica
∫ ∫
−∞ −∞
f(x, y) dx dy = 1
∞ ∞
⎛ ⎞
∫ ∫ ∫∫ ∫ ∫ ∫ [ y]
1 x 1 x 1
x
f(x, y) dx dy = dx dy = ⎜ dy ⎟ dx = −x
dx =
−∞ −∞ 0 −x 0 ⎝ −x ⎠ 0
∫
1
1
= 2 x dx = ⎡⎣ x ⎤⎦ = 1 2
0
0
91
b) Para hallar las medias de X e Y hay que calcular primero las funciones de densidad
marginales:
∞
∫ ∫
x
dy = [ y ]0 − x = 2 x 0 < x < 1
x
• f1 (x) = f(x, y)dy =
−∞ −x
⎧
∫
1
dx = [ x ]− y = 1 + y
1
∞ ⎪ −1< y< 0
⎪
∫
−y
• f2 (y) = f(x, y)dx = ⎨
∫ dx = [ x ] = 1 − y
1
−∞ ⎪ 1
0< y<1
⎪⎩ y
y
∞ 1
⎡ x3 ⎤
∫ ∫
1
2
α10 = μ x = E(X) = x f1 (x)dx = x.2 x dx = 2 ⎢ ⎥ =
−∞ 0 ⎣ 3 ⎦0 3
∫ ∫ ∫ ∫ ∫ y (1 − y)dy =
0 1 0 1
α 01 = μ y = E(Y) = y f2 (y)dy = y f2 (y)dy + y f2 (y)dy = y (1 + y)dy +
−∞ −1 0 −1 0
0 1
⎡y y ⎤ ⎡y y ⎤
∫ ∫
0 1 2 3 2 3
1 1 1 1
= (y + y 2 )dy + (y − y 2 )dy = ⎢ + ⎥ + ⎢ − ⎥ = − + + − = 0
−1 0 ⎣2 3 ⎦ −1 ⎣ 2 3 ⎦0 2 3 2 3
⎡ 1 ⎤ ⎡ 1 1 1⎤
c) Probabilidades: P ⎢ X < ; Y < 0 ⎥ y P ⎢ X > ; − < Y < ⎥
⎣ 2 ⎦ ⎣ 2 2 2⎦
12
⎛ ⎞ ⎡ x2 ⎤
∫ ∫ ∫ ∫ ∫ ∫
⎡ ⎤
12 0 12 0 12 12
1 1
[ y ]− x dx =
0
P ⎢X < ; Y < 0⎥ = f(x, y)dx dy = ⎜ dy ⎟ dx = x dx = ⎢ ⎥ =
⎣ 2 ⎦ 0 −x 0 ⎝ −x ⎠ 0 0 ⎣ 2 ⎦0 8
⎛ ⎞
∫ ∫ ∫ ∫ ∫ ∫
⎡ 1⎤ 1 12 1 12 12 1
1 1 1
P ⎢X > ; − < Y < ⎥ = f(x, y)dx dy = ⎜ dy ⎟ dx = [ y ]− 1 2 dx =
12
dx = [ x ]1 2 =
1
⎣ 2 2 2⎦ 12 −1 2 1 2⎝ −1 2 ⎠ 0 12 2
92
58. La función de densidad asociada a la emisión de billetes de una compañía área es:
a) Hallar la función de distribución.
b) Hallar las funciones de densidad marginales de X e Y.
c) ¿Son X e Y independientes?
Solución:
⎛ ⎞
∫ ∫ ∫∫ ∫ ∫
x y x y x y
a) F(x, y) = f(u, v) dv du = (u + v)du dv = ⎜ (u + v)dv ⎟ du =
−∞ −∞ 0 0 0 ⎝ 0 ⎠
⎛ ⎡ v2 ⎤ ⎞
y
⎡ y2 ⎤ ⎡ u2 ⎤
x
∫ ∫
x x
y2
⎜ u[ v ]0 + ⎢ ⎥ ⎟ du = [u]0x =
y
= ⎢u y + ⎥ du = y ⎢ ⎥ +
⎜ ⎣ 2 ⎦ 0 ⎟⎠ ⎣ 2⎦ ⎣ 2 ⎦0 2
0
⎝ 0
y x2 y2 x 1
= + = (y x 2 + y 2 x) 0≤x<1 0≤ y<1
2 2 2
En consecuencia,
⎧ 0 x<0 ó y<0
⎪1
⎪ (y x 2 + y 2 x) 0≤x<1 0≤ y<1
⎪2
⎪⎪ 1
F(x, y) = ⎨F1 (x) = (x 2 + x) 0≤x<1 , y≥1
⎪ 2
⎪ 1
⎪F2 (y) = 2 (y + y ) 0≤ y<1 , x≥1
2
⎪
⎪⎩ 1 x≥1 , y≥1
b) Funciones de densidad marginales de X e Y
∞ 1
∫ ∫
⎡ y2 ⎤
1
1
f(x, y)dy = (x + y)dy = x [ y ]0 + ⎢ ⎥ = x +
1
f1 (x) = 0<x<1
−∞ 0 ⎣ 2 ⎦0 2
∞ 1
∫ ∫
⎡ x2 ⎤
1
1
f(x, y)dx = (x + y)dx = ⎢ ⎥ + y [ x ]0 = + y
1
f2 (y) = 0< y<1
−∞ 0 ⎣ 2 ⎦0 2
Adviértase que:
93
ϑ F1 (x) ϑ ⎡ 1 2 ⎤ 1 ϑ F (y) ϑ ⎡ 1 ⎤ 1
f1 (x) = = ⎢ (x + x)⎥ = x + f2 (y) = 2 = ⎢ (y + y 2 )⎥ = + y
ϑx ϑx ⎣2 ⎦ 2 ϑy ϑy ⎣2 ⎦ 2
⎛ 1⎞ ⎛1 ⎞
f1 (x).f2 (y) = ⎜ x + ⎟ . ⎜ + y ⎟ ≠ x + y = f(x, y) luego no son independientes.
⎝ 2⎠ ⎝2 ⎠
59. La función de distribución asociada a un fenómeno de la naturaleza es:
a) Hallar la función de densidad.
b) Hallar las funciones de densidad marginales de X e Y.
c) Hallar las funciones de densidad condicionadas.
d) Calcular el coeficiente de correlación.
Solución:
⎧ e− (x + y) x>0 y>0
Función de densidad f(x , y) = ⎨
⎩0 en el resto
b) Funciones de densidad marginales
∞ ∞ ∞ ∞
∫ ∫ ∫ ∫
∞
f1 (x) = f(x, y)dy = e− (x + y) dy = e− x .e− y dy = e− x e− y dy = − e− x ⎡⎣ e− y ⎤⎦ 0 = − e− x . (−1) = e− x
−∞ 0 0 0
∞ ∞ ∞ ∞
∫ ∫ ∫ ∫
∞
f2 (y) = f(x, y)dx = e − (x + y)
dx = −y −x
e .e dx = e −y
e− x dx = − e− y ⎡⎣ e− x ⎤⎦ 0 = − e− y . (−1) = e− y
−∞ 0 0 0
94
X e Y independientes ⇒ La covarianza μ11 = σ xy = 0 ⇒ ρ = 0
c) Funciones de densidad condicionadas
f(x , y) e− (x + y)
f(x / y) = = − y = e− x = f1 (x) al ser X e Y independientes
f2 (y) e
f(x , y) e− (x + y)
f(y / x) = = − x = e− y = f2 (y) al ser X e Y independientes
f1 (x) e
μ 11
d) El coeficiente de correlación ρ = σ x y =
σx .σy
∞ ∞ ∞
∫ ∫ ∫
∞ ∞
α10 = μ x = E(X) = x.f1 (x)dx = x.e− x dx ⎡⎣ − x.e− x ⎤⎦ + e− x dx = ⎡⎣ − x.e− x − e− x ⎤⎦ 0 = 1
0
−∞ 0 0
∞ ∞ ∞
∫ ∫ ∫
∞ ∞
α 01 = μ y = E(Y) = y.f2 (y)dy = y.e dy−y
⎡⎣ − y.e ⎤⎦ +
−y
e− y dy = ⎡⎣ − y.e− y − e− y ⎤⎦ 0 = 1
0
−∞ 0 0
∞ ∞
∫ ∫
∞ ∞
Nota: x.e dx = ⎡⎣ x.e− x ⎤⎦ 0 +
−x
e− x dx = ⎡⎣ x.e− x − e− x ⎤⎦ 0
0 0
⎧ u = x → du = dx
⎪ ∞
∫
donde se ha realizado el cambio ⎨ ∞
⎪ dv = e −x
dx → v = e− x dx = ⎡⎣ − e− x ⎤⎦ 0
⎩ 0
∞ ∞ ∞ ∞ ∞ ∞
α11 = E(X.Y) =
∫∫ 0 0
x.y.f(x, y) dx dy =
∫∫ 0 0
x.y.e − (x + y)
dx dy =
∫ 0
−x
x.e dx .
∫ 0
y.e− y dy = 1
∞ ∞ ∞
∫ ∫ ∫
∞
α 20 = E(X ) = 2
x .f1 (x)dx =
2 2
x .e dx −x
⎡⎣ − x .e ⎤⎦ +
2 −x
2.x.e− x dx =
0
−∞ 0 0
∞ ∞ ∞
= ⎡⎣ − x 2 .e− x ⎤⎦ 0 + 2 ⎡⎣ − x.e− x − e− x ⎤⎦ 0 = ⎡⎣ − x 2 .e− x − 2.x.e− x − 2.e− x ⎤⎦ 0 = 2
Análogamente, α 02 = E(Y 2 ) = 2
σ 2x = α 20 − α10
2
=2−1=1 σx = 1=1
σ 2y = α 02 − α 201 = 2 − 1 = 1 σy = 1=1
95
μ11 0
Coeficiente de correlación ρ = σ x y = = = 0 ⇒ Las variables son incorreladas
σ x . σ y 1.1
60. La venta en un mercado de abastos lleva asociada la función:
⎧ ⎡xy ⎤
⎪k ⎢ + 1 ⎥ 0<x<1 −1< y <1
f(x, y) = ⎨ ⎣ 2 ⎦
⎪ 0 en el resto
⎩
a) Hallar k para que sea función de densidad
b) Hallar la función de distribución
c) Funciones de densidad marginales y condicionadas
d) Se considera la transformación Z = X − Y y T = X + 2Y , hallar la función de densidad de la
variable (Z , T)
Solución:
a) f(x , y) ≥ 0 ⇔ k ≥ 0
∞ ∞
Para que f(x , y) sea función de densidad debe verificarse que
∫ ∫
−∞ −∞
f(x, y) dx dy = 1
⎛ ⎤ ⎞ ⎛ ⎡ y2 ⎤1 ⎞
∫∫ ∫ ∫ ∫
1 1 1 1 1
⎡xy ⎤ ⎡xy
k ⎜ x ⎢ ⎥ + [ y ]−1 ⎟ dx =
1
k ⎢ + 1⎥ dx dy = k ⎜⎜ ⎢ + 1 ⎥ dy ⎟⎟ dx =
−1 ⎣ 2 ⎦ −1 ⎣ 2 ⎦ ⎠ ⎜ ⎟
⎝ ⎣ ⎦ −1
0 ⎝ 4
0 0
⎠
∫
1
1
2k dx = 2k [ x ]0 = 2k = 1
1
= k=
0 2
⎧xy + 2
⎪ 0<x<1 −1< y <1
La función de densidad f(x , y) = ⎨ 4
⎪⎩ 0 en el resto
∫ ∫
x y
b) Función de distribución F(x , y) = P(X ≤ x , Y ≤ y) = f(u, v) dv du
−∞ −∞
⎡ uv + 2 ⎤ ⎛ ⎡ uv + 2 ⎤ ⎞
∫∫ ∫ ∫ ∫∫
x y x y x y
F(x , y) = ⎢ 4 ⎥ dv du =
−1 ⎣ ⎦
⎜ ⎢
−1 ⎣ 4 ⎦ ⎠⎥ dv ⎟ du =
1
4
( ⎡⎣uv + 2⎤⎦ dv ) du =
0 0 ⎝ 0 −1
⎛ ⎡ v2 ⎤ y ⎞ ⎛ u y2 u ⎞
∫ ∫
x x
1 1
⎜ u ⎢ ⎥ + 2 [ v ] −1 ⎟ du =
y
= ⎜ − + 2 y + 2 ⎟ du =
4 ⎜ ⎣ 2 ⎦ −1 ⎟ 4 ⎝ 2 2 ⎠
0
⎝ ⎠ 0
96
1 ⎡ y 2 ⎛ u2 ⎞ 1 ⎛ u2 ⎞ ⎤ x 2 (y 2 − 1) x (y + 1)
x x
= ⎢ ⎜ ⎟ − ⎜ ⎟ + 2 y ( u ) 0 + 2 ( u ) 0
x x
⎥= +
4 ⎢ 2 ⎝ 2 ⎠0 2 ⎝ 2 ⎠0 ⎥⎦ 16 2
⎣
x 2 (y 2 − 1) x (y + 1)
En consecuencia, F(x , y) = + 0≤x<1 −1≤ y <1
16 2
Las funciones de distribución marginales, resultan:
⎛ uv + 2 ⎞
∫∫ ∫∫ ∫ ∫
uv + 2
x y x 1 x 1
⎛ ⎡ v2 ⎤ 1 2 1 ⎞
∫ ∫
x x
⎛ uv + 2 ⎞
∫∫ ∫∫ ∫ ∫
uv + 2
x y 1 y 1 y
⎛ ⎡ v2 ⎤ y 2 y ⎞ ⎡⎛ y 2 − 1 ⎞ ⎤
∫ ∫
1 1
2
= ⎜ u ⎢ ⎥ + [ v ]−1 ⎟ du = ⎢⎜ ⎟ u + ( y + 1 ) ⎥ du =
⎜ ⎣ 8 ⎦ −1 4 ⎟ ⎣⎝ 8 ⎠ 4 ⎦
0
⎝ ⎠ 0
1
⎛ y 2 − 1 ⎞ ⎡ u2 ⎤ 2 y2 − 1 y + 1 y2 + 8 y + 7
( ) [ ]
1
= ⎜ ⎟⎢ ⎥ + y + 1 u 0
= + = −1≤ y <1
⎝ 8 ⎠ ⎣ 2 ⎦0 4 16 2 16
c) También se podrían haber hallado a través de las funciones de densidad marginales:
∞ 1
∫ ∫
x ⎡ y2 ⎤
1
⎡xy 1⎤ 1 1
f1 (x) = f(x, y)dy = +
⎢ 4 2⎥ dy = ⎢ ⎥ + [ y ] −1 = 1
−∞ −1 ⎣ ⎦ 4 ⎣ 2 ⎦ −1 2
∞ 1
∫ ∫
y ⎡ x2 ⎤ 1 1 y + 4
1
⎡xy 1⎤
f2 (y) = f(x, y)dx = + dx = + [x] =
−∞ 0
⎢ 4 2⎥
⎣ ⎦ 4 ⎢⎣ 2 ⎥⎦ 0 2 0 8
∫ ∫
x x
du = [ u]0 = x
x
F1 (x) = P(X ≤ x) = f1 (u)du = 0≤x<1
−∞ 0
∫ ∫
⎡v + 4⎤ 1 ⎡ v2 ⎤ y2 + 8 y + 7
y y
La función de distribución conjunta:
97
⎧ 0 x<0 ó y < −1
⎪ 2 2
⎪ x (y − 1) + x (y + 1) 0≤x<1 −1≤ y <1
⎪ 16 2
⎪
F(x , y) = ⎨ x 0≤x<1 , y≥1
⎪ y2 + 8 y + 7
⎪ −1 ≤ y < 1 , x ≥ 1
⎪ 16
⎪ 1 x≥1 , y≥1
⎩
Las funciones de densidad marginales se pueden hallar a partir de la función de distribución
conjunta:
ϑ F1 (x) ϑ ϑ F (y) ϑ ⎡ y 2 + 8 y + 7 ⎤ y + 4
f1 (x) = = (x) = 1 f2 (y) = 2 = ⎢ ⎥=
ϑx ϑx ϑy ϑy ⎣ 16 ⎦ 8
o bien, a partir de la función de densidad:
∞ 1
∫ ∫
x ⎡ y2 ⎤
1
⎡xy 1⎤ 1 1
f1 (x) = f(x, y)dy = ⎢ 4 + 2 ⎥ dy = 4 ⎢ 2 ⎥ + 2 [ y ]−1 = 1
−∞ −1 ⎣ ⎦ ⎣ ⎦ −1
∞ 1
∫ ∫
y ⎡ x2 ⎤ 1 1 y + 4
1
⎡xy 1⎤
f2 (y) = f(x, y)dx = ⎢ 4 + 2 ⎥ dx = 4 ⎢ 2 ⎥ + 2 [ x ]0 = 8
−∞ 0 ⎣ ⎦ ⎣ ⎦0
Funciones de densidad condicionadas:
f(x, y) (x y + 2) 4 x y + 2
f(y / x) = = = ≠ f2 (y)
f1 (x) 1 4
f(x, y) (x y + 2) 4 2 x y + 4
f(x / y) = = = ≠ f1 (x)
f2 (y) (y + 4) 8 y+4
ϑz ϑz
⎧Z = X − Y ϑ (z, t) ϑx ϑy 1 −1
En la transformación ⎨ J = == = =3≠0
⎩T = X + 2 Y ϑ (x, y) ϑt ϑt 1 2
ϑx ϑy
por lo que existe la función de densidad g(z , t)
98
ϑx ϑx
ϑ (x, y) ϑz ϑt
Despejando (X,Y) en la función de (Z,T) se calcula el jacobiano J1 = =
ϑ (z, t) ϑy ϑy
ϑz ϑt
⎧ 2Z + T
⎧Z = X − Y 2Z = 2X − 2 Y ⎪⎪ X = 3 ϑ (x, y) 2 3 1 3 1
⎨ ⎨ J1 = = =
⎩T = X + 2 Y T = X + 2Y ⎪ Y = −Z + T ϑ (z, t) −1 3 1 3 3
⎪⎩ 3
⎡ 2z + t ⎤ ⎡ − z + t ⎤
⎢ 3 ⎥⎦ ⎢⎣ 3 ⎥⎦ 1 (2z + t)(− z + t)
g(z , t) = ⎣ . =
4 3 108
99
61. En una distribución N(μ , σ) , se estima la media poblacional μ mediante la media de una
σ2
muestra aleatoria simple (x 1 , x 2 , , x n ) . El estimador es insesgado y su varianza V(x) = .
n
Demostrar que la media muestral es un estimador eficiente.
Solución:
Para obtener la cota de Cramer‐Rao se parte de la función de densidad poblacional:
1
CCR = 2
⎡ ϑ Ln f(x, μ) ⎤
nE ⎢ ⎥
⎣ ϑμ ⎦
(x − μ ) 2
−
1 2 σ2
La función de densidad poblacional: f(x , μ) = e
σ 2π
tomando logaritmos neperianos, se tiene:
⎛ 1 (x − μ ) ⎞
2
y derivando respecto a μ :
2
ϑLn f(x , μ) 1 x−μ ⎛ ϑLn f(x , μ) ⎞ (x − μ)
2
ϑμ
=−
2 σ2
[ − 2(x − μ ) ] σ2
= → ⎜ ϑμ ⎟ =
σ4
⎝ ⎠
⎡ (x − μ)2 ⎤ σ 2
2
⎡ ϑ Ln f(x , μ) ⎤ 1
La esperanza matemática es: E ⎢ ⎥ = E ⎢ ⎥ = 4= 2
⎣ ϑμ ⎦ ⎣ σ 4
⎦ σ σ
Sustituyendo el valor de la esperanza matemática en la expresión de la cota para estimadores
insesgados:
1 1 σ2
CCR = 2
= =
⎡ ϑ Ln f(x, μ) ⎤ 1 n
nE ⎢ n 2
ϑμ ⎥ σ
⎣ ⎦
La varianza del estimador coincide con la cota de Cramer‐Rao, concluyendo que la media
muestral es un estimador eficiente de la media poblacional en la distribución normal.
100
62. El estacionamiento de corta estancia en el Aeropuerto Adolfo Suárez está cerca de la
terminal, de modo que al recoger a un pasajero solo hay que caminar una corta distancia al área
de recuperación de equipajes. Para decidir si el estacionamiento tiene suficientes lugares, el
gerente del aeropuerto necesita saber si el tiempo medio de permanencia es superior a 40
minutos. Una muestra aleatoria de una población normal mostró que 12 clientes estuvieron en
el estacionamiento los siguientes lapsos de tiempo, en minutos:
55 47 27 64 53 56
49 53 39 48 48 37
Con un nivel de significación 0,05, ¿se puede afirmar que el tiempo medio en el estacionamiento
es superior a 40 minutos?
Solución:
Se establecen las hipótesis nula y alternativa: H0 : μ ≤ 40 H1 : μ > 40
Regla de decisión:
⎧ Si x ≤ k Se acepta H0 (R.A)
⎨
⎩ Si x > k Se rechaza H0 (R.C)
En el muestreo de una población normal con varianza desconocida, y desviación típica muestral
x −μ x −μ
σ x , la variable = = tn − 1
σx sx
n−1 n
12 12
∑ ∑
1 576 1 1064
En la muestra: x = xi = = 48 s2x = (x i − x)2 = = 96,727
12 i = 1 12 11 i = 1 11
x −μ x −μ
sx = 96,73 = 9,835 → t11 = =
9,835 2,839
12
x − 40
Bajo la hipótesis nula, la muestra sigue una distribución t11 =
2,839
A partir del nivel de significación α se determina el valor crítico k:
101
⎧ Si x ≤ 45,098 Se acepta H0 (R.A)
⎨
⎩ Si x > 45,098 Se rechaza H0 (R.C)
63. El gerente de un centro comercial de Madrid desea estimar la cantidad media que gastan los
clientes que visitan el centro comercial. Sabiendo que el gasto sigue una distribución normal,
una muestra de 20 clientes señala las siguientes cantidades en euros:
37,9 46,9 41,8 46,8 49,2 52,7 50,8
52,6 61,8 23,7 42,2 61,5 58,8 54,8
48,5 61,9 51, 4 48,1 51,3 43,9
Determinar un intervalo de confianza del 95% e interpretar el resultado. ¿Se podría afirmar que
la media poblacional es de 50 o 60 euros?
Solución:
20 20
∑ ∑
1 986,6 1 50.221,66
x = α1 = xi = = 49,33 α 2 = x 2i = = 2511,083
20 i = 1 20 20 i = 1 20
n . σ 2x 20 . 77,6341
n . σ 2x = (n − 1) . s2x → s2x = = = 81,72
(n − 1) 19
20
∑
1 1552,682
o bien, s2x = (x i − x)2 = = 81,72 s x = 81,72 = 9,04 t0,025,19 = 2,093
19 i = 1 19
⎡ 9,04 ⎤
I0,95 (μ) = ⎢ 49,33 ± 2,093 = [ 49,33 ± 4,23] = [ 45,1 ; 53,56 ]
⎣ 20 ⎥⎦
El gerente del centro comercial se pregunta si la media poblacional podría haber sido de 50 0 60
euros. Como 50 euros se encuentra dentro del intervalo de confianza, resulta razonable que la
media poblacional sea de 50 euros.
102
Como el valor de 60 euros no se encuentra en el intervalo de confianza, se concluye que no es
probable que la media poblacional sea de 50 euros.
64. Una empresa de neumáticos afirma que una nueva gama en promedio 28.000 km. Las
pruebas con 64 neumáticos dan como resultado una duración media de 27.800 km, con una
desviación típica de 1.000 km.
a) Si se usa un nivel de significación del 5%, comprobar si hay evidencia suficiente para rechazar
la afirmación de la empresa.
b) ¿Cuál es el p‐valor?
Solución:
a) Sobre la población de los neumáticos se define la variable aleatoria X = “duración en
kilómetros”, donde X ∼ N(28000, σ)
Se trata de un contraste unilateral por la izquierda.
Regla de decisión:
⎧ Si x ≥ k Se acepta H0 (R.A)
⎨
⎩ Si x < k Se rechaza H0 (R.C)
En el muestreo de una población normal con varianza desconocida, con muestras grandes
⎛ s ⎞
n > 30 , la media muestral x ∼ N ⎜ μ , x ⎟
⎝ n⎠
⎛ 1000 ⎞
Bajo la hipótesis nula, la muestra sigue una distribución N⎜ 28000 , ≡ N( 28000 ,125 )
⎝ 64 ⎟⎠
El valor crítico k, bajo la hipótesis nula, se determina con el nivel de significación α = 0,05 :
103
⎡ k − 28000 ⎤ ⎡ k − 28000 ⎤
P ⎢z < ⎥ = P ⎢z ≥ − = 0,05
⎣ 125 ⎦ ⎣ 125 ⎥⎦
k − 28000
− = 1,645 → k = 28000 − 125 x 1,645 = 27794,375
125
Para un nivel de significación α = 0,05 ,
el p‐valor αp = 0,0548 > α = 0,05
Se acepta la hipótesis nula. Es decir, con una
fiabilidad del 95% se acepta que la duración
media de los neumáticos es de 28.000 km.
104
65. Un estudio de la DGT estima que el número de horas prácticas necesarias para la obtención
del permiso de conducir sigue una distribución normal N(24, 3). Se sabe que la autoescuela
Fuenterrebollo ingresa por alumno una parte fija de 250 euros, más 23 euros por hora de
práctica.
a) ¿Qué probabilidad hay de obtener el permiso de conducir con 20 horas de prácticas o menos?
b) ¿Cuántas horas de prácticas ha necesitado un conductor para obtener el permiso si el 68% de
los conductores ha necesitado más horas de prácticas que él?
c) Calcular el ingreso por alumno esperado.
d) Calcular la desviación típica del ingreso por alumno.
Solución:
a) X = "número de horas de prácticas necesarias para obtener el permiso de conducir"
⎛ X − 24 20 − 24 ⎞
P(X ≤ 20) = P ⎜ ≤ ⎟ = P(z ≤ −1,33) = P(z ≥ 1,33) = 0,0918
⎝ 3 3 ⎠
b) Sea h = "número de horas necesarias"
⎛ X − 24 h − 24 ⎞ ⎛ h − 24 ⎞
P(X ≥ h) = P ⎜ ≥ ⎟ = P⎜ z ≥ ⎟ = 0,68
⎝ 3 3 ⎠ ⎝ 3 ⎠
⎛ h − 24 ⎞ ⎛ h − 24 ⎞
P⎜ z ≥ ⎟ = 0,68 → P ⎜ z ≤ − ⎟ = 0,68
⎝ 3 ⎠ ⎝ 3 ⎠
⎛ h − 24 ⎞ ⎛ h − 24 ⎞ h − 24
P⎜ z ≤ − ⎟ = 0,68 ⇒ P ⎜ z ≥ − ⎟ = 0,32 − = 0, 46
⎝ 3 ⎠ ⎝ 3 ⎠ 3
h − 24
− = 0, 46 h = 24 − 3 X 0, 46 = 22,62
3
c) Para un alumno cualquiera, el ingreso de la autoescuela Fuenterrebollo por las prácticas es
I = 23X + 250
El ingreso por alumno esperado será:
d) La varianza del ingreso del alumno:
105
66. Se ha medido el perímetro craneal a niños de edad comprendida entre los dos y tres años,
obteniéndose los siguientes datos en centímetros:
Intervalos 38 − 40 40 − 42 42 − 44 44 − 46 46 − 48
Frecuencia observada 11 7 7 6 4
Comprobar si las observaciones craneales son o no distribuidas según una ley normal con un
nivel de confianza del 99%.
Solución:
Marca clase
Intervalos ni x ini x 2i ni
xi
35 1475 62427
Se calcula la media y la desviación típica:
5 6
∑ i=1
x ini
1475
∑x n
i=1
2
i i
62427
α1 = μ = = = 42,14 α 2 = = = 1783,62
N 35 N 35
106
⎡ 40 − 42,14 x − 42,14 42 − 42,14 ⎞
P [ 40 ≤ x < 42 ) = P ⎢ ≤ < ⎟ = P [ −0,76 ≤ z < −0,05 ) =
⎣ 2,8 2,8 2,8 ⎠
= P [ 0,05 ≤ z < 0,76 ) = 0, 4801 − 0,0708 = 0, 4093
Intervalos ni pi ei = npi
En este caso se obtiene:
107
Intervalos ni ei = npi n2i n2i / ei
43,4140
Frecuencia observada ≡ ni 11 7 7 10
Se establece la hipótesis nula H0 : El perímetro craneal sigue una distribución normal
⎛ 5
n2i ⎞
Que se aceptará cuando el estadístico observado ⎜
⎜
⎝
∑
i=1
ei
− n ⎟ es menor que el estadístico
⎟
⎠
teórico o esperado χ 2α , k − p − 1 donde los grados de libertad (k − p − 1) vienen determinados por
el número de clases k = 4 , menos el número de parámetros que ha habido que calcular (μ , σ) ,
p = 2 , menos 1 al ser excluyentes las modalidades, es decir, (4 − 2 − 1)
4
n2i
El estadístico observado χ = 2
1 ∑
i=1
ei
− n = 43, 4140 − 35 = 8, 414
108
67. Un fabricante de televisores está desarrollando un nuevo modelo de televisor en color, y
para este fin se pueden utilizar dos tipos de esquemas transistorizados. El fabricante selecciona
una muestra de esquemas transistorizados del primer tipo de tamaño 16, y otra del segundo
tipo de tamaño 13. Los datos muestrales respecto a la vida media de cada esquema son los
⎧ x1 = 1400 horas s1 = 30 horas n1 = 16
siguientes: ⎨
⎩ x2 = 1500 horas s2 = 17 horas n2 = 13
Construir un intervalo de confianza del 90% para la diferencia de vida media de cada tipo de
esquema.
Solución:
Sea la variable aleatoria X1 = 'vida media del primer esquema', que sigue una distribución
normal N(μ1 , σ 1 ) . Análogamente, la variable aleatoria X2 = 'vida media del segundo esquema',
sigue una distribución normal N(μ 2 , σ 2 ) .
Se quiere construir un intervalo de confianza para la diferencia de medias poblacionales
(μ1 − μ 2 ) con varianzas poblacionales desconocidas, y no se sabe si distintas o no, siendo las
muestras pequeñas n1 + n2 = 29 < 30 .
Para dilucidar si las varianzas poblacionales desconocidas son o no distintas, construimos
primero un intervalo de confianza para el cociente de varianzas (σ 21 σ 22 ) , de modo que si el
intervalo cubre al punto 1 se puede partir de que las varianzas son desconocidas pero iguales.
• Para construir un intervalo de confianza para el cociente de varianzas se emplea la fórmula:
1
siendo F1 − α /2 ; (n 1 − 1) , (n 2 − 1) =
Fα /2 ; (n 1 − 1) , (n 2 − 1)
s12 = 302 = 900 n1 = 16 s22 = 172 = 289 n2 = 13 s12 / s22 = 900 289 = 3,114
1 − α = 0,90 α / 2 = 0,05 F0,05 ; 15 , 12 = 2,6169 F0,95 ; 15 , 12 = 1 / F0,05 ; 12 , 15 = 1 / 2,4753 = 0,404
de donde
I 0,90 ⎛⎜ σ12 ⎞⎟ = ⎡⎢ 3,114 ; 3,114 ⎤⎥ = ⎣⎡ 1,19 ; 7,71 ⎤⎦ ≡ P ⎡⎢1,19 ≤ σ12 ≤ 7,71⎤⎥ = 0,90 = 1 − α
2 2
⎝ 2 σ
⎠ ⎣ 2,6169 0, 404 ⎦ ⎣ σ 2 ⎦
El intervalo no cubre el punto uno, y se concluye que las varianzas poblacionales son
desconocidas y distintas, con una fiabilidad del 90%.
109
Se trata de un intervalo de confianza para la diferencia de medias poblacionales (μ1 − μ 2 ) con
varianzas poblacionales desconocidas y distintas o no, con muestras pequeñas n1 + n2 < 30 .
⎡ s12 s22 ⎤
I 1−α (μ1 − μ 2 ) = ⎢ (x − y) ± tα /2 , f + ⎥
⎢⎣ n1 n2 ⎥
⎦
2
⎛ s12 s22 ⎞
⎜ + ⎟
n1 n2 ⎠
donde, f es la aproximación de Welch ≡ f = ⎝ 2 2
−2
⎛ s12 ⎞ ⎛ s22 ⎞
⎜ ⎟ ⎜ ⎟
⎝ n1 ⎠ + ⎝ n2 ⎠
n1 + 1 n2 + 1
se tiene:
(s ) (s ) (s ) (s )
2 2 2 2
2
1 / n1 = 3164,06 2
2 / n2 = 494,17 2
1 / n1 / 17 = 186,12 2
2 / n2 / 14 = 13,294
(s )
2
2
1 / n1 + s22 / n2 = 6159,11
2
⎛ s12 s22 ⎞
⎜ + ⎟
n1 n2 ⎠
f= ⎝ 2
6159,11
−2= − 2 = 28,89 ≈ 29
⎛ s12 ⎞ ⎛ s22 ⎞
2
186,12 + 13,294
⎜ ⎟ ⎜ ⎟
⎝ n1 ⎠ + ⎝ n2 ⎠
n1 + 1 n2 + 1
⎡ 900 289 ⎤
I 0,90 (μ1 − μ 2 ) = ⎢ (1400 − 1500) ± 1,699 + ⎥ = ⎡− 115,05 , − 84,95⎤⎦
⎣ 16 13 ⎦ ⎣
El intervalo no cubre el cero, concluyendo que existe diferencia significativa entre la vida media
de cada esquema, siendo mayor la vida media del segundo esquema con una fiabilidad del 90%.
110
68. Un instituto de investigaciones agronómicas siembra, en cinco parcelas diferentes, dos tipos
de maíz híbrido. Las producciones en quintales métricos por hectárea son:
Híbrido I 90 85 95 76 80
Híbrido II 84 87 90 92 90
Construir un intervalo de confianza del 90% para la diferencia entre las producciones medias.
Solución:
Sea la variable aleatoria X1 = 'producción de maíz del híbrido I', que sigue una distribución
normal N(μ1 , σ 1 ) . Análogamente, la variable aleatoria X2 = 'producción de maíz del híbrido II',
sigue una distribución normal N(μ 2 , σ 2 ) .
Se construye un intervalo de confianza para el cociente de varianzas para concluir si las
varianzas poblacionales desconocidas son o no distintas.
De modo que, si el intervalo de confianza para el cociente de varianzas (σ 21 σ 22 ) cubre al punto
1 se puede partir de que las varianzas son desconocidas pero iguales.
1
siendo F1 − α /2 ; (n 1 − 1) , (n 2 − 1) =
Fα /2 ; (n 1 − 1) , (n 2 − 1)
En este caso,
El intervalo cubre el uno, y se concluye que las varianzas poblacionales son desconocidas e
iguales, con una fiabilidad del 90%.
En consecuencia, se trata de un intervalo de confianza para la diferencia de medias
poblacionales (μ1 − μ 2 ) con varianzas poblacionales desconocidas pero iguales, con muestras
pequeñas n1 + n2 = 10 < 30
111
⎡ 1 1 ⎤
I 1 − α (μ1 − μ 2 ) = ⎢(x − y) ± tα /2 , (n + n 2 − 2) sp + ⎥
⎣
1
n1 n2 ⎦
x1 = 85,20 x2 = 88,6 n1 = n2 = 5
1 − α = 0,90 α 2 = 0,05 tα /2 , (n 1 + n 2 − 2) = t 0,05 , 8 = 1,860
⎡ 1 1⎤
I 0,90 (μ1 − μ 2 ) = ⎢(85,20 − 88,6) ± 1,860 . 5,81 + ⎥ = ⎡ − 10,23 , 3, 43 ⎦⎤ →
⎣ 5 5⎦ ⎣
→ P ⎡⎣ − 10,23 ≤ μ 1 − μ 2 ≤ 3, 43 ⎤⎦ = 0,90
El intervalo de confianza cubre el cero, por lo que no existe diferencia significativa entre las
producciones medias, con una fiabilidad del 90%.
69. Un equipo de investigación biológica está interesado en ver si una nueva droga reduce el
colesterol en la sangre. Con tal fin toma una muestra de diez pacientes y determina el contenido
de colesterol en la sangre antes y después del tratamiento. Los datos muestrales expresados en
miligramos por 100 mililitros son los siguientes:
Antes 217 252 229 200 209 213 215 260 232 216
Después 209 241 230 208 206 211 209 228 224 203
Construir un intervalo de confianza del 95 por 100 para la diferencia del contenido medio de
colesterol en la sangre antes y después del tratamiento.
Solución:
Se trata de datos apareados, en los que no existe independencia entre las muestras.
n n
I 1−α (μ1 − μ 2 ) = ⎡⎢ d ± tα /2 , (n−1) sd ⎤⎥ ∑ ∑ (d − d)
1 1
donde di = x i − y i d= di s2d = 2
n−1
i
⎣ n⎦ n i=1 i=1
112
X = 'Antes' 217 252 229 200 209 213 215 260 232 216
Y = 'Después' 209 241 230 208 206 211 209 228 224 203
di = x i − y i 8 11 −1 −8 3 2 6 32 8 13
⎡ 10,59 ⎤
I 0,95 (μ1 − μ 2 ) = ⎢7, 40 ± 2,262 ⎥ = ⎣⎡− 0,17 , 14,97⎦⎤
⎣ 10 ⎦
El intervalo abarca el cero, por lo que no existe diferencia significativa en la diferencia del
contenido medio del colesterol antes y después del tratamiento, con una fiabilidad del 95%.
70. Según los dirigentes del partido A, la intención de voto del partido rival B, en Andalucía, es
la misma que la que tiene en Madrid. Se realiza una encuesta a 100 personas en Andalucía de los
que 25 mostraron su apoyo al partido B, y a otras 100 personas en Madrid de las que 30 se
inclinaron por el partido B.
a) Construir un intervalo de confianza del 90% para la proporción de personas que votarían al
partido B en Andalucía.
b) ¿A cuántas personas habría que encuestar para obtener un margen de error o error de
estimación ± 2%, al nivel de confianza anterior?.
c) Construir un intervalo de confianza al 90% para la diferencia de proporciones en la estimación
del voto del partido B en las dos comunidades. ¿Podemos afirmar que los dirigentes del partido
A tienen razón?.
Solución:
a) La característica en estudio en ambas comunidades es dicotómica, tenemos que construir un
intervalo de confianza para el parámetro p1 (proporción) de la variable aleatoria binomial
asociada al estudio de la característica en la comunidad de Andalucía.
Como el tamaño de la muestra es suficientemente grande, n1 = 100 , se puede utilizar la
aproximación normal.
⎡ ˆ ⎤
pˆ (1 − p)
I 1 − α (p) = ⎢pˆ ± zα /2 ⎥
⎣ n ⎦
donde,
113
1 − α = 0,90 α 2 = 0,05 zα /2 = z0,05 = 1,645
pˆ 1 = 25 / 100 = 0,25 qˆ 1 = 1 − pˆ 1 = 0,75 n1 = 100
⎡ 0,25 . 0,75 ⎤
I 0,90 (p1 ) = ⎢ 0,25 ± 1,645 ⎥ = ⎡⎣ 0,179 ; 0,321 ⎤⎦ → P ⎡⎣ 0,179 ≤ p1 ≤ 0,321 ⎤⎦ = 0, 90
⎣ 100 ⎦
En Andalucía la intención de voto del partido B se encuentra entre el 17,9% y 32,1%, con un nivel
de confianza del 90%.
b) La amplitud o longitud vendrá dado por la fórmula:
2
⎡⎛ proporción ⎞ ⎛ error ⎞⎤ ⎡ pˆ x . qˆ x ⎤ ⎛ pˆ x . qˆ x ⎞
I = ⎢⎜ ⎟±⎜ ⎟ ⎥ ≡ ⎢pˆ x + zα /2 ⎥ → ∈ = ⎜⎜ z α 2
2
⎟⎟
⎣ ⎝ muestral ⎠ ⎝ estimación ⎠⎦ ⎣ n ⎦ ⎝ n ⎠
(zα /2 ) 2 (pˆ x . qˆ x )
de donde, n =
∈2
El caso más desfavorable será cuando pˆ x = qˆ x = 0,5 .
2
Siendo ∈2 = (± 0,02)2 = 0,0004 → n = (1,645) (0,5.0,5) ≈ 1691
0,0004
c) Se trata de un intervalo de confianza para la diferencia de parámetros poblacionales (p1 − p2 )
de dos distribuciones binomiales, con el tamaño de las muestras suficientemente grandes,
n1 = n2 = 100 , para utilizar la aproximación normal.
zα /2 = z 0,05 = 1,645
n1 = 100 pˆ 1 = 25 100 = 0,25 qˆ 1 = 1 − pˆ 1 = 0,75
n2 = 100 pˆ 2 = 30 100 = 0,3 qˆ 2 = 1 − pˆ 2 = 0,70
El intervalo de confianza cubre el cero, lo que indica que no existe diferencia significativa entre
la intención de voto del partido B en ambas comunidades, con lo cual los dirigentes del partido A
tienen razón con una fiabilidad del 90%.
114
71. Para comprobar si los operarios encontraban dificultades con una prensa manual de
imprimir, se hizo una prueba a cuatro operarios anotando el número de atascos sufridos al
introducir el mismo número de hojas, dando lugar a la siguiente tabla:
Operario A B C D Total
Obstrucciones 6 7 9 18 40
Con un nivel de significación del 5%, ¿existe diferencia entre los operarios?
Solución:
Estableciendo la hipótesis nula H0 : 'no existe diferencia entre los operarios'
La probabilidad de que se atascase una hoja sería 1 / 4 para todos los operarios.
De este modo, el número de atascos esperados para cada uno de ellos sería (e i = 10) i = 1, ,4
Sea la tabla de contingencia 1 x 4:
Operario A B C D Total
6 7 9 18 40
Obstrucciones
(10) (10) (10) (10) (40)
Se acepta la hipótesis nula, a un nivel de significación α si
k k
(ni − ei ) 2
∑ ∑
n2i
χk2 − 1 = = −n < χ 2α , k − 1 k ≡ número intervalos
i=1
ei i=1
ei
estadístico teórico
estadístico contraste
⎧⎪ k
(ni − ei )2 ⎫⎪
o bien, la región de rechazo de la hipótesis nula: R = ⎨ ∑ ei
≥ χ 2α , k − 1 ⎬
⎩⎪ i=1 ⎭⎪
4
∑
n2i 6 2 7 2 9 2 18 2
con lo cual, χ 23 = −n= + + + − 40 = 9
i=1
ei 10 10 10 10
115
72. Para una muestra aleatoria simple de 350 días, el número de urgencias tratadas diariamente
en un hospital queda reflejado en la siguiente tabla:
Número urgencias 0 − 5 5 − 10 10 − 15 15 − 20 20 − 25 25 − 30 Total días
Número de días 20 65 100 95 60 10 350
Contrastar con un nivel de significación del 5% si la distribución del número de urgencias
tratadas diariamente en el hospital se ajusta a una distribución normal.
Solución:
Se acepta la hipótesis nula, a un nivel de significación α si
k
(ni − ei ) 2
k
n2i k ≡ número intervalos
χk2 − p − 1 = ∑
i=1
ei
= ∑
i=1
ei
− n < χ 2α ; k − p − 1 donde
p ≡ número parámetros a estimar
estadístico teórico
estadístico contraste
1) Se obtiene la media y la desviación típica:
Intervalos xi ni x i ni x 2i ni
6 6 6
n= ∑
i=1
n i = 350 ∑i=1
x i ni = 5075 ∑ x n = 86437,5
i= 1
2
i i
116
6 6 6
∑
i=1
x i ni ∑
i=1
(x i − x) 2 ni ∑x
i=1
2
i ni
x= = 14,5 σ 2x = = − ( x ) 2 = 36,71 σ x = 6,06
350 350 350
n = 350 ∑ (n − e )
i=1
i i
2
/ ei = 4,57
117
⎡ 20 − 14,5 x − 14,5 25 − 14,5 ⎤
P(20 < x < 25) = P ⎢ < < ⎥ = P( 0,91 < z < 1,73) =
⎣ 6,06 6,06 6,06 ⎦
= P(z > 0,91) − P(z > 1,73) = 0,1814 − 0,0418 = 0,1396
3) Se calculan las frecuencias esperadas, multiplicando las probabilidades por el número total
ei = p i . n
4) Se calcula el estadístico de contraste χ 2 , donde el número de grados de libertad es
k − p − 1 = (n º intervalos) − (n º parámetros a estimar) − 1 = 6 − 2 − 1 = 3 , con lo cual,
(ni − ei )2
6
χ 23 = ∑
i =1
ei
= 4,57
118
73. Una empresa ubicada en Madrid tiene dos conductores para trasladar a los empleados a
Segovia. Los conductores deben anotar la duración de cada trayecto. En una muestra aleatoria
simple de 50 partes de incidencias por conductor, el conductor A registra un tiempo medio de
trayecto de 62,30 minutos con una desviación típica de 10,325 minutos, mientras que el
conductor B tiene un tiempo medio de trayecto de 60,02 minutos con una desviación típica de
8,625 minutos.
El tiempo medio empleado por el conductor A en el trayecto sigue una ley normal N(μ1 ,9) y el
empleado por el conductor B se distribuye según una ley N(μ 2 ,8) . Con un nivel de significación
del 5%, se pide contrastar:
a) H0 : μ 1 = μ 2 frente a H1 : μ 1 ≠ μ 2
b) H0 : μ1 − μ 2 ≥ 2 frente a H1 : μ 1 − μ 2 < 2
Solución:
a) Para realizar el contraste bilateral planteado ( H0 : μ 1 = μ 2 ) se recurre al test razón de
verosimilitud, ya que, en este caso el lema de Neyman‐Pearson no proporciona una región
crítica óptima.
La regla de decisión que proporciona el test de razón de verosimilitud es:
⎪⎧ x − y ≤ k se acepta H0 (R.A.)
Regla de decisión: ⎨
⎪⎩ x − y > k se rechaza H0 (R.C.)
⎛ σ ⎞ ⎛ σ ⎞
x ∼ N ⎜ μ1 , 1 ⎟ , y ∼ N ⎜ μ 2 , 2 ⎟
⎜ n1 ⎟⎠ ⎜ n2 ⎟
⎝ ⎝ ⎠
Con lo cual, la diferencia de medias muestrales, bajo la hipótesis nula, se distribuye:
⎡ σ 12 σ 22 ⎤ ⎡ 92 8 2 ⎤
( x − y ) ∼ N ⎢ 0 , + ⎥ ≡ N ⎢0 , + ⎥ = N⎡⎣ 0 , 1,7⎤⎦
⎢⎣ n1 n2 ⎥⎦ ⎣⎢ 50 50 ⎥⎦
El valor de k se determina a partir del nivel de significación α = 0,05
⎡ k−0 ⎤ ⎡⎛ k1 ⎞ ⎛ k2 ⎞ ⎤ ⎡ k1 ⎤ ⎡ k2 ⎤
= P⎢ z > ⎥ =P ⎢⎜z< ⎟∪ ⎜ z > ⎟⎥ = P ⎢ z > − ⎥ + P⎢z> ⎥ = 0,05
⎣ 1,7 ⎦ ⎢⎣ ⎝ 1,7 ⎠ ⎝ 1,7 ⎠ ⎦⎥ ⎣ 1,7 ⎦ ⎣ 1,7 ⎦
119
− k1 k2
por simetría: = 1,96 = z 0, 025 → k 1 = −3,33 = 1,96 = z 0, 025 → k 2 = 3,33
1,7 1,7
La región de aceptación: − 3, 33 ≤ x − y ≤ 3, 33
Se podía haber decidido con otros métodos:
• Se formulan las hipótesis: H0 : μ 1 − μ 2 = 0 H1 : μ 1 − μ 2 ≠ 0
Se trata de un contraste bilateral o de dos colas,
con α = 0,05
La región de aceptación se encuentra en el
intervalo (− zα/2 , zα /2 )
Se acepta la hipótesis nula cuando,
x−y 2,28
zαp /2 = ≤ zα /2 → − 1,96 ≤ zαp /2 = = 1,34 ≤ 1,96
σ 2
σ 2 1,7
+
1 2
n1 n2
Se acepta que los dos conductores emplean en promedio el mismo tiempo en el trayecto
Madrid‐Segovia.
• El intervalo de confianza para la diferencia de medias de dos distribuciones normales con
varianza poblacionales σ 12 y σ 22 conocidas
⎡ σ 12 σ 22 ⎤
I1−α (μ1 − μ 2 ) = ⎢(x − y) ± zα /2 + ⎥
⎢⎣ n1 n2 ⎥⎦
Como el intervalo cubre el cero no existe diferencia significativa entre el tiempo empleado por
los dos conductores en el trayecto Madrid‐Segovia.
120
b) La hipótesis nula planteada es H0 : μ1 − μ 2 − 2 ≥ 0 . Adviértase que se trata de un contraste
unilateral con cola a la izquierda (H1 : μ1 − μ 2 − 2 < 0)
La regla de decisión que proporciona el test de razón de verosimilitud:
⎧ x − y − 2 ≥ k se acepta H0 (R.A.)
Regla de decisión: ⎨
⎩ x − y − 2 < k se rechaza H0 (R.C.)
La región de aceptación se encuentra en el intervalo
(− zα , ∞)
x − y −k
Se acepta la hipótesis nula cuando zαp = ≥ − zα
σ 21 σ 22
+
n1 n2
⎧⎪ σ 12 σ 22 ⎫⎪
O bien, la región de aceptación sería: R.A = ⎨ (x − y − k) > − z α + ⎬
⎪⎩ n1 n2 ⎭⎪
62, 30 − 60,02 − 2
En este caso, zαp = = 0,164 ≥ −1,645
92 8 2
+
50 50
⎧⎪ 9 2 8 2 ⎫⎪
R.A = ⎨ (62, 30 − 60,02 − 2) > − 1,645 + ⎬ = ( 0,28 > − 2,80 )
⎪⎩ 50 50 ⎪⎭
Se acepta la hipótesis nula formulada.
121
74. La directora del departamento de personal de una corporación está buscando empleados
para un puesto en el extranjero Durante el proceso de selección, la administración le pregunta
cómo va la incorporación de empleados, y ella contesta que sigue una ley normal y que la
puntuación promedio en la prueba de aptitudes será de 90 puntos.
Cuando la administración revisa 19 de los resultados de la prueba, encuentra que la puntuación
media es de 83,25 puntos con una desviación estándar de 11.
Con un nivel de confianza del 90%, ¿lleva razón la directora?. Calcula su p‐valor.
Solución:
Se supone que la población de resultados de todos los candidatos sigue una distribución
X ∼ N(μ, σ ) , siendo ambos parámetros desconocidos..
En el muestreo de la población normal con varianza desconocida, con muestras pequeñas
x −μ
n = 11 < 30 , la media muestral x ∼ t10 , donde tn−1 =
sx / n
Se establecen las hipótesis: H0 : μ = 90 H1 : μ ≠ 90
El valor crítico k se calcula con el nivel de significación α = 0,10
⎡ x − 90 k 1 − 90 ⎤ ⎡ k − 90 ⎤ ⎡ k − 90 ⎤
P(x < k 1 ) = P ⎢ < ⎥ = P ⎢ t18 < 1 ⎥ = P ⎢ t18 > − 1 = 0,05
⎣ 2,524 2,524 ⎦ ⎣ 2,524 ⎦ ⎣ 2,524 ⎥⎦
122
k 1 − 90
− = 1,734 → k 1 = 85,62
2,524
⎡ x − 90 k 2 − 90 ⎤ ⎡ k − 90 ⎤ k − 90
P(x < k 1 ) = P ⎢ > ⎥ = P ⎢ t18 > 2 ⎥ = 0,05 2 = 1,734 → k 2 = 94,37
⎣ 2,524 2,524 ⎦ ⎣ 2,524 ⎦ 2,524
⎡ x − 90 83,25 − 90 ⎤
αp = P ⎣⎡ x > 83,25 t18 (90 ; 2,524)⎦⎤ = P ⎢ > = P ⎡⎣ t18 > −2,6774 ⎤⎦ =
⎣ 2,524 2,524 ⎥⎦
= P ⎡⎣ t18 > 2,6774 ⎤⎦ = P [ t18 < − 2,6774 ] + P [ t18 > 2,6774 ] = 2P [ t18 > 2,6774 ] = 2(0,008) = 0,016
123
75. La tabla refleja el número de accidentes mortales de tráfico que se producen en una
carretera a lo largo de un período de tiempo.
Accidentes mortales por día 0 1 2 3 4 5
Número de días 132 195 120 60 24 9
¿Se ajustan los datos a una distribución de Poisson?. Utilizar un nivel de significación 0,05
Solución:
La hipótesis nula se acepta a un nivel de significación α sí
k
(n i − ei )2 k
∑ ∑
n2i
χ 2
k−p−1 = = −n < χ 2α ; k − p − 1
i=1
ei i=1
ei
estadístico teórico
estadístico contraste
k ≡ Número intervalos p ≡ Número parámetros a estimar
La distribución de Poisson se caracteriza porque sólo depende del parámetro λ que coincide
con la media.
Sea la variable aleatoria X = Número de accidentes mortales por día y ni ≡ Número de días
xi ni x i ni P(x i = k ) = pi
0 132 0 0,2465
x =λ =
∑ x n = 756 = 1, 4
i i
n 540
1 195 195 0,3451
5 9 45 0,0110
n = 540 756
Las probabilidades con que llegan las partículas k = 0 , , 5 se obtienen sustituyendo los
1, 4k −1,4
valores de k en P(x i = k) = e
k!
124
Para verificar si el ajuste de los datos a una distribución de Poisson se acepta o no, mediante una
χ 2 , hay que calcular las frecuencias esperadas (ei = n . pi )
xi 0 1 2 3 4 5
Dando lugar a una tabla de contingencia 1 x 6, no teniendo que agrupar columnas contiguas al
no aparecer frecuencias esperadas menor que cinco.
Los grados de libertad son cuatro: k − p − 1 = 6 − 1 − 1 = 4
6 6
(ni − ei )2
∑ ∑
n2i
Estadístico de contraste: χ = 2
3 = −n=
i=1
ei i=1
ei
2 2
132 195 1202 602 242 92
= + + + + + − 540 = 5, 41
133,1 186,3 130, 4 60,8 21,3 5,9
125
76. Se sabe que las peras siguen una distribución N(θ, 1) . En una muestra de peras, con peso
medio de 300 gramos, se realizó un contraste con un nivel de significación del 5% y una potencia
de 0,6443, en donde la hipótesis nula era de H0 : θ = 0, 4 kg frente a la hipótesis alternativa de
H1 : θ = 0,3 kg. Se desea saber:
a) ¿Cuál es el tamaño de la muestra?
b) Hallar la hipótesis aceptada.
Solución:
1 − 21 (x n − θ )2 ⎡ 1 ⎤ − 2 i∑
n 1
(x i − θ ) 2
1 − 21 (x 1 − θ )2 1 − 21 (x 2 − θ )2
L (x 1 , x 2 , , x n , θ) = e e e =⎢ ⎥ e =1
2π 2π 2π ⎣ 2π ⎦
⎡ 1 ⎤ − 2 i∑
n 1
(x i − 0, 4)2
1⎡ ⎤
=1
e n n
L (x 1 , x 2 , , x n , θ = 0, 4) ⎣⎢ 2π ⎦⎥ − ⎢ ∑ (x i − 0, 4)2 − ∑ (x i − 0, 3)2 ⎥
2 ⎢i = 1 ⎥
= = e ⎣ i=1 ⎦
=
,x n , θ = 0,3)
n
L(x 1 , x 2 , n −1
∑ (x i − 0, 3)2
⎡ 1 ⎤ 2 i=1
⎢ 2π ⎥ e
⎣ ⎦
1 ⎡⎢ ⎤ 1 ⎢⎡ ⎤
n n n n n
− ∑
2 ⎢i = 1
x 2i + 0, 16 n − 0, 8∑ ∑
xi − x 2i − 0, 09 n + 0,6 ∑ xi ⎥
⎥
−
2⎢
0, 7 n − 0, 2 ∑ xi ⎥
⎥
= e ⎣ i=1 i=1 i=1 ⎦
= e ⎣ i=1 ⎦
≤ k1
tomando logaritmos neperianos, resulta,
⎡ n ⎤
∑
1 ⎢ 0, 7 n − 0, 2
− xi ⎥
2 ⎢ ⎥ 1 ⎡ n ⎤ n
Lne ⎣ i=1 ⎦
≤ Ln k 1 → − ⎢ 0,7 n − 0,2 ∑ x i⎥ ≤ Ln k 1 ⇒ 0,7 n − 0,2 ∑ x i ≤ − 2 Ln k 1
2 ⎣ i=1 ⎦ i=1
n
∑ xi
n n 0,7 n + 2 Ln k1 i=1 0,7 n + 2 Ln k1
− 0,2 ∑ x i ≤ − 0,7 n − 2 Ln k 1 → ∑ xi ≤ → x= ≤
i=1 i=1 0,2 n 0,2 n
La forma de la mejor región crítica es: x ≤ k
⎛ 1 ⎞
Ahora bien, la hipótesis nula H0 : θ = 0, 4 es cierta si x ∼ N ⎜ 0, 4 , ⎟ . Con un nivel de
⎜ n ⎟
⎝ ⎠
significación del 5%, se tiene:
126
⎡ x − 0,4 k − 0,4 ⎤ ⎡ k − 0,4 ⎤ k − 0,4
P ⎡⎣ x ≤ k H0 : θ = 0, 4 ⎤⎦ = P ⎢ ≤ ⎥ = P ⎢z ≤ ⎥ = 0,05 → = − 1,645
⎣ 1 n 1 n ⎦ ⎣ 1 n ⎦ 1 n
De otra parte, sabemos que la potencia del contraste es 0,6443.
⎛ 1 ⎞
Si se verifica la hipótesis alternativa H1 : θ = 0,3 se tiene que x ∼ N ⎜ 0,3 , ⎟
⎜ n ⎟⎠
⎝
⎧ −1,645
⎪⎪k − 0,4 = n 2,015
Resolviendo el sistema: ⎨ 0,1 = → n = 406 k = 0,3184
⎪ k − 0,3 = 0,37 n
⎪⎩ n
El tamaño de la muestra es de 406 peras.
127
77. Las especificaciones de un tipo de báscula aseguran que los errores en las pesadas siguen
una distribución normal con esperanza nula y varianza unidad. Se desea contrastar la afirmación
sobre la varianza frente a la hipótesis alternativa de que la varianza es 4. En este sentido, se
realizan cinco pesadas en las que el error cometido resultó ser:
1 0,9 − 0,2 1, 4 − 0,7
Para un nivel de significación del 5%, se pide:
a) Obtener la mejor región crítica.
b) Obtener la potencia del contraste.
c) Indicar qué hipótesis resultada aceptada.
Solución:
a) Sea la variable aleatoria X = ''error cometido en la báscula'' X ∼ N(0 , σ)
Se tiene la hipótesis nula H 0 : σ 2 = 1 frente a la hipótesis alternativa H 1 : σ 2 = 4
La función de verosimilitud para una muestra aleatoria simple de tamaño 5 es:
5
5
⎛ 1 x1 ⎞ ⎛ 1 − 2 x 25 ⎞ ⎛ 1 ⎞ − 2 σ2 i∑
1 2 1 1
− x 2i
2σ 2 2σ
L (x 1 , x 2 , ... , x 5 , σ ) = ⎜
2
e ⎟ ... ⎜ e ⎟ = ⎜ ⎟ e =1
⎜ σ 2π ⎟ ⎜ σ 2π ⎟ ⎜ σ 2π ⎟
⎝ ⎠ ⎝ ⎠ ⎝ ⎠
La región crítica óptima se obtiene aplicando el teorema de Neyman‐Pearson:
5
5
⎛ 1 ⎞ − 2 i∑
1
x 2i
⎜⎜ ⎟⎟ e =1
5 5 5
∑
3
,x 5 , σ 2 = 1) π − ∑ x 2i + ∑ x 2i
1 1 − x 2i
L (x 1 , x 2 , ⎝ 2 ⎠ 8
= =2 e = 2 e ≤ k1
5 2 i=1
8 i= 1 5 i=1
, x 5 , σ 2 = 4) ⎛
5
5
L (x 1 , x 2 , ⎞ −
1
∑ x 2i
1 2. 4 i=1
⎜⎜ ⎟⎟ e
⎝ 2 2π ⎠
5 5 k1
∑ x2i ∑ x2i Ln
3 3
− − 5 5
∑x ∑
8 8 k1 3 k1 32
25e i=1
≤ k1 → e i=1
≤ → − 2
≤ Ln → x 2i ≤
−3 / 8
i
32 8 i=1
32 i=1
Ln k 1 − Ln32 Ln k 1 − Ln32
5 5 5
∑i=1
x i2 ≤
−3 / 8
→ ∑
i=1
x 2i ≥
3/8
→ ∑x
i=1
2
i ≥k
La forma de la mejor región crítica es ∑x
i=1
2
i ≥k
El valor de k se obtiene apoyándonos en que el nivel de significación es del 5%:
128
⎡ 5 ⎤
P ⎢ ∑ x 2i ≥ k H0 : σ 2 = 1 ⎥ = 0,05
⎣ i=1 ⎦
∑x
i=1
2
i una variable aleatoria suma de cinco variables aleatorias independientes y con
distribución N(0 , 1)
5
En consecuencia, ∑x
i=1
2
i se distribuye como una χ 25 (Chi‐cuadrado con cinco grados de libertad).
En este sentido, observando en las tablas de Chi‐cuadrado:
5
⎡ 5 ⎤
P ⎢ ∑ x 2i ≥ k ⎥ = 0,05 ⇒ k = 11,07 . La región crítica es:
⎣ i=1 ⎦
∑x
i=1
2
i ≥ 11,07
En otras palabras, se aceptará la hipótesis nula cuando la suma de los cuadrados de las
observaciones muestrales sea menor que 11,07
b) La potencia del contraste es la probabilidad de rechazar la hipótesis nula cuando es cierta la
hipótesis alternativa, esto es:
⎡ 5 ⎤
Potencia = P ⎢
⎣⎢
∑
i=1
x 2i ≥ 11,07 H1 : σ 2 = 4 ⎥
⎦⎥
Si la hipótesis alternativa es cierta, la variable aleatoria X se distribuye según una normal
5 2
⎛ xi ⎞
N(0 , 2) , con lo que dividiendo cada x i por la desviación típica σ = 2 , se tiene que ∑ ⎜ ⎟ ∼ χ5
i=1 ⎝
2⎠
2
se distribuye según una χ 25 , en consecuencia:
⎡ 5 2 ⎤ ⎡ 5 ⎤ ⎡ 5
⎛ x i ⎞ 11,07 ⎤
2
Potencia = P ⎢ ∑ ⎢⎣ i = 1
x i ≥ 11,07 H 1 : σ 2 = 4 ⎥ = P ⎢
⎥⎦ ⎢⎣
∑
i=1
x ≥ 11,07 H 1 : σ = 4 ⎥ = P ⎢
2
i
2
⎥⎦ ⎢⎣
∑ ⎜ ⎟ ≥
i=1 ⎝
2⎠ 4 ⎥⎦
⎥=
c) El contraste se realiza hallando el ∑x
i=1
2
i de la muestra aleatoria simple, siendo:
∑x
i=1
2
i = 1 2 + 0,9 2 + (− 0,2) 2 + 1,4 2 + (− 0,7) 2 = 4,3 < 11,07 por lo que se acepta la hipótesis nula.
129
78. El precio de los productos vendidos por una empresa es una variable aleatoria con función
de densidad f(x) = θ x θ − 1 , donde 0 < x < 1 , θ > 0 , que depende del parámetro desconocido θ .
Se quiere contrastar sobre el valor de dicho parámetro la hipótesis nula H0 : θ = 1 frente a la
alternativa H1 : θ = 2 . Para ello, se toma una muestra aleatoria simple de tamaño dos.
Determinar el nivel de significación y la potencia del contraste, si se toma como región crítica
x 1 x 2 ≤ 0,6
Solución:
El nivel de significación α es la probabilidad de rechazar la hipótesis
nula siendo cierta: α = P(Rechazar H0 H0 Cierta) .
x 1 = 0,6 x2 = 1 x1 = 1 x 2 = 0, 6 x1
P ⎡⎣ x 1 x 2 ≤ 0,6 H0 : θ = 1 ⎤⎦ = ∫ x1 = 0 ∫ x2 = 0
1 dx 1 dx 2 + ∫ x 1 = 0,6 ∫ x2 = 0
1 dx 1 dx 2 =
0,6 1 0,6 1
= ∫ (x 2 )10 dx 1 + ∫ (x 2 )00, 6 dx 1 = ∫ 1 dx 1 + ∫ (0,6 x 1 ) dx 1 =
x1
0 0,6 0 0,6
= (x 1 )0,6
0 + ( lnx 1 ) 0,6 = 0,6 + 0,6 (Ln 1 − Ln 0,6) = 0,6 + 0,6(0 + 0,51) = 0,906
1
La probabilidad de rechazar la hipótesis nula siendo cierta es alta, lo que indica que el contraste
es malo.
x 1 = 0,6 x2 = 1 x1 = 1 x 2 = 0, 6 x 1
Pot = P ⎡⎣ x 1 x 2 ≤ 0,6 H0 : θ = 2 ⎤⎦ = ∫ x1 = 0 ∫ x2 = 0
2 x 1 2 x 2 dx 1 dx 2 + ∫ x 1 = 0,6 ∫ x2 = 0
2 x 1 2 x 2 dx 1 dx 2 =
0, 6 1 0, 6 1
= ∫ 0
4 x 1 (x 22 2) 10 dx 1 + ∫ 0, 6
4 x 1 (x 22 2) 0,0 6/x1 dx 1 = ∫ 0
2 x 1 dx 1 + ∫
0,6
2 (0,36 / x 1 ) dx 1 =
= (x 12 ) 0,6
0 + 0,72 (Ln x 1 ) 0,6 = 0,36 + 0,72 (Ln1 − Ln 0,6) = 0,36 + 0,72 (0 + 0,51) = 0,7272
1
La potencia del contraste no resulta excesivamente alta, el contraste no es bueno.
130
79. El volumen diario de ventas de una empresa, en cien mil euros, es una variable aleatoria X
sobre cuya función de densidad se establece la hipótesis nula H0 : f (x) = x 2 , 0 < x < 2 , frente a
la hipótesis alternativa H1 : f (x) = 1 2 , 0 < x < 2. Para realizar el contraste se toma una muestra
aleatoria simple de dos días en los que los volúmenes de venta fueron de 50.000 euros y 100.000
euros. Con un nivel de significación del 5 por ciento, se pide:
a) Hallar la mejor región crítica.
b) Calcular la potencia del contraste.
c) Qué hipótesis se acepta.
Solución:
a) Para una muestra aleatoria simple de tamaño dos, la mejor
región crítica aplicando el teorema de Neyman‐Pearson, el
cociente de las funciones de verosimilitud es:
L (x 1 , x 2 , f (x) = x 2) x1 x2
= = x1 x2 ≤ k
L (x 1 , x 2 , f (x) = 1 2) 1 2 . 1 2
x1 = k 2 x2 = 2 x1x2 x 1 =2 x 2 = k x1 x1 x2
0,05 = P ⎡⎣ x 1 x 2 ≤ k H0 : f(x) = x 2 ⎤⎦ = ∫ x1 = 0 ∫ x2 = 0 4
dx 1 dx 2 + ∫ x 1 =k 2 ∫ x2 = 0 4
dx 1 dx 2 =
2 k x1
x1 = k 2 x 1 ⎛ x 22 ⎞ x1 = 2 x 1 ⎛ x 22 ⎞ k2 x1 2 k2
= ∫ x1 = 0
⎜ ⎟ dx 1 +
4 ⎝ 2 ⎠0 ∫ x1 = k 2
⎜ ⎟
4 ⎝ 2 ⎠0
dx 1 = ∫ 0 2
dx 1 + ∫ k2 8 x1
dx 1 =
1 k2 k2 k2 k2 ⎡ 1 ⎤ k
2
= (x 12 )0k 2 + (Ln x 1 ) k2 2 = + ⎡⎣Ln 2 − Ln (k 2) ⎤⎦ = + 2 Ln2 − Ln k ⎥⎦ 8 ⎡⎣ 1,8633 − Ln k ⎤⎦ →
=
4 8 16 8 8 ⎢⎣ 2
k2
→ ⎡ 1,8633 − Ln k ⎤⎦ = 0, 05 → k 2 ⎡⎣ 1, 8633 − Ln k ⎤⎦ = 0, 40 de donde k = 0,3733
8⎣
La regla de decisión es x 1 x 2 ≤ 0,3733
Es decir, se rechaza la hipótesis nula si durante los días el producto de los dos volúmenes de
ventas de la muestra es inferior a 37.330 euros.
x 1 = 0,3733/2 2 1 x1 =2 0, 3733 x 1 1
P = P ⎡⎣ x 1 x 2 ≤ 0,3733 H1 : f(x) = 1 2 ⎤⎦ = ∫ ∫ dx 1 dx 2 + ∫ ∫ dx 1 dx 2 =
x1 = 0 0 4 x 1 = 0,3733/2 0 4
131
1
0, 3733/2 2 1 1 0, 3733/2 0,3733 2 1
=
0 ∫ 4
(x 2 )20 dx 1 + ∫
0, 3733/2 4
(x 2 ) 0,0 3733/x1 dx 1 =
2 0 ∫
dx 1 +
4 0, 3733/2 x
1
∫
dx 1 =
c) En la muestra aleatoria simple, los volúmenes de ventas fueron de 50.000 y 100.000 euros,
en consecuencia x 1 = 0,5 y x 2 = 1 , por tanto, x 1 x 2 = 0,5
Como la región crítica es x 1 x 2 ≤ 0,3733 , se acepta la hipótesis nula.
80. La variable aleatoria X representa los gastos mensuales de una empresa, cuya función de
densidad es f (θ, x) = θ x θ − 1 con θ> 0 y 0 < x < 1 . Se realiza una m.a.s. de tamaño 3, y se
proponen tres estimadores:
x + 2 x + 3 x 23
2 2
x 3 − 2x 1 + 4 x 2
θˆ 1 = x θˆ 2 = θˆ 3 =
1 2
6 6
a) Calcule los sesgos.
b) Si la muestra que se obtiene es (0,7 , 0,1 , 0,3), calcule las estimaciones puntuales.
c) ¿Cuáles son las funciones estimadas para las estimaciones anteriores?
Solución:
• Sesgo del estimador θˆ 1 = x
⎡ x + x2 + x3 ⎤ 1 1
θˆ 1 = x → E(θˆ 1 ) = E ⎢ 1 ⎥ = E⎡⎣ x 1 + x 2 + x 3 ⎤⎦ = (3 μ) = μ media poblacional
⎣ 3 ⎦ 3 3
1
∞ 1 1 1 ⎡ θ x θ+ 1 ⎤ θ
∫ ∫ ∫ ∫
θ−1 θ
donde μ = x f (x, θ) dx = x f (x, θ) dx = x θx dx = θ x dx = ⎢ ⎥ =
−∞ 0 0 0
⎣ θ+1 ⎦0 θ+1
θ θ θ2
E(θˆ 1 ) = μ = ˆ ˆ ˆ
→ Sesgo θ1 = b(θ1 ) = E(θ1 ) − θ = −θ=−
θ+1 θ+1 θ+1
132
x 12 + 2 x 22 + 3 x 23
• Sesgo del estimador θˆ 2 =
6
⎡ x 12 + 2 x 22 + 3 x 23 ⎤ 1 ⎡ ⎤
1
E(θˆ 2 ) = E ⎢ ⎥ = ⎢ E(x 2
) + 2E(x 2
) + 3E(x 2 ⎥
) = (6 α 2 ) = α 2 (∗)
⎥⎦ 6 ⎢⎣ α2 ⎥ 6
1 2 3
⎢⎣ 6 α2 α2 ⎦
donde α2 es el momento de orden 2 respecto al origen.
1
∞ 1 1 1 ⎡ θ xθ + 2 ⎤ θ
∫ ∫ ∫ ∫
θ−1 θ+1
α2 = E(x ) = 2
x f (x, θ) dx =
2
x f (x, θ) dx =
2
x θx
2
dx = θx dx = ⎢ ⎥ =
−∞ 0 0 0
⎣ θ+2 ⎦0 θ+2
⎡ x 12 + 2 x 22 + 3 x 23 ⎤ 1 ⎡ ⎤ θ
ˆ
entonces, E(θ2 ) = E ⎢ ⎥= ⎢ 2 ⎥
E(x 1 ) + 2E(x 2 ) + 3E(x 3 ) = α 2 =
2 2
⎢⎣ 6 ⎥⎦ 6 ⎣⎢ α2 α2 α2 ⎦
⎥ θ+2
θ θ2 + θ
( )
Sesgo θˆ 2 = b(θˆ 2 ) = E θˆ 2 − θ =
θ+2
−θ=−
θ+2
x3 − 2 x1 + 4 x2
• Sesgo del estimador θˆ 3 =
6
⎡ x − 2x 1 + 4 x 2 ⎤ 1 1 1
E(θˆ 3 ) = E ⎢ 3 ⎥ = E ⎡⎣ x 3 − 2 x 1 + 4 x 2 ⎤⎦ = (3 μ) = μ
⎣ 6 ⎦ 6 6 2
1
∞ 1 1 1 ⎡ θ x θ+ 1 ⎤ θ
∫ ∫ ∫ ∫
θ−1 θ
μ= x f (x, θ) dx = x f (x, θ) dx = x θx dx = θ x dx = ⎢ ⎥ =
−∞ 0 0 0
⎣ θ+1 ⎦0 θ+1
ˆ ˆ ˆ 1⎛ θ ⎞ 2θ2 + θ
Sesgo θ3 = b(θ3 ) = E(θ3 ) − θ = ⎜ −θ=−
2 ⎝ θ + 1 ⎟⎠ 2(θ + 1)
c) Las funciones estimadas para las estimaciones anteriores son:
133
81. La variable aleatoria poblacional "renta de las familias" del municipio de Madrid se
distribuye siguiendo un modelo N(μ , σ 2 ) . Se extraen muestras aleatorias simples de tamaño 4.
Como estimadores del parámetro μ se proponen los siguientes:
x + 2 x2 + 3 x3 x − 4 x2
μˆ 1 = 1 μˆ 2 = 3 μˆ 3 = x Se pide:
6 −3
a) Comprobar si los estimadores son insesgados.
b) ¿Cuál es el más eficiente?
c) Si tuviera que escoger entre ellos, ¿cuál escogería?. Razone su respuesta a partir del Error
Cuadrático Medio.
Solución:
⎡ x + 2 x2 + 3 x3 ⎤ 1
E(μˆ 1 ) = E ⎢ 1 ⎥ = E⎡⎣ x 1 + 2 x 2 + 3 x 3 ⎤⎦ =
⎣ 6 ⎦ 6
1 1
= ⎡⎣ E(x 1 ) + 2E(x 2 ) + 3E(x 3 ) ⎤⎦ = ⎡⎣ 6 μ ⎤⎦ = μ
6 6
⎡ x − 4 x2 ⎤ 1 1 1
E(μˆ 2 ) = E ⎢ 1 ⎥ = − E⎡⎣ x 1 − 4 x 2 ⎤⎦ = − ⎡⎣ E(x 1 ) − 4E(x 2 ) ⎤⎦ = − ⎡⎣ − 3 μ ⎤⎦ = μ
⎣ −3 ⎦ 3 3 3
⎡ x + x2 + x3 + x 4 ⎤ 1
E(μˆ 3 ) = E ⎢ 1 ⎥ = E⎡⎣ x 1 + x 2 + x 3 + x 4 ⎤⎦ =
⎣ 4 ⎦ 4
1 1
= ⎡⎣ E(x 1 ) + E(x 2 ) + E(x 3 ) + E(x 4 ) ⎤⎦ = ⎡⎣ 4 μ ⎤⎦ = μ
4 4
Los tres estimadores son insesgados o centrados.
b) El estimador más eficiente es el que tenga menor varianza.
⎡ x + 2x 2 + 3 x 3 ⎤ 1
V ⎡⎣ μˆ 1 ⎤⎦ = V ⎢ 1 = V ⎡ x 1 + 2 x 2 + 3 x 3 ⎤⎦ =
⎣ 6 ⎥
⎦ 36 ⎣
1 1 14
= ⎡⎣ V(x 1 ) + 4 V(x 2 ) + 9V(x 3 ) ⎤⎦ = ⎡⎣ 14 σ 2 ⎤⎦ = σ 2 = 0,39 σ 2
36 36 36
⎡ x − 4 x2 ⎤ 1 1 1 17
V ⎡⎣ μˆ 2 ⎤⎦ = V ⎢ 1 ⎥ = V ⎡⎣ x 1 − 4 x 2 ⎤⎦ = ⎡⎣ V(x 1 ) + 16 V(x 2 ) ⎤⎦ = ⎣⎡ 17 σ 2 ⎦⎤ = σ 2 = 1,89 σ 2
⎣ −3 ⎦ 9 9 9 9
⎡ x + x2 + x3 + x 4 ⎤ 1
V ⎡⎣ μˆ 3 ⎤⎦ = V ⎢ 1 = V ⎡ x 1 + x 2 + x 3 + x 4 ⎤⎦ =
⎣ 4 ⎥
⎦ 16 ⎣
134
1 1 4 2
= ⎡⎣ V(x 1 ) + V(x 2 ) + V(x 3 ) + V(x 4 ) ⎤⎦ = ⎡ 4 σ 2 ⎦⎤ =
⎣ σ = 0,25 σ 2
16 16 16
El estimador μ̂ 3 es el más eficiente.
c) Se escoge el estimador que presente menor Error Cuadrático Medio (ECM)
( )
2
ECM(θˆ ) = E(θˆ − θ) 2 = V(θˆ ) + E(θˆ ) − θ ˆ = ⎡ E(θ)
donde sesgo b(θ) ˆ ‐ θ⎤
⎣ ⎦
Como los tres estimadores son insesgados (centrados), se elige el que presente menor varianza,
que coincidirá con el que tiene menor ECM, es decir, se elige el estimador μ̂ 3
82. La distribución del peso de las manzanas de una determinada cosecha sigue una distribución
normal, cuyo peso medio es desconocido y cuya desviación típica es 7 gramos. Se pide:
a) Analizar cuál de los estimadores μ̂1 y μ̂ 2 del peso medio es mejor respecto del sesgo y de la
eficiencia, para una muestra aleatoria simple de tamaño cinco.
5
∑X
i=1
i
Solución:
a) El peso de las manzanas sigue una distribución N(μ , 7)
Se calculan las esperanzas de los estimadores para analizar el sesgo de los estimadores
⎛1 5 ⎞ 1 ⎡
5 ⎤ 5
∑ ∑ ∑ E⎡⎣ X ⎤⎦ = 5 (5 μ) = μ
1 1
E(μˆ 1 ) = E ⎜ Xi ⎟ = E ⎢ Xi ⎥ =
⎜5 ⎟ 5 ⎣⎢ i = 1 ⎦⎥ 5
i
⎝ i=1 ⎠ i=1
b) Para analizar la eficiencia de los estimadores se calculan sus varianzas:
135
⎡1 5 ⎤ 1 ⎡
5 ⎤ 5
∑ ∑ ∑ V [ X ] = 25 (5 . 49) =
1 1 49
V(μˆ 1 ) = V ⎢ Xi ⎥ = V ⎢ Xi ⎥ = i
⎢⎣ 5 i= 1 ⎥⎦ 25 ⎢⎣ i = 1 ⎥⎦ 25 i=1
5
83. Una muestra aleatoria (x 1 , , x n ) de la población tiene como función de densidad
⎧ θ x θ − 1 si x∈ (0,1)
fθ (x) = ⎨ θ > 0
⎩ 0 en el resto
a) Hallar un estadístico suficiente.
b) Estimador de máxima verosimilitud de θ .
c) Estimador de θ por el método de los momentos.
Solución:
a) Un estimador θ̂ es suficiente cuando no da lugar a una pérdida de información. Es decir,
cuando la información basada en θ̂ es tan buena como la que hiciera uso de toda la muestra.
Para identificar un estadístico suficiente se utiliza el teorema de factorización, que dice que dada
una muestra aleatoria (x 1 , , x n ) de una población X con función de densidad fθ , una
condición necesaria y suficiente para que un estadístico θ̂ sea suficiente para θ es que se pueda
descomponer de la forma: fθ (x 1 , , x n ) = g ⎡⎣ θˆ (x 1 , , x n ), θ ⎤⎦ . h(x 1 , , xn )
Para encontrar un estadístico suficiente θ̂ hay que factorizar la función de verosimilitud de la
forma: L(θ) = g(θˆ , θ) . h(x ,1,x ) n
Por tanto,
En consecuencia, θˆ = x , , x es un estadístico suficiente.
1 n
136
b) Para encontrar el estimador de máxima verosimilitud de θ
L(θ) = θn (x x )θ− 1 ‐
1 n
n ϑ Ln L(θ) n n n
Ln L(θ) = n Ln θ + (θ − 1) ∑ Lnx i → = + ∑ Lnx i = 0 → θˆ = −
i=1 ϑθ θ i=1
n
∑ Lnx i
i=1
c) Se plantea la ecuación E(x) = x
1
1 1 1 ⎡ xθ + 1 ⎤ θ
∫ ∫ ∫
θ−1 θ
x = E(X) = x fθ (x)dx = x θx dx = θ x dx = θ ⎢ ⎥ =
0 0 0
⎣θ + 1⎦ 0 θ + 1
x
x (θ + 1) = θ → θˆ =
1− x
84. Una muestra aleatoria (x 1 , , x n ) de la población tiene como función de densidad
⎧⎪ e− x + θ si x > 0
fθ (x) = ⎨ Se pide:
⎪⎩ 0 en el resto
a) Hallar un estimador por el método de los momentos de θ .
b) Estudiar si el estimador encontrado en el apartado anterior es insesgado para estimar el
parámetro θ .
Solución:
integración por partes
∞ ∞
a) Se plantea la ecuación: x = E[ x ] = ∫ θ
x fθ (x)dx = ∫ θ
x e − x + θ dx = θ + 1 → θˆ = x − 1
b) Un estimador es insesgado o centrado cuando su valor probable coincide con el valor del
parámetro a estimar. Es decir, E(θˆ ) = θ
E(θˆ ) = E( x − 1) = E( x ) − 1 = ( θ + 1) − 1 = θ
Integración por partes:
⎛ 1+ x ⎞
∫ xu e ∫
−x + θ
dx = x (− e − x + θ ) − − e − x + θ dx = − x e − x + θ − e − x + θ = − (1 + x) e − x + θ = − e − θ ⎜ x ⎟
dv u v v du ⎝ e ⎠
∞
∞
⎛ 1+ x ⎞
∫ θ
x e − x + θ dx = − e − θ ⎜ x ⎟ = θ + 1
⎝ e ⎠θ
137
85. El coseno X del ángulo con el que se emiten los electrones en un proceso radioactivo es una
⎧(1 + θ x ) 2 −1 ≤ x ≤ 1 − 1 ≤ θ≤ 1
variable aleatoria con función de densidad fθ (x) = ⎨
⎩ 0 en el resto
Considando una muestra aleatoria (x 1 , , x n ) de esta variable aleatoria, se pide:
a) Obtener el estimador θ por el método de los momentos.
b) Calcular la varianza de este estimador y demostrar que es consistente.
Solución:
1
1 1+ θx ⎡ x2 θ x3 ⎤ θ
a) Se plantea la ecuación: x = E[ x ] = ∫ −1
x
2
dx = ⎢ +
⎣ 2 6
⎥ =
⎦ −1 3
⇒ θˆ = 3 x
V(X) 9
b) V(θˆ ) = V(3 x) = 9V(x) = 9 = V(x)
n n
1
⎡ x3 θ x 4 ⎤
2 2
1 1+ θx ⎡θ⎤ ⎡θ⎤ 3 − θ2
∫
2
V(x) = E(x ) − ⎡⎣E(x)⎤⎦ =
2
x2
dx − ⎢ ⎥ = ⎢ + ⎥ − =
−1 2 ⎣3⎦ ⎣6 8 ⎦ −1 ⎢⎣ 3 ⎥⎦ 9
9 9 ⎡ 3 − θ2 ⎤ 3 − θ2
de donde, V(θˆ ) = V(x) = ⎢ ⎥=
n n ⎣ 9 ⎦ n
lim E(θˆ ) = θ
n→∞
Para probar que θ̂ es consistente para estimar θ es suficiente probar
lim V(θˆ ) = 0
n→∞
⎛ θ⎞ θ
lim E(θˆ ) = lim E(3 x) = lim 3E(x) = 3E ⎜ ⎟ = 3 = θ
n→∞ n→∞ n→∞
⎝ 3⎠ 3
3 − θ2
lim V(θˆ ) = lim V(3 x) = lim =0
n→∞ n→∞ n→∞ n
Por tanto, queda probado que θ̂ es consistente para estimar θ
138
139
140