Está en la página 1de 3

Grado en Ingeniera Inform

atica
Grado en Matem
atica Computacional
(EI1012-MT1012)
ESTADISTICA Y OPTIMIZACION
1 ord. - Enero de 2013
(1). Nombre:
1. (10%) Se analiza los tamanos de ficheros (en MB) de dos carpetas A y B para comparar, y los datos
se procesan dando lugar a la tabla:
n
x
s
xmn x0.25 x
e
x0.75 xmax
A 64 1.7 0.32 0.74 1.47 1.67 1.92 2.46
B 90 9.75 0.59 8.4 9.38 9.73 10.14 11.1
Contesta justificando siempre el uso de los datos de la tabla:
(a) (20%) Que carpeta tiene ficheros generalmente mas grandes?
(b) (20%) Cual es el tamano total de la carpeta B?
(c) (20%) Que carpeta tiene ficheros de tamanos mas homogeneos?
(d) (20%) El 75% de los archivos de la carpeta B tiene un tamano superior o igual a... cuantos
MB?
(e) (20%) Cuales seran la media y desviacion tpica de los tamanos de todos los archivos (si los
unimos en una unica carpeta)?

2. (15%) Se comprueba la velocidad de descarga con varios archivos, obteniendo la muestra de la tabla:
Tamano (MB) 0.6 3.1 6.8 7.1 2.1 3.1
Tiempo (seg.) 0.8 6.3 9.9 18.6 5.6 3.9
Haz una prediccion del tiempo de descarga de un archivo de 5.4 MB y otro de 42.9 MB, valorando
justificadamente la calidad de cada prediccion, mediante una tecnica estadstica reconocida

3. (15%) Se supone que cierto antivirus califica comoinfectadoal 5% de los archivos que estan realmente
limpios de virus, y califica comolimpioal 13% de los archivos que estan realmente infectados de virus.
Suponiendo tambien que de todos los archivos que se escanean a la larga, el 19% estan infectados:
(a) (75%) Si el antivirus da alarma de infeccion sobre un archivo, calcula la probabilidad de que ese
archivo este realmente infectado.
(b) (25%) Calcula el porcentaje de efectividad del antivirus, como la probabilidad de acertar al escanear a un archivo cualquiera.

4. (10%) Se quiere comparar el comportamiento de dos variables aleatorias X e Y , que indican el numero
de fallos de dos alumnos en un examen, y cuyas funciones de probabilidad se expresan mediante las
tablas a continuacion:
X
0
1
2
3
4
fX (x) 0.1 0.1 0.23 0.4 0.17
Y
0
1
2
3
4
fY (y) 0.18 0.3 0.25 0.12 0.15
Calcula:

(a) (40%) El valor esperado del numero de fallos del alumno X.


(b) (30%) La varianza del numero de fallos del alumno Y .
(c) (30%) La probabilidad de cometer 2 o menos errores, para ambos alumnos.

5. (20%) En tu empresa dispones de unos cuantos dispositivos de cierto tipo, aparentemente identicos.
Pero cada dispositivo funciona correctamente con probabilidad 0.75 (y de manera independiente unos
de otros).
(a) (50%) Al entrar en el almacen ves que hay 7 de estos dispositivos. Cual es la probabilidad
exacta de poder realizar una tarea para la que se necesita disponer de al menos dos dispositivos
en funcionamiento correcto?
(b) (50%) Otra tarea distinta requiere utilizar 101 de estos dispositivos que funcionen correctamente.
Si ahora dispones de 153 dispositivos en la empresa, cual es la probabilidad exacta de poder
realizar esta nueva tarea? En caso negativo da una probabilidad aproximada justificando la razon.

6. (20%) Se desea estimar la resistencia media de un nuevo material. Para ello se someten piezas fabricadas
con dicho material a una fuerza creciente hasta la ruptura, y se anota dicha fuerza, obteniendose los
datos:
581 581.6 588.8 607.1 573.2 611.4 582.5 596.7 574.6 579
Si se puede asumir que los datos obtenidos siguen el modelo normal, y si se nos asegura que la varianza
del proceso es 144, calcula:
(a) (50%) Un intervalo de confianza al 99% para la resistencia media.
(b) (50%) El tamano de una nueva muestra que garantizara (si es posible) un error de estimacion
para la resistencia media inferior o igual al 1% de la varianza de la poblacion de resistencias.

7. (10%) Una revista publica que la distribucion de sistemas operativos en los ordenadores de sobremesa
del mundo es 53% de Windows, 27% de Linux y 20% de Mac. Para contrastar esos porcentajes, realizas
una pequena muestra en la que encuentras 6 usuarios de Windows, 17 de Linux y 7 de Mac.
Usando un nivel de significacion del 10%, justifica si tu muestra es compatible o incompatible con la
distribucion publicada en la revista.

Soluciones
1 (a) La carpeta B pues tiene mayor valor medio (tambien valdra usar la mediana).
(b) El tamano total entendido como suma de tamanos de ficheros equivale a n x = 877.5.
(c) La carpeta de ficheros mas homogeneos (por tamano) es la B por tener menor coeficiente de variacion
(0.0600249940999749 vs 0.187921693757277)
(d) Se trata de fijarse en el cuantil x0.25 = 9.38, ya que el 75% de los datos son mayores (pues el 25%
son menores).
(e) Usando las formulas de media y desviacion tpica, la media sera 6.40454545454545 y la desviacion
tpica sale 15.9848338842975.
2 La recta de regresion del tiempo sobre el tamano sale Tiempo = 0.514745098039218+2.11352941176471
Tamano. Por tanto las predicciones son, respectivamente, 10.8983137254902 y 90.1556666666667. La calidad de la primera prediccion se puede medir con el R2 = 0.791575247936059, que dado que esta relativamente
cerca del1, indicara una fiabilidad alta. La calidad de la segunda prediccion es baja (sin necesidad de mirar
el R2 , porque es un dato muy alejado de la muestra, y por tanto no es razonable suponer que la tendencia
de los datos se vaya a mantener hasta tan lejos.
3 (a) Usando la formula del teorema de Bayes sale 0.803206997084548.
(b) Se trata de sumar las probabilidades en las que coinciden el fichero y el escaneo, es decir 0.9348.
4 (a) Usando la formula, E(X) = 2.44,
(b) De igual modo, Var(Y ) = 1.6824.
(c) P (X 2) = 0.43 y P (Y 2) = 0.73.
5 (a) Se trata de calcular P (X 2) donde X representa el numero de dispositivos que funcionan. Por tanto
X Bin(n = 7, p = 0.75) y P (X 2) = 1 F (1) = 0.9987 (tablas o formula).
(b) Se trata de calcular P (X 101) donde X representa el numero de dispositivos que funcionan. Por
tanto X Bin(n = 153, p = 0.75) y P (X 101) = 1 F (100). Las tablas y formulas de la binomial son
insuficientes para resolver esto, y podemos aproximar el modelo binomial por el normal, ya que n es muy
2
grande. Entonces X aprox N( = |153
{z0.75}, = |153 0.75
{z 0.25}). Con este nuevo modelo tenemos
114.75

28.6875

100.5114.75
5.35607132140714

que: P (X 101) = 1 FBin (100) = 1 FN (100.5) = 1 FZ

= 1 FZ (2.66) = 0.9961.

6 (a) El intervalo de confianza que corresponde es el de la media para X normal y varianza 2 conocida
(pues la varianza del proceso NO es la varianza de la muestra, sino la del modelo que genera lo datos, o lo
que es lo mismo, la de la poblacion). En el intervalo aparece el cuantil z0.995 , que buscado en la tabla de la
normal tipificada puede corresponder a cualquier valor entre 2.57 y 2.58. Por eso, el intervalo final puede ser
desde
[587.59 9.75246430395928] = [577.837535696041; 597.342464303959]
hasta
[587.59 9.7904116358813] = [577.799588364119; 597.380411635881]
2
0.995
.
(b) Ahora se trata de encontrar n tal que z0.995 n 0.01 2 . Despejando se obtiene n z0.01
Segun se haya encontrado el cuantil, el resultado es desde n 458.673611111111 (por tanto n 459) hasta
n 462.25 (por tanto n 463).
7 Se trata de aplicar el contraste de hipotesis de bondad de ajuste (de Pearson), con la tabla de probabilidades
X
Win Lin Mac
X
Win Lin Mac
y la muestra
. El estadstico de contraste sale H =
Prob. 0.53 0.27 0.2
Frec.
6
17
7
16.1098299557419, y el cuantil de referencia para decidir es (22 )10.1 = 4.6052. Por tanto, como H >
(22 )10.1 la decision es que la muestra es incompatible con la distribucion publicada en la revista (rechazar
H0 ).