Está en la página 1de 51

Ejemplos de exmenes resueltos de estadstica/1

Ejemplos de exmenes resueltos de estadstica

Contenido
1.- Examen de recuperacin del primer parcial, junio 2011 .................................................................. 1
2.- Examen de recuperacin del segundo parcial, junio 2011 ............................................................... 6
3.- Examen de recuperacin del tercer parcial, junio 2011.................................................................. 10
4.- Tercer parcial de estadstica, mayo 2011........................................................................................ 14
5.- Segundo parcial de estadstica, abril 2011...................................................................................... 21
6.- Primer parcial de estadstica, marzo 2011 ...................................................................................... 25
7.- Examen de Mtodos Estadsticos Enero 2011 .............................................................................. 30
8- Examen de Mtodos Estadsticos I Julio 2011 .............................................................................. 42

1.- Examen de recuperacin del primer parcial, junio 2011

1.- Una empresa electrnica fabrica una placa base para un determinado tipo de ordenador. Se sabe que el
porcentaje de placas base defectuosas de toda la produccin es del 2%. El coste de fabricacin de cada placa
es de 100 y se vende cada una a 300. Si al instalar en el ordenador se detecta que no funciona bien, se debe
reemplazar por otra que seguro que no es defectuosa, pero cuyo coste de fabricacin es de 150. La empresa
puede realizar un test antes de venderla, pero este test, cuando la placa es correcta, falla en el 1% de los casos,
y cuando la placa realmente est mal, acierta en el 90% de los casos. Se pide:

a) Sabiendo que el test dice que una placa est bien, calcular la probabilidad de que dicha placa
realmente sea defectuosa. (0,75 puntos)
b) Calcular el porcentaje de veces que se equivoca el test. (0,75 puntos)
c) Si el test resulta positivo, se instala la placa tal y como est (aun pudiendo ser defectuosa). Si el test
resulta negativo, una reparacin de 10 asegura que la placa estar bien. Cul es el precio mximo
que debemos pagar por el test para que, en promedio, sea rentable?(2 puntos)
d) Si la placa base internamente consta de 10 componentes idnticas e independientes, que asumimos
que estn montados en serie, y un requisito es que la probabilidad de no fallo de la placa base es del
80%, cul debe ser la probabilidad de no fallo de cada componente? (0,75 puntos)

Solucin Cuestin 1:
Ejemplos de exmenes resueltos de estadstica/2

+ C1
0,99

0,01 - C2
0,98

C3
+
0,1
0,02 D

0,9 - C4
C3 0,020,1 0,002
a) P(D / ) 0,0021
C1 C3 0,980,99 0,020,1 0,9722

b) P(Error)=P(C2+C3)=0,980,01+0,020,1=0,0118. Es decir, el 1,18 % de las veces se equivoca el


test.

c) El beneficio es

+ C1 =0,9702 B1=300-100=200
0,99

0,01 - C2 =0,0098 B2=-100+300-10=190


0,98

C3 =0,002 B3=300-100-150=50
+
0,1
0,02 D

- C4 =0,018 B4=-100+300-10=190
0,9

El valor medio del beneficio es,

E(B) = 2000,9702+(190)0,0098+500,002+(190)0,018 = 199,442

Sin hacer el test, el rbol con los beneficios es,


Ejemplos de exmenes resueltos de estadstica/3

C B1=300-100=200

D B2=300-100-150=50

Y el valor medio del beneficio es,

E(B)=0,98200+0,0250=197

El precio mximo del test es 199,332-197=2,442 .

d)

Para que funcione el sistema deben funcionar todos los elementos, por lo que la probabilidad de
funcionamiento del sistema es,

P(S) P(C1 C2 C10 ) P(C1)P(C2 )P(C10 ) P(C)10 0,8

De donde P(C) 0,81/ 10 0,9779debe ser la de cada componente.

2.- El espesor, X, de una determinada pieza sigue una distribucin aleatoria , segn la siguiente funcin de
densidad,
15 x
f (x) si 5 x 15
50
f ( x ) 0 en otro caso
Sabiendo que la tolerancia del espesor es de 103 mm, se pide:

a) Calcular la proporcin de piezas defectuosas. (1 punto)


b) Por trmino medio, cunto vale el espesor de cada pieza? (0,5 puntos)
c) Calcular la varianza del espesor de la pieza. (0,75 puntos)
d) Calcular el valor de la media y el valor de la desviacin tpica del espesor medio de 5 piezas tomadas
al azar. (0.75 puntos)
e) Si la pieza es correcta, el beneficio es de 10 /unidad, pero si es mayor que la tolerancia superior se
tiene una prdida de 2(X-13) /unidad, y en caso de ser menor que la tolerancia inferior, la prdida
es de 2(7-X)/unidad. Calcular el beneficio medio que obtendramos al producir 5000 piezas. (1,5
puntos)

Solucin Cuestin 2:

a) La proporcin de piezas correctas es,


Ejemplos de exmenes resueltos de estadstica/4

13 13 13
15 x (15 x )2 22 82
1 p 7
f ( x )dx
7
50
dx
250

7

100 100
0,60

De donde la proporcin de defectuosas es del p=0,40.

b) La media de X es,

15 15 15
15 x 15 x2 15x 2 x3 15152 153 155 2 53
E( x )
5
x
50
dx ( x
5
50
50
)dx



502 150

5
100

150 100 150
8,333

c) La varianza es,

D2 ( X) E( X2 ) E( X)
2

15 15 15
15 x 15 x3 15x 3 x4 15153 154 1553 54
E( x 2 )
5
x2
50
dx ( x 2
5
50 50)dx



150 200

5
150

200 150 200
75

Y la varianza es,

D2 ( x) 75 8,332 5,611

d) Llamando a Y el espesor medio, ste es,

x1 x 2 x 3 x 4 x 5
y
5

La media de y es,
5E( x )
E( y ) E( x ) 8,333
5

Y la desviacin tpica es,

D 2 ( x1 ) D 2 ( x 2 ) D 2 ( x 3 ) D 2 ( x 4 ) D 2 ( x 5 ) 55,611
D( y ) 2
1,059
5 25

e) El valor medio del beneficio viene dado por,

15 x 15 x 15 x
7 13 15
E(B) 2(7 x ) dx 10 dx 2( x 13) dx 5,2 / pieza
5
50 7
50 13
50

3.- A partir del diagrama siguiente, que representa los datos de consumo elctrico mensual entre enero 2010 y
junio 2011, elija la respuesta correcta a las siguientes preguntas:
Ejemplos de exmenes resueltos de estadstica/5

Box-and-Whisker Plot

20 30 40 50 60 70
Consumo
1. El consumo medio ha sido: (0,25 puntos)
a. 49.4
b. 56.5
c. 43.5

2. El 75% de los meses se consumi: (0,25 puntos)


a. Menos de 56.5 .
b. Ms de 56.5 .
c. Entre 43.5 y 56.5 .

3. El consumo mnimo observado en estos 20 meses fue de: (0,25 puntos)


a. 20 .
b. 39 .
c. 42.5 .

4. La distribucin tiene una asimetra (0,25 puntos)


a. Positiva, porque el tercer cuartil es mayor que el primer cuartil.
b. Negativa, porque el tercer cuartil es mayor que el primer cuartil.
c. Se puede decir que la distribucin es simtrica.

5. El 50% de los meses se consumi: (0,25 puntos)


a. Ms de 56.5 .
b. Menos de 43.5 .
c. Entre 43.5 y 56.5 .
Ejemplos de exmenes resueltos de estadstica/6

2.- Examen de recuperacin del segundo parcial, junio 2011

1. En el envasado de una marca de frutos secos, por normativa uno de los parmetros a controlar es
el peso de cada paquete. Esta variable sigue una distribucin Normal de media 110 g y de
desviacin tpica 2 g.

a. Calcular la probabilidad de que un paquete pese ms de 113 g. (0,5 puntos)

Llamando X al peso por cada paquete y siguiendo esta una distribucin del tipo X~N(110,2), la
probabilidad pedida es:

b. De acuerdo a la normativa para el control del contenido efectivo de los productos alimenticios
envasados, un paquete de estas caractersticas se considera defectuoso si su contenido es
inferior al 95,5% del valor nominal, que en este caso coincide con la media. Calcular la
proporcin de paquetes defectuosos, es decir, que incumplen la normativa. (1 punto)

Los paquetes que incumplirn la normativa sern aquellos que su peso sea inferior a
=0,955 Es por ello que la probabilidad pedida ser:

c. Estos paquetes se envasan en cajas de 40 unidades. Si una caja contiene 3 o ms paquetes


defectuosos son retirados de la cadena de produccin. Determinar el porcentaje de cajas que
se retiran de la cadena de envasado. (1 punto)

Se retiran aquellas caja con 3 o ms paquetes defectuosos, por lo que se define una nueva
variable Y que determina el nmero de defectuosos en cada caja. Esta nueva variable sigue una
distribucin del tipo Y~B( 40, 0,0067).
La probabilidad pedida ser:

d. Una cadena de supermercados hace un pedido de 200 cajas de dicho producto. Calcular la
probabilidad de que en el total del pedido haya ms de 10 paquetes que incumplan la
normativa. (1 punto)

Definimos una nueva variable T que sume el nmero de defectuosas que hay en las 200 cajas,
esto es:
, siendo Yi el nmero de paquetes defectuosos en la caja i, tal y como se
defini en el apartado anterior.
Esta nueva variable, por el Teorema Central del Lmite, tendr como distribucin
Ejemplos de exmenes resueltos de estadstica/7

T~ N(200400,0067, )=N(53,6, 7,3) por lo que la probabilidad pedida


es:

e. En el proceso de control de calidad, cuantas cajas por trmino medio han de controlarse
hasta encontrar la primera que sea defectuosa? (1 punto)

Sea S, el nmero de cajas a controlar antes de encontrar una defectuosa. Esta variable sigue una
distribucin de tipo S~BN(1, 0,00247), por lo que en trmino medio el nmero de cajas que tiene
que controlar hasta que parezca la primera defectuosa es:

cajas habr que controlar

2. La longitud de una pieza utilizada en un proceso de montaje sigue una distribucin normal de
media 50 mm y desviacin tpica 12 mm. Si extraemos una muestra aleatoria simple de 16 piezas.
Determinar:

a. Cul es la probabilidad de que su media sea menor de 58? (0,5 puntos)

La media muestral seguir una distribucin del tipo ~N(50, 12/16), por lo que la
probabilidad pedida es:

b. Entre qu valores se encontrar el 38% de las medias muestrales obtenidas al tomar


reiteradamente muestras de 16 piezas de ese lote? (1,5 puntos)

La probabilidad pedida es:

Asumiendo simetra para simplificar

c. Qu tamao tendra que tener la muestra para que la probabilidad de encontrar medias
superiores a 52 fuese 0,2578? (1,5 puntos)

El tamao de muestra n debe cumplir que:


Ejemplos de exmenes resueltos de estadstica/8

d. Calcular la probabilidad de que la varianza muestral sea mayor de 12,5? (1 punto)

La varianza muestral sigue una distribucin del tipo por lo que la probabilidad
pedida ser:

3. Una industria tiene como proveedores de componentes a cuatro empresas con las que lleva
trabajando mucho tiempo y no ha tenido nunca ningn problema.

Uno de dichos proveedores est realizando una poltica muy agresiva de precios asegurando
tambin unos estndares altos de calidad parejos al resto de sus competidores.

En aras de comprobarlo, si mantiene la misma calidad, y decidir si el departamento de compras


aumenta el suministro de dicho proveedor se realiza un anlisis estadstico con 200 componentes
de cada proveedor. Los resultados del ensayo se encuentran en la siguiente tabla indicndose el
nmero de componentes defectuosos y correctos de cada uno de ellos.

Componentes Componentes
Proveedor
Defectuosos Correctos
1 192 8
2 188 12
3 179 21
4 191 9

El estadstico obtenido para el test 2 correspondiente tiene como valor 8,96.

Seleccionar la respuesta adecuada a cada una de las cuestiones que se plantean justificando
adecuadamente la respuesta.

1. La hiptesis nula que se plantea en el test 2 a desarrollar es: (0.25 puntos)


a. Todos los proveedores tienen igual proporcin de piezas defectuosas.
b. Hay al menos un proveedor que tiene diferente proporcin de piezas defectuosas.
c. El nmero de componentes defectuosos es independiente del nmero de componentes
correctos.
d. El nmero de componentes defectuosos es dependiente del proveedor.
Ejemplos de exmenes resueltos de estadstica/9

2. Si la hiptesis nula es cierta el estadstico sigue una distribucin 2 con: (0.25 puntos)
a. 8 grados de libertad.
b. 7 grados de libertad.
c. 4 grados de libertad.
d. 3 grados de libertad.

3. El valor del p-value para el estadstico obtenido a partir de la frecuencias observadas y


esperadas es: (0.25 puntos)
a. 0,0313 (mediante interpolacin). El valor exacto es inferior (0,0298)
b. 0,0476
c. 0,0251
d. 0,0036

4. La conclusin que se obtiene tras realizar el test es: (0.25 puntos)


a. No se puede rechazar la Hiptesis Nula con un nivel de significacin de 5%
b. No se puede rechazar la Hiptesis Nula con un nivel de significacin de 1%
c. Se rechaza la Hiptesis Nula con un nivel de significacin del 1%.
d. Se acepta la Hiptesis Nula con un nivel de significacin del 5%.
Ejemplos de exmenes resueltos de estadstica/10

3.- Examen de recuperacin del tercer parcial, junio 2011

1.- De forma habitual, el 10% de los envos de una empresa de distribucin presentan alguna
incidencia como retrasos, errores, etc. Despus de la incorporacin de varios conductores inexpertos
y a lo largo de una semana se controlan 50 envos registrndose incidencias en 6 de ellos.

a) Con un nivel de significacin del 5% hay evidencias significativas de un empeoramiento en


la proporcin de envos con incidencias? (1,5 puntos)
b) Cul sera el valor de del test anterior si la proporcin de envos con incidencias hubiese
aumentado a un 15%? (1,5 puntos)
c) Cuntos envos deberamos controlar para estimar la proporcin real de envos con
incidencias con un error absoluto menor del 4% y un nivel de confianza del 80%? (0,5
puntos).
d) Calcular un intervalo de confianza al 99% para la proporcin poblacional P de envos con
incidencias despus de la incorporacin de los nuevos conductores.(0,50 puntos)

Resolucin

a) Las hiptesis a contrastar son: H0:P=P0= 0,10 H1:P>0,10 ya que de acuerdo con el
enunciado el cambio podra suponer un empeoramiento respecto al funcionamiento habitual,
es decir, una proporcin mayor que la habitual

La regin de aceptacin para este test es


P0 (1 P0 )
Aceptar si p P0 z
n
0,10 . 0,90
Como p=6/50=0,12 < 0,10 1,645 0,169
50
Podemos aceptar H0 y concluir que no ha habido un incremento significativo de
la proporcin de envos con incidencias

b) =P(Aceptar H0/ H1)=P(p<0,169/P=0,15)=P(N(0,15 0,15 . 0,85/50)<0,169)=


0,169 0,15
P(N(0,15 0,05)<0,169)= ( ) (0,38) 0,6480
0,05

c) El nmero de envos a controlar, considerando como proporcin habitual 0,10 es


z2 / 2 p (1 p ) 1,2852 . 0,10. 0,90
n0 92,77 93 envios
e2 0,042
Si tomamos como estimacin previa de P el valor muestral 0,12 sale 108,98 109
Envos.

d) El intervalo de confianza es
p (1 p ) 012 .088
p z / 2 012 2,57 (00019; 02381)
n 50
Ejemplos de exmenes resueltos de estadstica/11

2.- El nmero de llamadas diarias realizadas con el mvil por las alumnas de 1 de GITI podemos
admitir que es una variable de Poisson de media 2,5 llamadas/da y el de las llamadas realizadas
por los chicos tiene una distribucin de Poisson de promedio 1,5 llamadas/da.
Al entrar al examen todos dejan su mvil en la mesa del profesor. Elegido uno de los mviles
al azar, queremos verificar la hiptesis nula de que pertenece a una chica frente a la alternativa de
que es de un chico.
Como regla de decisin adoptamos la siguiente: Si el telfono tiene registradas tres llamadas o
ms a lo largo del da anterior, lo asignamos a una chica y si tiene registradas dos o menos
llamadas decimos que es de un chico.

a) Plantear estadsticamente las hiptesis a contrastar y las regiones de aceptacin y rechazo


propuestas en el enunciado. (1 punto)
b) Calcular el riesgo de primera especie de la prueba. Interpretar la respuesta.
(1,5 puntos).
c) Calcular el riesgo de segunda especie de la prueba. Interpretar la respuesta.
(1,5 puntos).

Solucin

a) Las hiptesis a contrastar son:

H0: =2,5 (pertenece a una chica)


H1: =1,5 (pertenece a un chico)

Las regiones de aceptacin y rechazo son:

Aceptar H0 si X 3
Rechazar H0 si X 2 Siendo X=Ps()

b) =P(Rechazar H0/ H0)= P(X 2/=2,5)=P( Ps (2,5)2)=0,5438 (El 54,38% de los telfonos
de las chicas seran asignados a los chicos con el test propuesto)

c) =P(Aceptar H0/ H1)=P(X3/=1,5)=P(Ps(1,5)3)=1-P(Ps(1,5)2)=


1-0,8088=0,1912 (El 19,12 % de los telfonos de los chicos seran asignados a las chicas
con el test propuesto)

PRCTICAS

1.- Se ha recogido la valoracin de un lder poltico en dos ciudades distintas 1 y 2 (Factor


A), dividida cada una en tres barrios segn su nivel adquisitivo (Alto, Medio y Bajo) (Factor
B). Parece que el mtodo ms indicado para ver si existe influencia de estos dos factores
sobre dicha valoracin es un Anlisis de la Varianza:
a) Los resultados obtenidos con el Statgraphics han sido estos qu conclusiones
obtenemos? (0,50 puntos)
--------------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
--------------------------------------------------------------------------------
Ejemplos de exmenes resueltos de estadstica/12

MAIN EFFECTS
A:Ciudad 60,8444 1 60,8444 21,37 0,0000
B:Nivel 84,6889 2 42,3444 14,87 0,0000

INTERACTIONS
AB 29,4889 2 14,7444 5,18 0,0076

RESIDUAL 239,2 84 2,84762


--------------------------------------------------------------------------------
TOTAL (CORRECTED) 414,222 89
--------------------------------------------------------------------------------

b) A la vista de las grficas siguientes y, teniendo en cuenta las conclusiones obtenidas en


el apartado anterior, determinar cul es la ciudad en la que se tiene una valoracin ms
alta del lder poltico y qu nivel adquisitivo tienen, justificando en qu grficas has
obtenido dichas conclusiones y porqu.(0,50 puntos)

Means and 95,0 Percent LSD Intervals


6,8
Valoracin

5,8

4,8

3,8

2,8
A B M

Nivel

Means and 95,0 Percent LSD Intervals


5,8

5,3
Valoracin

4,8

4,3

3,8

3,3
1 2

Ciudad
Ejemplos de exmenes resueltos de estadstica/13

Interaction Plot
7,1 Nivel
A
B
Valoracin

6,1
M

5,1

4,1

3,1
1 2
Ciudad

Soluciones

a) Los dos factores y la interaccin son significativas (p-valor<005), lo que implica que las
ciudades y los distintos niveles adquisitivos valoran al poltico de diferente manera.
La interaccin significara que los distintos niveles no valoran igual en las dos ciudades.

b) Dado que la interaccin es significativa no podemos mirar en los intervalos LSD ya que
nos dan los valores del factor sin tener en cuenta la relacin con la otra variable.
Si miramos en la grfica Interaction Plot vemos que la valoracin ms alta es en la ciudad
1 con nivel adquisitivo Alto y Medio, que tienen idntica valoracin.
Si hubiramos mirado en los LSD (que no es lo correcto aunque en este caso difieren
poco) slo es la ciudad 1 con nivel alto.

2.- La relacin que existe entre la potencia de un coche (horsepower) y su consumo (mpg)
y su pas de procedencia se ha estudiado a travs de un modelo de regresin como el que
se ve en la siguiente salida del statgraphics:

-----------------------------------------------------------------------------
Dependent variable: horsepower
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT 161,85 6,75849 23,9477 0,0000
mpg -2,56657 0,196964 -13,0306 0,0000
Pais 1,43398 2,909 0,492947 0,6228
-----------------------------------------------------------------------------

Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 55446,7 2 27723,3 121,33 0,0000
Residual 33589,4 147 228,499
Ejemplos de exmenes resueltos de estadstica/14

-----------------------------------------------------------------------------
Total (Corr.) 89036,1 149

R-squared = 62,2744 percent


R-squared (adjusted for d.f.) = 61,7611 percent
Standard Error of Est. = 15,1162
Mean absolute error = 11,615
Durbin-Watson statistic = 1,46866 (P=0,0005)
Lag 1 residual autocorrelation = 0,26547

1) De qu trminos depende de forma significativa para un valor de =0,05 la variable


dependiente? Justifica la respuesta (0,50 puntos)
a) Contante, mpg, pas
x b) Constante, mpg porque sus P-valores son menores q ue 0,05
c) Pas
d) La dependencia nos la da la R-squared.

2) Cunto vale el coeficiente de determinacin? (0,50 puntos)

a) Lo obtenemos de la tabla del anlisis de la varianza y nos lo da el p-value indicndonos


que como es menos que 005 el modelo es vlido.
b) Lo obtenemos de la tabla del anlisis de la varianza y se calcula como la raz cuadrada
de la SCE/SCT y vale 15,1162
x c) Lo obtenemos de la tabla del anlisis de la varianza y se calcula como la SCE/SCT por
100 y vale 62,2744%
d) Nos lo da la tabla del anlisis de la varianza y es el valor F-Ratio 121,33 que al ser tan
grande significa que el modelo es vlido.

4.- Tercer parcial de estadstica, mayo 2011

1. El tiempo que tarda en realizar la entrega de los paquetes a los clientes de la ciudad de Valencia
una empresa de mensajera ubicada en el polgono de la Fuente del Jarro es, de forma habitual,
una variable con distribucin N(m=35min, =10min). La semana pasada se incorporaron al
trabajo tres repartidores nuevos con poca experiencia, hecho que podra afectar a los tiempos de
entrega empeorndolos. Para hacer un control verificamos el tiempo de entrega de 4 paquetes
seleccionados aleatoriamente y obtenemos los siguientes valores expresados en minutos (40; 15;
42; 70).

a) Con un nivel de significacin del 5% Hay evidencias significativas de un empeoramiento del


tiempo medio de entrega? (1 punto)

b) Cul sera el valor de del test anterior si el tiempo medio de entrega hubiese aumentado a
45 minutos? (1 punto)
Ejemplos de exmenes resueltos de estadstica/15

c) Calcular un intervalo de confianza al 99% para la media del tiempo de entrega y otro al 95%
para la varianza de dicho tiempo de entrega (0,75 puntos)

d) Cuntos envos deberamos controlar para estimar la media real del nuevo tiempo de espera
con error absoluto menor de 2 minutos y un nivel de confianza del 80%? (0,75 puntos)

SOLUCIN:

e) Se trata de un test sobre la media m de una poblacin normal


Es un test unilateral porque el cambio solo es previsible que se d en un sentido (aumentar)
por lo tanto tenemos

H0: m=m0=35 minutos


H1: m>35

Dado que conocemos la desviacin tpica =10, la regla de decisin es

Aceptar H0 si x m0 z
n
10
Calculamos x 41,75 y 35 1,645 43,225
4
Como x 41,75 43,225 podemos aceptar la hiptesis nula y admitir que no ha
habido un aumento significativo del tiempo medio de reparto.

f) =P(Aceptar H0/ H1 cierta)=P( x 43,25 / m 45 )=P(N(45, /n)43,25)=


P(N(45, 10/4)43,25)= P(N(45, 5)43,25)=(43,25-45/5)=(-0,35)=0,3632

g) El intervalo de confianza para la media con varianza conocida es



x z / 2
n
y con nuestros datos
10
41,75 2,57
4

(41,75 12,85 ) (28,90 54,60)


El intervalo de confianza para la varianza poblacional es

(n 1) s 2 (n 1) s 2
2
n-1; /2 n-1;1-/2
2 2

3. 505583 3 .505583
2
2
3 0025 32 0975
Ejemplos de exmenes resueltos de estadstica/16

3. 505583 3 .505583
2
9384 0216
(16163; 7021944)

z
2 2
h) n / 2
1,285 . 10
41,28 42 entregas
e 2

2. Queremos estudiar si se mantiene la proporcin de circuitos integrados defectuosos que se


producen en un proceso de produccin. Lo habitual es que haya alrededor de un 0,5%. Para
comprobarlo, tomamos una muestra de 300 circuitos y si encontramos un circuito defectuoso o
ms decimos que la proporcin es superior a 0,5%.

a) Determinar, para este contraste de hiptesis, cunto vale la probabilidad de error de 1 especie
(1,25 puntos).
b) Si la proporcin de circuitos defectuosos del proceso fuera del 1% cunto valdra la
probabilidad de error de 2 especie? Qu significado tiene? (1,50 puntos)
c) Si al tomar la muestra de 300 circuitos nos sale uno defectuoso qu decisin tomamos? Qu
tipo de error podramos estar cometiendo? (0,75 puntos)

SOLUCIN:

H0(p=0005) vs H1(p>0005)

a)

b)

El 49% de las veces que apliquemos este test, aceptaremos que la proporcin de piezas
defectuosas es p=0005 cuando en realidad es 001 (por lo tanto nos estaremos equivocando)

c) Tal y como dice el enunciado, si nos sale X1, rechazamos la H0.


El nico tipo de error que podemos cometer es el de primera especie ya que hemos
RECHAZADO.

3. En una fbrica de botellas de plstico se quiere decidir qu producto resulta ms resistente. Para ello se
supone que tanto el tipo de plstico utilizado como materia prima, como el volumen de las botellas, pueden
afectar a dicha resistencia. Se estudiaron tres tipos de plstico, (A;B;C) y 4 volmenes diferentes (0,75; 1;
Ejemplos de exmenes resueltos de estadstica/17

1,25 y 1,5), midiendo la resistencia de 3 botellas elegidas al azar para cada posible combinacin de tipo de
plstico y volumen (se analizaron 36 botellas en total).

a) Completar la tabla del ANOVA de dos factores que result de dicho experimento (1 puntos):

Fuente SC Gl CM Fc
Plstico 2287,17 2 1143,585 42929
Volmen 1613,64 3 537,88 20191
Plstico x Volmen 2284,61 6 380,7683 14294
Residual 639,33 24 26639
Total 6824,75 35

b) En vista de la tabla anterior, qu se puede decir de la significacin de los efectos de los factores
estudiados? Qu significado tiene en este caso concreto de estudio la interaccin? Tomar = 0.05
(0,5 puntos)

Para el plstico: Tc=42929 > F tablas


F 0, 05
2, 24 340 P valor 0,05 Efecto significat ivo
Para el volumen: Tc=20191 > F tablas F30, 24
, 05
301 P valor 0,05 Efecto significat ivo
Para la interaccin:Tc=14294 > F tablas
F 0, 01
6, 24 2,51 P valor 0,05 Efecto significat ivo

El efecto significativo de la interaccin puede interpretarse como que el efecto del volumen no es el mismo en
los tres tipos de plastic

A partir del grfico de interaccin, qu combinacin de tipo de plstico y volumen da una botella ms
resistente? Si por motivos econmicos el nico tipo de plstico que se puede utilizar es el C, qu volumen de
botella da una mayor resistencia? (0,5 puntos)
Ejemplos de exmenes resueltos de estadstica/18

Grfico de interaccin
106 Plstico
A A
96 B
Resistencia

C
86
B
76

66
C
56
0,75 1 1,25 1,5
Volmen
Mejor combinacin (mayor resistencia) : Plstico A y Volumen 1,5 litros
Para el plstico C el volumen que ofrece mayor resistencia es de 1 litro
Ejemplos de exmenes resueltos de estadstica/19

4. Se estudia la relacin entre la composicin de un cemento tipo Portland y el calor desprendido durante la
fase de fraguado. Para ello se midi la cantidad de calor desprendido en caloras por gramos de cemento
junto con las variables que se pensaba podan tener influencia sobre el calor desprendido A, B y C que
representan el contenido en porcentaje de tres productos.

Los resultados se obtenidos se muestran a continuacin.

Anlisis de Regresin Mltiple


-----------------------------------------------------------------------------
Variable dependiente: Calor
-----------------------------------------------------------------------------
Error Estadstico
Parmetro Estimacin estndar T P-Valor
-----------------------------------------------------------------------------
CONSTANTE 48,1936 3,9133 12,3153 0,0000
A 1,69589 0,204582 8,28954 0,0000
B 0,656915 0,0442342 14,8508 0,0000
C 0,250018 0,184711 1,35356 0,2089
-----------------------------------------------------------------------------

Anlisis de Varianza
-----------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor
-----------------------------------------------------------------------------
Modelo 2667,65 3 889,217 166,34 0,0000
Residuo 48,1106 9 5,34562
-----------------------------------------------------------------------------
Total (Corr.) 2715,76 12

R-cuadrado = 98,2285 porcentaje


R-cuadrado (ajustado para g.l.) = 97,638 porcentaje
Error estndar de est. = 2,31206
Error absoluto medio = 1,57588
Estadstico de Durbin-Watson = 2,11016 (P=0,3638)
Autocorrelacin residual en Lag 1 = -0,116306

Anlisis de Regresin Mltiple


-----------------------------------------------------------------------------
Variable dependiente: Calor
-----------------------------------------------------------------------------
Error Estadstico
Parmetro Estimacin estndar T P-Valor
-----------------------------------------------------------------------------
CONSTANTE 52,5773 2,28617 22,998 0,0000
A 1,46831 0,121301 12,1047 0,0000
B 0,66225 0,0458547 14,4424 0,0000
-----------------------------------------------------------------------------

Anlisis de Varianza
-----------------------------------------------------------------------------
Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor
-----------------------------------------------------------------------------
Modelo 2657,86 2 1328,93 229,50 0,0000
Residuo 57,9045 10 5,79045
-----------------------------------------------------------------------------
Total (Corr.) 2715,76 12

R-cuadrado = 97,8678 porcentaje


R-cuadrado (ajustado para g.l.) = 97,4414 porcentaje
Error estndar de est. = 2,40634
Error absoluto medio = 1,90933
Estadstico de Durbin-Watson = 1,92164 (P=0,4717)
Autocorrelacin residual en Lag 1 = -0,054504
Ejemplos de exmenes resueltos de estadstica/20

A. El coeficiente de determinacin del modelo matemtico ms adecuado tiene un valor de:


(0,25 puntos)

a. 2,40634

b. 97,638

c. 2,31206

d. 97,4414 Cuando se comparan modelos se usa el R-cuadrado (ajustado para gl)

B. La ecuacin matemtica que se debera utilizar para predecir el valor del calor desprendido en la fase de
fraguado es: (0,25 puntos)

a. Calor=48,1936+0,656915B+1,69589A

b. Calor=52,5773+0,66225B+1,46831A (el coeficiente de C no es significativo)

c. Calor=48,1936+0,250018C+0,656915B+1,69589A

d. Ninguno de los anteriores

C. La estimacin del parmetro A representa: (0,25 puntos)

a. Decremento medio en el valor del calor por cada unidad que aumenta el parmetro A

b. Incremento medio en el valor del calor por cada unidad que aumenta el parmetro A
manteniendo constante el resto de variables independientes.

c. Incremento medio en el valor del calor por cada unidad que aumenta el parmetro A

d. Ninguna de los anteriores

D. Qu valor obtendramos del calor desprendido si A=11, B=56 y C=8 (0,25 puntos)

a. 103,63563

b. 105,81471 (sustituyndolas variables significativas en el modelo segundo que es el


apropiado)

c. 106,45871

d. 105,635774
Ejemplos de exmenes resueltos de estadstica/21

5.- Segundo parcial de estadstica, abril 2011

5. El director de una fbrica, un Graduado en Tecnologas Industriales, debe decidir el nmero de


operarios de una cierta seccin de la fbrica que va a contratar. Dichos operarios procesan
unidades de un cierto producto, que llegan a su seccin cada maana a primera hora. El nmero
de unidades de dicho producto que llega a la seccin cada da se distribuye segn una Poisson con
media 5. Cada operario puede procesar una y slo una unidad por da. Las unidades que no se
procesen se acumulan en un contenedor nico y sern eliminadas mediante el uso de una mquina
recicladora, lo que genera un coste igual a 1000 por da que se utilice (independientemente del
nmero de unidades que tenga que reciclar).

a) Cuntos operarios tendr que contratar como mnimo para asegurarse que, con una
probabilidad del 95%, todas las unidades que llegan en un da cualquiera sern procesadas?
(1.25 puntos)

b) Suponiendo que se dispone de 9 operarios, cul es la probabilidad de que se tenga que usar la
mquina recicladora ms de 5 veces en un ao? Cul ser, en promedio, el gasto de la fbrica
en la mquina recicladora por ao? (Suponer que la fbrica opera 300 das al ao). (1.25
puntos)

c) En promedio, cuntos das pasarn a partir de hoy hasta que la mquina recicladora tenga que
actuar por primera vez? Y por segunda vez? (0.5 puntos).

SOLUCIN

a) X=Ps(5)
Hay que buscar a/ P(Ps(5)a)0,95 segn baco P(Ps(5)9)=0,97 a=9 trabajadores

b) Segn los datos anteriores P(Ps(5)>9)=0,03 que es la probabilidad de que en un da


tengamos que utilizar la recicladora por uno o ms equipos reciclados

El nmero de das en 300 que se utiliza la recicladora X=B(n=300, P=0,03)=Ps(9)


P(X>5)=1-P(X5)=1-P(Ps(9)5)=1-0,12=0,88

El coste anual de la recicladora es Y=1000X y su valor medio


E(Y)=1000E(X)=1000 x 9 =9000 Euros/ao

c) Das hasta 1 vez X=Bn(r=1, P=0,03) E(X)=r/P= 1/0,03=33,33


Das hasta 2 vez X=Bn(r=2, P=0,03) E(X)=r/P= 2/0,03=66,66

6. Se sabe que el tiempo de vida de un determinado componente electrnico sigue una distribucin
exponencial de media 125 minutos. Se pide:

d) Probabilidad de que el componente dure ms de 3 horas. (0.5 puntos)


Ejemplos de exmenes resueltos de estadstica/22

e) Sabiendo que el componente estaba funcionando a las 3 horas, calcular la probabilidad de que
siga funcionando despus de 4 horas. (0.5 puntos)

f) Si colocamos 2 componentes en serie, cul es la probabilidad de que la vida del sistema


formado por estos dos componentes dure ms de 100 minutos? Considerar componentes
independientes. (1 punto)

g) Cuando falla un componente lo sustituimos por otro. Si al final hemos utilizado 50


componentes, cul es la probabilidad de que la suma de las vidas de los 50 componentes est
entre 100 horas y 110 horas? (1 punto)

SOLUCIN:

La vida del componente sigue una distribucin exponencial X EXP( 1/ 125 0,008)

a) La probabilidad de que dure ms de 3 horas es,

P( X 180) e180 e0,008180 e1,44 0,2369

b) Sabiendo que a los 180 minutos ya estaba funcionando, la probabilidad de que dure ms de
240 minutos es,

P( X 240 X 180) P( X 240) e 240


P( X 240 / X 180) e 60 e 0,00860 e 0,48 0,6188
P( X 180) P( X 180) e 180

c) Para el sistema en serie, para que la vida del sistema dure ms de 100 minutos se debe
cumplir que los dos componentes duren ms de 100 minutos, y como son componentes
independientes, la probabilidad es,

P( X 100) P( X1 100 X 2 100) P( X1 100)P( X 2 100) e 100 e 100 e 2100 e 20,008100


e 1,6 0,2019

d) De acuerdo con el teorema central del lmite, la suma de variables independientes y con la
misma distribucin sigue una normal de media la suma de las medias y varianza la suma de
varianzas. Esto es,

S X1 X2 ... X50
1
E(S) E( X1 X2 ... X50 ) E( X1 ) E( X2 ) ...E( X50 ) 50 50125 6250 minutos

1 1
D2 (S) D2 ( X1 X2 ... X50 ) D2 ( X1 ) D2 ( X2 ) ... D2 ( X50 ) 50 2 50 781250 minutos2
0,008 2

D(S) 883,88 minutos

La probabilidad que nos piden es,


Ejemplos de exmenes resueltos de estadstica/23

6600 6250 6000 6250


P(10060 S 11060) P(6000 S 6600)
883,88 883,88
0,396 ( 0,283) 0,6539 0,3886 0,2653

Una fbrica trabaja con dos mquinas A y B. El coste semanal, X A, de reparacin para la mquina A
se aproxima a una distribucin Normal con parmetros A=350 y A2=500. El coste semanal, XB, de
reparacin de la mquina B se aproxima a una distribucin normal con parmetros B=200 y
B2=400. Queremos estudiar el coste de las reparaciones de cada mquina y, para ello, tomamos una
muestra aleatoria de nA=5 facturas de reparaciones de la mquina A y otra de nB=4 de la mquina B
y calculamos las medias muestrales de los costes de reparacin. Si queremos comparar los costes de
las dos mquinas:

a) Determinar la distribucin de la diferencia de los costes medios muestrales. (1 punto)

b) Hallar la probabilidad de que la diferencia entre el coste medio muestral de A y el coste


medio muestral de B sea superior a 180 euros. (0.5 puntos)

c) Hallar la probabilidad de que al tomar las dos muestras de facturas, como se indica en el
enunciado, la cuasivarianza del coste de la mquina A sea superior a 114 veces la
cuasivarianza del coste de B? (1.5 puntos)

SOLUCIN:

a)

x A xB N A B , N (350 200, 500 400 )


A2 B2

nA nB
5 4
N (150, 200 ) N (150, 14,14)

b)

c)
S A2 / A2 B2
P( S A2 11,4S B2 ) P( S A2 / S B2 11,4) P( 11, 4 )
S B2 / B2 A2
400
P( F( n A 1), ( n B 1) 11,4 ) P( F4,3 9,12) 0,05
500
Ejemplos de exmenes resueltos de estadstica/24

7. Se ha realizado una encuesta con el objetivo de determinar si la edad de los conductores a partir
de los 21 aos influye sobre el nmero de accidentes (incluyendo todo tipo de accidentes) que han
tenido en los ltimos 2 aos. Los resultados de dicha encuesta se muestran en la Tabla 1.

Edad
Nmero accidentes 21-30 31-40 41-50 51-60 61-70 Total por Fila
0 748 821 786 720 672 3747
1 74 60 51 66 50 301
2 31 25 22 16 15 109
Total por Columna 853 906 859 802 737 4157
Tabla 1. Resultados de la encuesta realizada

Tras realizar un test 2, a los datos de la tabla anterior, se han obtenido los siguientes resultados
(considerar =0.05).

Prueba Estadstico Gl Valor-P


Chi-Cuadrado 12.662 0.12402
2x4=8

Seleccionar la respuesta adecuada a cada una de las cuestiones que se plantean justificando
adecuadamente la respuesta.

4. La hiptesis nula que se plantea en el test 2 desarrollado es: (0.25 puntos)


e. El nmero de accidentes es independiente de la edad del conductor.
f. El nmero de accidentes depende de la edad del conductor.
g. El nmero de accidentes presenta una distribucin binomial.
h. Ninguna de las anteriores.

5. Si la hiptesis nula es cierta el estadstico sigue una distribucin 2 con: (0.25 puntos)
a. 8 grados de libertad. (Filas-1 x Columnas -1)=2x4=8
b. 15 grados de libertad.
c. 5 grados de libertad.
d. 3 grados de libertad.

6. La frecuencia esperada correspondiente a nmero de accidentes=0 y edad del conductor =21-


30 aos es igual a: (0.25 puntos)
a. 768.87=3747x853/4157=768,87
b. 284.33
c. 748
d. Con los datos disponibles no podemos calcular las frecuencias esperadas.

7. La conclusin que se obtiene tras realizar el test es: (0.25 puntos)


a. No se puede rechazar la Hiptesis Nula puesto que el p-valor es mayor que el nivel de
significacin. (0,124>0,05)
b. Se rechaza la Hiptesis Nula puesto que el p-valor es menor que el nivel de
significacin.
Ejemplos de exmenes resueltos de estadstica/25

c. Se rechaza la Hiptesis Nula puesto que el p-valor es mayor que el nivel de


significacin.
d. No se rechaza la Hiptesis Nula puesto que el p-valor es menor que el nivel de
significacin.

6.- Primer parcial de estadstica, marzo 2011

1. Los componentes de un determinado producto estn dispuestos segn la figura de abajo, donde al lado de
cada elemento se indica la probabilidad de no fallo del mismo.
0,85 0,75

1 3
0,95

2 4

0,93 ?

a) Cul debe ser la probabilidad de no fallo del componente 4 para que en conjunto la probabilidad
de no fallo sea del 90%? (1.5 puntos)

SOLUCIN:

Llamando de R la probabilidad de no fallo de cada componente, la fiabilidad del sistema es,


Rsys (1 (1 R1)(1 R2 ))(1 (1 R3 )(1 R 4 ))R5

Sustituyendo valores,

0.90 (1 0.150.07)(1 0.25(1 R4 ))0.95

0.90 0.9895(1 0.25(1 R4 ))0.95

1 0.25(1 R 4 ) 0.9574
1 0.9574
(1 R 4 ) 0.1703
0.25
De donde la probabilidad de no fallo del componente 4 es R4 0.8297

2. Para comprobar si un motor elctrico es correcto o defectuoso el Departamento de Calidad aplica dos
pruebas independientes y sucesivas. La primera prueba tiene una probabilidad de acertar en el diagnstico del
90%, y la segunda prueba, cuando el motor es correcto acierta el 95% de los casos, pero cuando el motor es
defectuoso se equivoca en el 7% de las veces. Sabiendo que la proporcin de motores defectuosos es del 5%,
se pide:

a) Si una cualquiera de las pruebas, pero no ambas, dice que el motor es correcto, qu proporcin de casos
realmente ser correcto el motor? (1 punto)
b) Cul de las dos pruebas tiene mayor probabilidad de error? (1 punto)
Ejemplos de exmenes resueltos de estadstica/26

SOLUCIN:
a) El rbol de probabilidades es,

+ C1
0.95

+
0.05 - C2
0.90
+ C3
C 0.95
0.95 0.10 -
- C4
0.05
+ C5
+ 0 .0 7
0.10
0.93 - C6
0.05
D
+ C7
0.90 - 0.07

0.093 - C8
La probabilidad que nos piden es,
C2 C3 0.950.900.05 0.950.100.95
P(C / 1 )
C2 C3 C6 C7 0.950.900.05 0.950.100.95 0.050.100.93 0.050.900.07
0.0428 0.0903 0.1331
0.945
0.0428 0.0903 0.0047 0.0032 0.141
b) La probabilidad de error de la primera prueba es del 10%, y la de la segunda prueba, rbol de
probabilidades es,
+ C1
0.95

C
0.95 0.05 - C2

+ C3
0.07
0.05
D
0.93 - C4

La probabilidad de error viene dada por la suma de probabilidades de los caminos 2 y 3. Esto es,
P(Error ) C2 C3 0.950.05 0.050.07 0.051

Por lo que la prueba 1 es la de mayor probabilidad de error.


Ejemplos de exmenes resueltos de estadstica/27

3.- Sea una variable aleatoria X que representa el espesor, en milmetros, de las arandelas que produce una
mquina. Si la variable X tiene una funcin de densidad dada por:

2.5 x x (1.9 , 2.1),


f ( x)
0 caso contrario

Determinar:
a) La funcin de distribucin. (0.5 puntos)
b) La probabilidad de que una arandela tenga un espesor igual a 1.95 mm. (0.5 puntos)
c) P(1.95 < X < 2.05). (0.5 puntos)
d) El valor a tal que P(X < a) = 0.25 e interpretar el resultado. (0.5 puntos)
e) Sabiendo que la media de X es 2, calcular su varianza. (0.5 puntos)

SOLUCIN:

a)
0 x 1.9
x

F ( x) 2.5xdx 1.25x 2 4.51 x (1.9,2.1)
1.9
1 x 2.1

b) P(X=1.95)=0
2.1
c) P(1.95 X 2.05) 2.5 xdx 0.5
1.9
a

2.5xdx 0.25 1.25(a 1,9 2 ) 0.25 a=1.95


2
d)
1.9
2.1
e) E ( X ) [ E ( X )] x 2.5 xdx 2 2 4.01 4 0.01
2 2 2 2

1.9
4. En el almacn de un taller de fontanera hay tubos de cobre de 1.25 pulgadas de dimetro interior cortados a
diferentes longitudes y amontonados los trozos en un contenedor. Asumimos que la longitud de los tubos
cortados que se utilizan es una variable aleatoria cuya funcin de densidad es:

x / k x (0.40 , 2.20),
f ( x)
0 caso contrario
Supuestos:
I. Todos los tubos se compran a un proveedor pagando un coste de 3 /m

II. Los tubos se eligen del contenedor al azar para proceder a su montaje en la construccin de una
caldera de vapor

III. El coste de montaje de los tubos (preparacin, limpieza, soldadura, etc.) asciende a 10 /m de tubo
montado

IV. Al cliente se le cobra segn los metros montados a razn de 50 /m

V. Los tubos de longitud inferior a 0.50 m se desechan directamente y no se montan


Ejemplos de exmenes resueltos de estadstica/28

VI. Los tubos de longitud comprendida entre 0.5 y 2.00 m se montan enteros

VII. A los tubos con longitud mayor de 2.00 m, se les corta previamente el exceso sobre los 2.00 m que se
pierde y no se cobra. Los 2 m restantes se montan como en el apartado anterior

Calcular:
a) El valor medio de la longitud de los tubos del contenedor (1 punto)

b) El valor medio del beneficio por tubo del almacn (2 puntos)

SOLUCIN:

f(x)

0,40 2,2 X

a) Recordando que
2, 2
x 1
2, 2 1

x
f ( x)dx 1 tendremos dx x 2
0, 4 k
2 k 0, 4 2 k
(2,2 2 0,4 2 ) 1
despejando k=2,34
2, 2
2, 2 x 1 1
E ( X ) xf ( x)dx x dx x 3 (2,2 3 0,4 3 ) 1,5077
x
0, 4 k
3k 0, 4 3k
E ( Beneficio ) E ( B) B( x) f ( x)dx
b) x

B= (cobrado-pagado) en cada caso

B1 =0 -3x = -3x para (0,4 X 0,5)


B2 =50x-(3+10)x= 37x para (0,5 X 2.0)
B3 =(50 . 2)-(3x+2 . 10)= 80-3x para (2,0X 2,2)

0,5 x 2, 0 x 2, 2 x
E ( Beneficio ) E ( B) B( x) f ( x)dx (3x) dx 37 x dx (80 3x) dx
x
0, 4 2,34 0, 5 2,34 2, 0 2,34
Ejemplos de exmenes resueltos de estadstica/29

0,5 2, 0 2, 2
3 x3 37 x 3 1 80 x 2
x 3 0,0261 41,5064 13,2274 54,7077 euros / tubo
2,34 3 0, 4 2,3 3 0,5 2,34 2 2, 0

5. Una empresa decide realizar un estudio sobre el consumo de un determinado material, necesario para el
proceso de fabricacin que lleva a cabo, en funcin del da de la semana, en vistas a optimizar su stock
semanal del producto y la deteccin de posibles anomalas. Se han analizado un total de 57 das, de lunes a
viernes. Con estos datos de consumo se realiza el diagrama Box-Whisker mltiple que se muestra a
continuacin:

Grfico de Cajas y Bigotes

Lunes

Martes
DIA

Mircoles

Jueves

Viernes

0 100 200 300 400 500


CONSUMO

A la vista de los diagramas, responder a las siguientes preguntas justificando convenientemente las respuestas.

1. La mayor dispersin de consumo se produce: (0.25 puntos)


a. Los lunes
b. Los martes
c. Los mircoles
d. Todos tiene la misma dispersin ya que el consumo es independiente del da

Pues el rango intercuartlico es mayor.

2. La mayor asimetra se presenta: (0.25 puntos)


a. Los jueves y es positiva
b. Los martes y es negativa
c. Los martes y es positiva
d. Los jueves y es negativa

Pues ese da se da la mayor ditancia entre la mediana y la media, y media > mediana.

3. En trminos medios, los das de menor consumo son: (0.25 puntos)


a. Los mircoles
b. Los viernes
c. Los martes
Ejemplos de exmenes resueltos de estadstica/30

d. No se dispone de datos suficientes

Pues la media es la que est ms a la izquierda de todos los das.

4. Cul de las siguientes afirmaciones es cierta? (0.25 puntos)


a. El 75% de los lunes se consume por encima de 300
b. El 75% de los lunes se consume por debajo de 300
c. El 25% de los mircoles se consume por debajo de 260
d. El 25% de los mircoles se consume por encima de 180

El lmite derecho de la caja de los lunes, que corresponde al tercer cuartil, est en 300.

7.- Examen de Mtodos Estadsticos Enero 2011

BLOQUE I. CUESTIONES Y PROBLEMAS TIPO TEST (90 MINUTOS)


Todas las cuestiones deben ser debidamente justificadas. Aquellas cuestiones contestadas correctamente
pero no justificadas no sern puntuadas.

1.- La temperatura ambiente en el exterior de un edificio en invierno X (en grados centgrados) y la


potencia absorbida Y (en Kw), para mantener un local climatizado a una temperatura constante, se
comportan como una variable bidimensional con distribucin

10 9 cov xy
( X , Y ) N m ; V y = -0,8

5 cov xy 4

Calcular la probabilidad de que una maana en la que el termmetro marca 5 grados


centgrados la potencia absorbida sea superior a 6 Kw. (2 puntos)

SOLUCIN CUESTION 1:

La distribucin condicional de la potencia absorbida cuando la temperatura exterior es de 5C ser


y
(Y / x 5) N (my ( x0 mx ); y2 (1 2 ) )
=
x
3
(Y / x 5) N (5 0,8 (5 10); 4(1 (0,8)2 ) ) = (Y / x 5) N (7,667;1,2)
2
6 7,667
P((Y / x 5) 6) 1 ( P((Y / x 5) 6) 1 1 (1,39) 0,9177
1,2

2.- Una empresa de telefona mvil factura un 5% de llamadas de duracin superior a 10 minutos.
Ejemplos de exmenes resueltos de estadstica/31

a) Calcular la probabilidad de que en 15 llamadas elegidas al azar haya exactamente 1 con


duracin superior a 10 minutos (1 punto)
b) Cul es el promedio de llamadas que tendremos que verificar hasta encontrar 10 con
duracin inferior a 10 minutos? (1 punto)

SOLUCIN CUESTION 2:

a) El nmero de llamadas con duracin superior a 10 en una muestra de n=15 llamadas, si


sabemos que hay un 5% de llamadas con duracin superior a ese tiempo ser una variable
X=B(n=15; P=0,05)
15
La P( X 1) 0,051 (1 0,05)14 0,3658
1
b) El nmero de llamadas hasta obtener 10 con una duracin inferior a 10 ser una variable
X=BN(r=10;P=0,95)
y su valor medio E(X)=r/P=10/0,95=10,526

3.- Tres mquinas de una empresa producen una misma pieza. La mquina A tiene un 5% de
defectuosas, la mquina B un 1% y la mquina C un 3%. La mquina A produce 100 unidades por
hora, la B produce 50 unidades por hora y la C produce 150 unidades por hora. Todas las piezas van
a un almacn comn. Se pide:

a) Si de dicho almacn tomamos 3 piezas, cul es la probabilidad de que una de ellas sea
defectuosa? (1 punto)
b) Si tomamos una pieza al azar de dicho almacn, y resulta ser defectuosas, a qu mquina
asignaremos la produccin de dicha pieza defectuosa? Razonar la respuesta. (1 punto)

SOLUCIN CUESTION 3:

El rbol de probabilidad es,


C

A
0,05 De

100/300

50/300 C
B

0,01 De
150/300
C
C

0,03 De
Llamando a X= n de piezas defectuosas, esta variable sigue una distribucin B(n=3,p). La
Ejemplos de exmenes resueltos de estadstica/32

probabilidad de que una pieza del almacn sea defectuosa es,


100 50 150
p 0,05 0,01 0,03 0,033
300 300 300

a) La probabilidad de que una de las res piezas sea defectuosas es,


3
P( X 1) 0,033(1 0,033)2 0,093
1
b) Sabiendo que la pieza es defectuosas, las probabilidades de que sean de cada mquina son,
0,017 0,017
P( A / De) 0,5
0,017 0,0017 0,015 0,034
0,0017 0,0017
P(B / De) 0,05
0,017 0,0017 0,015 0,034
0,015 0,015
P( A / De) 0,441
0,017 0,0017 0,015 0,034

La mayor probabilidad corresponde a la mquina A, luego es ms probable que la pieza haya


sido producida por dicha mquina.

4.- La longitud de una determinada pieza es una variable aleatoria con funcin de densidad,

300 x
f ( x ) k para 100 mm x 200 mm
3
f ( x) 0 en otro caso

Consideramos que la pieza es correcta cuando su longitud est entre 105 mm y 190 mm. Se pide:
a) Calcular el porcentaje de piezas defectuosas. (1 punto)
b) Calcular la funcin de distribucin de la variable aleatoria longitud de la pieza. (0,5 puntos)
c) Si la longitud de la pieza es mayor de 190 la prdida que se produce es de 10, si la longitud
es menor de 105 mm la prdida es de 30x 2 , y si la pieza es correcta el beneficio es de
200x . Por trmino medio, cul ser el beneficio por cada pieza producida? (0,5 puntos)

SOLUCIN CUESTION 4:

La constante k la calculamos con la condicin de que la integral de la funcin de densidad para todo
su campo de existencia es igual a la unidad.

(300 x )

200
k dx 1
100 x
Integrando,
200
k - (300 x )2 k 200 2 100 2 k
30000 1
3 2 100 3 2 2 6
De donde k=0.0002
Ejemplos de exmenes resueltos de estadstica/33

a) La proporcin 1-p de piezas correctas es,

190 (300 x )
1 p 0,0002 dx 0,864
105 3
Y la proporcin de piezas defectuosas es p=1-0,864=0,136.

b) La funcin de distribucin para x entre 100 y 200 es,

x
X (300 x ) 0,0002 (300 x )2 0,0002
F( x ) 0,0002 dx [40000 (300 x )2 ]
100 3 3 2 100 6
F(x) = 0 para x<100
F(x)= 1 para x>200

c) El valor medio de cada pieza producida es,

(300 x ) (300 x ) (300 x )


105
190 200
E(B) ( 30x 2 )0,0002 dx 200x0,0002 dx ( 10)0,0002 dx
100
3 105 3 190 3
4060 / pieza

5.- En un proceso de fabricacin se dispone de dos mquinas. El peso de las piezas fabricadas por la
mquina A sigue una distribucin N (100; 2). El peso de las piezas fabricadas por la mquina B sigue
una distribucin N (102; 2). Se toma una muestra aleatoria de 5 piezas fabricadas por la mquina A y
se calcula la media muestral. A continuacin se toma otra muestra de 5 piezas de B y se calcula la
media muestral. Cul es la probabilidad de que la media muestral de A sea mayor que la de B? (2
puntos)

SOLUCIN CUESTION 5:

Solucin:
x A N (100; 2 5) x B N (102; 2 5)

E x A x B E x A E x B 100 102 2
x x x x (4 / 5) (4 / 5) 1,6
2
A B
2
A
2
B

P x x P x x 0 P N (2; 1,6 ) 0 2 /
A B A B
1,6 (1,58) 0,057
Ejemplos de exmenes resueltos de estadstica/34

BLOQUE II. PRCTICAS DE ORDENADOR (40 MINUTOS)


Todas las cuestiones deben ser debidamente justificadas. Aquellas cuestiones contestadas correctamente
pero no justificadas no sern puntuadas. Cada problema son 10 puntos. La nota del bloque es la media de
las notas de los dos problemas.

1.- Los alumnos de la asignatura de Mtodos Estadsticos han realizado en octubre un test de 4
ejercicios de probabilidad a travs de PoliformaT, cada uno de los cuales vale 0,08 puntos. En
noviembre han realizado un nuevo test de 4 ejercicios de distribuciones, cada uno de los cuales vale
0,08 puntos. Del total de 251 alumnos que han realizado ambos tests, en la siguiente tabla se
muestran las frecuencias de las puntuaciones obtenidas en el test de octubre (filas) en funcin de las
puntuaciones obtenidas en el test de noviembre (columnas).

Row
nov_0 nov_0,08 nov_0,16 nov_0,24 nov_0,32 Total
-------------------------------------------------------------
oct_0 | 1 | 1 | 0 | 3 | 3 | 8
| 12,50% | 12,50% | 0,00% | 37,50% | 37,50% | 3,19%
-------------------------------------------------------------
oct_0,08 | 1 | 1 | 14 | 9 | 5 | 30
| 3,33% | 3,33% | 46,67% | 30,00% | 16,67% | 11,95%
-------------------------------------------------------------
oct_0,16 | 2 | 15 | 22 | 14 | 12 | 65
| 3,08% | 23,08% | 33,85% | 21,54% | 18,46% | 25,90%
-------------------------------------------------------------
oct_0,24 | 4 | 8 | 22 | 31 | 20 | 85
| 4,71% | 9,41% | 25,88% | 36,47% | 23,53% | 33,86%
-------------------------------------------------------------
oct_0,32 | 3 | 5 | 12 | 26 | 17 | 63
| 4,76% | 7,94% | 19,05% | 41,27% | 26,98% | 25,10%
-------------------------------------------------------------
Column 11 30 70 83 57 251
Total 4,38% 11,95% 27,89% 33,07% 22,71% 100,00%

Cell contents:
Observed frequency
Percentage of row

Prctica 1:
- Calcular la frecuencia absoluta marginal de alumnos que han acertado dos preguntas en el test de
octubre. (2 puntos)
Solucin: la frecuencia absoluta marginal es 65 ya que hay 65 alumnos que cumplen esta condicin.

- Calcular la frecuencia relativa de alumnos que han acertado dos preguntas en el test de octubre y
tres en el de noviembre. (2 puntos)
Solucin: hay 14 alumnos que cumplen la condicin de los 251 del total, luego la frecuencia es
14/251 = 0,0558 = 5,58 %.

- De los alumnos que han acertado ms de dos preguntas en el test de octubre, calcular el porcentaje
Ejemplos de exmenes resueltos de estadstica/35

de los que tambin han acertado tres preguntas en el test de noviembre. (2 puntos)
Solucin: Hay 148 alumnos (85+63) que han acertado ms de 2 preguntas en octubre. De stos, 57
(31+26) han acertado 3 en noviembre. Por tanto, el porcentaje ser: 10057 / 148 = 38,51 %.

- El coeficiente de asimetra de las notas del test de octubre es: (2 puntos)


a) positivo b) negativo c) cero

Solucin: La media de las notas de octubre vale:


(300,08 + 650,16 + 850,24 + 630,32) / 251 = 0,213.
El nmero de datos por debajo de la media (8+30+65 = 103) es inferior al nmero de datos por
encima de la media (85+63=148). Siempre que se cumple esta condicin, el coeficiente de asimetra
es negativo (respuesta b).

- Cunto vale el coeficiente de correlacin entre las dos puntuaciones, seleccionando el subconjunto
de alumnos que han acertado menos de dos preguntas en el test de octubre y en el de noviembre?
(2 puntos)
a) r = 1
b) 0 < r < 1
c) r = 0
d) 1 < r < 0
e) r = 1

Solucin: Llamamos x a la puntuacin obtenida en el test de octubre e y a la obtenida en el test de


noviembre. Hay 4 alumnos que cumplen la condicin que se da, cuyas notas son: (x=0; y=0), (x=0;
y=0,08), (x=0,08, y=0), (x=0,08; y=0,08) x y 0,04

cov (x i x ) ( yi y) (0 0,04) 2 2 (0 0,04) (0,08 0,04) (0,08 0,04) 2


0
n 1 4 1

r cov s x s y 0 La respuesta correcta es la c).


Ejemplos de exmenes resueltos de estadstica/36

2.- Una cooperativa agrcola vende tres tipos de fitoreguladores (A, B y C) para regular el
crecimiento de trigo. Para determinar cul es el ms efectivo, se seleccionan al azar 12 parcelas de
trigo con caractersticas similares. En tres de ellas se aplica el fitoregulador A, en otras tres parcelas
el fitoregulador B y en otras seis, el C. En todos los casos, la aplicacin se realiza por medio de un
atomizador a una dosis de 10 mg/ha. Los resultados obtenidos, medidos como longitud media (mm)
de 10 plantas seleccionadas al azar al cabo de 3 semanas de aplicacin (variable longitud) son los
indicados en la tabla. Los datos se analizan con ANOVA utilizando Statgraphics, obtenindose el
grfico que se muestra a continuacin.

Means and 95,0 Percent LSD Intervals


880
780
longitud
680
580
480
380
280
A B C
fitoregulador
fitoregulador A fitoregulador B fitoregulador C
615 844 711
373 365 312 739 711 695
648 809 663

Prctica 2:
- Cul de las siguientes afirmaciones es correcta? (2,5 puntos)
a) A la vista de la grfica se deduce que el p-valor del test del ANOVA es superior a 0,05.
b) A la vista de la grfica se deduce que el p-valor del test del ANOVA es inferior a 0,05.
c) A partir de la grfica no es posible deducir ninguna de las dos respuestas anteriores.
d) Depende del nivel de significacin del test, el cual no se puede deducir del grfico.

Solucin: los intervalos LSD se han construido con un nivel de confianza 1-=95%, de modo que
=0,05. Dado que los intervalos LSD no se solapan significa que alguna de las medias es
significativamente distinta de las dems considerando =0,05, por lo que se rechaza la hiptesis
nula H0: mA=mB=mC. Consecuentemente, p-valor<, de modo que la respuesta correcta es la b).

- Teniendo en cuenta que x A =350, x B x C =750, qu tipo de fitoregulador se recomendara para


maximizar la longitud? (2,5 puntos)
a) El de tipo B, ya que la longitud de su intervalo LSD es mayor que la de C lo cual sugiere que
tiene una mayor probabilidad de que se alcancen valores mayores de longitud.
b) El de tipo C, ya que la longitud de su intervalo LSD es menor que el de B lo cual sugiere que su
desviacin tpica es menor.
c) El de tipo B C.
d) Cualquiera de los tres, ya que se acepta la hiptesis nula H0: mA=mB=mC.
Ejemplos de exmenes resueltos de estadstica/37

Solucin: la c) ya que se solapan sus intervalos LSD, por lo que debe aceptarse la hiptesis de que
mB=mC.

- Una de las hiptesis del ANOVA es que la poblacin de datos de la variable longitud se ajusta a un
modelo Normal en cada uno de los tres fitoreguladores ensayados. Cmo se podra verificar si esta
hiptesis es admisible? (2,5 puntos)
a) La hiptesis de normalidad es admisible dado que los intervalos LSD son simtricos.
b) Habra que estudiar si los 12 datos de la tabla se ajustan bien a un modelo Normal.
c) Habra que calcular los residuos del ANOVA y estudiar si stos se ajustan bien a un modelo
Normal.
d) No hay suficientes datos para estudiar si el modelo Normal es admisible.

Solucin: los intervalos LSD son siempre simtricos, por lo que la respuesta a) es falsa. Dado que la
media de A es significativamente menor que las otras dos, tampoco es correcto utilizar directamente
los 12 datos de la tabla, pues tenemos una mezcla de dos poblaciones con distinta media. La
respuesta correcta es la c), pues hay tcnicas que permiten estudiar si el modelo Normal es
admisible aunque slo tengamos 12 datos.
Ejemplos de exmenes resueltos de estadstica/38

- Para estudiar a qu se debe la variabilidad obtenida en funcin del tipo de fitoregulador, se analiza
en laboratorio la composicin de cada un de ellos y se encuentra que su composicin es muy similar,
pero difieren en la concentracin de una hormona de crecimiento vegetal denominada auxina
(variable conc). El fitoregulador A contiene 10 g/l de auxina, el de tipo B contiene 40 g/l y el de
tipo C, 20 g/l. El efecto de la concentracin sobre la longitud obtenida (datos de la tabla anterior) se
analiza con regresin lineal mltiple, obtenindose los siguientes resultados:

Multiple Regression Analysis


-----------------------------------------------------------------------------
Dependent variable: longitud
-----------------------------------------------------------------------------
Standard T
Parameter Estimate Error Statistic P-Value
-----------------------------------------------------------------------------
CONSTANT -258,333 125,178 -2,06372 0,0691
conc 73,0 11,1942 6,52125 0,0001
conc^2 -1,21667 0,211749 -5,7458 0,0003
-----------------------------------------------------------------------------

Analysis of Variance
-----------------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
-----------------------------------------------------------------------------
Model 299756,0 2 149878,0 29,40 0,0001
Residual 45876,0 9 5097,33
-----------------------------------------------------------------------------
Total (Corr.) 345632,0 11

R-squared = 86,7269 percent


R-squared (adjusted for d.f.) = 83,7774 percent
Standard Error of Est. = 71,3956
Mean absolute error = 47,5

Teniendo en cuenta los resultados del modelo de regresin, qu concentracin de auxina deber
tener el fitoregulador para maximizar la longitud, bajo las condiciones del experimento? Considerar
=0,05. (2,5 puntos)
a) conc = 20
b) conc = 30
c) conc = 40
d) conc = 20 o bien conc = 40
e) ninguna de las anteriores

Solucin: las dos variables del modelo son estadsticamente significativas ya que su p-valor es
menor a 0,05. La ecuacin resultante ser: Longitud = 258,333 + 73 conc 1,217 conc2
Para determinar el mximo relativo de esta ecuacin, hay que derivar e igualar a cero:
d(long)/dc = 73 2 1,217 conc = 0 conc = 73/(21,217) = 30 g/l.
Ejemplos de exmenes resueltos de estadstica/39

BLOQUE III. PROBLEMAS (60 MINUTOS)


Cada problema vale 10 puntos. La nota del bloque es la media de las notas de los dos problemas.

1.- El peso de las llantas para las ruedas del coche se sabe que sigue una distribucin normal N(15
kg; 2 kg). Se admite que la llanta es correcta cuando su peso est entre 11,5 kg y 17,5 kg. Se pide:

a) Si embalamos en una misma caja 20 unidades, cul es la probabilidad de que el peso medio
de las llantas sea superior a 16 kg? (2 puntos)
b) Si el peso mximo que puede aguantar una carretilla elevadora para el transporte de las
llantas es de 500 kg, cuntas llantas podr cargar de modo que no se supere el peso mximo,
con una probabilidad del 90%? (2 puntos)
c) Cul es la probabilidad de que en una caja de 20 llantas haya al menos 2 defectuosas, por no
cumplir el requisito del peso? (2 puntos)
d) Si un camin lleva 6 cajas, cul es la probabilidad de que en todas ellas se encuentren al
menos 20 llantas defectuosas, por no cumplir el requisito del peso? (2 puntos)
e) Para aceptar todo el camin se propone examinar una muestra de tamao n elegida al azar y
si encontramos al menos una defectuosa, rechazamos el camin. Cuntas llantas debemos
examinar para aceptar el camin con una probabilidad del 95%, cuando la proporcin de
llantas defectuosas sea del 5 por mil? (2 puntos)
SOLUCIN PROBLEMA 1:

a) La media muestral se distribuye segn,

2
x N(; ) N(15; )
n 20
16 15
P( x 16) P( z ) P( z 2,236) 0,0127
2 20
b) Llamando a Y= la suma de las n llantas, como

Y X1 X2 ... Xn
La distribucin de Y es Y N(15n; 4n )
La condicin impuesta es,

P( Y 500) 0,90
tipificando,
500 15n
P( z ) 0,90
2 n
La z cuya rea a la izquierda es 0,90, vale z 0,10 1,28 , y queda
500 15n
1,28
2 n
500 15n 1,282 n
15( n )2 2,56 n 500 0
Resolviendo la ecuacin de segundo grado, la solucin es n = 5,68 y n=32,36, de donde el valor
Ejemplos de exmenes resueltos de estadstica/40

a elegir es n=32.

c) La probabilidad p de que una llanta sea defectuosa es,

17,5 15 11,5 15
1 p P(11,5 X 17,5) ( ) ( ) (1,25) ( 1,75) 0,8944 0,04 0,8544
2 2

Y p=0,1456.

Llamando a Y= n de llantas defectuosas, Y sigue una distribucin binomial de parmetros


B(n=20;p=0,1456).

La probabilidad de que hayan al menos dos piezas defectuosas es,

P( Y 2) 1 P( X 0) P( X 1) 1 0,14560 (1 0,1456)20 200,1456(1 0,1456)19


1 0,043 0,1465 0,8105

d) La distribucin de Y es B(n=120, p=0,1456). Como np=1200,1456=17,47 y este valor es


mayor de 15, podemos aproximar a una normal, y la probabilidad que nos piden es,

20 17,47
P( Y 20) P( Z ) P( Z 0,655) 0,256
17,470,8544

e) La condicin que debe cumplir es,

P(Y=0)=0,95 , siendo Y una binomial de parmetros B(n;p=0,005). Desarrollando ,

(1 0,005)n 0,95
Tomando neperianos,
nln(0,995)=ln(0,95)

ln(0,95)
n 10,23
ln(0,995)
De donde tomamos n=10. Para n=11 la probabilidad es menor del 95%.
Ejemplos de exmenes resueltos de estadstica/41

2.- En una empresa de montajes se reciben lotes de cientos de unidades de un determinado


componente con una proporcin habitual del 1% de defectuosas. ltimamente se han recibido quejas
por parte de los empleados que montan estas componentes por lo que el jefe del almacn sospecha
que la proporcin de defectuosas de los ltimos envos puede haber aumentado. Para salir de dudas
decide tomar al azar del ltimo envo una muestra de 75 unidades y, tras comprobarlas, detecta que
una de ellas es defectuosa y el resto son correctas. Asumiendo que la proporcin muestral es una
variable aleatoria con distribucin normal:

a) Plantear las hiptesis a contrastar y, con un nivel de significacin del 10% qu puede
concluir el jefe del almacn? (4 puntos)
b) Cul sera la probabilidad de error de segunda especie si la proporcin de defectuosas fuera
realmente del 1,5%? (3 puntos)
c) Cuntas piezas deberan seleccionarse al azar para estimar la proporcin verdadera de piezas
defectuosas con un error absoluto menor que 0,01 y un nivel de confianza del 99%?
(justificar la respuesta) (3 puntos)

SOLUCIN PROBLEMA 2:

a) Dado que la proporcin habitual es de P=0,01, las hiptesis a contrastar sern:


H0:P=P0=0,01
H1:P>0,01
P0 (1 P0 )
La regla de decisin ser aceptar H0 si p P0 z
n
Obtenemos:
P=1/75=0,0133
z=z0,10=1,28 y
P (1 P0 )
P0 z 0 0,0247
n
Como p=0,0133 < 0,0247 aceptamos la hiptesis nula de que no ha habido un empeoramiento
significativo de la proporcin de defectuosas.
b)
0,015(1 0,015)
P( AceptarH 0 / H1 ) P(p 0,0247 / P 0,015) P(N(0,015; ) 0,0247)
75
0,0247 0,015
P(N(0,015;0,014) 0,0247) (0,69) 0,7549
0,014
(Asumimos que al ser n=75 muy grande, la proporcin muestral tiene una distribucin Normal)
c)
Para P=0,01 que es la proporcin habitual
PQz 2 / 2 0,01x0,99x 2,57 2
n 653,8 654 piezas
e2 0,012
Para P=Q=0,50 (caso de no tener informacin sobre P)
PQz2 / 2 0,50 x0,50 x2,57 2
n 16512,25 16513 piezas que es inviable
e2 0,012
Ejemplos de exmenes resueltos de estadstica/42

8- Examen de Mtodos Estadsticos I Julio 2011

BLOQUE I. CUESTIONES Y PROBLEMAS TIPO TEST (90 MINUTOS)


Todas las cuestiones deben ser debidamente justificadas. Aquellas cuestiones contestadas correctamente
pero no justificadas no sern puntuadas.

1.- Para el siguiente esquema de funcionamiento de un sistema

El tiempo de funcionamiento del componente 1 sigue una distribucin exponencial de vida media 250 horas,
el del componente 2 sigue una distribucin uniforme entre 150 y 350 horas; y el del componente 3 sigue una
distribucin normal de media 300 horas y desviacin tpica 30. Calcular la probabilidad de que el sistema est
funcionando al cabo de 275 horas. (2 puntos)

Solucin cuestin 1:

Llamando a Ri P(Ti t) la probabilidad de que el componente i funcione ms de un tiempo i, la


probabilidad de que el sistema funcione viene dado por,

Rsys [1 (1 R1)(1 R2 )]R3


Siendo:
1
275
R1 P(T1 275) e 250
0,3329
350 275
R 2 P(T2 275) 0,375
350 150
275 300
R3 P(T 275) 1 P(T 275) 1 1 ( 0,83) 0,7977
30
Y sustituyendo queda,
Rsys [1 (1 0,3329)(1 0,375)]0,7977 0,4651
Ejemplos de exmenes resueltos de estadstica/43

2.- Se extraen 100 valores al azar de una distribucin uniforme U[0 ; 1], y calculamos la suma de dichos
valores. Calcular dos lmites entre los cuales cabe esperar que se encontrar el valor de dicha suma con una
probabilidad del 0,90. (2 puntos)
Solucin cuestin 2:

100
Llamando a S x i donde cada xi U[0;1] con valor medio y varianza E( xi ) 0,5 y
i1

(b a)2 1
D2 ( x i ) .
12 12

Como S es una suma de variables independiente y con igual distribucin, tiende a una distribucin
normal de media y varianza,
100

D (x )
100
E(S) 0,5100 50 D 2 ( S) 2
i
i1
12
10
Y S seguir una distribucin normal N(50; ) . Los lmites deben cumplir la condicin de,
12
P(a S b) 0,90
Tipificando,
a 50 b 50
P N(0,1) 0,90
10 12 10 12

Por simetra, el valor de la normal tipificada que deja a su derecha un rea del 0,05 es z0,05 1,645
De donde los valores de a y b se obtiene como,
b 50
1,645 despejando queda b=54,75;
10 12
a 50
1,645 y despejando queda a=45,57.
10 12

3.- Si tomamos una muestra de tamao n=14, procedente de una poblacin normal de varianza 25, calcular la
probabilidad de que la desviacin tpica muestral sea mayor de 3,1. Qu valor de la varianza muestral es
superado el 10% de las veces, al tomar repetidas muestras de tamao 14? (2 puntos)

Solucin cuestin 3:
(n 1)s 2 133,12
P(s 3,1) P(s 2 3,12 ) P P(13
2
4,997) 0,975
2 25

El valor de la chi-cuadrado que deja a su derecha un rea del 10% es,
P(13
2
a) 0,10
Buscando en tablas, el valor de a es,
13s 2
a 19,812
25
Y despejando la varianza muestral, queda s2 38,1.
Ejemplos de exmenes resueltos de estadstica/44

4.- Una cadena de montaje est compuesta por 3 secciones. Cada vez que el material en proceso de montaje
llega a una seccin se produce una espera (desde el momento en que llega a la seccin hasta que se ponen a
trabajar con l). El tiempo de espera en cada seccin se distribuye normalmente con los parmetros que se
indican a continuacin (en minutos):

Seccin 1 Seccin 2 Seccin 3


Media 0,5 0,3 1
Varianza 0,015 0,005 0,045

Suponiendo que los tiempos de espera son independientes y que la espera le cuesta a la empresa 50 /minuto,
calcular la probabilidad de que el montaje le cueste a la empresa ms de 100 debido a la espera. (2 puntos)
Solucin cuestin 4:
El valor total del coste viene dado por,
C 50T1 50T2 50T3
Y como es una combinacin lineal de variables normales, su media y su varianza vienen dadas por,
E(C) 500,5 500,3 501 90
D (C) 50 D (T) 50 D (T) 502D2 (T) 5020,015 5020,005 5020,045 162,5
2 2 2 2 2

Y la probabilidad pedida es,


100 90
P(C 100) 1 P(C 100) 1 1 (0,7845) 1 0,7836 0,2164

162 ,5

5.- El nmero total de averas que se producen en los ascensores de un edificio sigue una distribucin de
Poisson con una media de 3 averas al mes. Se pide:
a) Cul es el nmero de averas esperado en un ao? (0,5 puntos)
b) Cul es la probabilidad de que se produzcan ms de 5 fallos en un mes? (0,5 puntos)
c) Cul es la probabilidad de que se produzcan ms de 30 fallos en un ao? (0,5 puntos)
d) Cul es la probabilidad de que ocurra una avera antes de 15 das? (0,5 puntos)

Solucin cuestin 5:

Llamando a X=nmero de averas en un mes, X Ps( 3)

a) Si Y es el nmero de averas en un ao, Y X1 X2 ... X3 , como es una suma de variables


de Poisson independientes, la Y tambin sigue otra Poisson con 1 2 ...12 123 36 ,
y en consecuencia el valor medio de Y es E(Y)=36.
b) P( X 5) 1 P( x 5 / 3) 1 0,9161 0,0839
c) Como Y sigue una Poisson de 36 , se puede aproximar a una distribucin normal
N(36; 36) , y la probabilidad pedida es,
30 36
P( Y 30) 1 P( Y 30) 1 P N(0,1) 1 ( 1) 1 0,1587 0,8413

36
d) El tiempo entre fallos sigue una distribucin exponencial de parmetro = nmero de
averas por unidad de tiempo. Si el tiempo lo indicamos en das, el valor de es
36
0,0986 averas/da
365
Y llamando a T el tiempo entre dos averas, esta variable sigue una exponencial de
parmetro =0,0986, y la probabilidad pedida es,
P(T 15) 1 e0,098615 1 0,2278 0,7722
Ejemplos de exmenes resueltos de estadstica/45

BLOQUE II. PRCTICAS DE ORDENADOR (40 MINUTOS)


Todas las cuestiones deben ser debidamente justificadas. Aquellas cuestiones contestadas correctamente
pero no justificadas no sern puntuadas. Cada problema son 10 puntos. La nota del bloque es la media de
las notas de los dos problemas.

1.-La siguiente tabla de frecuencias relativas relaciona el n de averas mensuales ( en filas) de una mquina y
su temperatura media de funcionamiento (en columnas):
Frequency Table
Row
Grados 40 Grados 50 Grados 60 Total
----------------------------------------
2 | 20 | 15 | 10 | 45
| 20,00% | 15,00% | 10,00% | 45,00%
----------------------------------------
3 | 12 | 7 | 5 | 24
| 12,00% | 7,00% | 5,00% | 24,00%
----------------------------------------
4 | 4 | 10 | 2 | 16
| 4,00% | 10,00% | 2,00% | 16,00%
----------------------------------------
5 | 0 | 5 | 10 | 15
| 0,00% | 5,00% | 10,00% | 15,00%
----------------------------------------
Column 36 37 27 100
Total 36,00% 37,00% 27,00% 100,00%

Cell contents:
Observed frequency
Percentage of table
Responder, en base a la tabla, a las siguientes preguntas, justificando las respuestas:

a) Qu porcentaje de meses se avera ms de 3 veces? (2,5 puntos)

Se trata de calcular P(X>3). A partir de la tabla se obtiene,


P( X 3) P( X 4) P( X 4) P( X 5) 0,16 0,15 0,31

b) En qu porcentaje de meses en que se trabaja a 60 sufren 3 averas? (2,5 puntos)

Nos piden el valor de una distribucin condicional, esto es,


P( X 3 Y 60) 5
P( X 3 / Y 60) 0,1852 ; es decir el 18,5%
P( Y 60) 27

c) Qu porcentaje de meses se trabaja a 50 y se presentan 5 averas? (2,5 puntos)

Es la distribucin conjunta,
P( X 5 Y 50) 0,05 , es decir, el 5%.

d) Qu porcentaje de meses se trabaja a 60 ? (2,5 puntos)

Es la distribucin marginal de la temperatura, esto es,

P( Y 50) 0,27

2.- Una industria qumica desea estudiar el efecto del tipo de catalizador y de la concentracin de un cierto
aditivo denominado NCV en la calidad final del producto elaborado. Para ello se ha diseado un experimento
Ejemplos de exmenes resueltos de estadstica/46

ensayando tres catalizadores diferentes: A, B y C (factor CAT) combinados con tres concentraciones de
aditivo: 4, 5 y 6 (factor NCV). Cada uno de los nueve tratamientos se ensay dos veces, midindose en cada
prueba un parmetro de calidad final (variable LAT). Tras la realizacin del experimento y la recogida de
datos se llev a cabo un Anlisis de la Varianza cuya tabla resumen se muestra a continuacin:

Analysis of Variance for LAT - Type III Sums of Squares


------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio
------------------------------------------------------------------
MAIN EFFECTS
A:CAT 77,7733 ___ ________ _____
B:NCV _______ ___ 41,4867 _____
INTERACTIONS
AB _______ ___ ________ _____
RESIDUAL 16,56 ___ ________
------------------------------------------------------------------
TOTAL (CORRECTED) 250,52 ___
------------------------------------------------------------------

a) Completa la tabla resumen del ANOVA, indicando qu efectos son estadsticamente significativos
(=0,05). Justificando la respuesta, as como los clculos realizados. (3,5 puntos)

Analysis of Variance for LAT - Type III Sums of Squares


------------------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio
------------------------------------------------------------------
MAIN EFFECTS
A:CAT 77,7733 2 38,8866 21,13
B:NCV 82,9734 2 41,4867 22,55
INTERACTIONS
AB 73,2133 4 18,303 9,95
RESIDUAL 16,56 9 1,84
------------------------------------------------------------------
TOTAL (CORRECTED) 250,52 17
------------------------------------------------------------------

Respuesta: Dado que se han realizado 18 pruebas experimentales, el nmero de grados de libertad
totales ser 18 1 = 17. Como en los dos factores hay dos niveles, los grados de libertad de cada
factor sern 3 1 = 2. La interaccin doble tendr 2 2 = 4 grados de libertad, y los residuales se
obtienen por diferencia: Dfres = 17 2 2 4 = 9
Cuadrado medioNCV = suma de cuadrados / gr. Lib
41,4867 = SC / 2 SC = 82,9734
SCAB = SCtotal SCCAT SCNCV = 73,2133
Dividiendo las sumas de cuadrados por los grados de libertad se obtiene el cuadrado medio.
Dividiendo el cuadrado medio de un factor entre el cuadrado medio residual se obtiene la F-ratio.

El F-ratio de CAT (21,13) y el F-ratio de NCV (22,5) superan el valor crtico (=0,05) de una F2;9
que vale 4,26. El F-ratio de la interaccin (9,95) supera el valor crtico (=0,05) de una F4;9 que
vale 3,63. Por tanto, el efecto simple de los dos factores y de la interaccin son estadsticamente
significativos.
Ejemplos de exmenes resueltos de estadstica/47

b) Qu informacin aporta el siguiente grfico? Dicha informacin es coherente con las conclusiones del
apartado anterior? Por qu? (2,5 puntos)
Means and 95,0 Percent LSD Intervals
13,3

11,3

LAT
9,3

7,3

5,3
A B C
ALG
CAT

Respuesta: Este grfico muestra los intervalos LSD (Least Significant Differences) para el factor
CAT, obtenidos con un nivel de confianza del 95%. A la vista del grfico se deduce que el valor
medio de la variable LAT es significativamente distinto entre los catalizadores A y el B, as como
tambin entre B y C ya que sus intervalos LSD no se solapan. Sin embargo, no hay diferencias
significativas entre A y C porque sus respectivos intervalos se solapan. Por tanto, se deduce que:
mB < (mA = mC).
La informacin deducida del grfico es coherente con el hecho de que el factor CAT resulta
estadsticamente significativo, pues ello indica que al menos uno de los catalizadores tendr un
valor medio significativamente distinto de los dems.
Ejemplos de exmenes resueltos de estadstica/48

c) Qu informacin aporta el siguiente grfico? Cul sera la interpretacin del grfico si la


interaccin doble no hubiese resultado estadsticamente significativa? (2,5 puntos)
Interaction Plot CAT
16 ALG
A
B
12
C

LAT
8

0
4 5 6
NCV

Respuesta: Teniendo en cuenta que la interaccin doble es estadsticamente significativa, segn se


deduce del apartado a), el grfico de la interaccin muestra que el efecto de NCV en la variable
LAT depende del tipo de catalizador. As pues, el efecto es lineal con el catalizador B, y se observa
un efecto cuadrtico en los otros dos casos. Con el catalizador A el valor mximo obtenido
corresponde a NCV=5, mientras que con el catalizador C, se obtiene el mnimo con NCV=5, lo que
indica que el efecto cuadrtico es distinto en A y en C.
Si la interaccin doble no hubiese resultado estadsticamente significativa no se podra concluir que
el efecto de NCV sobre LAT depende del tipo de catalizador.

d) Cul crees que sera el tratamiento ptimo si se desea maximizar la calidad del producto
elaborado? (1,5 puntos)
Respuesta: Dado que la interaccin doble es estadsticamente significativa, el tratamiento ptimo
ser utilizar catalizador C con NCV=6, ya que el valor medio obtenido en estas condiciones
(LAT=16) es el mayor de los 9 tratamientos ensayados.
Ejemplos de exmenes resueltos de estadstica/49

BLOQUE III. PROBLEMAS (60 MINUTOS)


Cada problema vale 10 puntos. La nota del bloque es la media de las notas de los dos problemas.

1.- Como parte del proceso de calidad implantado en una empresa, todas las unidades de un producto pasan,
despus de ser fabricadas, por un dispositivo de control que indica si son defectuosas o no. Si una pieza no
supera el control de calidad, es desechada. Se sabe que la probabilidad de que una pieza defectuosa supere el
control es del 2% y que la probabilidad de que una pieza correcta sea considerada como defectuosa por el
dispositivo es del 1%. La proporcin de piezas defectuosas en la fabricacin es del 5%.

a) Dada una pieza calificada como correcta por el dispositivo Qu probabilidad hay de que sea realmente
defectuosa? (4 puntos)

Para mejorar los resultados del proceso de calidad se decide que cada unidad fabricada pasar 2 veces por
el dispositivo de control. Para que una unidad sea considerada correcta, deber ahora superar el control las dos
veces. En cualquier otro caso, ser desechada. Con el nuevo sistema de control,

b) Qu probabilidad hay de que una pieza defectuosa sea considerada como buena? (3 puntos)
c) Qu porcentaje del total de piezas sacadas al mercado sern defectuosas? (3 puntos)

Solucin Problema 1:

a) El rbol de Bayes es,

CE C1
0,99

C
0,01 DE C2
0,95

CE C3
0,05 0,02

0,98 DE C4
Y la probabilidad pedida es,
C3 0,050,02
P(D / CE ) 0,00106
C1 C3 0,950,99 0,050,02

Ahora el rbol de Bayes es,


Ejemplos de exmenes resueltos de estadstica/50

CE C1
0,99 2

CE1
0,99 DE 2 C2
0,01
C CE C3
0,99 2

0,01 DE1
0,95
0,01 DE 2 C4

0,02 CE
2
C5

CE1
0,05 0,02
DE 2 C6
0,98
D CE
0,02 2
C7
0,98 DE1

0,98
DE 2 C8

b) Siendo independientes los resultados de los ensayos, se tiene que,

P(CE1 CE2 / D) P(CE1 / D)P(CE2 / D) 0,020,02 0,0004

c) La probabilidad pedida es,

C5 0,050,020,02 0,00002
P(D / CE ) 0,0000214
C1 C5 0,950,990,99 0,050,020,02 0,93111

En porcentaje es el 0,00214%.
Ejemplos de exmenes resueltos de estadstica/51

2.- El departamento de facturacin de una empresa comercial de distribucin viene registrando en los ltimos
meses, y de forma habitual, un 3% de facturas impagadas. Ante la nueva situacin de crisis econmica el
gerente piensa que puede haberse producido un incremento significativo de los impagos. Para comprobarlo
elige al azar 20 facturas con fecha de vencimiento pasada y detecta que 2 de ellas estn impagadas. Se pide:

a) Con un nivel de significacin del 5% hay evidencias suficientes de un incremento de la


proporcin de facturas impagadas? (4 puntos)
b) En la delegacin de la empresa en el Pas Vasco se toman al azar 40 facturas con fecha de
vencimiento tambin pasada y aparecen 3 impagadas. Con un nivel de significacin del 1%
podemos admitir que las dos delegaciones tienen el mismo nivel o proporcin de facturas
impagadas? (4 puntos)
c) Utilizando un nivel de confianza del 80% con cuntas facturas elegidas al azar podramos
estimar la proporcin de impagadas en el Pas Vasco con un error absoluto menor o igual al 4
%? (2 puntos)

Solucin problema 2:
a) Las hiptesis a contrastar son H0: P=0,03 contra H1: P>0,03
La regla de decisin es aceptar si
P0 (1 P0 ) 0,03.0,97
p P0 z 0,03 1,645 0,093
n 20
Como p=2/20=0,10 > 0,093 rechazamos la hiptesis nula y aceptamos que ha habido un
incremento de la morosidad

b) Las hiptesis a contrastar son H0: P1=P2 contra P1P2 y la regla de decisin es aceptar si

2 3
20 40
1 1 n p n2 p 2 20 40 0,083
p1 p 2 z / 2 P (1 P ) con P 1 1
n1 n2 n1 n2 20 40
1 1 1 1
z / 2 P (1 P ) 2,57 0,083.(1 0,083) 0,1941
n1 n2 20 40

Como p1 p2 2 / 20 3 / 40 0,10 0,075 0,025 0,1941 no podemos rechazar la


hiptesis nula y admitimos que pueden ser iguales las proporciones de impagados.
c) El tamao de muestra necesario es

2 2
p (1 p ) z / 2
n 0,075.0,925.1,285 71,6 72 facturas
e 0,04