Está en la página 1de 20

Tema 1

Inferencia estad
stica. Estimacin.
o
1.1 Introduccin a la inferencia estad
o
stica
1.2 Estimacin puntual
o
1.3 Estimacin por intervalos de conanza: medias, varianzas y proporciones
o

1.1.

Introduccin a la inferencia estad


o
stica

La inferencia estad
stica trata los mtodos mediante los cuales podemos hacer inferencias
e
(extraer determinadas conclusiones o generalizaciones) sobre una poblacin, a partir de la inforo
macin extra de una muestra aleatoria de dicha poblacin (como acabamos de repasar en el
o
da
o

tema 0
).
La inferencia estad
stica podr dividirse en dos areas: la estimacin y los contrastes de
a

o
hiptesis. En este tema trataremos la estimacin y en el siguiente
o
o
hiptesis. Veamos algunos ejemplos sencillos como ilustracin:
o
o

los contrastes de

Ejemplo 1.1.: Se evalu emp


o
ricamente un programa utilizando una coleccin aleatoria de
o
50 conjuntos de datos de entrada, midindose el tiempo de ejecucin para cada caso. Se calcul la
e
o
o
2 = 36 ms2 , respectivamente. La media de dicha
media y varianza, obtenindose: x = 65 ms y s
e

muestra puede emplearse para estimar la media de la poblacin entera (todos los tiempos de
o
ejecucin para todos los posibles valores de entrada), sin embargo debe quedar claro que NO es
o
la media verdadera de la poblacin. Emplearemos la distribucin de muestreo de X para tener
o
o

una idea de la exactitud de la estimacin. (PROBLEMA DE ESTIMACION).


o
Ejemplo 1.2.: En el art
culo Evaluation of Maintenanace software in Real-Time Systems
(IEEE Trans. on Comput., 1978), se pretend conocerse la cobertura de deteccin de fallos c
a
o
de un sistema tolerante a fallos. Para conseguir una estimacin de la mencionada proporcin
o
o
se insertaron 200 fallos aleatorios. El mecanismo de recuperacin detect con xito 178 de estos
o
o
e
fallos. La estimacin podr ser el cociente del nmero de fallos detectados entre el total (200). De
o
a
u
nuevo, la distribucin de muestreo de ese estimador nos proporcionar una idea de la abilidad
o
a

de la estimacin. (PROBLEMA DE ESTIMACION).


o
Ejemplo 1.3.: A la hora de disear un sistema de servicios, resulta adecuado contar con
n
diversas hiptesis de trabajo respecto al nmero de unidades que se deben servir en un cierto
o
u
29

30

Tema 1. Inferencia estad


stica. Estimacin.
o

momento. Una estimacin demasiado baja conducir a un servicio inadecuado, mientras que
o
a
una estimacin demasiado alta conducir a un desperdicio de recursos. Supongamos que a una
o
a
compa de distribucin de recursos informticos le interesa el nmero de usuarios interactivos
na
o
a
u
durante una hora dada y desea comprobarse si el nmero medio de usuarios se desv de 110 1 . Se
u
a
considera una muestra de 25 horas observadas y se obtiene una media de 112.2 y una desviacin
o
t
pica de 8.4. Se plantear la hiptesis que el nmero medio de usuarios es 110 y tras las pruea
o
u
bas oportunas, dicha hiptesis podr o no podr ser rechazada. En este ejemplo no se pretende
o
a
a
estimar un parmetro, sino decidir sobre una hiptesis. La teor del muestreo tambin nos ayua
o
a
e
dar a determinar la exactitud de nuestra decisin. (PROBLEMA DE CONTRASTE DE
a
o

HIPOTESIS).
Ejemplo 1.4.: Un proveedor nos suministra una mquina. Este proveedor arma que la proa
porcin de piezas defectuosas que produce la mquina es 0.001. Decidimos comprobarlo, as que
o
a

extraemos una muestra aleatoria de 2.000 unidades, de las cuales 15 resultan defectuosas. Es
aconsejable creer al proveedor o por el contrario, deber
amos recordarle que si no quedbamos
a

satisfechos nos devolv el dinero? (PROBLEMA DE CONTRASTE DE HIP OTESIS).


a

1.2.

Estimacin
o

Distinguiremos dos tipos:


o
! a) Estimacin puntual:
Se trata de estimar un parmetro poblacional mediante un nmero que lo aproxime. En el
a
u
ejemplo 1.1. estimamos la media de la poblacin () con la media de una muestra (x) y en
o
ejemplo 1.2. se emplea la proporcin de fallos detectados en la muestra () para obtener una
o
p
estimacin de la proporcin (cobertura) real (la de la poblacin completa), p. Sin embargo, no
o
o
o
podemos esperar que una estimacin puntual coincida exactamente con el parmetro poblacional
o
a
que pretende estimar, por ello en muchas ocasiones ser preferible proporcionar un intervalo que
a
contendr al parmetro poblacional con un grado razonable de certidumbre.
a
a

! b) Estimacin por intervalos:


o
Obtendremos intervalos, en los que conamos que se encuentre el parmetro poblacional a
a
estimar, por ejemplo la media poblacional . A estos intervalos se les conoce como intervalos de
conanza para el parmetro al (1 - ) 100 %, donde 1 - es el grado o nivel de conanza o
a
tambin intervalos de conanza al nivel de signicacin . ( estar entre 0 y 1, valores comunes
e
o
a
son: 0.1, 0.05 y 0.01). Cuanto mayor sea 1 - (nivel de conanza), ms amplio ser el intervalo.
a
a

! Cul es la interpretacin de un intervalo de conanza?


a
o
Supongamos que construimos un intervalo de conanza al 95 % para , para una serie de
1

ntese que en realidad la variable es discreta pero que las observaciones se aproximan a una normal
o

IG23 Ampliaci dEstad


o
stica. ETIG. Curs 2003/04

1.2. Estimacin
o

31

muestras de una poblacin Normal, cada una de ellas formada por, por ejemplo, 20 observaciones.
o
Cada vez tendremos una media muestral (x) diferente, mientras que no var Entonces, el 95 %
a.
de los intervalos que construysemos contendr a . Por supuesto, en un experimento concreto
e
a
slo disponemos de una muestra (formada por los 20 datos) y esperaremos con conanza que
o
nuestra muestra sea una de las del 95 % (cuidado!: no tiene sentido hablar de la probabilidad
de que est en un intervalo, ya que aunque es desconocida, no es una variable aleatoria, sino
e
entrar
amos en el campo de la inferencia Bayesiana). Vemoslo grcamente:
a
a

Figura 1.1: El 95 % de los intervalos de conanza contendrn a = 0.38. El tamao muestral


a
n
considerado cada vez es 20
Si en lugar de 20, el tamao muestral en cada muestra fuera 5, los intervalos sern ms
n
a
a
grandes, pero nuevamente el 95 % de los intervalos de conanza contendrn a = 0.38, segn la
a
u
siguiente grca.
a

Figura 1.2: El 95 % de los intervalos de conanza contendrn a = 0.38. El tamao muestral


a
n
considerado cada vez es 5
IG23 Ampliaci dEstad
o
stica. ETIG. Curs 2003/04

32

Tema 1. Inferencia estad


stica. Estimacin.
o

1.2.1.

Estimacin puntual
o

Existen diversos mtodos que nos permiten calcular estimadores (estad


e
sticos que se usan para
obtener estimaciones puntuales), como son: mtodos de mxima verosimilitud, de los momentos,
e
a
m
nimos cuadrados. Nosotros no veremos cmo conseguirlos, ni tampoco en qu propiedades
o
e
(por ejemplo: si es sesgado o no, eciencia mxima, consistencia) nos podr
a
amos jar para elegir
un buen estimador. En la bibliograf pueden encontrarse, y en tutor por supuesto. Veamos
a
as,
simplemente cmo estimar ciertos parmetros de determinadas distribuciones:
o
a

! i) Estimador puntual de p, para una Binomial(n,p), n conocido:


p=

X
n

donde X es el nmero de xitos que ocurren en las n observaciones.


u
e

b Ejemplo 1.2.: Cul sera la estimacin de p, la cobertura?


a
o
! ii) Estimador puntual de , para una Normal(, ):
2

= X.

Ejemplo 1.1.: Hacemos el muestreo y x = 65 ms

! iii) Estimador puntual de , para una Normal(, ):


2

N
2
i=1 (Xi X)

S2 =

N 1

Ejemplo 1.1.: Hacemos el muestreo y s2 = 36 ms2

i Si en lugar de dividir por N 1, hubisemos dividido por N , habramos obtenido un


e

estimador sesgado, o sea, E(S 2 ) = 2 , mientras que E(

N
2
i=1 (Xi X)

) = (N 1/N ) 2 .

a
iv) Estimador puntual del parmetro de una Poisson:

= X.

1.3.

Estimacin por intervalos


o

A lo largo de este apartado N denotar el tamao muestral y el nivel de signicacin.


a
n
o

i A) Intervalo de conanza para , con


IG23 Ampliaci dEstad
o
stica. ETIG. Curs 2003/04

conocida:

33

1.3. Estimacin por intervalos


o

[
Nota: deduccin de los intervalos de conanza, para el resto de casos se har anlogao
a a
mente:
Sea X1 , X2 , ..., XN una muestra aleatoria de una poblacin con media desconocida y 2
o
X
mite).
conocida. Z = /N es aproximadamente N(0,1) si N es grande (por el teorema central del l
Por tanto, P( -z/2 Z z/2 ) = 1 - , donde z/2 es tal que P(Z z/2 ) = /2.
Por ejemplo, para = 0.05, P(Z 1.96) = 0.05/2 = 0.025 y P( -1.96 Z 1.96) = 0.95

X
P( -1.96 /N 1.96) = 0.95 P( -1.96/ N X 1.96/ N ) = 0.95

P( -1.96/ N - X 1.96/ N - X) =
0.95 P( X + 1.96/ N X - 1.96/ N ) =
0.95 P( X - 1.96/ N X + 1.96/ N ) = 0.95 ].

(x - z/2 ) , x + z/2 N ) con P(Z z/2 ) = /2, Z N(0,1)


N

! B) Intervalo de conanza para , con

desconocida, para Normales:

(x - t/2 s ) , x + t/2 s ) con P(T t/2 ) = /2, T es t- Student con N 1 grados de libertad
N
N

Ejemplo 1.5.:Para acortar el tiempo de transmisin de ciertas imgenes digitales, stas


o
a
e
se comprimen. Se quiere conocer el tiempo de transmisin medio para un algoritmo concreto de
o
compresin, por ello se ha medido el tiempo para 15 imgenes, que consideraremos normal,
o
a
dando x = 2.35 segundos y s = 0.32 segundos. Encuentra el intervalo de conanza de 95 % para

el tiempo medio de transmisin.


o

! C) Intervalo de conanza para , con


30):

desconocida y N grande (N

(x - z/2 s ) , x + z/2 s ) con P(Z z/2 ) = /2, Z N(0,1)


N
N

WObservacin: Aun cuando la normalidad no pueda suponerse, si deseamos obtener un


o

intervalo de conanza para con la varianza desconocida, si la muestra es grande, podemos usar
C). Si la muestra es pequea, usaremos B) si la distribucin es normal.
n
o

b Ejemplo 1.1.: Calcula un intervalo de conanza al 95 % para el tiempo medio de


ejecucin.
o

Nota: z0,1 = 1.28, z0,05 = 1.64, z0,025 = 1.96, z0,01 = 2.33, z0,005 = 2.56].
IG23 Ampliaci dEstad
o
stica. ETIG. Curs 2003/04

34

Tema 1. Inferencia estad


stica. Estimacin.
o

F
jate que z/2 cumple: P(Z z/2 ) = /2, Z N(0,1), es decir, la probabilidad que la

variable Z sea mayor que z/2 es /2].

! Para determinar el tamao muestral necesario para una precisin determinada, en el


n
o
caso de la estimacin de la media a partir de una muestra aleatoria simple, usaremos:
o
z/2 2
)
Error
Cuando es desconocida, podemos recurrir a estudios previos o bien a la obtencin de una
o
muestra piloto previa, con la que estimaremos , mediante s.
N =(

Ejemplo 1.5.: Qu tamao de muestra necesitar


e
n
amos si queremos tener 95 % de conanza de que nuestra estimacin de diera menos de 0.05? Utiliza que por estudios previos
o
podemos estimar por 0.3.

i A veces, el inters no est en la estimacin de parmetros, sino en dnde caen las obe
a
o
a
o
servaciones individuales. As pues, debemos distinguir entre intervalos de conanza e intervalos

de tolerancia. Para una distribucin Normal con media y varianza desconocidas, los l
o
mites de
tolerancia estn dados por x ks, donde k est determinado de modo que se pueda establecer
a
a
con una conanza del 100(1 - ) por ciento que los l
mites contienen al menos una proporcin p
o
de la poblacin. En Montgomery (por ejemplo), puedes encontrar las tablas que proporcionan k,
o
con las que calcular estos intervalos de tolerancia.

! i

D) Intervalo de conanza para la diferencia de medias 1 - 2 , con


2
2
1 y 2 conocidas, para muestras aleatorias independientes (N1 = tamao muestral de
n
la muestra de la poblacin 1, N2 = tamao muestral de la muestra de la poblacin 2):
o
n
o
(x1 - x2 z/2

2
1
N1

2
2
N2 )

con P(Z z/2 ) = /2, Z N(0,1)

! E) Intervalo de conanza para la diferencia de medias

2
- 2 , con 1
2
y 2 desconocidas, para muestras aleatorias independientes y tamaos muestrales
n
grandes (N1 = tamao muestral de la muestra de la poblacin 1, N2 = tamao muestral de la
n
o
n
muestra de la poblacin 2):
o

(x1 - x2 z/2

s2
1
N1

s2
2
N2 )

con P(Z z/2 ) = /2, Z N(0,1)

Ejemplo 1.6.:Un ordenador paralelo consiste en elementos de procesamiento, PE,


autnomos que comparten una memoria central. Investigadores de la New York University
o
disearon una de estas mquinas llamada Ultracomptudora NYU. A n de evaluar el impacto del
n
a
IG23 Ampliaci dEstad
o
stica. ETIG. Curs 2003/04

35

1.3. Estimacin por intervalos


o

retardo introducido por la red sobre el desempeo global de la computadora, los investigadores
n
simularon el tiempo de acceso a la memoria central para instrucciones t
picas ejecutadas por
una versin paralela de un programa meteorolgico de la NASA. Se simularon dos conjuntos de
o
o
tiempos de acceso, uno procesando con 16 elementos de procesamiento y el otro con 48. Con 16
PE, el tiempo medio de acceso a la memoria central fue de 8.94 microsegundos, mientras que
con 48 PE fue de 8.83. Supongamos (informacin que no se proporcion) que se simularon 1000
o
o
instrucciones para cada una de las dos posibilidades, con desviaciones t
picas 3.1 y 3.5 respectivamente. Hay diferencias entre los tiempos de acceso a la memoria central de las instrucciones
procesadas con 16 PE y 48 PE? (usemos = 0.05).

Para el caso de una diferencia entre dos medias, la interpretacin del intervalo de conanza
o

puede extenderse a una compracin de las dos medias. De esta manera, por ejemplo, si teno
emos gran conanza de que una diferencia 1 - 2 es positiva, realmente inferiremos que 1 > 2
con poco riesgo de caer en un error. Por tanto, en la interpretacin de los intervalos de conanza
o
para diferencia de medias nos jaremos si el cero pertenece al intervalo o no].

F) Intervalo de conanza para la diferencia de medias 1 - 2 de poblaciones


2
normales independientes, con varianzas poblacionales desconocidas pero iguales (1
2
= 2 ) (N1 = tamao muestral de la muestra de la poblacin 1, N2 = tamao muestral de la
n
o
n
muestra de la poblacin 2):
o
(N 1)s2 +(N 1)s2
2

1
2
1
(x1 - x2 t/2
N1 +N2 2
N1 + N2 2 grados de libertad

N1 +N2
N1 N2 )

con P(T t/2 ) = /2, T es t-Student con

Ejemplo 1.7.:Denimos el tiempo de respuesta de un ordenador como el tiempo que un


usuario debe esperar mientras el ordenador accede a la informacin guardada en el disco. Supongo
amos que un centro de datos desea comparar los tiempos de respuesta medios de sus dos unidades
de disco. Se seleccionaron muestras aleatorias independientes de 13 tiempos de respuesta para
el disco 1 y 15 tiempos de respuesta para el disco 2; los datos registrados fueron (en milisegundos):
Disco 1: 59, 92, 54, 102, 73, 60, 73, 75, 74, 84, 47, 33, 61

x 1 = 68.2

Disco 2: 71, 38, 47, 53, 63, 48, 41, 68, 40, 60, 44, 39, 34, 75, 86

s1 = 18.6

x 2 = 53.8

s2 = 15.8

Calcula el intervalo de conanza de la diferencia de medias al 95 %, asumiendo normalidad e


igualdad de varianzas (lo comprobaremos en un apartado posterior). Podemos suponer igualdad
de medias poblacionales?
IG23 Ampliaci dEstad
o
stica. ETIG. Curs 2003/04

36

Tema 1. Inferencia estad


stica. Estimacin.
o

G) Intervalo de conanza para la diferencia de medias 1 - 2 de poblaciones


2
2
normales independientes, con varianzas poblacionales 1 , 2 desconocidas y desiguales
(N1 = tamao muestral de la muestra de la poblacin 1, N2 = tamao muestral de la muestra
n
o
n
de la poblacin 2):
o

(x1 - x2 t/2

s2
1
N1

s2
2
N2 )

s2

con P(T t/2 ) = /2, T es t-student con

de libertad

s2

( N1 + N2 )2

1
2
(s2 /N1 )2
(s2 /N2 )2
1
2
+ N 1
N1 1
2

grados

b Ejemplo 1.8.:Un fabricante de ordenadores est desarrollando un nuevo modelo de


a
monitor en color, para lo cual puede utilizar dos tipos de esquemas transistorizados. El fabricante
selecciona una muestra de esquemas transistorizados del primer tipo, de tamao 12, y otra del
n
segundo de tamao 11. Los datos muestrales respecto a la vida de cada esquema son los siguientes:
n
Esquma 1: x1 = 1400 horas
Esquema 2: x2 = 1500 horas

s1 = 30 horas
s2 = 17 horas

Determina el intervalo de conanza de la diferencia de las medias al 95 % suponiendo que los


2
2
gastos son normales y 1 = 2 .

H) Intervalo de conanza para la diferencia de medias 1 - 2 para


muestras apareadas. Hay veces que las muestras no son independientes. Pueden ser apareadas
como es el caso de tener datos del tipo antes y despus, o bien si a cada objeto (u objetos
e
emparejados) se le aplican dos mtodos.
e
sd
(d t/2 N ) donde d es la media de las diferencias y sd es la desviacin t
o pica de las
diferencias. Adems, P(T t/2 ) = /2, T es t-Student con N - 1 grados de libertad, N es el
a
nmero de objetos (parejas) de que disponemos
u

Ejemplo 1.9.: Se est investigando la utilidad de dos lenguajes diferentes para mejorar
a
la rapidez de programacin. Doce programadores expertos familiarizados con ambos lenguajes,
o
programaron una funcin estndar en ambos lenguajes y el tiempo que tardaron en minutos fue:
o
a
IG23 Ampliaci dEstad
o
stica. ETIG. Curs 2003/04

37

1.3. Estimacin por intervalos


o

Programador 1
Programador 2
Programador 3
Programador 4
Programador 5
Programador 6
Programador 7
Programador 8
Programador 9
Programador 10
Programador 11
Programador 12

LENGUAJE 1
17
16
21
14
18
24
16
14
21
23
13
18

LENGUAJE 2
18
14
19
11
23
21
10
13
19
24
15
20

DIFERENCIA (Lenguaje 1 - Lenguaje 2)


-1
2
2
3
-5
3
6
1
2
-1
-2
-2

d=
sd =
Construyamos el intervalo de conanza de la diferencia de medias al 95 %, para comprobar
si existe diferencia entre los dos lenguajes.

! I) Intervalo de conanza para


2

en una poblacin normal:


o

( (N 1)s , (N21)s ) con P(2 > 2 ) = /2, 2 es chi- cuadrado con N 1 grados de libertad
/2
2

/2

1/2

b Ejemplo 1.10.: Una queja frecuente de los usuarios de un sistema de ordenadores en

red es la gran varianza del tiempo de respuesta. Una importante empresa est pensando en instaa
lar una nueva red entre sus directivos. Con objeto de estudiar el tiempo de respuesta, se observa
una muestra aleatoria de 30 tiempos, obtenindose una varianza muestral de 25ms 2 . Construye
e
un intervalo de conanza de 99 % para la desviacin t
o pica de la poblacin muestreada (asume
o
condiciones de normalidad).

! J) Intervalo de conanza para el cociente /


2
1

2
2

de varianzas de dos

poblaciones normales independientes:


s2

s2

1
1
( s2 F 1 , s2 F
2

/2

1
1/2

) donde P( F > F/2 ) = /2 y F es F de Sndecor con (N1 1, N2 1) grados


IG23 Ampliaci dEstad
o
stica. ETIG. Curs 2003/04

38

Tema 1. Inferencia estad


stica. Estimacin.
o

de libertad

b Ejemplo 1.7.: Construye un intervalo de conanza al 95 % para el cociente de ambas


varianzas. Fue apropiado suponer igualdad de varianzas?

En la interpretacin de los intervalos de conanza para cociente de varianzas nos jaremos


o

si el uno pertenece al intervalo o no].

K) Intervalo de conanza para una proporcin p (de una Binomial)


o
cuando N es grande y la proporcin no es cercana a cero:
o
( z/2
p
de xitos
e

pq

N ),

donde P( Z > z/2 ) = /2 Z N(0,1) y p = X /N, q = 1 - p, X = nmero

b Ejemplo 1.2.: Calcula un intervalo de conanza al 95 % para p.

La magnitud del error que cometemos al emplear X/N como estimador de p, viene dada por:
o
n
E = Error = z/2 p(1p) . Esta frmula nos puede servir para determinar el tamao muestral
N
necesario para alcanzar un grado de precisin deseado.
o
N = p(1 p) (

z/2 2
E )

Si no dispusisemos de informacin acerca del valor de p, por ejemplo en base a una muestra
e
o
piloto:
N = p(1 p) (

z/2 2
E )

1
4

z/2 2
E )

Una vez obtenidos los N datos, tendremos un (1 )100 % de conanza que el error no
exceder E.
a

Ejemplo 1.11.: Se est probando la actividad de la CPU. Para la i-sima observacin,


a
e
o
consideremos Xi = 0 si la CPU no est ocupada y 1 en caso contrario. Supongamos que las
a
observaciones estn sucientemente separadas en el tiempo para considerarlas independientes y
a
asumamos qur X es Bernoulli con parmetro p. Queremos estimar la utilizacin esperada p y
a
o
deseamos estar al menos 95 % seguros que el error es como mucho de 0.04. Cmo ha de ser de
o
IG23 Ampliaci dEstad
o
stica. ETIG. Curs 2003/04

39

1.3. Estimacin por intervalos


o

grande la muestra si:


a) no tenemos idea de cul pueda ser la proporcin real?
a
o

b) por estudios previos, una estimacin preliminar ser 0.8?


o
a

o
e
! L) Intervalo de conanza para una proporcin p, si sta es muy cercana
a cero:
1
(0, 2N 2 ) con P(2 > 2 ) = , 2 es chi- cuadrado con 2(X + 1) grados de libertad, X =

nmero de xitos
u
e

Ejemplo 1.12.: Durante un mes, se usaron continuamente 2000 componentes y de ellas


4 fallaron. Calcula un intervalo de conanza al 99 % para la probabilidad de que un componente
falle en las condiciones establecidas.

! M) Intervalo de conanza para la diferencia de dos proporciones, con N

y N2 grandes (N1 = tamao muestral de la muestra de la poblacin 1, N2 = tamao muestral


n
o
n
de la muestra de la poblacin 2):
o
1
2
(p1 - p2 z/2 p1 q + p2 q ), donde P( Z > z/2 ) = /2 Z N(0,1), p1 = X1 /N1 , q1 = 1

N1
N2
- p1 , X1 = nmero de xitos en las N1 pruebas y p2 = X2 /N2 , q2 = 1 - p2 , X2 = nmero de

u
e

u
xitos en las N2 pruebas
e

Ejemplo 1.13.: Una de las t


picas aplicaciones de un sistema experto (sistema informtico capaz de resolver problemas partiendo de una base de conocimientos de expertos y
a
una serie de reglas de deduccin) es ayudar a aislar un fallo en algn sistema mecnico, eleco
u
a
trnico o siolgico. Supongamos que dos sistemas expertos, A y B, se han desarrollado para
o
o
analizar datos cardiovasculares y prestar su opinin sobre la condicin del paciente. Para como
o
parar los dos sistemas, se introducen datos de 40 condiciones seleccionadas aleatoriamente. Sean
X e Y las variables aleatorias correspondientes a los diagnsticos correctos de los sistemas A y
o
B, respectivamente y p1 , p2 las probabilidades respectivas de xito. Supongamos que el sistema
e
A realiza 35 diagnsticos correctos, mientras que B 30. Desea determinarse si los sistemas tienen
o
distinto nivel de efectividad, as que determina el intervalo de conanza al 95 % para la diferencia

de proporciones.
IG23 Ampliaci dEstad
o
stica. ETIG. Curs 2003/04

40

Tema 1. Inferencia estad


stica. Estimacin.
o

En la interpretacin de los intervalos de conanza para diferencia de proporciones nos


o

jaremos si el cero pertenece al intervalo o no].

IG23 Ampliaci dEstad


o
stica. ETIG. Curs 2003/04

Problemas del tema 1


En reprograf podrs encontrar ms problemas resueltos.
a,
a
a
1. Se sabe que la duracin, en horas, de un foco de 75 watts tiene una distribucin aproxo
o
imadamente Normal. Al tomar una muestra aleatoria de 12 focos, se tiene una duracin
o

promedio x = 3250 horas y una desviacin s = 1000 horas.


o
a) Construye un intervalo de conanza del 95 % para la duracin promedio
o
b)

Supngase que se desea una conanza del 95 % en que el error en la estimacin de la


o
o
duracin promedio sea menor que 5 horas. Qu tamao de muestra debe emplearse
o
e
n
para este n, si por estudios previos se sabe que 2 = 990 horas?

(Sol. : (3229.9077,3270.09), 153)


2. En un estudio sobre la efectividad del ejercicio f
sico para la reduccin de peso, un grupo
o
de 9 personas participaron en un programa prescrito de ejercicio f
sico durante 1 mes,
obtenindose:
e
Persona
1
2
3
4
5
6
7
8
9

Peso antes (Kg.)


105
89
84
106
90
96
79
90
100

Peso despus(Kg.)
e
98
86
85
105
88
93
75
85
96

Usando el nivel = 0.01, calcula el intervalo de conanza de la diferencia de medias e


interprtalo.
e

(Sol. : (0.52,5.7), como no contiene al cero s existe diferencia de peso).

3. Se ha realizado un experimento para comparar las econom en combustible para dos tipos
as
de camiones diesel equipados de forma similar. Se han usado 12 camiones de la marca A
y 10 de la marca B en pruebas de velocidad constante de 90 km/h. Si los de la marca A
41

42

Tema 1. Inferencia estad


stica. Estimacin.
o

promedian 16 kilmetros por litro con una desviacin estndar de 1 kilmetro por litro y
o
o
a
o
los de la marca B promedian 11 kilmetros por litro con una desviacin estndar de 0.8
o
o
a
kilmetros por litro. Calcula un intervalo de conanza al 95 % para la diferencia de medias
o
y determina (razonando porqu) si existe diferencia en el consumo entre estas dos marcas
e
de camiones. (Supn normalidad e igualdad de varianzas).
o

(Sol. : (4.182, 5.817), existe diferencia porque 0 no pertence al intervalo)


4. En una muestra aleatoria de 500 familias que tienen televisores en una cierta ciudad, se
encuentra que 340 estn suscritas a un cierto canal. Encuentra un intervalo de conanza
a
de 95 % para la proporcin real de familias en esta ciudad suscritas al canal. Determina
o
tambin el tamao muestral necesario si queremos tener una conanza de al menos 95 %
e
n
de que nuestra estimacin de p est dentro de 0.02, primero asumiendo la muestra anterior
o
a
como una muestra preliminar que nos proporciona una primera estimacin y en segundo
o
lugar, sin contar con esta informacin.
o

(Sol. : (0.64,0.72), 2090, 2401)


5. Se considera cierto cambio en un proceso de fabricacin de partes de componentes. Se
o
toman muestras del procedimiento existente y del nuevo para determinar si ste tiene coe
mo resultado una mejor Se encuentra que 75 de 1500 art
a.
culos del procedimiento actual
son defectuosos y 80 de 2000 art
culos del procedimiento nuevo tambin lo son. Encuentra
e
un intervalo de conanza de 90 % para la diferencia real en la fabricacin de defectuosos
o
entre el proceso actual y el nuevo, e interprtalo.
e

(Sol. : (-0.0017,0.0217), como contiene al cero, no hay razn para creer que el nuevo procedo
imiento producir una disminucin signicativa en la produccin de art
a
o
o
culos defectuosos
comparado con el mtodo existente.)
e
6. Se investiga la resistencia a la tensin de ruptura de hilo proporcionado por dos fabrio
cantes. Tomamos una muestra de 50 espec
menes de prueba provenientes de cada fabricante, obtenindose como resultados x1 = 88 psi y x2 = 90 psi con desviaciones respectivas
e
5 psi y 4 psi. Calcula un intervalo de conanza al 95 % para la diferencia entre las medias
de la tensin de ruptura e interprtalo.
o
e

(Sol. : (-3.775,-0.225), como 0 al intervalo, existir diferencia en cuanto a resistencia


/
a
de los hilos entre ambos fabricantes)
7. Un fabricante de monitores prueba dos diseos de microcircuitos para determinar si pron
ducen un ujo de corriente equivalente. Los datos obtenidos son:

Diseo 1:
n

n1 = 21

x1 = 24.2

IG23 Ampliaci dEstad


o
stica. ETIG. Curs 2003/04

s2 = 8
1

43

1.3. Estimacin por intervalos


o

Diseo 2:
n

n2 = 10

x2 = 23.9

s2 = 25
2

Determina si las varianzas son iguales ( = 0.05) y tras ello calcula el intervalo de conanza
al 95 % correspondiente para la diferencia de medias e interprtalo.
e

(Sol. : 1 (0.08719,0.9088), con lo cual, asumiremos varianzas distintas. 0 (-3.398,3.998),


/
con lo cual no hay razones para asumir ujos medios diferentes.)
8. Las concentraciones de zinc que se sacan del agua en 7 sitios diferentes son: 2.5, 2.4, 2.6,
2.65, 2.76, 2.8, 2.71 gramos por mililitro. Encuentra el intervalo de conanza de 95 % para la
concentracin media de zinc en el r Qu tamao de muestra necesitar
o
o.
e
n
amos si queremos
tener 95 % de conanza de que nuestra estimacin de diera menos de 0.05? Utiliza que
o
por estudios previos podemos estimar por 0.3.
(Sol. : (2.5,2.76); 139)
9. Adems de las especicaciones de peso y per
a
metro, la FIFA ha estipulado que los balones
deben botar 0.5 m de altura cuando se dejan caer a cierta altura. Una empresa juguetera
desea estudiar la altura del bote de los balones producidos, para comprobar que la transicin
o
diseo a produccin en masa se ha llevado a cabo con xito (disear un buen producto y
n
o
e
n
construir prototipos que funcionen es una cosa, otra cosa es la transferencia del diseo
n
a la manufactura). Podr
amos obtener una muestra aleatoria de por ejemplo tamao 60.
n
Calcula un intervalo de conanza al 95 % para la altura media del bote, sabiendo que la
media muestral ha sido x = 0.51m y la varianza muestral es s2 = 0.01.

(Sol. : (0.485,0.535) )
10. Se lleva cabo un expermiento en que se comparan dos tipos de motores, A y B. Se mide el
rendimiento en millas por galn de gasolina. Se realizan 50 experimentos con el motor A y
o
75 con el B. La gasolina que se utiliza y las dems condiciones se mantienen constantes. El
a
rendimiento promedio de gasolina para el motor A es de 36 millas por galn con desviacin
o
o
t
pica 6, el promedio para el motor B es 42 millas por galn y desviacin t
o
o pica 8. Calcula el
intervalo de conanza de 99 % sobre A - B , donde A y B son el rendimiento de gasolina
medio poblacional para los motores A y B respectivamente. Podemos suponer que ambas
medias poblacionales son iguales?
(Sol. : (-9.211,-2.789), como no contiene al cero s existe diferencia).

11. Se desea conocer si dos aleaciones de alumnio tienen o no igual resistencia. Para ello se
midi la resistencia a la compresin de 58 espec
o
o
menes del primer tipo y 27 del segundo,
obtenindose x1 = 70.7 y x2 = 76.13. Supongamos que se distribuyen normalmente. Sus
e
2
2
varianza muestrales son: s2 = 1,82 y s2 = 2,422 (supongamos que 1 = 2 , comprubalo
e
1
2
tambin, calculando el intervalo de conanza del cociente de varianzas al 95 %). Calcula el
e
intervalo de conanza de la diferencia de medias al 95 %, asumiendo normalidad. Podemos
suponer igualdad de medias poblacionales?
(Sol. : el intervalo de conanza para el cociente de varianzas al 95 % es: (0.256,1.04),
como 1 pertenece al intervalo, no hay razn para armar que las varianzas sean distintas;
o
IG23 Ampliaci dEstad
o
stica. ETIG. Curs 2003/04

44

Tema 1. Inferencia estad


stica. Estimacin.
o

intervalo de conanza de la diferencia de medias al 95 %: (-6.36,-4.5), no podemos suponer


igualdad de medias porque el cero no pertenece al intervalo).
12. Queremos estimar la proporcin real de unidades defectuosas en un embarque muy grande
o
de azulejos y deseamos estar al menos 95 % seguros que el error es como mucho de 0.04.
Cmo ha de ser de grande la muestra si:
o
a) no tenemos idea de cul pueda ser la proporcin real?
a
o
b) por estudios previos, sabemos que la proporcin real no excede de 0.12?
o
(Sol. : 601;254).
13. Para comparar dos tipos de parachoques, seis de cada tipo se instalaron en unos automviles. Despus stos se lanzaron contra un muro a 20km/h y se determinaron los
o
e e
gastos de las reparaciones (en euros).
Parachoques 1: 107, 148, 123, 165, 102, 119

x1 = 127.33

Parachoques 2: 134, 115, 112, 151, 133, 129

x2 = 129

s2 = 597.867
1

s2 = 202
2

Determina el intervalo de conanza de la diferencia de las medias al 95 % suponiendo que


2
2
los gastos son normales y 1 = 2 .
(Sol. : (-28.295,24.955), como contiene al cero no existen evidencias para armar que exista
diferencia entre las medias).
14. Disponemos de dos bsculas y desear
a
amos comprobar si existe diferencia sistemtica entre
a
los pesos obtenidos con ambas bsculas. Para ello construiremos el intervalo de conanza
a
de la diferencia de medias al 95 %.

Roca 1
Roca 2
Roca 3
Roca 4
Roca 5
Roca 6
Roca 7
Roca 8
Roca 9
Roca 10

BASCULA 1
11.23
14.36
8.33
10.50
23.42
9.15
13.47
6.47
12.4
19.38

BASCULA 2
11.27
14.41
8.35
10.52
23.41
9.17
13.52
6.46
12.45
19.35

(Sol. : (-0.04,0.00051), como cero pertenece al intervalo, no podemos concluir que exista
diferencia entre ambas medias).
15. Cinco medidas del contenido de alquitrn de cierta clase de cigarrillos dieron como resula
tado: 14.5, 14.2, 14.4, 14.3 y 14.6 mg. por cigarrillos. Construye un intervalo de conanza
IG23 Ampliaci dEstad
o
stica. ETIG. Curs 2003/04

1.3. Estimacin por intervalos


o

45

de 99 % para la desviacin t
o pica de la poblacin muestreada (asume condiciones de noro
malidad).
(Sol. : (0.082,0.6951)).
16. En un estudio para comparar dos l
neas de montaje se encontr que: 16 de 200 tractores
o
de la l
nea 1 necesitaron grandes ajustes antes de embarcarlos, mientras que 14 de 400 los
necesitaron en la l
nea 2. Determina el intervalo de conanza al 95 % para la diferencia de
proporciones.
(Sol. : (0.0033,0.08669), como no contiene al cero s existe diferencia entre ambas l

neas).

IG23 Ampliaci dEstad


o
stica. ETIG. Curs 2003/04

46

IG23 Ampliaci dEstad


o
stica. ETIG. Curs 2003/04

Tema 1. Inferencia estad


stica. Estimacin.
o

Autoevaluacin del tema 1


o
Las soluciones estn en reprograf
a
a.
Ejercicio 1: La contaminacin de metales pesados de varios ecosistemas es una seria ameo
naza ambiental, en parte debido a la potencial transferencia de sustancias peligrosas a los seres
humanos a travs de los alimentos. El art
e
culo cient
co Cadmium, Zinc and Total Mercury
Levels in the Tiussues of Several Fish Species from La Plata River Estuary, Argentina (Environmental Monitoring and Assessment, 1993), recoge diversos datos. Para una muestra de 56
peces de la especie Mugil liza la concentracin media muestral de zinc en el h
o
gado fue 9.15 g/g y
la desviacin t
o pica muestral fue 1.27 g/g (no confundirse, aqu indica micro). Para la especie

Pogonias cromis se recogieron 61 concentraciones, dando una media de 3.08 y una desviacin
o
t
pica de 1.71.
Calcula el intervalo de conanza para el verdadero promedio de la concentracin de zinc en
o
el h
gado para todos los peces de la especie Mugil liza en la localidad especicada, usando
un nivel de conanza de 95 %.
Repitelo ahora para la especie Pogonias cromis, pero usando un nivel de conanza de 99 %.
Por qu razones el intervalo de conanza para la Pogonias cromis es ms amplio que para
e
a
Mugil liza, pese a que el tamao muestral era mayor?
n
Haz una interpretacin del primero de los intervalos de conanza calculados.
o
Es necesario que la distribucin sea Normal para que los dos intervalos obtenidos sean
o
vlidos?
a
Ejercicio 2: Se comparan dos sistemas segn su tiempo de respuesta a un comando. Se
u
han tomado 13 datos para el sistema 1, obtenindose un tiempo de respuesta medio de 682
e
milisegundos y una desviacin t
o pica de 25 milisegundos. Mientras que para el segundo sistema,
se toman 10 datos obtenindose una media de 675 milisegundos y una desviacin t
e
o pica de 28
milisegundos. Suponiendo que los tiempos son normales:
1. Calcula un intervalo de conanza al 95 % para el cociente de varianzas y determina si existe
diferencia.
2. Calcula un intervalo de conanza al 95 % para la diferencia de medias y determina si existe
diferencia.
3. Calcula un intervalo de conanza al 95 % para la media del sistema 1.
47

48

Tema 1. Inferencia estad


stica. Estimacin.
o

4. Si deseamos que el error de la estimacin de la media anterior sea inferior a 2 milisegundos


o
con una conanza del 95 % y teniendo en cuenta que podr
amos asumir = 25, cul ser el
a
a
tamao muestral requerido?
n
Ejercicio 3: Segn las siguientes salidas, responde a las dos preguntas:
u

(a) Podemos suponer que las varianzas de las variables Col 1 y Col 2 son distintas? Razona
tu respuesta.
Comparison of Standard Deviations
--------------------------------Col_1
Col_2
-----------------------------------------------------------Standard deviation 0,918753
0,798088
Variance
0,844107
0,636944
Df
7
8
Ratio of Variances = 1,32524
95,0% Confidence Intervals
Standard deviation of Col_1: [0,607456;1,86991]
Standard deviation of Col_2: [0,539074;1,52895]
Ratio of Variances: [0,292641;6,49282]

(b) Escribe el intervalo de conanza al 95 % para la diferencia de medias (segn lo obtenido


u
en el apartado anterior). Son diferentes? Razona tu respuesta.
Comparison of Means
------------------95,0% confidence interval for mean of Col_1: 6,0125 +/- 0,768099
[5,2444,6,7806]
95,0% confidence interval for mean of Col_2: 7,07778 +/- 0,613466
[6,46431,7,69124]
95,0% confidence interval for the difference between the means
assuming equal variances: -1,06528 +/- 0,887095
[-1,95237,-0,178183]
not assuming equal variances: -1,06528 +/- 0,900396
[-1,9578,-0,172754]

IG23 Ampliaci dEstad


o
stica. ETIG. Curs 2003/04

También podría gustarte