Está en la página 1de 18

Cap

tulo 5
Variables aleatorias continuas
5.1 Introduccin
o
5.2 Distribuciones continuas
5.2.1 Uniforme

5.2.2 Exponencial

5.2.3 Weibull
5.2.4 Normal

5.3 Muestras aleatorias. Otros tipos de muestreo


5.4 Teorema central del l
mite
5.5 Distribuciones en el muestreo

5.1.

Introduccin
o

, se presentarn diversos modelos teria


o
cos de distribuciones de probabilidad para variables continuas (recuerda en el tema 1 el
apartado 1.1.). En el tema 1 ( el apartado 1.5.), vimos como la distribucin de la poblacin
o
o
En este tema y en la prctica 4 con el Statgraphics
a

de una variable aleatoria continua X podr describirse mediante una curva de densidad (como
a
un histograma idealizado), que representaba frecuencias relativas como areas bajo la curva. Si

en un histograma hacemos tender la amplitud del intervalo de clase a cero tendremos un nmero
u
innito de intervalos, convirtindose el histograma en un nmero innito de barras de grosor
e
u
innitesimal, dispuestas de modo continuo (histograma idealizado). De esta forma, llegar
amos a
la que llamamos en el tema 1 curva (o funcin) de densidad, y que denotaremos como f (x).
o
Recordemos esto rpidamente usando el siguiente ejemplo:
a
Ejemplo 5.1.: Los siguientes histogramas representan los datos recogidos en clase de la
variable aleatoria X = altura en cent
metros de las chicas (qu son muy grandes!) que estudian
e
estad
stica en Diseo en la UJI este curso:
n
67

68

Cap
tulo 5. Variables aleatorias continuas

155

160

165

170

175

180

185

155

160

165

(a)

170

175

180

185

145

(b)

150

155

160

165

170

175

180

185

(c)

Figura 5.1: Histogramas de frecuencias relativas del ejemplo 5.1., variando la amplitud de los
intervalos de clase, hasta llegar a un histograma idealizado, la curva de densidad (c)
Cada uno de los modelos que veremos (y los que no veremos) tiene asociado su funcin de
o
densidad y a travs de ella podremos calcular probabilidades de distintos sucesos. La forma de
e
calcular probabilidades para variables continuas diere de la que usamos en el tema anterior para
variables discretas. Ahora para calcular la probabilidad de un suceso deber
amos calcular el area

comprendida entre el eje x y la funcin de densidad (o sea, integrar), para los valores sealados
o
n
por el suceso.
Ejemplo 5.2.: Si quisiramos conocer la probabilidad de que un chico de la clase (qu tame
e
bin son muy grandes!) midiera entre 175 y 185 cm, P(175 X 185), debemos calcular el area
e

rallada, es decir, integrar la funcin de densidad entre 175 y 185 cm.


o

160

165

170

175

180

185

190

195

200

Segn las reglas de probabilidad, tendremos que el rea total bajo la funcin de densidad
u
a
o
es siempre 1. Adems, puesto que la integral de un punto al mismo punto vale cero (el area de
a

una barra con grosor un punto es nula, mira el grco 5.1 (c) y recuerda la ultima observacin
a

o
del punto 1.5.), se tiene que para variables continuas, la probabilidad de que una variable
aleatoria continua tome un valor puntual es cero. As en el ejemplo 5.1., P( X = 168.96
,
) = 0, por ejemplo. Por esta razn, para cualquier variable continua X se cumple: P( a X b)
o
= P( a < X b) = P( a < X < b) = P( a X < b), o sea, PARA VARIABLES CONTINUAS

UNICAMENTE, la probabilidad ser la misma tanto si la desigualdad es o no estricta.


a
[

F
jate que esta ultima propiedad no se cumple para las variables discretas (que se estu

508 Estad
stica. ETDI. Curs 2005/06

69

5.1. Introduccin
o

diaron en el tema anterior

).]

Existe gran cantidad de modelos para variables continuas. En clase veremos este ao la
n

Normal. En prcticas
a
se introducirn otros modelos: uniforme, exponencial, Weibull. Estas
a
dos ultimas distribuciones tienen aplicacin en abilidad. Adems en el tema siguiente usaremos

o
a
otras como la t de Student, 2 Chi-cuadrado y F de Snedecor. Cada una de ellas tiene una curva
de densidad y viene caracterizada por uno/s parmetros.
a
Como ya hemos dicho, para conocer la probabilidad de sucesos para variables continuas deber
amos integrar, sin embargo, para algunos modelos es posible expresar de forma anal
tica el

la funcin de distribucin acumulada que denotaremos


o
o
valor de la integral mediante
F (x) y que nos proporcionar P (X x), es decir, para cada x, la funcin F nos devolver la
a
o
a
probabilidad de que la variable X tome un valor menor o igual que x. A veces, no existe tal
expresin expl
o
cita y es preciso recurrir a tablas.
[

A modo de resumen aclaratorio: cada modelo continuo viene determinado por su funcin
o

de densidad, f . Hay que tener claro que la funcin de densidad, f , NO da probabilidades, sino
o
el area bajo dicha funcin. Para calcular probabilidades hay que usar F , la funcin de distribucin

o
o
o
acumulada.]
.

Observacin: el n de esta aclaracin es tratar de dar una visin general y localizar en


o
o
o
que punto del temario nos encontramos, para no perder de vista el objetivo nal. En el ejemplo
1.3 (el del ratn ergonmico para nios), nos interesaba estudiar TODA la poblacin de nios.
o
o
n
o
n
Como eso es inviable, extraeremos una muestra (representativa) de la poblacin, por ejemplo, N
o
= 100 nios. A partir de esa muestra estudiaremos la variable X = longitud del dedo
n
ndice en
la que estbamos interesados. Esta variable es cuantitativa y continua. (Pod habernos intersado
a
a
ms variables continuas como Y = longitud entre dos puntos determinados de la mano, u otro
a
tipo de variables, como Z = satisfaccin con un determinado juguete).
o
Los datos (100 en este caso) que habr
amos obtenido, primeramente los podr
amos describir
haciendo uso de las tcnicas vistas en el tema 1: tablas de frecuencias (apartado 1.2), grcas (hise
a
togramas, diagramas de cajas, etc.) (apartado 1.3.) y medidas descriptivas (apartado 1.4): media
(x), mediana, varianza (s2 ), desviacin t
o pica (s), percentiles, etc. Pero como ya sabemos, no es
tamos interesados en eso 100 nios concretos, sino en TODOS los nios, toda la POBLACI ON.
n
n
Para poder extraer conclusiones (INFERIR) acerca de la poblacin (esto se ver en el tema 6),
o
a
necesitamos asumir que nuestros datos provienen de una poblacin que sigue un determinado
o
modelo terico (en este punto del temario es en el que nos encontramos actualmente). A veces
o
podr no asumirse un modelo parmetrico pero la estad
a
a
stica no paramtrica queda fuera de nuee
stro alcance. Tambin existen tests para probar si nuestros datos provienen de un determinado
e
modelo, esto de nuevo queda fuera del alcance de este curso.
Las conclusiones que obtendremos vendrn dadas en trminos probabil
a
e
sticos (por ejemplo,
el intervalo de conanza al 95 % para es ...) y sern conclusiones sobre descriptores de la
a
poblacin: media (), varianza ( 2 ), etc., que en realidad, muy dif
o
cilmente se conocen.

i En fotocopias tenis algunas deniciones y propiedades.


e
508 Estad
stica. ETDI. Curs 2005/06

70

5.2.
5.2.1.

Cap
tulo 5. Variables aleatorias continuas

Distribuciones continuas

i Distribucin uniforme(a,b)
o

Es la distribucin que sigue una variable aleatoria X que toma valores en un intervalo [a,b]
o
con la misma probabilidad. Por ejemplo, las calculadoras cient
cas con la tecla RAN o Rnd
generan valores aleatorios de una variable uniforme entre 0 y 1. Su funcin de densidad y su
o
funcin de distribucin tienen la siguiente forma:
o
o
1

0.9

0.9

0.8

0.8

0.7

0.7

0.6

0.6

0.5

0.5

0.4

0.4

0.3

0.3

0.2

0.2

0.1
0
0.5

0.1

0.5

1.5

0
0.5

(a)

0.5

1.5

(b)

Figura 5.2: (a) Funcin de densidad, f , de la Uniforme(0,1); (b) Funcin de distribucin, F , de


o
o
o
la Uniforme(0,1)

La funcin de densidad, de distribucin acumulada, la media y varianza vienen dadas para


o
o
una variable Uniforme(a,b) por:

f (x; a, b) =

1
ba

(b a)2
a+b
si a < x < b
, 2 =
; =
en otro caso
2
12

F (x; a, b) =

xa
ba

5.2.2.

si x < a
si a < x < b
si x > b

i Distribucin exponencial()
o

Es usada muchas veces para modelizar el comportamiento de variables aleatorias del tipo
tiempo transcurrido hasta el fallo de un componente industrial o tiempo que se tarda en
completarse un proceso determinado. La funcin de densidad y funcin de distribucin de una
o
o
o
exponencial de parmetro tienen la siguiente forma:
a
508 Estad
stica. ETDI. Curs 2005/06

71

5.2. Distribuciones continuas


2

1.8

0.9

1.6

0.8

1.4

0.7

1.2

0.6

0.5

0.8

0.4

0.6

0.3

0.4

0.2

0.2

0.1

0
0.5

0.5

1.5

2.5

0
0.5

0.5

(a)

1.5

2.5

(b)

Figura 5.3: (a) Funcin de densidad, f , de la Exponencial(0.5); (b) Funcin de distribucin, F ,


o
o
o
de la Exponencial(0.5)

La funcin de densidad, de distribucin acumulada, la media y varianza vienen dadas para


o
o
una variable Exponencial() por:

f (x; ) =

1
1
0
si x 0
2
x si x > 0 ; = , = 2
e

F (x; ) =

0
si x 0
1 ex si x > 0

La distribucin exponencial est relacionada con la Poisson de la siguiente forma: si el nmero


o
a
u
de ocurrencias de un determinado fenmeno es una variable con distribucin Poisson, el tiempo
o
o
que pasa entre dos ocurrencias sucesivas es una variable con distribucin exponencial.
o
La distribucin Exponencial carece de memoria, se cumple P (X > s + t|X > s) = P (X > t),
o
en el contexto de tiempos de vida esto quiere decir que la probabilidad de fallar es independiente
del pasado, el sistema no envejece. Aunque pueda parecer algo irreal, no es descabellado por
ejemplo suponer que un fusible es tan bueno como nuevo mientras est funcionado.
e

5.2.3.

i Distribucin Weibull(,)
o

Otra de las distribuciones que se aplica adems de la Exponencial a problemas de abilidad


a
y tiempos de vida de componentes - equipos, es la Weibull(,). De hecho, para = 1, la
Weibull se reduce a la Exponencial.
La funcin de densidad para Weibull(1,) y distintos valores de puede verse en el siguiente
o
grco, > 0 es un parmetro de forma y > 0 de escala.
a
a
508 Estad
stica. ETDI. Curs 2005/06

72

Cap
tulo 5. Variables aleatorias continuas
1.8

1.6

1.4

1.2

0.8

0.6

0.4

0.2

0
0.5

0.5

1.5

2.5

3.5

4.5

Figura 5.4: En azul y continua: Weibull(1,1), en rojo y puntos: Weibull(1,2), en verde y rayas:
Weibull(1,0.95)
A continuacin, aparece la expresin de su funcin de densidad:
o
o
o

f (x; , ) =

x1 ex

si x 0
si x > 0

Como ya se ha dicho, la distribucin Weibull puede emplearse para modelar el tiempo hasta
o
presentarse un fallo en muchos sistemas f
sicos diferentes. Los parmetros de esta distribucin
a
o
permiten gran exibilidad para modelizar sistemas en los que el nmero de fallos aumenta con
u
el tiempo (por ejemplo, el desgaste), disminuye con el tiempo (algunos semiconductores) o permanece constante (fallos provocados por causas externas al sistema). En la siguiente pgina
a
http : //www.itl.nist.gov/div898/handbook/apr/apr.htm podris encontrar un cap
e
tulo dedicado a la abilidad.

5.2.4.

! Distribucin Normal(, )
o
2

La distribucin Normal o Gaussiana es muy importante puesto que se utiliza para modelar
o
much
simos fenmenos aleatorios; adems incluso se usa para aproximar otras distribuciones.
o
a
La distribucin Normal aproxima lo observado en muchos procesos de medicin sin errores siso
o
temticos, por ejemplo medidas f
a
sicas del cuerpo humano ( X = altura de las jvenes eso
o
n
paolasejemplo 5.1., X = altura de los jvenes espaolesejemplo 5.2., X = longitud del
n
dedo
ndice de los niosejemplo 1.3.) (el prximo curso en Ergonom lo comprobaris nuevan
o
a
e

mente), medidas de calidad en muchos procesos industriales (ejercicio 1 de la prctica 3


a
),
etc. Una justicacin de la frecuente aparicin de la distribucin Normal es el teorema central
o
o
o
del l
mite (que veremos en este tema): cuando los resultados de un experimento son debidos a un
conjunto muy grande de causas independientes que actan sumando sus efectos, cada uno de ellos
u
de poca importancia respecto al conjunto, es esperable que los resultados sigan una distribucin
o
Normal.
Ejemplo 1.3.: (ratn ergonmico). Este ejemplo, que nos ha ido persiguiendo durante todo
o
o
el curso, nos va a permitir ver varios ejemplos ms, de variables que podr suponerse Normales.
a
an
508 Estad
stica. ETDI. Curs 2005/06

73

5.2. Distribuciones continuas

Figura 5.5: Ratn optico ergonmico 3M


o
o
Para comprobar cient
camente las ventajas del ratn ergonmico frente al tradicional, se
o
o

han realizado diversos estudios (


en esta pgina, http://www.animax.no/study, puedes ena
contrar parte del trabajo). En esos estudios comparativos algunas de las variables empleadas y
que podemos suponer Normales son: tiempo de movimiento de cada ratn, actividad elctrica de
o
e
varios msculos del antebrazo durante la utilizacin de cada ratn, intensidad del dolor medida
u
o
o
en una cierta escala (VAS).
La funcin de densidad de una Normal de parmetros (media de la poblacin) y 2 (varianza
o
a
o
de la poblacin, siempre positiva), que denotaremos N(, 2 ) (a veces, como en el Statgraphics
o

, se denota N(,)), tiene la forma siguiente:


0.4

0.4

0.4

0.35

0.35

0.35

0.3

0.3

0.3

0.25

0.25

0.25

0.2

0.2

0.2

0.15

0.15

0.15

0.1

0.1

0.1

0.05

0.05

0.05

0
4

(a) Normal (0,1)

0
4

(b)

0
6

(c)

Figura 5.6: (a) Normal(0,1); (b) Un cambio en la media, supone una traslacin: Normal(0,1)
o
en azul y continua, Normal(3,1) en rojo y punteada; (c) Un cambio en la varianza, supone un
cambio en la variabilidad, pero el area bajo la curva sigue siendo 1, por ello tienen distinta altura:

Normal(0,1) en azul y continua y Normal(0,3) en rojo y punteada


Como puede apreciarse, la Normal (campana de Gauss) es simtrica respecto de la media (que
e
en este caso coincide con la mediana y la moda), o sea, el coeciente de asimetr valdr cero y
a
a
adems el coeciente de curtosis es 3 (recuerda apartado 1.4. del tema 1).
a

508 Estad
stica. ETDI. Curs 2005/06

74

Cap
tulo 5. Variables aleatorias continuas

La funcin de densidad es:


o
(x)2
1
f (x; , 2 ) =
e 22
2 2

xR

La funcin de distribucin acumulada es:


o
o
F (x; , 2 ) =

(y)2
1

e 22 dy
2 2
2

La dejamos de esta forma, ya que un integrando de la forma ez no tiene primitiva. Por


tanto, para calcularla o bien se emplea algn mtodo numrico o se usan tablas, que es lo que
u
e
e
haremos nosotros. Para ello necesitamos presentar la:

Distribucin normal estndar: es aquella distribucin normal con media 0 y


o
a
o
varianza 1. La denotaremos mediante la letra Z.
Los valores que se recogen en las tablas (las tablas estn en fotocopiadora) son para N (0, 1),
a
adems algunas calculadoras tambin permiten calcular probabilidades de una Normal estndar.
a
e
a
La tabla nos proporciona:
z

(z) = P (Z z) =

x2
1

e 2 dx
2

Figura 5.7: (z)

b Ejemplo 5.3.: uso de la tabla de N(0,1)


P (Z 1,96) =
P (Z 0,53) =
P (Z 2,33) =
508 Estad
stica. ETDI. Curs 2005/06

Z N (0, 1)

75

5.2. Distribuciones continuas

P (Z 2,33) =
O sea, P (Z z) = 1 - P (Z z), P (Z z) = 1 - P (Z z), P (Z z) = P (Z z).
Aydate de un grco si lo necesitas.
u
a

(a)

(b)

(c)

Figura 5.8: (a) P (Z z); (b) P (Z z); (c) P (Z z)


Veamos como con esa tabla podemos calcular cualquier probabilidad de cualquier Normal,
con cualquier media y varianza 2 , no necesariamente N(0,1).

! Estandarizacin: Sea X N(, ), podemos estandarizarla (o tipicarla) y


o
2

convertirla en una N(0,1) de la siguiente forma:


Z=

(recuerda
problema 9 del tema 1, hecho en clase). O sea, si X N(, 2 ), P (a < X < b)
a
b
= P ( < Z < ) = P (Z < b ) - P (Z < a )

F
jate que para estandarizar, dividimos por la desviacin t
o pica , NO por la varianza 2 ].

b Ejemplo 5.4.: Sea X N(5,2). Calcula:


P (X 8) =
P (4 X 8) =
[

F
jate que como la Normal es simtrica respecto su media , para X N(, 2 ): P (X )
e

= P (X ) = 0.5. Adems, si x , P (X x) 0.5. Tambin, si x , P (X x) 0.5.


a
e
Siempre que tengas dudas, recurre a hacer una representacin grca].
o
a

508 Estad
stica. ETDI. Curs 2005/06

76

Cap
tulo 5. Variables aleatorias continuas

Ejemplo 5.5.: Si X N(, 2 ), la fraccin (proporcin) de nmeros que estn a 3 desviao


o
u
a
ciones de la media es 0.9972, no importa el valor de , ni 2 :
P ( 3 < X < + 3) = P ( 3 < Z < +3 ) = P (3 < Z < 3) = P (Z < 3)

P (Z < 3) = 0.9986 - (1 - P (Z < 3)) = 0.9986 - (1 - 0.9986) = 0.9972


Puedes comprobar que la fraccin de nmeros que estn a 2 desviaciones de la media es
o
u
a
0.9544 y la fraccin de nmeros que estn a 1 desviacin de la media es 0.6826.
o
u
a
o

0.6826

0.9544

+ 2

b Ejemplo 5.6.: Una compaa vende sacos de pienso de 5 kg. (segn la etiqueta).
n
u
Por cada saco que venda conteniendo menos de 5 kg., ha de pagar una multa. Las mquinas
a
empaquetadoras no pueden garantizar un peso exacto de pienso por cada saco, as que el peso

de los sacos se distribuye Normalmente con una media de 5.13 kg. y una desviacin t
o pica =
0.08kg.
1. Qu proporcin de sacos pesa menos de 5kg.?
e
o

2. Cul es el peso w tal que el 80 % de los sacos pesa menos de w? (w es el 80-simo percentil)
a
e

3. La mquina puede ajustarse para cambiar el peso medio . Suponiendo que la desviacin
a
o
t
pica no cambia, qu valor deber adoptar para que unicamente el 1 % de las bolsas
e
a

pesen menos de 5 kg.?

508 Estad
stica. ETDI. Curs 2005/06

77

5.3. Muestras aleatorias. Otros tipos de muestreo

WObservacin: Aunque tericamente la curva normal representa una distribucin cono


o
o
tinua, a veces se usa para aproximadamente describir la distribucin de una variable discreta.
o
En esos casos, podr aplicarse la correccin de continuidad que veremos posteriormente en este
a
o
tema, para as obtener una mayor precisin.

5.3.

Muestras aleatorias. Otros tipos de muestreo

Recordemos que nuestro objetivo es inferir sobre la POBLACION. Nosotros slo contamos con
o
una muestra de la poblacin. Cmo generalizar ms all de un conjunto de datos particular?
o
o
a
a
El primer paso para el desarrollo de una base para la inferencia estad
stica es encontrar un
modelo probabil
stico de las muestras que nos permita utilizarlas para inferir informacin sobre
o
la poblacin de la que se han extra
o
do: el muestreo aleatorio simple.
Existen diversas tcnicas de extraccin de muestras de una poblacin (como vereremos
e
o
o
seguidamente). Nosotros nos centraremos en la ms simple:
a

! Muestreo aleatorio simple: se caracteriza por:


i) cada miembro de la poblacin tiene la misma probabilidad de ser seleccionado
o
ii) las selecciones son independientes las unas de las otras.
Ejemplo 5.7.: Imaginemos que deseamos conocer el gasto en ocio (en un mes) de los jvenes
o
(18-30 aos) espaoles. Para ello extraemos una muestra de tamao N (por ejemplo N = 100)
n
n
n
por muestreo aleatorio simple (pregunto el gasto a N jvenes completamente al azar). Si cada
o
estudiante de la clase repitiera el experimento, tendr
amos tantas muestras de tamao N como
n
estudiantes en la clase.
Por tanto, podemos considerar las variables aleatorias X1 , X2 , ..., XN donde X1 representa
el valor (gasto) de la primera persona elegida (que variar de una muestra a otra), X 2 el valor
a
de la segunda persona, ..., XN el valor de la N -sima persona.
e
Por la condicin i), la distribucin de cada Xi , 1 i N , es la misma que la de la poblacin
o
o
o
(todas las variables Xi siguen la misma distribucin). Por ii) X1 , X2 , ..., XN son independientes
o
(el conocimiento de una variable no aporta informacin acerca de los valores de la otra variable).
o
En consecuencia, X1 , X2 , ..., XN , son independientes e idnticamente distribuidas (i.i.d) y
e
constituyen una muestra aleatoria de tamao N .
n

Estad
stico: es cualquier funcin de las variables X1 , X2 , ..., XN que constituyen una
o
muestra aleatoria. Algunos ejemplos son:
Media de muestreo:
X=

X1 + X2 + ... + XN
N

Varianza de muestreo:
S2 =

N
i=1 (Xi

X)2
N 1
508 Estad
stica. ETDI. Curs 2005/06

78

Cap
tulo 5. Variables aleatorias continuas

Un estad
stico es una variable aleatoria por ser funcin de variables aleatorias, por lo cual
o
tiene una distribucin que se llama distribucin de muestreo.
o
o

[
Nota: denotamos con maysculas los estad
u
sticos de muestreo por ser variables aleatorias,
de esta forma se distinguen de las cantidades muestrales (x y s2 , por ejemplo) que vimos en el
tema 1, que corresponden a una muestra concreta y tienen un valor numrico concreto.]
e
Aunque a lo largo de este curso siempre supondremos que nuestra muestra se ha obtenido
por muestreo aleatorio simple, existen otros tipos de muestreo.
Un objetivo primordial de los procedimientos de muestreo es conseguir que la muestra sea
representativa de la poblacin (como la poblacin, pero en tamao reducido). Acabamos de
o
o
n
presentar el muestreo aleatorio simple, que se usar cuando los elementos de la poblacin sean
a
o
homogneos respecto a la caracter
e
stica a estudiar. Pero si disponemos de algn tipo de informau
cin sobre la poblacin ser coveniente emplearla a la hora de seleccionar la muestra. Un ejemplo
o
o
a
clsico son las encuesta de opinin (en Diseo conceptual: obtencin de informacin conocida a
a
o
n
o
o
nivel personal), donde los elementos (personas) de la poblacin son (o pueden serlo) heterogneas
o
e
en razn a su sexo, edad, profesin, etc. En estos casos interesar que la muestra tuviera una
o
o
a
composicin anloga a la poblacin, lo cual se conseguir mediante muestreo estraticado.
o
a
o
a
Muestreo estraticado: los elementos de la poblacin se dividen en clases o estratos. La
o
muestra se toma asignando un nmero de miembros a cada estrato (pueden usarse distintos criu
terios: proporcional al tamao relativo del estrato en la poblacin, proporcional a la variabilidad
n
o
del estrato, considerando costes, ...) y escogiendo los elementos por muestreo aleatorio simple
dentro de cada estrato.
Ejemplo 5.7.: en este ejemplo, estar bien dividir los elementos segn su nivel econmico,
a
u
o
y por ejemplo dividirlos segn la zona de la ciudad en que habiten: zona centro (clase alta), zona
u
intermedia (clase media), barrios perifricos (clase baja).
e
Ejemplo 5.8.: queremos conocer la resistencia de los plsticos que hay en un almacn. Los
a
e
plsticos provienen de dos fabricantes distintos. Ser mejor considerar dos estratos (cada fabria
a
cante), que los plsticos como un todo y muestrear sin distincin, porque puede que la distribucin
a
o
o
sea diferente en cada estrato.
Muestreo por conglomerados: se utiliza si la poblacin se encuentra de manera natural
o
agrupada en conglomerados, que podemos considerar como una muestra representativa de la
poblacin. La muestra se toma seleccionando algunos conglomerados al azar y dentro de ellos
o
analizando todos sus elementos o una muestra aleatoria simple.
Ejemplo 5.7.: siguiendo con este ejemplo, dentro de cada estrato (zona de la ciudad) podemos hacer divisiones en calles, las calles ser conglomerados ya que podemos considerarlas
an
homogneas respecto a la caracter
e
stica a estudiar.
Ejemplo 5.9.: supongamos que queremos analizar el dimetro de unas tuercas que tenemos
a
almacendas en cajas. Ser ms conveniente seleccionar al azar unas cajas y dentro de ellas rea a
508 Estad
stica. ETDI. Curs 2005/06

79

5.3. Muestras aleatorias. Otros tipos de muestreo

alizar un muestreo aleatorio simple que llevar a cabo un muestreo aleatorio simple, pues esto
implicar seguramente abrir muchas ms cajas.
a
a
Las ideas de estraticacin y conglomerado son opuestas: la estraticacin funciona tanto
o
o
mejor cuanto mayor sean las diferencias entre los estratos y ms homogneos sean stos ina
e
e
ternamente; los conglomerados funcionan si hay muy pocas diferencias entre ellos y son muy
heterogneos internamente.
e
Muestreo sistemtico: cuando los elementos de la poblacin estn ordenados en listas, se
a
o
a
usa el muestreo sistemtico. Si la poblacin es de tamao N y la muestra deseamos que sea de
a
o
n
tamao n, tomaremos k como el entero ms prximo a N/n, elegiremos un elemento al azar entre
n
a
o
los k primeros, por ejemplo el n1 , despus tomaremos los elementos n1 + k, n1 + 2k, etc, hasta
e
completar la muestra.
Como se ha visto en el ejemplo 5.7, los distintos tipos de muestreo pueden emplearse conjuntamente. Por ejemplo, en el anlisis de dimetros de tuercas en cajas provenientes de dos
a
a
fabricantes distintos (juntamos las ideas de los ejemplos 5.8 y 5.9).

Control de recepcin: un campo donde el muestreo juega un papel fundamental es


o
en el control de recepcin que trata de comprobar que los productos cumplan las especicaciones
o
de calidad.
El ms empleado es el control de recepcin por atributos, en el que se inspeccionan por
a
o
muestreo las unidades de un lote. Se seleccionan art
culos de cada lote y se toma una decisin
o
con base a dicha muestra respecto a si se acepta o se rechaza el lote, segn el nmero de unidades
u
u
defectuosas que contenga.

Para resolver esta cuestin podemos emplear los llamados planes de muestreo. Estos podemos
o
clasicarlos en:
a) Planes de aceptacin/rechazo: los ms conocidos son:
o
a
las normas japonesas JIS Z 9002
las normas norteamricanas Milatary Standard MIL- STD- 105D; UNE 66020
e

Este ultimo tiene en cuenta el tipo de inspeccin, as como el rigor de inspeccin.

o
Los muestreos pueden ser simples, dobles, mltiples y (en su caso extremo) secuencial (un
u
muestreo es secuencial cuando despus de cada observacin se toma una de las siguientes decie
o
siones: aceptar el lote, rechazarlo o seguir con el muestreo).
b) Planes de control recticativo: los lotes rechazados se inspeccionan al 100 % sustituyendo
los elementos defectuosos. Los ms usados son los de Dodge-Romig.
a
Las tablas de estos planes y una explicacin ms detallada sobre muestreo podis encontrarlos
o
a
e
por ejemplo en Johnson, Pea (vol. I) y sobre todo en cualquier libro sobre Control de Calidad.
n
En ellos podris tambin encontrar la relacin entre el
e
e
o
ndice de capacidad (para cumplir con las
especicaciones de calidad) y la frecuencia de inspeccin.
o
508 Estad
stica. ETDI. Curs 2005/06

80

Cap
tulo 5. Variables aleatorias continuas

5.4.

Teorema central del l


mite

i En fotocopias
5.5.

Distribuciones en el muestreo

i En fotocopias.
0.4

0.8

0.35

0.7

0.3

0.6

0.25

0.1
0.09

0.5

0.08
0.07
0.06

0.2

0.3

0.1

0.04

0.4

0.15

0.05

0.2

0.03
0.02

0.1

0.05

0.01

10

15

20

(a)

25

30

35

40

0
5

2
10

(b) t3

0.5

1.5

2.5

(c) F(4,20)

Figura 5.9: (a)2 Chi-cuadrado; (b) t de Student; (c) F de Snedecor

508 Estad
stica. ETDI. Curs 2005/06

3.5

4.5

Problemas del tema 5


E

Ejemplo La duracin de las bombonas de butano de 40 kg de carga tiene aproximadao


mente una distribucin normal. La probabilidad que una bombona dure ms de 220 horas es de
o
a
0.1587 y la probabilidad que dure menos de 190 horas es de 0.3085. Calcula:
1. La media y la desviacin t
o pica de la distribucin.
o
2. La probabilidad que dure entre 195 y 215 horas.
3. La duracin mxima que puede garantizarse con un 80 % de conanza.
o
a
1. 0.1587 = P (X > 220) = P ( X > 220 ) = P (Z > 220 ) = 1 - P (Z

P (Z 220 ) = 0.8413 y entonces mirando la tabla: 220 = 1

220
),

por tanto

0.3085 = P (X < 190) = P ( X < 190 ) = P (Z < 190 ) = 1 - P (Z 190 ), por tanto

a
P (Z 190 ) = 0.6915 y entonces mirando la tabla y teniendo en cuenta la simetr de la

190
normal: = 0,5
Tenemos 2 ecuaciones y 2 incgnitas: 220 - = , 190 + = 0.5, se resuelve y se obtiene
o
= 200 y = 20

2. P (195 < X < 215) = P ( 195 < X < 215 ) = P ( 195200 < Z < 215200 ) = P (0,25 <

20
20
Z < 0,75) = P (Z < 0,75) - P (Z < 0,25) = P (Z < 0,75) - (1 P (Z < 0,25)) = (tabla)
= 0,7734 - (1 0,5987) = 0.3721
3. 0.8 = P (X a) = P ( X a ) = P (Z a200 ) = P (Z a200 ), consultando la

20
20
tabla: 0,84 = a200 , y por tanto a = 183,2 horas
20
1. La duracin de cierto motor pequeo sigue una distribucin Normal con media 10 aos y
o
n
o
n
desviacin t
o pica 1.5 aos.
n
a) Cul es la probabilidad de que un motor dure menos de 7 aos?
a
n
b)

El fabricante se compromete a cambiar gratis todos aquellos motores que fallen durante
el tiempo de garant Si est dispuesto a reemplazar slo el 3 % de los motores, de
a.
a
o
qu duracin debe ser la garant que ofrezca?
e
o
a

(Sol: 0.0228, 7.18 aos)


n
2. Cierto tipo de bater de almacenamiento dura, en promedio 3.0 aos, con una desviacin
a
n
o
estndar de 0.5 aos. Suponiendo que las duraciones de la bater se distribuyen normala
n
a
mente, encuentra la probabilidad de que una bater dada dure menos de 2.3 aos. Calcula
a
n
el percentil 5 de la distribucin.
o
81

82

Cap
tulo 5. Variables aleatorias continuas

(Sol: 0.0808, 2.18 aos)


n
3. Una empresa elctrica fabrica focos que tienen una duracin, antes de fundirse, que se
e
o
distribuye normalmente con media igual a 800 horas y una desviacin t
o pica de 40 horas.
Encuentra la probabilidad de que un foco se funda entre 778 y 834 horas. Calcula el percentil
10 de la distribucin.
o
(Sol: 0.5111, 748.8 horas)
4. En un proceso industrial el dimetro de un cojinete es una parte componente importante.
a
El comprador establece que las especicaciones del dimetro sean 3.0 0.01 cm. La implia
cacin es que ninguna parte que caiga fuera de estas especicaciones se aceptar. Se sabe
o
a
que en el proceso, el dimetro de un cojinete tiene una distribucin Normal con media 3.0
a
o
y una desviacin estndar 0.005. En promedio, cuntos cojinetes se descartarn? Calcula
o
a
a
a
el percentil 85 de la distribucin.
o
(Sol: 4.56 %, 3.0052)
5. Se utilizan medidores para rechazar todos los componentes donde cierta dimensin no
o
est dentro de la especicacin 1.50 d. Se sabe que esta medicin se distribuye de fora
o
o
ma Normal con media 1.50 y desviacin estndar 0.2. Determina el valor d, tal que las
o
a
especicaciones cubran 95 % de las mediciones.
(Sol: 0.392)
6. Cierta mquina fabrica resistores elctricos que tienen una resistencia media de 40 ohmios
a
e
y una desviacin estndar de 2 ohmios. Supongamos que la resistencia sigue una Normal
o
a
y se puede medir con cualquier grado de precisin, qu porcentaje de resistores tendrn
o
e
a
una resistencia que exceda 43 ohmios? Calcula el percentil 95 de la distribucin.
o
(Sol: 6.68 %, 43.28)
7. Un fabricante produce pistones, cuyos dimetros se distribuyen segn una Normal de media
a
u
5 cm y una desviacin t
o pica 0.001 cm. Para que un pistn sirva debe encontrase entre 4.998
o
y 5.002 cm. Si el dimetro del pistn es menor que 4.998 cm se rechaza; si es mayor que
a
o
5.002 cm se recicla. Con qu probabilidad sirve? Cul es la probabilidad de rechazarlo?Y
e
a
de reciclarlo?
(Sol: 0.9544, 0.0228, 0.0228)
8. El tiempo necesario para armar cierta unidad es una variable aleatoria Normal con media
30 minutos y varianza 4 minutos. Determina el tiempo de armado de tal manera que la
probabilidad de exceder ste sea 0.2. Adems, determina la probabilidad que se tarde menos
e
a
de 27 minutos, entre 27 y 32 minutos y que se tarde ms de 32 minutos.
a
(Sol: 31.68, 0.0668, 0.7745, 0.1587)
9. La demanda semanal de bombillas en una ferreter es una variable N(300,81). Suponiendo
a
que se hacen pedidos semanales, calcula la cantidad de bombillas que necesitamos tener a
principio de semana para poder satisfacer la demanda un 95 % de las semanas. Cul es la
a
probabilidad que la demanda est entre 280 y 310 bombillas?
e
(Sol: 314.76 = 315 bombillas, 0.8533)
508 Estad
stica. ETDI. Curs 2005/06

83

5.5. Distribuciones en el muestreo

10. La dimensin principal de ciertas piezas tiene una distribucin Normal(150, 2 =0.4) y el
o
o
intervalo de tolerancia es (149,150.4). Se pide:
a) La proporcin esperada de defectuosas resultantes de dicho proceso
o
b)

Se toman 15 piezas, calcula la probabilidad de que 9 sean aceptables (o sea, 6 defectuosas)

c) Calcula el nmero esperado de piezas defectuosas en 50 piezas


u
d)

El percentil 40 de la distribucin
o

(Sol: 0.3214, 0.1683, 16,149.84 )


11. En una gran fbrica, los tubos uorescentes se mantienen encendidos d y noche. Las luces
a
a
se funden con un promedio de 120 al mes (30 d
as). Suponiendo que se reemplazan al instante y que el nmero de roturas sigue una distribucin Poisson. Calcula las probabilidades
u
o
de que:
a)

i Se rompan entre 100 y 120 luces (incluidas) en un mes

b)

No se rompa niguna luz un d


a

(Sol: 0.4892, 0.0183)


12.

i Supongamos que el tiempo, en minutos, desde el momento en que llegas a la parada del
bus hasta que llega el primer autobs se modeliza mediante una distribucin exponencial
u
o
con = 0.37. Encuentra las probabilidades de los siguientes sucesos:
a) El siguiente bus llega entre 2 y 4 minutos despus que t llegas
e
u
b)

Esperas ms de 2 minutos al primer bus


a

c) El primer bus llega dentro de los primeros 90 segundos


d)

No pasa ningn bus en los primeros 5 minutos de estar en la parada


u

e) Pasa al menos un bus en el primer minuto


(Sol: 0.2495, 0.4771, 0.4259, 0.1572, 0.3093)
13.

i La gente que frecuenta un cierto karaoke tiene una probabilidad de 0.4 de levantarse
y cantar. Cierto d hay 150 personas dentro del karaoke. Cul es la probabilidad que al
a
a
menos 10 personas se levanten y canten? (supongamos que cada persona toma la decisin
o
independentmente de las otras).
(Sol: 0.9988)

14.

i Un emisor enva una cierta seal. El receptor no lo recibe ntidamente, sino que un
n
determinado ruido que puede modelizarse como una distribucin uniforme en el intervalo
o
[-1,1] se aade a la seal. Cul es la probabilidad que al recibir la seal, sta tenga un
n
n
a
n e
ruido
a) mayor que 0.5?
508 Estad
stica. ETDI. Curs 2005/06

84

Cap
tulo 5. Variables aleatorias continuas

b) entre -0.25 y 0.75?


c) menor que 0.25?
(Sol: 0.25, 0.5, 0.625)
15.

i En una cierta fabricacin mecnica el 96 % de las piezas resulta con longitudes admisio
a
bles (dentro de las tolerancias), un 3 % defectuosas cortas y 1 % defectuosas largas. Calcula
la probabilidad de que:
a) En un lote de 250 piezas sean admisibles 242 o ms
a
b) En un lote de 100 piezas sean cortas 4 o menos
c) En un lote de 1000 piezas haya entre 6 y 12 inclusive largas
(Sol: 0.3156, 0.815, 0.71)

16.

i Se ha comprobado que la duracin de vida de ciertos elementos sigue una distribucin


o
o
exponencial con media 8 meses. Se pide:
a) Calcula la probabilidad de que un elemento tenga una vida entre 3 y 12 meses
b) El percentil 95 de la distribucin
o
(Sol: 0.46, 23.97)

17.

i El espesor del borde de un componente de una aeronave est distribuido de manera


a
uniforme entre 0.95 y 1.05 mm.
a) Cul es la proporcin de bordes cuyo espesor es mayor que 1.02mm?
a
o
b) Qu espesor est excedido por el 90 % de los bordes?
e
a
c) Cul ser la media y varianza del espesor del borde?
a
a
(Sol: 0.3; 0.96; 1 y 0.00083)

18.

i Una compaa area observando que, en promedio, el 12 % de las plazas reservadas no


n
e
se cubren decide aceptar reservas por un 10 % ms de las plazas disponibles en aviones de
a
450 plazas. Calcula la proporcin de vuelos en los que algn pasajero con reserva no tiene
o
u
plaza.
(Sol: 0.0197 2 %)

19.

i Un aparato de medida da una lectura que puede considerarse distribuida segn una
u
N(, 2 ), donde es el valor real de la magnitud deseada y 2 = 9. Para mejorar la precisin
o
se decide tomar la media X de n medidas.
a) Calcula el m
nimo n necesario para que la varianza de X sea inferior o igual a 0.1.
b) Con el valor de n obtenido en el apartado anterior, calcula la probabilidad que X se
aparte del valor real en ms de 0.2 unidades.
a
(Sol: 90, P (|X | > 0,2) = 0.5286)

508 Estad
stica. ETDI. Curs 2005/06

También podría gustarte