Documentos de Académico
Documentos de Profesional
Documentos de Cultura
tulo 5
Variables aleatorias continuas
5.1 Introduccin
o
5.2 Distribuciones continuas
5.2.1 Uniforme
5.2.2 Exponencial
5.2.3 Weibull
5.2.4 Normal
5.1.
Introduccin
o
de una variable aleatoria continua X podr describirse mediante una curva de densidad (como
a
un histograma idealizado), que representaba frecuencias relativas como areas bajo la curva. Si
en un histograma hacemos tender la amplitud del intervalo de clase a cero tendremos un nmero
u
innito de intervalos, convirtindose el histograma en un nmero innito de barras de grosor
e
u
innitesimal, dispuestas de modo continuo (histograma idealizado). De esta forma, llegar
amos a
la que llamamos en el tema 1 curva (o funcin) de densidad, y que denotaremos como f (x).
o
Recordemos esto rpidamente usando el siguiente ejemplo:
a
Ejemplo 5.1.: Los siguientes histogramas representan los datos recogidos en clase de la
variable aleatoria X = altura en cent
metros de las chicas (qu son muy grandes!) que estudian
e
estad
stica en Diseo en la UJI este curso:
n
67
68
Cap
tulo 5. Variables aleatorias continuas
155
160
165
170
175
180
185
155
160
165
(a)
170
175
180
185
145
(b)
150
155
160
165
170
175
180
185
(c)
Figura 5.1: Histogramas de frecuencias relativas del ejemplo 5.1., variando la amplitud de los
intervalos de clase, hasta llegar a un histograma idealizado, la curva de densidad (c)
Cada uno de los modelos que veremos (y los que no veremos) tiene asociado su funcin de
o
densidad y a travs de ella podremos calcular probabilidades de distintos sucesos. La forma de
e
calcular probabilidades para variables continuas diere de la que usamos en el tema anterior para
variables discretas. Ahora para calcular la probabilidad de un suceso deber
amos calcular el area
comprendida entre el eje x y la funcin de densidad (o sea, integrar), para los valores sealados
o
n
por el suceso.
Ejemplo 5.2.: Si quisiramos conocer la probabilidad de que un chico de la clase (qu tame
e
bin son muy grandes!) midiera entre 175 y 185 cm, P(175 X 185), debemos calcular el area
e
160
165
170
175
180
185
190
195
200
Segn las reglas de probabilidad, tendremos que el rea total bajo la funcin de densidad
u
a
o
es siempre 1. Adems, puesto que la integral de un punto al mismo punto vale cero (el area de
a
una barra con grosor un punto es nula, mira el grco 5.1 (c) y recuerda la ultima observacin
a
o
del punto 1.5.), se tiene que para variables continuas, la probabilidad de que una variable
aleatoria continua tome un valor puntual es cero. As en el ejemplo 5.1., P( X = 168.96
,
) = 0, por ejemplo. Por esta razn, para cualquier variable continua X se cumple: P( a X b)
o
= P( a < X b) = P( a < X < b) = P( a X < b), o sea, PARA VARIABLES CONTINUAS
F
jate que esta ultima propiedad no se cumple para las variables discretas (que se estu
508 Estad
stica. ETDI. Curs 2005/06
69
5.1. Introduccin
o
).]
Existe gran cantidad de modelos para variables continuas. En clase veremos este ao la
n
Normal. En prcticas
a
se introducirn otros modelos: uniforme, exponencial, Weibull. Estas
a
dos ultimas distribuciones tienen aplicacin en abilidad. Adems en el tema siguiente usaremos
o
a
otras como la t de Student, 2 Chi-cuadrado y F de Snedecor. Cada una de ellas tiene una curva
de densidad y viene caracterizada por uno/s parmetros.
a
Como ya hemos dicho, para conocer la probabilidad de sucesos para variables continuas deber
amos integrar, sin embargo, para algunos modelos es posible expresar de forma anal
tica el
A modo de resumen aclaratorio: cada modelo continuo viene determinado por su funcin
o
de densidad, f . Hay que tener claro que la funcin de densidad, f , NO da probabilidades, sino
o
el area bajo dicha funcin. Para calcular probabilidades hay que usar F , la funcin de distribucin
o
o
o
acumulada.]
.
70
5.2.
5.2.1.
Cap
tulo 5. Variables aleatorias continuas
Distribuciones continuas
i Distribucin uniforme(a,b)
o
Es la distribucin que sigue una variable aleatoria X que toma valores en un intervalo [a,b]
o
con la misma probabilidad. Por ejemplo, las calculadoras cient
cas con la tecla RAN o Rnd
generan valores aleatorios de una variable uniforme entre 0 y 1. Su funcin de densidad y su
o
funcin de distribucin tienen la siguiente forma:
o
o
1
0.9
0.9
0.8
0.8
0.7
0.7
0.6
0.6
0.5
0.5
0.4
0.4
0.3
0.3
0.2
0.2
0.1
0
0.5
0.1
0.5
1.5
0
0.5
(a)
0.5
1.5
(b)
f (x; a, b) =
1
ba
(b a)2
a+b
si a < x < b
, 2 =
; =
en otro caso
2
12
F (x; a, b) =
xa
ba
5.2.2.
si x < a
si a < x < b
si x > b
i Distribucin exponencial()
o
Es usada muchas veces para modelizar el comportamiento de variables aleatorias del tipo
tiempo transcurrido hasta el fallo de un componente industrial o tiempo que se tarda en
completarse un proceso determinado. La funcin de densidad y funcin de distribucin de una
o
o
o
exponencial de parmetro tienen la siguiente forma:
a
508 Estad
stica. ETDI. Curs 2005/06
71
1.8
0.9
1.6
0.8
1.4
0.7
1.2
0.6
0.5
0.8
0.4
0.6
0.3
0.4
0.2
0.2
0.1
0
0.5
0.5
1.5
2.5
0
0.5
0.5
(a)
1.5
2.5
(b)
f (x; ) =
1
1
0
si x 0
2
x si x > 0 ; = , = 2
e
F (x; ) =
0
si x 0
1 ex si x > 0
5.2.3.
i Distribucin Weibull(,)
o
72
Cap
tulo 5. Variables aleatorias continuas
1.8
1.6
1.4
1.2
0.8
0.6
0.4
0.2
0
0.5
0.5
1.5
2.5
3.5
4.5
Figura 5.4: En azul y continua: Weibull(1,1), en rojo y puntos: Weibull(1,2), en verde y rayas:
Weibull(1,0.95)
A continuacin, aparece la expresin de su funcin de densidad:
o
o
o
f (x; , ) =
x1 ex
si x 0
si x > 0
Como ya se ha dicho, la distribucin Weibull puede emplearse para modelar el tiempo hasta
o
presentarse un fallo en muchos sistemas f
sicos diferentes. Los parmetros de esta distribucin
a
o
permiten gran exibilidad para modelizar sistemas en los que el nmero de fallos aumenta con
u
el tiempo (por ejemplo, el desgaste), disminuye con el tiempo (algunos semiconductores) o permanece constante (fallos provocados por causas externas al sistema). En la siguiente pgina
a
http : //www.itl.nist.gov/div898/handbook/apr/apr.htm podris encontrar un cap
e
tulo dedicado a la abilidad.
5.2.4.
! Distribucin Normal(, )
o
2
La distribucin Normal o Gaussiana es muy importante puesto que se utiliza para modelar
o
much
simos fenmenos aleatorios; adems incluso se usa para aproximar otras distribuciones.
o
a
La distribucin Normal aproxima lo observado en muchos procesos de medicin sin errores siso
o
temticos, por ejemplo medidas f
a
sicas del cuerpo humano ( X = altura de las jvenes eso
o
n
paolasejemplo 5.1., X = altura de los jvenes espaolesejemplo 5.2., X = longitud del
n
dedo
ndice de los niosejemplo 1.3.) (el prximo curso en Ergonom lo comprobaris nuevan
o
a
e
73
0.4
0.4
0.35
0.35
0.35
0.3
0.3
0.3
0.25
0.25
0.25
0.2
0.2
0.2
0.15
0.15
0.15
0.1
0.1
0.1
0.05
0.05
0.05
0
4
0
4
(b)
0
6
(c)
Figura 5.6: (a) Normal(0,1); (b) Un cambio en la media, supone una traslacin: Normal(0,1)
o
en azul y continua, Normal(3,1) en rojo y punteada; (c) Un cambio en la varianza, supone un
cambio en la variabilidad, pero el area bajo la curva sigue siendo 1, por ello tienen distinta altura:
508 Estad
stica. ETDI. Curs 2005/06
74
Cap
tulo 5. Variables aleatorias continuas
xR
(y)2
1
e 22 dy
2 2
2
(z) = P (Z z) =
x2
1
e 2 dx
2
Z N (0, 1)
75
P (Z 2,33) =
O sea, P (Z z) = 1 - P (Z z), P (Z z) = 1 - P (Z z), P (Z z) = P (Z z).
Aydate de un grco si lo necesitas.
u
a
(a)
(b)
(c)
(recuerda
problema 9 del tema 1, hecho en clase). O sea, si X N(, 2 ), P (a < X < b)
a
b
= P ( < Z < ) = P (Z < b ) - P (Z < a )
F
jate que para estandarizar, dividimos por la desviacin t
o pica , NO por la varianza 2 ].
F
jate que como la Normal es simtrica respecto su media , para X N(, 2 ): P (X )
e
508 Estad
stica. ETDI. Curs 2005/06
76
Cap
tulo 5. Variables aleatorias continuas
0.6826
0.9544
+ 2
b Ejemplo 5.6.: Una compaa vende sacos de pienso de 5 kg. (segn la etiqueta).
n
u
Por cada saco que venda conteniendo menos de 5 kg., ha de pagar una multa. Las mquinas
a
empaquetadoras no pueden garantizar un peso exacto de pienso por cada saco, as que el peso
de los sacos se distribuye Normalmente con una media de 5.13 kg. y una desviacin t
o pica =
0.08kg.
1. Qu proporcin de sacos pesa menos de 5kg.?
e
o
2. Cul es el peso w tal que el 80 % de los sacos pesa menos de w? (w es el 80-simo percentil)
a
e
3. La mquina puede ajustarse para cambiar el peso medio . Suponiendo que la desviacin
a
o
t
pica no cambia, qu valor deber adoptar para que unicamente el 1 % de las bolsas
e
a
508 Estad
stica. ETDI. Curs 2005/06
77
5.3.
Recordemos que nuestro objetivo es inferir sobre la POBLACION. Nosotros slo contamos con
o
una muestra de la poblacin. Cmo generalizar ms all de un conjunto de datos particular?
o
o
a
a
El primer paso para el desarrollo de una base para la inferencia estad
stica es encontrar un
modelo probabil
stico de las muestras que nos permita utilizarlas para inferir informacin sobre
o
la poblacin de la que se han extra
o
do: el muestreo aleatorio simple.
Existen diversas tcnicas de extraccin de muestras de una poblacin (como vereremos
e
o
o
seguidamente). Nosotros nos centraremos en la ms simple:
a
Estad
stico: es cualquier funcin de las variables X1 , X2 , ..., XN que constituyen una
o
muestra aleatoria. Algunos ejemplos son:
Media de muestreo:
X=
X1 + X2 + ... + XN
N
Varianza de muestreo:
S2 =
N
i=1 (Xi
X)2
N 1
508 Estad
stica. ETDI. Curs 2005/06
78
Cap
tulo 5. Variables aleatorias continuas
Un estad
stico es una variable aleatoria por ser funcin de variables aleatorias, por lo cual
o
tiene una distribucin que se llama distribucin de muestreo.
o
o
[
Nota: denotamos con maysculas los estad
u
sticos de muestreo por ser variables aleatorias,
de esta forma se distinguen de las cantidades muestrales (x y s2 , por ejemplo) que vimos en el
tema 1, que corresponden a una muestra concreta y tienen un valor numrico concreto.]
e
Aunque a lo largo de este curso siempre supondremos que nuestra muestra se ha obtenido
por muestreo aleatorio simple, existen otros tipos de muestreo.
Un objetivo primordial de los procedimientos de muestreo es conseguir que la muestra sea
representativa de la poblacin (como la poblacin, pero en tamao reducido). Acabamos de
o
o
n
presentar el muestreo aleatorio simple, que se usar cuando los elementos de la poblacin sean
a
o
homogneos respecto a la caracter
e
stica a estudiar. Pero si disponemos de algn tipo de informau
cin sobre la poblacin ser coveniente emplearla a la hora de seleccionar la muestra. Un ejemplo
o
o
a
clsico son las encuesta de opinin (en Diseo conceptual: obtencin de informacin conocida a
a
o
n
o
o
nivel personal), donde los elementos (personas) de la poblacin son (o pueden serlo) heterogneas
o
e
en razn a su sexo, edad, profesin, etc. En estos casos interesar que la muestra tuviera una
o
o
a
composicin anloga a la poblacin, lo cual se conseguir mediante muestreo estraticado.
o
a
o
a
Muestreo estraticado: los elementos de la poblacin se dividen en clases o estratos. La
o
muestra se toma asignando un nmero de miembros a cada estrato (pueden usarse distintos criu
terios: proporcional al tamao relativo del estrato en la poblacin, proporcional a la variabilidad
n
o
del estrato, considerando costes, ...) y escogiendo los elementos por muestreo aleatorio simple
dentro de cada estrato.
Ejemplo 5.7.: en este ejemplo, estar bien dividir los elementos segn su nivel econmico,
a
u
o
y por ejemplo dividirlos segn la zona de la ciudad en que habiten: zona centro (clase alta), zona
u
intermedia (clase media), barrios perifricos (clase baja).
e
Ejemplo 5.8.: queremos conocer la resistencia de los plsticos que hay en un almacn. Los
a
e
plsticos provienen de dos fabricantes distintos. Ser mejor considerar dos estratos (cada fabria
a
cante), que los plsticos como un todo y muestrear sin distincin, porque puede que la distribucin
a
o
o
sea diferente en cada estrato.
Muestreo por conglomerados: se utiliza si la poblacin se encuentra de manera natural
o
agrupada en conglomerados, que podemos considerar como una muestra representativa de la
poblacin. La muestra se toma seleccionando algunos conglomerados al azar y dentro de ellos
o
analizando todos sus elementos o una muestra aleatoria simple.
Ejemplo 5.7.: siguiendo con este ejemplo, dentro de cada estrato (zona de la ciudad) podemos hacer divisiones en calles, las calles ser conglomerados ya que podemos considerarlas
an
homogneas respecto a la caracter
e
stica a estudiar.
Ejemplo 5.9.: supongamos que queremos analizar el dimetro de unas tuercas que tenemos
a
almacendas en cajas. Ser ms conveniente seleccionar al azar unas cajas y dentro de ellas rea a
508 Estad
stica. ETDI. Curs 2005/06
79
alizar un muestreo aleatorio simple que llevar a cabo un muestreo aleatorio simple, pues esto
implicar seguramente abrir muchas ms cajas.
a
a
Las ideas de estraticacin y conglomerado son opuestas: la estraticacin funciona tanto
o
o
mejor cuanto mayor sean las diferencias entre los estratos y ms homogneos sean stos ina
e
e
ternamente; los conglomerados funcionan si hay muy pocas diferencias entre ellos y son muy
heterogneos internamente.
e
Muestreo sistemtico: cuando los elementos de la poblacin estn ordenados en listas, se
a
o
a
usa el muestreo sistemtico. Si la poblacin es de tamao N y la muestra deseamos que sea de
a
o
n
tamao n, tomaremos k como el entero ms prximo a N/n, elegiremos un elemento al azar entre
n
a
o
los k primeros, por ejemplo el n1 , despus tomaremos los elementos n1 + k, n1 + 2k, etc, hasta
e
completar la muestra.
Como se ha visto en el ejemplo 5.7, los distintos tipos de muestreo pueden emplearse conjuntamente. Por ejemplo, en el anlisis de dimetros de tuercas en cajas provenientes de dos
a
a
fabricantes distintos (juntamos las ideas de los ejemplos 5.8 y 5.9).
Para resolver esta cuestin podemos emplear los llamados planes de muestreo. Estos podemos
o
clasicarlos en:
a) Planes de aceptacin/rechazo: los ms conocidos son:
o
a
las normas japonesas JIS Z 9002
las normas norteamricanas Milatary Standard MIL- STD- 105D; UNE 66020
e
o
Los muestreos pueden ser simples, dobles, mltiples y (en su caso extremo) secuencial (un
u
muestreo es secuencial cuando despus de cada observacin se toma una de las siguientes decie
o
siones: aceptar el lote, rechazarlo o seguir con el muestreo).
b) Planes de control recticativo: los lotes rechazados se inspeccionan al 100 % sustituyendo
los elementos defectuosos. Los ms usados son los de Dodge-Romig.
a
Las tablas de estos planes y una explicacin ms detallada sobre muestreo podis encontrarlos
o
a
e
por ejemplo en Johnson, Pea (vol. I) y sobre todo en cualquier libro sobre Control de Calidad.
n
En ellos podris tambin encontrar la relacin entre el
e
e
o
ndice de capacidad (para cumplir con las
especicaciones de calidad) y la frecuencia de inspeccin.
o
508 Estad
stica. ETDI. Curs 2005/06
80
Cap
tulo 5. Variables aleatorias continuas
5.4.
i En fotocopias
5.5.
Distribuciones en el muestreo
i En fotocopias.
0.4
0.8
0.35
0.7
0.3
0.6
0.25
0.1
0.09
0.5
0.08
0.07
0.06
0.2
0.3
0.1
0.04
0.4
0.15
0.05
0.2
0.03
0.02
0.1
0.05
0.01
10
15
20
(a)
25
30
35
40
0
5
2
10
(b) t3
0.5
1.5
2.5
(c) F(4,20)
508 Estad
stica. ETDI. Curs 2005/06
3.5
4.5
220
),
por tanto
0.3085 = P (X < 190) = P ( X < 190 ) = P (Z < 190 ) = 1 - P (Z 190 ), por tanto
a
P (Z 190 ) = 0.6915 y entonces mirando la tabla y teniendo en cuenta la simetr de la
190
normal: = 0,5
Tenemos 2 ecuaciones y 2 incgnitas: 220 - = , 190 + = 0.5, se resuelve y se obtiene
o
= 200 y = 20
2. P (195 < X < 215) = P ( 195 < X < 215 ) = P ( 195200 < Z < 215200 ) = P (0,25 <
20
20
Z < 0,75) = P (Z < 0,75) - P (Z < 0,25) = P (Z < 0,75) - (1 P (Z < 0,25)) = (tabla)
= 0,7734 - (1 0,5987) = 0.3721
3. 0.8 = P (X a) = P ( X a ) = P (Z a200 ) = P (Z a200 ), consultando la
20
20
tabla: 0,84 = a200 , y por tanto a = 183,2 horas
20
1. La duracin de cierto motor pequeo sigue una distribucin Normal con media 10 aos y
o
n
o
n
desviacin t
o pica 1.5 aos.
n
a) Cul es la probabilidad de que un motor dure menos de 7 aos?
a
n
b)
El fabricante se compromete a cambiar gratis todos aquellos motores que fallen durante
el tiempo de garant Si est dispuesto a reemplazar slo el 3 % de los motores, de
a.
a
o
qu duracin debe ser la garant que ofrezca?
e
o
a
82
Cap
tulo 5. Variables aleatorias continuas
83
10. La dimensin principal de ciertas piezas tiene una distribucin Normal(150, 2 =0.4) y el
o
o
intervalo de tolerancia es (149,150.4). Se pide:
a) La proporcin esperada de defectuosas resultantes de dicho proceso
o
b)
El percentil 40 de la distribucin
o
b)
i Supongamos que el tiempo, en minutos, desde el momento en que llegas a la parada del
bus hasta que llega el primer autobs se modeliza mediante una distribucin exponencial
u
o
con = 0.37. Encuentra las probabilidades de los siguientes sucesos:
a) El siguiente bus llega entre 2 y 4 minutos despus que t llegas
e
u
b)
i La gente que frecuenta un cierto karaoke tiene una probabilidad de 0.4 de levantarse
y cantar. Cierto d hay 150 personas dentro del karaoke. Cul es la probabilidad que al
a
a
menos 10 personas se levanten y canten? (supongamos que cada persona toma la decisin
o
independentmente de las otras).
(Sol: 0.9988)
14.
i Un emisor enva una cierta seal. El receptor no lo recibe ntidamente, sino que un
n
determinado ruido que puede modelizarse como una distribucin uniforme en el intervalo
o
[-1,1] se aade a la seal. Cul es la probabilidad que al recibir la seal, sta tenga un
n
n
a
n e
ruido
a) mayor que 0.5?
508 Estad
stica. ETDI. Curs 2005/06
84
Cap
tulo 5. Variables aleatorias continuas
i En una cierta fabricacin mecnica el 96 % de las piezas resulta con longitudes admisio
a
bles (dentro de las tolerancias), un 3 % defectuosas cortas y 1 % defectuosas largas. Calcula
la probabilidad de que:
a) En un lote de 250 piezas sean admisibles 242 o ms
a
b) En un lote de 100 piezas sean cortas 4 o menos
c) En un lote de 1000 piezas haya entre 6 y 12 inclusive largas
(Sol: 0.3156, 0.815, 0.71)
16.
17.
18.
19.
i Un aparato de medida da una lectura que puede considerarse distribuida segn una
u
N(, 2 ), donde es el valor real de la magnitud deseada y 2 = 9. Para mejorar la precisin
o
se decide tomar la media X de n medidas.
a) Calcula el m
nimo n necesario para que la varianza de X sea inferior o igual a 0.1.
b) Con el valor de n obtenido en el apartado anterior, calcula la probabilidad que X se
aparte del valor real en ms de 0.2 unidades.
a
(Sol: 90, P (|X | > 0,2) = 0.5286)
508 Estad
stica. ETDI. Curs 2005/06