Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ZI o
[I]
o
[I1]
< o
en donde o
es el umbral.
5
Fig. 1. Ejemplo de la representacin grca de las zonas de preferencia (ZP) y de indiferencia (ZI)
inducidas por la medida de discrepancia
2.2.2 Probabilidad de una seleccin correcta
De aqu en adelante denotaremos a la seleccin correcta por SC. Entonces, la probabilidad
de una seleccin correcta bajo cualquier conguracin o es
1(oC[o).
Esta probabilidad debe de ser grande si o 21 y pequea si o 21. Siendo nuestro objetivo
seleccionar a la mejor poblacin, centraremos nuestra atencin de SC en ZP. Aunque puede
suceder que en la ZP existan innitas conguraciones lo que complicara en gran medida
el problema de encontrar 1(oC[o). Sin embargo, puede existir una conguracin en ZP en
la cual 1(oC[o) sea mnima. A esta conguracin le llamaremos la conguracin menos
favorable (CMF) y se denotar o
A1
= (o
1,A1
. o
2,A1
. ...o
I,A1
). Cuando esta conguracin
exista centraremos nuestra atencin solamente a ella, puesto que nos brinda una cota inferior
a todas las probabilidades de una seleccin correcta. De esta manera habremos simplicado
el problema.
1(oC[o) _ 1(oC[o
A1
). \o 21.
Es importante aclarar que la o
A1
puede no ser un vector sino tambin puede ser un con-
junto de vectores, lo que explica el porque de su nombre: conguracin menos favorable, sin
6
embargo, es importante notar que 1(oC[o) = 1
para \o CMF.
Hasta aqu tenemos todos los elementos necesarios para poder implementar un procedimiento
de seleccin estadstica. Vamos a ilustrarlo.
Supongamos que tenemos / poblaciones con cierta distribucin conocida, y dentro de estas
queremos seleccionar a la mejor de acuerdo al valor ms grande de un cierto parmetro o
ciertos parmetros de un vector de parmetros o. El primer paso es establecer una estadstica
apropiada 1. Esta estadstica deber ser apropiada de acuerdo al parmetro o parmetros de
inters, as como tambin a la distribucin de las poblaciones y al objetivo del procedimiento.
Denotemos a 1
i
como el valor de la estadstica de la poblacin i sima con i 1. 2. .... /.
Denotemos a 1
[i]
a los estadsticos de orden, entonces tendremos
1
[1]
_ 1
[2]
_ ... _ 1
[I]
.
Como nuestro objetivo es seleccionar a la poblacin que tenga o
[I]
. entonces el procedimiento
de seleccin 1 es simplemente escoger a la poblacin de la que provenga 1
[I]
. Esta manera
de proceder es bastante aceptable, aunque surgen de manera natural dos puntos cruciales
que estn ligados.
1) Estimacin del tamao de las / muestras, elegidas de las poblaciones correspondientes.
2) Estimacin de la verdadera probabilidad de una seleccin correcta.
En este trabajo centraremos nuestra atencin en la estimacin del tamao mnimo muestral
de las / poblaciones de tal manera que podamos tener una conabilidad establecida.
2.2.3 Determinacin del tamao de muestra
Para determinar el tamao de muestra asumimos que el experimento est en la etapa de
diseo, donde requerimos determinar el tamao de muestra de cada poblacin para poder
establecer que el procedimiento de seleccin que hemos descrito nos lleve a una seleccin
correcta con una probabilidad determinada. Sea / el nmero de poblaciones con las que
contamos. Nuestro objetivo es el determinar los tamaos de muestra, :
i
. i 1. 2. .... / de
tal manera que la probabilidad de una seleccin correcta sea al menos un 1
especicado.
Por lo que, para poder implementar esta metodologa el investigador necesita establecer 1
. Hay
que notar que se debe tener 1
1
I
. pues si no lo es, podemos alcanzar tal conabilidad sin
siquiera tener la necesidad de obtener datos. Utilizando la notacin de la seccin anterior
tenemos que nuestro objetivo es obtener los tamaos de muestra mnimos para poder asegurar
lo siguiente:
1(oC[o) _ 1
.
para \o 21.
7
2.3 Generalizacin de los aspectos analticos del problema de seleccin de las : mejores
poblaciones
La losofa del problema de seleccin de las : mejores poblaciones es anloga al contexto
de la seleccin de la "mejor "poblacin. El contexto en este caso es el siguiente: queremos
seleccionar al "mejor" grupo de poblaciones, en donde, este grupo esta constituido por :
poblaciones de un total de /. Dada esta situacin, el espacio parametral cambia, pues la
zona de preferencia (ZP) y la zona de indiferencia (ZI) son modicadas, veamos porque:
tenemos / poblaciones y nuestro objetivo es seleccionar a las : "mejores" dentro de s-
tas, donde las : mejores sern las que tengan los parmetros o ms grandes (Estamos
suponiendo que / _ 2). Es decir, en notacin de estadsticas de orden, queremos selec-
cionar a o
[I]
. o
[I1]
. .... o
[Ic+1]
.Bajo esta notacin estamos considerando a todos los parmet-
ros o
[1]
. o
[2]
. .... o
[I]
. Como queremos seleccionar a las : "mejores" es natural considerar nada
ms la diferencia entre o
[Ic+1]
y o
[Ic]
. pues si la diferencia entre estas nos permite diferen-
ciar a la mejor, tambin lo har la diferencia entre las dems. As, por las propiedades de las
estadsticas de orden, hemos reducido la dimensin del espacio parametral. El espacio que
ha resultado es
c
= (o
[Ic+1]
. o
[Ic]
)[o
[i]
R. i / : + 1. / : R
2
.
Al igual que en el contexto de la seleccin de la mejor poblacin, deniremos como la medida
de discrepancia a:
o(o
[Ic+1]
. o
[Ic]
) = o
[Ic+1]
o
[Ic]
.
Por lo ya antes mencionado, por nuestras limitaciones en la metodologa de medicin y
tambin por las condiciones impuestas por el contexto del problema del investigador, se ja
un umbral, a partir del cual se denen las zonas de preferencia (ZP) y de indiferencia (ZI),
de la siguiente manera:
ZP o
[Ic+1]
o
[Ic]
_ o
ZI o
[Ic+1]
o
[Ic]
< o
en donde o
&
.
Dado que las observaciones tienen distribucin Weibull se tiene lo siguiente
1
)
=
a
j
i=1
1
o
i,)
~
_
j
o
)
. :
)
_
. (1)
donde 1 _ , _ /. A partir de lo anterior se tiene que
1(1
)
) =j
)
= :
)
j
o
)
\ c:(1
)
) =o
2
)
= :
)
j
2o
)
Para la seleccin de las : mejores poblaciones, necesitamos una manera de medir las dis-
crepancias. Una manera de hacerlo es tomando la diferencia de los valores esperados de las
estadsticas. Pero si procedemos de esta manera nos enfrentaremos a una complicacin, que
la distancia estar dependiendo, adems del parmetro de escala, del tamao de la muestra;
9
y eso es algo que no se desea. Evitamos esta complicacin, tomando el cociente de los valores
esperados e introduciendo la restriccin de que en todas las poblaciones tomaremos el mismo
tamao de muestra. Procediendo de esta manera y teniendo en cuenta el anlisis hecho en
la seccin 1.3, tendremos lo siguiente:
o
_
j
[Ic+1]
. j
[Ic]
_
=
j
[Ic]
j
[Ic+1]
=
:j
o
[Ic]
:j
o
[Ic+1]
=
j
o
[Ic]
j
o
[Ic+1]
Notemos que o
: R
2
+
(0. 1]. Teniendo en cuenta de que el objetivo es seleccionar a
las : "mejores" poblaciones que dieran, en cociente, un cierto valor o
&
con respecto a los
parmetros de escala de la distribucin Weibull de las / : poblaciones restantes, el umbral
elegido fue: (o
&
)
o
.
Antes de seguir, introduciremos una restriccin mas, que consiste en que las varianzas mues-
trales sean todas iguales: \ c: (1
)
) = c. para 1 _ , _ /.
3.2 Obtencin del tamao de muestra bajo la probabilidad de una seleccin correcta
El objetivo es determinar el tamao muestral de las poblaciones para seleccionar a las :
"mejores" poblaciones, que dieran de las dems en un cierto umbral. Esta seleccin se har
tomando en consideracin el error que se pueda cometer, establecido en la seccin 1.1. Este
error se cuanticar con la probabilidad con la que se quiera hacer la seleccin correcta.
Por esta razn la probabilidad de seleccin correcta ser funcin del tamao muestral (:)
y depender del umbral que se je (o
o
&
) y de la probabilidad con la que se quiera hacer la
seleccin correcta (1
).
La manera de identicar las : "mejores" poblaciones ser mediante las estadsticas 1
)
dadas
en (1). Denotaremos por 1
())
a las estadsticas de orden, que satisfacen 1
_
1
())
_
= j
[)]
. con
1 _ i _ /. Como se quiere seleccionar a las : "mejores" poblaciones que dieran en un
umbral dado, queremos calcular la probabilidad de que
max
_
1
(1)
. 1
(2)
. .... 1
(Ic)
_
< 1
(Ic+1)
< min
_
1
(Ic+2)
. 1
(Ic+3)
. .... 1
(I)
_
.
puesto que lo nico que nos importa es seleccionar a las : "mejores" poblaciones sin importar
el orden de stas siempre y cuando dieran de las / : restantes en un cierto umbral que se
jar con respecto a la poblacin / : + 1. A partir de esto se tiene la expresin siguiente:
:1
_
max
_
1
(1)
. 1
(2)
. .... 1
(Ic)
_
< 1
(Ic+1)
< min
_
1
(Ic+2)
. 1
(Ic+3)
. .... 1
(I)
__
= 1
(2)
Es fcil ver que (2) es equivalente a
:1[
_
1
(1)
. 1
(2)
. .... 1
(I1)
. 1
(I)
_
C] = 1
(3)
10
en donde C =
_
1
(1)
. 1
(2)
. .... 1
(I1)
. 1
(I)
_
R
I
[0 < 1
(i)
< 1
(Ic+1)
.1
(Ic+1)
< 1
())
< ....
...0 < 1
(Ic+1)
< . con 1 _ i _ / : y / : + 2 _ , _ /. Desarrollando (3) tenemos lo
siguiente:
:1[
_
1
(1)
. 1
(2)
. .... 1
(I1)
. 1
(I)
_
C] =
:
_
1
0
_
1
t
(ks+1)
. . .
_
1
t
(ks+1)
_
t
(ks+1)
0
. . .
_
t
(ks+1)
0
I
)=1
t
n
(j)
1
(j)
c
t
(j)
[j]
(a
(j)
)
_
j
[j]
_
n
(j)
dt
())
dt
(Ic+1)
=
:
_
1
0
t
n1
(ks+1)
c
t
(ks+1)
[ks+1]
(a)
_
j
[ks+1]
_
n
Ic
)=1
_
j
[j]
,a
_
(t
(Ic+1)
)
I
)=Ic+2
_
_
1
_
j
[j]
,a
_
(t
(Ic+1)
)
_
_
dt
(Ic+1)
=
:
_
1
0
_
j
[ks+1]
,a
_
(t
(Ic+1)
)
Ic
)=1
_
j
[j]
,a
_
(t
(Ic+1)
)
I
)=Ic+2
_
_
1
_
j
[j]
,a
_
(t
(Ic+1)
)
_
_
dt
(Ic+1)
= 1
.
donde es la funcin de densidad de la distribucin Gama y es la funcin de distribucin.
Ahora por la restriccin de que las varianzas muestrales son todas iguales a una constante c
tenemos que:
:j
2o
)
= c =j
o
)
=
_
c
:
.
Por el establecimiento de o
&
y por el establecimiento de la medida de discrepancia, tenemos
que el desarrollo anterior se reduce a:
1
= :
_
1
0
_
j
[ks+1]
,a
_
(t
(Ic+1)
)
Ic
)=1
_
j
[j]
,a
_
(t
(Ic+1)
)
I
)=Ic+2
_
_
1
_
j
[j]
,a
_
(t
(Ic+1)
)
_
_
dt
(Ic+1)
(4)
=:
_
1
0
(
_
c
n
,a)
(t
(Ic+1)
)
Ic
)=1
((c
u
)
_
c
n
,a)
(t
(Ic+1)
)
I
)=Ic+2
_
1
(
_
c
n
,a)
(t
(Ic+1)
)
_
dt
(Ic+1)
=:
_
1
0
(
_
c
n
,a)
(t
(Ic+1)
)
_
((c
u
)
_
c
n
,a)
(t
(Ic+1)
)
_
Ic
_
1
(
_
c
n
,a)
(t
(Ic+1)
)
_
c1
dt
(Ic+1)
.
El tamao muestral : que deseamos conocer, es la solucin a esta ecuacin, la cual no tiene
forma cerrada y por lo tanto debemos obtenerla en forma numrica. Para esto, denamos a
la siguiente funcin:
G(:) = :
_
1
0
(
_
c
n
,a)
(t
(Ic+1)
)
_
((c
u
)
_
c
n
,a)
(t
(Ic+1)
)
_
Ic
_
1
(
_
c
n
,a)
(t
(Ic+1)
)
_
c1
dt
(Ic+1)
.
(5)
Reparametrizamos sta funcin de la siguiente manera: sea t
(Ic+1)
=
1
(
_
c
n
,a)
(.
(Ic+1)
). Por
la regla de la cadena sabemos que (,
1
(r))
0
=
oa
)
0
()
1
(a))
. Aplicando este cambio de variable
11
a la funcin de distribucin Gama, tenemos que:
_
1
(
_
c
n
,a)
(r)
_
0
=
dr
0
(
_
c
n
,a)
_
1
(
_
c
n
,a)
(r)
_
=
dr
(
_
c
n
,a)
_
1
(
_
c
n
,a)
(r)
_
.
por lo que (5) se reduce a lo siguiente:
G(:) = :
_
1
0
(
_
c
n
,a)
(t
(Ic+1)
)
_
((c
u
)
_
c
n
,a)
(t
(Ic+1)
)
_
Ic
_
1
(
_
c
n
,a)
(t
(Ic+1)
)
_
c1
dt
(Ic+1)
=
:
_
1
0
(
_
c
n
;n
)
_
1
(
_
c
n
;n
)
(:
(ks+1)
)
__
((
u
)
_
c
n
;n
)
_
1
(
_
c
n
;n
)
(:
(ks+1)
)
__
ks
(
_
c
n
;n
)
_
1
(
_
c
n
;n
)
(:
(ks+1)
)
_
+ ...
...
_
1
(
_
c
n
;n
)
_
1
(
_
c
n
;n
)
(:
(ks+1)
)
__
s1
o:
(ks+1)
(
_
c
n
;n
)
_
1
(
_
c
n
;n
)
(:
(ks+1)
)
_
:
_
1
0
_
((c
u
)
_
c
n
,a)
_
1
(
_
c
n
,a)
(.
(Ic+1)
)
__
Ic _
1 .
(Ic+1)
_
c1
d.
(Ic+1)
= 1
.
A partir del comportamiento de la funcin G(:). el clculo numrico de : se obtiene me-
diante algoritmos de integracin y biseccin, estableciendo inicialmente los valores de el
umbral de separacin de las poblaciones (o
o
&
). el nmero de poblaciones de inters (/ y :),
la probabilidad con la que se desea hacer la seleccin correcta (1
) y el conocimiento de
los parmetros de forma de las poblaciones (,). Estos algoritmos fueron implementados el
programa 1c:c~ :o `nc:t:c|. codicado en C++.
3.3 El programa 1c:c~ :o `nc:t:c|
El desarrollo de la subseccin anterior deja en claro que no existe una expresin cerrada
para el clculo del tamao muestral para la seleccin de las : poblaciones con distribuciones
Weibull con el parmetro de escala mas grande, dentro de un conjunto de / poblaciones.
Es por esta razn que se implement el desarrollo de la seccin anterior en un programa
llamado 1c:c~ :o `nc:t:c|. en el cual los clculos se desarrollan de manera numrica. Se
presenta una gura de la ventana del programa para la obtencin del tamao muestral para
distribuciones Weibull con el mismo parmetro de forma. Para la determinacin del tamao
muestral, al igual que se mostr en la subseccin anterior, el programa necesita como entradas
lo siguiente:
1) La probablidad 1
.
2) Parmetro de forma de las poblaciones Weibull, ,. que en este caso puede ser una esti-
macin de este. En la ventana del programa este parmetro se representar como: 1c: c:ct:o
dc ,o::c.
3) El parmetro de discrepancia, o
&
. el cual en la ventana del programa ser representado
como 1c|tc.
4) El nmero total de poblaciones con el cual se cuenta, 1. que tiene la misma representacin
en la ventana del programa.
5) El nmero de poblaciones que se quiere seleccionar, o. que tiene la misma representacin
en la ventana del programa.
Una vez que se ha establecido los parmetros de entrada en la ventana del programa, se
procede a calcular el tamao muestral requerido. El programa, una vez que calcula este
tamao muestral da como resultados una grca de la variacin de la probabilidad en funcin
13
Fig. 3. Ejemplo de la ventana del programa para la determinacin del tamao muestral para la
seleccin de las s poblaciones Weibull con mayor parmetro de escala dentro de k poblaciones. En
el ejemplo las entradas del programa son del ejemplo presentado
del tamao de muestra. El usuario especica los lmites de la grca, estableciendo el lmite
superior de la probabilidad hasta donde uno quiere ver la grca al igual que establece
el lmite inferior de la probabilidad. Tambin el programa da como resultado el tamao
muestral como funcin de los parmetros de entrada. Se anexa una gura en donde se presenta
en funcionamiento el programa 1c:c~ :o `nc:t:c| con los parmetros del ejemplo que se
presentar a continuacin.
4 Ejemplo
Supongamos que el departamento de asuntos legales de una compaa automovilstica en la
que trabajamos, nos pide seleccionar a los 2 activadores de las bolsas de aire que duren el
mayor tiempo posible en buenas condiciones, para despus, haciendo un estudio de mercado
se seleccione al activador de bolsas de aire que mas convenga para poder despues, determinar
el tiempo de garantia del automvil al cliente. En el laboratorio, tenemos 6 sistemas de
activacin de bolsas de aire y los tiempos de vida de los activadores tienen distribucin
Weibull. Se asume, por la naturaleza del experimento y por los sistemas de activacin que
14
hay en el mercado, que los parmetros de forma de los 6 activadores que se tienen son iguales
a 3. Como el departamento legal junto con el departamento nanciero han determinado que
si se tiene una diferencia en tiempos de vida de un activador o a otro de a lo ms en 1 mes y
medio, les dar igual seleccionar a uno u a otro, entonces elegimos un valor umbral igual a
1.5 meses. Como no se quiere tener prdidas de dinero innecesarias y tampoco se quiere un
desprestigio a la marca del automvil, han jado que se requiere una seleccin correcta con
una probabilidad del 98.5%. Cuantos activadores se necesitan de cada modelo de activadores
de bolsas de aire diseados, para poder hacer una seleccin correcta?, teniendo en cuenta que
para realizar este experimento el costo de todo el inmobiliario del chasis es de $2000 lo1.
Los valores de entrada en el programa 1c:c~ :o `nc:t:c| son en este ejemplo los siguientes:
1) La probabilidad de seleccin correcta: 1
= 0.985.
2) 1c: c:ct:o dc ,o::c = 3 (, = 3).
3) Como la diferencia que queremos observar es de 1.5 meses, tenemos que o
&
= 1c|tc =
.6666 (que es el inverso de 1.5).
4) El nmero total de poblaciones con las que se cuenta es 1 = 6.
5) El nmero de poblaciones que se quiere seleccionar es o = 2.
La solucin arrojada por el programa es 11.59375. lo cual fue redondeado a 12 activadores
para cada poblacin. As, debern someterse a una prueba de vida 12 activadores de cada
proveedor y se eligen como los 2 mejores activadores, a los activadores con mayor tiempo de
vida caracterstica.
5 Conclusiones
El objetivo de este trabajo es determinar el tamao muestral necesario para la seleccin
de las mejores poblaciones, cuando estas tienen distribucin Weibull. Se consideran proced-
imientos de seleccin para la distribucin Weibull y se obtiene un procedimiento numrico
para determinar el tamao muestral necesario.
Debido a que en el caso considerado no hay expresiones cerradas para obtener el tamao
muestral, se desarroll un software (1c:c~ :o`nc:t:c|) para obtener el tamao muestral
necesario para la seleccin correcta de poblaciones.
Como trabajo a futuro se desprende de aqu el estudio de la determinacin del tamao
muestral para la seleccin correcta de las : de / poblaciones distribuidas como Weibull, con
mayor vida caracterstica para parmetros de forma tanto distintos. Una tarea a futuro de
inters es investigar la obtencin del tamao muestral para la seleccin correcta de las mejores
poblaciones, en donde la comparacin se haga no a travs de la vida caracterstica, sino a
15
travs de los cuantiles o a travs de la conabilidad a un tiempo de referencia determinado,
que puede ser un tiempo de garanta o un tiempo de vida til del producto.
6 Bibliografa
[1]. Bechhofer, R. E. (1954). A single-sample multiple decision procedure for ranking means
of normal populations with known variances. Ann. Math. Stat. 25, 16-39.
[2]. Bechhofer, R. E., Hayter, A. J. y Tamhane, A. C. (1991). Designing experiments for
selecting the largest normal mean when the variances are known and unequal: Optimal
sample size allocation. J. Stat. Plan. Infer. 28, 271-289.
[3]. Bechhofer, R. E., Santner, T. J. y Goldsman, D. M. (1995). Design and Analysis of
Experiments for Statistical Selection, Screening, and Multiple Comparisons. Wiley Series
in Probability and Statistics.
[4]. Gibbons, J. D., Olkin, I y Sobel, M. (1977). Selecting and Ordering Populations: A New
Statistical Methodology. New York: John Wiley & Sons.
16