Está en la página 1de 17

DETERMINACIN DEL TAMAO MUESTRAL

PARA LA SELECCIN DE POBLACIONES CON


DISTRIBUCIN WEIBULL

Alejandro Quiroz Zrate & Enrique Villa Diharce

Comunicacin Tcnica No I-06-13/28-08-2006
(CC/CIMAT)






Determinacin del tamao muestral para la seleccin de
poblaciones con distribucin Weibull.
Alejandro Quiroz Zrate
1
Enrique Villa Diharce
2
aquiroz@cimat.mx
1
, villadi@cimat.mx
2
Resumen
La necesidad de reducir costos y elevar la calidad de los productos en la industria, ha
llevado a las empresas a la dinmica de ahorrar y mejorar la calidad de sus productos
continuamente. Un factor muy importante en esta tarea son los proveedores de los
componentes que se utilizan como materia prima. Por esto es que con gran frecuencia
se tiene el problema de seleccionar el mejor proveedor de entre varios que ofrecen un
componente determinado. De acuerdo a las nuevas iniciativas de calidad, el costo ha
dejado de ser el criterio nico para esta seleccin, agregndose ahora la conabilidad
como un factor muy importante. En este artculo se presenta un procedimiento de
seleccin para la distribucin Weibull. La eleccin de esta distribucin fue de acuerdo
a un criterio de conabilidad, por ser esta distribucin una de las mas comunes en
la modelacin de tiempos a la falla.
1 Introduccin
El problema de seleccin de poblaciones se encuentra en diferentes contextos de aplicacin,
en donde contamos con varias poblaciones y debemos elegir una de ellas, que sea la mejor
de acuerdo a algn criterio de comparacin. En la industria es comn disponer de varios
proveedores de un determinado componente y tener que elegir al proveedor cuyo producto
sea el mejor, de acuerdo a algn criterio de comparacin. Cuando la conabilidad del pro-
ducto es la caracterstica determinante, entonces la comparacin de los proveedores debe
llevarse a cabo considerando mtricas de conabilidad, como por ejemplo, la vida media o la
conabilidad a un cierto nivel determinado. Los datos de los componentes que nos dan infor-
macin de su nivel de conabilidad, son los tiempos de vida, razn por la requerimos conocer
procedimientos de comparacin de poblaciones, para poblaciones cuyas distribuciones corres-
pondan a distribuciones de tiempos de vida. Tomando en cuenta que una distribucin de
tiempos de vida muy frecuente es la distribucin Weibull, en este trabajo desarrollamos un
procedimiento para determinar el tamao muestral necesario de las diferentes poblaciones
que comparamos, cuando la distribucin es Weibull.
En la seccin 2, se expone el planteamiento general del problema de seleccin de poblaciones.
En esta seccin se dan los elementos necesarios para poder obtener el tamao muestral
necesario para lograr una determinada probabilidad de seleccin correcta.
Preprint submitted to Elsevier Science 25 March 2006
En la seccin 3, se desarrolla el procedimiento que nos permite determinar el tamao mues-
tral requerido para seleccionar las mejores : poblaciones de entre un grupo de / (/ :)
poblaciones con distribucin Weibull. La comparacin se hace en trminos del parmetro
de escala de las distribuciones Weibull, considerando que estas tienen el mismo parmetro
de forma. Tambin se muestra el funcionamiento general del programa elaborado (1c:c~ :o
`nc:t:c|) para este trabajo para el clculo de los tamaos muestrales.
En la seccin 4, se muestra un ejemplo de seleccin de proveedores de bolsas de aire para
automviles, aqu se comparan seis proveedores y se elijen a los dos mejores.
En la seccin 5, se exponen las conclusiones del trabajo y se describe el trabajo a desarrollar
posteriormente como continuacin del presente estudio.
2 Planteamiento general
Supongamos que tenemos / poblaciones, y que dentro de estas existe una que es la "mejor"
poblacin, donde "mejor" es denido por el investigador de acuerdo al contexto del problema.
Nuestro objetivo es identicar esa poblacin, a la mejor poblacin. Como cualquier proce-
dimiento estadstico, las tcnicas de seleccin estn basadas en los resultados de muestras
aleatorias tomadas de las / poblaciones. Para poder identicar a la mejor poblacin necesita-
mos establecer un procedimiento o regla. Este procedimiento estar sujeto a la distribucin
de las / poblaciones y al parmetro de inters que tomamos como referencia para denir y
seleccionar a la mejor poblacin. Para esto, establecemos una medida de discrepancia entre
los parmetros de referencia de las poblaciones bajo comparacin.
Debido a que las discrepancias entre las poblaciones se estiman por las discrepancias mues-
trales correspondientes y estas tienen una variabilidad aleatoria natural, requerimos que las
discrepancias muestrales entre dos poblaciones sea mayor que un valor umbral para identi-
car una diferencia entre estas poblaciones. Este valor umbral lo denir el investigador de
acuerdo al contexto del problema o los instrumentos. As, si la mejor poblacin diere de
las dems cuando menos en un valor mnimo preestablecido podremos identicarla. Existe
la posibilidad de que la poblacin de la cual se obtuvo el mejor parmetro estimado (de
acuerdo al procedimiento establecido) no tenga en realidad el mejor parmetro. Por este
motivo es que se necesita cuanticar la posibilidad de cometer errores. Primero analizaremos
la naturaleza del error que se puede cometer en un procedimiento de seleccin estadstico,
despus estableceremos una medida de discrepancia y en base a esta y a la naturaleza del
error se basar nuestra cuanticacin de los errores.
2
2.1 La losofa de la seleccin de poblaciones
El establecimiento de un procedimiento de seleccin induce la denicin de una variable
aleatoria A. Esta variable aleatoria depender de la muestra que obtengamos de cada
poblacin y del parmetro de inters con el cual efectuaremos la seleccin. Vamos a suponer
que esta variable aleatoria, para simplicar el problema del procedimiento estadstico de se-
leccin, tiene alguna distribucin 1(r; o). Las diferencias que se registren en la obtencin de
las / mediciones en A. reejan las diferencias entre los / parmetros respectivos, o
1
. o
2
. . . . . o
I
Las observaciones son tomadas de manera independiente y estn distribuidas de la siguiente
manera:
Poblacin 1 2 . . . /
Distribucin 1(r; o
1
) 1(r; o
2
) . . . 1(r; o
I
)
Hay que tener en consideracin que se est construyendo toda una metodologa de seleccin
alrededor de un parmetro totalmente desconocido en cada una de las poblaciones, los o
i
,
para poder hacer inferencia sobre su comportamiento.
Para poder establecer el error que se puede cometer en un proceso de seleccin, supongamos
que la mejor poblacin tiene el parmetro o
(I)
. Esta notacin esta sujeta a la denicin de
mejor poblacin y al procedimiento de seleccin. Ahora, intuitivamente es razonable obtener
el estimador

o
i
para cada o
i
de las observaciones correspondientes y establecer que la mejor
poblacin es la que tenga

o
(I)
. Este procedimiento parece razonable pero la posibilidad de
cometer un error siempre existe, puesto que podemos saber de que poblacin proviene

o
(I)
.
ms no sabemos si esa poblacin es la "mejor".
Con el n de establecer el tipo de error que se puede cometer en un procedimiento estadstico
de seleccin, analicemos los errores en el caso del paradigma de Neyman-Pearson en la teora
de pruebas de hiptesis. No se puede hacer una comparacin directa por la diferencia losca
entre estos procedimientos. En teora de prueba de hiptesis, bajo el paradigma de Neyman-
Pearson, la idea losca radica en que el investigador tiene una hiptesis acerca del fenmeno
en cuestin y utilizar la maquinaria de este paradigma para corroborar o no la hiptesis. En
un procedimiento estadstico de seleccin, la losofa es muy distinta, el investigador utiliza
lo que ya sabe de las poblaciones para inferir cual es la "mejor" poblacin, ms el nunca
estableci hiptesis alguna. Es por esto, que lo ms que se puede hacer es una analoga, y eso
es lo que haremos. Los errores que se pueden cometer en una prueba de hiptesis aplicando
el paradigma de Neyman-Pearson son: el de rechazar H
0
(la hiptesis nula) cuando es cierta,
llamado error Tipo I o el de no rechazar H
0
cuando esta es falsa, llamado error Tipo II.
3
Situacin Real
H
0
verdadera H
0
falsa
Decisin del No rechazar H
0
No hay error Error (1ijo11)
Estadstico Rechazar H
0
Error (1ijo1) No hay error
En una prueba clsica con la hiptesis nula de homogeneidad entre los parmetros, el error
de Tipo I solamente se puede cometer en el subconjunto del espacio parametral en donde
o
1
= o
2
= . . . = o
I
y el error de Tipo II solamente se puede cometer en el subconjunto del
espacio parametral en donde la igualdad no se mantiene. En un procedimiento de seleccin,
la seleccin es correcta si el valor de o de la poblacin seleccionada es el "mejor", esto es o
(I)
.
Hay que tener en cuenta que nuestro objetivo no es estimar o
(I)
. ni tomar decisin alguna
sobre el valor de o
(I)
sino solamente seleccionar a la poblacin que tiene el valor de o igual
a o
(I)
. Por lo que solamente se comete error si la seleccin es incorrecta, esto es, armar que
el valor de o de la poblacin seleccionada es el "mejor" cuando no lo es. Es por esta razn
que en los procedimientos de seleccin existe el anlogo del error de Tipo II pero no existe
el anlogo del error de Tipo I. Supongamos que la poblacin de la cual proviene o
(I)
es la ,
sima.
Situacin Real
Decisin del o
(I)
= o
)
o
(I)
,= o
)
Estadstico Armar que

o
(I)
proviene de la , sima poblacin X
2.2 Aspectos analticos del problema de seleccin de la mejor poblacin
2.2.1 Zona de Indiferencia y Zona de Preferencia
Recordemos el planteamiento general. Supongamos que tenemos / poblaciones y que nuestro
objetivo es seleccionar a la "mejor" dentro de stas. (Estamos suponiendo que / _ 2). Dadas
estas suposiciones, el espacio parametral es R
I dim(0)
. pues el parmetro o no necesaria-
mente es unidimensional. Podemos tener varios procedimientos de seleccin, / = 1. 2. .... :.
Estos procedimientos de seleccin estarn en funcin del o de los parmetros sobre los que se
har la seleccin. Para elegir el procedimiento que nos de el menor error de seleccin, cuan-
ticaremos los procedimientos mediante una probabilidad de seleccin correcta. Denamos
a 1
I
como la probabilidad de una seleccin correcta utilizando el procedimiento de seleccin
/. El procedimiento q ser el mejor procedimiento de seleccin si satisface que:
1
j
_ 1
I
. \/ 1. 2. .... :.
Sin embargo, como el espacio parametral consta de una innidad de elementos, habr zonas
de ste en donde q sea el mejor procedimiento y otras zonas en las que / sea el mejor
4
procedimiento, donde / 1. 2. .... :q. Esta manera de proceder no es del todo eciente,
pero nos proporciona una manera de proceder. Para poder establecer el mejor procedimiento
analizaremos el espacio parametral, dividindolo en zonas de valores de o en donde
podamos establecer la preferencia de hacer una seleccin correcta y en otras en donde no
podemos establecer preferencia entre distintas selecciones. Estas zonas estarn en funcin de
la limitacin y la existencia de errores en la medicin o en el umbral jado por el investigador.
Las regiones son:
1) una en la cual las distancias entre los parmetros de las poblaciones sean grandes o
distinguibles del umbral, llamada zona de preferencia (ZP) y
2) otra en donde la distancias entre los parmetros de las poblaciones sean pequeas o
indistinguibles, llamada zona de indiferencia (ZI).
Para ejemplicar como se particiona el espacio parametral veamos lo siguiente:
Supongamos que tenemos / poblaciones y que nuestro objetivo es seleccionar a la "mejor"
dentro de stas, donde la mejor ser la poblacin que tenga el parmetro o ms grande (Es-
tamos suponiendo que / _ 2). Es decir, en notacin de estadsticas de orden: o
[1]
. o
[2]
. .... o
[I]
tal que o
[i]
_ o
[i+1]
y queremos seleccionar o
[I]
. Bajo esta notacin estamos considerando a
todos los parmetros o
[1]
. o
[2]
. .... o
[I]
. Ahora, como queremos seleccionar a la poblacin que
tenga o
[I]
. es natural considerar nada ms la diferencia entre o
[I]
y o
[I1]
. pues si la diferencia
entre estas nos permite diferenciar a la mejor, tambin lo har la diferencia entre las dems.
As, por las propiedades de las estadsticas de orden, hemos reducido la dimensin del espacio
parametral. El espacio que ha resultado es
= (o
[I1]
. o
[I]
)[o
[i]
R R
2
.
Pero, cmo podremos dividir al espacio parametral en las zonas 21 y 21? Denamos como
o(o
[I1]
. o
[I]
) = o
[I]
o
[I1]
.
la medida de discrepancia que utilizaremos. Debido a nuestras limitaciones en los procesos
de medicin, errores en los experimentos o las condiciones impuestas por el contexto del
problema del investigador, se ja un umbral. A partir de este umbral se denen las zonas de
preferencia (ZP) y de indiferencia (ZI), de la siguiente manera:
ZP o
[I]
o
[I1]
_ o

ZI o
[I]
o
[I1]
< o

en donde o

es el umbral.
5
Fig. 1. Ejemplo de la representacin grca de las zonas de preferencia (ZP) y de indiferencia (ZI)
inducidas por la medida de discrepancia
2.2.2 Probabilidad de una seleccin correcta
De aqu en adelante denotaremos a la seleccin correcta por SC. Entonces, la probabilidad
de una seleccin correcta bajo cualquier conguracin o es
1(oC[o).
Esta probabilidad debe de ser grande si o 21 y pequea si o 21. Siendo nuestro objetivo
seleccionar a la mejor poblacin, centraremos nuestra atencin de SC en ZP. Aunque puede
suceder que en la ZP existan innitas conguraciones lo que complicara en gran medida
el problema de encontrar 1(oC[o). Sin embargo, puede existir una conguracin en ZP en
la cual 1(oC[o) sea mnima. A esta conguracin le llamaremos la conguracin menos
favorable (CMF) y se denotar o
A1
= (o
1,A1
. o
2,A1
. ...o
I,A1
). Cuando esta conguracin
exista centraremos nuestra atencin solamente a ella, puesto que nos brinda una cota inferior
a todas las probabilidades de una seleccin correcta. De esta manera habremos simplicado
el problema.
1(oC[o) _ 1(oC[o
A1
). \o 21.
Es importante aclarar que la o
A1
puede no ser un vector sino tambin puede ser un con-
junto de vectores, lo que explica el porque de su nombre: conguracin menos favorable, sin
6
embargo, es importante notar que 1(oC[o) = 1

para \o CMF.
Hasta aqu tenemos todos los elementos necesarios para poder implementar un procedimiento
de seleccin estadstica. Vamos a ilustrarlo.
Supongamos que tenemos / poblaciones con cierta distribucin conocida, y dentro de estas
queremos seleccionar a la mejor de acuerdo al valor ms grande de un cierto parmetro o
ciertos parmetros de un vector de parmetros o. El primer paso es establecer una estadstica
apropiada 1. Esta estadstica deber ser apropiada de acuerdo al parmetro o parmetros de
inters, as como tambin a la distribucin de las poblaciones y al objetivo del procedimiento.
Denotemos a 1
i
como el valor de la estadstica de la poblacin i sima con i 1. 2. .... /.
Denotemos a 1
[i]
a los estadsticos de orden, entonces tendremos
1
[1]
_ 1
[2]
_ ... _ 1
[I]
.
Como nuestro objetivo es seleccionar a la poblacin que tenga o
[I]
. entonces el procedimiento
de seleccin 1 es simplemente escoger a la poblacin de la que provenga 1
[I]
. Esta manera
de proceder es bastante aceptable, aunque surgen de manera natural dos puntos cruciales
que estn ligados.
1) Estimacin del tamao de las / muestras, elegidas de las poblaciones correspondientes.
2) Estimacin de la verdadera probabilidad de una seleccin correcta.
En este trabajo centraremos nuestra atencin en la estimacin del tamao mnimo muestral
de las / poblaciones de tal manera que podamos tener una conabilidad establecida.
2.2.3 Determinacin del tamao de muestra
Para determinar el tamao de muestra asumimos que el experimento est en la etapa de
diseo, donde requerimos determinar el tamao de muestra de cada poblacin para poder
establecer que el procedimiento de seleccin que hemos descrito nos lleve a una seleccin
correcta con una probabilidad determinada. Sea / el nmero de poblaciones con las que
contamos. Nuestro objetivo es el determinar los tamaos de muestra, :
i
. i 1. 2. .... / de
tal manera que la probabilidad de una seleccin correcta sea al menos un 1

especicado.
Por lo que, para poder implementar esta metodologa el investigador necesita establecer 1

y como se ve en la seccin anterior, se necesita tambin la especicacin del umbral o

. Hay
que notar que se debe tener 1


1
I
. pues si no lo es, podemos alcanzar tal conabilidad sin
siquiera tener la necesidad de obtener datos. Utilizando la notacin de la seccin anterior
tenemos que nuestro objetivo es obtener los tamaos de muestra mnimos para poder asegurar
lo siguiente:
1(oC[o) _ 1

.
para \o 21.
7
2.3 Generalizacin de los aspectos analticos del problema de seleccin de las : mejores
poblaciones
La losofa del problema de seleccin de las : mejores poblaciones es anloga al contexto
de la seleccin de la "mejor "poblacin. El contexto en este caso es el siguiente: queremos
seleccionar al "mejor" grupo de poblaciones, en donde, este grupo esta constituido por :
poblaciones de un total de /. Dada esta situacin, el espacio parametral cambia, pues la
zona de preferencia (ZP) y la zona de indiferencia (ZI) son modicadas, veamos porque:
tenemos / poblaciones y nuestro objetivo es seleccionar a las : "mejores" dentro de s-
tas, donde las : mejores sern las que tengan los parmetros o ms grandes (Estamos
suponiendo que / _ 2). Es decir, en notacin de estadsticas de orden, queremos selec-
cionar a o
[I]
. o
[I1]
. .... o
[Ic+1]
.Bajo esta notacin estamos considerando a todos los parmet-
ros o
[1]
. o
[2]
. .... o
[I]
. Como queremos seleccionar a las : "mejores" es natural considerar nada
ms la diferencia entre o
[Ic+1]
y o
[Ic]
. pues si la diferencia entre estas nos permite diferen-
ciar a la mejor, tambin lo har la diferencia entre las dems. As, por las propiedades de las
estadsticas de orden, hemos reducido la dimensin del espacio parametral. El espacio que
ha resultado es

c
= (o
[Ic+1]
. o
[Ic]
)[o
[i]
R. i / : + 1. / : R
2
.
Al igual que en el contexto de la seleccin de la mejor poblacin, deniremos como la medida
de discrepancia a:
o(o
[Ic+1]
. o
[Ic]
) = o
[Ic+1]
o
[Ic]
.
Por lo ya antes mencionado, por nuestras limitaciones en la metodologa de medicin y
tambin por las condiciones impuestas por el contexto del problema del investigador, se ja
un umbral, a partir del cual se denen las zonas de preferencia (ZP) y de indiferencia (ZI),
de la siguiente manera:
ZP o
[Ic+1]
o
[Ic]
_ o

ZI o
[Ic+1]
o
[Ic]
< o

en donde o

es el umbral denido por el investigador de acuerdo al contexto del problema.


El establecimiento de la probabilidad de seleccin correcta ser anloga al caso de la seleccin
de la "mejor" poblacin, puesto que el espacio parametral
c
es solamente una proyeccin
distinta del espacio paramatral .
8
3 Seleccin de las : mejores poblaciones con distribucin Weibull, con los :
parmetros de escala ms grande con parmetros de forma conocidos
En esta seccin desarrollaremos la idea general de la obtencin del tamao muestral que
nos permitir seleccionar las : poblaciones dentro de un conjunto de / poblaciones, con
distribucin Weibull, que tengan el parmetro de escala ms grande. El desarrollo de este
procedimiento de seleccin esta basado en los trabajos para la seleccin de las : poblaciones,
con distribucin normal, que tengan la media mas grande dentro de un conjunto de / pobla-
ciones. ( [1], [2],[3] y [4]). En el contexto de las poblaciones con distribucin normal, se
supondr que las varianzas son conocidas. En este contexto, en que las poblaciones tienen
distribucin Weibull, suponemos que los parmetros de forma son conocidos e iguales.
La seleccin de la mejor poblacin dentro de un conjunto de / poblaciones es un caso par-
ticular del caso general que aqu se muestra, ya que este caso se tiene cuando : = 1.
3.1 Planteamiento del problema
Se tienen / poblaciones independientes con distribucin Weibull. De estas se han recolectado
las observaciones 1
i,)
~ \ci/n||(j
i
. ,) donde 1 _ i _ / y 1 _ , _ :
I
.Aqu :
I
es el tamao
de la muestra que elegimos de la / c:i:c poblacin. En este contexto, estamos asumiendo
que el parmetro de escala j
i
es desconocido y que el parmetro de forma, ,. es conocido.
Caracterizaremos a cada poblacin por su parmetro de escala y deniremos como las :
mejores poblaciones a las que tengan los : parmetros de escala ms grandes. Esta seleccin
se desear con una probabilidad de al menos 1

y de acuerdo al contexto del problema en


general se desea que los : parmetros de escala mas grandes se diferencien de los restantes
/ : en al menos o

&
.
Dado que las observaciones tienen distribucin Weibull se tiene lo siguiente
1
)
=
a
j

i=1
1
o
i,)
~
_
j
o
)
. :
)
_
. (1)
donde 1 _ , _ /. A partir de lo anterior se tiene que
1(1
)
) =j
)
= :
)
j
o
)
\ c:(1
)
) =o
2
)
= :
)
j
2o
)
Para la seleccin de las : mejores poblaciones, necesitamos una manera de medir las dis-
crepancias. Una manera de hacerlo es tomando la diferencia de los valores esperados de las
estadsticas. Pero si procedemos de esta manera nos enfrentaremos a una complicacin, que
la distancia estar dependiendo, adems del parmetro de escala, del tamao de la muestra;
9
y eso es algo que no se desea. Evitamos esta complicacin, tomando el cociente de los valores
esperados e introduciendo la restriccin de que en todas las poblaciones tomaremos el mismo
tamao de muestra. Procediendo de esta manera y teniendo en cuenta el anlisis hecho en
la seccin 1.3, tendremos lo siguiente:
o

_
j
[Ic+1]
. j
[Ic]
_
=
j
[Ic]
j
[Ic+1]
=
:j
o
[Ic]
:j
o
[Ic+1]
=
j
o
[Ic]
j
o
[Ic+1]
Notemos que o

: R
2
+
(0. 1]. Teniendo en cuenta de que el objetivo es seleccionar a
las : "mejores" poblaciones que dieran, en cociente, un cierto valor o

&
con respecto a los
parmetros de escala de la distribucin Weibull de las / : poblaciones restantes, el umbral
elegido fue: (o

&
)
o
.
Antes de seguir, introduciremos una restriccin mas, que consiste en que las varianzas mues-
trales sean todas iguales: \ c: (1
)
) = c. para 1 _ , _ /.
3.2 Obtencin del tamao de muestra bajo la probabilidad de una seleccin correcta
El objetivo es determinar el tamao muestral de las poblaciones para seleccionar a las :
"mejores" poblaciones, que dieran de las dems en un cierto umbral. Esta seleccin se har
tomando en consideracin el error que se pueda cometer, establecido en la seccin 1.1. Este
error se cuanticar con la probabilidad con la que se quiera hacer la seleccin correcta.
Por esta razn la probabilidad de seleccin correcta ser funcin del tamao muestral (:)
y depender del umbral que se je (o
o
&
) y de la probabilidad con la que se quiera hacer la
seleccin correcta (1

).
La manera de identicar las : "mejores" poblaciones ser mediante las estadsticas 1
)
dadas
en (1). Denotaremos por 1
())
a las estadsticas de orden, que satisfacen 1
_
1
())
_
= j
[)]
. con
1 _ i _ /. Como se quiere seleccionar a las : "mejores" poblaciones que dieran en un
umbral dado, queremos calcular la probabilidad de que
max
_
1
(1)
. 1
(2)
. .... 1
(Ic)
_
< 1
(Ic+1)
< min
_
1
(Ic+2)
. 1
(Ic+3)
. .... 1
(I)
_
.
puesto que lo nico que nos importa es seleccionar a las : "mejores" poblaciones sin importar
el orden de stas siempre y cuando dieran de las / : restantes en un cierto umbral que se
jar con respecto a la poblacin / : + 1. A partir de esto se tiene la expresin siguiente:
:1
_
max
_
1
(1)
. 1
(2)
. .... 1
(Ic)
_
< 1
(Ic+1)
< min
_
1
(Ic+2)
. 1
(Ic+3)
. .... 1
(I)
__
= 1

(2)
Es fcil ver que (2) es equivalente a
:1[
_
1
(1)
. 1
(2)
. .... 1
(I1)
. 1
(I)
_
C] = 1

(3)
10
en donde C =
_
1
(1)
. 1
(2)
. .... 1
(I1)
. 1
(I)
_
R
I
[0 < 1
(i)
< 1
(Ic+1)
.1
(Ic+1)
< 1
())
< ....
...0 < 1
(Ic+1)
< . con 1 _ i _ / : y / : + 2 _ , _ /. Desarrollando (3) tenemos lo
siguiente:
:1[
_
1
(1)
. 1
(2)
. .... 1
(I1)
. 1
(I)
_
C] =
:
_
1
0
_
1
t
(ks+1)
. . .
_
1
t
(ks+1)
_
t
(ks+1)
0
. . .
_
t
(ks+1)
0
I

)=1
t
n
(j)
1
(j)
c

t
(j)

[j]
(a
(j)
)
_
j

[j]
_
n
(j)
dt
())
dt
(Ic+1)
=
:
_
1
0
t
n1
(ks+1)
c

t
(ks+1)

[ks+1]
(a)
_
j

[ks+1]
_
n
Ic

)=1

_
j

[j]
,a
_
(t
(Ic+1)
)
I

)=Ic+2
_
_
1
_
j

[j]
,a
_
(t
(Ic+1)
)
_
_
dt
(Ic+1)
=
:
_
1
0

_
j

[ks+1]
,a
_
(t
(Ic+1)
)
Ic

)=1

_
j

[j]
,a
_
(t
(Ic+1)
)
I

)=Ic+2
_
_
1
_
j

[j]
,a
_
(t
(Ic+1)
)
_
_
dt
(Ic+1)
= 1

.
donde es la funcin de densidad de la distribucin Gama y es la funcin de distribucin.
Ahora por la restriccin de que las varianzas muestrales son todas iguales a una constante c
tenemos que:
:j
2o
)
= c =j
o
)
=
_
c
:
.
Por el establecimiento de o

&
y por el establecimiento de la medida de discrepancia, tenemos
que el desarrollo anterior se reduce a:
1

= :
_
1
0

_
j

[ks+1]
,a
_
(t
(Ic+1)
)
Ic

)=1

_
j

[j]
,a
_
(t
(Ic+1)
)
I

)=Ic+2
_
_
1
_
j

[j]
,a
_
(t
(Ic+1)
)
_
_
dt
(Ic+1)
(4)
=:
_
1
0

(
_
c
n
,a)
(t
(Ic+1)
)
Ic

)=1

((c

u
)

_
c
n
,a)
(t
(Ic+1)
)
I

)=Ic+2
_
1
(
_
c
n
,a)
(t
(Ic+1)
)
_
dt
(Ic+1)
=:
_
1
0

(
_
c
n
,a)
(t
(Ic+1)
)
_

((c

u
)

_
c
n
,a)
(t
(Ic+1)
)
_
Ic
_
1
(
_
c
n
,a)
(t
(Ic+1)
)
_
c1
dt
(Ic+1)
.
El tamao muestral : que deseamos conocer, es la solucin a esta ecuacin, la cual no tiene
forma cerrada y por lo tanto debemos obtenerla en forma numrica. Para esto, denamos a
la siguiente funcin:
G(:) = :
_
1
0

(
_
c
n
,a)
(t
(Ic+1)
)
_

((c

u
)

_
c
n
,a)
(t
(Ic+1)
)
_
Ic
_
1
(
_
c
n
,a)
(t
(Ic+1)
)
_
c1
dt
(Ic+1)
.
(5)
Reparametrizamos sta funcin de la siguiente manera: sea t
(Ic+1)
=
1
(
_
c
n
,a)
(.
(Ic+1)
). Por
la regla de la cadena sabemos que (,
1
(r))
0
=
oa
)
0
()
1
(a))
. Aplicando este cambio de variable
11
a la funcin de distribucin Gama, tenemos que:
_

1
(
_
c
n
,a)
(r)
_
0
=
dr

0
(
_
c
n
,a)
_

1
(
_
c
n
,a)
(r)
_
=
dr

(
_
c
n
,a)
_

1
(
_
c
n
,a)
(r)
_
.
por lo que (5) se reduce a lo siguiente:
G(:) = :
_
1
0

(
_
c
n
,a)
(t
(Ic+1)
)
_

((c

u
)

_
c
n
,a)
(t
(Ic+1)
)
_
Ic
_
1
(
_
c
n
,a)
(t
(Ic+1)
)
_
c1
dt
(Ic+1)
=
:
_
1
0

(
_
c
n
;n
)
_

1
(
_
c
n
;n
)
(:
(ks+1)
)
__

((

u
)

_
c
n
;n
)
_

1
(
_
c
n
;n
)
(:
(ks+1)
)
__
ks

(
_
c
n
;n
)
_

1
(
_
c
n
;n
)
(:
(ks+1)
)
_
+ ...
...
_
1
(
_
c
n
;n
)
_

1
(
_
c
n
;n
)
(:
(ks+1)
)
__
s1
o:
(ks+1)

(
_
c
n
;n
)
_

1
(
_
c
n
;n
)
(:
(ks+1)
)
_
:
_
1
0
_

((c

u
)

_
c
n
,a)
_

1
(
_
c
n
,a)
(.
(Ic+1)
)
__
Ic _
1 .
(Ic+1)
_
c1
d.
(Ic+1)
= 1

.
A partir del comportamiento de la funcin G(:). el clculo numrico de : se obtiene me-
diante algoritmos de integracin y biseccin, estableciendo inicialmente los valores de el
umbral de separacin de las poblaciones (o
o
&
). el nmero de poblaciones de inters (/ y :),
la probabilidad con la que se desea hacer la seleccin correcta (1

) y el conocimiento de
los parmetros de forma de las poblaciones (,). Estos algoritmos fueron implementados el
programa 1c:c~ :o `nc:t:c|. codicado en C++.
3.3 El programa 1c:c~ :o `nc:t:c|
El desarrollo de la subseccin anterior deja en claro que no existe una expresin cerrada
para el clculo del tamao muestral para la seleccin de las : poblaciones con distribuciones
Weibull con el parmetro de escala mas grande, dentro de un conjunto de / poblaciones.
Es por esta razn que se implement el desarrollo de la seccin anterior en un programa
llamado 1c:c~ :o `nc:t:c|. en el cual los clculos se desarrollan de manera numrica. Se
presenta una gura de la ventana del programa para la obtencin del tamao muestral para
distribuciones Weibull con el mismo parmetro de forma. Para la determinacin del tamao
muestral, al igual que se mostr en la subseccin anterior, el programa necesita como entradas
lo siguiente:
1) La probablidad 1

, con la cual se requiere realizar la seleccin correcta de las : poblaciones


12
Fig. 2. Ejemplo del comportamiento de la funcin G(n):
con el parmetro de escala mas grande. En la ventana del programa este parmetro estar
representado mediante 1

.
2) Parmetro de forma de las poblaciones Weibull, ,. que en este caso puede ser una esti-
macin de este. En la ventana del programa este parmetro se representar como: 1c: c:ct:o
dc ,o::c.
3) El parmetro de discrepancia, o

&
. el cual en la ventana del programa ser representado
como 1c|tc.
4) El nmero total de poblaciones con el cual se cuenta, 1. que tiene la misma representacin
en la ventana del programa.
5) El nmero de poblaciones que se quiere seleccionar, o. que tiene la misma representacin
en la ventana del programa.
Una vez que se ha establecido los parmetros de entrada en la ventana del programa, se
procede a calcular el tamao muestral requerido. El programa, una vez que calcula este
tamao muestral da como resultados una grca de la variacin de la probabilidad en funcin
13
Fig. 3. Ejemplo de la ventana del programa para la determinacin del tamao muestral para la
seleccin de las s poblaciones Weibull con mayor parmetro de escala dentro de k poblaciones. En
el ejemplo las entradas del programa son del ejemplo presentado
del tamao de muestra. El usuario especica los lmites de la grca, estableciendo el lmite
superior de la probabilidad hasta donde uno quiere ver la grca al igual que establece
el lmite inferior de la probabilidad. Tambin el programa da como resultado el tamao
muestral como funcin de los parmetros de entrada. Se anexa una gura en donde se presenta
en funcionamiento el programa 1c:c~ :o `nc:t:c| con los parmetros del ejemplo que se
presentar a continuacin.
4 Ejemplo
Supongamos que el departamento de asuntos legales de una compaa automovilstica en la
que trabajamos, nos pide seleccionar a los 2 activadores de las bolsas de aire que duren el
mayor tiempo posible en buenas condiciones, para despus, haciendo un estudio de mercado
se seleccione al activador de bolsas de aire que mas convenga para poder despues, determinar
el tiempo de garantia del automvil al cliente. En el laboratorio, tenemos 6 sistemas de
activacin de bolsas de aire y los tiempos de vida de los activadores tienen distribucin
Weibull. Se asume, por la naturaleza del experimento y por los sistemas de activacin que
14
hay en el mercado, que los parmetros de forma de los 6 activadores que se tienen son iguales
a 3. Como el departamento legal junto con el departamento nanciero han determinado que
si se tiene una diferencia en tiempos de vida de un activador o a otro de a lo ms en 1 mes y
medio, les dar igual seleccionar a uno u a otro, entonces elegimos un valor umbral igual a
1.5 meses. Como no se quiere tener prdidas de dinero innecesarias y tampoco se quiere un
desprestigio a la marca del automvil, han jado que se requiere una seleccin correcta con
una probabilidad del 98.5%. Cuantos activadores se necesitan de cada modelo de activadores
de bolsas de aire diseados, para poder hacer una seleccin correcta?, teniendo en cuenta que
para realizar este experimento el costo de todo el inmobiliario del chasis es de $2000 lo1.
Los valores de entrada en el programa 1c:c~ :o `nc:t:c| son en este ejemplo los siguientes:
1) La probabilidad de seleccin correcta: 1

= 0.985.
2) 1c: c:ct:o dc ,o::c = 3 (, = 3).
3) Como la diferencia que queremos observar es de 1.5 meses, tenemos que o

&
= 1c|tc =
.6666 (que es el inverso de 1.5).
4) El nmero total de poblaciones con las que se cuenta es 1 = 6.
5) El nmero de poblaciones que se quiere seleccionar es o = 2.
La solucin arrojada por el programa es 11.59375. lo cual fue redondeado a 12 activadores
para cada poblacin. As, debern someterse a una prueba de vida 12 activadores de cada
proveedor y se eligen como los 2 mejores activadores, a los activadores con mayor tiempo de
vida caracterstica.
5 Conclusiones
El objetivo de este trabajo es determinar el tamao muestral necesario para la seleccin
de las mejores poblaciones, cuando estas tienen distribucin Weibull. Se consideran proced-
imientos de seleccin para la distribucin Weibull y se obtiene un procedimiento numrico
para determinar el tamao muestral necesario.
Debido a que en el caso considerado no hay expresiones cerradas para obtener el tamao
muestral, se desarroll un software (1c:c~ :o`nc:t:c|) para obtener el tamao muestral
necesario para la seleccin correcta de poblaciones.
Como trabajo a futuro se desprende de aqu el estudio de la determinacin del tamao
muestral para la seleccin correcta de las : de / poblaciones distribuidas como Weibull, con
mayor vida caracterstica para parmetros de forma tanto distintos. Una tarea a futuro de
inters es investigar la obtencin del tamao muestral para la seleccin correcta de las mejores
poblaciones, en donde la comparacin se haga no a travs de la vida caracterstica, sino a
15
travs de los cuantiles o a travs de la conabilidad a un tiempo de referencia determinado,
que puede ser un tiempo de garanta o un tiempo de vida til del producto.
6 Bibliografa
[1]. Bechhofer, R. E. (1954). A single-sample multiple decision procedure for ranking means
of normal populations with known variances. Ann. Math. Stat. 25, 16-39.
[2]. Bechhofer, R. E., Hayter, A. J. y Tamhane, A. C. (1991). Designing experiments for
selecting the largest normal mean when the variances are known and unequal: Optimal
sample size allocation. J. Stat. Plan. Infer. 28, 271-289.
[3]. Bechhofer, R. E., Santner, T. J. y Goldsman, D. M. (1995). Design and Analysis of
Experiments for Statistical Selection, Screening, and Multiple Comparisons. Wiley Series
in Probability and Statistics.
[4]. Gibbons, J. D., Olkin, I y Sobel, M. (1977). Selecting and Ordering Populations: A New
Statistical Methodology. New York: John Wiley & Sons.
16

También podría gustarte