Documentos de Académico
Documentos de Profesional
Documentos de Cultura
EN CIENCIAS E INGENIERÍAS
ARTÍCULO/ARTICLE SECCIÓN/SECTION A
Abstract
Testors, and particularly typical testors, have been used in feature selection and supervised
classification problems. Deterministic algorithms have usually been used to find typical
testors. Recently, a new approach based on evolutionary algorithms has been developed.
A common problem to test the behavior of both approaches is the necessity of knowing,
in advance, the number of typical testors of a given basic matrix. For an arbitrary matrix,
this number can not be known unless all typical testors have been found. Therefore, this
paper introduces, for the first time, a strategy to generate basic matrices for which the
number of typical testors is known without to find them. This method is illustrated with
some examples.
Keywords. Testor theory, algorithm for finding typical testors, fisure selection.
Resumen
Los testores, y en particular los testores típicos, han sido utilizados en problemas de se-
lección de variable y problemas de clasificación supervisada. Comunmente se ha usado
algoritmos determinísticos para hallar testores típicos. A principios de esta decada comen-
zó a desarrollarse un nuevo enfoque basado en algoritmos evolutivos. Un problema común
para probar el comportamiento de ambos métodos es la necesidad de conocer a priori el nú-
mero de testores típicos de una matriz dada. Para una matriz arbitraria, no se puede saber
este número a menos de que se hayan encontrado todos los testores típicos. Por lo tanto,
este trabajo introduce, por primera vez, una estrategia para generar matrices básicas para
las cuales el número de testores típicos es conocido sin necesidad de aplicar un algoritmo
para encontrarlos. Este método se ilustra con algunos ejemplos.
Palabras Clave. Teoría de testores, algoritmos para el cálculo de testores típicos, selección
de variables.
para tratar matrices de dimensiones mayores [12, 13]. Definición 4.- Un conjunto T = {jk1 , . . . , jks } ⊆ J se
denomina testor típico de M si es un testor y tiene la
De manera similar a otros problemas NP (TSP, clique propiedad de tipicidad con respecto a M .
máximo, etc.) [14] es necesario tener un conjunto de
instancias para probar el desempeño de los diferentes Sean a y b dos filas de M .
algoritmos propuestos para calcular los testores típicos.
Por otro lado, teniendo estas matrices el problema de Definición 5.- Decimos que a es menor que b (a < b) si
los testores típicos se convierte en un problema útil para ∀i ai ≤ bi y ∃j tal que aj 6= bj .
evaluar los algoritmos estocásticos de optimización. Definición 6.- a es una fila básica de M si no existe otra
A pesar de esto, los autores no encontraron ningún re- fila menor que a en M .
porte previo sobre la construcción de matrices de prueba
Definición 7.- La matriz básica de M es la matriz M ′
para asesorar el desempeño de las estrategias de búsque- que sólo contiene todas las filas básicas de M .
da de testores típicos Para el problema de los testores
típicos las matrices de prueba deben ser matrices cu- La siguiente proposición es una caracterización de la
yo conjunto de testores típicos puede ser determinado matriz básica.
a priori. Además, deben garantizar poder probar los as-
pectos que influencian el desempeño de los algoritmos Proposición 2.- M ′ es una matriz básica si y sólo si pa-
tales como la dimensión de las matrices, longitud de los ra dos filas a y b cualesquiera, a, b ∈ M ′ existen dos
testores típicos, cantidad de testores típicos, etc. Este ar- columnas i y j tales que ai = bj = 1 y aj = bi = 0.
tículo está organizado de la siguiente manera: primero, Dada una matriz A, denotamos como Ψ∗ (A) al conjunto
introducimos formalmente el concepto de testor típico de todos los testores típicos de A.
para matrices booleanas. Luego, elaboramos resultados
teóricos que sirven de soporte para una herramienta útil Proposición 3.- Ψ∗ (M ) = Ψ∗ (M ′ ).
en la construcción de matrices de prueba. Finalmente,
demostramos la aplicación de esta herramienta generan- De acuerdo con la proposición 3, para obtener el con-
do algunas clases de matrices de prueba. junto Ψ∗ (M ) es conveniente encontrar la matriz M ′ y
luego luego calcular el conjunto Ψ∗ (M ′ ). Teniendo en
cuenta que M ′ tiene menor o igual número de filas que
Metodología M , la eficiencia de los algoritmos debe ser mayor para
M ′ que para M . De hecho, todas las matrices de prueba
Los conceptos de Testor y Testor Típico.
generadas en este ensayo son básicas.
Sea U una colección de objetos, estos objetos se des-
Operadores de matrices y sus propiedades.
criben mediante un conjunto de n características y es-
tán agrupados en l clases. Comparando característica Definimos el operador fusión simple, denotado por ϕ:
a característica de cada par de objetos perteneciente a
diferentes clases, podemos obtener una matriz M =
[mij ]l×n donde mij ∈ {0, 1} y l es el número de pa- ′ ′
res. mij = 1 (0) significa que los objetos del par deno- ϕ : ℜp×q × ℜp×q ⇒ ℜp×(q+q ) , q > 0, p > 0.
tado por i son similares (diferentes) en la característica
j. Sea I = {i1 , . . . , ij } el conjunto de las filas de M Dadas dos matrices A ∈ ℜp×q y B ∈ ℜp×q :
′
Ejemplo 2:
JQ = {j1 , . . . , jq , jq+1 , . . . , j2q ,
Sean
. . . , j(N −1)q+1 , j(N −1)q+2 , . . . , jN q }
1 5
1 0 3 El conjunto JQ se puede particionar en q clases
A= 0 9 yB =
,
2 3 6
7 8
1
JQ = j1 , jq+1 , . . . , j(N −1)q+1 ,
C = θ (A, B) , 2
JQ = j2 , jq+2 , . . . , j(N −1)q+2 , . . . ,
q
entonces JQ = {jq , j2q . . . , jN q } .
k
1 5 1 0 3 Todas las columnas en la misma clase JQ son idén-
k
1 5 2 3 6 ticas y JQ = N , ∀k ∈ {1, . . . , q}. Por otro lado,
0 9 1 0 3 considerando la manera en que se construyó Q se tie-
C =
0 9 2 3 6 ne Ψ∗ (B) ⊂ Ψ∗ (Q). Ahora generamos el conjunto
7 8 1 0 3
G (Ψ∗ (B)). G (Ψ∗ (B)) contiene Ψ∗ (B) y cualquier
7 8 2 3 6 conjunto de etiquetas T ′ obtenida de la sustitución de
una columna de cualquier Ti , i = 1, . . . , ν por cual-
Propiedades del operador θ: quier columna en su misma clase. Teniendo en cuenta
1. θ (θ (A, B) , C) = θ (A, θ (B, C)) = θ (A, B, C). la definición de testor típico, T ′ es un testor típico de
Q, por lo tanto G (Ψ∗ (B)) ⊆ Ψ∗ (Q). Hay N candi-
2. Sean A y B matrices booleanas. Si A y B son matri- datos para seleccionar cada una de las |Ti | columnas de
ces básicas, entonces θ (A, B) es una matriz básica. Ti ,entonces |G (Ψ∗ (B))| = N |T1 | + . . . + N |Tν | .
Nótese que para esta operación ambas matrices deben Ahora pasamos a demostrar que Ψ∗ (Q) ⊆ G (Ψ∗ (B)).
ser básicas. Supongamos que existe un conjunto T ′ tal que T ′ ∈
Alba y Santana Avances, 2010, Vol. 2, Pags. A30-A35
Ψ∗ (Q) y T ′ 6∈ G (Ψ∗ (B)). El conjunto T ′ no puede Teniendo en cuenta que ∀i, i = 1, . . . , m, IA+ = IAi ;
i
contener dos columnas de la misma clase puesto que la submatriz de A determinada por las columnas de JA+
la propiedad de tipicidad de T ′ no sería satisfecha. En- no contiene filas de ceros y cada etiqueta de columna
i
tonces todas las columnas de T ′ son de distintas cla- de JA+ cumple con la propiedad de tipicidad, entonces
ses. Para cada columna de T ′ consideremos el miem- i
JA+ ∈ Ψ∗ (A). La condición 1) está demostrada, pasa-
bro de su clase que pertenece a B. Llamamos TB′ a es- i
por definición, lo cual también contradice nuestra su- A+i tal que ji 6∈ T . Tomamos la fila sm donde sm =
posición. Entonces Ψ∗ (Q) ⊆ G (Ψ∗ (B)). Por lo tanto (sm−1 − 1)nm + jm y s1 = j1 . Teniendo en cuenta las
Ψ∗ (Q) = G (Ψ∗ (B)) y |Ψ∗ (Q)| = |G (Ψ∗ (B))| = características del operador fusión combinatoria, la fila
N |T1 | + . . . + N |Tν | . Fin de la demostración. sm de A tiene un 1 en cada columna ji y ceros en el res-
to de columnas, incluídas las columnas de T . Esto sig-
Ejemplo 3: nifica que existe una fila de ceros en A/T , por lo que T
no es un testor. La suposición de que existe T ∈ Ψ∗ (A)
Sean
1 0 0 es falsa. Fin de la demostración.
B= 0 1 0 y Ejemplo 4:
0 0 1
1 0
A1 = ,
Q = ϕ (B, B, B) 0 1
Ψ∗ (A1 )
1 0 0 1 0 0 1 0 0 = {x1 , x2 },
= 0 1 0 0 1 0 0 1 0 . 1 0 0
0 0 1 0 0 1 0 0 1 A2 = 0 1 0 ,
0 0 1
Entonces
Ψ∗ (Q) = 27. Ψ∗ (A2 ) = {x3 , x4 , x5 }
Sean A1 , . . . , Am m matrices tales que Ai = Ini ∀i ∈ 1 0 1 0 0
{1, . . . , m}. Sean JA1 , . . . , JAm elconjunto de
todas 1 0 0 1 0
las columnas de estas matrices y JAi ∩ JAj = ∅
1 0 0 0 1
∀i, j ∈ {1, . . . , m}, i 6= j. Sea A = θ(A1 , A2 ) = ,
0 1 1 0 0
0 1 0 1 0
Sea A la matriz obtenida al aplicar el operador fusión
0 1 0 0 1
combinatoria a las matrices Ai , es decir:
Ψ∗ (A) = {{x1 , x2 } , {x3 , x4 , x5 }}.
A = θ(A1 , . . . , Am ).
Teorema 2.- Ψ∗ (A) = {Ψ∗ (A1 ), . . . , Ψ∗ (Am )} = {JA1 , Corolario 1.- |Ψ∗ (A)| = m.
. . . , JA m }
Demostración:
Dada la forma en que se construyó la matriz A, esta ma- ∗
= N n1 + . . . +
Corolario 2.- Ψ ϕ A . . . A
triz se puede separar en m submatrices: La submatriz
| {z }
A+1 que contiene las primeras n1 columnas de A, la ma-
N
N nm .
triz A+2 que contiene las siguientes n2 columnas de A y
así hasta la submatriz A+ m que contiene las últimas nm Hemos terminado la presentación de un conjunto de re-
columnas de A. Se puede ver que A+ i solo incluye filas sultados teóricos que son simples en su formulación.
de Ai ∀i ∈ {1, . . . , m}. Aún así, constituyen una herramienta flexible y pode-
rosa para la construcción de matrices de prueba.
Sea JA , JA+ , . . . , JA+
m
el conjunto de columnas y IA ,
1
IA+ , . . . , IA+m
el conjunto de filas de las matrices A, Ejemplos de generación de matrices de prueba. En
1
+ +
A1 , . . ., Am respectivamente. Ahora demostremos que: esta sección se presentan algunas recetas para usar los
resultados previos en la evaluación de los algoritmos de
1) JA , JA+ , . . . , JA+
m
∈ Ψ∗ (A) búsqueda de testores típicos. Cada receta muestra cómo
1
n o evaluar una característica específica de las matrices que
2) Ψ∗ (A) \ JA , JA+ , . . . , JA+
m
= ∅. puede influenciar en el desempeño de los algoritmos.
1
Avances, 2010, Vol. 2, Pags. A30-A35 Alba y Santana
Estas matrices tienen pocos testores típicos que pueden dimensión alta. Pueden ser formadas aplicando el opera-
ser determinados fácilmente. dor fusión combinatoria a un conjunto de matrices iden-
tidad de dimensión relativamente alta: sea Q = θ(In1 ,
Matrices con la misma dimensión y diferente número de
. . . , In2 ), entoces dim(Q) = (n1 . . . nm ) × (n1 . . . nm )
testores típicos.
y |Ψ∗ (Q)| = m.
Supóngase que es necesario estudiar el desempeño de
los algoritmos cuando el número de testores típicos au- Conclusiones
menta. Para analizar la situación, se generan dos matri-
ces de la misma dimensión con una diferencia grande En este trabajo se ha desarrollado un método general pa-
en el número total de testores típicos de cada una. Las ra crear matrices de prueba para evaluar el desempeño
matrices Q1 y Q2 se generan cumpliendo las siguientes de estrategias de búsqueda de testores típicos. El méto-
condiciones: do propuesto está basado en resultados teóricos que son
1.- dim (Q1 ) = dim (Q2 ). simples en su formulación. A pesar de esto, estos resul-
tados son una base sólida para obtener diferentes instan-
2.- |Ψ∗ (Q1 )| 6= |Ψ∗ (Q2 )| cias que nos permiten probar varios casos del problema
de búsqueda de testores típicos.
Dadas estas dos condiciones, proponemos un procedi-
miento para crear estas matrices Q1 y Q2 . Empezando Hemos presentado algunos ejemplos que ilustran cómo
por dos matrices simples B1 y B2 con la misma dimen- generar la instancia necesaria para probar la influencia
sión y distinto número de testores típicos, aplicamos el de una característica particular en el algoritmo de bús-
operador ϕ a cada matriz N veces, obteniendo Q1 y Q2 . queda de testores típicos.
Ilustramos con el siguiente ejemplo: Teniendo en cuenta que hemos introducido una herra-
B1 se toma como I4 y B2 = θ(I2 , I2 ), entonces: mienta general y flexible para la construcción de matri-
ces de prueba, esperamos que este trabajo permita con-
vertir al problema del testor típico en un punto de refe-
Q 1 = ϕ B1 . . . B1 y Q 2 = ϕ B2 . . . B2 . rencia para la evaluación de algoritmos de optimización
| {z } | {z } estocásticos.
N N
Nótese que:
Referencias
dim(Q1 ) = dim Q2 = 4 × 4N
[1] A. N. Dmitriev, Y. I. Zhuravlev and F. Krendeleiev 1966.
Ψ∗ (Q1 ) = N 4 y Ψ∗ (Q2 ) = 2N 2 “On the mathematical principles of patterns and pheno-
mena classification.” Diskretnyi Analiz. 7, 3-15.
Matrices con diferente dimensión y mismo número de
testores típicos. [2] J. Ruiz, M. Lazo, E. Alba. 2001. “An overview of the
concept of testor.” Pattern Recognition. 34, 13-21.
En este caso el objetivo es estudiar el desempeño de los [3] M. Lazo, J. Ruiz. 1995. “Determining the feature rele-
algoritmos cuando el número de testores típicos a en- vance for non classically described objects and a new
contrar es el mismo, pero las matrices tienen diferente algorithm to compute typical fuzzy testors.” Pattern Re-
dimensión. cognition Letters. 16, 1259-1265.
Dos matrices Q1 y Q2 se generan cumpliendo las si- [4] A. Carrasco, J. Martínez 2004. “Feature selection for
guientes condiciones: natural disaster texts classification Using testors.” In-
telligent Data Engineering and Automated Learning.
1.- dim (Q1 ) 6= dim (Q2 ). Springer- Verlag. 8, 424-429.
2.- |Ψ∗ (Q1 )| = |Ψ∗ (Q2 )| [5] R. Vázquez, S. Godoy. 2007. “Using testor theory to re-
duce the dimension of neural network models.” Special
De manera similar al ejemplo anterior, el procedimiento Issue in Neural Networks and Associative Memories. 28,
empieza con dos matrices simples: las matrices identi- 93-103.
dad In1 e In2 . El operador ϕ se aplica a ambas matrices [6] J. Santos, A. Carrasco, J. Martínez. 2004. “Feature selec-
N1 y N2 veces respectivamente, obteniendo Q1 y Q2 . tion using typical testors applied to estimation of stellar
Para satisfacer ambas condiciones es necesario que n1 6= parameters.” Computación y Sistemas. 8, 015-023.
n2 y N1n1 = N2n2 (Corolario 2). [7] A. Pons, R. Gil, R. Berlanga. 2007. “Using typical tes-
tors for feature selection in text categorization.” Progress
Por ejemplo, podemos escoger los siguientes paráme- in Pattern Recognition, Image Analysis and Applica-
tros: n1 = 2, N1 = 9, n2 = 4, N2 = 3. tions. 12th Iberoamericann Congress on Pattern Recog-
nition. Springer Verlag.
Matrices con dimensión alta y pocos testores típicos.
[8] A. Pons, J. Ruiz, R. Berlanga. 2004. “A method for the
Estas matrices son importantes para estudiar la sensi- automatic summarization of topic-based clusters of do-
bilidad de los algoritmos en problemas con pocas so- cuments.” 8th Iberoamerican Congress on Pattern Re-
luciones (testores típicos) y un espacio de búsqueda de cognition. Springer Verlag. 596-603.
Alba y Santana Avances, 2010, Vol. 2, Pags. A30-A35