Está en la página 1de 48

Proyectos y temas de tesis en Computacin

Adolfo Guzmn Arenas


Centro de Investigacin en Computacin (CIC), Instituto Politcnico Nacional (IPN) 1
a.guzman@acm.org

RESUMEN. Se describen varios trabajos o proyectos en las reas de computacin,


informtica, software, comunicaciones, Internet, que podran servir, segn su nivel de
dificultad, como trabajos finales de cursos, trabajos de laboratorio, trabajos de investigacin,
tesinas, tesis de licenciatura, tesis de maestra, y quiz (algunos cuantos) tesis de doctorado, 2
segn la complejidad del problema y qu tan bien se desea resolverlos. El autor est en la
mejor disposicin de dirigir unos cuantos de ellos. Es til que el interesado posea ciertos
conocimientos o habilidades, descritos en cada proyecto.
Antecedentes. En 1980-85, el autor public un informe tcnico parecido. 3 Esta nueva
versin es muy distinta de la anterior, dados los avances de nuestra disciplina.
Cmo proceder. Si usted desea desarrollar alguno de estos temas, enveme (por correo
electrnico est bien) una propuesta conteniendo lo siguiente:
(1) Una mejor descripcin del problema escogido. Acote el problema. Modifique su
enunciado para ajustarse a sus necesidades, a su gusto. Quite lo vago. Reemplcelo por
algo ms concreto, segn usted lo necesita, segn usted lo entiende. Defnalo mejor, a su
gusto. Cambie el ttulo, si se requiere. [media cuartilla de extensin, est bien]
(2) Describa su solucin y proponga una arquitectura para resolver (1). Qu va a construir,
a programar? Cules son sus partes? Cmo interaccionan entre s, como funcionarn?
Haga un diagrama que muestre su arquitectura o estructura. Si es necesario, al disear su
arquitectura, consulte otras fuentes, revistas, compaeros, etc. Esta parte es trabajo
creativo, de la mente. [dos cuartillas de extensin, estn bien]
(3) Plan de accin. Cmo va a construir, a fabricar (2)? Qu herramientas va a usar? Va a
usar una base de datos relacional? Va a programar en C? La interfaz de usuario, la va a
1

Av. Juan de Dios Btiz esq. Miguel Othn de Mendizabal Ote. Unidad Profesional Lpez Mateos del
IPN, Col. Nueva Industrial Vallejo. Edificio CIC. 07738 Mxico, D. F. (A Guzmn): +52 (55) 5729 6000
x56569, x56507. a.guzman@acm.org Blog: a-guzman.blogspot.com skype: a.guzman Pg. Web:
http://alum.mit.edu/www/aguzman
2
En cuanto a los trabajos que desembocan en tesis de doctorado: En el CIC el estudiante de doctorado debe
publicar un artculo en una revista ISI (revista internacional, de prestigio) para poder obtener su grado de
doctor. Esto requiere que su trabajo de tesis (a) sea novedoso, que no se haya hecho antes; (b) que sea una
contribucin, una aportacin. Una mejora a lo que ya se tiene, una mejor manera (ms rpida, ms precisa,
ms general, ms entendible, con menos errores... algo mejor en algn aspecto) que la forma en que ahora se
resuelve el problema; (c) que no sea trivial, que no sea un ligero cambio o mejora a como ya se resuelve. No
se trata de hacer un peine con 101 dientes, porque no hay peines con 101 dientes. Adems, las tesis que yo
dirijo deben tener manifestaciones concretas (algo material o tangible que exhibir): un algoritmo escrito en
un lenguaje de programacin, funcionando y con resultados, con ciertas pruebas, o una pieza de hardware
(un artefacto electrnico, una tarjeta, un DSP con su programa hecho para resolver algo especfico. No me
gusta dirigir tesis que presentan mtodos o metodologas o estrategias o modelos (a menos que sean modelos
matemticos, verificables, demostrables) o "conjuntos de herramientas" para ver para qu sirven...
3
Ciento veinticinco proyectos y temas de tesis en Computacin. Reporte AHR 80 7, IIMAS UNAM. 1980.
Segunda edicin: Reporte AHR 80 7a., 1981, IIMAS. 3a. edicin: Reporte AHR 81 19,1981, IIMAS. 4a.
edicin: en el CINVESTAV, IPN.
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

1 de 48

hacer en Visual Basic? En Java? En PhP? Si es para Internet, sabe Java? Applets,
servlets? Tiene usted a su alcance las herramientas necesarias? (Si necesita un cohete
para llegar a la luna, y no tiene el cohete, no va a ir a la luna). Las herramientas que usted
propone, las sabe usar usted? Tiene usted las habilidades requeridas para la solucin del
problema? Explique su plan de accin. Incluya un plan de trabajo, con fechas y resultados
a entregar. Liste al final del plan los resultados a entregar, e incluya: Como resultado de
todo este trabajo, al final del mismo se tendr un sistema llamado xx capaz de yy y de
zz. Cuenta usted con todo el tiempo que se necesita? O trabaja, est casado, toma un
curso de ingls, vive lejos de su trabajo y, adems, aprende a tocar la guitarra? [Una
cuartilla].
(4) Direccin. Qu espera de m? En qu partes quiere que lo dirija? Desea que le haga
crticas? Sugerencias, cambios? [Un prrafo]
Con su propuesta en mis manos, yo le contestar rpidamente (10 das) si le puedo ayudar,
dirigir, ser til. Note que no tengo ms informacin adicional sobre el tema.
Los nmeros que llevan mis artculos se refieren a la lista que aparece en mi
curriculum vitae. La mayora de ellos pueden leerse o copiarse gratuitamente, en texto
completo, de mi pgina Web, o mejor de http://academia.edu. Ms informacin al final de
este documento.

1.

Clasitex. Anlisis de documentos escritos en espaol para encontrar


sus temas principales

OTROS NOMBRES (ttulos alternos). Clasificador automtico de textos segn su contenido.


Indexador de documentos en un rbol temtico de conceptos.
REA (dentro de la Computacin). Inteligencia Artificial, Procesamiento de lenguaje natural,
procesamiento de textos en espaol.
DESCRIPCIN. En qu consiste el proyecto. Contine desarrollando el rbol de conceptos
que permite que Clasitex encuentre los temas principales a los que se refiere un artculo
escrito en espaol. Haga el desmembrador de cada palabra en raz, prefijo, sufijo. Haga el
propagador de votos. Haga el mdulo de votacin a la francesa o de dos vueltas. Desarrolle
las otras sugerencias que aparecen en mi artculo de Clasitex en el Journal of Expert
Systems, enero 1998. Haga un programa en C que utilice dispersin al azar o hashing para
encontrar rpidamente los conceptos en el rbol de conceptos. Pero sobre todo, agregue
unos cincuenta mil nodos al rbol de conceptos.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Bsqueda inteligente
de texto. Se buscan los conceptos, no las palabras. Un artculo que habla de defensa
delantero, portero, gol, tiro de esquina, ser correctamente clasificado como en ftbol
sccer, an cuando este par de palabras no aparezca en el artculo.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Use el
programa Clasitex el Clasitex++ como punto de partida.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
98.4 Guzmn A. Hallando los temas principales en un artculo en espaol. Soluciones
Avanzadas. Vol. 5, nm. 45, pg. 58. I parte, 15 de julio de 1997, II parte vol. 5, nm.
49, pg. 66, 15 de septiembre de 1997. Tambin en: Simposio Internacional de
Computacin. Centro de Investigacin en Computacin. Instituto Politcnico Nacional.
Noviembre 12-14, 1997. Mxico, D.F., pginas 36-51.
4

Estos nmeros se refieren a la lista de trabajos de A. Guzmn que aparece en su curriculum vitae.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

2 de 48

99. Adolfo Guzmn. Finding the main themes in a Spanish document. Journal Expert
Systems with Applications, Vol. 14, No.1/2, Jan/Feb 1998, pages 139-148.
101. Beatriz Beltrn Martnez, Adolfo Guzmn Arenas, Francisco Martnez Trinidad, Jos
Ruiz Shulcloper. Clasitex++: una herramienta para el anlisis de textos. Memorias del
Tercer Taller Iberoamericano de Reconocimiento de Patrones, TIARP-98, Centro de
Investigacin en Computacin, Instituto Politcnico Nacional, Mxico, D. F. Marzo
1998. Pginas 369-379

2.

Agentes mviles

OTROS NOMBRES (ttulos alternos). Ayudante del Inyector de Agentes.


REA (dentro de la Computacin). Inteligencia Artificial, Agentes, Computacin distribuida.
DESCRIPCIN. En qu consiste el proyecto. Se inyecta de alguna manera en una mquina
husped, un agente que lleva a cabo una tarea especfica (por ejemplo, la sumarizacin de
datos que lleva a cabo el Sumarizador de Anasin). Por algn motivo, el agente detecta una
de las siguientes situaciones:
a) los datos han cambiado de morada, ya se mudaron a otro sub-directorio o a otra mquina,
por lo que el agente debe emigrar.
b) la mquina husped presenta paros frecuentes (est enferma) lo que amenaza con que el
agente se muera y no resucite. Es necesario eternizar al agente (hacerlo inmortal, o sea,
resistente a fallas o cadas de la mquina husped).
c) parte de los datos se han ido, el archivo se ha duplicado o replicado, por lo que es
conveniente que el agente haga una mitosis y se divida en dos (o ms), y sus clones
emigren y persigan a los nuevos datos.
Disee e implemente usted un sistema donde haya agentes mviles capaces de ser
inyectados, de detectar las condiciones (a) a (c) (y algunas otras), y de responder a ellas con
las caractersticas de migracin, mitosis, inmortalidad, etc., sealadas.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para definir procesos
distribuidos dbilmente acoplados que sean ms robustos, adaptables a los cambios que
inevitablemente ocurren en un ambiente de explotacin de informacin.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Quiz
el Inyector de Agentes del Ing. Gilberto Martnez Luna (Lab. de Sistemas de Informacin, C.
I. C.) sea un punto de partida.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
1). Adolfo Guzmn. Sumarizador-Transmisor de Anasin. SoftwarePro International, Austin,
Texas.
2). Gilberto Martnez Luna. Inyector de agentes. Tesis de M. en C., Depto. de Ing. Elctrica,
CINVESTAV-I. P. N., 1998.
3). 94. Guzmn A. Tecnologa de Agentes. Simposio Internacional de Computacin. Centro
de Investigacin en Computacin, Instituto Politcnico Nacional, Octubre 21-23, 1996,
Mxico, D.F., pginas 25-36. Tambin en: I. P. N. Ciencia, Arte y Cultura, vol. 2, nmero
10, Nov-Dic. 1996, pginas 3-10.

3.

Clasificadores tipo rboles k-d

OTROS NOMBRES (ttulos alternos). Clasificacin supervisada usando rboles de decisiones.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

3 de 48

REA (dentro de la Computacin). Inteligencia Artificial, Reconocimiento de patrones,


clasificacin supervisada.
DESCRIPCIN. En qu consiste el proyecto. Se puede hacer un clasificador que aprenda de
una matriz de aprendizaje y cuyo resultado sea un programa en C, un rbol de decisiones
(Ifs anidados, rbol k-d) que es el clasificador apropiado para lo que se aprendi. Aqu hay
varios proyectos relacionados:
1. Aprenda de varias matrices de aprendizaje, y de alguna manera combine los clasificadores
(rboles k-d) obtenidos en cada aprendizaje, para obtener un clasificador (rbol) ptimo,
es decir, la mejor combinacin de los rboles individuales.
2. Utilice rboles balanceados (b-trees) en vez de rboles k-d para tales clasificadores.
3. Utilice archivos indexados o funciones hash (de dispersin al azar) en vez de rboles k-d,
para la implementacin de tales clasificadores. El uso de archivos har lento el sistema,
pero har posible la clasificacin con clasificadores enormes (por ejemplo, el clasificador
ALVOT requiere todos los datos de la matriz de aprendizaje [MA] a tiempo de ejecucin;
si la MA es muy grande, habr que guardarla en disco).
4. Utilice strip-trees (rboles rebanados) en vez de rboles k-d.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Acoplar las
herramientas modernas de tecnologa de software a la ciencia de Reconocimiento de
Patrones.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Para
cada una de las proposiciones (1) a (4), habr que usar mtodos de codificacin distintos,
creo yo. Es demasiado pedir un solo algoritmo unificado, tal vez no sea deseable o posible.
TRABAJOS RELACIONADOS Y REFERENCIAS. Proyectos previos.
A. Guzmn. Generador de rboles k-d. SoftwarePro International, 1993.
89.5 Guzmn, A. rboles k-d como clasificadores supervisados y para la substitucin de
sistemas expertos. Congreso Internacional sobre Reconocimiento de Patrones. ICIMAF,
Habana, Cuba. 1995. (Este congreso fue el TIARP I, o Taller Ibero americano sobre
Reconocimiento de Patrones).
100. Ruiz Shulcloper, Jos; Guzmn, A. y Daz de Len, Juan Luis. Enfoque lgico
combinatorio al Reconocimiento de Patrones: Clasificacin Supervisada. Editorial
Politcnica, 1998.
A. Guzmn. Exploracin de distintos rboles para clasificacin supervisada. Proyecto DEPII. P. N., 1997-98.
Ricardo Avils. Tesis de Ingeniero en Comunicaciones y Electrnica, ESIME-I. P. N., 1978?
Utiliza rboles rebanados (strip trees) para clasificacin rpida, pero los genera a mano.

4.

Generador de clasificadores

OTROS NOMBRES (TTULOS ALTERNOS). Bsqueda automtica de clasificadores que


tengan una eficiencia dada.
REA (dentro de la Computacin). Inteligencia artificial, reconocimiento de patrones,
clasificacin supervisada.
DESCRIPCIN. En qu consiste el proyecto. Utilice algn mtodo para obtener un
clasificador supervisado, el cual depende de ciertos parmetros: qu testores tpicos se
usaron, cul es la granularidad o precisin de las variables (por ejemplo, una variable
5

Estos nmeros se refieren a la lista de trabajos de A. Guzmn que aparece en su curriculum vitae. Para
accesar los artculos completos, vaya al curriculum y seleccione la liga.
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

4 de 48

continua, como peso en kilogramos, puede engrosarse o convertirse a una variable con los
intervalos [de 0 a 10 kg.], [de 11 a 20 kg.], etc.) Utilcese una matriz de control para obtener
la eficiencia (porcentaje de aciertos) de tal clasificador. Ahora bien, supongamos que la
eficiencia obtenida no es la adecuada. Hay que buscar un clasificador mejor (con mayor
eficiencia).
El proyecto consiste en generar de manera automtica muchos clasificadores,
buscando uno (o varios) que tengan eficiencia alta. El generador modificar los parmetros
(granularidad de las variables, escoger otros testores tpicos, eliminar objetos de la matriz de
aprendizaje, ...) de suerte que se vayan generando clasificadores con eficiencia (quiz)
mayor. El mtodo obvio es el de fuerza bruta, pero es muy lento (por ser exhaustivo y estar
trabajando con una gran cantidad de variaciones de los parmetros). La idea es guiarse por
la eficiencia, por la cantidad de informacin de los rasgos, por la confusin entre objetos,
etc., para guiar el mtodo de fuerza bruta hacia uno de fuerza semi-bruta, que proponga
parmetros razonables y encuentre mejores clasificadores sin tanta exploracin.
Adicionalmente, pueden combinarse los 3 (o n) mejores clasificadores, para obtener
un clasificador an mejor que los clasificadores que se combinan. Idea: utilice la
sensibilidad (precios sombra) de cada parmetro del clasificador, para saber en qu sentido
modificar el parmetro.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
Es engorroso estar buscando manualmente un clasificador mejor que el que ya se
tiene. A menudo este trabajo se hace por una persona que es especialista en el campo de
aplicacin (es especialista en prstamos), pero no es especialista en Reconocimiento de
Patrones. El mtodo manual o del tanteo no garantiza encontrar rpido un clasificador
deseado.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
Desarrolle un algoritmo de fuerza bruta para generar clasificadores, y simultneamente
estudie (tericamente) los efectos de los diferentes parmetros del clasificador en su
eficiencia. Consecuentemente, agregue heursticos a su generador bruto para guiar la
generacin inteligentemente. Bono adicional: demuestre que su generador es monotnico
(la eficiencia de un nuevo clasificador generado, con respecto al anterior, aumenta siempre o
no disminuye).
Para el algoritmo de fuerza bruta, el clasificador a usar ser uno que (a) sea el ms
robusto o eficiente posible, y (b) se conozca bastante bien su fundamento terico, a fin de
entender el papel de cada parmetro del clasificador. Por ejemplo, use ALVOT. Bono
adicional: tenga una tabla que diga: para tales y cuales condiciones, el mejor clasificador a
usar, a priori, es la recta de Fisher, para esto otro hay que usar diagramas de Voronoi, etc.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
100. Ruiz Shulclper, Jos; Guzmn, A. y Daz de Len, Juan Luis. Enfoque lgico
combinatorio al Reconocimiento de Patrones: Clasificacin Supervisada Editorial
Politcnica, 1999. Mxico, D. F.
A. Guzmn. Generacin de clasificadores con una eficiencia dada. Trabajo en progreso,
incompleto. SoftwarePro International. (tengo un borrador de este artculo)

5.

Transformador de expresiones en SQL para minera de datos

OTROS NOMBRES (ttulos alternos). Virtualizador del cubo de minera de datos.


REA (dentro de la Computacin). Sistemas de informacin, minera de datos.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

5 de 48

DESCRIPCIN. En qu consiste el proyecto. Un minero utiliza expresiones en SQL (o en un


lenguaje especial, segn el proyecto # 18, convertible en expresiones en SQL) para accesar
un cubo de datos. El cubo de datos es isomorfo a la base de datos original (contiene la
misma informacin, guardada en una forma especial que facilita la bsqueda al minero).
Cuando se utiliza un cubo real, se duplica la informacin: se tiene en la base de datos
original, y se tiene en el cubo.
El proyecto consiste en eliminar el cubo de datos, pero haciendo creer al minero que
an existe, que an contina accesndolo. El truco es convertir la expresin en SQL que el
minero usa para accesar al cubo, en otra expresin equivalente en SQL, pero que ahora
accesa la base de datos real u original. Es decir, la expresin original en SQL accesa al cubo
y obtiene los mismos datos que la expresin nueva en SQL obtendr al accesar la base de
datos original. Por consiguiente, si engaamos al minero y le cambiamos su expresin en
SQL por la nueva expresin en SQL, y usamos sta para accesar la base de datos original,
se obtendrn los mismos resultados, por lo que el cubo de datos ya no es til y puede
eliminarse, lo que ahorra espacio en disco.
Usted har el traductor de SQL a nuevo SQL. Este traductor estar parametrizado
por la definicin de la base de datos original, y por el rbol que nos dice quines son los
hijos geogrficos de Jalisco, los hijos temporales de 1998, etctera (ver proyecto # 18).
Variante: no haga un traductor, haga un intrprete que atrape la expresin original en
SQL que el minero usa para accesar al cubo, y la interprete y entienda y haga los accesos
adecuados a la base de datos original, arrojando la misma informacin que se obtendra si el
cubo (ahora inexistente) se hubiese accesado.
Bono adicional: Cmo se manejarn los campos (totalizadores) que no existen, que
son la mayora de los totalizadores? Ahora que el cubo es real, tenemos la opcin de
cachear un totalizador cuyo valor era desconocido y acaba de ser computado, guardndolo
en el cubo real (valor obtenido bajo demanda, o evaluacin perezosa), o desechar tal valor,
teniendo que recomputarlo despus si se vuelve a necesitar. Para acelerar el procesamiento,
se sugiere que los totalizadores se vayan cacheando para evitar recomputarlos, pero dnde
guardarlos? No me atrevo a sugerir que se guarden en la base de datos real, la que est en
produccin!
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. La minera de datos
es un campo reciente, muy productivo, con productos comerciales primitivos que sin
embargo han alcanzado cierto xito (y mucho ruido). Sirven para descubrir anomalas,
situaciones interesantes, desviaciones y tendencias en un mar de datos, de manera
automtica. Apoyan la toma de decisiones tcticas y estratgicas en los mandos medios y
superiores de una empresa.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Utilice
tcnicas de expansin de macros en texto ASCII (despus de todo, eso es lo que es una
expresin en SQL).
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
92. Guzmn A. Mineros de Datos. En Soluciones Avanzadas, Mxico D.F., 1996. Tambin
en: ARCHIPILAGO. Vol. 2 nm. 9, pgina 19. Nov.-Dic. 1996.
97. Guzmn A. Estado del Arte y de la Prctica en Minera de Datos, Anlisis y Crtica. II
Taller
Iberoamericano de Reconocimiento de Patrones. Marzo 24-28, 1997. La
Habana Cuba, pginas 367-376.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

6 de 48

6.

Eliminador Universal de Baches (E U B)

OTROS NOMBRES (TTULOS ALTERNOS). Rueda que se adapta a las irregularidades de la


carretera.
REA (dentro de la Computacin). Inteligencia Artificial, Visin, Control en tiempo real.
DESCRIPCIN. En qu consiste el proyecto. Disear el hardware y software para el EUB.
Una cmara de imgenes, conectada a una computadora, montada en la parte
delantera de un automvil, va detectando los baches (agujeros) y topes (agujeros negativos)
que se encuentran en el camino adelante. Las ruedas estn formadas por rayos (como las de
las bicicletas, aunque no tantos rayos) y cada rayo termina en un pedazo de hule, que es el
que hace contacto con el terreno. Es decir, la circunferencia de la rueda no es una sola pieza,
sino que est formado de quiz doce rayos que terminan en pedazos de hule (como si fueran
zapatos), cada uno al final de un rayo. Cuando cada rayo de la rueda tiene una misma
longitud (radio), los doce pedazos de hule forman una circunferencia.
Ahora bien, los rayos pueden cambiar su longitud, controlados por la computadora.
El objeto del EUB es (1) detectar los baches positivos y negativos sobre los que pronto
andar el automvil; (2) calcular qu rueda y qu rayos harn contacto con el bache, y (3)
alargar o acortar los rayos correspondientes, a fin de que el bache no se sienta. Es un sistema
que trabaja en tiempo real.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
La ventaja del EUB es que permite que un automvil no sienta los baches, porque
los detecta y modifica la superficie de contacto, adaptndola a la superficie de la carretera,
de tal manera que el vehculo avance a una altura constante sobre la superficie, aunque sta
sea irregular. Es un amortiguador automtico adaptivo en tiempo real.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

7.

Seccin Amarilla electrnica

OTROS NOMBRES (ttulos alternos). Bsqueda inteligente de productos y servicios.


REA (dentro de la Computacin). Sistemas de Informacin, Procesamiento de lenguaje
natural, Procesamiento de textos en espaol.
DESCRIPCIN. En qu consiste el proyecto. Usando un rbol de conceptos como el que usa
CYC Clasitex, construir una seccin amarilla electrnica (podra venderse en un CD rom)
que supiera sinnimos, padres e hijos de un concepto, y otras relaciones sobre el rbol de
conceptos. Por ejemplo, una persona est buscando consultores, pero la seccin amarilla
los tiene almacenados como asesores o consejeros. Por ejemplo, buscamos bisagras de
3 pulgadas y encontramos que hay una fbrica de bisagras (pero no dice explcitamente que
sean de 3 pulgadas), y hay ferreteras, y hay tiendas para carpinteros. El sistema debe ser
capaz de sealar lo ms cercano a lo que se pidi, midiendo la distancia en el rbol de
conceptos.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
Mejorara la seccin amarilla actual, ya que uno pierde tiempo buscando autobuses
de pasajeros y est guardada la informacin como transportes forneos de personas.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Use el
rbol de conceptos de CYC Clasitex.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

7 de 48

98. Guzmn A. Hallando los temas principales en un artculo en espaol. Soluciones


Avanzadas. Vol. 5, nm. 45, pg. 58. I parte, 15 de Julio de 1997, II parte vol. 5, nm.
49, pg. 66, 15 de septiembre de 1997. Tambin en : Simposium Internacional de
Computacin. Centro de Investigacin en Computacin. Instituto Politcnico Nacional.
Noviembre 12-14, 1997. Mxico, D.F., pginas 36-51.
99. Adolfo Guzmn. Finding the main themes in a Spanish document. Journal Expert
Systems with Applications, Vol. 14, No.1/2, Jan/Feb 1998, pages 139-148.

8.

Sistema para manejo de llegadas y salidas de viajeros en los


aeropuertos internacionales

OTROS NOMBRES (ttulos alternos). Control de entradas y salidas de viajantes.


REA (dentro de la Computacin). Sistemas de Informacin.
DESCRIPCIN. En qu consiste el proyecto. En Mxico, los aeropuertos reciben y dejan salir
a las personas (el Instituto Nacional de Migracin, para ser ms exactos) de/a otros pases
en forma manual, llenando unas hojitas y verificando los documentos. La propuesta es captar
esta informacin en la computadora, por el agente de migracin, al momento en que tiene al
viajero frente a l. En ese momento la computadora accesa una base de datos para verificar
su estado, si no se le busca, etc. Nota 1: las aerolneas ya tienen en su base de datos los
nombres de los pasajeros que estn llegando o van a salir, por lo que esta informacin se
puede pre-cargarse a fin de hacer ms rpida la bsqueda (aunque hay que tomar en
cuenta que los nombres que aparecen en los boletos de avin no siempre coinciden con los
nombres del pasaporte).
Nota 2: Muchos pases tienen ya sus pasaportes con cdigo de barra y caracteres
OCR (fciles de leer por la computadora).
Extensin: a buques, puentes (paso con automviles, paso a pie).
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Modernizar el manejo
de visitantes internacionales en aeropuertos y puertos de entrada.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Use
una base de datos local con acceso rpido, probablemente en modo cliente-servidor y no a
travs de pginas web, y acceso remoto a otras bases de datos exgenas.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Los pases avanzados
cuentan ya con este servicio.

9.

Servicios (inscripcin, etc.) de estudiantes va Intranet

OTROS NOMBRES (ttulos alternos). Sistema escolar va Web.


REA (dentro de la Computacin). Sistemas de Informacin, Intranet.
DESCRIPCIN. En qu consiste el proyecto. Muchos trmites de control escolar
(inscripciones, cambio de grupo, darse de baja, consulta de calificaciones, etc.) y
administrativos se realizan con papel, y en forma presencial. El estudiante debe acudir a una
ventanilla, llenar un papel, firmar, etc. Disear un sistema donde estos trmites se puedan
hacer va Intranet/Internet, de modo que los estudiantes que tienen acceso a ella no tengan
que ir necesariamente a la escuela a hacer sus trmites. (Tambin pueden hacer los trmites
en la escuela, donde probablemente los dirijan hacia una terminal con Intranet).

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

8 de 48

ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Modernizar los


servicios a estudiantes. Evitar viajes a la escuela para realizar trmites.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Haga
un experimento con un centro de enseanza pequeo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Muchas universidades
modernas cuentan ya con este servicio. En el C. I. C., el M. en C. Csar Guzmn est
trabajando en estas lneas.
Sistema para actualizacin de datos de contaminacin, seguridad y proteccin industrial.
Proyecto del C. I. C. patrocinado por Pemex-Refinacin, ASIPA, 1997.

10.

Centro de acopio de donaciones

OTROS NOMBRES (ttulos alternos). Administracin de entradas y salidas de donativos.


REA (dentro de la Computacin). Sistemas de Informacin.
DESCRIPCIN. En qu consiste el proyecto. Hay muchas donaciones de ropa, medicina,
cobijas, bateras, ..., para distintos damnificados. Hay, por otro lado, desastres. Y hay
damnificados. Se trata de hacer la mejor distribucin posible de las donaciones, a travs de
un sistema de programas que usted disear. Una de las finalidades es determinar o
demostrar que tal donacin se entreg o regal a tal damnificado. El problema se parece al
de asignacin de personas (con ciertas habilidades y destrezas) a puestos de trabajo, o el de
encontrar parejas de hombre-mujer, donde cada uno declara ciertas preferencias (busco
dama de 25 a 35 aos, catlica, blanca, ....)
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Mejor administracin
y entrega de donaciones.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Programa para
encontrar parejas hombre-mujer. Programa para asignar trabajadores a puestos de trabajo.
Programa para asignar trabajos a distintas mquinas en un taller.

11.

Servidor de imgenes de personas extraviadas; buscadas; de objetos


robados; recuperados, va Internet

OTROS NOMBRES (ttulos alternos). Sistema para identificacin de objetos y personas va


Internet.
REA (dentro de la Computacin). Sistemas de Informacin, Manejo de imgenes, Intranet.
DESCRIPCIN. En qu consiste el proyecto. Una gran cantidad de objetos robados han sido
recuperados y esperan a que su dueo los identifique y se los lleve. Las personas tienen que
viajar actualmente a donde se encuentran los objetos. La idea es que el sistema que usted va
a disear ponga a disposicin de las personas interesadas, en distintos lugares, va Internet,
una imagen (o varias) de los objetos que se pueden reclamar. Lo mismo para fotos y
descripciones de personas extraviadas.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Mejor servicio a la
ciudadana.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Utilice
una base de datos que pueda almacenar imgenes.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

9 de 48

Sistema integral de informacin que muestra a travs de Intranet instalaciones, funcionarios,


y otras imgenes. Proyecto del C. I. C. patrocinado por Pemex-Refinacin. 1997.

12.

Vaco

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin).
DESCRIPCIN. En qu consiste el proyecto.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

13.

Diseo de marcas electrnicas en imgenes electrnicas

OTROS NOMBRES (ttulos alternos). Proteccin invisible en documentos electrnicos.


REA (dentro de la Computacin). Procesamiento de Imgenes.
DESCRIPCIN. En qu consiste el proyecto. Las imgenes en papel se protegen utilizando
marcas de agua, que son dibujos tenues que se sobreponen (o estn contenidos o preimpresos en el papel) sobre el dibujo original, de tal manera que no se noten o se noten
poco. De esta forma es posible demostrar que tal dibujo fue sacado de la Biblioteca del
Vaticano, pues tiene su marca de agua. Como no se nota mucho, es posible que pase
desapercibido por el infractor. Las marcas de agua normalmente resisten las operaciones
normales que se realizan con imgenes, como copiado, amplificacin, reduccin, mostrar
una parte de la imagen, distorsiones comunes, reflexin en espejo.
Usted va a disear un sistema que ponga marcas electrnicas sobre imgenes
electrnicas (o sea, que se muestran en una pantalla; tambin se pueden imprimir) con la
misma finalidad de las marcas de agua normales. Piense qu marcas usar. Disee el sistema.
Describa el mtodo de autenticacin de una imagen de usted que Juan Prez alega que es de
l.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para identificar el
dueo u origen de un documento.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
(falta aqu una referencia).

14.

Prueba de programas mediante inyectores de errores

OTROS NOMBRES (ttulos alternos). Introduccin de errores y estudio de su propagacin y


efectos.
REA (dentro de la Computacin). Tecnologa de software.
DESCRIPCIN. En qu consiste el proyecto. El efecto de un error en el cdigo puede medirse
o deducirse mediante la introduccin artificial de ciertos errores. Por ejemplo, puedo
introducir un error en la variable X, aadiendo una lnea (inyectando el error) que diga X :=
random (X). Describa un mtodo (no disee ni haga programas, solo el mtodo) para utilizar
estas tcnicas de inyeccin de errores. Describa su mtodo, d un ejemplo. Cmo se
compara contra mtodos ya existentes (ver referencia)? Cmo los mejora o supera? Qu

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

10 de 48

se gana con su mtodo? Y qu se gana con su mtodo versus con otros mtodos ya
existentes?
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
En la etapa de prueba, para determinar la robustez de programas.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
Computer Dec. 97.

15.

Compiladores para paralelizar varias instrucciones

OTROS NOMBRES (ttulos alternos). Instruction level parallelism.


REA (dentro de la Computacin). Arquitectura de computadoras, Tecnologa de Software.
DESCRIPCIN. En qu consiste el proyecto. Tenemos un programa en ensamblador (o en
binario) y tenemos un procesador que tiene una ALU (unidad aritmtica y lgica) capaz de
ejecutar en paralelo algunas instrucciones, amn de la paralelizacin que se obtiene en el
canal (bus) de memoria en el ciclo de obtencin (fetch), el de cmputo de la direccin
efectiva, el de ejecucin (escritura o lectura de datos a o desde memoria), etc. Podemos
suponer, por ejemplo, que la computadora tiene una palabra larga (60 bits, como la CDC
Cyber, R.I.P.), cuyas instrucciones podran ejecutarse en paralelo. Disee un compilador que
detecte las paralelizaciones posibles y las efecte, ensamblando las instrucciones
correspondientes, y estableciendo candados para cuando cierta paralelizacin no sea posible.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Aumentar la
velocidad de ejecucin.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
Computer, Dec. 97, p. 63 ff.

16.

Tramitel electrnico: informes de trmites en espaol, por telfono

OTROS NOMBRES (ttulos alternos). Informes exactos sobre pasos, procesos y trmites.
REA (dentro de la Computacin). Sntesis de voz.
DESCRIPCIN. En qu consiste el proyecto. Existe una oficina que da informacin telefnica,
mediante personas, de trmites en oficinas de gobierno. La idea es representar a cada trmite
por un flujograma (red dirigida, los nodos son transacciones atmicas o trabajos que realiza
un individuo, los arcos indican los nodos o transacciones corriente abajo que son
consecuencia de las transacciones que ya concluyeron; hay nodos condicionales o if: si es
menor de edad, vaya a la ventanilla 1, si no, vaya primero a la caja antecedentes penales),
y tener un sintetizador de voz que va leyendo el trmite por telfono.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Dar informacin
veraz por telfono.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Usar
tarjetas que se conectan a la PC para manejar (hablar) menes de voz, y leen (mediante
tonos) los dgitos pulsados en el microtelfono.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
86bis. Guzmn, A. Diseo de una Sistema General de Seguimientos. Simposium
Internacional de Computacin , CENAC-IPN, Nov. 10-13, 1993, Mxico, D.F.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

11 de 48

Cecilia Palomino. Construccin de un sistema de flujo de documentos (work flow) con


mltiples servidores. Tesis de M. en C., Centro de Investigacin en Computacin, 1999.

17.

Bsquedas en bases de datos con llaves inexactas

OTROS NOMBRES (ttulos alternos). Indexacin inexacta controlada.


REA (dentro de la Computacin). Reconocimiento de Patrones, Sistemas de Informacin.
DESCRIPCIN. En qu consiste el proyecto. Un objeto (persona) o situacin (conflicto
entre campesinos) se describe por varios atributos o rasgos (sueldo, edad, sexo, colonia
donde vive, altura, peso, religin ...), que poseen valores numricos o simblicos (catlico,
mahometano, budista, ...). [para simplificar, un objeto de stos (no es un objeto de C++)
puede representarse como un registro de un archivo o un rengln de una tabla de una base
de datos]. Un mtodo de hallar si un objeto dado est en un archivo grande o coleccin
grande de objetos es calcular, a partir de sus atributos, una llave o ndice (si se usan
archivos, se denominan archivos indexados. Si se usan tablas en memoria, se llaman llaves, y
se usa el mtodo de dispersin al azar o hashing). Dado un objeto nuevo, se desea
averiguar si est o no en tal archivo. Entonces se computa, a partir de los atributos de tal
objeto, una llave, y con ella se indexa el archivo. Si el ndice encuentra registro, s est el
objeto en el archivo, y el registro puede contener informacin adicional sobre el objeto: su
direccin, cunto nos debe de renta, o a qu clase pertenece: beisbolista, nadador,
levantador de pesas, corredor de fondo, etc. Si el ndice es invlido, significa que no est en
el archivo, el archivo no contiene al objeto nuevo, o no contiene un objeto con las
caractersticas del nuevo. Se puede entonces tomar algn tipo de decisin: decir que no est,
incorporarlo, etc.
Ahora bien, pudiera ser que los atributos sean ms o menos difciles de computar.
Por ejemplo, si estamos mirando caras, un atributo puede ser tamao de los ojos con
valores chico, mediano, grande. Pero pudiera haber confusin o inexactitud, de manera que
medimos chico cuando en realidad deba de ser mediano. Se habla de llaves inexactas.
La bsqueda con valores inexactos o imprecisos puede proceder as: se miden (lo mejor que
se pueda) los atributos del objeto nuevo. Se computa la llave para tal objeto. Se mete la
mano al archivo (se indexa con tal llave). Si se halla un objeto, hemos hallado un objeto que
casa perfectamente o con cero error con el objeto nuevo. Si no hallamos objeto alguno,
entonces no se encuentra un objeto con error = 0. Se procede a calcular todas las llaves
que distan 1 [o sea, que tienen error = 1] de la llave anterior (por ejemplo, la llave puede ser
llave a = {nariz chata, ojo chico}, donde los valores para nariz son chata, regular, afilada,
aguilea, y para ojo son chico, mediano, grande. Entonces una llave que dista 1 de la llave a
es {nariz regular, ojo chico}, otra llave que tambin dista 1 de la llave a es {nariz chata, ojo
grande}, una llave que dista 2 de la llave a es {nariz regular, ojo grande}, etc. Hllense todas
las llaves con error = 1 y los objetos (accesando varias veces el archivo) con error = 1, y as
tambin los objetos con error = 2 y quiz los que tienen error = 3, y presntense en forma
ordenada (primero los de error ms bajo), como objetos encontrados que se parecen al
objeto nuevo buscado.
Por alguna razn, la distancia o error en un atributo (forma de nariz) puede ser ms
grande (ms importante) que en otro atributo.
Tambin, los valores de algn atributo pudieran formar rbol. Por ejemplo, pudiera
ser fcil detectar con robustez que una nariz es grande, afilada o chata. Ahora bien, las
narices grandes se dividen en triangulares, rectangulares y pentagonales. Las narices afiladas

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

12 de 48

se dividen en rectas, cncavas y convexas o aguileas. Las narices chatas se dividen en


chata-chica y chata-aplastada. Ahora bien, dado que un objeto tiene {nariz triangular, ojo
chico}, cuando tal objeto no se halle en el archivo, se puede tratar de buscar {nariz grande,
ojo chico} en vez de {nariz rectangular, ojo chico} + {nariz pentagonal, ojo chico}. Es
decir, usar al pap del atributo en vez de a los hermanos del atributo. De esta manera es
posible generalizar un objeto, al generalizar (subir en el rbol) uno o ms de sus atributos.
La generalizacin es una operacin que nos protege de la imperfeccin al medir o computar
atributos. El programa que trata de accesar un objeto generalizado (aqul que posee un
atributo no expresado al mximo detalle, como hoja del rbol) debe poder computar las
llaves especficas derivadas de la llave general, y tratar de accesar tales objetos especficos.
Por ejemplo, el objeto (generalizado) {nariz grande, ojo chico} se particulariza en
(representa a) los objetos {nariz triangular, ojo chico}, {nariz rectangular, ojo chico}, {nariz
pentagonal, ojo chico}. La bsqueda del objeto {nariz grande, ojo chico} se lleva a cabo
mediante cuatro accesos al archivo, con las llaves {nariz grande, ojo chico}, {nariz
triangular, ojo chico}, {nariz rectangular, ojo chico}, {nariz pentagonal, ojo chico}. El
archivo puede contener objetos especficos y objetos generalizados. Idea: que los objetos
generalizados en el archivo contengan apuntadores a los objetos menos generalizados que
sean sus hijos. Esto evitara una gran cantidad de accesos intiles al disco, originadas por
llaves invlidas (que representan a objetos inexistentes): cada vez que se guarde un objeto
especfico en el archivo, comptense los objetos generalizados (o sea, los ascendientes de tal
objeto), y regstrense stos (teniendo cuidado de marcarlos como virtuales o artificiales, ya
que en realidad no han sido encontrados en la naturaleza, sino se han insertado en el archivo
solo para poder hacer referencia a sus hijos) tambin en el disco, cuidando tambin que cada
objeto apunte a sus descendientes inmediatos. Los objetos en el archivo estn organizados
de acuerdo al rbol de atributos. Por ende, la bsqueda es inmediata: cuando se tenga un
objeto nuevo, mdanse sus atributos, y, ya sea un objeto generalizado o no, sese su llave
para accesar el archivo. Si no existe, tampoco existen hijos suyos, y la bsqueda solo puede
proceder hacia arriba (generalizando ms tal objeto). Si existe, puede ser real (imprmase
como encontrado) o virtual, pero en todo caso lanse de l las llaves de sus hijos
inmediatos. Accsense stos, y reptase el proceso hacia abajo del rbol.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para comparar
objetos complejos (imgenes de rostros, por ejemplo) contra una base de datos enorme (con
muchos objetos).
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. El
trabajo de comparar objetos complejos puede dividirse en dos partes, la primera (que no
vamos a hacer en esta propuesta) es hallar los rasgos descriptivos o atributos del objeto, y
medirlos; la segunda parte, contenida en esta propuesta, es hallarlos rpidamente utilizando
un archivo organizado en rbol, segn el rbol que forman los atributos.
Ntese que aunque no se van a desarrollar los identificadores o medidores de
atributos, es menester tener una buena idea de los mismos, la que es imprescindible para
entender cmo va a estar organizado el rbol de atributos. Podra ser preferible, en
consecuencia, desarrollar tambin los identificadores de atributos, en paralelo con el archivo
arborizado.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
89. Guzmn, A. rboles k-d como clasificadores supervisados y para la substitucin de
sistemas expertos. Congreso Internacional sobre Reconocimiento de Patrones. ICIMAF,
Habana, Cuba. 1995. (Este congreso fue el TIARP I, o Taller Ibero americano sobre
Reconocimiento de Patrones).
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

13 de 48

18.

Lenguaje para expresar situaciones interesantes en minera de


datos

OTROS NOMBRES (ttulos alternos). Lenguaje que describe bsquedas generalizadas.


REA (dentro de la Computacin). Sistemas de Informacin, Minera de Datos
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
La minera de datos es un campo reciente, muy productivo, con productos
comerciales primitivos que sin embargo han alcanzado cierto xito (y mucho ruido). Sirven
para descubrir anomalas, situaciones interesantes, desviaciones y tendencias en un mar de
datos, de manera automtica. Apoyan la toma de decisiones tcticas y estratgicas en los
mandos medios y superiores de una empresa.
Una base de datos se interroga utilizando SQL. Para interrogar el cubo de datos
que usan los mineros, se ha usado un lenguaje sencillo, que nos permite expresar brincos
parametrizados (de semana en semana, de mes en mes, de ao en ao; de tienda en tienda,
de ciudad en ciudad, de estado a estado, de nacin a nacin). Tambin nos debe permitir
expresar los siguientes conceptos:
los hijos geogrficos de una entidad geogrfica, por ejemplo, los hijos geogrficos
de Veracruz, que son: Jalapa, Minatitln, Coatzacoalcos, ...
Mis tos de producto. Si estamos en el eje de productos, y yo soy bisagras,
entonces mi pap es ferretera, de donde los hermanos de mi pap, o sea mis
tos, son ropa, abarrotes, carnes y salchichonera, etc.
Los descendientes geogrficos de mi pap temporal. Si yo soy Jalisco, 15 de
agosto de 1997, entonces mi pap temporal es Jalisco, agosto de 1997, y los
descendientes geogrficos buscados son: Guadalajara, agosto 1997, Chapala,
agosto 1997, Ciudad Guzmn, agosto 1997, etc.
DESCRIPCIN. En qu consiste el proyecto.
La idea es desarrollar completamente el lenguaje, para poder expresar de una manera
sencilla, utilizando una notacin amigable y entendible, todos o muchos de los conceptos
(bsquedas, situaciones) que se usan o sean interesantes para minera de datos. Adems del
lenguaje, desarrollar su intrprete o su compilador (traductor a SQL + algunas rutinas que
no estn en SQL). Estos traductores estn parametrizados por la estructura del cubo de
datos, es decir, por un rbol que dice: Los hijos geogrficos de Jalisco son Chapala, Ciudad
Guzmn, ...; los hijos temporales de 1998 son Enero 1998, Febrero 1998, ..., Diciembre
1998.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Haga
un intrprete del lenguaje. Otra: haga un traductor a expresiones SQL (as lo tenemos
implementado ahora).
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
92. Guzmn A. Mineros de Datos. En Soluciones Avanzadas, Mxico D.F., 1996. Tambin
en: ARCHIPILAGO. Vol. 2 nm. 9, pgina 19. Nov.-Dic. 1996.
97. Guzmn A. Estado del Arte y de la Prctica en Minera de Datos, Anlisis y Crtica.
Memorias del II Taller Iberoamericano de Reconocimiento de Patrones. Marzo 24-28,
1997. La Habana Cuba, pginas 367-376.
112. Garca, A., Guzmn Arenas, A., y Martnez Luna, G. Anasin: Minera de datos con
bsqueda de patrones de comportamiento. Foro Computacin, de la teora a la
prctica. Pgs. 15-28. 26-28 de mayo de 1999. Mxico, D. F. . ISBN 970-18-3012-1

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

14 de 48

113. Guzmn, A. Minera y bodega de datos. Simposium Nacional de Computacin SICOM


99, 7-11 de junio de 1999, Villahermosa, Tabasco. Pgs. 5-13. ISBN 970-18-3046-6.

19.

Mtodos para evaluar relevancia y utilidad de temas en artculos


escritos en espaol

OTROS NOMBRES (ttulos alternos). Sensor de los problemas de una empresa, de una
comunidad.
REA (dentro de la Computacin). Inteligencia Artificial, Procesamiento de Lenguaje Natural,
procesamiento de textos en espaol.
DESCRIPCIN. En qu consiste el proyecto. Mientras ms se mencione un tema, es ms
importante, ms relevante, de ms actualidad. Cuntas veces se menciona? En qu pgina
del peridico aparece? Qu tan extensa es la nota? Dentro del documento, dnde aparece el
tema tambin indica su importancia: en el ttulo, en el resumen, en resultados principales.
Utilizando Clasitex (refs. 98 y 99), analice las noticias de los peridicos, o el boletn
informativo de la empresa, y determine cules son los temas que ms acaparan la atencin
del lector (o de los escritores).
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Manejo inteligente de
textos en espaol. Entender qu preocupa a una comunidad, a una empresa.
Nota: el proyecto #45 hace un estudio similar, pero no sobre lo que aparece en los
informes o peridicos, sino sobre lo que se lee.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Ver tambin proyecto
#20.
98. Guzmn A. Hallando los temas principales en un artculo en espaol. Soluciones
Avanzadas. Vol. 5, nm. 45, pg. 58. I parte, 15 de Julio de 1997, II parte vol. 5, nm.
49, pg. 66, 15 de septiembre de 1997. Tambin en : Simposium Internacional de
Computacin. Centro de Investigacin en Computacin. Instituto Politcnico Nacional.
Noviembre 12-14, 1997. Mxico, D.F., pginas 36-51.
99. Adolfo Guzmn. Finding the main themes in a Spanish document. Journal Expert
Systems with Applications, Vol. 14, No.1/2, Jan/Feb 1998, pages 139-148.

20.

Detectando tendencias y haciendo extrapolaciones en informes


escritos en espaol

OTROS NOMBRES (ttulos alternos). Series de tiempo en datos simblicos.


REA (dentro de la Computacin): Minera de datos simblicos. Minera de textos en espaol.
rea: Inteligencia Artificial. Sub-rea: procesamiento de lenguajes naturales.
DESCRIPCIN. En qu consiste el proyecto. Defnase una tendencia como una de las
siguientes condiciones: la mencin del tema bisbol va bajando (a travs de los meses,
digamos, en un determinado peridico), contando por ejemplo el nmero de artculos que lo
mencionan significativamente (un artculo menciona significativamente a un tema
cuando lo menciona ms de x veces, o ms del z % de los conceptos mencionados en el
artculo corresponden al tema. Ejemplo: un artculo menciona bisbol cuando ms del 6 %
de los conceptos del artculo se refieren a bisbol). Otra tendencia: ese nmero o porcentaje
va subiendo considerablemente (se incrementa ms del 8 por ciento mensual). Otra: ha

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

15 de 48

llegado a un mximo. Otra: a un mnimo. La idea es leer con Clasitex un gran nmero de
artculos, mes a mes, y ver si alguna de estas tendencias ocurre. Es como un minero
simblico que encuentra situaciones interesantes o tendencias en artculos en espaol.
sese Clasitex para contar el nmero de ocurrencias de conceptos que votan o se
refieren a bisbol. Una vez reducido cada artculo a un nmero de ocurrencias, sense los
mtodos comunes de minera de datos para determinar si hay incremento, decremento, salto,
mnimo, mximo, o alguna otra situacin interesante.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para detectar
situaciones interesantes, tendencias, en textos escritos en espaol. Manejo inteligente de
textos en espaol. Para saber la dinmica de la atencin de una empresa, de un pblico.
Cmo vara la importancia de un suceso, por la frecuencia con que se menciona el tema.
Bono adicional: haga estadsticas que reporten ms o menos lo siguiente: lo normal es que
un tema de cierta importancia dure una semana en las noticias, un tema ms importante (la
muerte de la princesa Diana) puede durar hasta 2 meses, etctera. Esto nos permite
comparar la importancia relativa de dos sucesos, midiendo el tiempo e intensidad con que
permanecen en las pginas principales de una publicacin. Variante: analice los distintos
artculos publicados en, digamos, los ltimos tres aos de Pattern Recognition, y haga
estadsticas que nos digan cmo el tema fusin de sensores ha arrancado, cundo lleg a
su cspide, y cmo ha declinado, quines son los autores o grupos ms destacados, los
grupos seguidores imitadores, los grupos lderes o iniciadores, etc. Cmo ha languidecido el
tema aplicaciones cliente-servidor, el tema repositorio de datos, etc.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Utilice
Clasitex Clasitex++ como punto de partida.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Ver tambin proyecto
#19.
98. Guzmn A. Hallando los temas principales en un artculo en espaol. Soluciones
Avanzadas. Vol. 5, nm. 45, pg. 58. I parte, 15 de Julio de 1997, II parte vol. 5, nm.
49, pg. 66, 15 de septiembre de 1997. Tambin en : Simposium Internacional de
Computacin. Centro de Investigacin en Computacin. Instituto Politcnico Nacional.
Noviembre 12-14, 1997. Mxico, D.F., pginas 36-51.
99. Guzmn, A. Finding the main themes in a Spanish document. Journal Expert Systems
with Applications, Vol. 14, No.1/2, Jan/Feb 1998, pages 139-148.

21.

Cuidador electrnico de automviles

OTROS NOMBRES (ttulos alternos). Detector de salidas no autorizadas.


REA (dentro de la Computacin). Electrnica digital.
DESCRIPCIN. En qu consiste el proyecto. Utilizando gafetes activos (son unas antenas
escondidas dentro de un gafete, con un chip, reciben una seal de radio y transmiten otra
--su identificacin), disear un sistema para que un transmisor de baja potencia cuide a los
automviles que estn en el estacionamiento privado de un edificio. Los autos entran, y el
gafete los identifica (ya lleg el Chevrolet verde). Al salir, el gafete se identifica (ya se va
el Chevrolet verde, ya no se est recibiendo la seal). El dispositivo rada con baja potencia,
a una antena de mayor ganancia que se coloca en la azotea del edificio, alumbrando al
estacionamiento a proteger. Cuando una persona se aleja en su automvil, tiene que avisar
de alguna manera a la computadora a fin de que sea salida normal. Por ejemplo,
teclendole al chip (o a la computadora en el edificio) una contrasea. La falta de este aviso

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

16 de 48

har que la computadora notifique a los guardias del estacionamiento salida anormal del
Chevrolet verde placas xxx, o d algn aviso parecido de alarma. Variante: no ponga la
antena en el techo, pngala cerca de la puerta de salida del estacionamiento. Necesitar
menos potencia.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Evita robos de
vehculos estacionados. Eliminacin o deteccin de robos en lugares confinados. Reduccin
del personal de vigilancia. Aumento de seguridad. Proteccin.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Hay
que disear el hardware, el software y las comunicaciones. Se parece a los pagers y a las
comunicaciones de los telfonos inalmbricos (no de los celulares). Hay que ver qu
frecuencias o tcnicas usar, a fin de no sufrir interferencias indeseadas.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
El Ing. Marco Antonio Reyes Garca estuvo desarrollando antenas que formaban
parte de gafetes activos, en el Instituto Mexicano de la Comunicacin, S. C. T.

22.

Transparentador de profesores

OTROS NOMBRES (ttulos alternos). Despliegue inteligente de imgenes recibidas.


REA (dentro de la Computacin). Procesamiento de imgenes. Sistemas en tiempo real.
DESCRIPCIN. En qu consiste el proyecto. Cuando se est televisando una clase o
conferencia, la cmara enfoca al pizarrn o a la pantalla. En eso el profesor se atraviesa y
con su cuerpo bloquea parte de la imagen. Y no se ve a dnde apunta o qu est sealando.
La idea es con la computadora alterar la imagen transmitida de manera que el cuerpo del
profesor se borre o se haga transparente, y vuelva a aparecer el texto que se encuentra
oculto por l.
Variante 1: Hacer la imagen del profesor no del todo transparente, sino que se vea apenas,
como fantasma o silueta.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Transmisin completa
de imgenes, a pesar de obstrucciones indeseables.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. En la
computadora receptora, guarde la imagen sin inteferencia, y cuando detecte que hay una
interferencia de profesor, conmute y despliegue sucesivamente una y otra imagen, esto nos
dar el efecto de transparentar a la obstruccin y semi-removerla. Regrese a la imagen nueva
cuando la obstruccin cese.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

23.

Juntas electrnicas para la Comisin de Honor del I. P. N.

OTROS NOMBRES (ttulos alternos). Reuniones electrnicas.


REA (dentro de la Computacin). Sistemas de informacin, groupware.
DESCRIPCIN. En qu consiste el proyecto. Para dictaminar sobre varios casos, los
miembros de la Comisin de Honor (y de muchos otros comits dentro y fuera del I. P. N.)
se renen presencial y sncronamente, para discutir sobre tal o cual caso, examinando para
cada uno varios documentos.
a) Tal examen pudiera ser no presencial pero s sncrono, es decir, a determinada hora cada
uno de los miembros de la Comisin se sientan frente a una PC en su oficina, y se
integran a la junta.
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

17 de 48

b) Otra variante: pudiese ser no presencial, como (a), y tambin asncrona: en realidad la
junta dura dos das, con un horario largo: tienen los integrantes hasta las 10 de la
maana para enviar candidatos; hasta las 6 p.m. para enviar objeciones, hasta las 10 p.m.
para votacin preliminar, etc.
Existe ya software comercial para juntas electrnicas, el proyecto podra ser imitar
uno, tratando de mejorarlo o de agregarle algunas caractersticas tiles adicionales. Con este
software es posible hacer votaciones de distintas maneras, conservar el anonimato de los
emisores de opiniones o votos, opinar en paralelo, hacer consensos sobre las cinco ideas o
candidatos mejores, los 5 peores, etc.

24.

Construccin de una computadora paralela como la SP2 utilizando


procesadores Pentium (no Power PCs) y un switch de fibra ptica

OTROS NOMBRES (ttulos alternos). Armando un Cluster de PCs.


REA (dentro de la Computacin). Arquitectura de computadoras, Sistemas Digitales.
DESCRIPCIN. En qu consiste el proyecto. Hay dos tipos de mquinas paralelas
(fuertemente acopladas), aqullas que intercambian datos mediante memoria compartida
(ejemplo comercial: Origin, de Silicon Graphics) y las que los intercambian mediante
conmutacin de mensajes o lneas o switches (ejemplo: IBM SP2). Ahora bien, una SP2 est
formada por varias Power PCs interconectadas por un switch rpido. La idea es usar
Pentiums (u otras PCs con chips de la familia 80X86) e interconectar estas mquinas
mediante un switch ptico (de fibra ptica), el que se comprara. Se compraran tambin las
Pentiums. El proyecto consiste en hacer el diseo, las interfaces, la interconexin, adaptarle
algn sistema operativo (Unix en paralelo o para varios procesadores, digamos), y dejar la
mquina andando, operacional.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Diseo y
construccin de una mquina paralela barata. Entender las tcnicas de conexin a un switch
de fibra ptica.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
Compre el switch ptico.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. En junio de 2000 este
proyecto se lleva a cabo en el Laboratorio de Electrnica del CIC.

25.

Traductor de un lenguaje estndar 4GL hacia SQLs de Informix,


Progress y Oracle

OTROS NOMBRES (ttulos alternos). Accesador universal a bases de datos


REA (dentro de la Computacin). Tecnologa de software, Sistemas de Informacin.
DESCRIPCIN. En qu consiste el proyecto. La idea es programar en un 4GL ms o menos
comn (por decir algo, en el de Progress), y poder conectarlo hacia otro manejador de base
de datos, haciendo (en la variante 1) un pre-procesador que substituye las llamadas que
realmente accesan la base de datos (de Progress), con llamadas a otras subrutinas que lo que
hacen es accesar (variante 1) la base de datos de Oracle, y devolver los buffers (o lo que sea)
llenos de datos tal como lo hubiera hecho Progress.
Variante 1: Traductor de Progress hacia Oracle. Compilador o macro-expansor que
convierte los comandos de lectura de Progress, reemplazndolos por llamadas (en Progress)

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

18 de 48

hacia una rutina que es la que llama al comando correspondiente de Oracle, el cual lee los
datos del motor de Oracle y los devuelve (llenando el buffer de memoria) tal como los
hubiera devuelto o recobrado el comando de Progress. Y similarmente para los comandos
que escriben, los que verifican si la llave es inexistente, etc.
Variante 1.b. Intrprete (caja de datos) de comandos de Progress cuando el motor se
ha reemplazado con uno de Oracle. Es un intrprete que intercepta los comandos, en vez de
un preprocesador que convierte comandos en un lenguaje (Progress) hacia otro (Oracle).
Variante 2. Traductor de Progress hacia varios lenguajes, no solo hacia Oracle.
Cuando en las variantes anteriores decimos Progress, en realidad estamos pensando en un
lenguaje sencillo o cmodo (por eso pens en Progress) para escribir nuestros programas, y
de ah hacer la traduccin (o interpretacin) automtica hacia otros motores de bases de
datos cuyos lenguajes 4GL no deseamos aprender. Es decir, pudiera ser que el lenguaje
cmodo en que programamos rutinariamente no sea Progress, sino alguno otro.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para proporcionar
independencia del motor de la base de datos. Para usar un nico lenguaje de programacin.
Para convertir sistemas que accesan a una base de datos relacional, a otra base de datos.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

26.

Traductor de los diferentes front-ends que accesan una base de datos

OTROS NOMBRES (ttulos alternos). Front-end universal. Presentacin de usuario cambiable.


REA (dentro de la Computacin). Tecnologa de software.
DESCRIPCIN. En qu consiste el proyecto. De Internet-Intranet, de Visual Basic, de Delphi.
O sea, entre ellos. Se puede acoplar con el accesador universal de bases de datos, que es
el proyecto 25.
La idea es programar el front end (que accesa a una base de datos) en un lenguaje
cmodo (Delphi, digamos), y de ah traducir hacia Internet-Intranet, hacia Visual Basic, etc.
Tenemos aqu las mismas variantes que en el proyecto 25.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Proporcionar
independencia del front-end que accesa una base de datos.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

27.

Manejador de documentos electrnicos (workflow) y convencionales

OTROS NOMBRES (ttulos alternos). Manejador hbrido. Flujo de documentos


REA (dentro de la Computacin). Sistemas de informacin.
DESCRIPCIN. En qu consiste el proyecto. Existen manejadores de documentos
electrnicos (workflow) que tienen un solo servidor. La Tesis de M. en C. de Cecilia
Palomino (C. I. C.-I. P. N.) trata del diseo y construccin de un manejador con varios
servidores, de manera que los trmites pueden emigrar de un servidor a otro, sin perder
ilacin o continuidad. Prosiga usted a lo largo de estas ideas, para hacer un manejador
hbrido que combine los documentos electrnicos con los documentos de papel
(convencionales).
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Un manejador de
documentos electrnicos sirve para: Eliminacin del papel, automatizacin de oficinas,
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

19 de 48

agilizacin de trmites, seguimiento de asuntos, control de asuntos. Uno hbrido tiene el


atractivo adicional de hacer una transicin ms suave o fluida entre la cultura de documentos
de papel y la de documentos electrnicos.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Bsese
en la parte ya existente.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Cecilia Palomino,
tesis de M. en C., C. I. C.-I. P. N. 1999.

28. Construccin de un pizarrn de mensajes (object request broker)


para aplicaciones de inter-operabilidad de software ya existente y en
produccin
OTROS NOMBRES (ttulos alternos). Pizarrn de distribucin de mensajes que solicitan
servicios, pero cuyos servidores no se conocen. Conectando sistemas ya instalados que no se
disearon para interactuar. Cmo darle longevidad a software ya existente y operacional,
mediante su interconexin.
REA (dentro de la Computacin). Computacin distribuida. Inter-operabilidad de sistemas,
integracin de aplicaciones
DESCRIPCIN. En qu consiste el proyecto. En una empresa con cierta antigedad, existen
sistemas de informacin aislados, que no se comunican entre s. Fueron creados
independientemente, en distintas plataformas, para distintos usos. En una empresa grande,
existe software que ya trabaja, por ejemplo leyendo datos de unos archivos o pantallas de
captura, haciendo una operacin (venta al contado, cobranza del pago del recibo telefnico,
inscripcin a un examen a ttulo de suficiencia). Estos sistemas se disearon aislados, de
manera que, por ejemplo, un paquete le informa a un alumno que reprob, pero no le
produce un recibo de pago para que vaya a pagar su examen extraordinario. l tiene que
usar otro sistema, que le vuelve a preguntar los datos, porque el sistema dos no est
conectado con el sistema uno. Otro ejemplo: en su banco Juan Prez tiene una cuenta de
ahorros y otra de cheques. Cada uno lo maneja un software distinto, el primero est en una
IBM AS 400 y el segundo en una HP con Unix. Juan Prez cambia de direccin, y le toman
sus datos para su cuenta de ahorros. Le tienen que volver a tomar los mismos datos para su
cuenta de cheques, porque los sistemas no estn conectados. Esto origina duplicacin de
informacin, lentitud, captura doble (con la consiguiente introduccin de errores de captura
o de teclado) porque la conexin entre sistemas se hace a mano. Despus del tiempo, se ve
la conveniencia de que el sistema A le pase informacin al sistema B, en ciertos casos. Y el
problema se complica si hay varias decenas de sistemas que podran, en ciertos casos,
comunicarse con otro(s).
El problema a resolver es interconectar este software, haciendo que los resultados de
un paquete vayan y avisen al otro paquete que tal o cual cosa debe suceder. (Una solucin
que se descarta en este proyecto es volver a hacer todo de nuevo usando una misma base
de datos, es decir, volver a hacer desde cero un sistema integral de informacin, o de manejo
de alumnos, o de transacciones en bancos. En este proyecto suponemos que tal solucin es
muy costosa y lenta, por lo que preferimos tender puentes entre los sistemas ya existentes).
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Aumenta la
longevidad de software ya existente y en produccin. Aumenta la productividad de la
empresa. Ahorra conexiones manuales, por ejemplo, volver a recapturar los datos. Por

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

20 de 48

ejemplo, tener que revisar manualmente 30 bases de datos (una por cada estado de la
repblica) cuando buscamos un nmero de placas de automvil.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
1. Abra las aplicaciones. Migrar a sistemas abiertos. Constryales una IPA (interfaz
programtica de aplicacin, en ingls API) para que otros programas puedan usarlas.
2. Construya un pizarrn central para manejar (recibir y redirigir) los mensajes que distintas
aplicaciones le dirijan a otras que tal vez pudieren interesarle, algo as como el mensaje
a quien corresponda.
3. Construya puentes desde este pizarrn central a cada una de las aplicaciones, utilizando
las IPAs previamente diseadas en (1).
3bis. Variante. Si no son muchas las aplicaciones a interconectar, construya directamente
puentes entre cada par de ellas (que realmente haya que comunicar, obviamente).
4. Considere la infraestructura. Redes. Software para convertir. El problema de accesar a
una IBM AS 400. El problema de accesar a Informix desde el web.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
1. John J. Donovan. Business Re-engineering with information technology. PTR Prentice
Hall. 1994. Es un libro con una metodologa para establecer puentes entre sistemas ya
existentes, haciendo que colaboren entre s.
2. En Pemex PEP, el Ing. Cadena conect los principales sistemas de administracin,
haciendo juntas entre expertos, y preguntndoles cosas como: cuando se hace un pedido
con el sistema A, qu informacin hay que pasarle al sistema B de almacenes? Los
expertos (en almacenes, no necesariamente en informtica) dicen qu debera suceder
lgicamente, por ejemplo agregar a los registros de los productos pedidos, la
informacin de que tal mercanca debe llegar, a tal precio, de tal proveedor,
aproximadamente en tal fecha. Luego se consulta a otros expertos (en informtica) en
los sistemas A y B que nos explican qu cosa sucede en realidad, o sea, dnde se queda
corto A y B. Luego, Cadena o alguien disea dos archivos, uno de salida de A que se
considera como peticiones a B. Otro de entrada de B que se considera como atender
peticiones que se encuentren en el formato B. Y un convertidor de texto a texto que
pasa los datos del formato A al formato B.
Sistema A que quiere
pedirle algo ms al B

Peticin de A, en el
formato FA

Sistema B
Peticin a B, en
el formato FB

Transformador de FA en FB,
segn las reglas de operacin
de la empresa

29.

Transformacin de funciones en tiempo real (en lnea), a otras de


tipo store & forward, en una bodega de datos

OTROS NOMBRES (ttulos alternos). Evaluacin perezosa, lazy evaluation.


REA (dentro de la Computacin). Computacin distribuida, bodegas de datos.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

21 de 48

DESCRIPCIN. En qu consiste el proyecto. Cmo hacer que ciertas funciones que


normalmente se ejecutan en tiempo real en un sistema de data warehousing, ahora se
ejecuten con informacin obtenida en forma diferida, con los mismos resultados, o con
resultados equivalentes, pero sin necesidad de utilizar conexiones en tiempo real, y usando
en cambio informacin diferida. Por ejemplo, en vez de actualizar inmediatamente la rplica
de una base de datos o tabla, acumulo mis transacciones de actualizacin y luego las envo
en bloque.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Mitiga la necesidad
de comunicaciones de gran disponibilidad. Reduce el ancho de banda (se pueden usar
tiempos nocturnos para realizarlas).
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

30.

Presentador de reportes dinmicos, reorganizables

OTROS NOMBRES (ttulos alternos). Despliegue de reportes reconfigurables. Informes con


matices.
REA (dentro de la Computacin). Interfaces de entrada y salida, sistemas de informacin.
DESCRIPCIN. En qu consiste el proyecto. Haga un desplegador de reportes, pero
escndale dentro una pequea base de datos (mejor: esconda unos archivos indexados) a fin
de que los reportes que se muestran sean interactivos, y el usuario que va a ver los informes
que pidi, pueda por ejemplo, ver nadams las mujeres, o nadams los que tienen saldo
mayor a mil pesos.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Consultas no
planeadas, con cierto grado de inteligencia o generalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
Utilizando un extractor de datos como los que posee Anasin, cargue la mini-base del
desplegador con los datos solicitados. Invente (genere) vistas o reportes comunes, y un
men sencillo para que el usuario pueda ver otros. Bono adicional: agrguele drill-down (la
capacidad de ver detalles de informacin global, por ejemplo, ventas en Coahuila = 580, le
pico al 580 y me da una pantallita donde me da detalles: Torren 300, Saltillo 280.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. La base de datos
Progress tiene un presentador de este tipo. El M. en C. Rafael Domnguez tiene experiencia
e inters en este tipo de desarrollos, y puede dirigir o asesorar en el proyecto.

31.

Digitalizador en tres dimensiones utilizando rayos lser

OTROS NOMBRES (ttulos alternos). Captura de imgenes en tres dimensiones.


REA (dentro de la Computacin). Dispositivos de entrada y salida.
DESCRIPCIN. En qu consiste el proyecto. Construya usted un dispositivo que permita
captar una imagen en tres dimensiones. Este dispositivo le permitir montarlo en el centro de
una plaza pblica, por ejemplo, para fotografiar (tener un modelo tri-dimensional) de los
edificios, los rboles, los monumentos, etc., que rodean o forman parte del recinto. Es como
si tomara una fotografa panormica, o con un lente ojo de pescado, que toman una
fotografa amplia del lugar. Con la ventaja de que la imagen captada es en tres dimensiones.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para tomar
fotografas tridimensionales estticas.
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

22 de 48

POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
El dispositivo es un lanzador de rayos lser que mide la distancia a donde llega el
lser. Es similar al que tenemos en las reglas lser que permiten medir la distancia entre
dos puntos, ms especficamente, entre el instrumento y el punto donde rebota o toca el
rayo.
La idea consiste en montar este lanzador en una mesa que va girando lentamente de
manera horizontal, de manera que se van grabando los ngulos de giro y las distancias a
donde el rayo lleg. Esto nos produce una rebanada o plano del espacio. Para capturar
otra rebanada, se levanta un poco el rayo, digamos 5 grados. Y se vuelve a girar la mesa,
hasta completar 360 grados. Esto produce otra rebanada del espacio (ms bien un cono)
que rodea al dispositivo fotogrfico. Para capturar otra rebanada, se levanta otros cinco
grados el rayo, y se vuelve a girar la mesa hasta completar 360 grados. De esta manera, en
coordenadas polares, se van leyendo las distancias a que los distintos objetos yacen, con
respecto al origen del rayo.
El dispositivo registra (teta, fi, erre), en coordenadas polares, donde erre es la
distancia a la que se encuentra el punto de rebote del rayo, fi es la elevacin del rayo, y teta
es su azimut.
Bono adicional: Una vez hecho un levantamiento (fotografa en 3 D) desde un cierto origen,
mueva el lser a otro punto, haga otro levantamiento, y con clculos geomtricos, mejore la
calidad (resolucin) de su fotografa 3-D.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

32.

Buscador inteligente de informacin en la web, de ejecucin diferida

OTROS NOMBRES (ttulos alternos). Bsqueda diferida de documentos en una red.


REA (dentro de la Computacin). Anlisis de texto y lenguaje natural, computacin
distribuida, quiz agentes.
DESCRIPCIN. En qu consiste el proyecto. Utilizando Clasitex, lance un agente que busca
artculos (en la red, en web) que hablen de algn tema especfico.
Variante: Hgalo para que ejecute en tiempo real.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Hallazgo inteligente
de textos en espaol (y, utilizando Clasitex+, en ingls).
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Proyecto No. 44.
El grupo de Computacin del INAOE ha realizado y est realizando buscadores de este tipo.
En el C. I. C., el M. en C. Norberto Medina tiene un proyecto en esta lnea.
Adolfo Guzmn. Finding the main themes in a Spanish document. Journal Expert Systems
with Applications, Vol. 14, No.1/2, Jan/Feb 1998, pages 139-148.
101. Beatriz Beltrn Martnez, Adolfo Guzmn Arenas, Francisco Martnez Trinidad, Jos
Ruiz Shulcloper. Clasitex++: una herramienta para el anlisis de textos. Memorias del
Tercer Taller Iberoamericano de Reconocimiento de Patrones, TIARP-98, Centro de
Investigacin en Computacin, Instituto Politcnico Nacional, Mxico, D. F. Marzo
1998. Pginas 369-379

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

23 de 48

33.

Interaccin segura entre agentes sospechosos

OTROS NOMBRES (ttulos alternos). Lenguaje de comunicacin para intercambio de


informacin entre agentes.
REA (dentro de la Computacin). Agentes.
DESCRIPCIN. En qu consiste el proyecto. Es peligroso dejar que agentes externos entren a
una computadora a realizar trabajos. Es ms fcil recibirlos en la puerta de entrada,
preguntarles qu informacin o ejecucin desean, entregarles lo pedido (o realizarlo), y
despedirlos. Se puede inclusive grabar una bitcora con el intercambio de informacin. Para
esto, se requiere un lenguaje de comunicacin (y su procesador correspondiente) para
solicitar datos, o para solicitar cierta accin. La interaccin se lleva a cabo a travs de un
muro de seguridad, parecido pero no substituto del muro de contencin (firewall) que
separa una Intranet de la Internet.
Lenguaje de intercambio
de datos y acciones

Agente que
atiende a la
visitas

Agente visitador

Muro de
seguridad

ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Permite que las


transacciones entre agentes se lleven a cabo de manera segura. El agente que atiende puede
llevar una bitcora de la transaccin, con constancias de lo que se pidi y lo que se hizo o
se entreg. El lenguaje debe ser de tal naturaleza claro o sencillo, para que las expresiones
en el mismo puedan ser analizadas por el agente recibidor y no haya lugar a dudas de que las
acciones solicitadas son vlidas y no involucran peligro o acciones indebidas. Por ejemplo,
no contendr apuntadores ni ndices no acotados, por el riesgo que implica de alterar datos
indebidamente.
La principal aplicacin es en comercio electrnico entre agentes.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Ver algunas
conferencias entre agentes en las Memorias del 4th World Congress on Expert Systems,
ITESM Mxico Mar 98.
Algunos proyectos de esta lista estn relacionados. El lenguaje probablemente tenga
una parte para identificar al agente visitante, otra para especificar datos, otra para especificar
comandos. Adems, el visitador se referir a los datos que necesita expresado en un
diccionario de datos que no necesariamente concuerde con el diccionario del lugar visitado.
Concntrese en la parte del lenguaje (y su intrprete o procesador) que maneja intercambio
de informacin, y quiz tambin en la de ejecucin segura de comandos. Ver Proyecto 38.
111. Olivares, J, Demetrio Aguirre, A., Domnguez Ayala, Mara, y Guzmn Arenas, A.
Computacin dirigida entre agentes con propsito. Foro Computacin, de la teora a la
prctica. Pgs. 210-219. 26-28 de mayo de 1999. Mxico, D. F. . ISBN 970-18-3012-1

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

24 de 48

34.

Replicador automtico de archivos, con actualizacin diferida o en


tiempo real

OTROS NOMBRES (ttulos alternos). Transmisor automtico de informacin de un lugar a


otro.
REA (dentro de la Computacin). Sistemas de informacin.
DESCRIPCIN. En qu consiste el proyecto. Desarrolle un software al que se le declaran dos
archivos (con la trayectoria completa de directorios, incluyendo el nombre de la mquina
donde residen), uno fuente y otro destino. Su software mantendr actualizada (en sincrona)
la copia destino, cada vez que se hagan cambios en el archivo fuente. La actualizacin podr
ser en tiempo real o en forma diferida, segn las facilidades de comunicacin con que se
cuente. Normalmente, a la copia (archivo destino) no se le podrn hacer modificaciones,
ser solamente de lectura. Bono adicional: que se le puedan hacer modificaciones al archivo
destino, mismas que se propagarn al archivo fuente. Full duplex. Desaparece entonces la
distincin entre archivo fuente y archivo destino.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Transmisin
automtica de informacin y de sus cambios.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
1) Lotus notes.
2) Ver Proyectos 34 y 38.

35.

Explicaciones automticas

OTROS NOMBRES (ttulos alternos). Razones detrs del dictamen de un sistema experto.
REA (dentro de la Computacin). Inteligencia Artificial.
DESCRIPCIN. En qu consiste el proyecto. Desarrolle un programa que ofrezca
explicaciones tiles. Monte su programa sobre otro (por ejemplo, un sistema experto) ya
hecho, y concntrese en la parte de la explicacin.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Mejora la aceptacin
y credibilidad de ciertas recomendaciones hechas por la computadora, digamos a travs de
un sistema experto.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
Tpicamente, los sistemas que explican dan informacin (a) sobre la lnea de cmputo que
ejecutaron, vaciando la pila de acciones o traza que condujo a la solucin; es decir,
explican la causa o razn de la salida o resultado; o (b) con frases cortas predeterminadas.
Esto es poco til. Dado que el sistema base (cuyas salidas tratamos de explicar) acaba de
proporcionar cierta salida o informacin I, agregue usted formas de ofrecer algunas de las
siguientes explicaciones:
(c) Detalles acerca de la nueva informacin I.
(d) Cmo es que la informacin I se relaciona con lo que ya se saba.
(e) Por qu es necesaria la informacin I.
(f) La estrategia de la solucin o recomendacin I.
(g) Justificacin. Cmo y por qu se lleg a la informacin I. Contestar preguntas del tipo
cmo?, por qu?, qu?
Quiz sea til tener un modelo de las expectativas del usuario, incluyendo su estado
de conocimiento, a dnde quiere llegar, qu est haciendo en este momento.
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

25 de 48

Cmo saber o medir la aceptacin de una explicacin? Cul es el mtodo de


explicacin?
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
Andrew Lyner, Amelia Baldwin, Jan Scott. Explanation generation in accounting expert
systems. Proc. 4th World Congress on Expert Systems, ITESM, Mexico, March 1998,
pages 25-32.

36.

Anotaciones que ayudan al mantenimiento de programas grandes o


ya existentes

OTROS NOMBRES (ttulos alternos). Mantenimiento de cdigo fuente ayudado por la


computadora.
REA (dentro de la Computacin). Tecnologa de software.
DESCRIPCIN. En qu consiste el proyecto. Desarrolle un sistema que le ayude a mantener
programas codificados ya hace tiempo por otras personas.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
(1) Conforme vaya estudiando el cdigo existente, vaya haciendo anotaciones sobre pedazos
relevantes del cdigo: aqu se actualiza el pago; aqu se validan los datos del cliente, etc.
J. K. Lee [1] utiliz palabras clave, en tanto que usted puede usar un rbol de conceptos
(no de palabras clave) [2]. Esta labor es manual, pero la har usted una sola vez.
(2) Usando el mismo lenguaje o taxonoma de (1), vaya clasificando las variables del cdigo,
sobre todo aqullas que no son temporales o de trabajo.
(3) Disee un machote (una ventana en Delphi, por ejemplo) para que el usuario especifique
las modificaciones que requiere. El machote hace uso de verbos o acciones (aumentar el
monto de ..., borrar los ...) sobre de los conceptos de (1).
(4) Escriba un programa que busque en el cdigo fuente, usando las anotaciones de (1) y
(2), aqullas partes que mejor casan con las especificaciones de (3). Es un programa que
hace casamiento o careo de (1+2) contra (3), sobre el rbol de conceptos.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
[1] Jae K. Lee, Byoung Y. Lee, Wooju Kim. A knowledge based maintenance of large scale
legacy systems: Metasoft. Proc. 4th World Congress on Expert Systems, ITESM, Mexico,
March 1998, pages 65-72.
[2] Adolfo Guzmn. Finding the main themes in a Spanish document. Journal Expert
Systems with Applications, Vol. 14, No.1/2, Jan/Feb 1998, pages 139-148.

37.

Base de datos que se llena por agentes

OTROS NOMBRES (ttulos alternos). Llenado automtico de una base de datos vaca por
agentes oferentes (push agents) y agentes buscadores.
REA (dentro de la Computacin). Agentes. Sistemas de Informacin
DESCRIPCIN. En qu consiste el proyecto. Disee un mtodo para llenar tablas que
contienen descripciones de lo que cada campo debe contener. El llenado se har en forma
diferida, utilizando agentes que toman esa descripcin y la comparan contra descripciones
parecidas de bases de datos ya existentes (y que, por ende, pudiesen tener la informacin
solicitada), generalmente geogrficamente distantes.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

26 de 48

ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Recopilacin


automtica de informacin. Sincronizacin de bases de datos (Proyecto 34). Resmenes
automticos de informacin.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
A. Disee una base de datos vaca (cree las tablas).
B. en cada registro (y campo) coloque una frmula que indique cmo se debe llenar ese
campo. Como si estuviramos describiendo una macro de una hoja de clculo. La
descripcin usar como taxonoma o diccionario de datos (a) uno pre-determinado (caso
sencillo), (b) uno local, que se casar con otro diccionario de datos exgeno (Ver proyecto
33) usando la ayuda de un diccionario comn (rbol del conocimiento comn) de conceptos.
C. Llene la base (A) utilizando agentes de uno de los dos siguientes tipos.
(1) agentes que usted mismo disear (agentes buscadores), que viajarn en la
red de la empresa (o en alguna otra red) buscando informacin que case con
la descripcin de cada celda; o bien,
(2) agentes visitadores (push agentes), que son agentes que otras personas
han diseado, y que buscan bases de datos vacas conteniendo (en el lenguaje
de (B)) descripciones de productos o informacin que casa con la que ellos
pueden proporcionar. Un agente visitador que encuentre una celda vaca que
l puede llenar, proceder a llenarla. Como en la actualidad no existen esas
otras personas que diseen los agentes visitadores, diselos usted mismo.
Ntese que los agentes visitadores no se disparan por la creacin de la base
vaca (A), sino que de manera asncrona se enterarn de la presencia de una
nueva base de datos vaca, misma que tratarn de llenar. Si un agente posee
informacin que no casa con la descripcin de las celdas, no las llenar, y
continuar su viaje.
D. Tanto los agentes buscadores de C.1 como los visitadores de C.2 requieren un lenguaje
que describa los datos de la base nueva, los datos de las bases ya existentes, y un mtodo
de comparacin o casamiento para ver si una base ya existente puede contener
informacin vertible a la base de datos nueva. Este lenguaje es el problema del proyecto
38. No se dedique a hacer el proyecto 38, busque una alternativa sencilla del lenguaje (es
decir, haya una versin simple del proyecto 38).
E. Si se va a cobrar por la informacin, entonces el lenguaje de (B) se complica como sigue:
1. Qu informacin ofrece. (esta parte ya est considerada). A qu precio.
2. Descripcin del proceso de oferta y contraoferta, peticiones. (bidding
process).
3. Un modelo formal del proceso de regateo o negociacin. Cundo tenemos
ofertas que son obligatorias (legalmente ya no las podemos retirar o rehusar)?
Cundo se convierte en legalmente obligatoria una peticin de compra? Por
ejemplo, este lenguaje debe ser capaz de describir un proceso de subasta. Ver
tambin proyecto 38.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
[1] Adolfo Guzmn. ANASIN. SoftwarePro International, Austin, Texas, 1994. Anasin es un
producto que enva agentes a buscar informacin (descrita sobre un diccionario de datos
ya conocido (caso B.a)) a lugares remotos, para que llenen una base de datos vaca.
[2] Jae Kyu Lee, KAIST, Corea. Opportunities of Artificial Intelligence in Electronic
Commerce. Proc. 4th World Congress on Expert Systems, ITESM, Mexico, March 1998,
page 8 (abstract only).

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

27 de 48

111. Olivares, J, Demetrio Aguirre, A., Domnguez Ayala, Mara, y Guzmn Arenas, A.
Computacin dirigida entre agentes con propsito. Foro Computacin, de la teora a la
prctica. Pgs. 210-219. 26-28 de mayo de 1999. Mxico, D. F. . ISBN 970-18-3012-1

38.

Lenguaje para intercambiar informacin entre agentes

OTROS NOMBRES (ttulos alternos). Casamiento de descripciones que utilizan taxonomas


(diccionarios de datos) distintos.
REA (dentro de la Computacin). Sistemas de Informacin. (El lenguaje tiene poco que ver
con agentes).
DESCRIPCIN. En qu consiste el proyecto. Sea O un agente que ofrece informacin, vende
servicios, o renta artculos. O describir su oferta en un lenguaje que se refiere a un
diccionario de datos local, suyo. Por ejemplo, vendo computadoras personales marca
Compaq que son de multimedia, ... Sea C un agente que desea comprar o adquirir cierta
informacin, bien o servicio. C describe sus necesidades en el mismo lenguaje que O, pero
refirindose a un diccionario de datos propio de C. Deseo comprar una PC pequea de
buena marca, con 2 Gby en disco duro, ... Para que haya una transaccin, es necesario que
ambos agentes descubran si hablan de lo mismo. El proyecto consiste en disear el lenguaje,
y el mtodo de casar una expresin en LO contra otra en LC.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Comercio
electrnico. Acceso a bases de datos poco familiares.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
Utilice cuatro rboles de conceptos [3], como sigue:
A. El rbol de conocimientos del rea del agente C (el comprador, el sumidero de datos). 6
B. El rbol de conocimientos del rea del agente O (el vendedor, el oferente o fuente de
datos).
C. Un rbol de conocimientos del rea pero comunes (por ejemplo, el rea puede ser
Ferretera. Entonces estamos hablando de un lenguaje comn a los ferreteros).
D. El rbol de conocimientos comunes, segn CYC [4].

C. rbol comn
del rea

A. rbol de conocimientos
de C (Comprador)

B. rbol de conocimientos
del oferente O

D. rbol del conocimiento


comn
CYC)
6
Con un poquito de suerte, los rboles
de los(segn
incisos A
y B estarn basados tan solo el diccionario de datos
de la base local, que fue la variante que utilic en [1]. Empero, el rbol de conocimientos comunes de [1] es
el del inciso C.
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

28 de 48

Trucos: (1) utilice el cdigo de barras de productos que ya existe en industrias organizadas
(industria refresquera, por ejemplo). El lenguaje se refiere entonces a productos cuya
descripcin existe en el estndar de la industria. (2) Utilice el hecho de que la jerarqua
misma contenida en los rboles descarta pronto grandes ramas de productos (por
ejemplo, cerca del nodo raz se descartan productos talese como Comida o Eventos
musicales, si lo que estoy buscando es Ferretera).
Si complicamos ms el lenguaje, ste debe poder describir:
1. El tipo de agente que soy. Comprador. Vendedor. Rento. Consignacin. Es
independiente del dominio.
2. Qu informacin ofrece. (esta parte ya est considerada, es el lenguaje de
descripcin del producto, o Capa de Especificacin del Producto.)
3. Descripcin del proceso de oferta y contraoferta, peticiones. (bidding
process). Si los agentes que visitan no solo van a intercambiar informacin,
sino que le van a solicitar a la mquina visitada que realice cierto proceso,
hay que poder describirlo (Knowledge Query and Manipulation Language,
ver proyecto 33)
4. Un modelo formal del proceso de regateo o negociacin. Ver Proyecto 37.
Ntese que el lenguaje debe poder permitir la interaccin ente comprador C y vendedor O
no importa si uno de ellos (o ambos) es una persona (en vez de un agente). En este caso,
la persona debe identificarse como tal soy persona, no agente, y el otro lado que lo
atiende debe poder pasarse a un modo de interaccin basado en menes grficos y formas
de captura interactivas, guiadas (construidas al vuelo?) por el lenguaje
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
[1] Adolfo Guzmn dirigi una tesis de maestra de un estudiante de Computacin del
Cinvestav (1994, no se recibi) que haca bsqueda en bases de datos poco familiares,
utilizando el mapeo de un rbol de conocimientos comunes en una cierta rea, a las
definiciones especficas de la base de datos a la cual se quera extraer informacin.
[2] Jae Kyu Lee, KAIST, Corea. Opportunities of Artificial Intelligence in Electronic
Commerce. Proc. 4th World Congress on Expert Systems, ITESM, Mexico, March 1998,
page 8 (abstract only).
[3] Adolfo Guzmn. Finding the main themes in a Spanish document. Journal Expert
Systems with Applications, Vol. 14, No.1/2, Jan/Feb 1998, pages 139-148.
[4] Lenat, D. B., and Guha, R. V. (1989) Building large knowledge-based systems. Reading,
MA: Addison Wesley.
[5] S. K. Lee, Jay Kyu Lee, K. J. Lee. Journal Expert Systems with Applications, Vol. 11
No. 4, pages 431-441, 1997.
[6] Jess Olivares est desarrollando en el C. I. C. una tesis de doctorado que involucra
agentes y sistemas evolutivos (que quiz aprendan), y probablemente se usen tambin
tcnicas como las de Clasitex para anlisis de lenguaje natural.
111. Olivares, J, Demetrio Aguirre, A., Domnguez Ayala, Mara, y Guzmn Arenas, A.
Computacin dirigida entre agentes con propsito. Foro Computacin, de la teora a la
prctica. Pgs. 210-219. 26-28 de mayo de 1999. Mxico, D. F. . ISBN 970-18-3012-1

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

29 de 48

39.

Uso de modelos digitales del terreno para estudiar erosin

OTROS NOMBRES (ttulos alternos). Estudio de erosin ocasionada por fluidos.


REA (dentro de la Computacin). GeoProcesamiento.
DESCRIPCIN. En qu consiste el proyecto. Utilice los modelos digitales del terreno, por
ejemplo, los que utilizan vxeles, para estudiar la erosin real de agua y viento. Para esto,
agregue a sus modelos informacin sobre el tipo de suelo, dureza, precipitacin, vientos
dominantes, etc. Haga simulaciones o predicciones de qu pasara en cierto tiempo x, en
2x, ...
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Idea:
use las tcnicas de erosin y dilacin de morfologa matemtica, convenientemente
cambiadas para tomar en cuenta la dureza del suelo y los efectos de la lluvia (o viento). Es
decir, cambiar la mtrica de las operaciones morfolgicas de dilacin y erosin (matemtica)
para modelar la erosin real (hdrica, elica).
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
35. Gmez, Dora y Guzmn, A. A digital Model for Three-dimensional Surface
Representation. Journal of Geoprocessing 1, 1979, 53-70. Elsevier Publishing Co. Also
in: Proceedings of an International Conference Computer Mapping for Resource
Analysis, a CoGeoData Conference. Kansas Geological Survey, University of Kansas,
and Instituto de Geografa de la UNAM. Mexico, 1978, pages 183-204.

40.

Nmeros de forma en tres dimensiones

OTROS NOMBRES (ttulos alternos). Representando formas tridimensionales con nmeros de


forma.
REA (dentro de la Computacin). GeoProcesamiento, reconocimiento de formas.
DESCRIPCIN. En qu consiste el proyecto. Generalice usted los nmeros de forma [33, 34,
397] para que describan formas (superficies) en tres dimensiones.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para describir la
forma de una superficie tridimensional.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
33. Bribiesca. E., y Guzmn, A. Shape Description and Shape Similarity Measurement for
Two-dimensional Regions. Proceedings of the 4th International Conference on Pattern
Recognition, Kyoto, Japn, 1978. 608-612. Also available as Technical Report PR 78 18
(Orange Series 9, 166), IIMAS UNAM, Also in: Journal of Geoprocessing, Vol. 1, No. 2,
129-144 (1980).
34. Bribiesca, E. y Guzmn, A. Nmeros de Forma: una notacin para describir formas
puras y para medir semejanzas y diferencias en formas. Reporte Tcnico PR 78 20 (Serie
Naranja 178), IIMAS UNAM, 1978.
39. Bribiesca, E. y Guzmn A. How to Describe Pure Forms and how to Measure
Differences in Shapes using Shape Numbers. Invited paper to the IEEE Conference on
Pattern Recognition and Image Processing. Chicago, USA. Also in Pattern Recognition,
Vol 12, No. 2, 1980, 101-112. This article won the Seventh Annual Pattern Recognition
7

La numeracin de los artculos de A. Guzmn sigue el orden en que aparecen en su curriculum.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

30 de 48

Award, awarded by the Pattern Recognition Society in November 1981, as the best article
of the year.
188. Ernesto Bribiesca, Adolfo Guzman. (2012) Enclosing Trees. Pattern Analysis and
Applications 15:1-17.

41.

Anlisis de imgenes mdicas

OTROS NOMBRES (ttulos alternos). Diagnstico de fotografas mdicas.


REA (dentro de la Computacin). Procesamiento de imgenes.
DESCRIPCIN. En qu consiste el proyecto. Tome usted un conjunto o tipo (de los muchos
que puede haber) de imgenes mdicas: cortes del rin, del hgado, imgenes de venas, de
eritrocitos, ..., pregntele al mdico o especialista respectivo para qu se tom la foto, qu
se le busca, qu informacin aporta. Haga un programa de cmputo que halle las respuestas
de manera automtica o semi-automtica.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Automatizacin del
anlisis y reconocimiento de imgenes mdicas.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

42.

Lenguaje de simulacin de efectos y consecuencias (en poblaciones


de afectados), de polticas, reglas y burocracias

OTROS NOMBRES (ttulos alternos). Anlisis de las consecuencias de decisiones sobre


conjuntos de poblaciones.
REA (dentro de la Computacin). Simulacin.
DESCRIPCIN. En qu consiste el proyecto. Construya un lenguaje y su procesador
(intrprete, quiz) que permita estudiar las consecuencias o efectos que ciertas
disposiciones, reglamentos, acciones, normas, leyes, costumbres, sobre todo de tipo
administrativo o burocrtico, tienen sobre personas. Para esto el lenguaje debe ser capaz de:
1. Definir los objetos (personas, digamos), sus propiedades, sus variables (salarios, estado de
descontento, tendencia a cambiar de empleo, tendencia a votar por el partido de
oposicin). Probablemente los objetos tengan una jerarqua: estudiantes, profesores,
burcratas, funcionarios, jefes de compras, ... Probablemente haya otros entes (objetos)
que no sean personas estrictamente, pero que funcionen como tales; comit de compras,
comit de becarios, comit de viajes, comit de prestaciones, comit del ao sabtico,
comit de lo que usted mande y guste.
2. Las interacciones, la manera en que estos objetos o personas interaccionan entre s.
3. Una forma de visualizar el progreso de la simulacin. Graficacin, despliegue de dibujos
que visualmente muestren lo que va ocurriendo, de manera dinmica, conforme la
simulacin avanza. Cmo cambia o se agudiza el estado de descontento, frente a una
decisin (suspender la beca del profesor, mientras lo evalo).
4. Maneras de detener la simulacin, cambiar parmetros, etc.
5. Bono extra. Maneras de dar marcha atrs.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Estudiar los efectos
de decisiones burocrticas, vicios, tendencias, sobre poblaciones confinadas (investigadores
del C. I. C., por ejemplo).

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

31 de 48

POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Use un
lenguaje para hacer simulacin.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

43.

Administrador del conocimiento de una empresa

OTROS NOMBRES (ttulos alternos). Programa bibliotecario que ha ledo los manuales
tcnicos, patentes, y otros documentos textuales de una organizacin, y conoce los temas de
los que trata cada uno.
REA (dentro de la Computacin). Procesamiento de texto y lenguaje natural, inteligencia
artificial.
DESCRIPCIN. En qu consiste el proyecto. Mucho del valor de una empresa es su
conocimiento, guardado primero dentro de las cabezas de sus empleados, y luego en los
manuales, directorios, catlogos, patentes, informes finales, semestrales, ... que se generan
continuamente. Un nuevo empleado puede andar buscando cierta informacin, pero tiene
que preguntar a otras personas dnde puede encontrar esa informacin. Es probable que no
se le refiera al documento existente, por ignorancia.
Usted desarrollar un bibliotecario, basado en Clasitex, que lea todos los
documentos escritos en espaol de una empresa, y los indexe y catalogue segn los temas
que cada uno abarca, usando el rbol de conceptos del sentido comn de CYC (o el
simplificado de Clasitex) o el rbol de conceptos especializados de la empresa (rbol de
pinturas, recubrimientos e impermeabilizantes, por ejemplo). Este bibliotecario podr
contestar preguntas provenientes de empleados o usuarios nuevos o poco familiarizados, del
tipo dnde puedo encontrar informacin sobre pinturas alklicas? El bibliotecario hallar
los documentos pertinentes, aunque uno de ellos se refiera, digamos, a recubrimientos
fenlicos, debido a que posee el rbol de conocimientos especficos.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Mucha de la inversin
valiosa de una empresa de alta tecnologa yace en su conocimiento, que se encuentra en
reportes finales, catlogos, descripciones de productos, artculos tcnicos, manuales de
usuario, y otros documentos escritos en espaol. Una persona poco familiarizada con los
trminos o los artculos de una empresa puede tener dificultades para accesar informacin
valiosa, debido a que no sabe dnde buscar, hay mucho dnde buscar, y no le orientan
adecuadamente. El bibliotecario que usted desarrollar pondr fin a este problema, y le
ahorrar mucho dinero a la empresa, al sistematizar el acceso y uso a la informacin tcnica
generada en lenguaje natural.
Many enterprises downsize to adapt to more competitive environments. But unless
they have captured the knowledge of their employees, downsizing can result in a loss of
critical information. Similarly, as employees leave, organizations are likely to lose access to
large quantities of critical knowledge. And as companies expand internationally, geographic
barriers can affect knowledge exchange and prevent easy access to information. These and
other forces are pushing enterprises to explore better methods for knowledge management.
Enterprise knowledge management entails formally managing knowledge resources,
typically by using advanced information technology. KM is formal y that knowledge is
classified and categorized according to a prespecified but evolving ontology into
structured and semistructured data and knowledge accessible and reusable to the enterprise.
The business world is becoming so concerned about knowledge management that,
according to one report, over 40 percent of the Fortune 1000 now have a chief knowledge

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

32 de 48

officer, a senior-level executive responsible for creating an infrastructure and cultural


environment for knowledge sharing. This article surveys some components of this young
field [1].
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Utilice
Clasitex. Vea los diferentes bibliotecarios de mi artculo [La computacin en la inter-ciencia].
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
[1] Daniel E. OLeary. Enterprise knowledge management. Computer, March 1998, pp 5461.
98.8 Guzmn A. Hallando los temas principales en un artculo en espaol. Soluciones
Avanzadas. Vol. 5, nm. 45, pg. 58. I parte, 15 de Julio de 1997, II parte vol. 5, nm.
49, pg. 66, 15 de septiembre de 1997. Tambin en: Simposium Internacional de
Computacin. Centro de Investigacin en Computacin. Instituto Politcnico Nacional.
Noviembre 12-14, 1997. Mxico, D.F., pginas 36-51.
99. Adolfo Guzmn. Finding the main themes in a Spanish document. Journal Expert
Systems with Applications, Vol. 14, No.1/2, Jan/Feb 1998, pages 139-148.
101. Beatriz Beltrn Martnez, Adolfo Guzmn Arenas, Francisco Martnez Trinidad, Jos
Ruiz Shulcloper. Clasitex++: una herramienta para el anlisis de textos. Memorias del
Tercer Taller Iberoamericano de Reconocimiento de Patrones, TIARP-98, Centro de
Investigacin en Computacin, Instituto Politcnico Nacional, Mxico, D. F. Marzo
1998. Pginas 369-379
Adolfo Guzmn. La Computacin en la Interciencia. Artculo a ser publicado en un libro en
homenaje al Dr. Marco Murray Lasso. 1998. Tambin: Simposium Internacional de
Computacin CIC 98 La computacin: investigacin, desarrollo y aplicaciones.
Noviembre de 1998. 41-56. Mxico, D. F. ISBN 970-18-1916-0.

44.

ndice del conocimiento digital

OTROS NOMBRES. ndice de todas las bibliotecas que existen en Internet, organizado por
conceptos.
REA. Sistemas de informacin, navegacin por Internet.
DESCRIPCIN. En qu consiste el proyecto. (1) Haga un rbol de todos los conceptos que le
interesan. Por ejemplo, conceptos de computacin. Siga los lineamientos para hacer un rbol
del conocimiento comn. En cada nodo de este rbol se almacenarn el apuntador (direccin
url) ms alguna descripcin (2,000 bytes, digamos) de cada artculo, libro o informe que
aparezca en cada biblioteca digital (o en un subconjunto de ellas). (2) Haga una tabla con las
siguientes columnas: (a) descripcin nica (direccin url ms algo, digamos) de un
documento; (b) fecha de la ltima visita a este documento; (c) si tenemos copia local de este
documento (si est en nuestro cach). (3) Haga un programa visitador o araa que visite
todas las bibliotecas digitales en Internet (o las que usted se interese), y de manera
incremental (a) lea cada artculo de ella; (b) usando Clasitex, averige de qu temas habla
ese artculo; (c) registre ese artculo en el rbol de (1), (d) lo registre en la tabla de (2), (e) si
el artculo ya ha sido consultado varias veces, lo guarde en el cach local. (4) Haga una
interfaz para el usuario, de manera que l pueda ver el rbol a cierto detalle, y pueda tambin
ver los apuntadores o ndices a los artculos que residen en cada nodo. (5) Haga un
programa asncrono o demonio, que peridicamente visite las bibliotecas, y actualice el
rbol, de acuerdo con la tabla de visitas en (2).
8

Estos nmeros se refieren a la lista de trabajos de A. Guzmn que aparece en su curriculum vitae.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

33 de 48

ANTECEDENTES, MOTIVACIN. Usted tendr en su computadora un ndice, organizado


por temas (3.0 Matemticas, 3.1 Aritmtica, 3.2 lgebra, 3.3 Ecuaciones Diferenciales,
3.3.1 Ecuaciones Diferenciales Ordinarias, 3.3.2 Ecuaciones Diferenciales Parciales, ...) de
todos los artculos, libros, documentos, informes, tesis, etc., de varias bibliotecas que existen
en Internet. Si usa la versin en espaol de Clasitex, estos documentos estarn en espaol. O
puede usar la versin en ingls de Clasitex.
Nota: el rbol que necesita Clasitex es precisamente el rbol del punto (1) en Descripcin.
Nota 2: el rbol del conocimiento resuelve de una vez por todas el problema de medir la
similitud entre dos documentos, que se puede medir como la distancia entre esos dos
documentos, medida sobre el rbol (nmero de nodos que los separan). Problema: un
documento est clasificado en varios nodos sobre el rbol.
Nota 3: como el rbol puede tener conceptos tales como Adolfo Guzmn, yo
automticamente puedo saber qu documentos hablan de Adolfo Guzmn, organizados por
temas.
VARIANTE 1. Haga un programa que nos informe qu documentos referencan a qu otros.
Cuntos documentos me citan a m. Qu autores. De qu nacionalidad. til para medir la
popularidad esttica de un autor (quines lo citan ms).
VARIANTE 2. Patrones de lectura. Ver proyecto # 45. Cmo medir la popularidad
dinmica de un autor, de un artculo (quines lo leen ms).
VARIANTE 3. Agrupamiento de artculos. Nubes o enjambres de artculos que se citan
frecuentemente entre s.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Proyecto No. 32.

45.

Estudio dinmico de los lectores de bibliotecas digitales

OTROS NOMBRES. Minera de datos de lecturas. Preferencias de lectores de bibliotecas


digitales. Patrones de lectura. Hbitos de lectura.
REA. Acopio de estadsticas.
DESCRIPCIN. Sobre el ndice mundial del conocimiento (Proyecto # 44), vea la dinmica de
un grupo de lectores. (a) Qu lee Adolfo Guzmn; (b) quiero leer lo mismo que lee
Cuauhtmoc Crdenas; (c) qu leen los integrantes del CIC; (d) en qu se difieren los
hbitos de lecturas del grupo 1 con respecto a los del grupo 2; (e) que artculos son ms
populares; cuntos das dura la popularidad, es decir, el rating de un artculo; (e2) qu
temas son los ms solicitados (medido sobre el rbol); (f) cadenas de Markov entre
artculos: despus de leer un artculo sobre accidentes, 29% de los lectores leen anuncios
sobre seguros de vida; en general, patrones de lectura. Segn la edad: conforme
envejecemos, qu leemos; por ocupacin, por nivel socio-econmico, en pocas de
elecciones, cuando hay tensin en la sociedad, etc.; (g) agrupamientos de artculos que se
leen junto; (h) formulacin predictiva de una publicacin peridica para el lector x, basado
en sus hbitos de lectura, ms una mezcla de las noticias importantes, ms una mezcla de lo
que leen otros selectos lectores; (i) nubes dinmicas de autores, grupos de gentes que se leen
entre s (no que se citan entre s, esto se mide en el proyecto #44); (j) cadenas de Markov
sobre la dinmica de la lectura: con referencia a un grupo 1, Juan Prez (uno de sus
miembros) lee primero los artculos extranjeros; luego, los lee fulano, zutano,...; luego,
empiezan a escribir sobre ese tema perengano y mengano.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

34 de 48

ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para hallar patrones


de lectura. Para generar publicaciones electrnicas personalizadas.
Nota: Nota: el proyecto #19 hace un estudio similar, pero no sobre lo que se lee,
sino sobre lo que aparece en los informes o peridicos.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Proyectos #44, #46.

46.

Patrones de compras de clientes, sobre el rbol de productos

OTROS NOMBRES. Minera de datos de ventas. Qu cosas compran mis clientes, organizadas
por lneas de venta.
REA (dentro de la Computacin). Acopio de estadsticas.
DESCRIPCIN. Como el proyecto # 45, pero use el rbol de productos de la base de datos o
cubo de datos, del expendio o empresa comercial que estamos analizando. Site cada venta
a un cliente en el rbol de productos.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Patrones de
consumo. Para promociones. En qu das se vende ms carne. En qu das se compra ms.
Qu se vende ms los viernes? Qu pares de productos se compran frecuentemente juntos?
Cada vez que compro carne, compro salchichas y vino tinto. Qu compra Juan Prez? Qu
compran los jugadores de baloncesto? Lea las preguntas de los proyectos 44 y 45, y
reescrbalas en funciones de artculo comprado, en vez de artculo ledo.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Como
los proyectos 44 y 45 (quo vide). Usted no necesitar una araa, pues los datos estn juntos.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Proyectos #44, #45.

47.

Estadsticas en la Web de artculos, ligas, lenguajes, etc.

OTROS NOMBRES. Estructuracin de la web. Tamao de la web.


REA (dentro de la Computacin). Agentes. Computacin distribuida.
DESCRIPCIN. En qu consiste el proyecto. Usando algunas de las tcnicas del proyecto #44,
viaje por la red y coleccione este tipo de estadsticas: de artculos, de servidores, de
porcentaje de artculos con errores ortogrficos, distribucin por idioma. Nmero de ligas
de una pgina a otra, pginas muy apuntadas, pginas que apuntan mucho a otras. Edad de
una pgina. (A) estudio esttico. (B) estudio dinmico: cmo cambian las propiedades
medidas en (A).
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Entender qu sucede
en la Web, cmo est formada. Cmo crece. Tendencias. Predicciones.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Proyecto #44

48.

Predicting catastrophes by agents watching the data base: beyond


data mining

OTROS NOMBRES (ttulos alternos). Agents that watch the data base (or the web) and
predict some phenomena.
REA (dentro de la Computacin). Agents. Prediction.
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

35 de 48

DESCRIPCIN. En qu consiste el proyecto. Start from some models of catastrophes or


phenomena that you want to detect, to predict. Watch the data base, with an on-line (or offline) demon, and try to fit the observed data patterns to your model(s).
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. To predict
catastrophes.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. The
Directorate of Civil Protection of Mexico City watches flow of information in radio, TV,
police and ambulance communications, to predict conflicts and catastrophes, and to react to
them in an anticipated matter. This model can be copied or used in what I propose.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Proyecto #32.

49.

Proto-minera de datos

OTROS NOMBRES (ttulos alternos). Pre-mineros de datos. Mineros con mucha sensibilidad
(capaces de detectar seales muy dbiles).
REA (dentro de la Computacin).
DESCRIPCIN. En qu consiste el proyecto. Haga un minero que, cuando detecte que la
condicin xx sucedi u ocurri, pregunte por ms datos, o busque ms datos (de un cierto
tipo, con una cierta configuracin o patrn) para realmente determinar si algo interesante
(condicin yy) ha sucedido.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Deteccin de seales
dbiles. Deteccin rpida de condiciones que pueden disparar o pre-condiciones, y
luego, deteccin con ms esmero o cuidado, del resto del fenmeno. Se divide el fenmeno
(patrn de datos a buscar) a detectar en dos partes. La primera la lleva a cabo el protominero, y es una bsqueda rpida, o normal. La segunda, si se detect la primera, ya es
con ms cuidado, ms prolija.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
*92. Guzmn A. Mineros de Datos. (1996) Soluciones Avanzadas No. 34, Mxico D.F.,
junio 15. http://www.fciencias.unam.mx/revista/soluciones/30s/No34/mineria.html
Tambin: ARCHIPILAGO. Vol. 2 nm. 9, pg. 19ff. Nov.-Dic.
*97. Guzmn A. Estado del Arte y de la Prctica en Minera de Datos, Anlisis y Crtica.
(1997) Memorias del II Taller Iberoamericano de Reconocimiento de Patrones, 367-376.
La Habana, Cuba. Marzo 24-28.
107. Adolfo Guzmn, Gilberto Martnez Luna. Minera de datos con bsqueda de patrones
de comportamiento. (1999) Boletn de Poltica Informtica, Ao XXII, 2, 13-30.
INEGI, Aguascalientes, Mxico.
112. Garca, A., Guzmn Arenas, A., y Martnez Luna, G. Anasin: Minera de datos con
bsqueda de patrones de comportamiento. (1999) Memorias del Foro Computacin, de
la teora a la prctica. Pgs. 15-28. Mxico, D. F., 26-28 de mayo. ISBN 970-183012-1 Tambin: Memorias del Congreso Internacional de Computacin CIC-99. Pedro
Galicia, ed. CIC-IPN. ISBN 970-18-3697-9. Pginas 528-540
113. Guzmn, A. Minera y bodega de datos. (1999) Memorias del Simposium Nacional de
Computacin SICOM 99, 5-13. Villahermosa, Tabasco. 7-11 de junio. ISBN 970-183046-6.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

36 de 48

50.

Rutas ptimas de camiones repartidores

OTROS NOMBRES (ttulos alternos). Trayectorias de vehculos que deben cumplir con ciertas
restricciones.
REA (dentro de la Computacin). Inteligencia Artificial.
DESCRIPCIN. En qu consiste el proyecto. Escriba un programa que calcule la ruta ptima
(o una buena aproximacin) para un vehculo que debe viajar por las calles de una ciudad,
visitando ciertos lugares, y adems debe cumplir con alguna de estas restricciones: (1)
minimizar la longitud de su recorrido; (2) el vehculo lleva dinero, que va depositando en
diferentes cajeros automticos (al llegar al ltimo, deposita el remanente, y regresa vaco).
Ahora bien, hay distintas zonas con distinta inseguridad (ndice de asaltos); minimice usted el
valor perdido en un asalto. (3) Optimice su recorrido porque hay cierta urgencia en visitar
ciertos lugares, hay lugares con una hora lmite para que el vehculo llegue (despus de la
cual, hay un descontento o penalidad).
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. Es un
problema de optimizacin.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

51.

Costos de inversin y operacin en una universidad presencial


versus en otra virtual

OTROS NOMBRES (ttulos alternos). Costos de la educacin convencional, y su comparacin


con enseanza en lnea.
REA (dentro de la Computacin). La tesis es ms bien de administracin o contadura.
DESCRIPCIN. En qu consiste el proyecto. Calcular costos de inversin, costos de
operacin, tendencias de costos.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para evaluar la
conveniencia de seguir construyendo universidades de ladrillo, versus hacer universidades y
enseanza en Internet.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
Digamos que usted va a hacer edificios para una Universidad de 5,000 alumnos.
(Sugerencia: vea cuntos alumnos tiene su universidad, y pregunte cunto cost; esto le dar
el costo por alumno). Si no tiene el dato, agregue los costos del edificio de aulas, el de las
autoridades, el de los burcratas, el estacionamiento, la biblioteca, el gimnasio, la alberca,
los guardias, los laboratorios, los invernaderos, la jaula para animales, los equipos de
experimentacin, los equipos del gimnasio, los libros de la biblioteca...
Ahora bien, para calcular el costo de INVERSIN en una universidad virtual,
digamos que para cada 100 alumnos necesita un servidor de 4,000 dlares, 25 a 35
mquinas clientes de 1,000 dlares, y un espacio de xx dlares (No s cunto cueste un
cuarto para albergar 100 estudiantes en Guatemala). Sale ms barato si los estudiantes
estudian en su casa o en su trabajo. Agregue otros gastos de INVERSIN (que solo se
hacen una sola vez. Calcule entonces el gasto de INVERSIN por alumno.
Publique sus datos en la Web (enveme una copia) para que otros lo sepan. Publique
sus datos como un artculo en
(a) el Congreso Internacional de Computacin CIC 2001 (ver informacin en
http://www.cic.ipn.mx);
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

37 de 48

(b) la revista Computacin y Sistemas (tendr que mandar su artculo a ver si se lo aceptan).
revista@cic.ipn.mx o cvs@cic.ipn.mx
BONO ADICIONAL: Calcule los costos de OPERACIN. Cunto cuesta cada alumno por
ao. Pago a empleados de la universidad (profesores, secretarias, jardineros, burcratas,
presidentes de comits), electricidad, libros que se gastan, computadoras que se gastan
(depreciacin), diskettes, hojas de papel, viajes, etc. Si desea, agregue los gastos del
alumno: comida, hospedaje, ropa, etc. --- CASO REAL.
O bien: cunto cobra una universidad de colegiatura, por hacer estudios de
licenciatura? Una buena universidad privada en Mxico cobra unos 5,000 dlares por
semestre de 5 materias.
Nota: Si su gobierno no le cobra, no piense que el costo es 0 dlares. Su educacin cuesta,
aunque usted no la pague. Forma correcta de calcular: calcule pago a empleados de la
universidad, electricidad, etc., como lo dije arriba.
Calcule los costos de OPERACIN de un alumno virtual: costo del software EVA
para rentarlo a la universidad: cinco dlares por alumno por materia semestral. Costo de los
asesores. Costo de la administracin.
O bien: cunto le cobra una universidad por educacin virtual? El CIC del IPN
cobra mil dlares por materia por semestre.
BONO ADICIONAL: Calcule un poco las tendencias. Los edificios duran 30 aos, luego
hay que remozarlos o restaurarlos. Los libros de computacin duran cinco a seis aos. Las
computadoras duran 5 aos. En sus conclusiones, ponga: Cul es el futuro de la educacin
presencial? O sea, cul es la tendencia de los costos en la educacin presencial? Comprela
con la tendencia de los costos en la educacin virtual.
NOTA: No confunda educacin virtual (va Internet) con educacin por teleconferencia (va
televisin y satlite). Esto ltimo es caro: el costo de los canales de satlite, del equipo de
transmisin y recepcin. Adems, la educacin por satlite es sncrona (profesor y alumno
deben coincidir a determinada hora) en tanto que la educacin virtual es asncrona (el
alumno estudia cuando quiere, el profesor puede estar durmiendo o muerto).
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
http//www.cic.ipn.mx http://eva.cic.ipn.mx

52.

Sitios Web que se autoorganizan de acuerdo con las preferencias del


usuario

OTROS NOMBRES (ttulos alternos). Minera de datos para ajustar el contenido de pginas
web y otros documentos electrnicos.
REA (dentro de la Computacin). Minera de datos + Internet.
DESCRIPCIN. En qu consiste el proyecto.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Usar minera para
ajustar el contenido de pginas web, de libros, de artculos, de acuerdo con preferencias
colectivas.
Ajustar contenido de acuerdo con la preferencia individual, es como un camalen: me ven del
color que quieren.
Ajustar contenido de acuerdo con la preferencia colectiva, es como un mueblero que hace ms
sillas que roperos, porque le consta que se le venden ms.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
Para ajuste al perfil individual.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

38 de 48

(a) cmo obtener el perfil individualo. Ofrezca un servicio gratuito por Internet, pero pida
que se suscriban. As, le da a cada usuario un nmero nico (y una contrasea). Luego,
pdale que llene cierta tablita o cuestionario sencillo. Luego, vigile qu pginas (de
usted) prefiere leer, qu artculos visita ms, qu compra ms, etc. De esta manera, usted
obtiene su perfil individual.
(b) Ajuste la pgina, documento, tabla de datos,... al perfil (a), eliminando, reduciendo o
expandiendo temas o secciones, segn los intereses de l.
Para ajuste al perfil colectivo.
(1) Clasifique a sus usuarios en n tipos o clases, y establezca para cada clase un perfil de
clase.
(2) Ajuste la pgina o documento que enva, usando (b), a la clase a la cual pertenece el
usuario receptor.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.
"Web Sites Begin to Get Organized, on Their Own" Self-organizing Web sites are moving the
Internet toward "self-consciousness" by employing software that automatically manages
content according to collective tastes. Joey Anuff, editor-in-chief of the site Plastic.com,
says, The Web in 1996 . . .
http://www.acm.org/technews/articles/2001-3/0119f.html#item6

53.

Descriptor de personas y buscador automtico

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin). Agentes, Internet.
DESCRIPCIN. En qu consiste el proyecto. Extienda XML (defina un machote en XML)
para describir personas (y otros recursos del Web) y hacer un buscador automtico. til
para: * agentes que venden * que buscan conocimiento * busco novia, esposo, trabajo... *
vendo zapatos, ferretera... * busco gentes que hayan comprado un estreo y necesiten
mantenimiento, o bocinas, o discos. * busco servidores dbiles para agazapar ah algn
software atacante de otra instalacin.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

54.

Bases de datos de texto coordinadas

OTROS NOMBRES (ttulos alternos). Bases de datos distribuidas sin acoplamiento ni


replicacin
REA (dentro de la Computacin). Bases de datos, sistemas de informacin.
DESCRIPCIN. En qu consiste el proyecto. Usar un software libre disponible en la red para
bibliotecas digitales (por ejemplo, Phronesis) para almacenar texto. Presentar un frente
comn que accese a distintas copias de estas bases, una en una ciudad, otra en otro lugar.. El
mtodo de acceso es el mismo. Tienen un front-end comn.
Trabajo adicional: De ciertas bases, tener rplicas. En modo espejo. O como una rplica
caliente, que absorbe parte de la carga de consulta.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Sirve para tener una
base de datos de automviles robados, donde cada estado de la repblica tiene su propia
base, pero es posible consulta global. Para ofertas de trabajo. Para personas perdidas.
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

39 de 48

POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

55.

Convergencia iterativa de bsquedas en dominios poco


estructurados

OTROS NOMBRES (ttulos alternos). Combinacin a la medida de diversas funciones de


similaridad, segn la reaccin del usuario.
REA (dentro de la Computacin). Bsqueda, clasificacin no supervisada, cmulos, funciones
de similaridad, confusin, inconsistencia.
DESCRIPCIN. En qu consiste el proyecto. Imagine (1) que tenemos una gran cantidad de
objetos (piense en piezas musicales, canciones, jazz, melodas, baladas, sinfonas, conciertos
de piano, tros de msica de cmara) que estn caracterizados de una manera que usted
no sabe (o sabe poco): duracin, intensidad del sonido, frecuencia promedio, clave (de
msica) de la pieza, relacin de silencios a sonido, cmo vara la frecuencia dominante en
funcin del tiempo, si tiene voz, el compositor de la letra, el de la msica, la orquesta, el tipo
de pieza musical, la empresa disquera No todos los objetos tienen todos los rasgos, por
ejemplo los cuartetos para orquesta de cmara no tienen voz. Imagine (2) que usted es
aficionado a la msica, y quiere escuchar msica de un cierto tipo, que a usted le gusta, pero
no sabe cmo definirlo. (Otro escenario: usted est buscando cierto tipo de imgenes, que
reflejen melancola, serenidad y calma, pero no aburrimiento ni vulgaridad). Por ejemplo,
Pandora es un software libre que, cuando usted le da dos o tres ejemplares de melodas que
a usted le gustan, le encuentra una gran cantidad de melodas similares. O Google Imgenes,
le da un montn de imgenes similares a una que usted seal. Similares segn Pandora,
pero no necesariamente segn usted.
El problema con estas aplicaciones es que no saben leer su mente. Si no le dan lo que
usted anda buscando, pues no sabe usted qu cambiar para que le arrojen resultados ms
acertados. Ni el software sabe qu preguntas hacerle. Cmo sintonizar o afinar un buscador
guiado por rasgos, para encontrar lo que a usted le interesa, lo que le es til?
El problema es: dado un conjunto pequeo (tres, digamos) de objetos prototipo
que usted da como ejemplo (objetos ejemplares los voy a llamar), el buscador tiene que
hallar muchos otros objetos similares a esos ejemplares. Pero la similitud debe ser la que
usted necesita, no la que el software use. Pero usted no sabe cmo comunicarle al software
qu quiere, ni el software sabe qu preguntarle (le puede preguntar en qu clave quiere que
le entregue las melodas, pero eso usted no lo entiende, no sabe qu es clave de Sol, por
ejemplo).
Entonces el buscador debe proceder por tanteo. Le muestra ciertos resultados. Usted
indica no solo su conformidad o inconformidad con los resultados, sino le da otra
informacin adicional: por aqu vas bien, pero por all vas mal. Por ejemplo, estos tres
resultados estn bien, estos otros cuatro estn mal, el resto es irrelevante. O algo ms
especfico. Por ejemplo, en ajedrez el software le pregunta: Quieres que juego agresivo, o
cauto? Quires que juegue a ganar, o a empatar Quires que muestre una habilidad
descomunal al mover los caballos? Quieres salidas poco comunes? Y vara sus
caractersticas de acuerdo con lo que el usuario dice. Pero el usuario dice esto solo despus
de ver varios resultados.
Definicin del problema: Hacer un buscador que combine de varias maneras las
funciones de similitud y el peso de las caractersticas de los objetos, y que trabaje con

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

40 de 48

retroalimentacin del usuario, no solo diciendo estos tres resultados estn bien, estos
cuatro estn mal sino dando mayor informacin
Tcnicamente, un objeto se caracteriza por un conjunto de rasgos. Features. Color,
olor, sabor, si tiene crema, si se sirve caliente, si fueran platillos.
Cada rasgo se puede detectar (medir) por medio de feature detectors.
Cada feature tiene dos o tres funciones de similitud.
El usuario da unos cuantos objetos ejemplares.
Con ellos, el buscador usa los rasgos, los extractores de rasgos (se pueden tener los
objetos preclasificados en una tabla de hash para hacer la bsqueda rapidsima), las
funciones de similaridad, y unos combinadores para recobrar un montn de objetos
similares y ver si le atina a lo que usted quiere. Para leer su mente ya que usted no se
puede expresar en el espacio de funciones ni de combinadores.
Usted y el buscador estn dispuestos a hacer varios ensayos, varias bsquedas.
Convergencia iterativa. Al final de cada bsqueda, usted califica los resultados y modifica
ciertos rasgos de bsqueda aqu est la parte creativa, pues en principio usted no se expresa
bien en el espacio de rasgos La idea es tener buenos resultados despus de unas cuantas
iteraciones.
Combinadores posibles: (1) similitud al centroide de los objetos similares. Usar distancia de
Mahalanobis para normalizar las distintas varianzas. O sea, los que se parecen al promedio
de los objetos ejemplares. (2) dem con pesos en los rasgos. (3) dem con pesos en los
objetos ejemplares. (4) Este feature se requiere, no me devuelvas objetos sin este rasgo. (5)
Usar el centroide y la varianza de los objetos ejemplares (usar confusin e inconsistencia), en
vez de centroide y varianza clsicos. (6) Idntico a (1) pero se hace (1) sobre los objetos
similares al ejemplar 1 unin los similares al ejemplar 2 unin los similares al ejemplar 3. (7)
Los que se parezcan a los tres objetos ejemplares. (8) Los que se parezcan a dos de los tres
objetos ejemplares. (9) usar como centroide el mnimo comn ancestro (por ejemplo, el
mnimo comn ancestro de perro y gato es carnvoro; el mnimo comn ancestro de perro e
iguana es vertebrado). (10) Usar un predicado donde cada clusula tiene una confusin dada
por el usuario. Ejemplo: Quiero un departamento = [(con tres recmaras)1 AND (que est
en planta baja)2 AND (que tenga dos baos)1 AND (que cueste menos de seis mil pesos al
mes)0]3. Donde los nmeros despus de los parntesis indican el grado de desviacin
permitido a cada clusula, pero adems el grado de desviacin (confusin) total del
predicado debe ser cuando mucho 3.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para buscar en
dominios complejos, poco estructurados. Para leerle la mente al usuario que no sabe
expresarse en el espacio de rasgos.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo. (A)
recolecte muchos objetos digamos, 50,000 documentos. (B) establezca rasgos. (C) haga
feature extractors. Con ellos haga una tabla de hash con 50,000 renglones. (D) haga varias
funciones de similaridad. Use las funciones estadsticas del trabajo xx. (E) Haga varios
combinadores, cuando menos los que arriba menciono. (F) Haga un sistema interactivo
donde interacte con el usuario de manera convergente.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Teora de la
confusin, teora de la inconsistencia. Clustering. Clasificadores.
2002 Selecting the Right Interestingness Measure for Association Patterns
Kumar.pdf
Los trabajos de A Guzmn pueden bajarse, texto completo, de su blog
aguzman.blogspot.com
Proyectos y temas de tesis en computacin. 11 de mayo de 2012

41 de 48

*146. Serguei Levachkine, A. Guzman-Arenas (2007) Hierarchy as a new data type for
qualitative variables. Journal Expert Systems with Applications 32, 3, 899-910. Slides
here.
167. Sergei Levachkine, Adolfo Guzman-Arenas, Victor Polo de Gyves (2005) The
semantics of confusion in hierarchies: from theory to practice. In Contributions to ICCS
05 13th International Conference on Conceptual Structures: common semantics for
sharing knowledge, July 18-22 2005, Kassel, Germany. 94-107.
http://www.divshare.com/download/6257877-9a7
186. Adolfo Guzman-Arenas, Adriana Jimenez, (2010) Obtaining the consensus and
inconsistency among a set of assertions on a qualitative attribute. Journal Expert Systems
with Applications 37, 158-164. doi:10.1016/j.eswa.2009.05.010 (problemas 1, 3 y 4 de
seis problemas sobre inconsistencia)
189. Adolfo Guzman-Arenas, Alma-Delia Cuevas, Adriana Jimenez. The centroid or
consensus of a set of objects with qualitative attributes. Accepted by Expert Systems with
Applications. (problema 5 de seis problemas sobre inconsistencia)
(Problema 2) varios centroides. Clustering via centroids a bag of qualitative values and
measuring its inconsistency. Adolfo Guzman-Arenas and Alma-Delia Cuevas. Submitted
to a book.

56.

Parsing sintctico-semntico

OTROS NOMBRES (ttulos alternos). Analizador de texto que usa sintaxis y semntica.
REA (dentro de la Computacin). Lingstica computacional.
DESCRIPCIN. En qu consiste el proyecto. Tomar la salida de FREELING, evaluar qu
tanto hace sentido (su coherencia), y si es bajo, buscar combinatoriamente (pero con
heursticas, guiado por los marcos y etiquetas de los diferentes formantes del texto) salidas
(rboles) alternos que eleven su coherencia.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para entender lo que
dice un documento.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

57.

Estudio de la manipulacin de la informacin por distintas fuentes

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin).
DESCRIPCIN. En qu consiste el proyecto.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

58.

Estandarizacin de mtodos para construir software

OTROS NOMBRES (ttulos alternos). Metodologas tiles para construir software de


dominios especficos. Metodologas con herramientas y criterios de decisin para disear

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

42 de 48

aplicaciones de web para pequeas empresas. Otro: dem para minera de datos. Otro: dem
para workflow (flujo de documentos) (escritorios electrnicos).
REA (dentro de la Computacin).
DESCRIPCIN. En qu consiste el proyecto. Ejemplo 1: mtodos para desarrollar programas
que muestran en Web los resultados de algunas consultas a una base de datos, a usarse por
empresas mexicanas pequeas (PYMEs). Consideraciones: lluvia de ideas, roles especficos,
diseo gobal de subrutinas, reuso, uso de estas herramientas para <Diseo en minera>
<Diseo en web> <Diseo de aplicaciones geo>, RUP, Scrum, Xtreme Programming.
Consideraciones en el caso del ejemplo 1: acceso a base de datos desde ventanas. A) para
visualizar. B) para update. C) Para nuevos datos. Interfaces a usar: PhP, Java, flash.
Backend: MySQL, PosgreSQL. la interaccin?
OTRA DESCRIPCIN. Los mtodos generales para construir software (use componentes,
halle casos de uso, mantenga sus clases autocontenidas) son como las instrucciones o
libros de cmo hacerse rico, como ser feliz. Muy generales para poder interpretarse en
casos prcticos. Mucho ms efectivo sera un libro Cmo hacerse rico vendiendo
verdolagas. Se trata de desarrollar mtodos (metodologas) especficas para un rea
determinada. Ejemplos: Metodologas con herramientas y criterios de decisin para disear
aplicaciones de web para pequeas empresas. Otro: dem para minera de datos. Otro: dem
para workflow (flujo de documentos) (escritorios electrnicos). Probable modo de proceder:
(a) escoger un rea de construccin de software para facilitar la vida diseando y
construyendo (no se trata solamente de disear una metodologa, sino de inventar o
mejorar el mtodo y luego hacer software de apoyo que lo facilite, lo complemente No se
trata solo de disear un mejor mtodo para ganar la carrera de 100m planos, sino de hacer
el mtodo y ganar la carrera usando ese mtodo) un mtodo que permita construir ese tipo
de software ms gilmente, ms rpidamente, con menos errores, o con algunas otras
ventajas. (b) ver a varios diseadores y programadores prcticos (yo tengo acceso a varios
de ellos) cmo disean ese tipo de software (por ejemplo, software para desplegar datos en
Google Maps), platicar con ellos, ver qu herramientas usan. (c) Disear usted mismo(a)
una o dos de estas aplicaciones, para tener mejor idea de cmo se hace manualmente. (d)
pensar, proponer y discutir con esos diseadores qu cambios o mejoras podran hacerse, y
cmo hacerlas, qu tipo de herramienta nueva, de existir, facilitara la construccin de
Software para desplegar datos en Google Maps (o el rea escogida); (e) disear y hacer
(construir, probar, implantar) la herramienta; (f) disear con ella otro par de aplicaciones de
Software para desplegar datos en Google Maps o lo que se haya escogido, y buscar si
hubo mejoras al comparar con (c). Este tema de tesis requiere fluidez en la programacin,
familiaridad con bases de datos, con lenguajes de alto nivel es una tesis prctica, handson.
Consideraciones generales. Retroalimentacin temprana. Documentar en video. Problemas a
vencer: el efecto domin. Vamos bien (anlisis a la ligera). El problema de Rolls Royce.
Darnos cuenta de cundo un proyecto (o una etapa del mismo) ya fracas.
(Ejemplo: SAP. Ejemplo. SAS. Ejemplo: Open GS.)
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

43 de 48

59.

Estudio de la manipulacin de la informacin por distintas fuentes

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin). Manejo de texto, redes sociales.
DESCRIPCIN. Estudio de la manipulacin de la informacin por distintas fuentes. En una red
social (por ejemplo Twitter), analizar varias fuentes conspicuas de tweets (PRD, Televisa, la
Curia Mexicana, el PAN, por ejemplo) y determinar cmo distorsionan la informacin,
comparada contra una fuente (una cadena de noticias, digamos) que se toma como patrn
correcto. Variante: analizar blogs.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

60.

Diferentes maneras de medir la inconsistencia

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin).
DESCRIPCIN. Diferentes maneras de medir la inconsistencia (en eventos descritos por
propiedades no numricas). Juan tiene un perro dice A. Juan tiene un Doberman dice
B. Juan tiene un pastor alemn dice C. Juan tiene un mamfero dice D. Cul es la
inconsistencia entre estas afirmaciones? Disee diferentes maneras de medirlas. Halle
ejemplos prcticos de su uso. Se tienen varios artculos publicados sobre la teora de la
confusin y la teora de la inconsistencia.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

61.

Un deductor o contestador de preguntas no triviales

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin).
DESCRIPCIN. Un deductor o contestador de preguntas no triviales. Se tiene una red
semntica de hechos (nodos relacionados entre s mediante relaciones, como Jurez
naci_en Oaxaca, el perro come carne, el sol es caliente, las ranas viven en el agua) u
ontologa. Hacer un deductor que responda preguntas no triviales como Conoci Jurez a
Comonfort? Se mojan las ranas? Qu mamferos se alimentan de protenas de animal? La
mayora de los datos son simblicos (no numricos).
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Poder contestar
preguntas complejas, no triviales, a partir de una serie de hechos representada de alguna
manera, por ejemplo como una ontologa, o por ejemplo como una estructura de tablas de
bases de datos.
POSIBLE DESARROLLO. Requisitos: saber programar con fluidez, de preferencia Lisp
Prolog. (Java C est bien, otros lenguajes podran servir). Hay que hacer un deductor.
Podemos hacerlo de dos maneras: (a) trabajando como si fueran bases de datos, guardando
los hechos en tablas, y haciendo preguntas sencillas (puntuales) va SQL, y ms complejas
hilvanando varias preguntas sencillas. (b) Utilizando el principio de Resolucin de J. A.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

44 de 48

Robinson, pidiendo demostrar la falsedad de una afirmacin (una sentencia lgica, una
frmula lgica que no tienen variables libres). Por ejemplo, si quiero hallar el nombre de la
esposa de Jurez, le digo al resolvedor es falso que Jurez tiene una esposa. Si el
resolvedor me contesta F o NIL, significa: Tu afirmacin (tu sentencia) es falsa, Jurez s
tiene esposa, se llama Brgida Garca. Eso era lo que yo quera saber, gracias.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Este trabajo es parte
de la construccin de OM*, que es continuacin de OM.

62.

Uso de semntica para mejorar el anlisis de un parser

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin).
DESCRIPCIN. Uso de semntica para mejorar el anlisis de un parser (analizador sintctico).
Se tiene la salida de un parser (digamos, Freeling). Comete errores en su descomposicin de
oraciones en espaol porque no conoce la semntica de los verbos, de los adjetivos. Tome la
salida del parser, mida la incongruencia de la oracin (cosas que no hacen sentido), y
proponga nuevos parseos (anlisis) que tengan mejor congruencia (o la reduzcan a cero).
Ejemplo: El jinete con sombrero vena cansado. Ejemplo: Juan baaba a la nia y Pedro
secaba a la nia lo analiza (anlisis de dependencias) como (baaba Juan (a nia la) (y
Pedro) (secaba a nia la)) cuando el anlisis correcto debe ser (y (baaba Juan a nia la)
(secaba Pedro a nia la)).
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad. Para que la
computadora pueda analizar un documento escrito en lenguaje natural (espaol, ingls), es
necesario que entienda cada oracin. Entender significa poder representar el significado o
conocimiento o informacin en la oracin, en forma tal que se puedan hacer deducciones
(ver proyecto #61) o contestar preguntas complejas de manera correcta (consistentes con la
informacin que el documento contiene). Este analizador dotara a una computadora la
capacidad de entender un documento o escrito, y representarlo (guardarlo) en una
estructura de datos (una tabla, una ontologa, una lista) susceptible de poder manipularse
mecnicamente, por un algoritmo, para poder responder preguntas complejas y hacer
deducciones. Esto es muy parecido a aprender: la mquina lee un documento, lo entiende,
lo guarda en su memoria, y ya es capaz de contestar preguntas no triviales sobre la
informacin que el documento contiene. No se ha hecho antes. (El deductor se describe en
el proyecto #61).
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
Requisitos: familiarizacin con manejo de texto. Fluidez en la construccin de programas, en
especial si manejan texto. Java, C, C++ estn bien. Lisp es excelente. Otros lenguajes
podran servir. Se requiere usar FreeLing (http://nlp.lsi.upc.edu/freeling/, es un analizador
sintctico, gratuito, es relativamente fcil de aprender superficialmente). Una posible manera
de hacerlo:
(a) dle una oracin a FreeLing, y colecte su resultado, que generalmente ser un rbol de
dependencias.
(b) Analice ese rbol con un medidor de congruencia (que usted tiene que hacer). Este
software nos dir qu tanto sentido (semntico) tiene una oracin o grupo nominal que
FreeLing ha identificado, por ejemplo (el perro bebe leche). Qu es beber? Es ingerir un
lquido. La leche es un lquido? S lo es. Los perros pueden beber? S, pueden. Beben
leche? No s, quiz, porque los perros pueden beber y la leche es un lquido y es

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

45 de 48

comestible, es nutrimento. La congruencia es grande en este caso. La congruencia es un


nmero entre 0 (totalmente incongruente) y 1 (totalmente congruente, tiene sentido). Si
la frase tiene congruencia cercana a 1, est bien, y el medidor se aplica a otra frase,
recorriendo el rbol de abajo arriba, y calculando la congruencia de un rbol a partir de la
congruencia de sus sub-rboles.
(c) Si la congruencia est lejos de 1, hay que corregir el anlisis (la agrupacin de las
palabras en conjuntos con sentido). Por ejemplo, supongamos que FreeLing analiza Juan
y su novia van a la playa con olas grandes. y nos da este anlisis [rbol de
dependencias]: (van (y Juan (novia su)) (a playa la) (con olas grandes) (punto) ). El anlisis
est mal, pues dice que el sujeto de van es Juan y su novia (est bien) y el objeto es a la
playa (est bien), pero que van con olas grandes (est mal, estara bien si dijera con una
bibicleta). Las olas grandes no se refieren al acto de ir, sino a la playa. Las olas grandes
pertenecen a la playa, no a van. Entonces, el medidor de congruencia de (1) nos seala
que hay un error en (van sujeto objeto con olas grandes), que sujeto est bien, que
objeto est bien, y que error est en el rbol (van xx xx yyy). Hay que componerlo.
Entonces entra en accin el corrector semntico de subrboles, que va a proponer
nuevos anlisis (l mismo, ya sin usar FreeLing, que ya hizo lo que pudo) que mejoren la
congruencia. Qu puede estar mal? Pueden ir Juan y su Novia. S, s pueden acudir. La
playa, es un lugar a donde se va, a donde se acude? S, es un espacio geogrfico. Puede
un sujeto ir con olas grandes? Las olas describen una manera o forma de ir? No. Ah
caray, hay que moverla de lugar. Quin puede tener olas? La playa, el mar. Puede la
playa tener olas grandes? S. Entonces, el corrector semntico mueve a las olas grandes
de lugar, y ahora el rbol queda as: (van (y Juan (novia su)) (a playa la (con olas grandes))
(punto)). Ahora s, el sujeto va a la playa, en particular a una playa que tiene olas
grandes. El medidor de congruencia nos dice que este nuevo rbol est bien (congruencia
1). Ya mejor la congruencia, ya tenemos un mejor resultado. Si no se puede llegar a
congruencia = 1, con que se llegue a un valor cercano a 1 est bien. O en el peor de los
casos, con que se mejore sustancialmente la congruencia, est bien.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Este trabajo es parte
de la construccin de OM*, que es continuacin de OM.

63.

Cambio de opinin

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin).
DESCRIPCIN. Cambio de opinin. Tenemos una red semntica (nodos ligados por
relaciones) u ontologa donde se sabe entre otras cosas (naci Jurez Oaxaca). Pero
empieza a llegar evidencia de que Jurez naci en Francia, Jurez naci en Guelatao, Jurez
naci en Mxico, Jurez naci en Acapulco Haga que la red cambie de opinin de tal
forma que la actualizacin de informacin (belief revision, belief update) produzca
perturbacin mnima.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos. Este trabajo es parte
de la construccin de OM*, que es continuacin de OM.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

46 de 48

64.

Otro proyecto

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin).
DESCRIPCIN. En qu consiste el proyecto.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

65.

Otro proyecto

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin).
DESCRIPCIN. En qu consiste el proyecto.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

66.

Otro proyecto

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin).
DESCRIPCIN. En qu consiste el proyecto.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

67.

Otro proyecto

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin).
DESCRIPCIN. En qu consiste el proyecto.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

68.

Otro proyecto

OTROS NOMBRES (ttulos alternos).


REA (dentro de la Computacin).
DESCRIPCIN. En qu consiste el proyecto.
ANTECEDENTES, MOTIVACIN. Para qu sirve, cul es su finalidad.
POSIBLE DESARROLLO. Una de las maneras en que (tal vez) se pueda llevar a cabo.
PROYECTOS RELACIONADOS Y REFERENCIAS. Trabajos previos.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

47 de 48

Referencias generales: Mi blog: a-guzman.blogspot.com Describe reas en las que estoy


interesado, o he trabajado, o algunos alumnos o colegas.
Mi pgina Web: http//alum.mit.edu/www/aguzman
Mi pgina en Academia (contiene casi todos mis artculos, en texto completo): Entrar a
academia.edu y buscar Adolfo Guzmn Arenas. Quiz le pida registrarse, es gratis, adelante.

Proyectos y temas de tesis en computacin. 11 de mayo de 2012

48 de 48

También podría gustarte