Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ii Examen Ling-Informatica
Ii Examen Ling-Informatica
El corpus que se tiene que tener tiene que tomar en cuenta es el aspecto geográfico,
sociológico y quizá pragmático para ello se tiene que clasificar
Con respecto al proyecto que se llevó a cabo en mi opción considero que es un logro como
un ejemplo al mostrar un nuevo campo con un valor agregado como lo es el lenguaje
natura. Pero las palabras que se presentan son arcaicas, desfasadas en donde su uso es
ínfimo por no decir vago, pero lo que se debe elogiar a estos investigadores es su interés en
el lenguaje natural y tratar de inmiscuirse en este campo de la tecnología y tomar nuevos
temas fusionar dos especialidades la informática y la lingüística. Sobre todo el lenguaje
natural de hecho ese es el logro pero utilizaron un mal tema porque no es de utilidad. la
informática trae consigo un gran avance a esta era, al igual que la lingüística con el
constante cambio que se da en el mundo del lenguaje, entonces considero que se deben
hacer investigaciones con temas actuales también en la lingüística, por ejemplo la forma de
uso de algunas palabras de los jóvenes en redes sociales, en lo diario con amigos,
familiares, etc. no solo esto también armar un lexicón con palabras especializadas que
tratan los policías, médicos, ingenieros, que ayudarían mucho, sin embargo viendo nuestra
realidad no hay trabajos por lo menos similares a ello en alguna plataforma. si se quisiera
hacer un trabajo de esta magnitud se tendría que empezar de cero, primero con la
recopilación del corpus que sería un trabajo arduo y que tomaría bastante tiempo. Este
proyecto el de México quizá haya sido un poco más fácil porque ellos contaban ya con un
corpus electrónico, se le da el merito a la gran fusión que hizo con la ingeniería, y emplear
un lenguaje natural. En el Perú aun no se han realizado trabajos de gran magnitud. Empero
no se descarta en un futuro no muy lejano llevar a cabo un proyecto basado en lenguaje
juvenil, un lexicón de jergas que a la vez este a la disposición de cualquiera, llevándolo a
un diccionario virtual y sobre todo empleando un lenguaje natural. Las herramientas que
podemos utilizar para llevar a cabo este proyecto son varios.
HERRAMIENTAS
Debo: para realizar un diccionario, describe para extraer definiciones de internet a partir de
texto libre, ecode para extraer contextos definitorios de textos de especialidad mediante
patrones verbales, mbdaii que es una minería de textos sobre el sistema de base de datos
académica del instituto de ingeniería aplicar las técnicas de minería de textos y
procesamiento de lenguaje natural a la información proveniente de académicos del instituto
de ingeniería de la UNAM, extraída del mbdaii y por ultimo utilizar el termext extractor
terminológico extraer automáticamente candidatos a término a partir de textos
especializados de un texto plano.
LINEAS DE INVESTIGACION
Para tener un corpus más ordenado se deben de tomar en cuenta las siguientes líneas de
investigación:
- Análisis morfológico, sintáctico y semántico: donde se llevará a cabo un análisis
de significado, el orden de las palabras y como estas estaban compuestas.
- Bancos terminológicos: es un repositorio que reúne la terminología propia de lo
que se quiere ampliar, en este caso de las palabras.
- Lingüística de corpus: recaudar el corpus necesario para seguir con la
investigación.
- Lexicología y lexicografía: estudio de la estructura léxica según relaciones
sistemáticas y patrones recurrentes en la lengua mientras que la lexicografía
pretende simplemente describir o recoger formas léxicas y se centra en una
lengua particular.