Está en la página 1de 3

II EXAMEN DE LINGÜÍSTICA INFORMÁTICA

APELLIDOS Y NOMBRES: BARRIONUEVO CANCAPA ADA LUZ

COMENTARIO DEL PROYECTO LLEVADO A CABO EN MÉXICO


QUE LLEVA EL TÍTULO: “EL CORPUS HISTÓRICO DEL
ESPAÑOL EN MÉXICO”

Un corpus lingüístico es toda la información a trabajar, como muestras textuales de diversas


naturalezas, escritos, etc. todo aquello se lleve a análisis sirve para la construcción de otros
recursos lingüísticos, como son los diccionarios, lexicones, etcétera. Este proyecto se lleva
a cabo con el objetivo de realizar diccionarios electrónicos. en el caso de Perú si es que se
llevaría a cabo un tipo de investigación similar. Podríamos empezar por la recopilación de
los neologismos, jergas juveniles, vocabulario especializado de los policías, en el campo de
la medicina, en el campo de la ingeniería.

Si se busca trabajos ya en este campo y lo que se quiere hacer es continuar con la


investigación y generar lexicones, se tiene que tomar en cuenta todos los contextos del Perú

El corpus que se tiene que tener tiene que tomar en cuenta es el aspecto geográfico,
sociológico y quizá pragmático para ello se tiene que clasificar

COMPARACION CON UN TEMA DEL CASO PERÚ

Con respecto al proyecto que se llevó a cabo en mi opción considero que es un logro como
un ejemplo al mostrar un nuevo campo con un valor agregado como lo es el lenguaje
natura. Pero las palabras que se presentan son arcaicas, desfasadas en donde su uso es
ínfimo por no decir vago, pero lo que se debe elogiar a estos investigadores es su interés en
el lenguaje natural y tratar de inmiscuirse en este campo de la tecnología y tomar nuevos
temas fusionar dos especialidades la informática y la lingüística. Sobre todo el lenguaje
natural de hecho ese es el logro pero utilizaron un mal tema porque no es de utilidad. la
informática trae consigo un gran avance a esta era, al igual que la lingüística con el
constante cambio que se da en el mundo del lenguaje, entonces considero que se deben
hacer investigaciones con temas actuales también en la lingüística, por ejemplo la forma de
uso de algunas palabras de los jóvenes en redes sociales, en lo diario con amigos,
familiares, etc. no solo esto también armar un lexicón con palabras especializadas que
tratan los policías, médicos, ingenieros, que ayudarían mucho, sin embargo viendo nuestra
realidad no hay trabajos por lo menos similares a ello en alguna plataforma. si se quisiera
hacer un trabajo de esta magnitud se tendría que empezar de cero, primero con la
recopilación del corpus que sería un trabajo arduo y que tomaría bastante tiempo. Este
proyecto el de México quizá haya sido un poco más fácil porque ellos contaban ya con un
corpus electrónico, se le da el merito a la gran fusión que hizo con la ingeniería, y emplear
un lenguaje natural. En el Perú aun no se han realizado trabajos de gran magnitud. Empero
no se descarta en un futuro no muy lejano llevar a cabo un proyecto basado en lenguaje
juvenil, un lexicón de jergas que a la vez este a la disposición de cualquiera, llevándolo a
un diccionario virtual y sobre todo empleando un lenguaje natural. Las herramientas que
podemos utilizar para llevar a cabo este proyecto son varios.

HERRAMIENTAS

Debo: para realizar un diccionario, describe para extraer definiciones de internet a partir de
texto libre, ecode para extraer contextos definitorios de textos de especialidad mediante
patrones verbales, mbdaii que es una minería de textos sobre el sistema de base de datos
académica del instituto de ingeniería aplicar las técnicas de minería de textos y
procesamiento de lenguaje natural a la información proveniente de académicos del instituto
de ingeniería de la UNAM, extraída del mbdaii y por ultimo utilizar el termext extractor
terminológico extraer automáticamente candidatos a término a partir de textos
especializados de un texto plano.

LINEAS DE INVESTIGACION

Para tener un corpus más ordenado se deben de tomar en cuenta las siguientes líneas de
investigación:
- Análisis morfológico, sintáctico y semántico: donde se llevará a cabo un análisis
de significado, el orden de las palabras y como estas estaban compuestas.
- Bancos terminológicos: es un repositorio que reúne la terminología propia de lo
que se quiere ampliar, en este caso de las palabras.
- Lingüística de corpus: recaudar el corpus necesario para seguir con la
investigación.
- Lexicología y lexicografía: estudio de la estructura léxica según relaciones
sistemáticas y patrones recurrentes en la lengua mientras que la lexicografía
pretende simplemente describir o recoger formas léxicas y se centra en una
lengua particular.

A manera de conclusión vamos a decir que es un tema muy interesante el proyecto


planeado que se puede concretizar. Teniendo como ejemplo el proyecto realizado en
México.

También podría gustarte