Está en la página 1de 2

APUNTES CORPUS

(08/02/2019)
¿qué es un corpus de texto / lengua?
Corpus = cuerpo. Conjunto de texto suponiendo que el texto sea la lengua y que hay que
poner en un formato, generalmente electrónico. Un corpus de texto no es la lengua sino
una representación de la lengua que hace alguien (ser humano o una máquina como
resultado de un proceso que ha elaborado un ser humano previamente) pero sí que es
el mejor medio que tenemos para observar la lengua. La ventaja es que nos pone a
nuestra disposición unos datos para trabajar objetivamente y de modo científico.
¿por qué la lingüística de corpus?
De la observación del texto a las propiedades de la lengua. Aprender a observar la
lengua.
Es una rama que ayuda a desarrollar una cantidad de materiales que corroboren o den
respaldo a trabajos científicos. Nos permite extraer propiedades de la lengua natural
para elaborar el corpus.
Objetivo último:
- Descubrir y tratar los (algunos) problemas de las relaciones entre formas y
sentido en el texto digitalizados.
Del corpus a por ejemplo un diccionario.
Del diccionario al corpus.
- Formar las bases para un dialogo entre informáticos y lingüistas.
Del texto informatizado al diccionario.
Conocer significados de palabras y ser capaces de transmitir info usando enunciados
muy comunes con significados distintos que solo conocen las personas que tienen que
enterarse de la información. Encriptación inteligente.
A las máquinas hay que transmititrle las siguientes ordenes:
1. Identificar que esa cadena de caracteres es una “palabra” del español.
Contrastandolo con una base de datos en la que esa palabra aparece como tal.
2. Una vez que la tenemos identificada podemos plantearnos la pregunta de Qué
es esa palabra y cómo se comporta con otras.
3. ¿qué significa? La vuelta al diccionario, hemos contrastado con el mismo que
emsa es una palabra del español pero al mismo tiempo podemos tener que mesa
es varias cosas distintas (tiene varios significados).
INTERPRETACIÓN DE UN TEXTO EN LENGUA NATURAL: TRES FUENTES DE INFORMACIÓN
- Circunstancias enunciativas. Lo que hemos visto en pragmática y en análisis del
discurso.
- Conocimientos enciclopédicos.
- Sistema lingüístico.

También podría gustarte