Está en la página 1de 4

María Victoria García Nieto TERMINOLOGIA (2º GTEIN)

TEMA 5
1. Conceptos básicos
El procesamiento del lenguaje natural (Pln) es un campo del conocimiento al que han
contribuido a su desarrollo disciplinas como la lingüística, la informática, la ciencia
cognitiva y la ingeniería electrónica, esta última más estrechamente relacionada con
las tecnologías del habla. A lo largo de la historia del Pln los dos enfoques principales
de investigación adoptados han sido los paradigmas simbólico y estadístico1:

(i) el enfoque simbólico se caracteriza por la construcción de sistemas que


almacenan explícitamente los hechos lingüísticos (p.ej.
fonológicos/fonéticos, morfológicos, sintácticos, semánticos, pragmáticos
discursivos) a través de esquemas de representación del conocimiento,
desarrollados principalmente de forma manual.
(ii) el enfoque estadístico se caracteriza por la construcción de sistemas que no
almacenan explícitamente el conocimiento lingüístico o del mundo, sino
que aplican técnicas matemáticas sobre extensos córpora informatizados
con el fin de inferir dicho conocimiento.

1.1.- Diferenciando conceptos

Dentro de las tecnologías del lenguaje tenemos cuatro conceptos a destacar:

- Ingeniería lingüística: Es una disciplina de carácter multidisciplinario que utiliza


el conocimiento desarrollado en el marco informático del PLN y del marco
lingüístico nutrido de las diciplinas de la traducción, de la terminología y de la
lingüística computacional, tanto en sus vertientes teóricas como aplicadas.
- Industrias de la lengua: es el sector de actividad dedicado al diseño, producción
y comercialización de productos y servicios relacionados con el tratamiento de
las lenguas.
- Lingüística informática: Es la disciplina orientada al desarrollo de programas de
apoyo en los estudios realizados en diversos campos de la filología,
fundamentalmente extrae datos estadísticos, concordancias, colocaciones…etc.
- Lingüística computacional: es un campo interdisciplinario que se ocupa del
desarrollo de formalismos del funcionamiento del lenguaje naturales, tales que
puedan ser transformados en programas ejecutables para un ordenador. 
CUALQUIER ACTIVIDAD QUE IMPLIQUE UN ANÁLISIS O GENERACIÓN DE LA
LENGUA UTILIZANDO UN ORDENADOR. ÁREA DENTRO DE LA LINGÜÍSTICA
APLICADA. Se centra en la modelización del conocimiento lingüístico para
posibilitar la construcción de sistema computacionales que analicen y/o
generen textos en lenguaje natural.

2. Bases de datos terminológicas


María Victoria García Nieto TERMINOLOGIA (2º GTEIN)

Un banco de datos terminológicos es una recopilación estructurada y automatizada de


información sobre las unidades de significación y designación especializada, destinado
a responder las necesidades de un grupo definido de usuarios.

¿Quiénes son los usuarios principales de las bases de datos terminológicas?:

- Mediadores (Traductores, intérpretes, periodistas, redactores, etc.)


- Lexicógrafos y terminólogos
- Científicos y técnicos
- Documentalistas
- Asesores y planificadores lingüísticos
- Profesores de lenguas
- Investigadores en lingüística

2.1.- Criterios de clasificación de un banco de datos terminológico

- Según sus objetivos


a) Informativos
b) Prescriptivos

- Según su orientación de base


a) Basados en el término: si parten del término SEMASIOLOGICO
b) Basados en el concepto: si parten del concepto  ONOMASIOLÓGICO

- Según su temática
a) De temática especializada general: que contenga muchos campos
b) De temática especializada concreta: un campo terminológico que trate un
tema

- Según sus dimensiones


a) Grandes dimensiones: organismos de carácter administrativo (IATE)
b) Minibancos de terminología: profesional o centro especializado en una
materia

- Según los datos que contienen


a) Bancos de términos propiamente dichos
b) Bancos de fraseología
c) Bancos de términos en sus documentos (textos especializados, Wikipedia)
d) Bancos enciclopédicos (Wikipedia)
e) Bancos visuales (Wipo, ikonet)

- Según la selección de contenidos en relación con sus objetivos


a) Normativos (Aenor, eurlex)
b) Prescriptivos (iate)
c) Informativos (ate)

- Según el número de lenguas


María Victoria García Nieto TERMINOLOGIA (2º GTEIN)

a) Monolingües
b) Plurilingües
c) Monolingües con equivalencias en otras lenguas

- Según la organización de los datos


a) Organizados a partir de documentos (corpus)
b) Organizados a partir de términos descontextualizados

- Según el hardware
a) Desarrollados en gran ordenador  base de datos de Google
b) Desarrollados en microordenador  ordenador normal

- Según el sistema del banco


a) De primera generación  ad hoc, organización léxica en un sistema
conceptual
b) De segunda generación  mejoras en el diseño. Al margen de grandes
centros oficiales

2.2.- Bancos de datos de interés terminológico

Trabajo terminológico  crea bases de información especializada  entre los que se


incluyen bancos de datos terminológicos  todos aquellos recursos documentales en
forma de bancos de datos que sirvan de información conceptual y de base de
detección de términos – cualquier recurso documental que aporte información
terminológica es un banco de datos de interés terminológico.

Un banco de datos de terminológico siempre es un banco de datos de interés


terminológico, pero un banco de datos de interés terminológico no tiene por qué ser
un banco de datos terminológico.

Tipos:

- Bancos de datos bibliográficos


- Bases textuales (corpus)
- Bases de conocimiento (ontologías)
- Bases de datos terminológicos

2.3.- Información útil de las bases de datos

- Contexto
- Ámbito de uso
- Fuente y fiabilidad
- Información gráfica
- Variantes denominativas
- Relaciones conceptuales y ontológicas

2.4.- Elementos que hay que contemplar al usar bases de datos terminológicas
María Victoria García Nieto TERMINOLOGIA (2º GTEIN)

1. Ayuda de elementos gráficos


2. Identificar el contexto y el campo temático
3. Distinción de niveles de especialidad
4. Prestar atención a la sinonimia y polisemia

2.5.- Fases de creación de bancos de datos

1) Elaboración del proyecto: Lineas  un equipo se reúne para hablar de cómo


va a ser esa base.
a) Para qué: identificar las necesidades
b) Evaluar puntos fuertes y débiles
c) Detectar los obstáculos
d) ¿Qué elementos intervienen en la viabilidad?
e) Seleccionar el grupo de trabajo

La viabilidad con respecto a una base de datos quiere decir si es posible llevarla a cabo.
Para evaluar la viabilidad, hay que tener en cuenta una serie de elementos: un equipo,
financiación y tiempo.

2) Estudio específico de la viabilidad  ¿Es posible? Se hace un estudio para


saber si es posible o no, realizable.

3) Diseño general: concepción general de banco de datos, empleo e ingenieros.

4) Selección del hardware y el software: participan ingenieros

5) Concepción detallada del banco de datos la creación

6) Simulación proyecto piloto  para ver como sería, como funciona, adelantarse
a los problemas

7) Creación y actualización  también requiere financiación (la actualización)

También podría gustarte