Está en la página 1de 18

CJS - 222

Docente:
NIDIA EDITH ARAOZ RIOJA
 La lingüística computacional es un campo
Multidisciplinario encargada del
desarrollo y estudio de formalismos
descriptivos del funcionamiento del
lenguaje natural, tales que puedan ser
transformados en programas ejecutables
para un ordenador.
 La lingüística computacional no se centra
en ninguna de las áreas de la lingüística en
particular, sino que es un campo
interdisciplinar, en el que participan
lingüistas, informáticos especializados en
inteligencia artificial, psicólogos
cognoscitivos y expertos en lógica, entre
otros.
 A la Lingüística Computacional se le llama
a veces Procesamiento del Lenguaje
Natural, debido a la combinación de Datos
informáticos y el lenguaje para un trabajo
conjunto.
 La lingüística computacional surgió en los
EE. UU como un esfuerzo para obtener
computadoras capaces de traducir textos
automáticamente de lenguas extranjeras
al inglés, particularmente de revistas
científicas rusas. Surgió como resultado de
las aseveraciones de Warren Weaver,
quien veía en la traducción una forma de
descifrado.

 Cuando la inteligencia artificial apareció


en la década de los sesenta, la lingüística
computacional se convirtió en una rama
de la Inteligencia Artificial, tratando con el
nivel de comprensión humano y la
producción de los lenguajes naturales.
 Para traducir un lenguaje en otro, se
observó que uno tenía que entender la
sintaxis de ambos lenguajes, al menos en
el nivel de morfología y las frases enteras.

 Para entender la sintaxis, uno debe


entender la semántica del vocabulario y la
pragmática del lenguaje. Lo que empezó
como un esfuerzo para traducir textos se
convirtió en una disciplina encargada de
entender cómo representar y procesar el
lenguaje natural individual usando
ordenadores
 La lingüística computacional teórica se
basan la ciencia cognitiva.
 Los aportes de la psicología cognitiva y
psicolingüística, dieron como resultado la
aparición de una nueva ciencia, que es la
psicolingüística computacional.
 Su objetivo es desarrollar teorías
lingüísticas computables, es decir, que
puedan ser aplicadas sutilmente a los
ordenadores. Dado que las teorías
formales existentes no dan cuenta de
todos los fenómenos lingüísticos posibles,
la lingüística computacional teórica se
perfila como un incentivo para la
comprensión formal de los procesos
lingüísticos, así como un medio para su
demostración práctica.
 Esto ocurre, por ejemplo, mediante el
análisis automático de grandes corpus
lingüísticos, para investigar un fenómeno
lingüístico o probar la validez de una
teoría.

 Sin embargo, no todas las teorías


lingüísticas tienen la pretensión de ser
aplicadas al dominio informático. En
efecto, la lingüística cognitiva estudia las
motivaciones de un hablante determinado
para expresarse, lo que naturalmente está
lejos de poder ser modelado con un
ordenador.
 Es una rama de la lingüística
computacional con una evidente
orientación tecnológica, lo que ha
provocado que con frecuencia sea referida
con nombres como ingeniería lingüística o
tecnología del lenguaje humano.

 Se centra en los aspectos prácticos que se


puedan derivar de la simulación de la
conducta lingüística con medios
informáticos. Su objetivo es crear
productos informáticos que incorporen
algún componente en el que intervenga el
lenguaje, oral o escrito. Entre ellos figuran:
1. El apoyo a los usuarios de computadores
con el procesamiento de texto, por
ejemplo, corrección de errores de
digitación y ortográficos, prueba de la
corrección gramatical, cambio en
ideogramas en japonés o chino.

2. La búsqueda automática en pasajes de


texto, y no solo en su forma, sino en su
significado.

3. El apoyo al traducir textos en otra lengua


(traducción asistida por ordenador) o
también la traducción automática.

4. El procesamiento del lenguaje hablado,


por ejemplo, en el servicio de
información telefónico o en aparatos de
lectura para ciegos.
5. De la búsqueda de información en
bibliografías, contestación directa de
preguntas sobre la base de grandes
bancos de datos.
6. El tratamiento de datos presentes
lingüísticamente, por ejemplo, la
indexación de literatura, la creación de
índices, lista de materias y la producción
de resúmenes.
7. El apoyo a los autores en la redacción de
textos, por ejemplo, en la búsqueda de la
palabra precisa o la terminología
correcta.
8. La interacción de los usuarios con el
computador en lenguaje natural, tal que
los computadores sean accesibles
también a las personas que no tienen
suficiente conocimiento de las órdenes
específicas.
 Los estudios computacionales de la
estructura del lenguaje se iniciaron con la
publicación de Syntactic Structures, por
Noam Chomsky, quien propuso por
primera vez que la estructura sintáctica
del lenguaje se puede modelar a través de
un sistema de reglas completamente
mecanizadas o formales.
 Esta teoría abrió la puerta para modelar
dentro del paradigma computacional no
sólo la sintaxis sino los diversos niveles de
representación lingüística y tuvo
repercusiones en una gama muy amplia de
disciplinas científicas, tecnológicas y en las
humanidades. Los niveles principales de
estructura lingüística son como sigue:
NIVEL FONÉTICO Y FONOLÓGICO
 Las unidades básicas de la estructura del
lenguaje hablado se conocen como
fonemas. Los fonemas se reconocen por
sus características combinatorias o
sintagmáticas, y de contraste o
paradigmáticas, y corresponden, hasta
cierto punto, con los símbolos del
alfabeto.
NIVEL DE PROSODIA Y ENTONACIÓN
 En este nivel se representa la acentuación
de las palabras y la estructura tonal de los
enunciados. Las unidades sobre las que
recaen los tonos son las sílabas y la
entonación se caracteriza por la variación
de la frecuencia fundamental o en la
elocución, la cual permite distinguir las
oraciones declarativas, interrogativas y
admirativas.
NIVEL LÉXICO Y MORFOLÓGICO
 El siguiente nivel de representación se
enfoca al análisis de la estructura
abstracta de las palabras. Esta estructura
se puede pensar en términos de una lista
de palabras o “lexicón” con una entrada
por cada palabra; cada entrada a su vez
contiene una secuencia de fonemas, la
cual se asocia a uno o varios alófonos así
como a la representación de su significado
convencional.
NIVEL SINTÁCTICO
 La sintaxis caracteriza la estructura de las
frases y las oraciones. En este nivel se
considera que dentro de la oración hay
palabras cuya función es central en la
oración y que las otras tienen un papel
subordinado. Estas relaciones se
representan como una jerarquía cuyo
nodo superior o cabeza es el núcleo
gramatical y los nodos inferiores son los
constituyentes. Dicha estructura puede ser
simple o muy compleja dependiendo de
los fenómenos involucrados y del formato
de representación y se conoce como
“estructura sintáctica”.
NIVEL SEMANTICO
 El propósito de la semántica es
caracterizar el significado convencional o
independiente del contexto de emisión o
interpretación de una unidad lingüística,
ya sea básica, como las palabras, o
compuesta, como las frases y las
oraciones. La semántica computacional se
basa en el llamado “Principio de
Composicionalidad”, que establece que el
significado de una estructura compuesta
es función del significado de sus partes y
de su modo de combinación gramatical.
En su formulación más general la
semántica de una oración se caracteriza
como una función proposicional, donde la
palabra principal en la estructura es la
función y las otras sus argumentos.
NIVEL PRAGMATICO
 Toda unidad lingüística, ya sea hablada o
escrita, se realiza e interpreta en relación a
un “contexto”. La noción de contexto se
puede ilustrar con una analogía pictórica:
todo cuadro tiene una imagen saliente, “la
figura”, que ocurre siempre en relación a
una escena o “fondo”. La unidad lingüística
es la figura y el contexto el fondo.
AMBIGÜEDAD
 Un problema que aqueja a los modelos
computacionales de la interpretación del
lenguaje natural es la ambigüedad. Este
fenómeno se puede apreciar directamente
en el lexicón, ya que hay muchas palabras
que tienen más de un significado
convencional, como banco o gato, y su
resolución consiste en inferir qué es lo que
quiso decir quien las expresó en la
situación de uso, tanto en el lenguaje
hablado como en el escrito.
ARQUITECTURA DE LA MÁQUINA DEL
LENGUAJE
 A primera vista, la funcionalidad y
relaciones entre los niveles de
representación lingüística sugieren que el
lenguaje se procesa, es decir, se interpreta
y se genera, a través de una estructura “de
tubería” (pipeline) o “de abajo hacia
arriba” (bottom-up), en el que los
módulos de procesamiento
correspondientes a cada nivel de
estructura se alinean en serie. Este
modelo se adopta explícita o
implícitamente en la gran mayoría de los
modelos y aplicaciones de la Lingüística
Computacional.
Algunos de los problemas que se deben
resolver son:
 Determinar la semántica. La misma forma
de palabra puede presentar en función del
contexto un significado diferente.
 Se debe elegir el significado pertinente al
contexto. Por otro lado, se necesitan
formalismos para la representación de los
significados de las palabras.
 Resolución de la ambigüedad sintáctica.
En algunos casos, una frase se deja
analizar e interpretar de varias formas.
 Elegir la correcta exige algunas veces
información semántica sobre el acto de
habla y la intención del hablante, pero, al
menos, conocimientos estadísticos previos
sobre la aparición conjunta de las
palabras.
 Reconocer el propósito de una expresión
lingüística. Algunas frases no deben
entenderse textualmente.
Una ciencia no se define solo mediante un
campo de aplicación, sino también
mediante un interés teórico. Los
computadores son autómatas, los que
manipulan símbolos según reglas definidas.
Igual como los números, también los
lenguajes son sistemas de símbolos.
Resulta evidente, por consiguiente, diseñar
programas computacionales que simulen las
operaciones que el hombre realiza con las
palabras de una lengua, al menos en parte.
Se pueden probar así las hipótesis
lingüísticas con el computador.
La lingüística computacional es, en este
sentido, una lingüística en la cual la
simulación computacional se utiliza como
medio metódico para profundizar nuestros
conocimientos sobre la lengua humana.

También podría gustarte