Está en la página 1de 8

Lingüística

Las computadoras son capaces de procesar


en un breve lapso de tiempo grandes
volúmenes de información, que una
persona no podría leer a lo largo de toda su
vida. El único problema para la
computadora al procesar los textos es que
simplemente ¡no los entiende!.
Los textos son para la computadora
solamente cadenas de letras sin sentido y
no información útil para su razonamiento.
Escasamente, la computadora puede hacer un procesamiento lógico de estos textos, y para ello
necesita primero inevitablemente conocer la estructura de textos y su formalización. Previo
a adentrarnos en este procesamiento, necesitamos poner esto en contexto.
El ser humano, a lo largo de la historia, ha utilizado el lenguaje para trasmitir sus conocimientos,
sentimientos, emociones y sensaciones con el resto de los seres humanos. El origen del
lenguaje es objeto de estudio de diferentes disciplinas, entre las más significativas se encuentra
la lingüística, la antropología, la psicología, genética humana.
La Lingüística, en específico, es la disciplina que se ocupa del estudio científico del lenguaje.
Tiene por objetivo descubrir los métodos de descripción de cualquier lenguaje natural y
por lo tanto, de conocer en profundidad una lengua particular y entender la facultad humana del
lenguaje.
Dentro de la Lingüística se pueden identificar diferentes áreas de interés, tales como:
 Lingüística Teórica: Se encarga del análisis lingüístico, es decir, de los aspectos
centrales de la estructura de las lenguas naturales y la caracterización del conocimiento
lingüístico de los hablantes. Usualmente se ha considerado que la lingüística teórica está
formada por:
 Fonología
 Morfología
 Sintaxis
 Semántica

Paradigmas y Lenguajes / Paradigmas de Programación


Pag. 5
 Lingüística Aplicada: Aplicación de la lingüística a áreas específicas como la
traducción, enseñanza de un segundo idioma, etc.
 Antropología Lingüística: Estudio de las relaciones entre lenguaje y la cultura.
 Neurolingüística: Estudio del cerebro y de su funcionamiento en la producción,
percepción y adquisición del lenguaje.
 Psicolingüística: Estudio de la adquisición del lenguaje.
 Sociolingüística: Estudio de las relaciones entre el lenguaje y estructuras sociales,
variación lingüística y actitudes hacia el lenguaje.
 Lingüística Computacional: Estudia el procesamiento del lenguaje natural. De esta se
desprenden o especializan otras, como por ejemplo la Ingeniería Lingüística, que tiene
por objetivo facilitar la comunicación entre hombre y la máquina, e incluso entre
máquinas (protocolos de comunicación). Aplicaciones actuales exitosas en esta subarea
de la lingüística son Siri y Cortana. 

Análisis Lingüístico
Desde el punto de vista de la Lingüística Teórica, la gramática de una lengua es la
representación explícita del conocimiento (consciente e inconsciente) que las personas
tienen de su lengua, es decir, de la manera correcta en que las palabras van colocadas dentro
de una oración.
La lingüística teórica proporciona las nociones y herramientas analíticas necesarias para
describir ese conocimiento de manera explícita.
El análisis lingüístico consiste en:
1. ANALIZAR los datos existentes en el lenguaje y descubrir sus reglas, leyes y
regularidades.
2. EXPRESAR formalmente una generalización racional de esas reglas, leyes y
regularidades.

Lenguaje
Lenguaje es el empleo de la palabra para:
 expresar ideas
 comunicarse
 establecer relaciones entre los “seres humanos”.

Paradigmas y Lenguajes / Paradigmas de Programación


Pag. 6
Un lenguaje se compone de:
 un conjunto de palabras
 los métodos para combinarlas en frases y oraciones
 su pronunciación (Ortología)
 un diccionario terminológico previamente establecido (Lexicografía).
En un lenguaje las combinaciones posibles de palabras deben respetar la Sintaxis (o conjunto
de reglas sintácticas establecidas). Asimismo, dichas palabras deben tener un determinado
sentido, deben ser comprendidas en un contexto dado, a ello se le denomina Semántica.

Etapas progresivas de validez frase


 Análisis léxico: Analiza si las palabras de una frase pertenecen al lenguaje.
 Análisis sintáctico: Analiza si las palabras ocupan un lugar permitido dentro de la frase.
 Análisis semántico: Analiza el producto de la etapa previa y comprueba restricciones
de tipo y otras limitaciones semánticas de modo de determinar si es una frase valida del
lenguaje.
Ejemplo:

léxicamente sintácticamente semánticamente


válido? válido? válido?

Sócrates es un ombre. No - -

hombre Sócrates es un. Sí No -

hombre es un Sócrates. Sí Sí No

Sócrates es un hombre. Sí Sí Sí

Hagamos el mismo razonamiento para las siguientes frases del cartel de un carnicero, cual sería
el orden apropiado según el cuadro anterior:
Hoy tenimos carne picada para haraves y crioyas.
Hoy tenemos carne picada para árabes y criollas.
Hoy tenemos árabes y criollas para carne picada.
Tenemos árabes y hoy criollas picada carne para.
Cuando hablamos de lenguajes se pueden diferenciar dos clases muy bien definida:

Paradigmas y Lenguajes / Paradigmas de Programación


Pag. 7
 Los lenguajes naturales como el español, el ruso, el inglés, el francés, etc.
 Los lenguajes formales como el lenguaje de la lógica matemática, los lenguajes de
programación, etc.

Lenguaje Natural
Existen muchas definiciones de lenguaje
natural (LN), entre ellas una que puede
acercarnos a entender mejor este concepto es
la que plantea que “Lenguaje Natural es el
lenguaje escrito o hablado por una
comunidad”. Los lenguajes han sufrido un
largo y complejo proceso de desarrollo desde
el surgimiento del hombre sobre la faz de la
Tierra. Los lenguajes se han desarrollado a partir de la experiencia práctica de los diferentes
grupos humanos. Las principales hipótesis son la Monogénesis y poligénesis lingüística. La
primera propone que todas las lenguas humanas derivan de una lengua primigenia que debió
aparecer antes de la salida de los homo sapiens. La segunda sostiene que si bien los humanos
tenían capacidad para el lenguaje este apareció en diferentes grupos de humanos diseminados,
más o menos por la misma época.
En los lenguajes modernos, la riqueza de los componentes semánticos otorga al LN gran poder
expresivo y valor como herramienta para expresar y exteriorizar razonamientos sutiles y
complejos. La sintaxis de un LN se puede modelar mediante la utilización de un lenguaje
formal. Otra propiedad importante del LN es la polisemia, es decir, la posibilidad de que una
expresión lingüística tenga varios significados.
La comprensión y reconocimiento del lenguaje natural es uno de los problemas más
complejos a los que se enfrenta la Inteligencia Artificial debido a su complejidad,
irregularidad y diversidad, en relación al significado de frases, oraciones y textos en su
conjunto.

Paradigmas y Lenguajes / Paradigmas de Programación


Pag. 8
Lenguaje Formal
Un lenguaje formal (LF) es un lenguaje artificial, formado por símbolos y formulas y tiene
como objetivo fundamental posibilitar representar conocimiento simbólicamente o la
programación de computadoras.
Las palabras y oraciones en un (LF) poseen una definición rigurosa desde el punto de vista
científico. Son utilizados para modelar teorías científicas con la ventaja de que con estos se
reduce la ambigüedad.
Las características de los (LF) son las siguientes:
 Son un medio eficaz para modelar rigurosamente un lenguaje.
 Su sintaxis es capaz de definir oraciones con un único significado. (evitando la
polisemia del lenguaje natural)
 Constituyen una poderosa herramienta para el procesamiento del Lenguaje Natural
(computacional).

Gramáticas Formales
Hay una parte de la lingüística de interés especial para los Informáticos – esta es la Gramática.
El concepto de Gramática fue originalmente definido por los lingüistas en su estudio de los
lenguajes naturales.
Los lingüistas tienen una relación no sólo con la definición precisa de lo que es o no es una
sentencia u oración válida de un lenguaje, sino también que dan o suministran descripciones
estructurales de las sentencias, frases u oraciones.
Uno de los objetivos originales estuvo relacionado con el desarrollo de una Gramática Formal
capaz de describir la lengua inglesa. Aun no se dispone de una gramática bien definida de la
lengua inglesa. Además, existen contradicciones entre ellos, sobre que tipo de gramática formal
seria capaz de describir al idioma Inglés. Sin embargo, se han alcanzado mejores resultados
en la descripción de los lenguajes de computación.
Por ejemplo, la Backus-Naur Form (BNF) fue
usada originalmente para describir el lenguaje
de programación “ALGOL 60”. La BNF es un
metalenguaje, por ser un lenguaje con el que se
pueden describir otros lenguajes.

Paradigmas y Lenguajes / Paradigmas de Programación


Pag. 9
Tabla de símbolos de la BNF:
Símbolo Significado
 o := "se define como"

| "o", alternativa
[x] Ocurrencias de x. 0 o más
{x} Número arbitrario de ocurrencias de x. 1 o más
(x | y) Selección (x o y)
Ej. de utilización de la BNF, en este caso de la sentencia if del SQL :
if_statement :=IF boolean_expression THEN statement [statement]...
[ELSIF boolean_expression THEN statement [statement]...]
[ELSIF boolean_expression THEN statement [statement]...]...
[ELSE statement [statement]...] END IF;
y su correspondiente diagrama de Sintaxis o de Conway1:

1 Diagrama de Conway: Es una herramienta gráfica para describir formalmente la sintaxis de un lenguaje. En ella
se usan símbolos terminales y no terminales, representados respectivamente con un círculo o un rectángulo redondeado y con
un rectángulo. Los diagramas se enlazan con flechas que indican el orden en que se debe realizar la interpretación.

Paradigmas y Lenguajes / Paradigmas de Programación


Pag. 10
Cuadro comparativo BNF/Diagrama de Conway

Nota: ε (epsilon) significa cadena vacía

Definiciones empleadas en las gramáticas formales.


Alfabeto: Un alfabeto es un conjunto arbitrario, pero finito, de caracteres.
Por ejemplo, el código de máquina se basa en el alfabeto binario
A1={0,1}
otros ejemplos son:
A2= {0,1,2,3,4,5,6,7,8,9}
A3= {+,-,*, /} etc.
Componente Léxico (Símbolo, cadena o palabra): las ocurrencias múltiples de caracteres de
un alfabeto dado.
Frase, oración o sentencia: Una frase es una secuencia de componentes léxicos.
Gramática (sintaxis): La gramática o la sintaxis de un lenguaje define si una secuencia
arbitraria de símbolos es correcta. Si una frase es correcta será aceptada por el lenguaje.

Paradigmas y Lenguajes / Paradigmas de Programación


Pag. 11
Producción: Es la regla para la sustitución de cadenas.
Símbolos terminales: Son los símbolos que realmente aparecen en la frase.
Símbolos no terminales: Deben ser definidos por otras producciones o reglas; es decir, también
aparecen en el lado izquierdo de las producciones. Los símbolos no terminales son variables
sintácticas.
Volviendo a la BNF, si se necesita definir matemáticamente al conjunto de los enteros,
tenemos:
Símbolos terminales:
T= {+,-, 0,1,2,3,4,5,6,7,8,9}
Símbolos no terminales:
N= {int, unsigned_int, digit}
Producciones:
int  [+ | - ] unsigned_int
unsigned_int  digit [unsigned_int]
digit  0|1|2|3|4|5|6|7|8|9|
 La primera producción define un entero, como un entero sin signo más un signo inicial,
que puede estar ausente o ser "+" o "-".
 La segunda indica, a través de una definición recursiva, que un unsigned_int es un dígito
seguido de unsigned_int.
 La tercera indica que un dígito puede ser alguno de los símbolos indicados.
Existe un lenguaje formal, si se puede derivar cualquiera de sus frases con un número
finito de reglas BNF. En este aspecto, el conjunto finito de reglas anterior es una descripción
formal del conjunto infinito de los enteros.

Ejercitación:
Como sería el diagrama de Conway del ejemplo anterior.
Como haríamos la BNF y Conway para los números reales.
PL 25 03 95’

Paradigmas y Lenguajes / Paradigmas de Programación


Pag. 12

También podría gustarte