Está en la página 1de 7

Página |1

PROCESAMIENTO DEL LENGUAJE NATURAL

El procesamiento del lenguaje natural (abreviado PLN, o NLP del idioma inglés Natural
Language Processing) es una rama de la inteligencia artificial que ayuda a las
computadoras a entender, interpretar y manipular el lenguaje humano. NLP toma
elementos prestados de muchas disciplinas, incluyendo la ciencia de la computación y la
lingüística computacional, en su afán por cerrar la brecha entre la comunicación humana y
el entendimiento de las computadoras.
Es un campo de las ciencias de la computación, inteligencia artificial y lingüística que
estudia las interacciones entre las computadoras y el lenguaje humano. Es un campo de
las ciencias de la computación e ingeniería que se ocupa de facilitar la interacción
humana con las máquinas a través del uso del lenguaje natural o lenguaje humano. El
Procesamiento del Lenguaje Natural ocurre es a través de un proceso en el cual la
máquina, que solamente entiende un lenguaje binario de ceros y unos, es entrenada para
entender el lenguaje humano.
Por medio de esta fase, algoritmos o procesos matemáticos traducen datos (lenguaje
natural) en el cerebro de la máquina para que éste determine patrones y pueda generar
una respuesta. Mucho dependerá del tipo, calidad y cantidad de datos de entrenamiento
para determinar el éxito de respuesta de la máquina. Por ejemplo, para entrenar a Google
Home, el tipo de datos que se utilizó fue la voz humana y seguramente con una extensa
variedad de tonalidades y registros de voz (calidad y cantidad) provenientes de hombres,
mujeres, niños, adultos, extranjeros y locales.
El PLN se ocupa de la formulación e investigación de mecanismos eficaces
computacionalmente para la comunicación entre personas y máquinas por medio de
lenguajes naturales. El PLN no trata de la comunicación por medio de lenguajes naturales
de una forma abstracta, sino de diseñar mecanismos para comunicarse que sean eficaces
computacionalmente — que se puedan realizar por medio de programas que ejecuten o
simulen la comunicación — . Los modelos aplicados se enfocan no solo a la comprensión
del lenguaje de por sí, sino a aspectos generales cognitivos humanos y a la organización
de la memoria.
El nivel de inteligencia de un ser humano se evalúa mediante IQ (cociente de inteligencia).
Si bien puede haber muchas maneras de evaluar el nivel de inteligencia de un Chatbots,
uno de los aspectos más críticos es la capacidad de llevar a cabo conversaciones
contextuales, atractivas y comprensibles con los seres humanos. Vaya desafío!
Para lograrlo se usan 3 tecnologías, estas tecnologías son:
 NLP: Procesamiento de lenguaje natural (Natural Language Processing)
 NLU: Comprensión del lenguaje natural (Natural Language Understanding)
 NLG: Generación de lenguaje natural (Natural Language Generation)
El procesamiento del lenguaje natural (PLN) es el campo que combina las tecnologías de
la ciencia computacional (como la inteligencia artificial, el aprendizaje automático o la
inferencia estadística) con la lingüística aplicada, con el objetivo de hacer posible la
comprensión y el procesamiento asistidos por ordenador de información expresada en
Página |2

lenguaje humano para determinadas tareas, como la traducción automática, los sistemas
de diálogo interactivos, el análisis de opiniones, etc.

 El análisis de opiniones y de sentimientos es una parte importante del PLN que se


ocupa del análisis computacional de textos producidos por seres humanos, con el
objetivo de procesar y extraer unos niveles cuantificables de opiniones y sentimientos
conexos.
 La traducción automática se centra en la traducción de textos asistida por ordenador
de un idioma humano a otro. Existen muchos tipos de enfoques y de técnicas de
traducción automática, en función del contexto de la traducción, del planteamiento
(estadístico, basado en normas, híbrido), etc.
 El reconocimiento y la clasificación de entidades nombradas constituye un
importante subcampo de la extracción de información que se ocupa de la localización,
la identificación y la clasificación de elementos atómicos individuales denominados
“entidades nombradas” en textos, como sustantivos, expresiones relacionadas con
fechas, porcentajes, números, etc.
 Los sistemas de diálogo proporcionan a las personas una vía de interacción con un
sistema computacional (por ejemplo, utilizar una aplicación informática) usando
diálogos escritos (e incluso orales), similares a los que entablan entre sí los seres
humanos sobre un asunto concreto.
 Los clasificadores y otras tecnologías de reconocimiento de patrones permiten la
clasificación de la información según unos criterios predefinidos. La información puede
ser de naturaleza diversa: visual, textual, acústica, etc.

EVOLUCIÓN DEL PROCESAMIENTO DEL LENGUAJE NATURAL


Aunque el procesamiento del lenguaje natural no es una ciencia nueva, la tecnología
avanza con rapidez gracias a un mayor interés en la comunicación entre humanos y
máquinas, además de la disponibilidad del big data, computadoras poderosas y
algoritmos mejorados.
Como humano, usted puede hablar y escribir en inglés, español o chino. Pero el lenguaje
nativo de una computadora – que se conoce como código o lenguaje de máquina – es
mayormente incomprensible to para la mayoría de las personas. En los niveles más bajos
de su dispositivo, la comunicación se da no con palabras sino a través de millones de
ceros y unos que producen acciones lógicas.
De hecho, los programadores utilizaban tarjetas perforadas para comunicarse con las
primeras computadoras hace 70 años. Este proceso manual y arduo era entendido por un
número relativamente reducido de personas. Ahora puede decir, “Alexa, me gusta esta
canción” y un dispositivo que reproduce música en su hogar bajará el volumen y le
responderá, “OK. Evaluación guardada”, en una voz similar a la humana. Luego adapta su
algoritmo para reproducir esa canción – y otras como ésa – la próxima vez que escuche
esa estación musical.
Página |3

¿POR QUÉ ES IMPORTANTE EL PROCESAMIENTO DEL LENGUAJE NATURAL?

Grandes volúmenes de datos textuales: El procesamiento del lenguaje natural ayuda a


las computadoras a comunicarse con humanos en su lenguaje y escala otras tareas
relacionadas con el lenguaje. Por ejemplo, NLP hace posible que las computadoras lean
texto, escuchen la voz hablada, la interpreten, midan el sentimiento y determinen qué
partes son importantes. Las máquinas de hoy pueden analizar más datos basados en
lenguajes que los humanos, sin fatigarse y de una forma consistente e imparcial.
Considerando la asombrosa cantidad de datos no estructurados que se generan todos los
días, desde registros médicos hasta medios sociales, la automatización será decisiva para
analizar por completo datos de texto y habla con eficiencia.

¿CÓMO FUNCIONA NLP?


Separación de las piezas elementales del lenguaje: El procesamiento del lenguaje
natural incluye diferentes técnicas para interpretar el lenguaje humano, que van desde los
métodos estadísticos y del aprendizaje basado en máquina hasta los enfoques basados
en reglas y algorítmicos. Necesitamos una amplia variedad de métodos porque los datos
basados en texto y en voz varían ampliamente, al igual que las aplicaciones prácticas.
Las tareas básicas de NLP incluyen la simbolización y el análisis sintáctico,
lematización/derivación, etiquetado de la parte del habla, detección del lenguaje e
identificación de relaciones semánticas. Si alguna vez creó diagramas de enunciados en
la primaria, ya ha realizado estas tareas de forma manual antes.
En términos generales, las tareas NLP dividen el lenguaje en piezas elementales más
cortas, intentan entender las relaciones entre las piezas y exploran cómo funcionan las
piezas juntas para crear significado.

Estas tareas implícitas se utilizan a menudo en recursos NLP de más alto nivel, como:

 Categorización de contenido. Un resumen del documento basado en la lingüística,


incluyendo búsqueda e indización, alertas de contenido y detección de duplicación.
 Descubrimiento y modelado de temas. Capture con precisión el significado y temas
en colecciones de texto, y aplique analítica avanzada a texto, como optimización y
pronósticos.
 Extracción contextual. Extraiga automáticamente información estructurada de
fuentes basadas en texto.
 Análisis de sentimiento. Identificación del estado de ánimo u opiniones subjetivas en
grandes cantidades de texto, incluyendo minería de sentimiento y opiniones promedio.
 Conversión de habla a texto y de texto a habla. Transformación de comandos de
voz en texto escrito y viceversa.
 Sumarización de documentos. Generación automática de sinopsis de grandes
cuerpos de texto.
 Traducción basada en máquina. Traducción automática de texto o habla de un
idioma a otro.
Página |4

MÉTODOS Y APLICACIONES NLP

Cómo entienden las computadoras los datos textuales

NLP y analítica de texto: El procesamiento del lenguaje natural va de la mano de la


analítica de texto, la cual cuenta, agrupa y categoriza palabras para extraer estructura y
significado de grandes volúmenes de contenido. La analítica de texto se utiliza para
explorar contenido textual y derivar nuevas variables de texto crudo que se pueden
visualizar, filtrar o utilizar como entradas para modelos predictivos u otros métodos
estadísticos.

NLP y la analítica de texto se utilizan juntos para muchas aplicaciones, entre otras:

 Descubrimiento de investigación. Identifique patrones y pistas en correos


electrónicos o reportes escritos para detectar y resolver delitos.
 Conocimiento en materia. Clasifique contenido en temas significativos de modo que
pueda seguir alguna acción y descubrir tendencias.
 Analítica de medios sociales. Descubra conocimiento y sentimiento sobre temas
específicos e identifique a personas influyentes importantes.

COMPONENTES DEL PROCESAMIENTO DEL LENGUAJE NATURAL

A continuación, vemos algunos de los componentes del procesamiento del lenguaje


natural. No todos los análisis que se describen se aplican en cualquier tarea de PLN, sino
que depende del objetivo de la aplicación.

 Análisis morfológico o léxico. Consiste en el análisis interno de las palabras que


forman oraciones para extraer lemas, rasgos flexivos, unidades léxicas compuestas.
Es esencial para la información básica: categoría sintáctica y significado léxico.
 Análisis sintáctico. Consiste en el análisis de la estructura de las oraciones de
acuerdo con el modelo gramatical empleado (lógico o estadístico).
 Análisis semántico. Proporciona la interpretación de las oraciones, una vez
eliminadas las ambigüedades morfosintácticas.
 Análisis pragmático. Incorpora el análisis del contexto de uso a la interpretación final.
Aquí se incluye el tratamiento del lenguaje figurado (metáfora e ironía) como el
conocimiento del mundo específico necesario para entender un texto especializado.

Un análisis morfológico, sintáctico, semántico o pragmático se aplicará dependiendo del


objetivo de la aplicación. Por ejemplo, un conversor de texto a voz no necesita el análisis
semántico o pragmático. Pero un sistema conversacional requiere información muy
detallada del contexto y del dominio temático.

Ejemplos cotidianos de NLP

Existen muchas aplicaciones comunes y prácticas de NLP en nuestras vidas diarias. Más
allá de conversar con asistentes visuales como Alexa o Siri, he aquí algunos ejemplos
más:
Página |5

¿Alguna vez ha observado los correos electrónicos de su carpeta de correo no deseado y


ha notado similitudes en las líneas del asunto? Observa filtrado de correo no deseado
Bayesiano, técnica NLP estadística que compara las palabras del correo no deseado con
correos electrónicos válidos para identificar correo basura.

¿Alguna vez ha perdido una llamada telefónica y leído la transcripción automática del
correo de voz en su bandeja de entrada del correo o aplicación de su teléfono inteligente?
Eso es conversión de habla a texto, recurso del procesamiento del lenguaje natural.

¿Alguna vez ha navegado por un sitio Web utilizando su barra de búsqueda integrada o
bien seleccionando etiquetas sugeridas de tema, entidad o categoría? Entonces ha
empleado métodos NLP para realizar búsquedas, modelado de remas, extracción de
entidades y categorización de contenido.

Un subcampo de NLP llamado entendimiento del lenguaje natural (NLU, por sus siglas en
inglés) ha comenzado a crecer en popularidad debido a su potencial en aplicaciones
cognitivas y de inteligencia artificial. NLU va más allá del entendimiento estructural del
lenguaje para interpretar intención, resolver ambigüedad de contexto y palabras, e incluso
generar lenguaje humano bien formado por cuenta propia. Los algoritmos NLU deben
resolver el problema muy complejo de la interpretación semántica – es decir, entender el
significado pretendido del lenguaje hablado o escrito, con todas las sutilezas, contenido e
inferencias que los humanos podemos comprender.

La evolución de NLP hacia NLU tiene muchas implicaciones importantes para empresas y
consumidores por igual. Imagine el poder de un algoritmo que puede entender el
significado y el matiz del lenguaje humano en muchos contextos, desde medicina hasta
leyes y hasta el salón de clases. A medida que los volúmenes de información no
estructurada continúen creciendo de manera exponencial, nos beneficiaremos de la
habilidad incansable de las computadoras de ayudarnos a comprenderlo todo.

Algunas aplicaciones del Procesamiento de Lenguaje Natural

En la actualidad, existen algunas aplicaciones de esta ciencia en el mercado. Por ejemplo,


a través del Procesamiento del Lenguaje Natural se puede realizar análisis de opinión o
de sentimientos acerca de las reseñas escritas a un producto. También se le atribuye a
esta ciencia la traducción automática de Google, los diálogos automáticos para hacer
chatbots, el reconocimiento del habla en productos como Siri, Alexa y Google Home, y
finalmente, la clasificación automática de documentos. Esta ciencia también se encuentra
generando impacto en gobiernos de la región, a través de la clasificación automática de
contenido. La Jefatura de Gabinete de la Nación Argentina, por ejemplo, utiliza técnicas
de Procesamiento de Lenguaje Natural para clasificar y redirigir automáticamente todas
las preguntas que los legisladores del Congreso realizan, a la persona más adecuada
dentro de la Administración Pública Nacional.

El esquema general de la mayoría de los sistemas y métodos que involucran el


procesamiento de lenguaje es el siguiente:
Página |6

Primero, el texto no se procesa directamente sino se transforma en una representación


formal que preserva sus características relevantes para la tarea o el método específico
(por ejemplo, un conjunto de cadenas de letras, una tabla de base de datos, un conjunto
de predicados lógicos, etc.).

Luego, el programa principal manipula esta representación, transformándola según la


tarea, buscando en ella las subestructuras necesarias, etc.

Finalmente, si es necesario, los cambios hechos a la representación formal (o la


respuesta generada en esta forma) se transforman en el lenguaje natural.

Entre las tareas principales del procesamiento de lenguaje natural se puede mencionar:

 Recuperación de información: La aplicación del procesamiento de lenguaje natural


más obvia y quizá más importante en el momento actual es la búsqueda de
información (se llama también recuperación de información). Por un lado, en Internet y
en las bibliotecas digitales se contiene una cantidad enorme de conocimiento que
puede dar respuestas a muchísimas preguntas que tenemos. Por otro lado, hay tanta
información que no sirve porque ya no se puede encontrarla. Hoy en día la pregunta
ya no es “¿si se sabe cómo...?” sino “ciertamente se sabe, pero ¿dónde está esta
información?”. Técnicamente, rara vez se trata de decidir cuáles documentos (así se
llaman archivos o textos en la recuperación de información) son relevantes para la
petición del usuario y cuáles no.
 Interfaces en lenguaje natural: El problema más importante de este tipo de
aplicaciones es que –a diferencia de las aplicaciones en la recuperación de
información– se requiere entender exactamente la intención del usuario, ya que el
costo de error puede ser muy alto. Realmente, si el robot entiende incorrectamente el
comando, pude hacer alguna acción destructiva o peligrosa. Si se malentiende la
pregunta a la base de datos, la información proporcionada resultará incorrecta, lo que
puede causar consecuencias graves. Entonces, las interfaces en lenguaje natural en
muchos casos requieren de las representaciones de información más detalladas y
complejas, así como del análisis lingüístico más preciso y completo.
 Traducción automática: Entonces, este tipo de los sistemas de traducción requiere
de toda la fuerza de la ciencia de lingüística computacional, los métodos más precisos
y completos del análisis del texto y representación de su contenido.

Modelos para el Procesamiento de Lenguaje Natural


Que una máquina se comunique con una lengua natural implica tratar de manera
computacional esa lengua. ¿Cómo se transforma un lenguaje natural en lenguaje
computacional? Esto requiere un proceso de modelización matemática, para que un
ordenador, que solo entiende bytes y dígitos, comprenda el lenguaje humano.
Página |7

Por un lado, los informáticos codifican los programas empleando lenguajes de


programación, y por otro, los lingüistas computacionales se encargan de preparar el
modelo lingüístico para que los ingenieros informáticos lo implementen en un código
eficiente y funcional.

Los modelos lingüísticos utilizados en PLN son esencialmente dos: los modelos lógicos,
basados en gramáticas, y los modelos probabilísticos, basados en datos.

https://www.sas.com/es_ar/insights/analytics/what-is-natural-language-processing-nlp.html

http://www.vicomtech.org/t4/e11/procesamiento-del-lenguaje-natural

https://blogs.iadb.org/conocimiento-abierto/es/que-es-el-procesamiento-de-lenguaje-
natural-y-como-ponerlo-en-practica-con-recursos-abiertos/

https://www.huffingtonpost.es/instituto-de-ingenieria-del-conocimiento/que-es-el-pln-o-
procesamiento-de-lenguaje-natural_a_23253781/

https://www.euroforum.es/blog/inteligencia-artificial-y-lenguaje-natural-cual-es-la-conexion/

https://cvc.cervantes.es/obref/congresos/sevilla/tecnologias/ponenc_carbonell.htm

http://sisbib.unmsm.edu.pe/BibVirtual/Publicaciones/risi/2009_n2/v6n2/a06v6n2.pdf

https://businessanalyticsdata.wordpress.com/2015/12/21/pln-procesamiento-del-lenguaje-
natural/

https://educacion.elpensante.com/desventajas-del-lenguaje-natural/

También podría gustarte