Está en la página 1de 2

Procesamiento del Lenguaje Natural (PLN)

El procesamiento de lenguaje natural o PLN es un campo dentro de la informática, la


inteligencia artificial y la lingüística computacional que estudia la manera de comunicar las
máquinas con las personas mediante el uso de lenguas naturales, como el español, el inglés o
el chino. Dicho esto, El PNP busca que las máquinas consigan entender, interpretar y
manipular el lenguaje humano. De este modo, a los desarrolladores se les permite organizar y
estructurar el conocimiento para realizar tareas como resumen automático, traducción,
reconocimiento de entidades con nombre, extracción de relaciones, análisis de sentimientos,
reconocimiento de voz y segmentación de temas.

¿Para qué es útil el PNL?


La función del PNL es corregir la gramática, convertir el habla en texto y traducir
automáticamente a otros idiomas, hasta incluso el análisis de sentimientos, extracción de
temas, extracción de relaciones. También, para minería de textos y respuestas automáticas de
preguntas.

Uso de algoritmos de PLN: Algorithmia


El PNL se basa en algoritmos de aprendizaje automático. Es decir, no necesita ser codificado
manualmente por grandes conjuntos de reglas, el PNL aprende de forma autónoma estas
reglas mediante el análisis de un conjunto de ejemplos y hacer una inferencia estática. Como
norma cuantos más datos se analicen más preciso será el modelo.

Estos son Algunos de los algoritmos usados para el análisis de contenidos en textos en
Algorithmia:

 Summarizer: Una herramienta de resumen lleva todos los puntos clave de un texto a la
versión resumida
 AutoTag: Es una técnica que descubre temas contenidos en un cuerpo de texto.
 Reconocimiento de entidad: Este algoritmo recupera entidades reconocidas de un
cuerpo de texto utilizando la biblioteca stanfordNlp
 Análisis de sentimientos: Identificar el sentimiento de una cadena de texto, de muy
negativo a neutral y a muy positivo.
 PorterStemmer: Reduce las palabras a su raíz
 Tokenizer: Divide el texto en tokens.

Bibliotecas PLN de código abierto


Estas bibliotecas proporcionan los bloques de construcción algorítmicos de PLN en aplicaciones
del mundo real. Están:

 Apache OpenNLP: Un kit de herramientas de aprendizaje automático


 Natural Language Toolkit (NLTK): Una biblioteca de Python que proporciona módulos
para procesar texto, clasificar, tokenizar, derivar, etiquetar, analizar etc.
 MALLET: Un paquete de Java que proporciona clasificación de documentos,
agrupamiento, modelado de temas, extracción de información etc.

Ejemplos de casos de uso del procesamiento del lenguaje natural:


Uno de los ejemplos del PLN son las redes sociales. Las marcas hacen un seguimiento de las
conversaciones en línea para comprender lo que dicen los clientes y así obtener información
sobre el comportamiento del usuario.

Herramienta para monitoreo de redes sociales:

-Usar el algoritmo recuperar Tweets con palabras clave

-El algoritmo de Análisis de opinión

-PLN para construir su propio lector RSS

Se puede construir un lector RSS de aprendizaje automático en menos de 30 minutos


utilizando los siguientes algoritmos:

1. ScrapeRSS es para tomar el título y el contenido de una fuente RSS.


2. Html2Text para conservar el texto importante, pero eliminar todo el HTML del
documento.
3. AutoTag se utiliza la asignación de Dirichlet latente para identificar palabras clave
relevantes del texto.
4. El análisis de sentimientos se usa para identificar si el artículo es positivo, negativo o
neutral.
5. El resumen se utiliza finalmente para identificar las oraciones clave.

IBM lleva el PLN a nuevos horizontes


IBM Project Debater es el primer sistema de IA diseñado para debatir sobre humanos en temas
complejos utilizando una combinación de investigación pionera desarrollada por
investigadores de IBM, que incluye: redacción y entrega de discursos basados en datos,
comprensión auditiva y modelado de dilemas humanos.

También podría gustarte