Documentos de Académico
Documentos de Profesional
Documentos de Cultura
A continuación, se muestran tres ejemplos de problemas que podrían ser abordados por
medio de la aplicación de Tecnologías del Lenguaje. Se pide realizar un informe en el
que se justifique razonadamente por medio de qué paradigma sería más adecuado
abordar cada problema, indicando cómo podría hacerse a partir de las técnicas
correspondientes a cada paradigma que se han visto a lo largo del bloque.
En particular, para cada caso hay que responder a las siguientes cuestiones:
Hay ciertos aspectos previos que se deben tener en cuenta antes de decidir bajo qué
paradigma desarrollaríamos (y cómo) nuestro sistema:
Asumimos, por tanto, que tenemos una base de datos con miles de mensajes ya
clasificados por departamento y que cada clase tendrá una distribución de palabras más o
menos característica.
CASO 2
La comunicación a través de redes sociales tiene cada vez más impacto en nuestra
sociedad. En el caso de Twitter, dada una institución como, por ejemplo, el Ministerio
de Ciencia e Innovación, es muy habitual que cada día se publiquen miles de tweets
hablando de ella.
El problema es que, dado el alto número de tweets que se publican a diario en las redes
sociales, realizar este proceso de filtrado de tweets relevantes de forma manual es muy
laborioso, de manera que desde el Departamento de Comunicación de dicho ministerio
nos han pedido una solución usando Tecnologías de la Lengua.
• Tras hacer una pequeña estadística con usuarios de verdad, se comprueba que
hay un conjunto limitado de frases que se dan en la mayoría de los casos (90%)
y un conjunto muy extenso de excepciones que cubren un 10% de los casos.