Está en la página 1de 15

Asignatura Datos del alumno Fecha

Procesadores de Apellidos: Lozano Palacios


18-03-2024
Lenguajes Nombre: Yimy

Laboratorio 1: Minería de texto y procesamiento


de lenguaje natural
Para poder afrontar los ejercicios planteados es necesario haber estudiado los
temas uno y dos. Además, para poder realizar los ejercicios del laboratorio es
necesario contar con los siguientes requisitos de software:

▸ Lenguaje R instalado en equipo local.


▸ Entorno de desarrollo como R studio.
▸ Objetivos de la actividad.

Esta sesión de laboratorio está destinada a que el alumno ponga en práctica


la teoría aprendida relacionada con la minería de texto y el procesamiento del
lenguaje natural. Por esto, el objetivo de este trabajo es realizar un análisis
general a partir del procesamiento de cuatro libros de una categoría particular
del Proyecto Gutenberg.
▸ Descripción de la actividad y pautas de elaboración.

Según lo anterior, se debe:

 Obtener el corpus de los cuatro libros seleccionados.


Los libros seleccionados son los siguientes:

 Libro: La Odisea
Autor: Homer, 751? BCE-651? BCE
Codigo:
© Universidad Internacional de La Rioja (UNIR) 58221
Lenguje: Español

Obtenemos en copus del libro Homero

Tema 2. Actividades 1
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

Buscamos las 15 palabras mas usadas

© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 2
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

Filtramos para eliminar información que no necesitamos y repetimos las búsqueda


de las palabras

Realizamos la nube de palabras

© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 3
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

Filtramos y hacemos nuevamente la nube de palabras parametrizando el sistema


para que solo muestre 50 palabras.

 Libro: La Divina Comedia


Autor: Dante Alighieri, 1265-1321
Código: 57303
Lenguaje: Español.

© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 4
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 5
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 6
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

 Libro: Cristóbal Colón y el descubrimiento de América


Autor: Humboldt, Alexander von, 1769-1859
Código: 61831
Lenguaje: Español.

© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 7
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 8
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

© Universidad Internacional de La Rioja (UNIR)

 Libro: La Quimera

Tema 2. Actividades 9
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

Autor: Pardo Bazán, Emilia, condesa de, 1852-1921


Código: 49756
Lenguaje: Español

© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 10
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 11
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

 Libro: Edipo rey; Edipo en Colona; Antígona


Autor: Sophocles, 496? BCE-407 BCE
Código: 63509
Lenguaje: Español

© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 12
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 13
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

 Calcular el índice TF-IDF de los cuatro libros elegidos.

 Representar gráficamente los quince términos más característicos de cada


© Universidad Internacional de La Rioja (UNIR)
libro.

Tema 2. Actividades 14
Asignatura Datos del alumno Fecha
Procesadores de Apellidos: Lozano Palacios
18-03-2024
Lenguajes Nombre: Yimy

 Realizar una comparación entre los términos más frecuentes y términos más
característicos por cada uno de los libros.
 Obtener las asociaciones entre palabras de, al menos, dos de los términos
más característicos de dos libros.
▸ Entrega:

La entrega del laboratorio deberá contener:

 Un informe donde se describa brevemente qué libros eligió, el desarrollo del


laboratorio y los resultados obtenidos. El documento deberá entregarse en
formato editable (.doc, .docx, .odf). No se acepta el formato .pdf.
 Archivo con el código fuente utilizado para el desarrollo del laboratorio (.R).
© Universidad Internacional de La Rioja (UNIR)

Tema 2. Actividades 15

También podría gustarte