Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Analizar los datos a través de procedimientos y Categoriza la información a fin de permitir consultas
obtención de información de acuerdo a la accesibles utilizando técnicas y algoritmos
categorización definida en la organización. implementados en la industria.
Esta actividad tiene carácter formativo, cuya finalidad es visualizar lo que aprendes, en la directa
medida que tu docente de asignatura te va retroalimentando constantemente, tanto a nivel individual
como colectivo (equipo de trabajo).
Paso 1.
Paso 2.
Descargue desde el sitio del curso la base de datos movielens, contenida en el archivo movielens.sql.
A continuación acceda a través de la terminal a MySQL mediante el siguiente comando: mysql -uroot
-pcloudera. Una vez dentro, cree una base de datos con nombre movielens: create movielens y luego
importe el contenido del archivo descargado, mediante el comando source filename.sql. Para
asegurarse que todo está correcto, ejecute cualquier consulta sobre la tabla movies.
Importación a HDFS.
Paso 4.
Paso 5.
Verifique que el resultado sea correcto, primero revisando la carpeta movies en HDFS (hadoop fs -ls
movies) y luego haciendo display del contenido del archivo resultante (hadoop fs -cat movies/part-m-
00000).
Paso 6.
Recursos
Criterio de evaluación
I. Analiza una situación que pueda ser resuelta por Hive del Ecosistema Hadoop
Identifica los elementos principales de la situación en estudio
Analiza las características de Hive que se podrían utilizar
II. Propone una aplicación de Hive para resolver la situación en estudio.
Importa la tabla movies.
Importa la tabla ratings.
Importa la tabla users.