Está en la página 1de 2

Nombre

Sigla Asignatura BDY7101 Big Data Tiempo 2h


Asignatura

Experiencia de Aprendizaje N° 2 Conociendo y aplicando el mundo Hadoop

Actividad N° 2.4 Sqoop, Pig e Impala

Nombre del Recurso Didáctico 2.4.2 Actividad Apache Sqoop

1. APRENDIZAJES E INDICADORES DE LOGRO

Aprendizajes (Procedimentales, Indicadores de logro


Actitudinales y conceptuales)

Analizar los datos a través de procedimientos y Categoriza la información a fin de permitir consultas
obtención de información de acuerdo a la accesibles utilizando técnicas y algoritmos
categorización definida en la organización. implementados en la industria.

Es riguroso con la aplicación de las


Sigue los procedimientos establecidos en el uso de las
herramientas para lograr el mayor desempeño
herramientas del ecosistema Hadoop y/o Spark, para
de la misma.
lograr el mayor desempeño de éstas.

Reconoce las herramientas de evaluación


de datos más populares para la resolución Reconoce las funcionalidades y características del uso
de problemas Big Data de acuerdo a las de las herramientas de evaluación de datos.
buenas prácticas de la industria.

2. DESCRIPCIÓN GENERAL ACTIVIDAD

Esta actividad tiene carácter formativo, cuya finalidad es visualizar lo que aprendes, en la directa
medida que tu docente de asignatura te va retroalimentando constantemente, tanto a nivel individual
como colectivo (equipo de trabajo).

Paso 1.

Creación de la base de datos.

Paso 2.

Descargue desde el sitio del curso la base de datos movielens, contenida en el archivo movielens.sql.
A continuación acceda a través de la terminal a MySQL mediante el siguiente comando: mysql -uroot
-pcloudera. Una vez dentro, cree una base de datos con nombre movielens: create movielens y luego
importe el contenido del archivo descargado, mediante el comando source filename.sql. Para
asegurarse que todo está correcto, ejecute cualquier consulta sobre la tabla movies.

Docente Diseñador Gerardo Cerda Neumann Revisor metodológico Manuela Jiménez


Paso 3.

Importación a HDFS.

Paso 4.

Usando Sqoop, importe la tabla movies utilizando el siguiente comando:


sqoop import --connect jdbc:mysql://localhost/movielens --username root -- password cloudera --
fields-terminated-by '\t' --table movies

Paso 5.

Verifique que el resultado sea correcto, primero revisando la carpeta movies en HDFS (hadoop fs -ls
movies) y luego haciendo display del contenido del archivo resultante (hadoop fs -cat movies/part-m-
00000).

Paso 6.

Repita el proceso anterior para las tablas ratings y users.

Recursos

Usar las presentaciones del curso para apoyarse en las respuestas.

Criterio de evaluación

Carga la tabla movies. (3 puntos)


Carga la tabla ratings. (2 puntos)
Carga la tabla users. (2 puntos)

Aspectos a considerar en la evaluación

I. Analiza una situación que pueda ser resuelta por Hive del Ecosistema Hadoop
 Identifica los elementos principales de la situación en estudio
 Analiza las características de Hive que se podrían utilizar
II. Propone una aplicación de Hive para resolver la situación en estudio.
 Importa la tabla movies.
 Importa la tabla ratings.
 Importa la tabla users.

Docente Diseñador Gerardo Cerda Neumann Revisor metodológico Manuela Jiménez

También podría gustarte