0% encontró este documento útil (0 votos)
48 vistas8 páginas

Guía de Aprendizaje - Tarea 4 - Componente Práctico - Prácticas Simuladas

La guía de aprendizaje del componente práctico del curso de Ingeniería de Datos establece que los estudiantes deben construir una solución de ingeniería de datos utilizando el ecosistema Hadoop y herramientas de computación distribuida y en la nube. La actividad incluye la creación de un mapa conceptual, un programa de cálculo matemático avanzado, y la visualización de datos, con un enfoque en la aplicación práctica de conceptos teóricos. Se espera que los estudiantes evidencien sus resultados a través de diversas entregas que demuestren su comprensión y habilidades en el análisis de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
48 vistas8 páginas

Guía de Aprendizaje - Tarea 4 - Componente Práctico - Prácticas Simuladas

La guía de aprendizaje del componente práctico del curso de Ingeniería de Datos establece que los estudiantes deben construir una solución de ingeniería de datos utilizando el ecosistema Hadoop y herramientas de computación distribuida y en la nube. La actividad incluye la creación de un mapa conceptual, un programa de cálculo matemático avanzado, y la visualización de datos, con un enfoque en la aplicación práctica de conceptos teóricos. Se espera que los estudiantes evidencien sus resultados a través de diversas entregas que demuestren su comprensión y habilidades en el análisis de datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Universidad Nacional Abierta y a Distancia

Vicerrectoría Académica y de Investigación

Guía de aprendizaje para el desarrollo del componente práctico


del curso
Ingeniería de Datos
Código: 202037699

1. Información general del componente práctico.

Tabla 1. Información general del componente práctico

Aspecto Descripción
1. Estrategia metodológica Aprendizaje Basado en Tareas
(Task-Based Learning, TBL)
2. Tipología de curso Metodológico
3. Momento de la evaluación Intermedio
4. Puntaje de la actividad 180 puntos
5. Número de actividades del 1
componente registradas en
esta guía
6. Horas de trabajo independiente 35
del estudiante
7. Horas de acompañamiento 16
docente
8. Tipo de práctica formativa Simulada

2. Con esta actividad de componente práctico se espera que


los estudiantes logren y evidencien el siguiente resultado
de aprendizaje:

Construir una solución de ingeniería de datos mediante la


exploración del ecosistema Hadoop, computación distribuida,
servicios en la nube y fundamentos en lenguajes de programación,
para el análisis de grandes volúmenes de datos.

1
3. Descripción general de la actividad del componente
práctico.

La actividad del componente práctico está diseñada para fortalecer las


competencias técnicas y analíticas de los estudiantes mediante el
desarrollo de proyectos integrados que abordan temas clave en el manejo
de datos, cálculos matemáticos avanzados, simulación, y optimización
numérica. Los estudiantes construirán un mapa conceptual que detalle el
ecosistema Hadoop y las funcionalidades de sus herramientas principales,
junto con un cuadro comparativo que analice diferentes enfoques de
computación (local, distribuida y en la nube). Además, implementarán un
programa de cálculo matemático avanzado para resolver problemas como
derivadas, integrales, sistemas de ecuaciones lineales y graficación de
funciones. Estas tareas les permitirán aplicar conocimientos teóricos en
herramientas prácticas como SymPy y entornos de programación
modernos.
De igual manera, se explorará el análisis y visualización de datos
utilizando un dataset público, lo que incluye desde la limpieza de datos
hasta la creación de gráficos avanzados para comprender mejor las
relaciones entre variables. Asimismo, se desarrollará una simulación de
datos para el análisis de series temporales y un proyecto de optimización
numérica que abarcará tanto el uso de herramientas especializadas como
la implementación de algoritmos personalizados. Este componente
fomenta la integración de habilidades computacionales, estadísticas y
matemáticas aplicadas, preparando a los estudiantes para enfrentar
desafíos reales en ciencia de datos y tecnología.
Tabla 2. Información actividad 1

Aspecto Descripción
1. Escenarios de componente Simulado con apoyo de TIC
práctico
2. Tipo de actividad Independiente
3. Número de actividad 1
4. La actividad inicia el: lunes, 14 de abril de 2025
5. La actividad finaliza el: domingo, 11 de mayo de 2025

2
Los recursos con los que debe contar para el desarrollo de la
actividad son los siguientes:
Ecosistema Hadoop:

• Joyanes, L. (2019). Inteligencia de negocios y analítica de datos.


Editorial Alfaomega, Vol. 1, pp. 29-36. Recuperado de
http://libroweb.alfaomega.com.mx/book/1007/free/data/contenid
os_cap5.pdf

• Voulgaris, Z. (2014). Data Scientist: The Definitive Guide to


Becoming a Data Scientist. Technics Publications, pp. 75-93.
Recuperado de
https://bibliotecavirtual.unad.edu.co/login?url=http://search.ebsc
ohost.com/login.aspx?direct=true&db=nlebk&AN=1005057&lang=
es&site=eds-live&scope=site&ebv=EB&ppid=pp_75

• Ríos Insua, D. y Gómez-Ullate Oteiza, D. (2019). Big data:


conceptos, tecnologías y aplicaciones. Editorial CSIC Consejo
Superior de Investigaciones Científicas, pp. 32-37. Recuperado de
https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/122031?page=
32

Fundamentos de computación distribuida:

• Lopez, F. (2015). Sistemas distribuidos. Editorial colección una


década, vol. 1, pp. 15-17. Recuperado de
http://dccd.cua.uam.mx/libros/archivos/03IXStream_sistemas_dis
tribuidos.pdf

• Castro, I. et al. (2019). Introducción a la computación distribuida.


Universidad Oberta de Catalunya, vol. 1, pp. 7-21. Recuperado de
http://openaccess.uoc.edu/webapps/o2/bitstream/10609/63485/2
/Computaci%C3%B3n%20de%20altas%20prestaciones_M%C3%
B3dulo%204_Introducci%C3%B3n%20ª%20la%20computaci%C3
%B3n%20distribuida.pdf

3
Computación en la nube:

• Rueda, R. (2018). ¿Qué es la computación en la nube?. Revista


sistemas Uni Andes, pp. 72-80. Recuperado de
http://acistente.acis.org.co/typo43/fileadmin/Revista_112/tres.pdf

• Morales, E., et al (2016). Computación en la nube con Google.


Expoch, Escuela Superior Politécnica del Chimborazo, vol. 1. Pp. 31-
39. Recuperado de http://cimogsys.espoch.edu.ec/direccion-
publicaciones/public/docs/books/2019-09-17-210847-
computaci%C3%B3n%20en%20la%20nube-comprimido.pdf

Fundamentos de Python:

• Lott, S. F. (2015). Python Essentials. Packt Publishing, pp. 25-100.


Recuperado de
https://bibliotecavirtual.unad.edu.co/login?url=http://search.ebsc
ohost.com/login.aspx?direct=true&db=nlebk&AN=1019626&lang=
es&site=eds-live&scope=site&ebv=EB&ppid=pp_25

La actividad consiste en:

La actividad consiste en:


1. Construir un mapa conceptual que muestre el ecosistema hadoop y
funcionalidad de cada una de sus herramientas. Además, elaborará
un cuadro comparativo que muestre las características, ventajas y
desventajas de la computación no distribuida local, distribuida local
y computación en la nube

2. Desarrollo de un Calculador Matemático Avanzado


• Implementar un programa que:
o Calcule derivadas e integrales de funciones matemáticas
utilizando SymPy.
o Resuelva sistemas de ecuaciones lineales de hasta 3
variables.
o Grafique funciones matemáticas como seno, coseno,
tangente, y exponencial en un intervalo dado.
4
3. Procesamiento y Visualización de Datos en un Dataset
Público
• Usar un dataset disponible en Google Colab (puede ser un
archivo CSV subido por el usuario). El programa deberá:
o Leer y mostrar estadísticas básicas del dataset (media,
mediana, desviación estándar, moda).
o Realizar operaciones de limpieza de datos, como eliminar
valores nulos o duplicados.
o Crear gráficos avanzados como histogramas, gráficos de
caja (boxplots) y gráficos de dispersión que representen
relaciones entre columnas del dataset.
4. Simulación de Datos y Análisis de Series Temporales
• Diseñar un programa que:
o Genere datos simulados para representar una serie temporal
(ej: ventas diarias en un mes).
o Realice análisis estadístico avanzado, incluyendo detección
de tendencias y estacionalidad.
o Use Matplotlib o Seaborn para crear gráficos de línea que
muestren las tendencias.
5. Proyecto de Optimización Numérica
• Crear un programa que:
o Utilice SciPy para resolver un problema de optimización (ej:
minimizar una función de costo).
o Implemente un algoritmo personalizado de optimización
(como gradiente descendente) para un problema simple
o Grafique los resultados de la optimización.
Para el desarrollo de esta actividad debe seguir los siguientes pasos:
• Paso 1: Definir el alcance y funciones del calculador, decidir las
operaciones que incluirá: derivadas, integrales, resolución de
ecuaciones, etc.
• Paso 2: Usar SymPy para: Derivar e integrar funciones
simbólicas, Resolver sistemas de ecuaciones no lineales.

5
• Paso 3: Usar Matplotlib para graficar funciones matemáticas,
como polinomios y trigonométricas, en un intervalo definido por el
usuario.
• Paso 4: Elegir un archivo CSV público y cargar el dataset en
pandas, explorar y limpiar los datos, identificar valores nulos o
duplicados y decidir cómo manejarlos y Mostrar estadísticas básicas
(media, mediana, desviación estándar).
• Paso 5: Generar gráficos como histogramas para analizar
distribuciones, gráficos de dispersión para relaciones entre
variables y gráficos de líneas para analizar tendencias temporales.
• Paso 6: Usar SciPy para resolver el problema mediante: Métodos
de optimización locales, Métodos globales si es necesario. Graficar
la evolución del valor de la función objetivo durante el proceso de
optimización.
Evidencias de trabajo independiente:
Las evidencias de trabajo independiente para entregar son:
1. Mapa Conceptual del Ecosistema Hadoop

• Archivo o imagen del mapa conceptual que muestre claramente las


herramientas del ecosistema Hadoop, sus funcionalidades y
relaciones.

2. Cuadro Comparativo de Tipos de Computación

• Documento en formato tabular que detalle las características,


ventajas y desventajas de la computación no distribuida local,
distribuida local y computación en la nube.

3. Programa de Cálculo Matemático Avanzado

• Código fuente del programa desarrollado (en Python), incluyendo


comentarios explicativos.
• Capturas de pantalla o registros de salida que evidencien el cálculo
de derivadas, integrales, resolución de sistemas de ecuaciones
lineales y graficación de funciones.

6
4. Procesamiento y Visualización de Datos

• Código fuente del análisis de datos en Google Colab o similar,


mostrando estadísticas descriptivas, limpieza de datos y
visualizaciones avanzadas (gráficos como histogramas, boxplots y
gráficos de dispersión).
• Capturas de pantalla del entorno y gráficos generados.

5. Simulación de Series Temporales

• Código fuente del programa que genere y analice la serie


temporal.
• Gráficos que evidencien tendencias y estacionalidades en los datos
simulados.
• Informe breve que describa el análisis realizado.

6. Proyecto de Optimización Numérica

• Código fuente de las soluciones de optimización con SciPy y del


algoritmo personalizado (como gradiente descendente).
• Gráficos y resultados que muestren el proceso y los resultados de
la optimización.
• Explicación breve del problema de optimización resuelto y la
metodología aplicada.
Evidencias de trabajo grupal:
En esta actividad no se requieren evidencias de trabajo grupal:
4. Lineamientos generales para la elaboración de las
evidencias
Para evidencias elaboradas de forma independiente, tenga en cuenta
las siguientes orientaciones:
• Documento que debe incluir el desarrollo de los puntos y los
ítems: portada, desarrollo y bibliografía en formato APA.
• Entregar el documento a través del entorno de evaluación.
Todos los integrantes del grupo deben participar con sus aportes en el
desarrollo de la actividad.
En cada grupo deben elegir un solo integrante que se encargará de
entregar el producto solicitado en el entorno o escenario que haya
señalado el docente.
7
Antes de entregar el producto solicitado deben revisar que cumpla con
todos los requerimientos que se señalaron en esta guía de actividades
de componente práctico.
Solo se deben incluir como autores del producto entregado, a los
integrantes del grupo que hayan participado con aportes durante el
tiempo destinado para la actividad.
Tenga en cuenta que todos los productos escritos independientes o
grupales deben cumplir con las normas de ortografía y con las
condiciones de presentación que se hayan definido.
En cuanto al uso de referencias considere que el producto de esta
actividad debe cumplir con las normas Elija un elemento.
En cualquier caso, cumpla con las normas de referenciación y evite el
plagio académico, para ello puede apoyarse revisando sus productos
escritos mediante la herramienta Turnitin que encuentra en el campus
virtual.
5. Situaciones de orden académico
Considere que en el acuerdo 029 del 13 de diciembre de 2013, artículo
99, se considera como faltas que atentan contra el orden académico,
entre otras, las siguientes: literal e) “El plagiar, es decir, presentar como
de su propia autoría la totalidad o parte de una obra, trabajo, documento
o invención realizado por otra persona. Implica también el uso de citas o
referencias faltas, o proponer citas donde no haya coincidencia entre ella
y la referencia” y liberal f) “El reproducir, o copiar con fines de lucro,
materiales educativos o resultados de productos de investigación, que
cuentan con derechos intelectuales reservados para la Universidad.”
Las sanciones académicas a las que se enfrentará el estudiante son las
siguientes:
a) En los casos de fraude académico demostrado en el trabajo
académico o evaluación respectiva, la calificación que se impondrá será
de cero puntos sin perjuicio de la sanción disciplinaria correspondiente.
b) En los casos relacionados con plagio demostrado en el trabajo
académico cualquiera sea su naturaleza, la calificación que se impondrá
será de cero puntos, sin perjuicio de la sanción disciplinaria
correspondiente.

También podría gustarte