Está en la página 1de 7

Programa académico

Especialización en Big Data

Asignatura
Procesamiento de Datos

ETAPA DE PROFUNDIZACIÓN

En la actualidad para sacarle provecho a toda la información generada en nuestra


sociedad, nuestra empresa, en el mundo, es importante realizar una introspección de toda
esa información y realizar una recolección de estos, para así poder hacer un análisis, elegir
los datos de una manera más adecuada, saber cómo se hace el manejo del tratamiento
datos o los procedimientos adecuados para toda la información elegida.

Sin embargo, no basta solo con elegir algunos datos de todas las datas que se quiere
trabajar o analizar, se debe pensar también en tener una consistencia y trazabilidad de los
datos, pero para que existan esos parámetros, se requiere de una serie de procesos que le
permita a los estudiantes o usuarios, ejecutar una adecuada interpretación y análisis de
estos. Por lo tanto, es de suma importancia trabajar conceptos sobre inteligencia de
negocios, minería de datos, métodos y herramientas para la interpretación y los diferentes
puntos de vista que se pueden tener de acuerdo con la información obtenida para así
realizar una retroalimentación de estos.

En importante tener presente que se deben tener esos conocimientos para poder
hacer un estudio adecuado de la información, realizar una interpretación apropiada, para
así poder realizar la toma de decisiones, de acuerdo con el trabajo realizado.
ACTIVIDAD

Trabajo individual

Esta actividad debe realizarse de manera individual. Para este trabajo se debe investigar sobre las
operaciones que se pueden realizar sobre los RDD de Spark (transformaciones y acciones),
elaborando un documento en donde se describan y clasifiquen las operaciones halladas y se
presente un ejemplo corto de al menos 5 transformaciones y 5 acciones.

Todo lo anterior debe ser plasmado en un documento donde se evidencie el resultado de la


investigación. Al tratarse de una investigación es obligatorio el uso de citación de fuentes
bibliográficas o referencias de acuerdo con las normas APA.

Tener en cuenta para el desarrollo del trabajo individual:

1. Resolver el cuestionario evaluativo de la unidad de manera individual.


2. Realizar una indagación de forma individual de los temas abarcados en esta actividad.
3. Subir las evidencias del trabajo en la plataforma LMS del curso.
.

Trabajo grupal

Esta actividad busca que el estudiante desarrolle los elementos de estadística que se evidencian la
Unidad 2, para que pueda realizar la evaluación e interpretación de los datos y de igual manera
conocer las Técnicas/Herramientas con las cuales se puede realizar la interpretación de datos.

A continuación se comparten una serie de datos que deben ser analizados y procesados por las
diversas técnicas planteadas en la unidad. Dichos datos provienen de la página
https://geoportal.dane.gov.co/visipm/ - Medida de Pobreza Multidimensional, filtrado para la ciudad
de Bogotá D.C.
La base que se debe emplear para este trabajo está disponible en este enlace:
https://tinyurl.com/576ppt8z. Tomando como partida los campos NIVEL_VULNERABILIDAD
e IPM (Índice de Pobreza Multidimensional):
• Realice el diagrama de dispersión.
• Calcule la ecuación de la recta de regresión (ecuación estimada).
• Identifique el tipo de correlación que tiene la tabla final, haciendo uso de la ecuación
estimada.

Este proceso debe ser plasmado en un documento con las evidencias de cada punto
solicitado.

Sugerencia: para facilitar el ejercicio se podrían codificar los valores del campo
NIVEL_VULNERABILIDAD como números (ejemplo: baja = 1, media-baja = 2, baja = 3,
etc.).

Tener en cuenta para el desarrollo de la actividad grupal:

1. Realizar una indagación de forma grupal de las temáticas abarcadas en esta


actividad.
2. Leer la unidad 2: Influencia del pre-procesamiento de datos dentro del desempeño
de modelos de perfilamiento de clientes elaborados con herramientas de minería de
datos.
3. Subir las evidencias del trabajo grupal en la plataforma LMS del curso.

Nota: El documento solicitado se puede realizar en grupos de máximo 3 personas.

Entregables:

1. Trabajo individual
1.1. Resolver el cuestionario evaluativo de la unidad.
1.2. Cargar en la plataforma de UCompensar el documento elaborado con la
evidencia de la investigación solicitada en la actividad individual.

2. Trabajo grupal
2.1. Cargar en la plataforma de UCompensar el documento elaborado con la
evidencia del desarrollo de los puntos solicitados en la actividad grupal.

Para el caso de la actividad individual cada persona debe entregar un documento con las siguientes
características:

• Archivo de texto en formato MS Office Word o compatible.


• Fuente y tamaño: Arial o Times New Roman, 12 Pt.
• Interlineado: 1,5 líneas.
• Márgenes 2,5 cm superior e inferior y 3 cm lado izquierdo y lado derecho.
• Citar las fuentes bibliográficas o referencias según normas APA.
Para el caso de la actividad grupal los estudiantes tienen la libertad de escoger los integrantes de
cada equipo y las herramientas tecnológicas a usar para resolver los puntos propuestos. Los grupos
pueden ser de máximo 3 personas (no se permite superar esta cantidad de personas sin excepción
alguna).

Se debe entregar un documento por grupo, a través de un integrante que unifique la entrega. En los
comentarios se deben especificar los nombres de todos los miembros del grupo.

Todos los integrantes del grupo deben participar en la realización del trabajo, es importante aclarar
que el trabajo es grupal y no necesariamente debe ser sincrónico, por lo cual pueden trabajar
definiendo los aportes y responsabilidades de cada integrante y realizarlos de forma asincrónica en
los espacios que acuerden.

Para el desarrollo del documento solicitado tener en cuenta:


• Archivo de texto en formato MS Office Word o compatible.
• Fuente y tamaño: Arial o Times New Roman, 12 Pt.
• Interlineado: 1,5 líneas.
• Márgenes 2,5 cm superior e inferior y 3 cm lado izquierdo y lado derecho.
• Citar las fuentes bibliográficas o referencias según normas APA.
• El archivo debe contener nombres y apellidos de cada estudiante, programa y asignatura.

ESPACIOS DE SOCIALIZACIÓN

De acuerdo con la acción formativa de la unidad sobre Análisis exploratorio de datos y


Muestreo Estadístico, este espacio académico contará con un foro de dudas académicas, en el que
todos los estudiantes podrán participar, con el fin de que tanto el docente como los compañeros de
clase participen del mismo y contribuyan al fortalecimiento del conocimiento del curso.

En este espacio el foro de dudas académicas tiene como finalidad brindar apoyo entre pares
(compañeros del curso), para aclarar dudas e inquietudes y profundizar las ideas sobre el
contenido de la acción formativa del curso (actividades de aprendizaje o materiales de estudio).

RECURSOS NECESARIOS PARA LA ACTIVIDAD

Recursos
Técnicos,
Computador con conexión a internet, consulta de base de datos, herramientas
tecnológicos
ofimáticas o herramientas para la creación de gráficos
y materiales
Ambientes de Recursos bibliográficos físicos o digitales (Biblioteca Ucompensar).
aprendizaje Recursos bibliográficos de libre acceso.
Videos en internet
Riquelme Santos, J., Ruiz, R., & Gilbert, K. (2006).
Minería de datos: Conceptos y
tendencias. Inteligencia Artificial: Revista
Iberoamericana de Inteligencia Artificial, 10
(29), 11-18. Obtenido de
https://idus.us.es/bitstream/handle/11441/43290/Min
Obligatorios
er%EDa%20de%20datos.pdf?sequence=1
Recursos
bibliográficos Suárez, Y. R., & Amador, A. D. (2009). Herramientas
de minería de datos. Revista Cubana de Ciencias
Informáticas, 3(3-4), 73-80.
https://www.redalyc.org/pdf/3783/378343637009.pdf
Complementarios Villada, F. (2016). Redes Neuronales Artificiales
aplicadas a la Predicción del Precio del Oro. Scielo.
https://scielo.conicyt.cl/scielo.php?script=sci_arttext&
pid=S0718-07642016000500016

También podría gustarte