Está en la página 1de 13

TECNOLÓGICO NACIONAL DE MÉXICO

1. Datos Generales de la asignatura

Nombre de la asignatura: Administración de datos masivos

Clave de la asignatura: TID-2102

SATCA1: 2-3-5

Ingeniería en Sistemas
Carrera: Computacionales.

2. Presentación

Caracterización de la asignatura
Esta asignatura aporta al perfil del Ingeniero las competencias y herramientas
necesarias para atender a la necesidad actual en los diferentes sectores de
servicios, gobierno, industria, y empresas exige un profesional capacitado en el
análisis y procesamiento masivo de la información.

Las competencias profesionales preparan al egresado de esta carrera para


desempeñarse en la vida laboral con mayores probabilidades de éxito. Estas se
logran a través de las unidades que articulan los saberes de diversos campos,
dirigidos al manejo de datos, la utilización de un sistema gestor de bases de datos
para recolección y organización, al análisis de un conjunto de datos masivos y la
aplicación de proyectos de uso de datos masivos. Las competencias
profesionales se ven enriquecidas por aquellas competencias demandadas en el
mercado laboral, enfocadas a trabajo en equipo, atención al proceso,
comunicación efectiva, ética profesional, planeación y organización, orientación a
la mejora continua, orientación al logro, atención al cliente, orientación a la mejora
continua, relaciones interpersonales.
El complemento de estas permite acceder a los puestos de trabajo reconocidos
en los sectores laborales relacionados con las funciones productivas del sector
de servicios e industrial.

Esta asignatura sirve para:


• Analizar un conjunto de datos masivos.
• Identificar un conjunto de datos de casos de uso.
• Organizar un conjunto de datos masivos.

La intención de esta asignatura es que el egresado sea capaz de:

• Diferenciar los conceptos de datos simples y masivos.

1
Sistema de Asignación y Transferencia de Créditos Académicos

Página | 1
TECNOLÓGICO NACIONAL DE MÉXICO

• Clasificar a través de ejemplos los tipos de datos simples y masivos.


• Identificar los diferentes escenarios en el que se utilizan los datos masivos.
• Identificar el uso de la estadística en el análisis de datos.
• Conocer las técnicas de análisis de datos masivos: estadísticas
descriptivas, estadísticas inferenciales y estadísticas con datos masivos.
Utilizando un lenguaje de distribución libre enfocado a los análisis estadísticos
Intención didáctica
Se organiza el temario de la asignatura en cinco unidades donde se sugieren
diferentes tecnologías para el manejo de datos masivos.

Las primeras tres unidades se abordan:


La diferencia entre datos simples y masivos.
Identificación de los casos de uso de los datos masivos.
Establecimiento de las técnicas de tratamiento de datos masivos.
Aplicación de una técnica de análisis de datos en el procesamiento de la
información.
Procesamiento de un conjunto de datos estructurados orientado a negocios.

En la cuarta unidad se realizan las principales tecnologías en el entorno Big


Data, analizando y visualizando datos en el mundo Big Data.
Finalmente, en el quinto tema, se presentan los conocimientos sobre algunas
de las nuevas tendencias en bases de datos.

Página | 2
TECNOLÓGICO NACIONAL DE MÉXICO

3. Participantes en el diseño y seguimiento curricular del programa

Lugar y fecha de Participantes Observaciones


elaboración o revisión

Instituto Tecnológico de Participantes Miembros de la Reunión para la


Tehuacán, del 16 al 20 de Academia de Sistemas y elaboración del módulo
abril del 2018 Computación: de especialidad
MC Irene García Ortega
ME Saira A. Vásquez
Gamboa
MTI Felipe Rodríguez
Ramírez
MTI Eduardo Vázquez Zayas
LI Patricia Cruz García
Instituto Tecnológico de Participantes Reunión para la
Tehuacán, del 1 al 11 de Miembros de la Academia de elaboración del módulo
diciembre del 2020 Sistemas y Computación: de especialidad
MC Irene García Ortega
ME Saira A. Vásquez Gamboa
MTI Felipe Rodríguez
Ramírez
MTI Eduardo Vázquez Zayas
LI Patricia Cruz García
MDS Olga López Fórtiz
Ing. Fernando Cansino Gálvez
4. Competencia(s) a desarrollar
Competencia(s) específica(s) de la asignatura
Diseñar e implementar Sistemas de Base de Datos empleando tecnologías
emergentes que permitan resolver situaciones reales de una organización.
Conocer y utilizar tecnologías emergentes de bases de datos para el desarrollo de
aplicaciones relacionadas con el tratamiento de información y soporte para la toma
de decisiones.

Diseña e implementa sistemas de base de datos que permitan resolver situaciones


reales de una organización.

Diseña e implementa un pequeño data warehouse definiendo los metadatos


necesarios a utilizar para integrarse a soluciones de inteligencia empresarial haciendo
una descripción de los usos y aplicaciones que tiene cada una de ellas.

Investiga y conoce las tecnologías de base de datos para el soporte en la toma de


decisiones mediante la minería de datos.
Crear e implementar una aplicación informática en la nube.

Página | 3
TECNOLÓGICO NACIONAL DE MÉXICO

5. Competencias previas
• Dominio del lenguaje SQL.
• Habilidad de programación en un lenguaje orientado a objetos.
• Conocimiento de la arquitectura cliente-servidor.
• Habilidades para utilizar software de sistemas.
• Diseñar y manipular bases de datos relacionales.
• Administrar bases de datos utilizando un sistema de gestión de bases de
datos.
• Manipular información estadística de la base de datos.
• Crear y manipular bases de datos para el tratamiento de la información en
distintas plataformas, considerando elementos de integridad y seguridad.
• Aplicar metodologías de ingeniería software para la elaboración de un
proyecto.

6. Temario

No. Temas Subtemas


1 Tratamiento de Datos 1.1 Tipos de datos
1.1.1 estructurados
1.1.2 semiestructurados
1.1.3 no estructurados
1.1.4 datos en tiempo real
1.2 Datos masivos
1.3 Lenguajes para el análisis y
tratamiento de datos masivos
1.3.1 Aplicación con lenguaje R
1.3.2 Aplicación con Python

1.4 Estructura de los datos en XML


1.4.1 XML Document Schema,
Xlink, Xinclude,XPath: Location
paths, Xpointer, XSLT - XSL
Transformations,XSL Formatting
Objects, XQuery, XUpdate
1.5 Consultando datos JSON con
GraphQL.

2 Sistemas Gestores de datos 2.1 Identificación desde los diferentes


masivos escenarios que se identifican los datos
masivos
2.2. Identificar el uso en la estadística
de datos.

Página | 4
TECNOLÓGICO NACIONAL DE MÉXICO

2.3 Identificar las técnicas de análisis de


datos
2.3.1 estadística descriptiva
2.3.2 inferenciales
2.3.3 para tratamiento de datos
2.4 Mongo DB
3 Bases de datos para la toma de 3.1 Bodegas de datos (Data Warehouse).
decisiones 3.1.1 definición, funcionamiento, Diseño,
herramientas
3.2 Mercados de datos (Data Mart).
3.2.1 definición, fases, tecnologías

4 Herramienta Hadoop 4.1. Componentes de Hadoop


4.1.1 MapReduce
4.2 El enfoque de gestión de MapReduce
4.3 Hadoop Common Components
4.4 Desarrollo de aplicaciones en Hadoop
4.5 Casos de Estudio de Hadoop

5 Tendencias 5.1 Introducción a las tecnologías


Tecnológicas. emergentes en bases de datos.
5.2 Blockchain
5.3 Ciencia de Datos

Página | 5
TECNOLÓGICO NACIONAL DE MÉXICO

7. Actividades de aprendizaje de los temas

Nombre de tema

1 Tratamiento de Datos.

Competencias Actividades de aprendizaje

Específica(s): Aplicar el tratamiento de • Realizar una búsqueda bibliográfica


datos en los lenguajes R y Python. sobre la gestión de los tipos de
datos, (estructurados,
Genéricas: semiestructurados, no
estructurados, datos en tiempo real)
- Habilidad de investigación. y elaborar un cuadro comparativo
- Capacidad de aplicar los sobre los tipos de datos para
conocimientos en la práctica. presentarlo en clase.
- Capacidad de generar nuevas ideas. • Realizar una búsqueda bibliográfica
- Optimiza soluciones. sobre los datos masivos y diseñar
- Usa el pensamiento lógico, algorítmico, un cuadro sinóptico.
heurístico, analítico y sintético.
• Ejemplificar los tipos de datos, para
conocer su uso y aplicación.
• Realizar una búsqueda bibliográfica
sobre los lenguajes para el análisis
y tratamiento de datos masivos y
elaborar una comparación de los
lenguajes investigados.

Nombre de tema

Sistemas Gestores de datos masivos

Competencias Actividades de aprendizaje

Específica(s): • Realizar la investigación sobre los


sistemas gestores de datos
Aplicar las técnicas de análisis de datos masivos, elabora un cuadro
en Sistemas Gestores de datos masivos. sinóptico, comentarlo en equipos y
llegar a una conclusión.
Genéricas:
• Realizar una investigación sobre
las técnicas de análisis de datos,
• Capacidad de análisis y determina los escenarios de
síntesis. aplicación y realiza la
• Capacidad de organizar y presentación en clase.
planificar. • Analiza casos de éxito que
• Usa el pensamiento lógico, permitan identificar la
algorítmico, heurístico, analítico infraestructura requerida realizar
y sintético.
Página | 6
TECNOLÓGICO NACIONAL DE MÉXICO

• Habilidades básicas de manejo el análisis en los sistemas


de la computadora. gestores de datos masivos.
• Trabajo en equipo. • Elaborar un escenario real que
• Capacidad para identificar, plantear haga uso de análisis de datos en
y resolver problemas. los sistemas gestores de datos
• Capacidad de aplicar los masivos.
conocimientos en la práctica.
• Habilidades de gestión de
información (habilidad para
buscar y analizar información
proveniente de fuentes
diversas).
• Capacidad de generar nuevas
ideas (creatividad).
• Solución de problemas.
• Toma de decisiones.

Nombre de tema

Bases de datos para el soporte en la toma de decisiones

Específica(s): Actividades de aprendizaje

Diseñar e implementar un almacén de • Investigar la definición de Data


datos (Data warehouse) aplicando la warehouse, tipos, características y
metodología (KIMBALL, RELATIONAL, realizar un mapa conceptual.
DATA VAULT, CRIPS) utilizando Data Mart • Investiga las diferentes
para la toma de decisiones en la metodologías para la
inteligencia de negocios (business implementación de data
warehouse y realiza un cuadro
intelligence)
comparativo que resalte las
Genéricas: ventajas y desventajas
• Investigar las Herramientas de
• Capacidad de aplicar los Inteligencia de Negocio (Business
conocimientos en la práctica. Intelligence BI) y realizar un cuadro
• Capacidad para identificar, plantear comparativo que resalte semejanzas,
diferencias o características.
y resolver problemas.
• Capacidad para tomar decisiones. • Investiga definición y tipos de Data
• Capacidad de trabajo en equipo. Mart (OLAP, OLTP) y realiza un
• Capacidad de motivar y conducir informe oral en la clase
hacia metas comunes.
• Capacidad para formular y
gestionar proyectos. • Realiza cubos de datos a partir de
una base de datos relacional.

Página | 7
TECNOLÓGICO NACIONAL DE MÉXICO

• Realiza un Data warehouse y


realiza un reporte con los pasos
para su construcción

• Investiga las características de las


herramientas que se utilizan para
soluciones de Business
Intelligence: como Oracle
Business Intelligence, IBM-
cognos, Microsoft Analysis
Services (SSAS), Pentaho,
Spagobi y realiza un cuadro
comparativo que resalte ventajas
y desventajas

Nombre de tema

Herramienta Hadoop
Competencias Actividades de aprendizaje

Específica(s): • Investigar y Conocer las características


básicas de la tecnología Hadoop y realizar
Aplicar la tecnología Hadoop para un glosario.
Almacenar y procesar grandes cantidades • Conocer la arquitectura básica de un
de datos sistema Hadoop y esquematizar.
Genéricas: • Investigar MapReduce como un sistema
o manera de implementar software que
• Capacidad de aplicar los permita paralelizar los datos y elaborar
conocimientos en la práctica. una presentación y presentarla al grupo.
• Capacidad para identificar, plantear • Conocer el desarrollo de aplicaciones
y resolver problemas. Hadoop
• Capacidad para tomar decisiones. • Analizar casos de estudio con Hadoop y
• Capacidad de trabajo en equipo.
presentar al grupo.
• Capacidad de motivar y conducir
hacia metas comunes.

Nombre de tema

Tendencias Tecnológicas.

Competencias Actividades de aprendizaje

Específica(s): • Realizar una búsqueda bibliográfica


por equipos de diversas fuentes de
Desarrolla una visión actualizada para

Página | 8
TECNOLÓGICO NACIONAL DE MÉXICO

contextualizarse en las tecnologías información sobre las nuevas


emergentes de bases de datos. tendencias tecnológicas y resumir en
una tabla destacando sus
Genéricas:
características y aplicación.
• Capacidad de análisis y síntesis.
• Realizar prácticas de laboratorio sobre
• Habilidad para buscar y analizar. las nuevas tecnologías emergentes
• Trabajo en equipo.
utilizando python.
• Capacidad de aplicar los
• conocimientos en la práctica.

8. Práctica(s)

• Diseñar un escenario real donde se realice la carga masiva de datos, utilizando


técnicas de análisis mediante el SGBD MongoDB utilizando algún lenguaje para
el tratamiento de datos masivos.
• Diseñar una data mart orientado a la satisfacción de las necesidades de un
usuario, partiendo de una base de datos relacional cuyas vistas no ofrecen
solución a las necesidades del mismo.
• Aplicar el modelo OLAP a una base de datos multidimensional para procesar
información orientada a la toma de decisiones.
• Instalar R y RStudio, familiarizarse con el entorno de RStudio, introducir,
almacenar e importar datos y funciones en RStudio.
• Aplicación de Python con datos masivos.
• Realizar prácticas de laboratorio para crear un sitio web limitado haciendo uso
de las tecnologías web con XML y presentarlo ante el grupo.
• Analizar, diseñar y programar una solución de datos masivos en un caso de
estudio utilizando hadoop.
• Implementar una billetera con blockchain en un portal de e-commerce con
python.
• Utilizar ciencia de datos para identificar preferencias en los consumidores en un
portal e-commerce.
• Diseñar una base de datos semi-estructurada para consultar datos con XPath,
XQuery y SQL/XML.
• Desarrollar programas que realicen la migración de XML a B.D. y viceversa.
• Construir un sitio web limitado para resolver un problema de e-commerce o e-
bussines usando herramientas web (open source) y XML.
• Desarrollo de programas que utilicen tecnologías de B.D. con XML, Instalación y
configuración de herramientas de XML con un servidor Web.

Página | 9
TECNOLÓGICO NACIONAL DE MÉXICO

• Diseñar una data mart orientado a la satisfacción de las necesidades de un


usuario, partiendo de una base de datos relacional cuyas vistas no ofrecen
solución a las necesidades del mismo.

Página | 10
TECNOLÓGICO NACIONAL DE MÉXICO

9. Proyecto de asignatura

Proponer una plataforma que resuelva un problema del mundo real implementando
tecnologías emergentes de bases de datos. Se sugiere que el producto se constituya
como una herramienta de apoyo a las materias de la Carrera de Ingeniería en Sistemas
Computacionales, o como apoyo a la automatización de algún proceso en la región de
Tehuacán:

• Fundamentación: Dentro de esta fase el estudiante debe ingresar el marco


referencial (teórico, conceptual, contextual, legal) en el cual se fundamenta el
proyecto de acuerdo con un diagnóstico realizado de la empresa para cual se va a
desarrollar la plataforma integral, mismo que permite lograr la comprensión de la
situación actual que vive la empresa.

• Planeación: Con base en el diagnóstico realizado en la fase anterior, el estudiante


debe realizar el modelado de todos los procesos involucrados en el desempeño de
las funciones de la empresa a analizar, así mismo se debe entregar un cronograma
de trabajo.

• Ejecución: Consiste en el desarrollo completo de la infraestructura del problema


integral planteado. Es decir, el estudiante debe elaborar la base de datos a utilizar, el
diseño de interfaces a mostrar, y la interconexión de estos. Esta fase es la de mayor
duración, debido a que implica el desempeño de las competencias genéricas y
específicas a desarrollar dentro de la asignatura.

• Evaluación: Es la fase final que aplica un juicio de valor en el contexto laboral-


profesión, social e investigativo, ésta se realiza a través del reconocimiento de logros
y aspectos a mejorar. Dentro de esta fase se evaluará el proyecto final mediante una
presentación formal por parte del estudiante, en donde los puntos a considerar son
los siguientes: contenido, instrumento de apoyo, lenguaje no verbal, expresión verbal
y funcionalidad de la propuesta desarrollada.

Página | 11
TECNOLÓGICO NACIONAL DE MÉXICO

10. Evaluación por competencias

La evaluación debe ser continua y formativa por lo que se debe considerar el desempeño
de cada una de las actividades de aprendizaje, haciendo especial énfasis en:

• Información obtenida durante las investigaciones solicitadas, plasmadas en


documentos escritos o digitales.
• Modelado de datos que especifiquen la solución a problemas reales o de
ingeniería utilizando sistemas gestores de base de datos.
• Se recomienda utilizar varias técnicas de evaluación con un criterio específico
para cada una de ellas (teórico-práctico).
• Desarrollo de un proyecto por unidad que integre los tópicos vistos en la misma
• Desarrollo de un proyecto final que integre todas las unidades de aprendizaje.
• Presentación y exposición de cada actividad de aprendizaje, así como de las
prácticas propuestas. Algunas se evaluarán por equipo.
• Integración de las rúbricas en un portafolio de evidencias.
• Proyectos realizados empleando cada uno de los aspectos estudiados de
computación en la nube.
• Información recabada durante las consultas e investigaciones solicitadas,
plasmadas en documentos escritos también llamados productos.
• Reportes escritos de los resultados u observaciones obtenidas durante las
actividades realizadas en cada unidad académica, así como de las conclusiones
obtenidas de dichas observaciones.
• Descripción de otras experiencias concretas que se obtendrán al participar en
discusiones, exposiciones o cualquier otro medio didáctico-profesional que trate
sobre la materia y que deberán realizarse durante el curso académico.
• Exámenes teórico-prácticos para comprobar la efectividad del estudiante en la
resolución de casos prácticos.

11. Fuentes de información

http://rstudio-pubs-
static.s3.amazonaws.com/215332_188c0491b64a46f9b38d5d0768a7469f.html

https://wpd.ugr.es/~bioestad/guia-r-studio/practica-1-r-studio/#6

https://docs.mongodb.com/manual/
Blockchain y Smart Contracts La revolución de la confianza
1ª edición 2019,
Ocariz Emiliano B
Alfaomega, RC Libros
ISBN 978-607-538-365-1.

Ciencia de Datos - Técnicas analíticas y aprendizaje estadístico


1ª edición 2018,
Página | 12
TECNOLÓGICO NACIONAL DE MÉXICO

García Herrero, Jesús; Berlanga de Jesús, Antonio; Patricio Guisado, Miguel Ángel;
Padilla, Washington R.
Alfaomega, Altaria Editorial
ISBN 978-607-538-252-4

https://www.tecnologias-informacion.com/datawarehouse.html

https://www.unir.net/ingenieria/revista/herramientas-business-intelligence/

https://www.itconsultors.com/herramientas-de-la-inteligencia-de-negocios

https://gravitar.biz/datawarehouse/metodologias-data-warehouse/

https://gravitar.biz/datawarehouse/mejores-practicas-para-construir-un-data-warehouse/

https://www.astera.com/es/type/blog/types-of-data-marts/

https://www.esan.edu.pe/apuntes-empresariales/2020/07/data-warehouse-pasos-para-
construirlo-con-exito/

https://www.talend.com/es/resources/what-is-data-mart/

https://docplayer.es/1357758-Analisis-diseno-e-implementacion-de-un-datamart-
utilizando-herramientas-open-source-para-las-unidades-administrativa-y-financiera-de-
la-espe.html

Página | 13

También podría gustarte