Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Uso de herramientas de
explotación de datos
Área
Tecnología y transporte
5° semestre
Carrera:
Profesional Técnico-Bachiller en
Ciencia de datos e inteligencia artificial
UHED-00 1/ 20
Colegio Nacional de Educación Profesional Técnica
Semestre: Quinto.
Vigencia: Cuatro años, en tanto no se produzca un documento que lo anule o desaparezca el objeto del actual.
Prohibida la reproducción total o parcial de esta obra por cualquier medio, sin autorización por escrito del CONALEP.
UHED-00 2/ 20
Colegio Nacional de Educación Profesional Técnica
UHED-00 3/ 20
Colegio Nacional de Educación Profesional Técnica
Contenido Pág.
2.1 Presentación 10
2.5 Referencias 18
UHED-00 4/ 20
Colegio Nacional de Educación Profesional Técnica
El Sistema CONALEP invita a valorar las repercusiones de ser una Institución de Excelencia Educativa; a proponer que en
cada uno de nuestros planteles se piense en las formas tan diversas que existen de aportar, para que México sea mejor, más
justo y equitativo con el esfuerzo de todos.
Un estudiante formado en nuestros planteles, deberá siempre distinguirse por su continuo esfuerzo para incorporarse en las
mejores condiciones al mercado laboral o tener la opción de continuar sus estudios en Educación Superior para competir
con otros jóvenes en un mundo productivo que cada día demanda un mayor dominio de la técnica y la tecnología frente a
los enormes retos de la industria 4.0 y las necesidades de la sociedad mexicana.
Estos programas de estudio son resultado del intenso trabajo de docentes, académicos de prestigio e instituciones del sector
productivo, público y privado, para lograr una opción de formación de calidad, al servicio de los sobresalientes estudiantes
de la República Mexicana.
UHED-00 5/ 20
Colegio Nacional de Educación Profesional Técnica
Educar, implica una gran responsabilidad, la tarea es compleja, tiene que ver con los intereses y las necesidades de los
alumnos, con la vocación del profesional de la educación involucrado en ello, su claridad, voluntad y preocupación por hacer
llegar de mejor manera el saber a sus estudiantes.
Educar, también es responder a las necesidades del entorno inmediato de la familia, de la comunidad, del país y, desde
luego, con el propio desarrollo de la humanidad.
El cumplimiento de los planes y programas de estudio vigentes, plantean el desafío de ser acordes con los tiempos actuales,
así como con el desarrollo económico, social y cultural del país, entre otros; habrán de expresar en sus contenidos, de manera
clara, las estrategias de planeación, desarrollo y evaluación; asimismo, contienen invariablemente una visión precisa acerca
de lo que se quiere lograr con ellos, en la relación educativa entre docentes y alumnos.
El presente documento es producto del esfuerzo coordinado de grupos de especialistas, docentes y trabajadores al servicio
de la Educación, para cumplir con su diseño el reto de confirmar que el Sistema CONALEP es una Institución de Excelencia
Educativa.
Con el esfuerzo de todos, se concreta esta misión educativa, fundamental para el desarrollo de nuestro país.
UHED-00 6/ 20
Colegio Nacional de Educación Profesional Técnica
Aplicar modelos de inteligencia artificial por medio del análisis de datos, así como del conjunto de elementos para gestionar la
información de la nube, utilizando paradigmas de programación, a fin de generar soluciones tecnológicas innovadoras en los diversos
sectores de la industria.
UHED-00 7/ 20
Colegio Nacional de Educación Profesional Técnica
• Enfrenta las dificultades que se le presentan y es consciente de sus valores, fortalezas y debilidades.
Se autodetermina y cuida de sí
• Identifica sus emociones, las maneja de manera constructiva y reconoce la necesidad de solicitar apoyo ante
1. Se conoce y valora a sí mismo
una situación que lo rebase.
y aborda problemas y retos
• Elige alternativas y cursos de acción con base en criterios sustentados y en el marco de un proyecto de vida.
teniendo en cuenta los
• Analiza críticamente los factores que influyen en su toma de decisiones.
objetivos que persigue. • Asume las consecuencias de sus comportamientos y decisiones.
• Administra los recursos disponibles teniendo en cuenta las restricciones para el logro de sus metas.
2. Es sensible al arte y participa
en la apreciación e • Valora el arte como manifestación de la belleza y expresión de ideas, sensaciones y emociones.
interpretación de sus • Experimenta el arte como un hecho histórico compartido que permite la comunicación entre individuos y
expresiones en distintos culturas en el tiempo y el espacio, a la vez que desarrolla un sentido de identidad.
géneros. • Participa en prácticas relacionadas con el arte
• Reconoce la actividad física como un medio para su desarrollo físico, mental y social.
3. Elige y practica estilos de vida
• Toma decisiones a partir de la valoración de las consecuencias de distintos hábitos de consumo y conductas
saludables.
de riesgo.
• Cultiva relaciones interpersonales que contribuyen a su desarrollo humano y el de quienes lo rodean.
Se expresa y comunica
4. Escucha, interpreta y emite • Expresa ideas y conceptos mediante representaciones lingüísticas, matemáticas o gráficas.
mensajes pertinentes en • Aplica distintas estrategias comunicativas según quienes sean sus interlocutores, el contexto en el que se
distintos contextos mediante encuentra y los objetivos que persigue.
la utilización de medios, • Identifica las ideas clave en un texto o discurso oral e infiere conclusiones a partir de ellas.
códigos y herramientas • Se comunica en una segunda lengua en situaciones cotidianas.
apropiados. • Maneja las tecnologías de la información y la comunicación para obtener información y expresar ideas.
• Sigue instrucciones y procedimientos de manera reflexiva, comprendiendo como cada uno de sus pasos
contribuye al alcance de un objetivo.
Piensa crítica y reflexivamente
• Ordena información de acuerdo con categorías, jerarquías y relaciones.
5. Desarrolla innovaciones y
• Identifica los sistemas y reglas o principios medulares que subyacen a una serie de fenómenos.
propone soluciones a
• Construye hipótesis y diseña y aplica modelos para probar su validez.
problemas a partir de
• Sintetiza evidencias obtenidas mediante la experimentación para producir conclusiones y formular nuevas
métodos establecidos. preguntas.
• Utiliza las tecnologías de la información y comunicación para procesar e interpretar información.
UHED-00 8/ 20
Colegio Nacional de Educación Profesional Técnica
UHED-00 9/ 20
Colegio Nacional de Educación Profesional Técnica
2.1. Presentación
El módulo de Uso de herramientas de explotación de datos corresponde a la Formación Profesional de la carrera de Profesional
Técnico-Bachiller en Ciencia de datos e inteligencia artificial y se cursa en el quinto semestre, el cual tiene como propósito que el alumno
implemente un ecosistema de big data distribuido mediante herramientas que permitan recibir y analizar la información, realizando
mejoras en el funcionamiento y seguridad del ambiente con la finalidad de contribuir a la toma de decisiones.
Para ello, el módulo está conformado por dos unidades de aprendizaje; la Unidad 1 pretende que el alumno implemente un ambiente
de big data distribuido, con la finalidad de iidentificar el procedimiento para el procesamiento en la distribución de datos, diferenciando
el procesamiento centralizado, distribuido y paralelo para trabajar con miles de nodos en red, patabytes y segmentado; con la Unidad 2
mejorar el funcionamiento y seguridad del ambiente distribuido de datos, para manejar mayor cantidad de información en menor
tiempo mejorando el desempeño.
La formación profesional del PT-B, en la carrera ya antes mencionada, está diseñada con un enfoque de procesos, lo cual implica un
desarrollo de competencias profesionales que incluye funciones productivas integradas en las etapas de conocimiento para ejecutar una
gran cantidad de datos de manera distribuida en diferentes nodos, replicar en una base de datos en diferentes nodos segmentando para
la distribución de la carga de trabajo, configurar ambientes que le permiten procesar una gran cantidad de datos a través de
herramientas informáticas para ser analizados al momento e implementar estrategias de mejoras en el desempeño de la búsqueda en
big data. El módulo Uso de herramientas de explotación de datos se relaciona con otros módulos como son: Aplicación de modelos ETL,
Análisis del lenguaje natural, Reconocimiento de patrones y Análisis de criptografía y seguridad.
La tarea educativa en este módulo tendrá que diversificarse, con el fin de que los docentes realicen funciones preceptoras, las que
consistirán en la guía y acompañamiento de los alumnos durante su proceso de formación académica y personal y en la definición de
estrategias de participación que permitan incorporar a su familia en un esquema de corresponsabilidad que coadyuve a su desarrollo
integral; por tal motivo, deberá destinar tiempo dentro de cada unidad para brindar este apoyo a la labor educativa de acuerdo al
Programa de Preceptorías.
Por último, es necesario que al final de cada unidad de aprendizaje se considere una sesión de clase en la cual se realice la recapitulación
de los aprendizajes logrados, en lo general, por los alumnos, con el propósito de verificar que éstos se han alcanzado o, en caso contrario,
UHED-00 10/ 20
Colegio Nacional de Educación Profesional Técnica
determinar las acciones de mejora pertinentes. En este proceso, los docentes tienen la facultad de instrumentar las modalidades de
autoevaluación, coevaluación y heteroevaluación, de acuerdo con las condiciones particulares de su entorno, aun cuando de manera
institucional se definen los criterios e indicadores para su aplicación.
UHED-00 11/ 20
Colegio Nacional de Educación Profesional Técnica
Implementar un ecosistema de big data distribuido mediante herramientas que permitan recibir y analizar la información,
realizando mejoras en el funcionamiento y seguridad del ambiente con la finalidad de contribuir a la toma de decisiones.
UHED-00 12/ 20
Colegio Nacional de Educación Profesional Técnica
Uso de herramientas
de explotación de 2.1 Configura ambientes que le permiten procesar una gran
datos cantidad de datos a través de una o varias herramientas
informáticas
72 horas 12 horas
2. Optimización del 2.2 Procesa el flujo de datos en tiempo real provenientes de una
funcionamiento de las tareas. fuente determinada, transformándolos en información que
puede ser analizada al momento.
44 horas 12 horas
UHED-00 13/ 20
Colegio Nacional de Educación Profesional Técnica
Resultado de aprendizaje: 1.1. Ejecuta una gran cantidad de datos de manera distribuida en diferentes nodos,
demostrando las posibilidades de escalabilidad. 12 horas
UHED-00 14/ 20
Colegio Nacional de Educación Profesional Técnica
1.2. Replica de datos los datos en diferentes nodos segmentando para la distribución
Resultado de aprendizaje 16 horas
de la carga de trabajo.
B. Escalabilidad Horizontal
• Balance de cargas por
hardware
• Balance de cargas por
software
• Tipos de clúster
• Clúster sobre servidores
C. Características de Mongo DB
• Potente sintaxis de consultas
• Indexación
• Soporte para SQL
• Transacciones
• Base de datos distribuida
con gran escalabilidad
vertical y horizontal
• Permite ejecutar consultas
pasando directamente
código JavaScript
C: Conceptual P: Procedimental A: Actitudinal
UHED-00 15/ 20
Colegio Nacional de Educación Profesional Técnica
Resultado de aprendizaje: 2.1. Configura ambientes que le permiten procesar una gran cantidad de datos a
12 horas
través de una o varias herramientas informáticas.
C. Características
• Trabaja en memoria
• Velocidad
• Procesamiento en
tiempo real
• Lenguajes de
programación
UHED-00 16/ 20
Colegio Nacional de Educación Profesional Técnica
2.2. Procesa el flujo de datos en tiempo real provenientes de una fuente determinada,
Resultado de aprendizaje 12 horas
transformándolos en información que puede ser analizada al momento.
• Soporte de
aplicaciones ETL.
UHED-00 17/ 20
Colegio Nacional de Educación Profesional Técnica
B. Apache Kafka
• Plataforma distribuida
de transmisión de datos
de forma inmediata:
- Procesar flujos de
registros
- Almacenar
- Publicar
- Suscribirse a flujo de
datos.
C. Características de Apache
STORM
• Acompañamiento con
Apache Kafka.
• Procesar flujos de datos
de forma masiva.
UHED-00 18/ 20
Colegio Nacional de Educación Profesional Técnica
C. Apache Lucene
• Indexación de
información
• Búsqueda de
información
C: Conceptual P: Procedimental A: Actitudinal
UHED-00 19/ 20
Colegio Nacional de Educación Profesional Técnica
2.5. Referencias
Básicas:
• García-Alsina, M. (2017). Big data. Gestión y explotación de grandes volúmenes de datos. Editorial UOC. España.
• Ríos, D. y Gómez-Ullate, D. (2019). Big data. Conceptos, tecnologías y aplicaciones. Consejo Superior de Investigaciones Científicas.
España.
• Pérez-Solà, C. y Casas-Roma, J. (2016). Análisis de datos en redes sociales. Editorial UOC. España.
Complementarias:
• Durán, X. (2019). El imperio de los datos. El big data, la privacidad y la sociedad del futuro. Universitat de Valencia. España.
• Vicente, E. y Mateos, A. (2018). Data science y redes complejas. Métodos y aplicaciones. Editorial Universitaria Ramón Areces.
España.
Páginas Web:
• Torres, G., Salinas, O., Estrada, A. y Guerrero, J. (2012). Centro de Desarrollo de Software de la Universidad Tecnológica Emiliano
Zapata del Estado de Morelos (CDS-UTEZ). Herramientas de Explotación de Información de Bases de Datos. Recuperado el día
19/04/2022 de http://www.gridmorelos.uaem.mx/~mcruz/CICOS2011/articulo27.pdf
• Grupo Ático 34. (sf). Grupo Ático 34. Data Warehouse. Definición y funciones. Recuperado el día 19/04/2022 de
https://protecciondatos-lopd.com/empresas/data-warehouse/
• Junta de Andalucía. (sf). Marco de desarrollo de la Junta de Andalucía. Conceptos sobe escalabilidad. Recuperado el día
19/04/2022 de http://www.juntadeandalucia.es/servicios/madeja/contenido/recurso/220
• Elastic. (sf). Elasticasearch. ¿Qué es Elasticsearch?. Recuperado el día 19/04/2022 de https://www.elastic.co/es/what-
is/elasticsearch
• LT DATA CHANNEL. Hadoop. Recuperado el día 16/05/2022 de https://www.youtube.com/watch?v=BHF3rtylfPQ
• HandsonERP. Hadoop Tutorial 1 - What is Hadoop?. Recuperado el día 16/05/2022 de https://www.youtube.com/watch?v=xWgdny19yQ4
• Qazi, A. HortonWorks. Recuperado el día 16/05/2022 de https://alamgirqazi-github-io.translate.goog/tech-blog/install-hortonworks-data-
platform-hdp-3.1.5/?_x_tr_sl=en&_x_tr_tl=es&_x_tr_hl=es-419&_x_tr_pto=sc
• Perez, R. DOCKER - Creación de Sistemas altamente Distribuidos. Recuperado el día 16/05/2022 de
https://sistemasdistribuidos.foroactivo.com/t211-docker-creacion-de-sistemas-altamente-distribuidos
• UAL. Procesamiento centralizado y distribuido de datos. Recuperado el día 16/05/2022 de
http://ual.dyndns.org/biblioteca/Evaluacion_Seleccion_Equipo_2017/pdf/S3d1.pdf
UHED-00 20/ 20