Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Proyecto
“Consultoría para el diseño de una solución integral para el sistema de
información de monitoreo y evaluación, así como del proceso de analítica de
información.”
Cliente
COMPUTADORES PARA EDUCAR
Contrato No. 29 - 20
Noviembre 2020
1
Ficha del documento
Nombre del cliente: Computadores Para Educar - CPE
Control de cambios
Fecha Versió Descripción del Cambio Elaborado por:
n
20/11/2020 1 Creación del documento Diego Ramírez
Ajustes de acuerdo con observaciones
23/11/2020 2 realizadas por parte de Computadores Diego Ramírez
para Educar -CPE-.
Ajustes de acuerdo con observaciones
24/11/2020 3 realizadas por parte de Computadores Diego Ramírez
para Educar -CPE-.
Actualización del documento con las
21/12/2020 4 Diego Ramírez
capacitaciones adicionales realizadas.
Revisó
Fecha Nombre Cargo - Entidad Firma
Aprobó
Fecha Nombre Cargo - Entidad Firma
2
Contenido
1. PROPÓSITO ..................................................................................................................................... 7
2. ALCANCE .......................................................................................................................................... 7
3. DEFINICIONES, SIGLAS Y ABREVIATURAS ............................................................................... 8
4. DELIMITACIÓN DEL ÁMBITO DEL PROYECTO ........................................................................ 10
4.1 MÓDULO DE AGENTE DE MONITOREO Y EVALUACIÓN .................................................. 14
4.2 MÓDULO DE ENCUESTAS....................................................................................................... 15
4.3 MÓDULO DE REPORTE E INDICADORES DEL ECOSISTEMA DE INNOVACIÓN
EDUCATIVA............................................................................................................................................. 16
4.4 MÓDULO DE ADMINISTRACIÓN DEL SISTEMA ................................................................... 16
5. ESTUDIO DE VIABILIDAD ............................................................................................................. 17
5.1 VIABILIDAD TÉCNICA ............................................................................................................... 18
5.2 VIABILIDAD JURÍDICA .............................................................................................................. 21
6. MAPA DE RUTA PARA EL DESARROLLO E IMPLEMENTACIÓN ........................................... 23
7. ESTIMACIÓN DE TIEMPO Y COSTOS ........................................................................................ 24
7.1 RESULTADOS TÉCNICOS........................................................................................................ 25
7.2 PLANIFICACIÓN TEMPORAL Y ASIGNACIÓN DE RECURSOS.......................................... 29
8. PERFILES DEL PERSONAL REQUERIDO PARA EL DESARROLLO DEL PROYECTO ....... 31
9. RIESGOS IDENTIFICADOS PARA EL SISTEMA DE INFORMACIÓN ..................................... 34
9.1 ANÁLISIS CUALITATIVO DE RIESGOS .................................................................................. 35
10. DEFINICIÓN DEL CONCEPTO DE OPERACIÓN ................................................................... 41
10.1 DIAGRAMA DE CASOS DE USO AGENTE DE MONITOREO .............................................. 41
10.2 DIAGRAMA CASOS DE USO COMPONENTE TRANSACCIONAL ...................................... 42
10.3 DIAGRAMA CASOS DE USO COMPONENTE DASHBOARD............................................... 43
10.4 PROPUESTA DE MODELO DE OPERACIÓN PARA EL MONITOREO Y ANALÍTICA DE
DATOS ASOCIADOS AL USO DE LAS TERMINALES ENTREGADAS EN LAS SEDES
EDUCATIVAS, CONSIDERANDO LAS CONDICIONES EN MATERIA DE CONECTIVIDAD EN
LAS SEDES BENEFICIADAS ................................................................................................................ 47
10.5 INTEROPERABILIDAD CON SIM Y OTRAS FUENTES DE INFORMACIÓN DE CPE, ASÍ
COMO DE FUENTES DE ENTIDADES EXTERNAS ........................................................................... 50
10.6 PROPUESTA INTEGRAL DE LOS MODELOS DE ANALÍTICA APLICABLES, QUE
DEFINAN MECANISMOS O PROCEDIMIENTOS DE EVALUACIÓN Y DESPLIEGUE, ASÍ COMO
SU INTERACCIÓN CON EL SISTEMA DE INFORMACIÓN ............................................................... 53
10.6.1 MODELO DE ANALÍTICA DESCRIPTIVA Y DIAGNOSTICA ............................................. 53
3
10.6.1.1 BODEGA DE DATOS ......................................................................................................... 53
10.6.1.2 ARQUITECTURA DE LA BODEGA DE DATOS .............................................................. 53
10.6.1.3 DISEÑO DE LA BODEGA DE DATOS ............................................................................. 57
10.6.1.3.1 MODELO ENCUESTA ................................................................................................... 57
10.6.1.3.2 MODELO FORMACIÓN................................................................................................. 58
10.6.1.3.3 MODELO MONITOREO DE SOFTWARE .................................................................... 60
10.6.1.3.4 MODELO MONITOREO DE HARDWARE ................................................................... 61
10.6.1.3.5 MODELO SOSTENIBILIDAD AMBIENTAL .................................................................. 63
10.6.1.4 EXTRACCIÓN, TRANSFORMACIÓN Y CARGA............................................................. 64
10.6.1.4.1 CALIDAD DE LOS DATOS ............................................................................................ 68
10.6.1.4.2 HERRAMIENTAS DE CALIDAD DE DATOS ............................................................... 69
10.6.1.4.3 VISUALIZACIÓN Y ANÁLISIS DE DATOS .................................................................. 70
10.6.2 MODELO DE ANALÍTICA PREDICTIVA Y PRESCRIPTIVA .............................................. 74
10.6.2.1 MICROSOFT AZURE MACHINE LEARNING .................................................................. 80
10.6.3 ARQUITECTURA DE DESPLIEGUE .................................................................................... 84
10.6.3.1 VISTA DE IMPLEMENTACIÓN ......................................................................................... 86
11. CAPACITACIONES .................................................................................................................... 90
12. RECOMENDACIONES............................................................................................................... 92
12.1 RECOMENDACIONES NECESARIAS PARA EL ÓPTIMO DESARROLLO,
IMPLEMENTACIÓN Y SEGUIMIENTO DEL SISTEMA. ...................................................................... 92
12.1.1 RECOMENDACIONES DESARROLLO MÓDULO DE AGENTE DE MONITOREO Y
EVALUACIÓN .......................................................................................................................................... 94
12.1.2 RECOMENDACIONES DESARROLLO MÓDULO DE ENCUESTAS ............................... 95
12.1.3 RECOMENDACIONES DESARROLLO MÓDULO DE ADMINISTRACIÓN ...................... 97
12.1.4 RECOMENDACIONES DESARROLLO MÓDULO DE REPORTES E INDICADORES ... 98
12.2 RECOMENDACIONES ALTERNATIVAS DE SOLUCIÓN PARA LA CAPTURA DE
INFORMACIÓN ....................................................................................................................................... 99
13. ANEXOS .................................................................................................................................... 101
4
Tablas e ilustraciones
5
Ilustración 24 Cuadrante mágico para plataformas de ciencias de datos y aprendizaje de
máquina ................................................................................................................... 77
Ilustración 25 Arquitectura de referencia almacenamiento de datos moderno.................. 78
Ilustración 26 Arquitectura de referencia y análisis avanzado .......................................... 79
Ilustración 27 Pipeline Azure Machine Learning. .............................................................. 82
Ilustración 28 Vista de despliegue propuesta ................................................................... 84
Ilustración 29 Vista de despliegue implementación .......................................................... 86
6
1. Propósito
2. Alcance
7
3. Definiciones, Siglas y Abreviaturas
8
Ministerio de Tecnologías de la Información y las Comunicaciones – MinTIC.
Según la Ley 1341 o Ley de TIC, es la entidad que se encarga de diseñar, adoptar
y promover las políticas, planes, programas y proyectos del sector de las
Tecnologías de la Información y las Comunicaciones.
Dentro de sus funciones está incrementar y facilitar el acceso de todos los
habitantes del territorio nacional a las Tecnologías de la Información y las
Comunicaciones y a sus beneficios.
9
4. Delimitación del ámbito del proyecto
OBLIGACIÓN
Se diseñará e implementará de junio de 2020 a diciembre de 2024, un modelo de monitoreo y
evaluación estandarizada para medir y hacer seguimiento del acceso y uso de las tecnologías
digitales en la educación, que identifique aspectos de Innovación educativa desarrollados en
programas e iniciativas que se implementen en el entorno educativo con tecnologías digitales.
El Ministerio de Tecnologías de la Información y las Comunicaciones a través de CPE y en
articulación con el Ministerio de Educación Nacional diseñará y articulará, entre abril de 2020
y junio de 2021, instrumentos unificados de recolección de datos que permitan hacer un
seguimiento sistemático del acceso y uso de las tecnologías digitales en las prácticas
educativas por parte de la comunidad educativa.
El Ministerio de Tecnologías de la Información y las Comunicaciones a través de CPE
en articulación con el Ministerio de Educación Nacional diseñará e implementará entre
junio de 2020 y diciembre de 2024, el Sistema de Información y Evaluación para la
Innovación Educativa a partir de las tecnologías digitales, para compilar la información
sobre el uso de las tecnologías digitales, el acceso a conectividad y tecnologías
digitales, la formación docente y los resultados en el aprendizaje de los estudiantes.
Este sistema deberá contar con la información pertinente para realizar el monitoreo y
evaluación de la incorporación de las tecnologías digitales en la educación y ser compatible
con el Observatorio de la Innovación Educativa a partir de las TIC.
10
de 2020 a diciembre de 2023, el Índice de Innovación Educativa, cuyo propósito es identificar
el estado de apropiación de las tecnologías digitales en las instituciones educativas que defina
el Ministerio de Educación Nacional.
OBLIGACION
El Ministerio de Tecnologías de la Información y las Comunicaciones, a través de CPE, entre
de julio de 2023 y diciembre de 2024, realizará una evaluación de la política de Tecnologías
para Aprender, con el propósito de visibilizar los resultados de las acciones propuestas en el
presente documento CONPES y analizar el cumplimiento de los objetivos de la política.
11
Computadores para Educar –CPE-, dentro de las obligaciones del CONPES 3988
línea de acción 1, tiene por responsabilidad el diseño e implementación del Sistema
de Información y Evaluación para la Innovación Educativa a partir de las
tecnologías digitales, para compilar la información sobre el uso de las
tecnologías digitales, el acceso a conectividad y tecnologías digitales, la
formación docente y los resultados en el aprendizaje de los estudiantes. y
teniendo en cuenta que “En Colombia, el programa CPE ha enfocado el seguimiento
y monitoreo al acceso de TIC (número de terminales entregadas, número de sedes
educativas beneficiadas) y en términos de docentes formados. Sin embargo, en el
marco de la innovación a través de TIC, hay falencias en el proceso de seguimiento
a los agentes que participan en la estrategia de formación de CPE, falta de
instrumentos de evaluación, de estrategias interinstitucionales e integración en el
proceso de seguimiento para alimentar la medición de los efectos de la intervención
(CPE, 2019). Así mismo, por parte de CPE se identifica que el monitoreo de la
transformación de las prácticas educativas en este momento es inexistente.
1
CONPES 3988 31 de marzo de 2020, Tecnologías para aprender: Política nacional para impulsar la innovación en las prácticas
educativas a través de las tecnologías digitales.
12
iniciando con la especificación de requerimientos, su análisis y diseño, para el cual
se ha planteado el modelo conceptual del dominio que se presenta a continuación
donde se identifican los conceptos claves del problema proporcionando una visión
estructural del mismo.
13
Hemos identificado que, si bien por parte de Computadores para Educar - CPE - y
del ecosistema de innovación se han entregado terminales y contenidos educativos,
no se ha contado con herramientas que permitan realizar una medición frente al uso
y apropiación de estas terminales, lo cual dificulta conocer si las terminales
realmente están siendo usadas, y la pertinencia de los contenidos preinstalados que
han sido entregados, ya que no se cuenta con información estadística confiable
asociadas al acceso, uso y apropiación de los contenidos preinstalados en las
terminales donadas por el programa a sedes educativas oficiales, bibliotecas
públicas y casas de la cultura a nivel nacional , por lo cual dentro del sistema de
monitoreo y evaluación para la innovación educativa -SM&E-, se hace necesario
contar con un módulo especifico, que se encargue de esta responsabilidad.
Este módulo del sistema debe permite monitorear y analizar información sobre el
uso del hardware y software asociados a las terminales de cómputo de las sedes
educativas beneficiarias del programa Computadores para Educar -CPE-. El agente
contempla dos perspectivas: la primera, es el aplicativo instalado en la terminal a
monitorear; la segunda, es el módulo en el que se consulta la información global del
monitoreo y se establecen configuraciones al agente.
14
Otro aspecto relevante que se identificó como característica que el sistema de
monitoreo y evaluación para la innovación educativa -SM&E- debe incluir, es
permitir la recolección de información mediante instrumentos que permitan a las
entidades del ecosistema de innovación educativa capturar información de campo,
susceptible de monitoreo, para los cual se propone incluir un módulo que permita
aplicar estos instrumentos de forma periódica, y adecuarlos a las necesidades de
información presentes y futuras, es esta razón por la cual dentro del diseño del
sistema se incluye un módulo de encuestas, que tiene la siguiente responsabilidad.
15
dimensiones, indicadores, variables de cálculo y la definición de la línea base. Para
lo cual, dentro del sistema de monitoreo y evaluación para la innovación educativa
-SM&E-, se ha definido del módulo de reportes e indicadores (Dashboard) del
ecosistema de innovación educativa.
Este módulo permitirá presentar el estado actual de los indicadores del ecosistema
de manera gráfica y amigable. Estos indicadores están agrupados por dimensiones
de análisis, adicionalmente la presentación de indicadores podrá estar acompañada
por visualización de información geográfica, según corresponda. Se permitirá
visualizar lo indicadores establecidos por el ecosistema de innovación y realizar
seguimiento de los mismos, al igual que definir cuáles de estos indicadores
corresponde a cada uno de los índices (innovación educativa y evolución digital).
16
administrar el sistema, la creación de roles específicos para permitir la participación
de usuario de otras entidades pertenecientes al ecosistema de innovación
educativa, lo cual garantiza que cualquier usuario de otra entidad podrá acceder a
todas las acciones del sistema de monitoreo y evaluación para la innovación
educativa -SM&E-, con previo registro por parte del administrador del sistema por
parte de Computadores para Educar - CPE -.
5. Estudio de viabilidad
17
5.1 Viabilidad Técnica
Transaccional. Permite:
18
Agente de monitoreo y evaluación. Permite:
19
Actualmente no existe en el mercado un sistema de monitoreo y evaluación, que
cumpla con todas las necesidades requeridas por la entidad en un solo sistema.
Existen soluciones que cumplen parcialmente las funciones de agente de seguridad,
gestión de encuestas y herramientas de reportaría que trabajan de forma
desarticulada, entendiendo que el sistema no solo debe cumplir con las necesidades
de Computadores para Educar - CPE -, sino con las de todo el ecosistema de
innovación, se considera necesario el desarrollo y la implementación de un sistema
único, que integre todas las funcionalidades que permitan gestionar la información,
y construir instrumentos sólidos de evaluación que las entidades puedan medir los
resultados y el impacto de las TIC en la educación, este sistema debe estar
desarrollada con base a estándares y niveles de seguridad adecuados a su
misionalidad.
20
manifiesta especialmente en la conservación de la información en soporte
electrónico.
El programa “Computadores para Educar” está a cargo del Ministerio TIC conforme
al documento CONPES Nº 3063 de 23 de diciembre de 19992, con la asistencia de
otros organismos y entidades del Estado como es el caso del Ministerio de
Educación Nacional. El Decreto 1064 de 2020 establece dentro de los objetivos del
Ministerio de Tecnologías de la Información y las Comunicaciones -MinTIC- las de
diseñar las políticas, planes, programas y proyectos con el fin de promover la
inversión y el cierre de la brecha digital y promover el uso y apropiación de los
tecnologías de la información y comunicaciones entre los ciudadanos, las
empresas, el Gobierno y demás instancias nacionales como soporte del desarrollo
2“Este documento propone al CONPES la implementación de un programa de donación masiva de computadores por parte de las
entidades públicas y la empresa privada a las escuelas y colegios públicos del país. Este programa ha sido llamado “Computadores para
Educar” (CPE), y se enmarca dentro de la Agenda Nacional de Conectividad, la cual comprende estrategias para masificar el uso las
Tecnologías de la Información y Comunicación. La entidad encargada de diseñar y coordinar el programa CPE será el Ministerio de
Comunicaciones, con la asistencia del Despacho de la Primera Dama de la Nación, el Ministerio de Educación Nacional, el SENA y el
Departamento Nacional de Planeación”.
21
del país3. A su turno, tanto el documento CONPES Nº 30634 como el decreto 2324
de 9 de noviembre de 20005 establecen que corresponde al Ministerio de Educación
Nacional frente al programa Computadores para Educar, la de suministrar la
información para determinar las instituciones beneficiarias, definir los criterios para
la distribución equitativa, coordinar las acciones con las secretarías de educación
del orden territorial y determinar el uso y apropiación efectiva de la tecnología por
parte de los beneficiarios. De tal suerte, que en las normas en comento, subyace
expresamente la competencia para el Ministerio TIC en calidad de coordinador
general del programa Computadores para Educar como para el Ministerio de
Educación Nacional como primera autoridad nacional en el sector educativo, para
adelantar este tipo de sistemas que sin lugar a dudas pretenden cerrar la brecha
digital haciendo una distribución más equitativa de los equipos y optimizando su uso
y apropiación en aquellas instituciones beneficiarias bajo criterios de eficiencia y
equidad. Dicho monitoreo deberá seguir parámetros de privacidad, anonimato y la
aplicación de la política de tratamiento de datos personales, en caso que se llegaré
a haber algún tipo de tratamiento y que en cualquier caso, deberá respetar los
derechos de los titulares (usuarios finales) y cuyo fines solo deben enmarcarse en
la normativa antes citada, es decir, para el uso y apropiación efectiva de la
tecnología.
3 Decreto 1064 de 23 de julio de 2020, artículo 1º, numeral “1. Diseñar, formular, adoptar y promover las políticas, planes, programas y
proyectos del sector de Tecnologías de la Información y las Comunicaciones, en correspondencia con la Constitución Política y la Ley, con
el fin de promover la inversión y el cierre de la brecha digital, contribuir al desarrollo económico, social y político de la Nación y elevar el
bienestar de los colombianos”. Numeral “2. Promover el uso y apropiación de las Tecnologías de la Información y las Comunicaciones
entre los ciudadanos, las empresas, el Gobierno y demás instancias nacionales como soporte del desarrollo social, económico y político
de la Nación”.
4 C. Ministerio de Educación Nacional. Esta institución estará encargada de asesorar y manejar los aspectos pedagógicos del programa.
Para lo anterior, determinará las instituciones beneficiarias del programa, así como los criterios para la distribución de los computadores
y el uso que se le dará a los mismos. Estos parámetros serán utilizados para definir los requerimientos técnicos de los equipos a recibir,
de manera que suplan satisfactoriamente las necesidades previstas. (…) Esta coordinación permitirá desarrollar un plan conjunto de
distribución, uso y apropiación efectiva de la tecnología por parte de las instituciones escolares a donde se lleven los equipos.
5 Decreto 2324 de 2020, Artículo 9º. Corresponde al Ministerio de Educación suministrar la información necesaria para determinar las
instituciones beneficiarias del Programa, definir los criterios para la distribución equitativa y uso de los equipos y coordinar las acciones
necesarias con las Secretarías de Educación, Departamentales, Distritales y Municipales para la ejecución de un plan de distribución, uso
y apropiación efectiva de la tecnología por parte de las instituciones públicas beneficiarias de los equipos.
22
116, la cual, en ciertas materias es delegada en los Ministros de cada sector, como
es el caso, se sugiere al programa Computadores para Educar, que teniendo clara
la competencia compartida entre los dos Ministerios y de manera concreta para la
materia objeto de estudio, podrá expedirse un Manual de Usuario del Sistema de
Información de Monitoreo y Evaluación, que vaya de la mano de la Política de
Tratamiento de Datos Personales, para preservar los propósitos de cierre de brecha
digital, distribución equitativa bajo los criterios de privacidad y anonimato del
sistema; y si mediante dichos equipos se tuviera acceso a datos personales de los
usuarios aplicar la normativa vigente7.
Domi ni o No 2
Domi ni o No 3
Domi ni o No 4
Gestión de
Análisis y diseño Desarrollo e implementación Puesta en marcha
transición
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
6 Artículo 189. Corresponde al Presidente de la República como Jefe de Estado, Jefe del Gobierno y Suprema Autoridad Administrativa:
11. Ejercer la potestad reglamentaria, mediante la expedición de los decretos, resoluciones y órdenes necesarios para la cumplida
ejecución de las leyes.
7 Ley Estatutaria 1581 de 2012.
23
Sea considerado iniciar el desarrollo e implementación del sistema, desarrollando
el módulo de administración, de esta forma se permitirá en las primeras liberaciones
del sistema tener control de las funcionalidades habilitadas y de los roles que se
creen.
8
La estimación por casos de uso es un método de estimación de esfuerzo a partir de los casos de uso, que es aplicable en proyectos de
desarrollo de software. El método de Puntos Casos de Uso (Use Case Points) fue desarrollado en 1993 por Gustav Kamer, bajo la
supervisión de Ivar Jacobson (creador de los casos de uso y gran promovedor del desarrollo de UML y el Proceso Unificado).
24
casos de uso se les asigna una complejidad basada en transacciones, entendidas
como una interacción entre el usuario y el sistema, mientras que a los actores se
les asigna una complejidad basada en su tipo, es decir, si son interfaces con
usuarios u otros sistemas. También se utilizan factores de entorno y de complejidad
técnica para ajustar el resultado con un factor de corrección. El método de punto de
casos de uso consta de cuatro etapas, en las que se desarrollan los siguientes
cálculos:
4. Esfuerzo horas-hombre.
Se obtuvo los siguientes resultados asociados a cada factor que propone el método
de Puntos de casos de uso.
25
Tabla 4 Factor Ambiental
26
Tabla 7 Complejidad de Casos de Uso basada en transacciones
Cantidad Actores
Cantidad de Tipo de
No Casos de uso Simple Medio Complejo
Transacciones caso
1 Adicionar terminal de cómputo a monitorear 4 Medio 1 0 2
2 Consultar información de las terminales de cómputo 8 Complejo 1 0 2
3 Consultar ubicación de sedes educativas 4 Medio 1 0 2
4 Consultar ubicación de la terminal de cómputo 3 Medio 1 0 2
5 Consultar uso de software de la terminal de cómputo 4 Medio 1 0 2
6 Exportar información del uso de la terminal de cómputo 2 Simple 1 0 2
7 Consultar software instalado en la terminal de cómputo 3 Medio 1 0 2
8 Configurar monitoreo y sincronización de terminales de cómputo 8 Complejo 1 0 2
9 Configurar gráficas 4 Medio 0 0 2
10 Configurar alertas 4 Medio 0 0 2
11 Bloquear terminal de cómputo 1 Simple 1 0 2
12 Gestionar usuarios del SM&E 2 Simple 0 0 2
13 Gestionar roles del SM&E 2 Simple 0 0 2
14 Gestionar permisos del SM&E 2 Simple 0 0 2
15 Visualizar indicadores y/o índices de planes de inversión 4 Medio 2 0 2
16 Gestionar planes 3 Medio 0 0 2
17 Gestionar proyectos 3 Medio 0 0 2
18 Gestionar actividades 3 Medio 0 0 2
19 Consultar estudiantes de establecimientos educativos 2 Simple 2 0 2
20 Consultar formación académica realizada por estudiantes 2 Simple 2 0 2
21 Consultar docentes de establecimientos educativos (incluye ver detalle) 2 Simple 2 0 2
22 Consultar formación académica realizada por docentes 2 Simple 2 0 2
23 Consultar información básica de establecimientos educativos 2 Simple 2 0 2
24 Consultar información de matrículas en la sede educativa 2 Simple 2 0 2
25 Consultar estado de conexión de la terminal de cómputo 2 Simple 2 0 2
26 Consultar inventario de terminales de cómputo-CPE (Inventario para donar) 2 Simple 2 0 2
27 Consultar información de mantenimientos realizados por CPE 2 Simple 2 0 2
28 Consultar información de retoma de equipos 2 Simple 2 0 2
29 Consultar encuesta 3 Medio 1 0 4
30 Crear encuesta 8 Complejo 1 0 4
31 Actualizar encuesta 5 Medio 1 0 4
32 Eliminar encuesta 2 Simple 1 0 2
33 Ver encuesta 2 Simple 1 0 2
34 Publicar e Inactivar encuesta (incluir tema de publicar en app) 4 Medio 1 0 2
35 Ver respuestas de encuestas diligenciadas 3 Medio 1 0 2
36 Descargar encuesta publicada 2 Simple 1 0 2
37 Diligenciar encuesta 3 Medio 1 0 2
38 Sincronizar resultado de la encuesta (encuesta diligenciada) 4 Medio 1 0 2
39 Gestionar información de entregas de terminales de cómputo (realizadas por CPE y otros) 2 Simple 1 0 2
40 Gestionar información sobre demanufactura de residuos electrónicos 2 Simple 1 0 2
41 Gestionar información de KITS RAEE entregados a las sedes educativas 2 Simple 1 0 2
Publicar indicador - Porcentaje de establecimientos educativos (públicos) que
Simple
42 cuentan con acceso a electicidad 2 2 0 2
43 Publicar índice - Instituciones educativas (sector público) que cuentan con 2 Simple 2 0 2
Publicar indicador - Cantidad de terminales de cómputo entregadas a los
Simple
44 establecimientos educativos (oficiales) del país (por institución, sede, 2 2 0 2
Publicar indicador - Cantidad de terminales de cómputo con contenidos
Simple
45 digitales entregados por CPE a los establecimientos educativos (oficiales) del 2 2 0 2
Publicar indicador - Cantidad de sedes educativas oficiales con acceso a
Simple
46 terminales de cómputo y contenidos digitales 2 2 0 2
Publicar indicador - Terminales de cómputo con contenidos digitales
entregadas a sedes educativas para uso de dos tipos de usuario (docentes, Simple
47 estudiantes) 2 2 0 2
Publicar indicador - Razón de estudiantes por equipo de cómputo (con y sin
Simple
48 conexión a internet) (a nivel dpto, mpio, institución, sede) 2 2 0 2
Publicar indicador - Cantidad de docentes de las sedes educativas oficiales,
Simple
49 formados en uso pedagógico de TICS 2 2 0 2
50 Publicar indicador - Cantidad docentes acompañados en procesos de 2 Simple 2 0 2
51 Publicar indicador - Estudiantes acompañados en procesos educativos con 2 Simple 2 0 2
Publicar indicador - Eventos de socialización de experiencias exitosas en el
Simple
52 uso práctico de las TIC en la educación 2 2 0 2
Publicar indicador - Porcentaje de instituciones educativas con acceso a
Simple
53 laboratorios experimentales virtuales o plataformas educativas 2 2 0 2
Publicar indicador - Cantidad de kits de nuevas tecnologías basadas en RAEE
Simple
54 entregados en las sedes educativas. 2 2 0 2
Publicar indicador - Cantidad de terminales obsoletas retomadas de los
Simple
55 establecimientos educativos oficiales del país. 2 2 0 2
Publicar indicador - Cantidad (en toneladas) de Residuos electrónicos
Simple
56 dispuestos correctamente (demanufactura) 2 2 0 2
Publicar indicador - Cantidad de personas de la comunidad (educativa)
Simple
57 capacitados en la correcta disposición de residuos de aparatos eléctricos y 2 2 0 2
Total 76 0 57
27
Para realizar un refinamiento con una granularidad más fina, se usaron los
siguientes criterios para estimar las (horas – hombre) por casos de uso:
28
Tabla 9 Porcentajes de estimación etapas del proyecto
29
Tabla 11 Personal requerido
PERSONAL REQUERIDO
IMPLEMENTACIÓN DEL SM&E
Arquitecto de software
Arquitecto de datos
Desarrollador Senior
Desarrollador Senior
Desarrollador Junior
Desarrollador Junior
Desarrollador Junior
Desarrollador Junior
Líder de pruebas
Analista de pruebas Senior
Analista de pruebas Senior
Analista de pruebas Senior
Analista de pruebas Junior
Analista de pruebas Junior
Analista de pruebas Junior
Analista de sistemas
Analista de sistemas
Especialista en infraestructura
Especialista en infraestructura
Especialista en infraestructura
Gerente de proyectos
30908.51 (𝐻𝑜𝑟𝑎𝑠)
= 1471.833(𝐻𝑜𝑟𝑎𝑠/𝐻𝑜𝑚𝑏𝑟𝑒)
21 (𝐻𝑜𝑚𝑏𝑟𝑒)
30
183.97(𝐷𝑖𝑎𝑠 𝑙𝑎𝑏𝑜𝑟𝑎𝑙𝑒𝑠/ 𝐻𝑜𝑚𝑏𝑟𝑒)
= 9.19 (𝑀𝑒𝑠𝑒𝑠/𝐻𝑜𝑚𝑏𝑟𝑒)
20(𝐷𝑖𝑎𝑠 𝐿𝑎𝑏𝑜𝑟𝑎𝑙𝑒𝑠 𝑎𝑙 𝑚𝑒𝑠)
PERSONAL REQUERIDO
NOMBRE CANTIDAD TÍTULO OTROS CERTIFICACIONES EXPERIENCIA
DEL ROL PROFESIONAL ESTUDIOS REQUERIDAS PROFESIONAL
1 Ingeniero de Especializado Certificación Scrum Con
cualquiera de o Posgrado en Master y/o Product experiencia
las siguientes Arquitectura de Owner y/o Scrum mínima de
profesiones: software, Developer. cinco (5)
Sistemas o ingeniería de proyectos de
Electrónico o software, desarrollo de
Telemático o construcción sistema de
Ingeniería en de software o información,
Arquitecto de
tecnologías de afines. ejecutados y
software
la información y terminados o
las cinco (5) años
comunicaciones de experiencia
o Industrial, con en el cargo.
tarjeta o
matrícula
profesional
vigente.
1 Profesional en Especialización Certificaciones Con
estadística o o Posgrado en emitidas por entes experiencia
Arquitecto de informática o cualquiera de certificadores mínima de tres
datos ingeniería o las siguientes autorizados (3) proyectos
economía o áreas: Analítica nacionales o de analítica de
matemáticas o de Datos, internacionales en datos, o tres (3)
31
física o afines, Ciencia de cualquiera de las años de
con tarjeta o datos, siguientes áreas: experiencia en
matrícula Inteligencia Analítica de Datos, el cargo.
profesional Artificial, Ciencia de datos,
vigente. Inteligencia de Inteligencia Artificial,
Negocios, Big Inteligencia de
Data, Análisis Negocios, Big Data,
de datos o Análisis de datos o
afines. afines
2 Ingeniero de Certificación Scrum Con
cualquiera de Master y/o Product experiencia
las siguientes Owner y/o Scrum mínima de tres
profesiones: Developer. (3) proyectos
Sistemas o de desarrollo de
Electrónico o sistema de
Telemático o información,
Ingeniería en ejecutados y
Desarrollador
tecnologías de terminados o
Senior
la información y tres (3) años de
las experiencia en
comunicaciones el cargo.
o Industrial, con
tarjeta o
matrícula
profesional
vigente.
4 Ingeniero de Certificación Scrum Con
cualquiera de Master y/o Product experiencia
las siguientes Owner y/o Scrum mínima de un
profesiones: Developer. (1) proyecto de
Sistemas o desarrollo de
Electrónico o sistema de
Telemático o información,
Ingeniería en ejecutados y
Desarrollador
tecnologías de terminados o un
Junior
la información y (1) año de
las experiencia en
comunicaciones el cargo.
o Industrial, con
tarjeta o
matrícula
profesional
vigente.
1 Ingeniero de Certificación Scrum Con
cualquiera de Master y/o Product experiencia
las siguientes Owner y/o Scrum mínima de tres
profesiones: Developer. (3) proyectos
Líder de Sistemas o de desarrollo de
pruebas Electrónico o Adicional sistema de
Telemático o certificación ISTQB información,
Ingeniería en ejecutados y
tecnologías de terminados o
la información y tres (3) años de
32
las experiencia en
comunicaciones el cargo.
o Industrial, con
tarjeta o
matrícula
profesional
vigente.
3 Ingeniero de Certificación Scrum Con
cualquiera de Master y/o Product experiencia
las siguientes Owner y/o Scrum mínima de tres
profesiones: Developer. (3) proyectos
Sistemas o de desarrollo de
Electrónico o sistema de
Telemático o información,
Analista de Ingeniería en ejecutados y
pruebas tecnologías de terminados o
Senior la información y tres (3) años de
las experiencia en
comunicaciones el cargo.
o Industrial, con
tarjeta o
matrícula
profesional
vigente.
3 Ingeniero de Certificación Scrum Con
cualquiera de Master y/o Product experiencia
las siguientes Owner y/o Scrum mínima de un
profesiones: Developer. (1) proyecto de
Sistemas o desarrollo de
Electrónico o sistema de
Telemático o información,
Analista de Ingeniería en ejecutados y
pruebas tecnologías de terminados o un
Junior la información y (1) año de
las experiencia en
comunicaciones el cargo.
o Industrial, con
tarjeta o
matrícula
profesional
vigente.
2 Ingeniero de Certificación Scrum Con
cualquiera de Master y/o Product experiencia
las siguientes Owner y/o Scrum mínima de dos
profesiones: Developer. (2) proyecto de
Sistemas o desarrollo de
Analista de Electrónico o sistema de
sistemas Telemático o información,
Ingeniería en ejecutados y
tecnologías de terminados o
la información y dos (2) años de
las experiencia en
comunicaciones el cargo.
33
o Industrial, con
tarjeta o
matrícula
profesional
vigente.
3 Ingeniero de Certificación Scrum Con
cualquiera de Master y/o Product experiencia
las siguientes Owner y/o Scrum mínima de dos
profesiones: Developer. (2) años de
Sistemas o experiencia en
Electrónico o Adicional contar con el cargo.
Telemático o al menos una
Especialista Ingeniería en certificación técnica
en tecnologías de en PLATAFORMAS
infraestructura la información y CLOUD como AWS,
las AZURE o afines.
comunicaciones
o Industrial, con
tarjeta o
matrícula
profesional
vigente.
1 Ingeniero de Especializado Certificación PMP Con
cualquiera de o Posgrado experiencia
las siguientes Gerencia de adicional mínima de
profesiones: proyectos o certificación Scrum cinco (5)
Sistemas o Dirección de Master y/o Product proyectos de
Electrónico o proyectos o Owner y/o Scrum desarrollo de
Telemático o afines. Developer. sistema de
Ingeniería en información,
Gerente de
tecnologías de ejecutados y
proyectos
la información y terminados o
las cinco (5) años
comunicaciones de experiencia
o Industrial, con en el cargo.
tarjeta o
matrícula
profesional
vigente.
Este análisis se realiza sobre los riesgos previsibles, para la ejecución del proyecto
de implementación del sistema de monitoreo y evaluación para la innovación
educativa – SM&E, los riesgos se presentan tipificados, obedecen a riesgos a ser
considerados en proyectos de implementación de sistema de información.
34
Los riesgos identificados serán registrados en el Anexo 3 Matriz riesgos. La matriz
está diseñada incorporando la etapa de identificación de los riesgos con el código
que se le asignará, descripción, consecuencia y asignación del riesgo como se
muestra en la siguiente imagen:
35
Ilustración 4 Valoración del riesgo
ANÀLISIS
IDENTIFICACIÓN DEL RIESGO PLANES DE RESPUESTA
CUALITATIVO
Probabilidad del riesgo
Descripción del riesgo
Plan de Acción
de acción
Código
Tipo
36
1. Elaborar Plan de
trabajo.
1. Sobrecostos
2. Elaborar el Plan
para dar
de proyecto con
cumplimiento a
los recursos
los entregables
establecidos para
y/o metas
cada actividad.
Requerimientos establecidas del
3. Definir los
Operacional
Que la entidad
socialice y
Resistencia al sensibilice a su
Operacional
1. Resistencia al
cambio en la Computadores personal en el Computadores
cambio por
R2 apropiación del para educar 4 5 20 ALTO proyecto. para Educar
miembros de la
sistema de CPE CPE
organización.
información Implantar
estrategia de
gestión del cambio
1. Afectación en
Demoras en la
cumplimiento de Seguimiento a
Operacional
Que no se
incumplimiento Seguimiento
Operacional
37
Solicitud de
Operacional
Contratista Contratista
adicionales no Distorsión del General proceso
Computadores Computadores
R5 contemplados alcance del 2 5 10 MEDIO de control de
para Educar para Educar
en el alcance proyecto cambios
CPE CPE
del proyecto
1.Incumplimiento
en las entregas Exigir experiencia
Falta de
de las diferentes de contratistas y
Operacional
1.Cronogramas de
Adelantar las ejecución con
Operacional
Contratista Contratista
fechas de fechas y
Computadores Computadores
R7 entrega de los Baja calidad de 3 3 9 MEDIO responsables
para Educar para Educar
productos del los entregables
CPE CPE
proyecto 2.Plan de gestión
del proyecto
Baja calidad en
los productos de
Operacional
Pruebas
software. Planificar casos de
insuficientes
R8 Contratista 2 5 10 MEDIO pruebas del Contratista
del sistema de
Pérdidas de sistema
información
tiempo y
sobrecostos
Implementación
Operacional
38
Manejo
Operacional
Verificación previa
de los condiciones
en los que se
prestará el servicio
Situaciones de Presentar
No se satisface la
orden público o alternativas de
necesidad de Contratista Contratista
calamidad que ejecución del
Social
39
Crear mesas de
interoperabilidad
entre las
entidades
pertenecientes al
ecosistema de
No disponer de la
Entidades del innovación para
información
ecosistema de definir los detalles
requerida para Contratista Contratista
innovación semánticos,
realizar la Computadores Computadores
Operacional
40
evaluación para
innovación
educativa.
41
Ilustración 5 Diagrama de casos de uso Agente de monitoreo
42
Ilustración 6 Diagrama casos de uso componente Transaccional
43
Ilustración 7 Diagrama casos de uso componente Dashboard
44
MATRIZ RACI
SISTEMA DE MONITOREO Y EVALUACIÓN SM&E Roles y responsabilidades
Responsible, Accountable, Consulted, Informed
Administrador técnico de
Profesional de Monitoreo
Profesional de Monitoreo
Profesional de Monitoreo
Administrador funcional
Agente de servicio al
Profesional de apoyo
Profesional de apoyo
Profesional de apoyo
Profesional de apoyo
Lider del procesoo
Lider del proceso
de plataforma
y Evaluación.
y Evaluación.
y Evaluación.
plataforma
ROLES
cliente
Proceso de
Entidades del Gestión de
monitoreo y Servicio al Sostenibilidad Formación Gestión
Tarea OTI ecositema de soluciones
evaluación cliente ambiental educativa logística
innovación tecnológicas
CPE
Administración del sistema
Gestión de roles dentro del sistema A R
Gestión de usuarios del sistema R R A
Gestón de permisos A R
Soporte del sistema A R
45
Monitoreo de terminales
Instalar agente de monitoreo en la terminal de cómputo. I D A I R
Configurar monitoreo y sincronización de terminales de cómputo A D I I R
Consultar información de las terminales de cómputo A R
Adicionar terminal de cómputo a monitorear I D A I R
Bloquear terminal de cómputo I D I I R
Transaccional
Tabla 14 Matriz RACI modelo de operación.
Las rutinas deben entenderse en el contexto del sistema y son las actividades
frecuentes, encaminadas a capturar la información, cargarla en la herramienta de
administración del sistema SM&E, revisar la calidad de estas, generar reportes y
usar la información para la toma de decisiones. A continuación, se presenta a modo
de ejemplo las rutinas a ser consideradas en la operación del sistema.
Rutinas Descripción
Captura de Actividad recurrente de extracción de información, que se
información debe
realizar en los periodos o vigencias definidos en el sistema,
por medio de instrumentos de captura o encuestas.
46
Análisis y uso de la El grupo de monitoreo, la dirección de CPE y los miembros del
información para la ecosistema de innovación educativa, deben analizar los
toma de decisión avances y dificultades para tomar las decisiones pertinentes.
Sobre esta rutina se recomienda realizar las siguientes
actividades:
• Revisión del tablero de control: seguimiento al logro de metas
a través de indicadores.
• Revisión de los índices de innovación y evolución educativa:
complementa la información del tablero de control.
Objetivo: Monitorear el uso que los estudiantes, docentes y/o directivos docentes
de una sede educativa, le dan a la terminal de cómputo (portátil, computador de
escritorio o tableta) donada por Computadores Para Educar -CPE- o por otras
entidades pertenecientes al ecosistema e innovación educativa.
47
Ilustración 8 Flujograma del proceso Monitoreo de la terminal de cómputo
48
de datos de información referente a
especificaciones técnicas y uso de
la terminal.
3 Entregar terminal de cómputo.
Entidad del Entidad
De acuerdo con el procedimiento
ecosistema (que perteneciente al
oficial definido por cada entidad, se
entregará la ecosistema de
genera la entrega (donación) de la
terminal de innovación
terminal de cómputo a la sede
cómputo) educativa
educativa.
4 Distribuir internamente la
terminal de cómputo.
La terminal de cómputo es ubicada
en las instalaciones de la sede
Sede educativa Sede educativa
educativa según lo determine el
rector del establecimiento
educativo.
49
especificaciones técnicas y uso de
la terminal.
(Actividad periódica, según
configuración del instalador)
50
un elemento clave dentro de la arquitectura del sistema al que se denomina
interoperabilidad.
9
https://www.mintic.gov.co/arquitecturati/630/articles-9375_recurso_4.pdf
51
de seguridad que les permita controlar el acceso a los servicios web expuestos en
las capas de integración. Esta capa, además, encapsula los aspectos de seguridad
necesarios para el intercambio de datos distribuidos, garantizando así, la
confidencialidad, integridad e interoperabilidad entre las partes (proveedores y
consumidores).
Del lado derecho de la imagen, se ilustran las capas de infraestructura que debe
disponer Computadores para Educar – CPE - para compartir información con el
mundo exterior, estas son: la capa de seguridad y la capa de integración. Se aclara
que, los servicios que se expongan en la capa de integración podrán ser utilizados
y reutilizados por los sistemas de información internos (CPE), promoviendo así, un
estilo arquitectónico orientado a servicios.
52
10.6 Propuesta integral de los modelos de analítica aplicables, que definan
mecanismos o procedimientos de evaluación y despliegue, así como su
interacción con el sistema de información
53
Ilustración 10 Diagrama arquitectura de datos
Los orígenes de los datos están conformados por bases de datos relacionales,
archivos planos separados por comas, archivos Excel o representaciones XML o
JSON provenientes de servicios web. Los orígenes de datos pueden ser internos o
externos a Computadores para Educar - CPE. Las herramientas y servicios ETL
proveen variedad de conectores para vincular los orígenes de datos y extraer la
información requerida. Se debe garantizar que la herramienta o servicio
seleccionado para este proceso cuente mínimo con conectores para archivos CSV
y Excel; para bases de datos SQL Server, Azure SQL, MySQL, PostgreSQL y; para
protocolos genéricos como HTTP, OData, ODBC, JDBC y REST.
54
Para los procesos de extracción de información desde fuentes de autoridades
públicas como el Ministerio TIC o el Ministerio de Educación que hacen parte del
ecosistema de innovación educativa, se propone el esquema de interoperabilidad
basado en servicios web a través de protocolos HTTP/REST y hacer uso de la
plataforma X-Road® para establecer un intercambio de información en línea y
seguro.
En caso que las entidades externas no cuenten con servicios web ni con la
plataforma X-Road® habilitada, CPE debe establecer mecanismos alternos para
extracción de información tal como habilitar un servicio de transferencia de archivos
seguro (SFTP o FTPS) o aun mejor, una solución administrada para la transferencia
de archivos (Managed File Transfer – MFT) que pueda gestionar, monitorizar y
55
automatizar las transferencias de archivos CSV o Excel que reporten las entidades
para ser almacenadas en la bodega de datos del SM&E.
Se propone el uso de una base de datos intermedia para consolidar los datos desde
los sistemas origen y realizar su correspondiente preparación para, posteriormente,
hacer el cargue de estos a la bodega. Esta zona de stage o de preparación es
opcional y tiene una naturaleza transitoria, es decir que su contenido se borrará una
vez cumpla su objetivo. Sea o no que se decida la utilización de este espacio, es
necesario realizar las transformaciones necesarias sobre los datos utilizando los
componentes de tratamiento de datos que ofrecen herramientas o servicios ETL.
10
Proceso inverso al de aplicación de las formas normales en diseño de bases de datos.
http://informatica.uv.es/docencia/biblioguia/BD/ficheros/tema6.pdf
56
tableros de control asociados a cada una de las dimensiones de análisis definidas
en el modelo de monitoreo y evaluación.
57
Ilustración 12 Modelo estrella de encuestas
Este modelo contempla una tabla de hechos con la información diligenciada de las
encuestas docentes, y un conjunto de dimensiones sobre las cuales se puede filtrar
rápidamente la información.
58
El modelo que se presenta a continuación pertenece al almacén de datos que
resuelve las preguntas asociadas al dominio de formación.
Este modelo, contempla una tabla de hechos con los registros de las actividades de
formación impartida a la comunidad educativa, y un conjunto de dimensiones sobre
las cuales se puede filtrar rápidamente la información.
59
con el fin de realizar análisis sobre las actividades de formación y quienes fueron
beneficiados.
60
En este caso, se contempla una tabla de hechos con los inventarios de software
reportados por cada una de las terminales, y un conjunto de dimensiones sobre las
cuales se puede filtrar rápidamente la información.
Este almacén de datos permitirá consolidar la información que reportan los agentes
de monitoreo relacionadas con el inventario de software de cada una de las
terminales, permitiendo conocer variaciones en el software instalado o software que
no se esté utilizando en determinada sede educativa, entre muchas otras cosas.
61
Ilustración 15 Modelo estrella monitoreo hardware
Este modelo contempla una tabla de hechos con los inventarios de hardware
reportados por cada una de las terminales, y un conjunto de dimensiones sobre las
cuales se puede filtrar rápidamente la información.
Este almacén de datos permitirá consolidar la información que reportan los agentes
de monitoreo relacionadas con el inventario de hardware de cada una de las
terminales, permitiendo conocer por ejemplo variaciones en el hardware instalado
en una terminal.
62
10.6.1.3.5 Modelo sostenibilidad ambiental
La bodega de datos construida contiene otras tablas que apoyan los procesos de
consulta acorde a los indicadores y reportes requeridos, adicionalmente se diseñó
de manera que pueda crecer y evolucionar frente a nuevas necesidades de análisis.
63
A futuro, esta bodega de datos puede hacer parte de un data lake 11 para ampliar
las capacidades de análisis mediante la combinación de otros orígenes de datos
(incluso aquellos no estructurados) y el uso de técnicas avanzadas de big data.
Los procesos de ETL, son necesarios para poblar la bodega de datos, los datos
provenientes de sus orígenes pueden venir en diferentes formatos. Esta tarea es
posible realizarla de diversas maneras, sin embargo, se recomienda el uso de
herramientas o servicios especializados para esta actividad, como Azure Data
Factory y SQL Server Integration Services (SSIS), dada la variedad de conectores
con las fuentes de datos ofrecidos, las posibilidades de perfilamiento y limpieza de
datos y las capacidades de automatización en la carga de los datos finalmente a la
bodega. A continuación, se presenta una arquitectura sobre un proceso ETL que
va desde la ingesta de datos hasta llegar a su visualización:
Fuente: Microsoft
11Un data lake es un entorno de datos compartido en su formato original que comprende múltiples repositorios y aprovecha las
tecnologías de big data.
64
En este sentido, de acuerdo con el diagnóstico realizado en fases previas al diseño
y para mantener una homogeneidad tecnológica en Computadores para Educar -
CPE-, la arquitectura de referencia presentada en la figura 8 , resulta conveniente
para implementar un esquema ETL utilizando servicios de la nube de Microsoft,
comenzando desde las fuentes de datos en diferentes formatos, pasando por un
servicio de orquestación que transforma y carga los datos en la bodega de datos
para que, finalmente, servicios de análisis y visualización los puedan utilizar.
65
A continuación, se presenta un ejemplo de capacidades de transformación con
Azure Data Factory:
Fuente: Microsoft
Teniendo en cuenta que para poblar cada almacén de datos se va a requerir por lo
menos una ETL, los pasos sugeridos para llevar a cabo este proceso en Data
Factory son:
12
software de control de versiones. https://git-scm.com/
66
Los tipos de transformación soportados por este servicio son:
67
Nombre Categoría Descripción
Sort Row modifier Ordena las filas entrantes del flujo de datos actual.
• Exactitud / precisión
• Consistencia
• Oportunidad
• Relevancia
• Confianza
• Completitud
68
datos deben pasar con este conjunto de validaciones y transformaciones antes de
ingresar a la bodega de datos. Existe un tercer control sobre calidad que se puede
dar al momento de consultar la información, donde también es posible realizar
algunas acciones de transformación, pero deben ser las mínimas posibles.
13 https://openrefine.org/
14 https://datacleaner.org/
15 https://docs.microsoft.com/en-us/sql/data-quality-services/data-quality-services
69
• Cálculos sobre datos numéricos.
• Posibilidad de realizar correcciones masivas sobre los datos (reemplazo de
valores)
• Transformaciones personalizadas sobre los datos utilizando lenguajes de
script.
• Posibilidades de hacer unión de conjuntos de datos (merge o join)
70
Se recomienda que las visualizaciones que se implementen reflejen información
relevante y comprensible, seleccionando los indicadores y tipos de gráficos más
apropiados para cada situación.
16 https://colombiatic.mintic.gov.co/
71
diferentes datamarts a herramientas como Power BI 17o Tableu18, tal como lo ilustra
el siguiente ejemplo:
Ilustración 20 Conexión de Power BI con una fuente Azure SQL Data Warehouse
Fuente: Microsoft
17
https://powerbi.microsoft.com/es-es/
18
https://www.tableau.com/
72
Ilustración 21 Diseñador de informes Power BI
73
10.6.2 Modelo de analítica predictiva y prescriptiva
74
En cuanto a la fase 2, será necesario consolidar la Bodega de datos del SM&E y
poblarla con suficiente información histórica para que sea un insumo suficiente y
certero para el proceso de analítica predictiva.
Fuente: MathWorks
En este caso, el flujo de trabajo para la aplicación de análisis predictivo incluye los
siguientes pasos básicos:
75
1. Importar datos de varias fuentes, tales como archivos web, bases de datos,
hojas de cálculo. La bodega de datos ahorra gran parte de este paso, sin
embargo, será posible enriquecerse con nuevas fuentes en caso de ser
requerido.
2. Limpiar los datos mediante la eliminación de los valores atípicos y la
combinación de las fuentes de datos.
3. Es necesario identificar los picos de datos, los datos ausentes o los puntos
anómalos que se deben eliminar de los datos.
4. Desarrollar un modelo predictivo preciso basado en los datos agregados
mediante estadísticas, herramientas de ajuste de curvas o aprendizaje
automático.
La predicción es un proceso complejo con muchas variables, así que podría
utilizarse las redes neuronales para crear y entrenar un modelo predictivo.
En cuyo caso, sería necesario realizar varias iteraciones con el conjunto de
datos de entrenamiento para probar diversos enfoques. Una vez finalizado el
entrenamiento, se puede probar el modelo con datos nuevos para examinar
cómo se comporta.
5. Integrar el modelo en un sistema de predicción en un ambiente productivo.
Una vez localizado un modelo que pronostique lo deseado con precisión,
puede aplicarse en producción para poner los análisis a disposición en el sitio
web.
El análisis prescriptivo es una rama del análisis de datos que emplea modelos
predictivos para sugerir las acciones a realizar con el fin de obtener resultados
76
óptimos. Este tipo de análisis confía en la optimización y en las técnicas basadas
en reglas para tomar decisiones.
Fuente Gartner.
Para el SM&E se recomienda la cartera de productos para Azure ML, que incluye
Azure Machine Learning Studio, Azure Data Factory, Azure HDInsight, Azure
Databricks, Power BI y otros componentes. Para las cargas de trabajo locales,
Microsoft ofrece Machine Learning Server. Esta serie de servicios implementan
77
capacidades que están disponibles para su uso casi inmediato a diferencia de un
modelo de implementación tipo desarrollo a la medida desde cero que implicaría un
gran esfuerzo en tiempo para poder llegar a ver los primeros resultados, por lo cual
es recomendable hacer uso de servicios de computación en la nube que ofrezcan
este tipo de capacidades.
Fuente: Microsoft
78
Ilustración 26 Arquitectura de referencia y análisis avanzado
Fuente: Microsoft
79
Azure Databricks: Es una plataforma de análisis rápida, sencilla y colaborativa
basada en Apache Spark.
80
El implementador deberá tomar la bodega de datos del SM&E como la principal
fuente de información y crear modelos aprovechando lo mejor de los algoritmos
ofrecidos por el servicio de Azure y/o profundizando con códigos de R19 o Python20
si llega a ser necesario. Acorde a los escenarios identificados, se concluye que la
regresión lineal es un método de solución estadístico habitual y simple que resulta
apropiado cuando se busca la predicción de un objetivo numérico.
• Crear un modelo
Paso 1: obtener datos
Paso 2: Preprocesamiento de datos
Paso 3: Definir las características
• Entrenar el modelo
Paso 4: Seleccionar y aplicar un algoritmo de aprendizaje
Paso 5: Probar el modelo
• Desplegar y utilizar el modelo
Paso 6: predecir sobre nuevos datos
19 https://www.r-project.org/
20 https://www.python.org/
81
Ilustración 27 Pipeline Azure Machine Learning.
Después de ejecutar la evaluación del modelo, se debe revisar las salidas de datos
y logs como una primera forma de ver los resultados. Las métricas devueltas para
los modelos de regresión están diseñadas para estimar la cantidad de errores. Se
considera que un modelo se ajusta a los datos correctamente si la diferencia entre
los valores observados y los previstos es pequeña. Pero el patrón de los valores
residuales (la diferencia entre un punto previsto y su valor real correspondiente)
puede indicarle mucho sobre el sesgo potencial en el modelo.
82
• Error medio absoluto (MAE): mide la proximidad de las predicciones con
respecto a los resultados reales; por lo tanto, cuanto menor es la puntuación,
mejor.
• Error cuadrático medio (RMSE): crea un valor único que resume el error en
el modelo. Al elevar al cuadrado la diferencia, la métrica no tiene en cuenta
la diferencia entre un exceso o un defecto de predicción.
• Error absoluto relativo (RAE): es la diferencia absoluta relativa entre los
valores esperados y los reales; es relativa porque la diferencia media se
divide por la media aritmética.
• Error cuadrático relativo (RSE): del mismo modo, normaliza el error
cuadrático medio total de los valores previstos dividiendo entre el total de
errores al cuadrado de los valores reales.
• Coeficiente de determinación: a menudo conocido como R 2, representa la
eficacia predictiva del modelo como un valor entre 0 y 1. Cero significa que
el modelo es aleatorio (no explica nada); 1 significa que hay un ajuste
perfecto. Pero hay que tener precaución al interpretar los valores de R 2, ya
que los valores bajos pueden ser completamente normales y los valores altos
pueden ser sospechosos.
83
10.6.3 Arquitectura de despliegue
84
En el diagrama se identifican los siguientes elementos:
Componente Descripción
85
analítica avanzada, tales, como los presentados en la
arquitectura de referencia de Microsoft Azure.
Firew all
86
Tabla 17 Propuesta de implementación
21
https://azure.microsoft.com/es-es/pricing/details/app-service/windows/
22
https://azure.microsoft.com/es-es/pricing/details/api-management/
87
4 vCores
Azure SQL Database y servicio
16 GB RAM
Servidor BD de almacenamiento de copias de
250 GB almacenamiento
seguridad.
ANS sugerido 99.9%
Servidor SMTP con servicio de
envío de correos masivo para
comunicaciones dirigidas a la
comunidad educativa. Se puede
Servidor de
hacer uso del servicio de correo ANS sugerido 98.5%
correo
actual de CPE para audiencias
pequeñas23 pero para audiencias
grandes se recomienda un
servicio especializado.
Servidor de transferencia de
Soporte protocolo SFTP
Servidor archivos Seguro para disponer allí
500 GB de almacenamiento
SFTP archivos que requieran ser
ANS 98.5%
cargados a la bodega.
Instancia en modalidad
Azure Data Factory v2 Data
como servicio:
pipeline puede ser empleado para
8 vCores
Servidor ETL automatizar los procesos de
16 GB RAM
extracción, transformación y
40 GB En disco
carga a la bodega
ANS sugerido 98.5%
Hardware Gen 5
Azure SQL DW / Azure Synapse
8 vCore
Servidor Analytics para soportar el
20 GB en RAM
DWH almacenamiento y consultas
500 GB de almacenamiento
sobre la bodega de datos
ANS 99.95%
Power BI y otros servicios de
CPU 4 núcleos 2.0GHz x64
analítica avanzada para reportes,
6 GB RAM
Servidor BI cuadros de mando y demás
10 GB libres disco duro
formas de consulta y
ANS 98.5%
visualización.
Azure Blob Storage para
Servidor de almacenar datos no estructurados Modalidad como servicio.
archivos como archivos PDF, Word o ANS 98.5%
imágenes.
23
Límites de Exchange: https://docs.microsoft.com/es-es/office365/servicedescriptions/exchange-online-
service-description/exchange-online-limits?redirectedfrom=MSDN
88
Como se puede observar, esta propuesta hace uso de los servicios de la Nube de
Azure y se propone unas características técnicas mínimas para iniciar la operación,
las cuales deberán ser ajustadas acorde al crecimiento y al plan de capacidad
tecnológica que se establezca para la Solución, esto aprovechando la característica
de elasticidad que ofrece el modelo de servicios en la nube. La selección de
infraestructura deberá contemplar máquinas bajo arquitectura de 64 bits y con
componentes y servicios de red que tengan soporte dual IPv4/IPv6.
89
11. Capacitaciones
Para las capacitaciones se trazó una estrategia para garantizar una compresión y
apropiación por parte del personal de Computadores para Educar -CPE-, de los
temas y productos generados durante la ejecución del proyecto. Para lo cual se
realizaron sesiones con componentes de familiarización e interiorización.
Familiarización
Interiorización
Tomando en consideración los resultados obtenidos en la etapa anterior, se
ejecutaron las principales acciones de capacitación, y se profundizara en los temas
identificados con mayores vacíos en la familiarización, obteniendo un aprendizaje
significativo individual y apropiación de los temas tratados.
Sesiones realizadas
No. Tiempo de la
Fecha Temas tratados
Sesiones sesión
Estructuración y especificación de casos de uso:
90
7. Espectro de la Analítica
8. Como Iniciar - Gobierno
9. Contexto Estratégico
1. Técnicas de exploración
2. Análisis estadístico
3. A/B Testing
4. Correlación
5. Regresión
6. Machine Learning
7. Clasificación
8. Clustering
9. Filtros
1. Integración de datos
2. Requerimientos de datos
3. Data profiling
4. Data Integration workflow
Toma de decisiones:
91
1. Arquitectura técnica
2. Enterprise Data Warehouse
3. Data Architecture workflow
4. BI Data Architecture
5. Data Information
6. Data Integration
7. Data Preparation
8. Analytical Data
Exploración de datos:
1. Técnicas de exploración
2. Análisis estadístico
3. A/B Testing
4. Correlación
5. Regresión
6. Machine Learning
7. Clasificación
8. Clustering
9. Filtros
12. Recomendaciones
92
• Extenso tiempo del proceso de contratación entre la fase de diseño e
implementación puede generar desactualización de la información y pérdida de
relevancia del proyecto respecto a los objetivos estratégicos de Computadores
para Educar -CPE-.
93
12.1.1 Recomendaciones desarrollo módulo de agente de monitoreo y
evaluación
94
12.1.2 Recomendaciones desarrollo módulo de encuestas
95
✓ Exponer los datos resultados de las encuestas para que puedan ser
capturados por los procesos ETL que los llevarán hasta la bodega de
datos.
24 https://html.spec.whatwg.org/
25 https://www.w3.org/Style/CSS/specs.en.html
26 https://angular.io/
27 https://nodejs.org/es/
28 https://es.reactjs.org/
29 https://azure.microsoft.com/es-es/services/sql-database/
30 https://ionicframework.com/
31 https://flutter.dev/
32 https://www.sqlite.org/index.html
96
En cuanto a requisitos o capacidades del dispositivo móvil se recomienda
mínimo:
✓ Teléfono inteligente o tableta con una resolución de pantalla de 320x480
píxeles o más.
✓ Tamaño de pantalla de 6”
✓ 100 MB de espacio libre en la memoria principal del dispositivo.
✓ 10 GB libres de almacenamiento
✓ Sistema operativo Android o IOS reciente
✓ Quad core 1.6GHz
✓ 4GB Memoria RAM
Aun así, se deben realizar las mediciones necesarias para ajustar los
requerimientos de hardware asociados al dispositivo móvil que garanticen el
funcionamiento y rendimiento apropiado de la solución una vez
implementada la solución.
97
• Se recomienda aislar las funcionalidades de auditoría en servicios con un
esquema de bases de datos diferente al resto de las tablas de administración
y con perfiles independientes al administrador técnico o funcional del sistema,
esto con el fin de prevenir consultas o modificaciones no autorizadas sobre
las trazas de auditoría.
33 https://patterns.arcitura.com/
98
flexibilidad en las consultas y funcionen de manera autogestionada de
manera que los analistas puedan sacar el mejor provecho de la información
almacenada en la bodega.
99
factores que influyen ampliamente en cómo los encuestados interpretarán las
preguntas.
• Solo utilizar preguntas cerradas. Esto con el fin de facilitar el análisis de
información.
• Sólo incluir preguntas cuyos resultados serán utilizados realmente para algo
que genere valor. Para esto la entidad puede analizar cuáles de las preguntas
y respuestas recolectadas en vigencias anteriores se utilizan como insumo
para algún proceso de análisis o simplemente se recolecta la información,
pero nunca se utiliza.
• Contrastar cuál información ya ha sido previamente recolectada por otra
entidad para evitar preguntar varias veces lo mismo. Buscar mecanismos
con dichas entidades para compartir la información.
• Aprovechar la tecnología y las fuentes de datos disponibles para incluir
controles de validación que minimicen la posibilidad de errores en la captura
de información.
• Informar a los usuarios sobre el tratamiento de los datos recolectados y
solicitar su autorización cuando sea requerido acorde a la Ley colombiana.
• Revisar los cuestionarios antes de enviarlos y hacer mediciones sobre el
diligenciamiento de las encuestas para determinar posibles problemas de
usabilidad, complejidad, ambigüedad, tiempos o cualquier otra variable que
sea susceptible de optimización.
• Es recomendable que exista algún incentivo para el encuestado que lo motive
a diligenciar la encuesta de manera objetiva, responsable y en los tiempos
planeados.
• Hacer uso de los agentes de monitoreo u otros mecanismos de
interoperabilidad entre sistemas de información para extraer o complementar
información de manera automática.
100
13. Anexos
101