Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Entrega 1
Entrega 1
Alumnos
ASIGNATURA
Las compras públicas en Colombia estan regidas por el Estatuto General de Contratación Pública y
sus normas concordantes, las cuales han establecido la obligatoriedad, particularmente el artículo
2.2.1.1.1.6.1 del Decreto 1082 de 2015, a las Entidades Estatales de realizar un análisis para
conocer el sector respectivo al objeto a contratar desde la perspectiva legal, comercial, financiera,
organizacional, técnica y de análisis de riesgos, es decir, que las entidades del Estado deben
realizar un estudio con el fin de identificar la demanda y la oferta del objeto a contratar.
El rendimiento del proceso de minería de datos se considera exitoso cumpliendo los plazos
establecidos para el estudio y con el ahorro de tiempo en la estructuración del análisis de
demanda y oferta a las entidades del Estado, que permita optimizar la inversión de tiempo en
etapas como la planeación de los procesos de contratación y, por ende, lograr con tiempos de
ejecución más amplios, lo cual genera un valor agregado para las entidades ejecutoras de
presupuesto público.
La problemática actual para realizar el estudio del sector es la complejidad y demoras en tiempos
en la materialización del análisis, teniendo en cuenta que se están realizando mediante la consulta
uno a uno, por medio de la consulta al ciudadano de la plataforma SECOP II, consulta secop II y
donde se evidencian que solo utilizan hasta 10 contratos para realizar dichos análisis.
1.2.4 Terminología
1.2.5 Análisis de costes/beneficios
Al completar el objetivo comercial del proyecto se disminuyen los tiempos de análisis de
oferta y demanda y aumentaría la cantidad de estudios del sector que se producirían para
las entidades del Estado que soliciten el servicio, a su vez, eso daría resultados más
efectivos y productos de mayor calidad a los que se presentan actualmente dando una
mayor credibilidad y profesionalismo a la empresa.
La disminución en los tiempos en la realización de los productos de análisis, hace que la
empresa, WS INGENIERIA SAS, pueda abarcar mayor cantidad de solicitudes de servicios
de minería de datos en esta área y aumentaría la productividad que se traducirá en
mayores utilidades para la empresa.
1.3 Determinación de los objetivos de minería de datos
Teniendo en cuenta el objetivo comercial del proyecto de minería de datos los objetivos de la
minería de datos son los siguientes:
SEMANAS
FASE RECURSOS 1 2 3 4 5 6 7 8
COMPRENSION DEL NEGOCIO ANALISTA MINERIA
COMPRENSION DE LOS DATOS ANALISTA MINERIA
PREPARACION DE LOS DATOS ANALISTA MINERIA
MODELADO ANALISTA MINERIA
EVALUACION ANALISTA MINERIA
DISTRIBUCION ANALISTA MINERIA
Tabla 1 plan de trabajo proyecto de minería
Información de acceso
https://www.datos.gov.co/Gastos-
Enlace de acceso Gubernamentales/SECOP-II-Contratos-
Electr-nicos/jbjy-vk9h
Información de la Entidad
Área o dependencia Subdirección de IDT
Agencia Nacional de Contratación Pública
Nombre de la Entidad
Colombia Compra Eficiente
Departamento Bogotá D.C.
Municipio Bogotá D.C.
Orden Nacional
Sector Planeación
Información de Datos
Idioma Español
Cobertura Geográfica Nacional
Frecuencia de Actualización Diaria
Fecha Emisión (aaaa-mm-dd) 1/10/2019
Temas
Categoría Gastos Gubernamentales
procesos de contratación,compra
Etiquetas
pública,contratos,secop
Licencia y atribución
Licencia
1 Datos nominales: El nivel de medición más débil que representa categorías sin
representación numérica.
2 Datos ordinales: Datos en los que es posible ordenar o clasificar las respuestas, pero
no es posible medir la distancia.
3 Datos de intervalo: En general, datos enteros en los que se pueden realizar
mediciones de pedidos y distancias.
4 Datos de relación: datos en los que es posible el ordenamiento significativo, distancia,
decimales y fracciones entre variables
Variable Escala
Nombre Entidad Relación
Nit Entidad Nominal
Departamento Relación
Ciudad Relación
Localización Relación
Orden Relación
Variable Escala
Sector Relación
Rama Relación
Entidad Centralizada Relación
Proceso de Compra Nominal
ID Contrato Nominal
Referencia del Contrato Nominal
Estado Contrato Relación
Codigo de Categoria Principal Relación
Descripcion del Proceso Nominal
Tipo de Contrato Relación
Modalidad de Contratacion Relación
Justificacion Modalidad de Contratacion Ordinal
Fecha de Firma Ordinal
Fecha de Inicio del Contrato Ordinal
Fecha de Fin del Contrato Ordinal
Fecha de Inicio de Ejecucion Nominal
Fecha de Fin de Ejecucion Nominal
Condiciones de Entrega Nominal
TipoDocProveedor Relación
Documento Proveedor Nominal
Proveedor Adjudicado Nominal
Es Grupo Nominal
Es Pyme Nominal
Habilita Pago Adelantado Nominal
Liquidación Nominal
Obligación Ambiental Nominal
Obligaciones Postconsumo Nominal
Reversion Nominal
Valor del Contrato Intervalo
Valor de pago adelantado Nominal
Valor Facturado Nominal
Valor Pendiente de Pago Nominal
Valor Pagado Nominal
Valor Amortizado Nominal
Valor Pendiente de Amortizacion Nominal
Valor Pendiente de Ejecucion Nominal
Estado BPIN Nominal
Código BPIN Nominal
Anno BPIN Nominal
Saldo CDP Nominal
Saldo Vigencia Nominal
EsPostConflicto Nominal
URLProceso Nominal
Destino Gasto Ordinal
Origen de los Recursos Ordinal
Dias Adicionados Nominal
Puntos del Acuerdo Nominal
Pilares del Acuerdo Nominal
Nombre Representante Legal Nominal
Nacionalidad Representante Legal Nominal
Tipo de Identificación Representante Legal Nominal
Identificación Representante Legal Nominal
Género Representante Legal Nominal
Presupuesto General de la Nacion – PGN Nominal
Sistema General de Participaciones Nominal
Sistema General de Regalías Nominal
Recursos Propios (Alcaldías, Gobernaciones y
Nominal
Resguardos Indígenas)
Recursos de Credito Nominal
Recursos Propios Nominal
Ultima Actualizacion Nominal
Codigo Entidad Ordinal
Variable Escala
Fecha Inicio Liquidacion Nominal
Fecha Fin Liquidacion Nominal
Codigo Proveedor Ordinal
Objeto del Contrato Nominal
Tabla 4 tabla de categorización de variables
Del cuadro anterior se puede definir que hay 2.482.856 registros que en promedio de valor es de $
66.880.329.107,09
Modalidad N
CCE-19-Concurso_Meritos_Con_Lista_Corta_1Sobre 3
CCE-20-Concurso_Meritos_Sin_Lista_Corta_1Sobre 3.159
Concurso de méritos abierto 4.965
Concurso de méritos con precalificación 1
Contratación directa 1.889.553
Contratación Directa (con ofertas) 45.522
Contratación régimen especial 290.638
Contratación régimen especial (con ofertas) 20.612
Enajenación de bienes con sobre cerrado 152
Enajenación de bienes con subasta 94
Licitación pública 7.632
Licitación Pública Acuerdo Marco de Precios 1.245
Licitación pública Obra Publica 4.515
Mínima cuantía 157.062
No Definido 4.587
Selección Abreviada de Menor Cuantía 28.010
Seleccion Abreviada Menor Cuantia Sin Manifestacion Interes 695
Selección abreviada subasta inversa 24.411
N total 2.482.856
Min 1
Max 1.889.553
Media 137.936
Desviación 443.322
Tabla 6 análisis estadístico inicial campo modalidad
Ilustración 2 análisis estadístico inicial campo modalidad
En el análisis inicial anterior se encuentra en modalidad un segmento “no definido” que evidencia
una inconsistencia y 4.587 datos que no están tipificados en modalidad y que ponen en riesgo el
análisis de los datos en esta segmentación.
Departamento N
Amazonas 2.099
Antioquia 197.060
Arauca 10.266
Atlántico 79.259
Bolívar 59.360
Boyacá 45.501
Caldas 37.896
Caquetá 11.246
Casanare 27.859
Cauca 33.216
Cesar 23.059
Chocó 12.484
Córdoba 15.531
Cundinamarca 82.566
Departamento N
Guainía 1.103
Guaviare 1.964
Huila 39.771
La Guajira 10.253
Magdalena 30.298
Meta 50.155
Nariño 35.807
No Definido 11.342
Putumayo 13.690
Quindío 44.100
Risaralda 50.417
San Andrés, Providencia y Santa
19.953
Catalina
Santander 110.214
Sucre 21.965
Tolima 64.815
Vaupés 688
Vichada 4.529
N Total 2.482.856
Min 688
Max 1.038.264
Media 73.025
Desviacion 178.376
Tabla 7 análisis estadístico inicial campo departamento
Ilustración 3 análisis estadístico inicial campo departamento
3 PREPARACIÓN DE DATOS
Con el fin de realizar preparación y limpieza de datos se pretende realizar las siguientes acciones:
3.1 Selección de los datos
Teniendo en cuenta que el conjunto de datos contiene 71 campos, se procede a seleccionar las
columnas que se necesiten tanto para los objetivos comerciales como los objetivos principales y
específicos del proyecto y el ejercicio de análisis de datos, su selección se representa en el
siguiente cuadro: