Está en la página 1de 87

UNIVERSIDAD DE CHILE

FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS


DEPARTAMENTO DE INGENIERÍA CIVIL

PREDICCIÓN DE LAS VARIACIONES DE COSTOS PARA PROYECTOS


DE CONSTRUCCIÓN UTILIZANDO REDES NEURONALES

MEMORIA PARA OPTAR AL TÍTULO DE INGENIERO CIVIL

MATÍAS EDUARDO JORY RUBILAR

PROFESOR GUÍA:
WILLIAM WRAGG LARCO

MIEMBROS DE LA COMISIÓN:
CARLOS AGUILERA GUTIÉRREZ
RAÚL GOUET BAÑARES

SANTIAGO DE CHILE
NOVIEMBRE 2007
RESUMEN DE LA MEMORIA
PARA OPTAR AL TITULO DE
INGENIERO CIVIL
POR: MATÍAS JORY R.
FECHA: 23/10/2007
PROF. GUIA: Sr. WILLIAM WRAGG L.

“PREDICCIÓN DE LAS VARIACIONES DE COSTOS PARA


PROYECTOS DE CONSTRUCCIÓN UTILIZANDO REDES
NEURONALES”

El objetivo general de este trabajo de título es estudiar el uso de redes neuronales


artificiales en la industria de la construcción. Más específicamente, se desarrolló un modelo
cuyo propósito es estimar las variaciones de costos en una construcción habitacional en altura.
Con el fin de tener un punto de comparación se realizaron los mismos modelos en regresión
lineal múltiple.

Adicionalmente se generaron dos modelos más, uno para predecir el costo


presupuestado de un edificio en una etapa de evaluación de proyectos y otro para predecir las
variaciones de plazo de un proyecto.

Para conseguir la base de datos se realizó una encuesta distribuida entre más de 20
profesionales de obra de distintas empresas. Mediante herramientas estadísticas se eligieron
las mejores variables para los distintos modelos. Una vez realizado cada modelo se estudió la
incidencia de cada variable en el problema y se ejecutó una validación cruzada para
determinar el real nivel de representatividad de los mejores modelos.

Los resultados arrojan dos modelos coherentes para la predicción de variaciones de


costos no así para las variaciones de plazo, problema que al parecer no puede ser modelado
por las variables que posee la encuesta. Ambos modelos no son excluyentes por lo que se
pueden utilizar de manera simultánea.

Se concluye que es factible realizar una predicción de las variaciones de costos ya que
para el caso de construcciones habitacionales en altura, la industria muestra una
estandarización de sus procesos constructivos bastante avanzada. También se concluye que la
inclusión de nuevas tecnologías de gestión que ayudan a la toma de decisiones es un paso
serio en el mercado competitivo de hoy en día. Al final se recomiendan algunas
consideraciones para estudios posteriores.

ii
INDICE DE TEMAS:

1. INTRODUCCIÓN............................................................................................................1

2. MARCO TEÓRICO.........................................................................................................3

2.1. BREVE DESCRIPCIÓN DE LA INDUSTRIA DE LA CONSTRUCCIÓN EN CHILE Y MOTIVACIÓN


PARA ESTE ESTUDIO. ........................................................................................................................... 3
2.1.1. Problemas con el cumplimiento de la planificación de una obra................................. 4
2.2. SOLUCIÓN PROPUESTA: ANÁLISIS DE DATOS Y UTILIZACIÓN DE TÉCNICAS MODERNAS DE
GESTIÓN. ............................................................................................................................................. 6
2.2.1. Análisis de datos usando Estadística. ........................................................................... 7
2.2.2. Redes Neuronales Artificiales como herramienta de gestión. ...................................... 8
2.3. REDES NEURONALES ARTIFICIALES. ...................................................................................... 9
2.3.1. Introducción. ................................................................................................................. 9
2.3.2. Características de las Redes Neuronales Artificiales R.N.A....................................... 11
2.3.3. Elementos Básicos....................................................................................................... 11
2.3.3.1 Neuronas. ................................................................................................... 11
2.3.3.2 Función de Entrada. .................................................................................... 12
2.3.3.3 Función de Activación o de Transferencia. .................................................... 12
2.3.4. Arquitectura de una Red Neuronal. ............................................................................ 15
2.3.5. Operación de las R.N.A: Aprendizaje y Generalización............................................. 16
2.3.5.1 Fase de Aprendizaje. ................................................................................... 16
2.3.5.2 Fase de Generalización. .............................................................................. 17
2.3.6. Regla LMS para aprendizaje supervisado. ................................................................. 17
2.3.7. Aprendizaje por retropropagación de errores (Backpropagation)............................. 19
2.3.8. Ventajas de las R.N.A.................................................................................................. 20

3. METODOLOGÍA...........................................................................................................21

3.1. MODELOS A REALIZAR.......................................................................................................... 21


3.1.1. Modelos para estimar el costo presupuestado de un proyecto de construcción......... 22
3.1.2. Modelos para estimar la variación de costo y plazo. ................................................. 22
3.2. INFORMACIÓN SOBRE PROYECTOS DE CONSTRUCCIÓN......................................................... 23
3.2.1. Encuesta. ..................................................................................................................... 24
3.2.1.1 Antecedentes Generales. .............................................................................. 24
3.2.1.2 Calidad y Experiencia. ................................................................................ 26
3.2.1.3 Información Desarrollo Proyecto. ................................................................. 27
3.2.1.4 Programación y Control. ............................................................................. 28
3.2.1.5 Datos Finales. ............................................................................................ 29
3.3. RECOLECCIÓN Y ANÁLISIS DE DATOS. .................................................................................. 29
3.4. MODELO QUE ESTIMA EN ORDEN DE MAGNITUD EL PRESUPUESTO DE UN PROYECTO DE
CONSTRUCCIÓN. ................................................................................................................................ 31
3.4.1. Modelo de Regresión Lineal Múltiple......................................................................... 31
3.4.2. Modelo basado en R.N.A............................................................................................. 36

iii
3.5. MODELO QUE ESTIMA LA VARIACIÓN DE COSTOS DE UN PROYECTO DE CONSTRUCCIÓN..... 40
3.5.1. Modelo de Regresión Lineal Múltiple......................................................................... 40
3.5.2. Modelo de R.N.A. ........................................................................................................ 44
3.6. MODELO QUE ESTIMA EL PLAZO REAL DE UN PROYECTO DE CONSTRUCCIÓN...................... 46
3.6.1. Modelo de Regresión Lineal Múltiple......................................................................... 46
3.6.2. Modelo de R.N.A. ........................................................................................................ 47

4. ANÁLISIS DE RESULTADOS.....................................................................................48

4.1. COMPARACIÓN DE RESULTADOS........................................................................................... 48


4.1.1. Modelos que estiman un orden de magnitud del presupuesto..................................... 48
4.1.2. Modelo que estima la variación de costos. ................................................................. 52
4.1.3. Modelo que estima el plazo real de construcción ....................................................... 56
4.2. VALIDACIÓN CRUZADA DEL MODELO DE VARIACIÓN DE COSTOS ........................................ 58
4.2.1. Resultado validación cruzada ..................................................................................... 58
4.2.2. Determinación del mejor modelo................................................................................ 59
4.3. COMENTARIOS DEL CAPÍTULO .............................................................................................. 64

5. COMENTARIOS Y CONCLUSIONES.......................................................................68

6. ANEXO A........................................................................................................................70

7. ANEXO B ........................................................................................................................78

7.1. DEFINICIONES ....................................................................................................................... 78


7.2. SELECCIÓN DE VARIABLES .................................................................................................... 78

8. BIBLIOGRAFÍA ............................................................................................................80

iv
INDICE DE TABLAS

TABLA 2.1 VALORES ESTIMADOS DE LA EXACTITUD ESPERADA DE LOS TIPOS DE


ESTIMACIONES ......................................................................................................... 4
TABLA 3.1ANTECEDENTES GENERALES ....................................................................... 26
TABLA 3.2 CALIDAD Y EXPERIENCIA ........................................................................... 27
TABLA 3.3 INFORMACIÓN DESARROLLO PROYECTO ................................................... 28
TABLA 3.4 PROGRAMACIÓN Y CONTROL ..................................................................... 29
TABLA 3.5 DATOS FINALES ........................................................................................... 29
TABLA 3.6 VALORES DESCRIPTIVOS DE LAS VARIABLES CUANTITATIVAS MÁS
IMPORTANTES PARA TODOS LOS PROYECTOS. .................................................... 30
TABLA 3.7 VALORES DESCRIPTIVOS DE LAS VARIABLES CUALITATIVAS MÁS
IMPORTANTES PARA TODOS LOS PROYECTOS. .................................................... 30
TABLA 3.8 VALORES DESCRIPTIVOS DE LA VARIACIÓN DE COSTOS Y PLAZOS ........ 30
TABLA 3.9 ALTERNATIVAS A REALIZAR CON R.L.M Y R.N.A. ..................................... 34
TABLA 3.10 ALTERNATIVAS A REALIZAR CON R.L.M Y R.N.A. ................................... 41
TABLA 3.11 CONFIGURACIONES DE LAS DISTINTAS ALTERNATIVAS REALIZADAS .. 44
TABLA 3.12 CONFIGURACIONES PARA LA ALTERNATIVA ELEGIDA ........................... 47
TABLA 4.1 DATOS PARA TESTEAR LA EXACTITUD DE LAS ESTIMACIONES............... 48
TABLA 4.2 RESULTADOS ALTERNATIVA 1 ................................................................... 48
TABLA 4.3 RESULTADOS ALTERNATIVA 2 ................................................................... 49
TABLA 4.4 RESULTADOS ALTERNATIVA 3 ................................................................... 50
TABLA 4.5 RESULTADOS ALTERNATIVA 4 ................................................................... 50
TABLA 4.6 RESULTADOS ALTERNATIVA 5 ................................................................... 51
TABLA 4.7 DATOS PARA TESTEAR LA EXACTITUD DE LAS ESTIMACIONES............... 53
TABLA 4.8 RESULTADOS ALTERNATIVA 1 VARIACIÓN DE COSTOS ........................... 53
TABLA 4.9 RESULTADOS ALTERNATIVA 2 VARIACIÓN DE COSTOS ........................... 54
TABLA 4.10 RESULTADOS ALTERNATIVA 3 VARIACIÓN DE COSTOS .......................... 55
TABLA 4.11 RESULTADOS ALTERNATIVA 4 VARIACIÓN DE COSTOS .......................... 55
TABLA 4.12 DATOS PARA TESTEAR LA EXACTITUD DE LAS ESTIMACIONES ............. 57
TABLA 4.13 RESULTADOS VARIACIÓN DE PLAZO ........................................................ 57
TABLA 4.14 ECM PARA VALIDACIONES DE LA ALTERNATIVA 2 ................................. 59
TABLA 4.15 ECM PARA VALIDACIONES DE LA ALTERNATIVA 3 ................................. 59
TABLA 4.16 PROYECTOS USADOS PARA VALIDACIÓN DE MODELOS.......................... 59
TABLA 4.17 ESTIMACIONES PROYECTO 1 PARA TÉCNICA DE RLM ............................. 60
TABLA 4.18 ESTIMACIONES PROYECTO 1 PARA TÉCNICA DE RNA ............................. 61
TABLA 4.19 ESTIMACIONES PROYECTO 2 PARA TÉCNICA DE RLM ............................. 62
TABLA 4.20 ESTIMACIONES PROYECTO 2 PARA TÉCNICA DE RNA ............................. 63
TABLA 4.21 PROMEDIO DE ESTIMACIONES PARA EL PROYECTO 1 ............................. 66
TABLA 4.22 PROMEDIO DE ESTIMACIONES PARA EL PROYECTO 2 ............................. 66
TABLA 4.23 ECM DE LAS ESTIMACIONES OBTENIDAS EN LA VALIDACIÓN, MODELO 1
................................................................................................................................ 66
TABLA 4.24 ECM PARA EL MODELO 2 ........................................................................... 67
TABLA 4.25 COMPARACIÓN DE ECM POR TÉCNICAS Y MODELOS .............................. 67
TABLA 6.1 PROYECTOS USADOS PARA GENERAR LOS DISTINTOS MODELOS ............ 70

v
INDICE DE FIGURAS

FIGURA 2.1 PROCESADOR ELEMENTAL O NEURONA ................................................... 12


FIGURA 2.2 FUNCIÓN LOGÍSTICA.................................................................................. 13
FIGURA 2.3 FUNCIÓN LINEAL ....................................................................................... 13
FIGURA 2.4 FUNCIÓN TANGENTE HIPERBÓLICA .......................................................... 14
FIGURA 2.5 FUNCIÓN GAUSSIANA ................................................................................ 14
FIGURA 2.6 FUNCIÓN COMPLEMENTO DE GAUSSIANA................................................ 15
FIGURA 2.7 ARQUITECTURA DE UNA RED NEURONAL ARTIFICIAL ............................ 15
FIGURA 2.8 SUPERFICIE DE ECM ................................................................................... 18
FIGURA 2.9 MÉTODO DEL DESCENSO POR GRADIENTE PARA UNA RED DE UNA
NEURONA ............................................................................................................... 19
FIGURA 2.10 MÉTODO DEL DESCENSO POR GRADIENTE PARA UNA RED MULTICAPA
................................................................................................................................ 19
FIGURA 3.1 BASE DE DATOS EN SPSS ........................................................................... 31
FIGURA 3.2 PASOS PARA LA REGRESIÓN MÚLTIPLE ................................................... 32
FIGURA 3.3 ELECCIÓN DE LAS VARIABLES INDEPENDIENTES Y DEPENDIENTE ........ 32
FIGURA 3.4 OUTPUT CON LOS RESULTADOS ................................................................ 33
FIGURA 3.5 PROCESO DE ETIQUETADO DE DATOS ...................................................... 36
FIGURA 3.6 ELECCIÓN DE TIPO DE RED ....................................................................... 37
FIGURA 3.7 DETERMINACIÓN DE NEURONAS CAPA OCULTA...................................... 38
FIGURA 3.8 DETERMINACIÓN DEL NÚMERO DE EPOCHS, AL MOMENTO DE
ENTRENAR UNA RED.............................................................................................. 38
FIGURA 3.9 ENTRENAMIENTO DE LA RED .................................................................... 39
FIGURA 3.10 TESTEO DE LA RED................................................................................... 39
FIGURA 3.11 ECM VS. EPOCHS PARA 3 Y 4 NEURONAS EN LA CAPA OCULTA ............ 45
FIGURA 3.12 ECM VS. EPOCHS PARA 5, 6 Y 7 NEURONAS EN LA CAPA OCULTA ........ 45
FIGURA 3.13 ECM VS. EPOCHS PARA 8, 9 Y 10 NEURONAS EN LA CAPA OCULTA ...... 46
FIGURA 4.1 RESULTADOS ALTERNATIVA 1 .................................................................. 49
FIGURA 4.2 RESULTADOS ALTERNATIVA 2 .................................................................. 49
FIGURA 4.3 RESULTADOS ALTERNATIVA 3 .................................................................. 50
FIGURA 4.4 RESULTADOS ALTERNATIVA 4 .................................................................. 51
FIGURA 4.5 RESULTADOS ALTERNATIVA 5 .................................................................. 51
FIGURA 4.6 RESULTADOS ALTERNATIVA 1 VARIACIÓN DE COSTOS .......................... 54
FIGURA 4.7 RESULTADOS ALTERNATIVA 2 VARIACIÓN DE COSTOS .......................... 54
FIGURA 4.8 RESULTADOS ALTERNATIVA 3 VARIACIÓN DE COSTOS .......................... 55
FIGURA 4.9 RESULTADOS ALTERNATIVA 4 VARIACIÓN DE COSTOS .......................... 56
FIGURA 4.10 RESULTADOS VARIACIÓN DE PLAZO ...................................................... 57
FIGURA 4.11 ESTIMACIONES RLM PROYECTO 1 ........................................................... 60
FIGURA 4.12 ESTIMACIONES RNA PROYECTO 1 ........................................................... 61
FIGURA 4.13 ESTIMACIONES RLM PROYECTO 2 ........................................................... 62
FIGURA 4.14 ESTIMACIONES RNA PROYECTO 2 ........................................................... 63

vi
1. INTRODUCCIÓN.

Con el fin de que la construcción siga siendo un factor importante de la economía


chilena se necesita una industria moderna y acorde con la era de la globalización, para esto se
debe mejorar a pasos agigantados la gestión de las empresas constructoras. En este trabajo de
título se ocupa como herramienta para una buena gestión, un sistema de Redes Neuronales
Artificiales (R.N.A.). Estas se han aplicado en áreas tan dispares como procesamiento de
señales, reconocimiento de patrones complejos, tareas de clasificación, procesamiento de
imágenes y en ciertas áreas de la hidrología, finanzas y construcción. En teoría los modelos de
R.N.A. pueden lograr predicciones confiables en la industria de la construcción, gracias a que
su mayor ventaja es que pueden determinar patrones en problemas que presentan relaciones
complejas y no lineales, tal como son los problemas de la industria.

En Latinoamérica existen pocos casos en que se haya utilizado sistemas de R.N.A para
resolver problemas de gestión en el rubro de la construcción. Sin embargo en países asiáticos
y en Estados Unidos el uso de esta tecnología está empezando a cobrar cada vez más auge. Es
así como en los journals de la American Society of Civil Engineers (A.S.C.E)1 se puede
encontrar una gran variedad de investigaciones que utilizan esta tecnología para problemas
típicos de gestión de la construcción. Por ejemplo, se pueden encontrar papers que tratan de
crear sistemas de predicción del performance para proyectos de ingeniería [Georgy, 2005],
otros en que se trata de predecir la variación de costos para proyectos de reconstrucción
[Attalla y Hegazy, 2003], para medir la productividad de partidas de hormigón [Ezeldyn,
2006], o para modelar el markup de un contratista [Liu, 2005].

El principal objetivo de este trabajo de título es analizar la factibilidad de desarrollar


un modelo de redes neuronales capaz de predecir variaciones de costos y de plazos para
proyectos de construcción. La idea es estudiar la posibilidad de que un modelo sirva como
herramienta eficaz al momento de decidir ciertas variables en el inicio del estudio de un nuevo
proyecto. Con esta ayuda el usuario podría tomar decisiones, las que pueden influir de manera
positiva en la productividad de una obra.

Otro objetivo importante es la inserción de nuevas tecnologías, en este caso sistemas


de redes neuronales artificiales y algunos métodos estadísticos, en la industria de la
construcción chilena, de manera de analizar su real utilidad y viabilidad, tarea por lo demás
compleja si se considera que la construcción en Chile tiende a tener más de intuición y
experiencia que uso de nuevas tecnologías y herramientas.

La metodología de este estudio cuenta con los siguientes pasos:

1. Estudiar experiencias pasadas en el uso de redes neuronales y de estadística para


determinar variaciones de costos y plazos.

1
http://www.pubs.asce.org/journals/jrns.html

1
2. Identificar y analizar factores que pueden influir en los problemas de costo y plazo que
se pueden generar en un proyecto de construcción utilizando una base bibliográfica y
la experiencia de profesionales de la industria de la construcción.

3. Con los factores determinados en el punto anterior se diseña una encuesta con el fin de
generar una base de datos con la cual trabajar.

4. Determinar una metodología eficiente para la estimación de variaciones de plazo y


costos que incluya el uso de métodos estadísticos y de redes neuronales artificiales.

5. Implementación de la metodología creando un prototipo con herramientas


computacionales.

6. Testeo del sistema usando proyectos distintos a los de la fase de diseño.

En el capítulo 2 se explica el problema a estudiar y se muestra una pequeña reseña


sobre la tecnología de las redes neuronales artificiales y su funcionamiento. El capítulo 3
presenta la metodología usada para crear la base de datos y la elaboración de los distintos
modelos. En el capítulo 4 se presentan y analizan los resultados de cada modelo y se efectúa
una validación de los métodos que presentan los mejores resultados. Se termina este trabajo
con el capítulo 5, en donde se encuentran los comentarios y conclusiones.

2
2. MARCO TEÓRICO.

2.1. Breve descripción de la industria de la construcción en Chile y motivación


para este estudio.

Según un articulo de la revista BIT [Casares, 2007] la productividad de la industria de


la construcción en Chile aumentó en un 40.9% entre los años 1986-1996, periodo que se
conoce como el boom de la construcción. Para el entonces presidente de la Cámara Chilena de
la Construcción, Fernando Echeverría, este alto valor se debió a tres factores importantes.

El primero es la introducción de una buena cantidad de innovaciones en el sector, por


ejemplo: moldajes industriales, la masificación del hormigón premezclado, preparación
industrial del acero, etc. Estas nuevas tecnologías trajeron una disminución de costos y plazos
y masificaron nuevas formas de trabajo.

La segunda variable importante fue el sistema de gestión de las empresas


constructoras: estas pasaron de hacer prácticamente todo en una obra a transformarse en
administradores de ella, que contratan y coordinan subcontratistas especializados. Esto lleva a
que los subcontratos realicen la mayoría del trabajo y así las empresas constructoras
mantienen poco personal propio.

El último factor clave es la notable especialización que han realizado las empresas
subcontratistas, las cuales se han vuelto mucho más eficientes haciendo subir los estándares
para toda la industria.

A pesar de estos buenos resultados, la industria de la construcción tiene un atraso


considerable si se compara su gestión con las empresas de servicios. Una de las razones para
este atraso es que la mano de obra en esta industria sigue siendo barata en comparación con
las otras actividades económicas. Esto quiere decir que los márgenes de ganancia siguen
siendo relativamente buenos, por lo que las empresas no ponen todo su esfuerzo en mejorar la
gestión de sus proyectos.

Se da en esta industria que las empresas "gestionan" al momento de optar por sus
subcontratos, esto es, que la mayoría de las veces optan por el subcontratista más barato,
presionando a las empresas a bajar sus precios de manera considerable, lo que genera el
incentivo de que las empresas subcontratistas muchas veces cobren precios que una vez
adjudicado un proyecto no tienen la capacidad de cumplir. Como resultado se tiene grandes
problemas a la a hora de hacer cumplir los contratos y una asfixia permanente sobre las
pequeñas empresas las cuales subsisten sin la suficiencia económica para capacitar a sus
trabajadores y menos para obtener nuevas tecnologías, ambas condiciones necesarias para
mejorar su gestión.

3
Otro punto de preocupación que empieza a tomar fuerza en esta industria es el
aumento en los estándares mínimos. Por ejemplo, las empresas tendrán que enfrentar las
nuevas normas de confort habitacional, las nuevas políticas de vivienda pública y a un
comprador más exigente que el que había en el pasado, el cual, al momento de comprar una
vivienda, tiene requerimientos que no todas las empresas pueden cumplir. Lo mencionado
anteriormente obliga a las empresas constructoras a mejorar su gestión y políticas de futuro
para mantenerse competitivas dentro del mercado. Con este fin se pueden abordar distintas
soluciones en todas las etapas de un proyecto, siendo vital la etapa de planificación, ya que es
ahí donde se estiman ciertos alcances del proyecto, que a la postre pueden ser significativos
en su rendimiento.

2.1.1. Problemas con el cumplimiento de la planificación de una obra.

La planificación de un proyecto es la etapa en donde se estiman los costos


(presupuestos) y duraciones (programación) de las distintas partidas de un proyecto de
construcción. Los factores que tienen un impacto significativo en la elaboración de la
planificación son los siguientes:

1. Calidad y cantidad de información disponible a la hora de hacer un presupuesto y


programación.
2. Tiempo destinado para preparar los presupuestos y programación
3. Competencia del proyectista o del profesional encargado de la planificación.
4. Herramientas y técnicas que se usan para las estimaciones.

Estas estimaciones tienen distintos grados de exactitud, dependiendo de la etapa de


estudio del proyecto. La siguiente tabla muestra los valores estimados de la exactitud esperada
para los distintos tipos de estimación usadas a lo largo de la planificación de un proyecto.

Tabla 2.1 Valores estimados de la exactitud esperada de los tipos de


estimaciones.
Ingeniería
Contingencias Exactitud de la
Descripción Tipo Desarrollada
Probables [%] Estimación [%]
[%]
Definitiva 4 40 8 +/- 5 -10
Preliminar 3 12 12 +/- 10 - 20
Conceptual 2 5 15 +/- 15 - 30
Orden de Magnitud 1 2 20 +/- 30 - 50 o más

Con el fin de obtener un aceptable porcentaje de exactitud en la planificación, es


importante que ésta se realice de la manera más prolija posible. Esto significa tomar en cuenta
una serie de parámetros que generalmente se omiten o no se consideran importantes a la hora
de confeccionar un presupuesto o programación, pero que si pueden llegar a influir. A
continuación se enumeran algunos;

4
• Informes geológicos detallados sobre los tipos de terreno encontrados en el sitio.
• Informes hidrográficos.
• Estudios de impacto ambiental.
• Reglamentos y bases del contrato.
• Planificación de la obra.
• Antecedentes de la zona y costos de referencia en ella.
• Conocer el mercado de trabajadores especializados y de personal general en la zona de
construcción.
• Fuentes de abastecimiento de materiales y equipos.
• Habitaciones.
• Acceso a la obra.

A los parámetros anteriores se deben sumar los considerados para todo proyecto, como
sueldos, rendimientos de trabajadores y equipos, costos de operación de equipos, costo de los
materiales, etc. Pero para que toda la información anteriormente citada sirva para generar un
presupuesto completo y de buena calidad, la condición quizás más importante es tener un
proyecto definido de la forma más completa posible. Esto incluye una buena calidad de las
especificaciones técnicas, de los planos generales y de detalle.

Aún teniendo una muy buena planificación siempre surgen imponderables en la


ejecución de un proyecto. A continuación se muestra una lista de los más típicos.

• Desmoronamiento de terreno.
• Napas freáticas descubiertas en las faenas de excavación.
• Problemas con los vecinos.
• Atraso de permisos.
• Problema con maquinarias.
• Accidentes en obra.
• Mal ritmo de provisión de hormigón.
• Problemas con los proyectos.
• No existencia de materiales.
• Mal clima.
• Falta de mano de obra especializada.
• Rendimiento de mano de obra menor a la esperada.
• Falta de presupuesto.
• Demora entrega de certificados.

De ocurrir alguno o varios de estos problemas se tiene una situación en donde el


presupuesto y los plazos establecidos de un proyecto ya no se pueden cumplir, según lo
estipulado en los contratos de construcción.

5
El no cumplimiento del presupuesto trae repercusiones complejas a las empresas
constructoras. Obviamente una extensión del presupuesto significa una utilidad inferior a la
esperada, lo cual, para empresas constructoras grandes, puede ser un problema menor pero
para empresas pequeñas que mantienen flujos y márgenes apretados, una utilidad por debajo
de la esperada puede significar problemas mayores, ya sea el fracaso del proyecto o el quiebre
de la empresa si es que la desviación con respecto al presupuesto es demasiado grande.

En el caso en que no se cumplan los plazos estipulados en los contratos las


consecuencias también pueden ser nefastas, si consideramos obras que tienen una fecha de
utilización impostergable. Las multas y problemas que se generan si las obras no son
entregadas en las fechas correspondientes son grandes. Toda empresa embarcada en una
construcción le tiene miedo a las multas por concepto de atraso de entrega de las obras,
debido a que las multas son cantidades considerables de dinero, lo cual nuevamente afecta de
manera directa a la utilidad del proyecto.

Considerando lo anteriormente dicho, las empresas constructoras deben estimar de la


manera más rigurosa posible los plazos y presupuestos de sus contratos. Esto obliga a hacer
un análisis de riesgo de los proyectos de una manera mucho más minuciosa de lo que se hace
en la actualidad, ya que el no cumplimiento de estas dos condiciones genera externalidades
negativas considerables, que pueden ir desde una utilidad menor a la esperada, pasando por
perdida de reputación de la empresa, y en casos más extremos la quiebra de las mismas.

Ante estos problemas críticos la industria de la construcción debe apoyarse en


herramientas novedosas de gestión. Corresponde cambiar su manera de hacer negocios y
abrirse a las nuevas tecnologías disponibles con el fin de mejorar sus márgenes y
rendimientos. Atrás deben quedar las prácticas de aumentar los márgenes disminuyendo
sueldos o apretando casi hasta la quiebra a los subcontratistas.

2.2. Solución propuesta: análisis de datos y utilización de técnicas modernas de


gestión.

La pregunta que surge al determinar los alcances de un proyecto, es cómo considerar


variables que no se pueden hacer tangibles dentro del marco rígido de un presupuesto y que
subyacen en cada proyecto de construcción.

Básicamente lo que se propone es hacer un análisis de riesgo para un proyecto de


construcción, utilizando herramientas novedosas y así evitar que a la hora de evaluar los
riesgos o posibles retrasos y sobrecostos de construcción se recurra a herramientas
determinísticas, en donde el profesional establece los imprevistos como un porcentaje,
basándose en su experiencia y no en herramientas reales que le den una justificación seria de
tal análisis. En otras palabras estandarizar la información y usarla de manera racional.

6
La idea es imitar sistemas que utilizan las empresas manufactureras y de servicios, las
cuales están ocupando desde hace un buen tiempo sistemas de análisis de datos. Estos
sistemas se ocupan de realizar un análisis exhaustivo de los datos que obtienen de sus
procesos o ventas. Con ellos pueden definir nuevas estrategias o determinar ciertas
predicciones de ventas o producción. Algunos de estos sistemas son el data minning, modelos
estadísticos multivariados, redes neuronales artificiales o sistemas borrosos, los cuales son de
gran utilidad a la hora de planificar las producciones o establecer objetivos futuros.

Claramente, al tratar de emular ciertos patrones de gestión de otras industrias surge el


problema de que en general las empresas constructoras toman una cantidad considerable de
datos de sus proyectos pero no le dan un uso especial o no los someten a análisis. Incluso, una
vez construida una obra, no se dan el tiempo de hacer una revisión relativamente exhaustiva
del cumplimiento de sus presupuestos y programaciones, lo cual les daría una noción del
rendimiento que tiene la empresa2.

La solución es crear una base de datos potente a la cual se le sumen no sólo variables
típicas sino también variables que conocen los profesionales de obra y que no son
almacenados en ninguna parte. Con esta base de datos se pueden generar ciertos modelos que
reconozcan patrones en ellos y que sirvan para arrojar una luz a las estimaciones de
imprevistos para sobrecostos y extensiones de plazo en proyectos de construcción. Todo esto,
bajo el supuesto de que la duración y los costos de un proyecto se ven afectados por un
cúmulo de factores los cuales pueden ser estimados y así mitigar sus efectos sobre la
productividad de una construcción.

A continuación se establecen los alcances para las herramientas que se ocuparán en este
estudio.

2.2.1. Análisis de datos usando Estadística.

Para un análisis de datos propiamente tal se debe incluir sin lugar a dudas un análisis
estadístico minucioso. Lo primero en un análisis de estas características es separar la
estadística descriptiva de la estadística inferencial [Triola, 2000a].

La estadística descriptiva sirve para estudiar las características más importantes de un


conjunto conocido de datos de una población. Esta división de la estadística permite conocer
la naturaleza o distribución de los datos lo cual es muy útil para conocer entre que valores se
mueven los datos que se tienen. También se pueden calcular medidas de tendencia central con
las cuales se tiene una idea de donde tienden a agruparse los datos y por último determinar
medidas de variación para estudiar la dispersión de los datos y como varían entre sí.

2
David Baccarini realizó una encuesta a ejecutivos de empresas constructoras británicas y ante
la pregunta de si al finalizar una construcción revisaban la precisión de sus presupuestos y
programaciones el 62% de los encuestados dijo que no [Baccarini, 2005].

7
Con ayuda de la estadística inferencial se pueden determinar generalizaciones o
inferencias a partir de los datos. Acá es donde se recaba la información implícita que tienen
los datos, la cual puede servir para tomar decisiones o ayudar en la gestión. Para esto existen
distintas herramientas en esta área de la estadística, las cuales se pueden utilizar para
determinar por ejemplo: parámetros de poblaciones usando datos de muestra, diferencia entre
las medias o varianzas de muestras de distintas poblaciones, correlaciones e independencias
entre variables para una muestra, etc. Con alguna de las herramientas anteriormente citadas de
la estadística inferencial se podrá establecer ciertas diferencias o relaciones entre las distintas
variables que inciden en el riesgo de un proyecto de construcción y a la vez depura una base
de datos, con el fin de realizar modelos más complejos que ayuden a la predicción de
resultados o estimación de riesgos.

Otra ayuda importante para el análisis de datos son los sistemas multivariados de
estadística, los cuales, gracias al uso de software especializados para computadores personales
son de fácil uso y acceso. Con distintas técnicas del análisis multivariante se pueden realizar
variados tipos de inferencias a partir de tres o más variables al mismo tiempo. Por ejemplo se
pueden reducir el número de variables de una base de datos, mediante las interrelaciones que
se dan entre las distintas variables, condensando la información en un número menor de
variables con una pérdida mínima de información. Otra técnica de gran ayuda que sirve para
realizar predicciones a partir de varias variables independientes, es la regresión múltiple. Con
la regresión múltiple se pueden determinar predicciones relativamente precisas para las
variaciones de costos y plazos3.

Se tiene entonces en la estadística una herramienta poderosa para hacer inferencias a


partir de una base de datos y así tratar de comprender de mejor manera la influencia de
distintas variables sobre las variaciones de plazos y costos para proyectos de construcción.

Obviamente la estadística no es por si sola la panacea ni la que resolverá todos los


problemas de la industria, se necesita para que funcione, que la base de datos sea lo más seria
posible ya que por muy grande que sea una muestra esta puede ser no representativa de una
población. Esto debido a que la manera de conseguir la base de datos no se realiza de una
manera prolija y sin un estudio previo de las variables importantes en el rendimiento de una
construcción.

2.2.2. Redes Neuronales Artificiales como herramienta de gestión.

Las redes neuronales artificiales se han aplicado en una serie de actividades de


diversas industrias y también con variado éxito en la industria de la construcción. Este uso se
torna interesante al considerar que los problemas en la industria de la construcción para
estimar sus resultados, dependen de un entorno complejo e incierto el cual posee una fuerte

3
Varias investigaciones leídas comparan modelos de regresión lineal múltiple con modelos de
redes neuronales. [Attalla y Hegazy, 2003]

8
interrelación entre muchos factores conocidos y desconocidos. Con las características de la
industria anteriormente señaladas, las redes neuronales tienen varias ventajas frente a otros
tipos de métodos ya que pueden reconocer patrones complejos y no lineales.

Desde principios de la década de los noventa que el uso de redes neuronales en el


sector construcción ha cobrado un mayor auge, aunque todavía con un carácter más de
investigación a nivel universitario que con un claro sentido empresarial, como en otras
aplicaciones de esta técnica. Algunos de los trabajos interesantes han sido, por ejemplo,
aumento de costos de construcción en autopistas durante un tiempo dado [Wilmot y Mei,
2005], estimación de las utilidades para una propuesta [Liu y Ling, 2005], modelos para
estimar la productividad en faenas con uso de concreto [Ezeldin y Sharara, 2006], modelos
para estimar los resultados de un proyecto de construcción [Georgy et al, 2005], etc. Como se
aprecia, existen varias iniciativas con diversos resultados por lo que se hace vital el estudio de
estas experiencias para ir mejorando los modelos y poder ampliar el espectro de usos.

Al utilizar una herramienta basada en redes neuronales artificiales, se lograría cubrir


cuatro aspectos básicos a la hora de estimar los errores en la planificación de un proyecto.
Estos son: 1) Automatización en la forma de determinar la variación de costos y duración para
un proyecto inmobiliario, 2) Interacción entre la inmobiliaria y la constructora para
determinar los alcances de un proyecto, 3) Análisis de distintos escenarios para la ejecución
de la obra y su diseño, y 4) Estimación fiable que sirva para tomar ciertas dediciones.

Como las redes neuronales no sirven para hacer inferencias a partir de una base de datos
sino que más bien funcionan como una herramienta, cobra sentido realizar un análisis
estadístico para obtener información que puede ser importante y de ayuda en el problema
descrito.

2.3. Redes Neuronales Artificiales.

2.3.1. Introducción.

El cerebro humano, a través de su red neuronal biológica, tiene la capacidad de


procesar grandes cantidades de información a gran velocidad. Esta información se combina y
se compara con la ya almacenada en el cerebro y se entregan respuestas adecuadas incluso,
para situaciones nuevas. Es así como un ser humano sabe que se puede quemar con el fuego,
reconoce las imágenes que ve, puede diferenciar distintos olores, etc. Esto nos dice que el ser
humano es capaz de resolver problemas gracias a su experiencia acumulada a lo largo de su
vida.

Las redes neuronales artificiales son un modelo simplificado del cerebro humano.
Estas “copian esquemáticamente la estructura neuronal del cerebro para tratar de reproducir
9
sus capacidades, como por ejemplo, aprender de la experiencia a partir de las señales o datos
del exterior, con el objetivo de construir sistemas de procesamiento de la información
paralelos, distribuidos y adaptativos” [Martín del Brío y Sanz, 2001]. Las redes neuronales
actúan sobre un conjunto de datos en donde reconocen patrones, pueden hacer predicciones o
tomar una decisión, gracias a la experiencia obtenida en una etapa de aprendizaje. Así, las
redes tienen un buen desempeño en la solución de problemas complejos donde el
reconocimiento de patrones o comportamientos es importante. Algunos ejemplos de uso de
redes neuronales son los siguientes:

Biología:
- Obtención de modelos de la retina.

Empresa:
- Evaluación de probabilidades de formaciones geológicas y petrolíferas.
- Explotación de bases de datos.
- Optimización de plazas y horarios en líneas de vuelo.
- Modelado de sistemas para automatización y control.

Medio Ambiente:
- Analizar tendencias y patrones.
- Previsión del tiempo.

Finanzas:
- Previsión de la evolución de precios.
- Valoración del riesgo de créditos.
- Interpretación de firmas.

Manufactura:
- Robots automatizados y sistemas de control.
- Control de producción en líneas de procesos.
- Inspección de calidad.

Medicina:
- Analizadores del habla.
- Diagnóstico y tratamiento a partir de síntomas.
- Predicción de reacciones adversas en los medicamentos.

Militares:
- Clasificación de las señales de radar.
- Creación de armas inteligentes.
- Reconocimiento y seguimiento en el tiro al blanco.

Como se puede ver, las redes neuronales tienen una gran cantidad de aplicaciones,
muchas de las cuales todavía no se pueden ni siquiera prever.

10
2.3.2. Características de las Redes Neuronales Artificiales R.N.A.

Las Redes Neuronales Artificiales emulan tres características claves de los sistemas
nerviosos, los cuales son:

a) Procesamiento Paralelo: Al igual que las neuronas del cerebro, las redes neuronales
artificiales están formadas por una gran cantidad de procesadores sencillos. De esta manera se
tiene la ventaja de que cada uno realiza un procesamiento separado de las otras neuronas con
lo que se puede procesar una gran cantidad de datos al mismo tiempo y de manera más rápida
que en un sistema de procesador único.

b) Memoria Distribuida: En una R.N.A. la información queda almacenada en los pesos de


cada conexión y por eso se habla de una memoria distribuida. Esto tiene la ventaja de que si
una conexión se daña se pierde solo una pequeña parte de toda la memoria almacenada en la
red. Esto es completamente distinto a un computador normal donde la memoria se almacena
en posiciones bien definidas. Esto entrega un sistema tolerante a fallos, como vemos en el
sistema nervioso del ser humano, en donde muere una gran cantidad de neuronas al día pero
pasan varios años antes de que sus capacidades se vean resentidas.

c) Adaptabilidad: Una R.N.A. es capaz de adaptarse a su entorno, ya que en la etapa de


entrenamiento, va modificando sus pesos a medida que acumula más información procedente
del exterior. Así en una etapa posterior, tiene la capacidad de generalizar para un nuevo
conjunto de datos.

2.3.3. Elementos Básicos.

2.3.3.1 Neuronas.

La neurona o procesador elemental (PE) es un dispositivo básico de cálculo y es la


estructura básica de una red neuronal. Esta recibe un vector de entrada procedente del exterior
o de otras neuronas y, mediante una función de activación, emite una única salida, la cual se
envía hacia otra neurona o hacia el exterior. Las neuronas se agrupan formando capas, las
cuales a su vez forman las redes neuronales. La Figura 2.1 muestra una neurona i, a la cual
le llega información desde neuronas de una capa anterior.

11
Figura 2.1 Procesador elemental o neurona.

2.3.3.2 Función de Entrada.

La función de entrada más habitual es la función lineal que se muestra a continuación:

Netai = ∑ Wij X j − θ i ,

donde θ es el umbral de excitación.

Como se puede observar la función lineal es una suma ponderada de las entradas con
los pesos sinápticos.

Los pesos sinápticos Wij determinan la intensidad de la interacción entre la neurona


presináptica j con la postsináptica i. Los pesos sinápticos toman valores entre -1 y 1. Si el
peso es positivo se habla de una sinapsis excitadora en cambio si es negativo, se tiene una
sinapsis inhibidora.

También se pueden considerar funciones de entrada no lineales.

2.3.3.3 Función de Activación o de Transferencia.

La función de activación es la que determina la manera en que se manipulan los datos


y como se genera la información que se envía a las siguientes capas o hacia el exterior, en
caso de que sea de la capa de salida.

A continuación definiremos las funciones más usadas.

- Función Logística o Sigmoide.

Es la función más usada, con rango de salida desde 0 a 1. Permite concentrar el


aprendizaje en valores no extremos ya que acomoda señales muy intensas sin producir

12
saturación y admite señales débiles sin una excesiva atenuación. La expresión matemática es
la siguiente:

1
F ( x) = .
1 + e −x

Figura 2.2 Función Logística.

- Función Lineal.

Esta función se utiliza cuando se quiere que todos los datos tengan la misma
importancia, esto ya que esta función no se hace menos sensible al alejarse de cero. La
expresión matemática es la siguiente:

F ( x) = x .

Figura 2.3 Función Lineal.

13
- Función Tangente Hiperbólica.

Esta función tiene las mismas propiedades que la Logística pero permite un rango de
salida que va desde -1 a 1. La expresión matemática es la siguiente:

e x − e−x
F ( x) = x .
e + e−x

Figura 2.4 Función Tangente Hiperbólica.

- Función Gaussiana y complemento de Gaussiana.

La función gaussiana se usa cuando la información del centro es la más relevante, en


cambio el complemento de gaussiana se usa para que la red le de más importancia a los
valores extremos. Las expresiones matemáticas son las siguientes.

F(x) =1−e−x .
2
−x2
Gaussiana F(x) =e Complemento de Gaussiana

Figura 2.5 Función Gaussiana.

14
Figura 2.6 Función Complemento de Gaussiana.

2.3.4. Arquitectura de una Red Neuronal.

La arquitectura de una red es la topología, estructura o patrón de conexiones de una


red neuronal. En una red neuronal los nodos o neuronas se conectan a través de conexiones
sinápticas, las cuales se pueden propagar en un solo sentido. En general las neuronas se suelen
agrupar en capas y el conjunto de más de una de ellas constituye una red neuronal.

Una red neuronal típica posee tres tipos de capas como se ve en la siguiente figura.

Figura 2.7 Arquitectura de una red neuronal artificial.

La capa de entrada es la que almacena la información que se le suministra a la red.


Es de carácter única y su número de neuronas está determinado por la cantidad de inputs de la
red. Esta capa no realiza ningún proceso, salvo la aplicación de una función escalar antes de
pasar la información a la siguiente capa. Puede recibir variables de entrada binarias o
continuas, dependiendo de la aplicación.

15
El procesamiento de los datos se lleva a cabo en la capa oculta, es ahí donde se
procesa y se memoriza la información. La cantidad de capas ocultas y su número de neuronas
lo decide quién arma la red y al pasar por ella los datos se propagan a la capa siguiente,
después de pasar por una función de activación.

La respuesta de la red se da en la capa de salida la cual es de carácter única y su


cantidad es el número de outputs de la red. En esta capa los datos también pasan por una
función de activación antes de dar el producto final de la red que puede ser binario, para el
caso de problemas de clasificación o continuo en el caso de predicciones.

Existen otros tipos de arquitecturas para redes neuronales como puede ser una red
monocapa. También se pueden dar conexiones intra-capa o conexiones retrorealimentadas en
que el sentido es contrario entrada-salida.

2.3.5. Operación de las R.N.A: Aprendizaje y Generalización

En los sistemas de redes neuronales artificiales se distinguen dos fases de operación, la


primera es la etapa de aprendizaje en donde se entrena a la red a partir de un grupo de datos
para que luego en la siguiente fase de generalización la red se pueda ocupar como una
herramienta útil.

2.3.5.1 Fase de Aprendizaje.

En la fase de aprendizaje se produce el ajuste de los parámetros libres de la red a partir


de un proceso de estimulación. La mayoría de estos procesos consideran sólo el cambio en los
pesos sinápticos y el tipo de aprendizaje viene dado por la manera en que se cambian dichos
parámetros.

El aprendizaje parte con un cierto modelo de neurona, arquitectura de red y con los
pesos sinápticos iniciales como nulos o aleatorios. La red va alterando sus pesos conforme se
le entregan nuevos conjuntos de datos.

A continuación se explican los distintos tipos de aprendizaje que se dan en las R.N.A.

El método más sencillo es el aprendizaje supervisado en donde a la red se le


presentan los inputs y outputs de un conjunto de datos, de manera iterativa la red ajusta sus
pesos para que el output tienda a ser el deseado. Los métodos más usados de aprendizaje
supervisado son el algoritmo de retropropagación (Back-propagation) y la regla delta
generalizada.

16
El caso en que a la red no se le presentan respuestas deseadas el tipo de aprendizaje es
no supervisado, para que este funcione se le debe presentar a la red una multitud de patrones
para generar un cierto nivel de redundancia en las entradas y así la red sea capaz de descubrir
por sí misma rasgos comunes, regularidades, correlaciones o categorías. Es por esto que este
tipo de aprendizaje es de gran utilidad para generadores de categorías.

Existe dos tipos más de aprendizaje, conocidos como híbrido y reforzado. El primero
es una mezcla del aprendizaje supervisado y no supervisado, el cual mezcla estos tipos en
distintas capas. El segundo lo que hace es emplear información del error pero la ocupa sólo
para determinar si está funcionando bien o mal, y por ende no explicita la salida deseada.

2.3.5.2 Fase de Generalización.

En esta fase se detiene el aprendizaje por lo que la estructura y pesos logrados en la


fase anterior quedan fijos. Con esta arquitectura y pesos fijos la red es capaz de generalizar a
partir de casos nuevos que se le presenten.

2.3.6. Regla LMS para aprendizaje supervisado.

La regla LMS (Least Mean Square) o regla Widrow-Hoff conduce a actualizaciones de


tipo continuo, siendo la actualización de los pesos proporcional al error que la neurona comete
[Haykin, 1994].

El método consiste en establecer una función de error o coste que mida el rendimiento
de la red y que dependa de los pesos sinápticos. Dada esta función se establece el
procedimiento de optimización capaz de proporcionar una configuración de pesos que
corresponda a un mínimo local de la función propuesta. Dicho de otra manera, el método
aplicado proporciona una regla de actualización iterativa de los pesos en función de los
patrones de aprendizaje. Así se puede lograr la búsqueda de un punto óptimo de la red
neuronal. A continuación se explicará el algoritmo de enseñanza para la red más simple,
llamada Adalina, la cual consta de una neurona similar a la de la Figura 2.1 pero la función
de activación es la identidad.

La función error o coste más utilizada es la del Error Cuadrático Medio:

p
1 2 1
J= e = (d − ∑ wk x k ) 2 ,
2 2 k =1

donde
d: salida deseada
wk: peso sináptico
xk: entrada k-ésima

17
Al graficar se obtiene una curva como la mostrada en la Figura 2.8, en donde el
punto w* corresponde a una configuración de pesos localmente óptima.

Figura 2.8 Superficie de ECM.

Para el caso en que el problema sea mayor a dos dimensiones, la representación


gráfica de esta función, sería como una hipersuperficie con montañas y valles, en donde la
configuración de pesos w* ocupada por un valle es la solución localmente óptima.

Expresada de manera matemática, la condición óptima para la función de error está


dada por:
∂J
∇ wk J = = 0, k = 1,2,...., p .
∂wk

Esta condición arroja un sistema de ecuaciones conocida como Wiener-Hopf, el cual


se soluciona con el método de optimización del descenso por el gradiente. Según Bonifacio
del Brío [Martín del Brío y Sanz, 2001] para encontrar un mínimo local se realiza el siguiente
procedimiento; “Se parte en t = 0 de una cierta configuración w(0) y se calcula el sentido de
la máxima variación de la función J(w) en w(0), que vendrá dado por su gradiente en w(0).
El sentido de la máxima variación (máximo gradiente) apuntará hacia un colina del paisaje
de la hipersuperficie de J(w). A continuación se modifican los parámetros w siguiendo el
sentido contrario al indicado por el gradiente de la función error. De este modo se lleva
acabo un descenso por la hipersuperficie del error, aproximándose en una cierta cantidad al
valle, un mínimo (local); el proceso se itera hasta alcanzarlo”. La regla de actualización de
los pesos es la siguiente:

⎛ p

wk (n + 1) = wk (n) + η ⎜ d (n) − ∑ w j (n) x j (n) ⎟⎟ x k (n)
⎜ k = 1,2,......, p .
⎝ j =1 ⎠
η indica el tamaño del paso tomado en cada iteración.

Para el caso de una red multicapa (con una o más capas ocultas) se extiende el
algoritmo LMS, esto quiere decir que la funcional de error se derivará en función de los pesos
de la capa de salida y de los pesos de las neuronas de las capas ocultas, haciendo uso de la

18
regla de cadena. En consecuencia, las funciones de transferencia de las neuronas deben ser
diferenciables. Las siguientes figuras muestran la utilización del método del descenso por
gradiente para una red de una neurona y de una red multicapa.

Figura 2.9 Método del descenso por gradiente para una red de una neurona.

Figura 2.10 Método del descenso por gradiente para una red multicapa.

2.3.7. Aprendizaje por retropropagación de errores (Backpropagation).

El algoritmo de Backpropagation consiste en propagar el error hacia atrás desde la


capa de salida hacia al capa de entrada, pasando por las capas ocultas, esto se hace para
modificar los pesos de las conexiones. El proceso completo sigue los siguientes pasos:

19
- Se introducen los inputs en la capa de entrada.
- Se propaga esta señal por todas las capas de la red hasta la que se obtiene un output en la
capa de salida.
- Se compara el output de salida de la red con el deseado.
- Se calcula un error para cada unidad de salida.
- Se transmite el error hacia atrás hacia todos los nodos que están conectados directamente.
- Estos nodos reciben una fracción el error proporcional al peso de sus conexiones.
- Se actualizan de manera iterativa todos los pesos de las conexiones con tal de disminuir el
error.
- Cuando el error resulta aceptable se detiene el aprendizaje.

2.3.8. Ventajas de las R.N.A.

Las redes neuronales artificiales presentan grandes ventajas las cuales hacen que este
tipo de tecnología esté entrando con fuerza en múltiples áreas. Entre las ventajas se incluye:

• Aprendizaje Adaptativo: Capacidad de aprender a realizar ciertas tareas mediante una


experiencia inicial o entrenamiento.
• Generalización: Facultad de las redes neuronales de responder de manera acertada
cuando se le presentan datos nuevos a los cuales no había sido expuesta, esta ventaja
se da gracias a la auto-organización de la información que reciben.
• Tolerancia a fallos: Si una parte de la red falla la otra puede seguir funcionando con lo
que la red neuronal no pierde su funcionalidad, esto gracias a que almacenan su
información de manera distribuida, cada neurona tiene una parte pequeña de la
información a diferencia de los sistemas tradicionales en la cual cada parte de
información esta almacenada en una parte específica.
• Operación en tiempo real: Las redes neuronales son de rápido procesamiento de datos.
Esto gracias ha que a aumentado la eficiencia de los programas a través del diseño de
procesadores con arquitectura mejorada y también se ha extendido la capacidad y
manejo de la memoria computacional.
• Compatibilidad con tecnologías existentes: Las redes neuronales pueden ser
fácilmente implementadas utilizando técnicas existentes e integradas a casi cualquier
tipo de sistema.

20
3. METODOLOGÍA.

3.1. Modelos a realizar.

En el momento en que un mandante concibe un proyecto de construcción se deben


realizar varias estimaciones iniciales para determinar la viabilidad del mismo. El primer paso
es definir los alcances y características generales del proyecto.

La experiencia indica que esta fase de estimaciones iniciales se realiza en un corto


periodo de tiempo por lo que se debe contar con herramientas adecuadas de análisis, de no ser
así muchas estimaciones pueden ser erróneas. Si un proyecto mal estimado en su orden de
magnitud, pasa a una segunda fase en donde se determina que no es viable, se ha perdido un
tiempo valioso el cual podría haber sido destinado a proyectos realmente factibles.

A nivel de estimaciones de orden de magnitud los profesionales dedicados a la


evaluación de proyectos deben contar con modelos que los ayuden a realizar estimaciones lo
más exactas posibles. Al contar con modelos de estas características se obtienen varias
ventajas como por ejemplo:

- Reducción importante de tiempo y costos al momento de definir en una primera


instancia la viabilidad de un proyecto.

- Evaluar las mejores oportunidades de inversión o participación.

- Estandarización del proceso de estimación de costos en la etapa de evaluación o


planificación de un proyecto.

- Permiten al mandante analizar distintas opciones sobre los alcances y características


del proyecto.

Esta última ventaja da al mandante un abanico de opciones para elegir el proyecto que
más le convenga a los intereses de su empresa.

Para este trabajo de título se abordarán dos problemas a modelar. El primer problema a
tratar será la construcción de un modelo capaz de realizar una estimación de orden de
magnitud del costo presupuestado de un proyecto de construcción4, el cual servirá para
entender el comportamiento de las R.N.A y la regresión lineal múltiple (R.L.M.). El segundo
problema, en donde se pretende ocupar todo el potencial de estas dos herramientas, es

4
Para rangos de valores de una estimación de orden de magnitud ver Tabla 2.1

21
elaborar cuatro modelos, dos de R.N.A. y dos de R.L.M., capaces de estimar las variaciones
de costos y plazos de un proyecto de construcción, objetivo principal de este trabajo de título.

3.1.1. Modelos para estimar el costo presupuestado de un proyecto de construcción.

Se elaboran varios modelos basados en R.N.A., en donde se utilizara el software


comercial de redes neuronales Neurosolutions, y en R.L.M. utilizando el software de
estadística SPSS. Ambos modelos tienen la tarea de lograr una estimación del costo
presupuestado de un proyecto de construcción5 a partir de una serie de variables. Para un buen
uso de estos se software se ocupó literatura especializada [Príncipe et al, 2000], [Pérez,
2005]. El tipo de estimación para estos modelos es de orden de magnitud.

Una vez realizados los dos modelos se procede a analizar el poder de generalización
de cada uno. Para esto se utilizaron cuatro proyectos de testeo con el fin de determinar cual de
los dos métodos logra una mejor estimación.

3.1.2. Modelos para estimar la variación de costo y plazo.

En estos modelos se decidió utilizar como variable dependiente los plazos y costos
finales de un proyecto6, en vez de las variaciones, ya que mejoraba el nivel de generalización.

Tanto como para la variación de costos y plazos se realizanon varios modelos en


R.N.A. y en R.L.M. utilizando los software antes mencionados.

Una vez realizados los modelos se procedió a analizar el poder de generalización de


cada uno. Para esto se utilizaon cuatro proyectos de testeo con el fin de determinar cual de los
métodos logra una mejor estimación.

Con el fin de legitimar los mejores modelos se realizó una validación cruzada. Esto
implicó rehacerlos varias veces con la base de datos aleatorizada.

A continuación se muestra un diagrama de flujo de los pasos a seguir para la


realización de los modelos.

5
Presupuesto Proyecto = Costos Generales + Costo Directo de Obra, en Tabla 6.1del Anexo A
columna Costo Presupuestado.
6
Ver columnas Costo real y Plazo real en Tabla 6.1 Anexo A

22
Recolección de Datos Análisis de Datos
Encuesta orientada a Valores descriptivos,
proyectos correlaciones, análisis
habitacionales en de varianza, etc.
altura.

Identificación de variables CP
Selección de modelos
Superficie
Pisos sobre cota 0 Costo Presupuestado CP
Subterráneos Variación de Costos VC
Categoría (Clase1, Clase2, Variación de Plazos VP
Clase3)

Identificación de variables VC Identificación de variables VP


-Costo presupuestado -Costo presupuestado
-Superficie -Superficie
-Pisos sobre cota 0 -Empresa construye y vende
-Empresa construye y vende -Subterráneos
-Subterráneos Plazo programado
-Complejidad del Layout
-Técnicas especiales de
construcción

Diseño modelos de
Diseño de R.N.A. regresión
Definir: Ecuación de regresión
- Nº de capas ocultas Coeficientes estandarizados
- Nº de neuronas Coeficiente de
determinación R2

Entrenamiento R.N.A.
Testeo y Validación
Establecer:
- Proyectos para Regresión vs. Redes
entrenamiento Neuronales
- Proyectos para testeo Elección del mejor modelo
- Nº de iteraciones y revalidación

3.2. Información sobre proyectos de construcción.

Según la bibliografía revisada, uno de los aspectos claves de la realización de un


modelo predictivo en redes neuronales se basa en tener un amplio registro de datos con que

23
alimentarla y que a su vez esta información sea lo más acuciosa y fidedigna posible. Debido al
punto anterior, se determinó realizar una encuesta a una gran variedad de empresas
constructoras e inmobiliarias. Esto tiene la ventaja de que se puede encausar la recolección de
datos hacia los temas que el investigador desee. La encuesta y su utilización se explican en el
siguiente punto.

3.2.1. Encuesta.

La encuesta que se decidió enviar a las distintas empresas contiene varias categorías
que son de interés para el rubro de la construcción, para cada categoría se consideraron
distintas variables que pueden afectar la productividad de cada proyecto o que tienen un cierto
riesgo inherente en ellas. Dichas variables fueron determinadas analizando distintos estudios
similares a este7 y una vez estipuladas fueron sometidas al juicio de profesionales del rubro
para asegurar la utilidad de cada una de ellas.

De manera de evitar que el encargado de contestar la encuesta dejase partes en blanco


o simplemente lo hiciese para un solo proyecto en vez de para varios, la encuesta se diseñó
para que se conteste de manera rápida y fácil. Además se creó con un formato tipo
cuestionario en donde se le explica al encargado como contestar la encuesta. Así se evita que
se tengan distintos tipos de respuesta para una misma pregunta. Cabe mencionar que para
cada proyecto se tiene un cuestionario diferente.

Una de las conclusiones más destacables de los distintos estudios es la importancia de


contar con una muestra que pertenezca a una población relativamente homogénea, esto para
no tener casos extremos o muy dispares entre si, que dificulten el reconocimiento de patrones.
Por esto se determinó usar sólo proyectos habitacionales de edificación en altura.

A continuación se detalla cada categoría, las variables que contienen y una breve
explicación de cómo contestar cada una de ellas. Además, para evitar algún tipo de problema,
toda la información se registra de manera anónima para así asegurar la confidencialidad de las
empresas que entregaron datos.

3.2.1.1 Antecedentes Generales.

Este punto contiene antecedentes típicos de cada proyecto de construcción, los cuales
se analizan por separado.

7
Se encontraron varias experiencias similares realizadas en distintas partes del mundo, estas
fueron de gran ayuda para evitar incluir variables cuya incidencia era mínima en el problema a
estudiar [Sutrisna et al, 2005].

24
- Costo presupuesto del proyecto y Costo directo de obra: Con estas dos variables y con
los costos reales se calcularán las diferencias de costos de cada proyecto. Una de estas dos
variables será la variable dependiente a estimar en los modelos.

- Tipo de contrato: Con esta variable se pretende identificar si existe alguna diferencia
significativa en el resultado de la construcción a partir de distintos tipos de contratos entre el
mandante y la empresa constructora..

- Duración programada proyecto: Sirve para definir un tiempo estimado de estudio y


elaboración de los distintos proyectos y para ver su incidencia en los resultados.

- Superficie proyecto: Sirve para estudiar la incidencia del tamaño del proyecto en la
estimación que se haga de los costos y plazos.

- Empresa construye y vende: Es una variable interesante ya que se podrá inferir si es que
existe una diferencia en como se hacen las proyecciones si el propietario del proyecto a la vez
lo construye.

- Comuna: Puede indicar alguna diferencia en los resultados dependiendo de la ubicación del
proyecto.

- Habitacional o Comercial: Responde a si el proyecto para el cual se está contestando la


encuesta es de carácter comercial o habitacional.

- Fecha de inicio y término de la construcción: Esta variable puede ser interesante para
ubicar el proyecto en las distintas coyunturas económicas por las que puede estar pasando el
país o la industria de la construcción.

- Número de pisos y subterráneos: Se analizará si la cantidad de pisos sobre y bajo la cota 0


pueden incidir en una alteración de las proyecciones, interesante es analizar el número de
pisos por separado ya que los subterráneos pueden acarrear más complicaciones que los pisos
sobre la cota 0.

- Tipo de estructura: Se analizará la diferencia entre una construcción cuya estructura


sismorresistente es de muros de hormigón armado, marcos rígidos de vigas y columnas o si es
una estructura de acero.

25
La categoría completa con la explicación que lee el encuestado se muestra a
continuación.

Tabla 3.1Antecedentes Generales.


Antecedentes generales Observaciones
Costo total del proyecto en UF sin IVA (gastos grales. + costo
Costo o presupuesto del proyecto
directo)
Costo directo de obra Costo directo de la obra en UF sin IVA
Tipo de contrato entre mandante y constructora. Opciones:
Suma alzada, Serie de Precios Unitarios y Administración
Tipo de contrato
Delegada. Si es un sistema mixto elegir de las tres opciones la
más cercana al contrato del proyecto.
Duración total en días desde el inicio del Proyecto de
Duración programada proyecto
Arquitectura hasta entrega de terreno.
Superficie proyecto Superficie total del proyecto en m2.
Sí: si la misma empresa construye y explota el proyecto, No:
Empresa construye y vende
caso contrario.
Comuna Comuna donde se sitúa el proyecto.
Tipo de proyecto Habitacional o Comercial
Fecha de inicio de la construcción Especificar año y mes en que empezó la construcción
Fecha de término de la construcción Especificar año y mes en que terminó la construcción
Número de pisos Nº de pisos desde la cota 0.
Número de subterráneos Nº de subterráneos del proyecto.
Tipo de estructura Estructura de marcos rígidos, de muros o de acero.

3.2.1.2 Calidad y Experiencia.

Acá tenemos algunas variables que debido a que pueden tener un rango de respuestas
demasiado amplio se someterán al juicio de expertos para encausarlas en 4 o menos
categorías, las variables anteriormente citadas son el nombre de la oficina de Arquitectura y el
nombre de la oficina de ingenieros que realiza el cálculo estructural.

Algunas variables interesantes a analizar por separado son:

- Experiencia empresa constructora, años de experiencia administrador de obra: Es


interesante ver si es que el know how adquirido por la empresa y el administrador de obra
durante años sirve para establecer una diferencia con empresas más pequeñas o nuevas.

- Valor venta promedio: Puede ser un parámetro interesante considerar la calidad del
producto a vender y si esto afecta la productividad del negocio.

- Inspección técnica externa: El analizar si el proyecto posee una inspección técnica externa
también puede ser importante al momento de subir los costos ya que los requerimientos de
calidad pueden ser mayores al exigir el fiel cumplimiento de las especificaciones técnicas

26
- Coordinación de proyectos externa: La realización de una coordinación externa del
proyecto puede determinar que el proyecto sea mejor estudiado y así muchos errores de
diseño se corrigen antes de llegar a terreno.
- Certificación: Es interesante analizar si la empresa que posee algún tipo de certificación
que estandarice sus procesos o gestione la calidad obtiene mejores rendimientos que una
empresa que no posee ningún tipo de certificación.

La categoría completa con la explicación que lee el encuestado se muestra a continuación.

Tabla 3.2 Calidad y Experiencia.


Calidad y Experiencia Observaciones
Arquitecto Nombre oficina de arquitectura.
Calculista Nombre oficina de ingenieros.
Experiencia empresa constructora Superficie total construida por la empresa.
Valor venta promedio Valor de venta promedio en UF/m2
Años de experiencia administrador obra Años de experiencia del administrador de obra.
Sí: si se realizó una inspección externa a cargo del mandante
Inspección técnica externa
(incluir nombre empresa), No: caso contrario.
Sí: si una empresa externa se encargó de la coordinación de los
Coordinación de Proyectos distintos proyectos (incluir nombre empresa). No: caso
contrario.
Si: si la empresa posee algún tipo de certificación. Ej: ISO
La empresa posee certificación
9000, etc. (nombrar certificación), No: caso contrario.

3.2.1.3 Información Desarrollo Proyecto.

En esta categoría se tocan temas que atañen al proceso mismo de la construcción del proyecto,
el análisis por separado se hace a continuación:

- Accesibilidad de los materiales: Puede ser importante ya que para las obras extraordinarias
la lejanía de un material dado puede traer asociado un costo mayor a que si las materias
primas están relativamente cerca.

- Técnicas especiales de construcción: Es interesante analizar la posible relación entre la


introducción de tecnologías nuevas en un proyecto y los sobrecostos o variaciones de plazo
que estas pueden acarrear.

- % de subcontratación: El porcentaje de subcontratación en un proyecto de construcción es


uno de los temas importantes en el rubro ya que no hay una regla establecida, por ende no se
puede indicar de manera exacta si a mayor porcentaje de subcontratación se reducen los
costos o los plazos o hasta que punto se puede dar esa lógica.

27
- Duración construcción programada: Con esta variable y la duración real del proyecto se
determinará la segunda variable dependiente u output del modelo.

- Complejidad del layout: Esta variable que puede tener cierto efecto en la organización de
una obra que es la complejidad de la instalación de faena o del layout, esto por que es sabido
que con un terreno complejo el layout de instalaciones puede traer complicaciones serias en la
ejecución de las obras.

La categoría completa con la explicación que lee el encuestado se muestra a continuación.

Tabla 3.3 Información Desarrollo Proyecto.


Información Desarrollo Proyecto Observaciones
Alta: La obra se encuentra cerca de sus insumos (< 5 hrs.),
Media: La obra se encuentra a una distancia media de los
Accesibilidad de los materiales
insumos (>5 hrs.,<1.5 días), Baja: La obra se encuentra a una
distancia considerable de su fuente de insumos ( >1.5 días).
Número de obras extraordinarias llevadas a cabo durante la
Número de obras extraordinarias
ejecución del proyecto.

Alto: Se usaron nuevas tecnologías en una gran parte de la


construcción, Medio: el proyecto incluye ciertas tecnologías
Técnicas especiales de construcción
nuevas de mediana complejidad. Baja: El proyecto no presentó
uso de tecnologías nuevas en su construcción.

% de partidas subcontratadas del proyecto. (costo total partidas


% de subcontratación según proyecto
subcontratadas*100/costo directo de construcción)
Duración programada en días desde la entrega de terreno hasta
Duración Construcción Programada
termino de construcción.
Bajo: El terreno permite una fácil instalación de faenas y no
presenta grandes problemas, Medio: La instalación de faena es
Complejidad del layout
más compleja, Alta: el terreno presenta características que
complican la construcción y el layout de instalaciones.

3.2.1.4 Programación y Control.

Las dos variables que pertenecen a esta categoría se incluyeron para determinar si
genera alguna influencia en el resultado de un proyecto el que se ocupe algún software en el
control de presupuestos y que se tenga un profesional dedicado a la programación y control de
la obra.

La categoría completa con la explicación que lee el encuestado se muestra a continuación.

28
Tabla 3.4 Programación y Control.
Programación y control Observaciones
Profesional dedicado exclusivamente a Sí: si la empresa posee un profesional a cargo exclusivamente para
programación y control programación y control, No: caso contrario.
Sí: si la empresa utiliza algún tipo de software para control de
Utiliza algún software para control de
presupuesto, Ej: Rego, Arquímides, Presto, Unysoft, Opus olé, etc.,
presupuesto
No: caso contrario.

3.2.1.5 Datos Finales.

Utilizando las variables que se muestran en la siguiente tabla y las variables


construcción programada y costo inicial del proyecto se calcularán los outputs a los que será
sometido el modelo. Con estos outputs se generará la red de retropropagación que se explicó
en el marco teórico.

La categoría completa con la explicación que lee el encuestado se muestra a continuación.

Tabla 3.5 Datos Finales.


Datos finales Observaciones
Duración real construcción Duración real de construcción del proyecto.
Costo total real del proyecto al final de su construcción (gastos
Variación de costo total proyecto
grales + costo directo + obras extraordinarias).
Costo directo de obra real al final de la construcción. (Incluyendo
Variación de costo directo de obra
obras extraordinarias, si se tienen)

3.3. Recolección y análisis de datos.

La encuesta mostrada en el punto anterior se distribuyó a cerca de 20 profesionales del


rubro de la construcción de 15 empresas distintas. Entre los profesionales se encontraban
administradores de obra, supervisores de proyectos y gerentes. La encuesta se difundió
principalmente mediante entrevistas, aunque en algunos casos se mandó sólo por email,
previo contacto telefónico. El periodo de difusión se extendió desde mediados de abril hasta
fines de junio del año 2007 y se obtuvieron 32 proyectos distintos. Cabe destacar que se
podrían haber obtenido más de no ser por el límite de tiempo para entregar este trabajo de
título.

En un primer análisis se eliminaron proyectos que no cumplían con el requisito de ser


edificios habitacionales en altura con lo que la base de datos se redujo a 27 proyectos. Luego
se quitaron 3 más debido a que no eran proyectos representativos o tenían demasiados datos
ausentes. Al final la base de datos quedó de 24 proyectos, todos edificios habitacionales en
altura. En el anexo A se presentan los valores de cada variable para los 24 proyectos a ocupar
en los modelos.
29
En las Tabla 3.6 y Tabla 3.7 se muestran los rangos en que se mueven las variables
más importantes de la base de datos. Con esta se pretende dar una idea de la magnitud,
tamaño y costo, de los edificios recabados. Como se observa la muestra va desde pequeños
proyectos de poco más de 3.000 [m2] hasta grandes proyectos de aproximadamente de 35.000
[m2], lo que garantiza una muestra representativa del problema a estudiar.

Tabla 3.6 Valores descriptivos de las variables cuantitativas más importantes


para todos los proyectos.
Desv.
Variables N Mínimo Máximo Media
Estándar
Costo del proyecto [UF] 24 43.271,00 376.778,00 152.365,65 83.465,28
Pisos sobre cota 0 [uni] 24 4,00 27,00 15,70 5,72
Nº de subterráneos [uni] 24 1,00 6,00 1,95 1,26
Superficie proyecto [m2] 24 3.500,00 34.837,00 14.105,66 7.585,89
valor de venta [UF/m2] 24 25,00 50,00 34,48 7,13

Tabla 3.7 Valores descriptivos de las variables cualitativas más importantes


para todos los proyectos.
Técnicas
Complejidad de Empresa Construye
Especiales de Frecuencia Frecuencia Frecuencia
Layout y Vende
Construcción
Alta 8 Alta 6 No 6
Baja 14 Baja 12 Si 18
Media 2 Media 6 Total 24
Total 24 Total 24

En la Tabla 3.8 se ven algunos valores descriptivos de la variación de costos y plazos


para los proyectos de la base de datos. En ambas variables el rango de valores es amplio lo
que indica que los resultados de los proyectos también son representativos de la industria.

Tabla 3.8 Valores descriptivos de la variación de costos y plazos.


N Mínimo Máximo Media Desv. Estándar

Variación de costo del


24 -13.972,00 16.378,30 2.580,45 7.242,86
proyecto [UF]

Variación de plazo [día] 24 -30,00 90,00 26,79 26,77

Las variables de comuna y valor de venta se juntaron para crear una variable
cualitativa nueva llamada categoría la cual será incluida en los distintos modelos. Esta
variable será dividida en tres clases. La primera incluye proyectos de gran calidad, en
comunas de alto costo de suelo y de alto costo de venta de sus departamentos. La segunda
clase incluye proyectos de mediana calidad, en comunas de un costo de suelo medio y con un

30
precio de venta de departamentos medio. La tercera clase incluye los proyectos no contenidos
en las otras dos.

3.4. Modelo que estima en orden de magnitud el presupuesto de un proyecto de


construcción.

3.4.1. Modelo de Regresión Lineal Múltiple.

Los distintos modelos de regresión múltiple de este trabajo de título se realizaron con el
software de estadística SPSS. A continuación se detallan los pasos para obtener una regresión
múltiple con este programa.

Lo primero es importar la base de datos al software. La siguiente imagen muestra la


base de datos ya importada al SPSS.

Figura 3.1 Base de datos en SPSS.

El paso siguiente es realizar la regresión múltiple, las imágenes que se muestran a


continuación muestran el proceso a realizar.

31
Figura 3.2 Pasos para la regresión múltiple.

Figura 3.3 Elección de las variables independientes y dependiente.

Una vez establecidas las condiciones para la regresión el software crea una ventana
aparte con un Output en donde aparecen los resultados.

32
Figura 3.4 Output con los resultados.

Siguiendo los pasos mencionados y habiendo mezclado los proyectos al azar


previamente, se elaboraron varias regresiones con distintas variables cada una. La elección de
las variables se explica en el Anexo B. La nueva variable categoría es separada en dos
variables ficticias con el fin de poder usarla en la regresión lineal8.

Para realizar los modelos se ocuparon veinte proyectos para la regresión y cuatro para
testear la exactitud de las estimaciones, los cuales se pueden ver en el Anexo A. Se ocupa el
coeficiente de determinación ajustado9 para comparar entre regresiones. Además, para
determinar la importancia de cada variable en cada regresión se mostrará los coeficientes
estandarizados beta10.

La siguiente tabla muestra las variables que se ocuparon para las cinco mejores
alternativas:

8
Al tener una variable con tres clases sólo se necesitan dos variables ficticias para poder
representarla en la regresión y en la red neuronal. Ver Anexo B.
9
Se ocupa el R 2 ajustado ya que cada regresión tiene un número distinto de variables
independientes. Ver Anexo B
10
Ver Anexo B

33
Tabla 3.9 Alternativas a realizar con R.L.M y R.N.A.
Variables Predictoras Alt. 1 Alt. 2 Alt. 3 Alt. 4 Alt. 5
Superficie(X1) X X X X X
Pisos sobre cota 0 (X2) X X X
Subterráneos(X3) X X
Clase 1 (X4) X X X X
Clase 2 (X5) X X X X
Sí empresa construye y vende (X6) X

Variable Criterio
Costo Proyecto(Y) X X X X X

La primera regresión es la siguiente:

Y = −2135,37 + 10.99 * X 1 Con R2: 0,946

Los coeficientes estandarizados son:

Coeficiente
Variable
estandarizado Beta
Superficie [m2] (X1) 0,974

La segunda regresión es la siguiente:

Y = −33794.29 + 10.42 * X 1 + 1405.86 * X 2 + 18554.59 * X 5 + 26754.07 * X 4


Con R2: 0,959

Los coeficientes estandarizados son:

Coeficiente
Variable
estandarizado
Superficie [m2] (X1) 0,923
Clase 1 (X4) 0,163
Clase 2 (X5) 0,110
Pisos sobre cota 0
0,094
[uni] (X2)

La tercera regresión es la siguiente:

Y = −32805.53 + 10.36 * X 1 + 2197.17 * X 2 − 7957.61 * X 3 + 29441.21 * X 4 + 21058.18 * X 5


Con R2: 0,966

34
Los coeficientes estandarizados son:

Coeficiente
Variable
estandarizado
Superficie [m2] (X1) 0,918
Clase 1 (X4) 0,180
Clase 2 (X5) 0,126
Pisos sobre cota 0
0,148
[uni] (X2)
Subterráneos [uni]
-0,096
(X3)

La cuarta regresión es la siguiente:

Y = −11483.98 + 10.63 * X 1 + 23889.15 * X 4 + 11950.40 * X 5


Con R2: 0,956

Los coeficientes estandarizados son:

Coeficiente
Variable
estandarizado
Superficie [m2] (X1) 0,966
Clase 1 (X4) 0,142
Clase 2 (X5) 0,072

La quinta regresión es la siguiente:

Y = −31129.90 + 10.46 * X 1 + 2439.99 * X 2 − 9140.99 * X 3 + 32633.87 * X 4 + 24276.17 * X 5 −


9048.39 * X 6

Con R2: 0,965

Los coeficientes estandarizados son:

Variable Coeficiente estandarizado

Superficie [m2] (X1) 0,927


Clase 1 (X4) 0,200
Clase 2 (X5) 0,145
Pisos sobre cota 0 [uni]
0,164
(X2)
Subterráneos [uni] (X3) -0,110
Sí empresa construye y
-0,045
vende (X6)

35
A partir de los coeficientes estandarizados de las distintas alternativas se pueden
realizar varias inferencias. Primero, para las cuatro alternativas se observa que la variable más
importante es la Superficie del proyecto, lo cual obedece a que es la variable de mayor
correlación con el costo del proyecto, a mayor superficie obviamente aumenta el costo
presupuestado. La variable ficticia clase 1 muestra un coeficiente estandarizado mayor que la
clase 2 lo que confirma que a medida que se aumentan los estándares de un edificio los costos
aumentan. Por último en los coeficientes de la alternativa 4 se observa que el número de
subterráneos posee un coeficiente estandarizado negativo lo que indica que de dos edificios
con la misma superficie total será más barato el que posea más subterráneos, esto se debe a
que el costo por metro cuadrado de subterráneo es menor. El coeficiente asociado a la variable
sí empresa construye y vende en la alternativa 5 es negativo, lo que indica que si una empresa
es inmobiliaria y constructora el costo del proyecto sale más barato que si son dos empresas
separadas. En el capítulo 4 se analizan los resultados para cada modelo.

3.4.2. Modelo basado en R.N.A.

Como ya se ha mencionado el software ocupado para realizar los modelos en redes


neuronales es el Neurosolutions5 for Excel, el cual permite manipular los datos con el editor
de planillas de cálculo lo que facilita su uso. A continuación se detallan los pasos más
importantes para obtener un modelo utilizando esta herramienta.

Lo primero es tener los datos ordenados en la planilla de cálculo para luego proceder a
etiquetar las variables que serán independientes y dependientes. Los proyectos se etiquetan
como de entrenamiento y de testeo. La siguiente figura muestra como se etiquetaron los datos.

Figura 3.5 Proceso de etiquetado de datos.

36
Una vez que se tienen todos los datos etiquetados se procede a crear la red, para eso el
software tiene tres opciones. La primera es para problemas de clasificación, la segunda para
aproximación de funciones, en ambas una vez creada la red se pueden cambiar varios
parámetros como el número de epochs11, el número de neuronas en la capa oculta y el tipo de
función de transferencia. La tercera opción permite determinar todo sobre la red, desde su
arquitectura hasta el tipo de aprendizaje. La siguiente figura muestra la selección del tipo de
red.

Figura 3.6 Elección de tipo de red.

Una vez que se elige la red a entrenar se abre automáticamente la interfaz del
Neurosolutions5, en ella se puede elegir el número de neuronas de la capa oculta y las
funciones de transferencia como se muestra en la Figura 3.7 Determinación de neuronas
capa oculta. Luego al momento de entrenar la red se elige el número de epochs, como se
muestra en la Figura 3.8.

11
Número de veces que se le presentan los datos a la red.

37
Figura 3.7 Determinación de neuronas capa oculta.

Figura 3.8 Determinación del número de epochs, al momento de entrenar una


red.

38
La siguiente figura muestra el proceso de entrenamiento de la red.

Figura 3.9 Entrenamiento de la red.

Una vez entrenada la red se procede a hacer el testeo con los proyectos que se dejaron
aparte para tal efecto, lo que se puede ver en la siguiente figura la cual muestra el resultado de
la generalización del modelo.

Figura 3.10 Testeo de la red.

39
Para todos lo modelos realizados se ocupó la opción de red para aproximación de
funciones, la cual corresponde a una red de una capa de entrada, una capa oculta y la capa se
salida. El método de aprendizaje de esta red es el algoritmo de retropropagación o
Backpropagation.

Como la técnica de redes neuronales es un método de prueba y error se realizaron


varios modelos distintos con el fin de mejorar las generalizaciones. El procedimiento ocupado
para llegar a los modelos con las mejores estimaciones es el siguiente:

- Se establece una cantidad de neuronas en la capa oculta (2 o 3 neuronas), y se van


aumentando las iteraciones o epochs (se parte con 150), una vez que empieza a disminuir la
exactitud se detiene el aumento de iteraciones.

- Luego se realiza el mismo procedimiento con un número mayor de neuronas en la capa


oculta, hasta que la exactitud de la generalización comienza a decrecer.

Lo más importante al momento de entrenar una red es no caer en la memorización de


los datos, si esto pasa, la generalización empeora de manera drástica. Para esto es necesario
no aumentar el número de grados de libertad de la red..

Al igual que con la técnica de R.L.M, se ocuparon 20 proyectos para entrenar la red y
4 para testear el nivel de generalización. Los modelos realizados son los mismos que en el
punto anterior, con el fin de poder comparar ambas técnicas de manera directa.

3.5. Modelo que estima la variación de costos de un proyecto de construcción.

3.5.1. Modelo de Regresión Lineal Múltiple.

Para estos modelos se realizaron los mismos pasos que para el modelo que estima el
costo presupuestado de un proyecto. La variable dependiente a ocupar será el costo real del
proyecto12, con el cual se calculará la variación de costos, esto ya que con el costo real como
variable dependiente se lograron mejores estimaciones.

En el anexo B se explica la elección de las variables que se ocupan en las distintas


alternativas. Las variables Complejidad de Layout y Técnicas especiales de construcción se
usaron con el procedimiento de variables ficticias, ya que son variables cualitativas. La
siguiente tabla muestra las cuatro que dieron los mejores resultados.

12
Este es el costo directo más los gastos generales al que se llegó al final de la construcción.
Ver columna Costo Real en Tabla 6.1, Anexo A.

40
Tabla 3.10 Alternativas a realizar con R.L.M y R.N.A.
Variables Predictoras Alt. 1 Alt. 2 Alt. 3 Alt. 4
Costo proyecto presupuestado
X X X X
(X1)
Superficie (X2) X X X X
Nº de pisos sobre cota 0 (X3) X
Nº de subterráneos (X4) X X
Sí empresa construye y vende
X X X X
(X5)
Complejidad del layout, alta
X X
(X6)
Complejidad del layout, media
X X
(X7)
Técnicas especiales de
X X
construcción, media (X8)
Técnicas especiales de
X X
construcción, alta(X9)

Variable Criterio
Costo real proyecto (Y) X X X X

Para realizar los modelos se ocuparon veinte proyectos para la regresión y cuatro para
testear la exactitud de las estimaciones, los cuales se pueden ver en el Anexo A. Se ocupó el
coeficiente de determinación ajustado para comparar entre regresiones. Además, para
determinar la importancia de cada variable se muestran los coeficientes estandarizados beta.

La primera regresión es la siguiente:

Y = 4109.86 + 1.104 * X 1 − 1.131 * X 2 − 3459.454 * X 5


Con R2: 0,978

Los coeficientes estandarizados son:

Coeficiente
Variable
estandarizado
Costo proyecto
presupuestado 1,096
[UF](X1)
Superficie [m2](X2) -0,102
Sí empresa construye y
-0,016
vende(X5)

41
La segunda regresión es la siguiente:

Y = −514.048 + 1.134 * X 1 − 1.754 * X 2 − 3752.229 * X 5 + 425.407 * X 3 + 1153.871 * X 4


Con R2: 0,976

Los coeficientes estandarizados son:

Coeficiente
Variable
estandarizado
Costo proyecto
presupuestado 1,126
[UF](X1)
Superficie [m2](X2) -0,158
Sí empresa construye y
-0,018
vende(X5)
Nº de pisos sobre cota
0,030
0 [uni] (X3)
Nº de subterráneos
0,019
[uni] (X4)

La tercera regresión es la siguiente:

Y = 1042 .291 + 1.01 * X 1 − 0.91 * X 2 − 7868 .308 * X 5 + 3090 .521 * X 6 + 3870 .155 * X 7
+ 3380 .795 * X 8 + 12975 .98 * X 9
Con R2: 0,975

Los coeficientes estandarizados son:


Coeficiente
Variable
estandarizado
Costo proyecto
presupuestado 1,093
[UF](X1)
Superficie [m2](X2) -0,082
Sí empresa construye y
-0,037
vende(X5)
Complejidad del
0,016
layout, alta (X6)
Complejidad del
0,020
layout, media (X7)
Técnicas especiales de
construcción, media 0,018
(X8)
Técnicas especiales de
0,046
construcción, alta(X9)

42
La cuarta regresión es la siguiente:

Y = −129 .398 + 1.124 * X 1 − 1.238 * X 2 − 7114 .795 * X 5 + 3423 .433 * X 6 + 3143 .531 * X 7
+ 3327 .438 * X 8 + 11722 .57 * X 9 + 933 .157 * X 4
Con R2: 0,973

Los coeficientes estandarizados son:

Coeficiente
Variable
estandarizado
Costo proyecto
presupuestado 1,116
[UF](X1)
Superficie [m2](X2) -,112
Sí empresa construye y
-,034
vende(X5)
Complejidad del
,018
layout, alta (X6)
Complejidad del
,016
layout, media (X7)
Técnicas especiales de
construcción, media ,018
(X8)
Técnicas especiales de
,042
construcción, alta(X9)
Nº de subterráneos
,015
[uni] (X4)

Al observar los coeficientes estandarizados se aprecia que la variable más importante


para las cuatro alternativas es el costo presupuestado. También se puede ver que el coeficiente
de la superficie es negativo, esto puede ser atribuido a que grande edificios tienden a
planificarse mejor y los procesos se estandarizan aún más, lo que implica que la mano de obra
se familiariza a un nivel que le permite trabajar más rápido y de manera más eficiente que en
proyectos más pequeños en los cuales no se alcanza este nivel de eficiencia.

Para la variable Técnicas especiales de construcción se observa que la categoría alta


tiene un coeficiente bastante mayor que la categoría baja, esto señala que la inclusión de
nuevas tecnologías en una obra incide en un aumento de costos. Esto no quiere decir que una
vez usada y asimilada esta tecnología por parte de la empresa constructora, la próxima obra
tenga problemas de costos. Al parecer las nuevas tecnologías generan un efecto de shock sólo
en la primera obra.

La variable Complejidad de layout no presenta una gran diferencia en los valores de


los coeficientes entre su categoría alta y media, pero sí se genera una diferencia con la

43
categoría baja13, esto indicaría que crece la probabilidad de un aumento de costos en un
layout de complejidad alta y media en comparación con un layout de complejidad baja, pero
la diferencia no es tan clara entre las categorías más altas. En el capítulo 4 se analizan los
resultados para cada modelo.

3.5.2. Modelo de R.N.A.

Para el modelo de redes neuronales se utilizaron las mismas alternativas mostradas


para el caso de regresión. A su vez se ocuparon los mismos veinte proyectos para entrenar la
red y los restantes cuatro para su testeo.

En este caso para cada alternativa se fue variando el número de neuronas de la capa
oculta y el número de epochs. La experiencia dice que a medida que se aumenta el número de
neuronas se debe disminuir el número de epochs, de esta manera se evita la memorización de
los datos por parte de la red en la fase de entrenamiento. El proceso se detiene cuando se
encuentra una estimación suficientemente buena. Las distintas arquitecturas para cada
alternativa se muestran a continuación.

Tabla 3.11 Configuraciones de las distintas alternativas realizadas.

Alternativa 1 N-2 N-3


Capa de Entrada 3 3
Capa Oculta 2 3
Capa de Salida 1 1

Alternativa 2 N-2 N-3 N-4


Capa de Entrada 5 5 5
Capa Oculta 2 3 4
Capa de Salida 1 1 1

Alternativa 3 N-2 N-3 N-4 N-5 N-6 N-7 N-8 N-9 N-10
Capa de Entrada 7 7 7 7 7 7 7 7 7
Capa Oculta 2 3 4 5 6 7 8 9 10
Capa de Salida 1 1 1 1 1 1 1 1 1

Alternativa 4 N-3 N-4 N-5 N-6 N-7 N-8 N-9 N-10


Capa de Entrada 8 8 8 8 8 8 8 8
Capa Oculta 3 4 5 6 7 8 9 10
Capa de Salida 1 1 1 1 1 1 1 1

13
Recordar que se necesitan sólo dos variables ficticias para una variable cualitativa de tres
categorías, la tercera categoría se expone cuando las otras dos presentes en la ecuación son
cero.

44
Para la alternativa 1 la mejor configuración fue la N-3 con 800 epochs. Para la
alternativa 2 fue la N-3 con 1000 epochs, para la alternativa 3 fue la N-10 con 150 epochs y
para la alternativa 4 fue la N-6 con 400 epochs.

Con el propósito de ilustrar el comportamiento de la red, los siguientes gráficos


muestran como varía el Error Cuadrático Medio de la estimación para distintas
configuraciones de epochs y de neuronas de la capa oculta en la alternativa 3.

ECM Vs. Epochs

0,08000
0,07000
0,06000
0,05000
ECM

4 neuronas
0,04000
3 neuronas
0,03000
0,02000
0,01000
0,00000
0 500 1000 1500 2000 2500
Epochs

Figura 3.11 ECM Vs. Epochs para 3 y 4 neuronas en la capa oculta.

ECM Vs. Epochs

0,08000

0,07000

0,06000

0,05000
7 neuronas
ECM

0,04000 6 neuronas
5 neuronas
0,03000

0,02000

0,01000

0,00000
0 500 1000 1500 2000 2500 3000 3500
Epochs

Figura 3.12 ECM Vs. Epochs para 5, 6 y 7 neuronas en la capa oculta.

45
9 neuronas
ECM Vs. Epochs
8 neuronas
10 neuronas
0,18000
0,16000
0,14000
0,12000
ECM

0,10000
0,08000
0,06000
0,04000
0,02000
0,00000
0 500 1000 1500 2000 2500 3000 3500
Epochs

Figura 3.13 ECM Vs. Epochs para 8, 9 y 10 neuronas en la capa oculta.

En estos gráficos se puede apreciar como a medida que aumenta el número de


neuronas de la capa oculta el número de epochs necesarios para mejorar el error cuadrático
medio de la estimación disminuye. Por ejemplo para lograr una buena estimación con 10
neuronas en la capa oculta se necesitan 150 epochs, pero para 5 neuronas el número de epochs
debe aumentarse a 500. Esto se relaciona con el tema de la cantidad de grados de libertad
máximo para lograr una buena generalización y así evitar la memorización de los datos. Otro
ejemplo: para 9 neuronas de la capa oculta con un número de entrenamiento de 2000 epochs,
la generalización tiende a ser bastante mala (ECM=0.16), en cambio para 5 neuronas el error
para los mismos 2000 epochs baja a 0.05, incluso si seguimos disminuyendo el número de
neuronas por ejemplo a 3, para 2000 epochs el error es de 0.04. Esto indica que la regla de
mantener un bajo número de parámetros libres sirve para mejorar la generalización. En este
caso la tendencia es que si se aumenta el número de neuronas de la capa oculta se debe
disminuir el número de epochs y viceversa.

3.6. Modelo que estima el plazo real de un proyecto de construcción.

3.6.1. Modelo de Regresión Lineal Múltiple.

Para este modelo se ocupó el plazo real como variable dependiente, ya que mostró
mejores resultados que al ocupar la variación del plazo como variable criterio. Los proyectos
utilizados para la regresión y el testeo son los mismos que para los modelos de variación de
costos. Para la elección de variables del modelo ver Anexo B.

46
A continuación se detalla la única regresión que entregó resultados cercanos a los
reales. Para este caso se ha agregado el coeficiente de determinación múltiple R214, el cual
sirve para ver que tan bien se ajusta la regresión a los datos de muestra. Al igual que en el
modelo anterior, se muestran los coeficientes estandarizados con el fin de determinar cuales
son las variables más influyentes en esta regresión.

La regresión es la siguiente:

Y = 32.920 + 0.0003 * X 1 − 0.002 * X 2 + 22.740 * X 3 + 6.386 * X 4 + 0.902 * X 5


Con R2: 0,970

Los coeficientes estandarizados son:

Coeficiente
Variable
estandarizado
Costo proyecto
presupuestado 0,171
[UF](X1)
Superficie [m2](X2) -0,125
Sí empresa construye y
0,063
vende(X3)
Nº de subterráneos
0,060
[uni] (X4)
Plazo programado
0,897
[días](X5)

3.6.2. Modelo de R.N.A.

Para este modelo se analizó la misma alternativa que para el caso de regresión lineal y
se ocuparon los mismos proyectos para el entrenamiento y testeo. En la tabla a continuación
se pueden ver distintas configuraciones para la arquitectura de la red neuronal.

Tabla 3.12 Configuraciones para la alternativa elegida.


Alternativa 1 N-2 N-3 N-4 N-5
Capa de Entrada 5 5 5 5
Capa Oculta 2 3 4 5
Capa de Salida 1 1 1 1

La mejor configuración es la N-5 con 200 epochs.

14
Ver Anexo B.

47
4. ANÁLISIS DE RESULTADOS.

4.1. Comparación de resultados.

4.1.1. Modelos que estiman un orden de magnitud del presupuesto.

En Tabla 4.1 se pueden ver los cuatro proyectos ocupados para testear las distintas
alternativas de regresión lineal y de redes neuronales. Estos proyectos fueron elegidos de
manera aleatoria y no forman parte de los datos con que se realizaron los modelos.

Tabla 4.1 Datos para testear la exactitud de las estimaciones


Proyecto Costo Proyecto Superficie Pisos sobre cota 0 Subterráneos
Clase 1 Clase 2
[UF] [m2] [uni] [uni]
1 253.165,0 22.000 1 0 20 2
2 84.783,0 7.660 0 1 10 1
3 43.271,0 3.500 0 1 6 0
4 227.413,0 24.206 0 1 21 6

De la Tabla 4.2 a la Tabla 4.6 se muestran los resultados obtenidos para las cinco
alternativas señaladas en el capítulo anterior. La columna Real contiene el costo
presupuestado para la obra que calcula la constructora, la columna Reg1 muestra la
estimación hecha por el modelo de regresión lineal explicado en el punto 3.4.1 y la columna
RNA1 contiene la estimación que entrega el modelo de redes neuronales del punto 3.4.2. Se
incluye en las tablas, con el fin de comparar de mejor manera los modelos, el error en
porcentaje de la estimación de cada uno y el error cuadrático medio. Se incluye una figura en
cada alternativa para ver de manera gráfica la diferencia en las estimaciones.

Tabla 4.2 Resultados Alternativa 1.


Costo Proyecto Presupuestado Error
Proyectos
Real Reg1 RNA1 Reg1 RNA1
1 253.165,0 239.644,7 244.674,3 -5,34% -3,35%
2 84.783,0 82.048,1 87.821,3 -3,23% 3,58%
3 43.271,0 36.329,7 55.174,7 -16,04% 27,51%
4 227.413,0 263.888,6 281.544,7 16,04% 23,80%
Error Cuadrático Medio 19.804,8 28.076,9

48
Costo pres.
Resultados Alternativa 1 Reg1
RNA1
300.000

250.000

200.000
Costo [UF]

150.000

100.000

50.000

0
1 2 3 4
Proyecto

Figura 4.1 Resultados Alternativa 1.

Tabla 4.3 Resultados Alternativa 2.


Costo Proyecto Presupuestado Error
Proyectos
Real Reg2 RNA2 Reg2 RNA2
1 253.165,0 250.317,0 262.878,6 -1,12% 3,84%
2 84.783,0 78.636,1 86.204,3 -7,25% 1,68%
3 43.271,0 29.665,5 40.326,0 -31,44% -6,81%
4 227.413,0 266.509,9 261.401,4 17,19% 14,95%
Error Cuadrático Medio 20.973,63 17.750,05

Costo pres.
Resultados Alternativa 2 Reg2
RNA2
300.000

250.000

200.000
Costo [UF]

150.000

100.000

50.000

0
1 2 3 4
Proyecto

Figura 4.2 Resultados Alternativa 2.

49
Tabla 4.4 Resultados Alternativa 3.
Costo Proyecto Presupuestado Error
Proyectos
Real Reg3 RNA3 Reg3 RNA3
1 253.165,0 252.586,9 256.518,1 -0,23% 1,32%
2 84.783,0 81.627,3 87.078,7 -3,72% 2,71%
3 43.271,0 37.698,7 47.933,0 -12,88% 10,77%
4 227.413,0 237.424,7 223.214,1 4,40% -1,85%
Error Cuadrático Medio 5.949,32 3.737,58

Costo pres.
Resultados Alternativa 3 Reg3
RNA3
300.000

250.000

200.000
Costo [UF]

150.000

100.000

50.000

0
1 2 3 4
Proyecto

Figura 4.3 Resultados Alternativa 3.

Tabla 4.5 Resultados Alternativa 4.


Costo Proyecto Presupuestado Error
Proyectos
Real Reg4 RNA4 Reg4 RNA4
1 253.165,0 246.216,3 283.708,8 -2,74% 12,06%
2 84.783,0 81.875,2 85.823,4 -3,43% 1,23%
3 43.271,0 37.663,6 44.781,5 -12,96% 3,49%
4 227.413,0 257.722,4 228.499,5 13,33% 0,48%
Error Cuadrático Medio 15.865,38 15.309,06

50
Costo pres.
Resultados Alternativa 4 Reg4
RNA4
300.000

250.000

200.000
Costo [UF]

150.000

100.000

50.000

0
1 2 3 4
Proyecto

Figura 4.4 Resultados Alternativa 4.

Tabla 4.6 Resultados Alternativa 5.


Costo Proyecto Presupuestado Error
Proyectos
Real Reg4 RNA4 Reg4 RNA4
1 253.165,0 262.211,6 261.080,3 3,57% 3,13%
2 84.783,0 79.504,7 80.431,0 -6,23% -5,13%
3 43.271,0 44.407,4 48.771,9 2,63% 12,71%
4 227.413,0 233.763,4 236.551,1 2,79% 4,02%
Error Cuadrático Medio 6.150,61 6.988,50

Costo pres.
Resultados Alternativa 5 Reg5
RNA5
300.000

250.000

200.000
Costo [UF]

150.000

100.000

50.000

0
1 2 3 4
Proyecto

Figura 4.5 Resultados Alternativa 5.

51
Tanto para el modelo de regresión múltiple como para el de redes neuronales, la
alternativa 3 es la que logra la mejor estimación. La Tabla 2.1 muestra que para una
estimación de orden de magnitud, el nivel de exactitud va desde un 30% a un 50%. Salvo una
estimación de la alternativa 2, todas mejoran este nivel de exactitud, incluso la gran mayoría
está dentro del nivel de estimación definitiva, que según la Tabla 2.1 va desde un 5% a un
10%.

En la Tabla 4.2 se observa que la alternativa 1 es la que presenta los peores


resultados, esto se puede deber a que es un modelo que considera la superficie como su única
variable independiente, con este resultado se puede inferir que a pesar de la alta correlación
entre la superficie y el costo del proyecto se hace necesario contar con más información para
realizar mejores estimaciones. En este caso la regresión logra un mejor resultado que la red
neuronal.

En la alternativa 2 en cambio la red neuronal logra un mejor resultado que el modelo


de regresión. Se observa en esta alternativa que al no considerar los subterráneos como una
variable independiente, el proyecto 4 obtiene una estimación muy por sobre el costo
presupuestado real. Este proyecto como se puede observar en la Tabla 4.1 posee una gran
superficie y un número alto de subterráneos, cuyo precio por metro cuadrado es menor que los
pisos sobre la cota cero. Debido a esto el modelo asume el mismo costo para toda la
superficie. Esto genera que la estimación sea considerablemente mayor que el costo real
presupuestado.

La alternativa 3 es la que muestra los mejores resultados al observar sus estimaciones


y el error cuadrático medio. Esta mejora comparada con la alternativa 2 se puede deber a que
considera separadamente el número de subterráneos y de pisos sobre la cota 0, detalle
importante ya que los costos por metro cuadrado de subterráneo son menores.. En este caso el
modelo de redes neuronales artificiales posee un mejor nivel de estimación que el de
regresión, salvo para el proyecto 3. Esto se puede deber a que este proyecto es
considerablemente más pequeño que los de toda la muestra. Sin embargo la alternativa 4 logra
realizar una estimación a nivel de definitiva del proyecto 3, por lo que se podría crear un
modelo escalonado para distintos rangos de tamaño.

A pesar de que la alternativa 5 contiene las mismas variables que la 3 más sí construye
y vende, no logra obtener un mejor resultado.

4.1.2. Modelo que estima la variación de costos.

En la Tabla 4.7 se pueden ver los cuatro proyectos ocupados para testear las cuatro
alternativas mostradas en el capítulo 3. Estos proyectos fueron elegidos de manera aleatoria y
no forman parte de los datos con que se realizaron los modelos.

52
Tabla 4.7 Datos para testear la exactitud de las estimaciones
Nº de
Costo pisos
Empresa Nº de Técnicas Costo real
proyecto Superficie sobre Complejidad
Proyecto construye subtes Especiales de proyecto
presupuestado [m2] cota del layout
y vende [uni] Construcción [UF]
[UF] 0
[uni]
1 no 80.700,0 8.950 12 2 baja baja 82.000,0
2 si 97.426,0 8.468 15 2 alta alta 97.780,0
3 si 186.809,2 20.470 13 2 baja alta 178.907,8
4 no 253.165,0 22.000 20 2 media baja 262.304,3

Los resultados para las distintas alternativas se muestran en las siguientes cuatro
tablas. La columna de Costo Real indica la variable dependiente, junto a esta se muestra la
estimación para la regresión lineal (Reg1) y para el modelo de redes neuronales (RNA1).
También se indica la variación real de costos (Var. real) que tuvo el proyecto y la calculada a
partir de las estimaciones de R.L.M (Var. Reg1) y de R.N.A. (Var. RNA1). Se utilizará el
error cuadrático medio con el fin de comparar de mejor manera el nivel de estimación de las
distintas alternativas y modelos. Se incluyen figuras que muestran de manera gráfica los
resultados.

Tabla 4.8 Resultados Alternativa 1 Variación de costos


Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg1 RNA1
real Reg1 RNA1
1 80.700,0 82.000,0 83.115,4 82.754,1 1,61% 2,99% 2,55%
2 97.426,0 97.780,0 98.673,8 99.891,3 0,36% 1,28% 2,53%
3 186.809,2 178.907,8 183.817,6 182.397,7 -4,23% -1,60% -2,36%
4 253.165,0 262.304,3 258.832,1 262.162,7 3,61% 2,24% 3,55%
Error Cuadrático Medio 0,0170 0,0151

53
Var real
Resultados Alternativa 1 Var. Reg1
Var. RNA1

3,00%

1,00%
Variación [%]

-1,00% 1 1,5 2 2,5 3 3,5 4

-3,00%

-5,00%
Proyectos

Figura 4.6 Resultados Alternativa 1 Variación de costos

Tabla 4.9 Resultados Alternativa 2 Variación de costos


Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg2 RNA2
1 80.700,0 82.000,0 82.741,5 81.733,2 1,61% 2,53% 1,28%
2 97.426,0 97.780,0 100.085,2 98.899,5 0,36% 2,73% 1,51%
3 186.809,2 178.907,8 179.572,7 180.679,8 -4,23% -3,87% -3,28%
4 253.165,0 262.304,3 258.892,5 262.580,2 3,61% 2,26% 3,72%
Error Cuadrático Medio 0,0145 0,0077

Var real
Resultados Alternativa 2 Var. Reg2
Var. RNA2

3,00%

1,00%
Variación [%]

-1,00% 1 1,5 2 2,5 3 3,5 4

-3,00%

-5,00%
Proyectos

Figura 4.7 Resultados Alternativa 2 Variación de costos

54
Tabla 4.10 Resultados Alternativa 3 Variación de costos
Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg3 RNA3
1 80.700,0 82.000,0 81.740,7 82.918,1 1,61% 1,29% 2,75%
2 97.426,0 97.780,0 99.196,2 99.464,6 0,36% 1,82% 2,09%
3 186.809,2 178.907,8 183.585,9 184.488,2 -4,23% -1,73% -1,24%
4 253.165,0 262.304,3 263.603,0 260.919,9 3,61% 4,12% 3,06%
Error Cuadrático Medio 0,0148 0,0184

Var real
Resultados Alternativa 3 Var. Reg3
Var. RNA3

3,00%

1,00%
Variación [%]

-1,00% 1 1,5 2 2,5 3 3,5 4

-3,00%

-5,00%
Proyectos

Figura 4.8 Resultados Alternativa 3 Variación de costos

Tabla 4.11 Resultados Alternativa 4 Variación de costos


Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg3 RNA3
1 80.700,0 82.000,0 81.390,6 81.553,2 1,61% 0,86% 1,06%
2 97.426,0 97.780,0 100.428,2 100.177,5 0,36% 3,08% 2,82%
3 186.809,2 178.907,8 182.643,5 185.431,7 -4,23% -2,23% -0,74%
4 253.165,0 262.304,3 262.284,5 263.636,5 3,61% 3,60% 4,14%
Error Cuadrático Medio 0,0173 0,0217

55
Var real
Resultados Alternativa 4 Var. Reg4
Var. RNA4

3,00%

1,00%
Variación [%]

-1,00% 1 1,5 2 2,5 3 3,5 4

-3,00%

-5,00%
Proyectos

Figura 4.9 Resultados Alternativa 4 Variación de costos

Un primer análisis muestra que tanto los cuatro modelos de redes neuronales como los
cuatro de regresión de las distintas alternativas, son capaces de predecir el signo de la
variación de costos.

Si se considera el error cuadrático medio como medida de comparación entre modelos,


salvo para la alternativa 2, los modelos de regresión lineal son superiores en sus estimaciones
que los de redes neuronales. Al ver los 4 modelos de regresión se puede inferir que el mejor es
el de la alternativa 2, le siguen el de la alternativa 3, alternativa 1 y por último el de la
alternativa 4 que es el que da la peor estimación. Curiosamente los modelos de redes
neuronales siguen el mismo orden que los modelos de regresión.

El mejor modelo de todos es el de redes neuronales de la alternativa 2 el cual tiene un


error cuadrático medio de 0.0077, le sigue el modelo de regresión de la misma alternativa con
un error de 0.0145.

4.1.3. Modelo que estima el plazo real de construcción

En la Tabla 4.12 se pueden ver los cuatro proyectos ocupados para testear el modelo
de regresión lineal y de redes neuronales.

56
Tabla 4.12 Datos para testear la exactitud de las estimaciones
Costo Plazo
Construye Superficie
Proyecto Presupuestado Subterráneos programado
y vende [m2]
[UF] [días]
1 no 80.700,0 8.950 2 330
2 no 97.426,0 8.468 2 450
3 no 186.809,2 20.470 2 480
4 no 253.165,0 22.000 2 570

Los resultados se muestran en la siguiente tabla. La columna de Plazo Real indica la


variable dependiente, junto a esta se muestra la estimación para la regresión lineal (Reg1) y
para el modelo de redes neuronales (RNA1). También se indica la variación real del plazo
(Var. real) que tuvo el proyecto y la calculada a partir de las estimaciones de R.L.M (Var.
Reg1) y de R.N.A. (Var. RNA1). Se utilizará el error cuadrático medio con el fin de comparar
de mejor manera el nivel de estimación de los dos modelos.

Tabla 4.13 Resultados variación de plazo


Plazos reales
Plazo Plazo Variación de plazos [días]
estimados [días]
Proyectos programado real
Var. Var.
[días] [días] Reg1 RNA1 Var. real
Reg1 RNA1
1 330 360 346,1 346,3 9,09% 4,87% 4,93%
2 450 480 483,2 482,3 6,67% 7,38% 7,19%
3 480 480 508,1 511,1 0,00% 5,86% 6,48%
4 570 590 582,7 582,0 3,51% 2,22% 2,10%
Error Cuadrático Medio 0,0369 0,0392

Gráficamente las variaciones se muestran en la siguiente figura.

Var. real
Resultados Alternativa 1
Var. Reg1
Var. RNA1
10,00%
9,00%
8,00%
Var. Plazo [%]

7,00%
6,00%
5,00%
4,00%
3,00%
2,00%
1,00%
0,00%
1 1,5 2 2,5 3 3,5 4
Proyectos

Figura 4.10 Resultados Variación de plazo

57
Siendo la alternativa mostrada en la página anterior la mejor de varias probadas, se
puede inferir a partir de los resultados que la variación de plazo no ha podido ser tan bien
modelada por las variables que posee la encuesta como el modelo de costos. Ante esto el
modelo es útil como un primer estimador de plazo en una fase inicial del proyecto, y no como
una fuente fidedigna del plazo real.

4.2. Validación cruzada del modelo de variación de costos

Como se puede apreciar en el punto 4.1.2 la confección de un modelo que estime


variaciones de costos podría ser posible. Con el fin de ratificar la eficacia del modelo se
realiza una validación cruzada. Esta validación se ejecuta con la misma base de datos pero
cambiando los proyectos que se ocuparon para crear y testear los modelos, esto quiere decir
que para cada validación se eligen al azar veinte proyectos para la construcción del modelo y
cuatro para su testeo.

Para realizar la validación se ha elegido las alternativas 2 y 3, las cuales se señalan en


el punto 3.5.1, ya que son las que logran las mejores estimaciones para los modelos de
variación de costos. Para cada alternativa se realizarán cinco validaciones tanto para RLM
como para RNA, lo que da un total de 20 nuevos modelos.

Adicionalmente se han incluido dos proyectos, a estos se les aplicará cada validación y
el modelo original del punto 4.1.2 con el fin de estimar su costo real y variación de costos.
Con estos dos proyectos se puede apreciar la eficacia de cada validación en estimar
variaciones de costos y servirá para definir cual es el mejor modelo posible de todos los
realizados.

4.2.1. Resultado validación cruzada

Los resultados de las cinco validaciones para cada alternativa y por tipo de técnica se
pueden apreciar en el Anexo A.

A modo de resumen se presentan las Tabla 4.14 y Tabla 4.15 las cuales contienen el
error cuadrático medio para cada validación y alternativa.

58
Tabla 4.14 ECM para validaciones de la Alternativa 2
ECM
Modelo
RNA RLM
Modelo inicial 0,0145 0,0077
Validación 1 0,0308 0,0221
Validación 2 0,1025 0,0493
Validación 3 0,0740 0,0339
Validación 4 0,0623 0,0623
Validación 5 0,0299 0,1307

Tabla 4.15 ECM para validaciones de la Alternativa 3


ECM
Modelo
RNA RLM
Modelo inicial 0,0148 0,0184
Validación 1 0,0308 0,1063
Validación 2 0,0564 0,0383
Validación 3 0,0596 0,0647
Validación 4 0,0623 0,0623
Validación 5 0,0448 0,0383

Como se observa en la Tabla 4.14 y Tabla 4.15, para ambas alternativas el modelo
inicial realiza una estimación bastante buena. El problema es que para las distintas
validaciones de una misma alternativa el ECM aumenta. Esto parece indicar que para el
modelo inicial se tomaron cuatro proyectos fáciles de predecir o sesgados, debido a que al
construir las mismas alternativas con la base de datos aleatorizada, el poder de generalización
disminuye.

4.2.2. Determinación del mejor modelo.

Los dos proyectos que se usan para establecer cuál es el mejor modelo se muestran a
continuación.

Tabla 4.16 Proyectos usados para validación de modelos


Nº de
Costo pisos
Empresa Nº de Técnicas Costo real
proyecto Superficie sobre Complejidad
Proyecto construye subtes especiales de proyecto
presupuestado [m2] cota del layout
y vende [uni] construcción [UF]
[UF] 0
[uni]
1 no 355.000,0 24.300 15 5 media alta 370.000,0
2 no 127.520,0 9.500 48 3 alta media 148.520,0

59
Cada uno de estos proyectos fue testeado en cada validación con el fin de obtener una
estimación del costo real. A continuación se muestran los resultados de las estimaciones del
proyecto 1 para cada validación de la alternativa 2 y 3. Al final de cada tabla se presenta la
variación que se obtiene promediando la media obtenida de la Alternativa 2 y 3.

Tabla 4.17 Estimaciones Proyecto 1 para técnica de RLM


Proyecto 1 RLM

Costo presupuestado 355.000,0


Costo real 370.000,0

Alternativa 2 Alternativa 3
Primer modelo 371.713,5 386.597,0
Validación1 369.870,1 389.000,6
Validación2 364.773,9 389.187,8
Validación3 371.009,0 390.803,9
Validación4 351.488,4 357.506,7
Validación5 366.405,6 391.113,7
Media 365.876,7 384.035,0

Promedio Alt. 2 y Alt. 3 374.955,8

Variación real 4,23%


Variación estimada Alt. 2 3,06%
Variación estimada Alt. 3 8,18%
Var. Est. prom. Alt. 2 y Alt. 3 5,62%

De manera gráfica se observa lo siguiente.

Alternativa 2
Estimaciones RLM Proyecto 1 Alternativa 3
Valor real
400.000,00

390.000,00
Costo real [UF]

380.000,00

370.000,00

360.000,00

350.000,00

340.000,00
1 2 3 4 5 6

Validación

Figura 4.11 Estimaciones RLM Proyecto 1


nota: la validación 1 es la estimación usando el modelo del punto 4.1.2 o primer modelo

60
Al analizar los datos de la Tabla 4.17 y la Figura 4.11 se aprecia que para el caso de
los modelos de regresión las estimaciones de la Alternativa 2 se mantienen por debajo del
valor real, en cambio las estimaciones de la Alternativa 3 se mantienen muy por encima del
valor real, salvo para el modelo 5 en donde ambas estimaciones están por debajo. A
continuación se muestran los resultados de las estimaciones del proyecto 1 para los modelos
de redes neuronales.
Tabla 4.18 Estimaciones Proyecto 1 para técnica de RNA
Proyecto 1 RNA

Costo presupuestado 355.000,0


Costo real 370.000,0

Alternativa 2 Alternativa 3
Primer modelo 367.836,5 385.362,2
Validación1 361.989,5 384.038,1
Validación2 342.674,4 390.169,0
Validación3 367.664,9 388.878,8
Validación4 328.444,0 400.624,5
Validación5 343.484,8 398.047,0
Media 352.015,68 391.186,6

Promedio Alt. 2 y Alt. 3 370.762,9

Variación real 4,23%


Variación estimada Alt. 2 -0,84%
Variación estimada Alt. 3 10,19%
Var. Est. prom. Alt. 2 y Alt. 3 4,68%

De manera gráfica se observa lo siguiente.


Alternativa 2
Estimaciones RNA Proyecto 1 Alternativa 3
Valor real
420000

400000
Costo real [UF]

380000

360000

340000

320000

300000
1 2 3 4 5 6

Validación

Figura 4.12 Estimaciones RNA Proyecto 1


61
Se observa que para este proyecto las estimaciones hechas con RNA son más precisas
que para el modelo de RLM. Al igual que en el caso anterior la Alternativa 3 se muestra por
encima del valor real y la Alternativa 2 por debajo, esto indica que se puede usar un promedio
de ambas alternativas como estimación definitiva. A continuación se pueden ver las
estimaciones para el proyecto 2 usando la técnica de RLM.

Tabla 4.19 Estimaciones Proyecto 2 para técnica de RLM


Proyecto 2 RLM

Costo presupuestado 127.520,0


Costo real 148.520,0

Alternativa 2 Alternativa 3
Primer modelo 151.357,8 139.256,1
Validación1 166.269,6 141.168,4
Validación2 166.225,7 136.839,4
Validación3 161.540,0 138.954,9
Validación4 141.987,4 136.915,9
Validación5 168.798,7 139.371,6
Media 159.363,2 138.751,0

Promedio Alt. 2 y Alt. 3 149.057,1

Variación real 16,47%


Variación estimada Alt. 2 24,97%
Variación estimada Alt. 3 8,81%
Var. Est. prom. Alt. 2 y Alt. 3 16,89%

Graficando los datos de la Tabla se puede ver lo siguiente.


Alternativa 2
Estimaciones RLM Proyecto 2 Alternativa 3
Valor real
180.000,00

170.000,00
Costo real [UF]

160.000,00

150.000,00

140.000,00

130.000,00

120.000,00
1 2 3 4 5 6

Validación

Figura 4.13 Estimaciones RLM Proyecto 2

62
Para este proyecto se observa que la Alternativa 3 está por debajo del valor real y la
Alternativa 2 por sobre. La siguiente tabla contiene las estimaciones para los modelos de
redes neuronales.

Tabla 4.20 Estimaciones Proyecto 2 para técnica de RNA


Proyecto 2 RNA

Costo presupuestado 127.520,0


Costo real 148.520,0

Alternativa 2 Alternativa 3
Primer modelo 147.420,5 136.291,2
Validación1 166.264,4 138.193,6
Validación2 176.219,7 136.240,0
Validación3 171.389,4 137.994,1
Validación4 158.141,1 137.891,5
Validación5 185.960,7 136.022,9
Media 167.566,0 137.105,6

Promedio Alt. 2 y Alt. 3 152.335,8

Variación real 16,47%


Variación estimada Alt. 2 31,40%
Variación estimada Alt. 3 7,52%
Var. Est. prom. Alt. 2 y Alt. 3 19,46%

Graficando los datos de la tabla anterior queda:

Alternativa 2
Estimaciones RNA Proyecto 2 Alternativa 3
Valor real
200000
190000
180000
Costo real [UF]

170000
160000
150000
140000
130000
120000
110000
100000
1 2 3 4 5 6

Validación

Figura 4.14 Estimaciones RNA Proyecto 2

63
Al igual que en el modelo de RLM para este proyecto la Alternativa 3 va por debajo del
valor real y la Alternativa 2 por sobre. Al observar los resultados para el proyecto 2 se extrae
que la estimación promedio de los modelos de RLM es mejor a la de los modelos de RNA.

A juzgar por los resultados obtenidos en las estimaciones de cada proyecto el modelo
definitivo puede ser un promedio de las medias de cada alternativa, esto ya que al parecer una
alternativa tiende a subdimensionar el costo real y la otra a sobredimensionarlo.

4.3. Comentarios del capítulo

Al analizar el resultado de las alternativas 3, 4 y 5 que estiman el costo presupuestado,


se puede decir que las variables escogidas resuelven de buena manera el problema. Una
modificación que podría generar un mejor resultado sería separar la superficie total del
proyecto en la correspondiente a los subterráneos y a los pisos sobre la cota 0. Esto debido a
que el número de subterráneos se estableció como una variable importante a la hora de
predecir el costo presupuestado, ya que el costo por metro cuadrado es menor a los pisos
sobre la cota 0. De esta manera se tendría una información más acuciosa del proyecto a
estudiar y posiblemente una mejor estimación.

La variable cualitativa categoría dividida en dos clases demostró ser importante para
los modelos de redes neuronales, esto se aprecia en la marcada diferencia entre las
estimaciones de la Alternativa 1 y la 4, las cuales muestran un ECM de 28.076,9 y 15.309,06
respectivamente. La primera alternativa ocupa la superficie como única variable, en cambio la
cuarta agrega la variable categoría y esto mejora considerablemente las estimaciones, salvo
para el proyecto 1. Esta mejoría no fue tan marcada en los modelos de regresión, con un ECM
de 19.804,8 y 15.865,38 respectivamente, y que para el proyecto 2, 3 y 4 presenta peores
estimaciones que el modelo de RNA, esto se puede deber al carácter de cualitativa de la
variable ya que al parecer los modelos de RNA asimilan de mejor manera este tipo de
variables.

La mejor alternativa según el R2 ajustado es la número 3 y dentro de esta el modelo de


redes neuronales es la que tiene el menor error cuadrático medio, seguido por el modelo de
regresión de la alternativa 5. El problema de la alternativa 3 es que no se ajusta bien al
proyecto 3 el cual es el más pequeño de la base de datos. Ante esto se podría crear un modelo
por rangos de proyectos. Para esto se debe elegir una de las opciones que logre una buena
estimación del proyecto 3, si se considera esta condición se podría ocupar el modelo de
regresión de la alternativa 5 para proyectos de menos de 5.000 [m2], esta parece ser una mejor
alternativa que el modelo de redes neuronales de la alternativa 4 ya que esta presenta un ECM
de 6.150,61 versus uno de 15.309,06.

Un aspecto importante a considerar en la predicción del Costo Presupuestado es que


cada empresa tiene distintas maneras de realizar su presupuesto, sobre todo en el porcentaje

64
que destinan a gastos generales y sueldos de sus empleados por lo que un proyecto con las
mismas características puede tener costos diferentes. También varía el rendimiento y costos
de los subcontratistas con que cuenta la empresa. Estos distintos escenarios hacen que un
modelo de estas características presente un rango pequeño de riesgo, el cual es muy complejo
de medir.

En el caso del modelo para predecir la variación de costos en una primera etapa, antes
de la validación, se lograron buenos resultados. El modelo de RNA de la alternativa 2 fue la
que obtuvo los mejores resultados con los ECM más bajos. Lo sigue la RLM de la alternativa
3 la cual excluye las variables pisos sobre cota 0 y subterráneos e incluye complejidad del
layout y técnicas especiales de construcción. El hecho de mantener un buen nivel de
estimación al cambiar las variables, refleja que se han escogido las que al parecer resuelven el
problema. Se debe mencionar que se hizo un modelo que incluyó todas las variables utilizadas
en las cuatro alternativas y que dio un peor resultado.

Se puede apreciar en cada una de las alternativas que, para un proyecto cuya
inmobiliaria pertenece a la misma empresa que construye, la variación de costos tiende a
disminuir, incluso puede ser negativa. Una razón para esto es que en el caso contrario las
empresas constructoras con el fin de ganar una licitación presentan propuestas difíciles de
cumplir. A su vez una constructora del mismo holding que la inmobiliaria no tiene necesidad
de ganar una propuesta, por ende los presupuestos y programaciones son más veraces o
apegados a la realidad que los otros. Esto se ve reflejado en las distintas regresiones en donde
el coeficiente que acompaña a esta variable es negativo y cuyo valor que puede significar la
utilidad del proyecto, de ahí radica la importancia de incluir esta variable obligatoriamente en
todas las alternativas.

El objetivo de la validación hecha para las alternativas 2 y 3 era demostrar que las
variables escogidas realmente podían resolver el problema. Se pudo observar que al hacer las
validaciones los resultados variaron bastante. Esto se refleja en el cambio que presenta el
ECM para cada validación. Esta fuerte variación se puede explicar en parte por que la
cantidad de proyectos era insuficiente para establecer de manera clara los patrones que rigen
el problema. Quizás con una mayor cantidad de proyectos las variaciones del ECM para cada
validación hubiesen sido menores.

Como en este caso el número de proyectos es pequeño, la importancia de realizar un


modelo con varias validaciones radica en que se asegura una mejor estimación en caso de que
alguna presente desviaciones muy grandes, como se ve en la Figura 4.11 para la validación
número 5. A esto se puede agregar que para este problema específico se dio que, dependiendo
del proyecto, una alternativa subvalora el costo real y la otra lo sobrevalora. Si se consideran
estos hechos, la mejor opción es promediar las seis estimaciones de cada alternativa, así se
evitan desviaciones grandes, y luego promediar la alternativa 2 y la 3. De esta manera se
obtiene un modelo que estima un valor centrado muy cerca del costo real como se muestra en
las siguientes tablas de resumen para los proyectos 1 y 2 definidos en la Tabla 2.1.

65
Tabla 4.21 Promedio de estimaciones para el proyecto 1
Variación RLM Variación RNA
Var. Prom. Alt. 2 Var. Prom. Alt. 3 Var. Prom. Alt. 2 Var. Prom. Alt. 3
3,06% 8,18% -0,84% 10,19%

Promedio Alt.2 y Alt. 3 RLM 5,62%


Promedio Alt.2 y Alt. 3 RNA 4,68%
Proyecto 1 Var. Real 4,23%

Tabla 4.22 Promedio de estimaciones para el proyecto 2


Variación RLM Variación RNA
Var. Prom. Alt. 2 Var. Prom. Alt. 3 Var. Prom. Alt. 2 Var. Prom. Alt. 3
24,97% 8,81% 31,40% 7,52%

Promedio Alt.2 y Alt. 3 RLM 16,89%


Promedio Alt.2 y Alt. 3 RNA 19,46%
Proyecto 2 Var. Real 16,47%

La siguiente tabla muestra el ECM asociado a la técnica de RLM y RNA de las tablas
anteriores para la predicción de las variaciones de costos para los dos proyectos.

Tabla 4.23 ECM de las estimaciones obtenidas en la validación, modelo 1


Promedio Alt.2 y Alt. 3 RLM Promedio Alt.2 y Alt. 3 RNA
ECM 0,0103 0,0214

En las tablas 4.21 y 4.22 se puede ver que al promediar los resultados de las dos alternativas,
tanto para la técnica de RNA como de RLM, se logra un buen nivel de estimación de la
variación de costos, lo cual se observa en el bajo ECM que presentan. Ante estos buenos
resultados se define el modelo 1 como el promedio de las estimaciones obtenidas por la
alternativa 2 y 3. Por otro lado, la alternativa 2 inicial mostrada en el punto 4.1.2, muestra una
buena estimación tanto de los cuatro proyectos de testeo como de los últimos dos usados para
testear las validaciones, a esta opción se la llamará modelo 2. La siguiente tabla muestra estos
resultados.

66
Tabla 4.24 ECM para el modelo 2
Variación de costos
Proyectos Var. real Alternativa 2
Reg2 RNA2
1 1,61% 2,53% 1,28%
2 0,36% 2,73% 1,51%
3 -4,23% -3,87% -3,28%
4 3,61% 2,26% 3,72%
5a 4,23% 4,71% 3,62%
6a 16,47% 18,69% 15,61%

ECM 0,0150 0,0076


a: proyectos que pertenecen a la Tabla 4.16
Claramente la técnica de RNA logra la mejor estimación para el modelo 2. El
problema surge al momento de comparar el modelo 1 con el 2 ya que sólo se pueden
comparar para los dos últimos proyectos, debido a que son los únicos testeados en ambas
opciones. La siguiente tabla muestra un resumen comparativo de los ECM para los dos
modelos pero sólo para la predicción de los dos últimos proyectos.

Tabla 4.25 Comparación de ECM por técnicas y modelos


RLM RNA
a
ECM modelo 1 0,0103 0,0214
ECM modelo 2b 0,0249 0,0110
a: ECM mostrados en la Tabla 4.23
b: ECM solo para los proyectos 5 y 6 mostrados en la Tabla 4.16

Como se observa en la Tabla 4.25 el menor ECM es para el modelo 1 utilizando la


técnica de regresión lineal múltiple seguido por el modelo de redes neuronales artificiales del
modelo 2.

Ante los resultados se escoge el modelo 1 como predictor de variaciones de costos, no


sólo por mostrar un ECM menor al modelo 2, si no por que al ser un promedio de varios sub-
modelos se nivelan posibles predicciones con variaciones extremas. Sin embargo el modelo 2
de RNA muestra un excelente resultado como se puede ver en la Tabla 4.25 por lo que
también se considera un modelo válido como predictor de costos.

67
5. COMENTARIOS Y CONCLUSIONES.

El principal objetivo de este trabajo de título es analizar la factibilidad de desarrollar


un modelo capaz de predecir variaciones de costos y plazos. Según los resultados vistos en el
capítulo 4 se puede decir que sí es posible realizar un modelo de esas características.

Una de las razones claves para el buen resultado fue encausar la investigación sólo a
un tipo de proyecto, en este caso a construcción habitacional en altura. Este tipo de proyecto
muestra una estandarización importante en sus procesos constructivos, quizás más de lo que
se cree, lo que genera que sus resultados puedan ser modelados. Por otro lado, los proyectos
de construcción enfocados a otros sectores, por ejemplo: industrial o comercial, muestran una
dispersión de resultados mucho más amplia por lo que buscar patrones es bastante más
complejo. Otra razón importante para optar por este tipo de construcción es la gran cantidad
de edificios construidos y en construcción en Santiago, lo que facilita el acceso a la
recolección de datos.

A pesar de lo accesible de los datos para este tipo de proyectos se debe tener bastante
cuidado a la hora de hacer una encuesta. En estos casos siempre existirá un error asociado a
cómo el profesional contesta la encuesta ya que cada persona puede entender de una manera
distinta ciertas preguntas. Por ejemplo en algunas variables un poco más subjetivas como la
complejidad de layout, para un profesional un layout de una obra puede ser de complejidad
media y para otro puede ser de complejidad baja. Para minimizar este tipo de problemas se
deben mejorar aún más las definiciones de las variables, esto quiere decir tratar de reducir al
mínimo las posibles subjetividades que puede enfrentar la encuesta. Por otro lado el hecho de
que para casi todas las alternativas que estiman el costo presupuestado se obtuvieran buenos
resultados indica que las variables escogidas son representativas del problema. A su vez para
el modelo de variación de costos también las variables escogidas explicaron el problema. En
cambio para el modelo que estima variaciones de plazo, no se logró encontrar la combinación
de variables que obtuviera buenos resultados, esto se puede deber a que el nivel de
incertidumbre en este caso es mayor que en el problema de costos o simplemente las variables
de la encuesta fueron insuficientes para encontrar los patrones necesarios.

Como se ha visto en este trabajo de título la inclusión de técnicas novedosas en la


gestión de la construcción es posible. Por un lado las redes neuronales artificiales son una
herramienta que permite resolver ciertos problemas que las técnicas más clásicas no logran.
Además es una técnica relativamente fácil de emplear en donde no es necesario tener vastos
conocimientos previos. Otra ventaja importante es que las redes neuronales no imponen
condiciones de partida a los datos, como puede ser linealidad, distribución normal, etc. La
desventaja de las RNA radica en que su comportamiento es una caja negra, esto significa que
su comportamiento es muy difícil de interpretar y es limitada la información que se puede
sacar de ella. Esta desventaja hace que los métodos estadísticos como la regresión lineal
múltiple cobren fuerza, ya que al usar esta técnica se puede obtener información valiosa sobre
las variables que se ocupan.
68
Ninguna de las dos técnicas es cien por cien efectiva por lo que combinarlas parece ser
la mejor opción. En este caso se puede utilizar la estadística para determinar las variables más
importantes y para realizar inferencias a partir de ciertos resultados.

Un análisis importante al momento de realizar modelos de estas características es


chequear el nivel de representatividad que tienen. En esta investigación se realizaron varias
validaciones para los posibles modelos, esto es importante cuando la base de datos es
pequeña. Si se tiene una base de datos extensa se puede realizar un número menor de
validaciones. Por ejemplo se puede dividir la muestra en dos y con cada mitad realizar el
mismo modelo y chequear el poder de generalización de cada uno. Otra opción es realizar
modelos escalonados, para esto se puede dividir un modelo dependiendo de la superficie que
tienen los proyectos, etc.

Lo importante es que independiente de la técnica escogida para realizar estos modelos,


la base de datos sea representativa de la industria. Como conclusión final se considera que
tanto el modelo 1 como el modelo 2 mostrados en el capítulo anterior no son excluyentes por
lo que llegado el momento de usarlos como herramienta de gestión se pueden considerar
ambos.

69
6. ANEXO A

Tabla 6.1 Proyectos usados para generar los distintos modelos


Costo Empresa Pisos sobre
Superficie Subterráneos
Proyecto Presupuestado construye Comuna cota 0
[m2] [uni]
[UF] y vende [uni]
1 123.000,00 10.500 si Chillán 16 1
2 125.265,00 11.014 si Ñuñoa 16 1
3 80.700,00 8.950 no Santiago 12 2
4 58.565,19 5.200 no Ñuñoa 4 1
5 224.306,35 19.764 si Ñuñoa 21 3
6 97.426,00 8.468 si Las Condes 15 2
7 130.000,00 13.268 si Las Condes 16 2
8 94.891,00 8.901 si Las Condes 14 1
9 186.809,22 20.470 si Ñuñoa 13 2
10 63.706,50 6.050 si Providencia 9 3
11 121.000,00 10.700 si Ñuñoa 13 1
12 336.164,40 26.170 si Las Condes 27 2
13 89.000,00 6.437 no Las Condes 12 1
14 149.500,00 13.000 si Santiago 24 4
15 157.214,00 13.757 si Providencia 14 2
16 185.101,00 16.956 si Valparaíso 16 1
17 122.867,00 12.275 si Recoleta 20 1
18 168.069,00 18.150 no Santiago 26 4
19 253.165,00 22.000 no Las Condes 20 2
20 157.781,00 16.303 si Valparaiso 16 1
21 376.778,00 34.837 si San Miguel 16 2
22 84.783,00 7.660 si Santiago 10 1
23 43.271,00 3.500 no Rancagua 6 1
24 227.413,00 24.206 si Providencia 21 6

70
Continuación Tabla 6.1
Valor de Empresa Técnicas Plazo Sueldo
Complejidad
Proyecto venta posee especiales de programado jornal
del layout
[UF/m2] certificación construcción [días] [pesos]
1 35 no alta 450 alta 150.000
2 28 no baja 540 media 268.000
3 31 no baja 330 baja 190.000
4 31 no baja 240 alta 180.000
5 30 no medio 527 baja 205.000
6 46,5 no medio 450 alta 225.000
7 45 no medio 500 baja 180.000
8 44,3 no medio 460 baja 210.000
9 33 no medio 480 baja 180.000
10 37 no alta 420 alta 180.000
11 32 si baja 420 alta 190.000
12 50 no baja 660 baja 240.000
13 41,9 si baja 390 alta 194.008
14 30 si medio 540 media 180.000
15 35 no baja 450 baja 205.000
16 25 si baja 420 baja 185.000
17 26 si baja 480 baja 200.000
18 32 si baja 480 baja 200.000
19 42 si baja 570 media 200.000
20 25 no baja 390 baja 200.000
21 26 no medio 990 media 180.000
22 31 no medio 396 media 190.000
23 35 no baja 360 baja 150.000
24 36 si baja 570 media 180.000

71
Continuación Tabla 6.1
Fecha Fecha Tipo de
Proyecto Arquitecto Ingeniero
inicio Termino Estructura
1 Ago-05 Dic-06 muros Carlos Belmar Patricio Bonelli
Pedro Bartolome
2 Nov-05 Jun-07 muros Navarrete,Page y Asoc.
Bachelet
R. Gatica -
3 Nov-04 Oct-05 muros Gastón Figueroa
J.Jimenez
R. Gatica -
4 Jul-04 Mar-05 muros IVI Arquitectos
J.Jimenez
5 Ago-05 Mar-07 muros Fernandez Wood Eduardo Spoerer
6 Oct-05 Ene-07 muros Almagro Eduardo Spoerer
7 Nov-04 Abr-06 muros Almagro Spoerer asociados
8 Jun-05 Oct-06 muros Almagro Eduardo Spoerer
9 Mar-05 Ago-06 muros Hernando Arrigada Pilar Menendez
10 Jun-03 Jul-04 muros Jorgue Millan Pilar Menendez
11 Sep-05 Dic-07 muros Patrri Turnerr Eduardo Spoerer
12 Jun-04 Abr-06 muros Squella Arquitectura René Lagos
13 Jul-06 Ago-07 muros Apt y Fleiserman Lenora Morales
14 Ene-05 Ago-06 muros Manuel Alarcon Santoloya
15 May-06 Ago-07 muros Fernandez Wood luis soler
16 Mar-04 Jun-05 muros Saavedra y Asoc. Alfonso Larrain
17 Jun-04 Dic-05 muros Juan Luis Hurtado Alfonso Larrain
18 Sep-04 Dic-05 muros Allamand y Gaona Asoc. Alfonso Larrain
Alemparte, Barreda y
19 Nov-06 Jul-07 muros René lagos
asoc
20 Abr-04 May-05 muros Vicente Perez Alfonso Larrain
21 Sep-04 Jul-07 muros Leyton Arquitectos Gonzalo Santolaya
22 Oct-05 Ene-07 muros Eugenio Molina Morel Pedro Bartolomé B.
23 Ago-06 Jul-07 muros Senarq Arquitectura Inges
24 Ene-04 Jun-06 muros Paz Gatica-Jimenez

72
Continuación Tabla 6.1
Experiencia Experiencia Nº obras Monto
Profesión Accesibilidad
Proyecto empresa administrador extraordinarias OOEE
administrador materiales
[años] [años] [uni] [UF]
Constructor
1 500.000 7 alta 10 15.000,0
Civil
Constructor
2 . 4 media 5 3.368,9
Civil
Constructor
3 2.700.000 12 alta 64 1.300,0
Civil
Constructor
4 2.700.000 10 alta 52 5.086,0
Civil
Ingeniero
5 . 12 alta 0 0,0
Civil
Constructor
6 1.087.000 4 alta 8 1.200,0
Civil
Constructor
7 1.087.000 3 alta 3 240,0
Civil
Ingeniero
8 1.087.000 3 alta 5 0,0
Civil
Constructor
9 1.800.000 25 alta 0 0,0
Civil
Ingeniero
10 1.800.000 12 alta 0 0,0
Civil
Constructor
11 800.000 7 alta 0 1.000,0
Civil
Ingeniero
12 2.500.000 10 alta 0 7.748,0
Civil
Ingeniero
13 500.000 14 alta 0 2.500,0
Civil
Constructor
14 500.000 5 alta 0 0,0
Civil
Constructor
15 . 5 alta 0 1.749,7
Civil
Constructor
16 1.351.000 12 alta 0 4.700,0
Civil
Ingeniero
17 1.351.000 5 alta 0 5.628,0
Civil
Constructor
18 1.351.000 7 media 0 10.600,0
Civil
Ingeniero
19 . 17 alta 107 4.995,0
Civil
Constructor
20 1.351.000 10 baja 0 0,0
Civil
Constructor
21 2.700.000 15 alta 0 0,0
Civil
Constructor
22 275.000 10 alta 35 4.657,2
Civil
Constructor
23 . 7 alta 0 2.000,0
Civil
Constructor
24 400.000 5 alta 15 8.600,0
Civil

73
Continuación Tabla 6.1
Variación
Subcontratación Plazo real Costo real Variación
Proyecto Software Plazo
[%] [días] [UF] Costo [UF]
[días]
1 no 40,00% 480 138.000,00 30 15.000,00
2 no 63,00% 540 128.634,00 0 3.369,00
3 no 80,00% 360 82.000,00 30 1.300,00
4 no . 300 63.618,20 60 5.053,01
5 si 52,00% 589 227.700,00 62 3.393,65
6 no . 480 97.780,00 30 354,00
7 si 31,00% 510 129.000,00 10 -1.000,00
8 no 30,50% 471 94.160,00 11 -731,00
9 si . 480 178.907,80 0 -7.901,42
10 si . 450 70.966,50 30 7.260,00
11 no 25,00% 480 122.800,00 60 1.800,00
12 si 46,00% 690 352.542,70 30 16.378,30
13 si 50,00% 420 93.450,00 30 4.450,00
14 si . 570 155.740,00 30 6.240,00
15 si 61,30% 450 143.242,00 0 -13.972,00
16 si . 450 144.132,94 30 -40.968,06
17 si 32,00% 540 123.813,08 60 946,08
18 si 37,00% 450 173.111,07 -30 5.042,07
19 no . 590 262.304,30 20 9.139,30
20 si 70,00% 390 172.383,00 0 14.602,00
21 no 32,00% 1005 376.778,00 15 0,00
22 si . 441 86.142,92 45 1.359,92
23 no 60,00% 360 45.000,00 0 1.729,00
24 no 90,00% 660 226.500,00 90 -913,00

Resultados Alternativa 2 Validación1


Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg3 RNA3
1 376.778,0 376.778,0 362.627,0 371.502,8 0,00% -3,76% -1,40%
2 84.783,0 86.143,0 82.804,6 88.831,3 1,60% -2,33% 4,77%
3 149.500,0 155.740,0 160.043,8 154.271,3 4,17% 7,05% 3,19%
4 125.265,0 126.634,0 126.459,0 125.417,9 2,69% 0,95% 0,12%
Error Cuadrático Medio 0,0308 0,0221

74
Resultados Alternativa 2 Validación2
Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg3 RNA3
1 224.306,4 227.700,0 227.217,0 225.803,8 1,51% 1,30% 0,67%
2 168.069,0 173.111,1 181.642,7 187.079,7 3,00% 8,08% 11,31%
3 63.706,5 70.966,5 58.594,4 67.751,7 11,40% -8,02% 6,35%
4 80.700,0 82.000,0 85.349,0 80.913,8 1,61% 5,76% 0,26%
Error Cuadrático Medio 0,1025 0,0493

Resultados Alternativa 2 Validación 3


Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg3 RNA3
1 157.214,0 143.242,0 157.528,7 150.468,3 -8,89% 0,20% -4,29%
2 376.778,0 376.778,0 366.642,4 366.654,6 0,00% -2,69% -2,69%
3 63.706,5 70.966,5 63.770,3 71.937,5 11,40% 0,10% 12,92%
4 186.809,2 178.907,8 176.444,2 171.575,5 -4,23% -5,55% -8,15%
Error Cuadrático Medio 0,0740 0,0339

Resultados Alternativa 2 Validación 4


Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg3 RNA3
1 89.000,0 93.450,0 90.354,4 84.581,5 5,00% 1,52% -4,96%
2 336.164,4 352.542,7 332.489,0 338.966,7 4,87% -1,09% 0,83%
3 58.565,2 63.618,2 58.131,2 54.446,6 8,63% -0,74% -7,03%
4 253.165,0 262.304,3 251.011,2 253.687,2 3,61% -0,85% 0,21%
Error Cuadrático Medio 0,0740 0,0965

Resultados Alternativa 2 Validación 5


Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg3 RNA3
1 376.778,0 376.778,0 362.735,1 365.828,9 0,00% -3,73% -2,91%
2 168.069,0 173.111,1 179.897,9 187.350,1 3,00% 7,04% 11,47%
3 130.000,0 129.000,0 129.032,2 127.591,6 -0,77% -0,74% -1,85%
4 43.271,0 45.000,0 46.022,2 55.615,8 4,00% 6,36% 28,53%
Error Cuadrático Medio 0,0299 0,1307

75
Resultados Alternativa 3 Validación 1
Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg3 RNA3
1 376.778,0 376.778,0 362.627,0 395.909,3 0,00% -3,76% 5,08%
2 84.783,0 86.143,0 82.804,6 74.356,1 1,60% -2,33% -12,30%
3 149.500,0 155.740,0 160.043,8 142.249,3 4,17% 7,05% -4,85%
4 125.265,0 126.634,0 126.459,0 113.197,6 2,69% 0,95% -9,63%
Error Cuadrático Medio 0,0308 0,1063

Resultados Alternativa 3 Validación 2


Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg3 RNA3
1 224.306,4 227.700,0 223.419,9 218.092,2 1,51% -0,40% -2,77%
2 168.069,0 173.111,1 165.300,6 172.500,4 3,00% -1,65% 2,64%
3 63.706,5 70.966,5 76.946,4 74.926,0 11,40% 20,78% 17,61%
4 80.700,0 82.000,0 78.978,6 80.957,7 1,61% -2,13% 0,32%
Error Cuadrático Medio 0,0564 0,0383

Resultados Alternativa 3 Validación 3


Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg3 RNA3
1 157.214,0 143.242,0 154.840,5 153.498,7 -8,89% -1,51% -2,36%
2 376.778,0 376.778,0 387.906,3 392.571,1 0,00% 2,95% 4,19%
3 63.706,5 70.966,5 76.086,3 76.879,1 11,40% 19,43% 20,68%
4 186.809,2 178.907,8 186.009,3 187.494,7 -4,23% -0,43% 0,37%
Error Cuadrático Medio 0,0596 0,0647

Resultados Alternativa 3 Validación 4


Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var.
[UF] Reg2 RNA2 Var. real
Reg3 RNA3
1 89.000,0 93.450,0 93.450,0 90.535,0 5,00% 6,50% 1,72%
2 336.164,4 352.542,7 352.542,7 298.617,1 4,87% -6,27% -11,17%
3 58.565,2 63.618,2 63.618,2 65.701,1 8,63% 15,17% 12,18%
4 253.165,0 262.304,3 262.304,3 251.755,5 3,61% 1,38% -0,56%
Error Cuadrático Medio 0,0660 0,0863

76
Resultados Alternativa 3 Validación 5
Costos reales
Costo Variación de costos [%]
Costo estimados [UF]
Proyectos Presupuestado
real [UF] Var. Var. Var.
[UF] Reg2 RNA2
real Reg3 RNA3
1 376.778,0 376.778,0 387.873,8 401.463,9 0,00% 2,94% 6,55%
2 168.069,0 173.111,1 167.007,4 168.222,8 3,00% -0,63% 0,09%
3 130.000,0 129.000,0 126.041,8 125.866,1 -0,77% -3,04% -3,18%
4 43.271,0 45.000,0 41.842,7 45.509,8 4,00% -3,30% 5,17%
Error Cuadrático Medio 0,0448 0,0383

77
7. ANEXO B

7.1. Definiciones

A continuación se definen algunos conceptos utilizados en este trabajo de título. Para


un estudio más profundo de cada concepto se recomienda el libro Análisis Multivariante
[Hair et al, 1999a] y Estadística Elemental [Triola, 2000ª].

i. Análisis de Regresión Lineal Múltiple: Es una técnica estadística que se utiliza para
analizar la relación entre una única variable dependiente y varias variables
independientes. El objetivo es usar las variables independientes para predecir la única
variable dependiente. Las variables independientes son ponderadas de manera de
indicar su contribución relativa a la predicción conjunta. Las ponderaciones facilitan la
interpretación de la influencia de cada variable en la realización de la predicción.

ii. Variables Ficticias: Una variable ficticia es una variable dicotómica que representa
una categoría de una variable independiente no métrica. Cualquier variable
independiente que posee k categorías puede ser representada como variable ficticia k-
1. Por ejemplo una variable con tres categorías puede ser expresada con dos variables
ficticias que toman los valores de 0 o 1.

iii. R2 ajustado: Este se usa para comparar diferentes ecuaciones de regresión múltiple ya
que ajusta el valor de R2 según el número de variables y el tamaño de muestra. El
coeficiente de correlación múltiple (R2) es una medida de que tan bien se ajusta la
ecuación de regresión a los datos. El ajuste es muy bueno si el valor se aproxima a 1 y
malo si se aproxima a 0.

iv. Coeficientes beta: Estos coeficientes eliminan el problema de tener diferentes


unidades en las variables independientes y reflejan la importancia relativa sobre la
variable dependiente de un cambio en una desviación estándar de cada variable. Con
esta unidad común de medida se puede determinar qué variable es más influyente.

7.2. Selección de variables

Para la selección de variables se utilizó como guía el libro Análisis Multivariante [Hair
et al, 1999b].

La primera eliminación de variables fue para aquellas que tienen valores en blanco,
por ejemplo: Nivel de subcontratación, experiencia empresa constructora. Luego se eliminó

78
la variable tipo de estructura, ya que todos los edificios caen en la misma categoría. La
variable accesibilidad de los materiales no se consideró ya que para cada categoría se contaba
con pocos ejemplos. Esto debido a que la categoría alta se presentaba en casi la totalidad de
los proyectos.

Las variables Arquitecto e Ingeniero no se consideraron ya que presentaban una gran


dispersión de resultados. Si bien se pensó categorizar los resultados, el factor subjetividad al
momento de realizarlo desechó esta opción.

Con todas las variables sobrantes y ocupando el software SPSS, se procedió a seguir
los pasos explicados en el libro Análisis Multivariante. El primer paso fue utilizar todas las
variables y dejar que el mismo software decidiera cual era la mejor combinación. Esto gracias
a que el SPSS cuenta con métodos de regresión lineal destinados a este ejercicio (método
stepwise, backward, foward). El problema es que salvo para el método backward, la única
variable que consideraban en la regresión final era el costo presupuestado. El método
backward entregó cinco variables más, pisos sobre cota 0, número de subterráneos, empresa
construye y vende, complejidad del layout y si la empresa posee certificación. Al tener
regresiones tan pobres en el número de variables, el libro entrega otra opción, agregar más
variables de manera manual. El procedimiento es el siguiente: Cada vez que se incluye una
nueva variable en la regresión se analiza su poder de generalización. Esto se hizo ocupando
los cuatro proyectos dejados fuera para testear los modelos. Así se realizaron varias
regresiones, ocupando como base, las entregadas por los métodos del SPSS antes
mencionados y una tabla de correlaciones de las variables. Las mejores regresiones a las que
se llegó en cada problema, son las mostradas en este trabajo de título.

79
8. BIBLIOGRAFÍA

- ATTALLA, M.; HEGAZY, T. 2003. Predicting Cost Deviation in Reconstruction


Projects: Artificial Neural Networks versus Regression. J. Constr. Eng. Manage.
129(4):405-411.

- BACCARINI, D. 2005. Understanding Project Cost Contingency- A Survey. In: QUT


Research Week 2005. Conference Proceedings. Brisbane, Australia. 4-5 July
2005. The Queensland University of Technology Research Week International
Conference.

- CASARES, M. 2007. Servicios CDT más tecnologías de la información. BIT. 53:40-42.

- EZELDIN, AS.; SHARARA, L. 2006. Neural Networks for Estimating the Productivity
of Concreting Activities. J. Constr. Eng. Manage. 132(6):650-661.

- GEORGY, M.; CHANG, L-M.; ZHANG, L. 2005. Prediction of Engineering


Performance: A Neurofuzzy Approach. J. Constr. Eng. Manage. 131(5):548-557.

- HAIR, J.; ANDERSON, R.; TATHAM, R.; BLACK, W. 1999a. Introducción. In:
Análisis Multivariante. 5ª ed. Prentice Hall Iberia, S.R.L. Madrid, España. pp 1-
28.

- HAIR, J.; ANDERSON, R.; TATHAM, R.; BLACK, W. 1999b. Análisis de regresión
múltiple. In: Análisis Multivariante. 5ª ed. Prentice Hall Iberia, S.R.L. Madrid,
España. pp 143-206.

- HAYKIN, S. 1994. Least-Mean-Square Algorithm. In: Neural Networks. A


Comprehensive Foundation. Macmillan College Publishing Company, Inc. USA.
pp 121-137.

- LIU, M.; LING, Y. 2005. Modeling a Contractor´s Markup. J. Constr. Eng. Manage.
131(4):391-399.

- MARTÍN DEL BRÍO, B.; SANZ A. 2001. Redes neuronales supervisadas. In: Redes
Neuronales y Sistemas Difusos. 2ª ed. Alfaomega Grupo Editor, S.A. Colombia.
pp 41-84.

- PÉREZ, C. 2005. Técnicas Estadísticas con SPSS 12. Aplicaciones al análisis de datos.
Pearson Educación S.A. Madrid, España. 824 p.

- PRINCIPE, J.; EULIANO, N.; LEFEVRE, WC. 2000. Neural and Adaptive Systems.
Fundamentals Through Simulations. John Wiley & Sons, Inc. USA. 656 p.

80
- SIQUEIRA, I. 1999. Neural Network-Based Cost Estimating. Presented in partial
Fulfillment of the Requirements For the Degree of Masters of Applied Science.
Quebec, Canada. Concordia University. 87 p.

- SUTRISNA, M.; POTTS, K.; PROVERBS, D. BUCKLEY, K. 2005. A decision


support tool for the valuation of variations on civil engineering projects. RICS.
5(7):1-43.

- TRIOLA, M. 2000a. Introducción a la estadística. In: Estadística Elemental. 7ª ed.


Addison Wesley Longman. Naucalpan de Juárez, México. pp 2-35.

- TRIOLA, M. 2000b. Correlación y regresión. In: Estadística Elemental. 7ª ed. Addison


Wesley Longman. Naucalpan de Juárez, México. pp 474-533.

- WILMOT, CH.; MEI, B. 2005. Neural Network Modeling of Highway Construction


Costs. J. Constr. Eng. Manage. 131(7):765-771.

81

También podría gustarte