Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
• Por un lado, recordar la distinción fundamental que existe entre verificación y validación, la
cual debe ir estrechamente ligada al objetivo perseguido por el modelo elaborado.
• En segundo lugar, justificar cómo no es posible aplicar un único enfoque de validación, para
la totalidad de los problemas analizados.
• En último lugar, recopilar y estructurar los distintos tests de validación, que aseguran la
validez de cualquier modelo de dinámica de sistemas.
Palabras Clave
Un problema surge cuando existe una diferencia entre la situación existente y la deseada, o entre
la posición actual de un sistema y su posición potencial, o se percibe alguna clase de
insatisfacción con la actuación de un sistema, o se toma conciencia de la existencia de
oportunidades, o de la relación de desarmonía entre la realidad y las propias preferencias (Oral y
Kettani, 1993). Es precisamente si tales percepciones se dan en el ámbito de la empresa, cuando
el esfuerzo directivo debe ir dirigido a solucionar ese problema. No obstante, y dada la gran
diversidad de problemas organizativos, estos pueden ser abordados desde distintos ángulos, lo
que da lugar a distintas disciplinas y aproximaciones. Así, y recogiendo la clasificación de los
dos citados autores, cabría distinguir entre:
• Problemas prototipo. Se trata de situaciones bien conocidas, que requieren de poco o ningún
esfuerzo conceptual, siendo fácilmente formalizables. El énfasis del análisis se pone en el
desarrollo de algoritmos que proporcionen una solución al problema objeto de estudio.
Estos distintos enfoques tienen, no obstante, un punto común: la construcción de modelos. Esos
modelos pueden ser clasificados de muy diversos modos; así, cabría hablar de modelos físicos
versus simbólicos, modelos dinámicos versus estáticos, modelos deterministas versus
estocásticos, ... Esta distinción es importante desde el momento en que no existe un acuerdo
general sobre que constituye un modelo válido (Déry, Landry y Banville, 1993).
Antes de abordar el tema de la validez de los modelos, conviene tener claros una serie de
conceptos. En este sentido resulta esencial distinguir entre:
Validación: persigue que el modelo sea lo bastante bueno. Esta valoración depende del propio
objetivo del modelo (Kleinjnen, 1995). Consiste pues en un proceso, por el cual
los científicos se aseguran así mismos, y a los demás, que una teoría o modelo es
una descripción de un fenómeno determinado, siendo adecuado para los usos para
los cuales será aplicado (Miser, 1993).
Por tanto, y a tenor de lo expuesto, cabe afirmar que, tan sólo después de que se considere que
el modelo de simulación fue correctamente programado —es un modelo verificado—, cabe
plantearse los problemas relativos a la validación del mismo.
Oral y Kettani (1993) consideran que el objetivo de una validación adecuada es producir
información que ayude a los usuarios potenciales a aceptar o rechazar el modelo; por tanto no se
puede perseguir, exactamente, el mismo enfoque de validación para todos los tipos de
problemas; pues los objetivos básicos de los modelos varían de uno a otro, de modo
considerable. Es necesario pues, centrarse en el desarrollo de una metodología de validación
particular para cada tipo de problema, en vez de insistir en una metodología universal de
validación, aplicable a todos las categorías de problemas. Este último propósito resultaría una
tarea difícil, cuando no imposible, ya que no existe un acuerdo sobre qué es un modelo
validado, o en qué consiste el proceso de validación (Déry, Landry y Banville, 1993).
∗ La crítica racionalista o teoría del falsacionismo considera que la validación de los modelos
debería adoptar la forma de un proceso de falsación, dirigido a comprobar las teorías y los
modelos a través de las hipótesis. Teniendo en cuenta que los modelos se derivan de las
teorías, las cuales a su vez se sustentan en conjeturas, uno nunca estaría en condiciones de
asegurar que el modelo es válido; pudiendo, a lo sumo —al no haber sido todavía
rechazado—, llegar a afirmar que es validable.
En cualquier caso ambos enfoques, consideran a la validez como un asunto de exactitud, más
que de utilidad.
3
Desde esta última perspectiva, la validación tiene que tener componentes informales,
subjetivos y cualitativos, consistiendo en un proceso gradual de otorgar confianza al modelo,
más que un problema de aceptación o de rechazo (Barlas, 1996).
Así pues, no existe un proceso de validación, aplicable a todos los tipos de problemas socio-
económicos; por lo que debe profundizarse en el desarrollo de distintas metodologías de
validación —aplicables cada una de ellas, a un tipo de problema—, en vez de tratar de obtener
una metodología de validación universal, (Oral y Kettani, 1993).
4
Esos tests plantean serios problemas de autocorrelación y de multicolinealidad, pues asumen
que los datos no están autocorrelacionados, no presentan correlación cruzada y tienen una
distribución normal, mientras que los datos generados por un modelo de dinámica de sistemas
son autocorrelacionados y presentan correlación cruzada debido a su propia naturaleza. Además,
los modelos de dinámica de sistemas no tienen como resultado una única variable en la que
centrar los tests de validación; pues, normalmente, son múltiples las variables relevantes en el
estudio. Por tanto, si el proceso de validación del modelo adoptase la forma de tests
estadísticos1, surgiría el problema de estimar el nivel de significación en los tests simultáneos de
múltiples hipótesis, no existiendo una solución lo bastante general para ser usada en un proceso
automatizado de validación (Barlas, 1996).
Además de las dificultades apuntadas, Barlas (1996) y Kleijnen (1995), resaltan la relativa al
establecimiento de un nivel de significación para el test estadístico. El test de significación
estadística consiste en anticipar una hipótesis nula, la cual será rechazada si la discrepancia entre
lo que tal hipótesis predice y los datos reales es estadísticamente significativa; pues ello
significaría que tal discrepancia no puede ser atribuida a la mera casualidad. Para llevar a cabo
este test es necesario establecer un nivel de discrepancia, por encima del cual la hipótesis nula
será rechazada. Esto implica aceptar cierta probabilidad de error, puesto que ese nivel de
discrepancia, o de significación, es fijado arbitrariamente —lo normal es que asuma el valor de
un 5%—, aún a pesar de que es él el que determina la zona de rechazo de la hipótesis nula, o lo
que es lo mismo, la probabilidad de rechazar una hipótesis nula, que sin embargo es verdadera
—error tipo I, error ?? o riesgo del modelador—. Se corre además el peligro, de incurrir en otro
tipo de error —error tipo II, error ?, o riesgo del usuario del modelo—, que supone la aceptación
de una hipótesis nula, que es falsa.
Una vez fijado el nivel de significación, se pueden cometer dos tipos de errores: rechazar un
modelo que es válido, o aceptar un modelo que no es válido. La solución a este problema no es
sencilla, pues si se elige un nivel de significación pequeño, se reduce la probabilidad de cometer
un error tipo I, pero se aumenta la probabilidad de incurrir en un error tipo II; mientras que un
nivel de significación elevado produce el efecto contrario. Para cada tipo de problema abordado
el coste de estos dos tipos de errores es distinto; y por tanto, en caso de que tales costes sean
conocidos, debería buscarse un nivel de significación óptimo, que minimizase el coste total de
comisión de ambos tipos de errores2. No obstante, la estimación de tales costes es difícil
(cuando no imposible) de efectuar; por lo que las distintas escuelas proponen soluciones a este
problema:
♣ La lógica positivista no vincula la validación del modelo al propósito del mismo; por tanto,
para ella, el nivel de significación elegido marcará la zona de rechazo o de aceptación del
1
Pese a todo, Barlas (1996) reconoce que la estadística es necesaria a la hora de comprobar la precisión
de la predicción que resulta del comportamiento del modelo, una vez que la validez de su estructura ya
ha quedado establecida.
2
Para aquellos modelos construidos para comprobar teorías, la verdad de ésta debe ser probada
objetivamente con independencia de los costes de comisión del error tipo I o tipo II. Por tanto, en este
caso, es necesario usar tests de significación estadística para rechazar o aceptar el modelo. No obstante,
la filosofía holística, considera que la confirmación de una teoría se obtiene a través de un proceso
gradual; por lo que no pueden ser aplicadas las nociones de verdad absoluta y de objetividad; ya que
esta última suele interpretarse, como una visión desapasionada del tema objeto de estudio, lo cual no es
aplicable en la construcción de modelos, pues estos siempre incluyen el punto de vista del modelador.
De hecho, el test de significación estadística es muy poco utilizado en las ciencias sociales, incluso
cuando los problemas técnicos señalados anteriormente, se encuentren resueltos. Pues la aplicación de
este test en las ciencias sociales tiende a buscar más asociaciones empíricas, que hipótesis explicativas,
contribuyendo esto a empobrecer la teoría (Barlas, 1996).
5
modelo desde un punto de vista totalmente objetivo, determinándose así, la veracidad o
falsedad del modelo.
♣ La filosofía holística, al igual que el instrumentalismo, considera que la validez, depende del
propósito del modelo; por lo que el nivel de significación debería depender igualmente de tal
propósito. Es preciso, por tanto, considerar los costes que tiene, para el modelador y para el
usuario, aceptar un modelo inválido, frente a los que les supone rechazar uno válido. Esto
conduce a la necesidad de introducir juicios de valor, ya que el modelo será aceptado
siempre y cuando se considere que es más beneficioso utilizarlo, que no hacerlo.
3
Así por ejemplo, para el investigador un modelo debería ser considerado útil, si genera señales dentro
de la estructura del sistema real, que permitan hacer predicciones correctas y estimular el planteamiento
de cuestiones significativas para futuros desarrollos.
6
cualquier caso, la validez es un término relativo por dos motivos: (1) porque para modelizar la
realidad casi siempre existen múltiples modelos entre los que hay que elegir aquel de mayor
confianza y (2) porque el modelo elaborado sólo puede ser correctamente valorado con relación
a un propósito particular, es decir, es inútil tratar de establecer que un modelo es útil, sin
especificar para que propósito va a ser usado.
Por tanto no existe un único test que sirva para validar el modelo. Por este motivo es adecuado
seguir un planteamiento popperiano (Bell y Senge, 1980) a la hora de obtener una base sólida,
que permita descubrir errores en el modelo y fomente la búsqueda de mecanismos causales,
esenciales para el análisis de las políticas y de su influencia sobre el comportamiento del
sistema.
Por tanto, la comprobación estadística debería considerarse como condición necesaria, pero no
suficiente, para validar el modelo.
4
Bell y Senge, en su artículo de 1980, justifican este hecho poniendo como ejemplo la explicación causal
de Newton al movimiento de los planetas. Pues ni el principio de inercia, ni el de gravitación son
observables de forma independiente, al impedirlo la acción de factores externos y la fuerza de gravedad
de la Tierra.
7
β) Validación de la actuación del modelo
Para obtener los datos pueden emplearse diversos métodos, tales como entrevistas
estructuradas, o no estructuradas, con los participantes en el sistema que está siendo
modelado, análisis, observaciones “in-situ”, así como otros métodos indirectos (Ram y Ram,
1996). En cualquier caso, para la elaboración de un modelo son fundamentales tres tipos de
datos (Oral y Kettani, 1993):
Constituyen la categoría de datos más rica de las tres. En ellos se incluye la experiencia,
el conocimiento, el juicio, las percepciones y la creatividad de los individuos, siendo
por tanto necesario un proceso de, incluso, varios años de duración, para su formación.
Sólo incluyen información cuantitativa; por tanto, pueden ser considerados como un
subconjunto de los datos escritos. No obstante, gracias a ellos es posible establecer el
valor de los parámetros del modelo. La utilización de los datos obtenidos en un modelo
en otro, —aún y cuando este segundo analice un tema semejante—, debe efectuase con
sumo cuidado; pues podría dar lugar al empleo de datos inconsistentes con la definición
y el objetivo del modelo (Graham, 1980).
La elección de las variables del sistema determinará los datos que se precisan, así como
la necesidad o no de agregar los mismos. Las variables, en los estudios de dinámica de
sistemas, son elegidas, tanto porque pueden reproducir las causas de los problemas que
están siendo analizados, como porque pueden ser reconocidas y validadas por los
participantes en la construcción del modelo. Esta consideración favorece el uso de
variables a un nivel de agregación próximo al nivel observable por los individuos; sin
8
que sea preciso detenerse en consideraciones sobre si los mismos están o no
estadísticamente disponibles5.
En este sentido es posible distinguir entre (Graham, 1980): datos por debajo del nivel de
agregación6 de las variables del modelo —datos desagregados— y datos al nivel de
agregación de dichas variables —datos agregados—. Los primeros son información a
cerca de acontecimientos y elementos que, una vez agregados, se corresponden con
variables del modelo. No obstante, tal agregación nunca debería efectuarse sobre la base
de algún informe o recuento, efectuado por un agregado estadístico.
• Identificar para qué tipos de problemas el modelo puede ser una herramienta de
resolución útil, así como la calidad de las soluciones aportadas por el mismo.
Tiene por objeto ayudar a los usuarios potenciales a aceptar o rechazar el modelo, siendo
denominado por Oral y Kettani (1993) como “validación a cerca de la idoneidad del
modelo”. Analiza tanto la representatividad como la utilidad, el coste y las sinergias, que
conlleva el empleo del modelo para sus usuarios. Estos deben estar convencidos de que el
modelo permite ofrecer soluciones al problema, proporcionando mejoras importantes frente a
otras técnicas. Fomentar esa creencia es labor del modelador; quien debe ser capaz de
transmitir el grado de confianza que tiene en el modelo. Con relación a este aspecto, cabe
señalar (Oral y Kettani, 1993), que la dinámica de sistemas es una metodología que
incorpora bucles de realimentación, permitiendo así, profundizar en el entendimiento de las
relaciones más importantes entre los elementos clave del sistema. Esto permite a su vez,
incorporar factores causales en el proceso de análisis del problema.
La Figura 1 esquematiza los tests que, con carácter general, deben ser empleados a la hora de
constatar la validez del modelo de dinámica de sistemas; mientras que la Figura 2 pone de
manifiesto la secuencia a seguir a la hora de realizarlos. En primer lugar deben aplicarse los
tests de validación estructural, para pasar posteriormente a la utilización de los tests de
validación del comportamiento. Pues sólo cuando el modelo pasa con éxito los tests
estructurales, se puede tener confianza en la habilidad del mismo para reproducir
5
Tal es el caso de objetivos y presiones psicológicas, las cuales son raramente medidas, pudiendo, sin
embargo, ser fundamentales en la descripción del modelo, a cerca de porqué surge un problema.
6
El nivel de agregación está siempre estrechamente relacionado con el modelo en construcción. Así,
datos que se encuentran por debajo del nivel de agregación para un modelo, pueden ser datos al nivel
de agregación para otro (Graham, 1980).
9
comportamientos pasados del sistema y generar recomendaciones7. Esta habilidad del modelo
añade a su vez, credibilidad sobre la utilidad del mismo para proponer políticas alternativas que
mejoren la actuación del sistema.
Test estadísticos de
Test Empíricos
validación del
comportamiento
Tests Teóricos
• Tests directos de estructura: estos determinan la validación del modelo por medio de la
comparación directa de éste con el conocimiento que se posee sobre la estructura del sistema.
Dentro de ellos es posible distinguir entre: tests teóricos o tests empíricos, en función de que
se trate de tests que comparan la estructura del modelo con el conocimiento teórico sobre el
sistema, o que la comparen con información cuantitativa, o cualitativa, obtenida directamente
del sistema que está siendo modelado.
7
Barlas (1989) señala que un modelo con errores estructurales es capaz de reproducir con gran exactitud
comportamientos del sistema; de ahí la importancia de realizar, en primer lugar, los tests estructurales.
Por su parte, las dificultades de un modelo estructuralmente sólido, para reproducir con exactitud los
comportamientos del sistema, se encuentran en el hecho de que algún parámetro o input exógeno ha
sido mal representado en el modelo, lo cual es más fácil de percibir y corregir, que cualquier error
estructural.
10
reproducción del comportamiento del sistema, dato por dato, es prácticamente imposible, aún
y cuando el modelo sea estructuralmente adecuado (Sterman, 1984). Por consiguiente, los tests
indirectos de estructura deben poner el énfasis en analizar la habilidad del modelo para
reproducir patrones de comportamiento observados en la realidad, y no una serie de datos
puntuales (Barlas, 1996).
Por medio de los tests de validación del comportamiento se aplicarán una serie de medidas
estadísticas, al objeto de analizar el porqué de las diferencias percibidas entre los datos
históricos y los obtenidos por medio de la simulación del modelo.
Finalmente, con los tests de implicaciones de las políticas se intenta verificar si la respuesta de
un sistema a los cambios en las políticas recomendadas por el modelo, corresponde a las
predicciones obtenidas a través de éste (Forrester y Senge, 1980).
Falla Falla
Falla
Tests indirectos de
estructura
8
Las dos vinculaciones discontinuas denotan la posibilidad de saltar de una revisión del modelo, a los
tests indirectos de estructura, o a los tests de validación del comportamiento, siempre y cuando, la
revisión efectuada al modelo no haya sido de contenido estructural.
11
IV. Síntesis
A lo largo de este trabajo se ha intentado justificar, cómo las numerosas críticas efectuadas a la
dinámica de sistemas, derivadas de la falta del empleo de técnicas cuantitativas —y en especial
de carácter estadístico—, a la hora de validar el modelo que reproduce la estructura del sistema,
y sobre el cual se analizarán las fuerzas que generan el comportamiento observado, carecen de
fundamento y son resultado del desconocimiento sobre el verdadero objeto de esta herramienta,
así como de las fases que engloba.
Aún y cuando todavía queda camino por recorrer en la construcción de un armazón de técnicas
de validación dinámica, son múltiples y muy variados —cualitativos y cuantitativos, teóricos y
empíricos, directos e indirectos— los tests que actualmente se aplican para garantizar la
validación del modelo dinámico, sin que el empleo de técnicas exclusivamente estadísticas,
tenga porqué conllevar un mayor carácter científico de las disciplinas que las emplean, frente a
la dinámica de sistemas.
V. Bibliografía:
Barlas, Y., and Carpenter S.: «Philosophical roots of model validation: Two paradigms», System
Dynamics Review Vol 6 No 2, 1990, pp 148-166.
Barlas, Y.: «Multiple tests for validation of system dynamics type of simulation models»,
European Journals of Operational Research, No 42, 1989, pp 59-87.
Barlas, Y.: «Formal aspects of model validity and validation in system dynamics», System
Dynamics Review Vol 12 No 3, otoño 1996, pp 183-210.
Bell, J.A. y Senge, P.M.: «Methods for enhancing refutability in system dynamics modeling»,
TIMS Studies in Management Sciences No 14, 1980 pp 61-73.
Déry, R., Landry, M. y Banville, C.: «Revisiting the issue of model validation in OR: An
epistemological view», European Journals of Operational Research, No 66, 1993, pp
168-183.
Forrester, J.W. (1961): Industrial dynamics. The MIT Press, Cambridge, Massachusetts.
Forrester, J.W. y Senge, P.: «Tests, for building confidence in system dynamic models». TIMS
Studies in Management Sciences No 14, 1980 pp 209-228.
Law, A.M. y Kelton, W.D. (1991): Simulation Modeling and Analysis. 2ª Ed. McGraw–Hill,
New York.
12
Miser, H.J.: «A foundational concept of science appropriate for validation in operational
research», European Journals of Operational Research, No 66, 1993, pp 204-215.
Oral, M. y Kettani, O.: «The facets of the modeling and validation process in operations
research», European Journals of Operational Research, No 66, 1993, pp 216-234.
Ram, S. y Ram, S.: «Validation of expert systems for innovation management: Issues,
methology and empirical assessment», Journal Product Innovation Management, Vol 13,
No 1, En-1996, pp 53-68.
Starr, P.: «Modeling issues and decisions in system dynamics», TIMS Studies in the
Management Science, No 14, 1980 pp 45-59.
Sterman, J.D.: «Appropiate summary statistic for evaluating the historical fit of system
dynamics models», Dynamica, Vol 10 Parte II, invierno 1984, pp 51-66.
13