Está en la página 1de 408

Fundamentos de los

Sistemas de Ayuda
a la Decisión
Sixto Ríos Insua
Concepción Bielza Lozoya
Alfonso Mateos Caballero
Grupo de Análisis de Decisiones
Departamento de Inteligencia Artificial
Facultad de Informática
Universidad Politécnica de Madrid
Fundamentos de los Sistemas de Ayuda a la Decisión
© Sixto Ríos Insua, Concepción Bielza Lozoya y Alfonso Mateos Caballero
© De la edición RA-MA 2002

MARCAS COMERCIALES: Las designaciones utilizadas por las empresas para distinguir
sus productos (hardware, software, sistemas operativos, etc.) suelen ser marcas registradas.
RA-MA ha intentado a lo largo de este libro distinguir las marcas comerciales de los
términos descriptivos, siguiendo el estilo que utiliza el fabricante, sin intención de infringir
la marca y sólo en beneficio del propietario de la misma. Los datos de los ejemplos y pantallas
son ficticios a no ser que se especifique lo contrario.
RA-MA es marca comercial registrada.

Se ha puesto el máximo empeño en ofrecer al lector una información completa y precisa.


Sin embargo, RA-MA Editorial no asume ninguna responsabilidad derivada de su uso,
ni tampoco por cualquier violación de patentes ni otros derechos de terceras partes que pudieran
ocurrir. Esta publicación tiene por objeto proporcionar unos conocimientos precisos y acreditados
sobre el tema tratado. Su venta no supone para el editor ninguna forma de asistencia legal,
administrativa ni de ningún otro tipo. En caso de precisarse asesoría legal u otra forma de ayuda
experta, deben buscarse los servicios de un profesional competente.

Reservados todos los derechos de publicación en cualquier idioma.

Según lo dispuesto en el Código Penal vigente ninguna parte de este libro puede ser
reproducida, grabada en sistema de almacenamiento o transmitida en forma alguna ni
por cualquier procedimiento, ya sea electrónico, mecánico, reprográfico, magnético o
cualquier otro, sin autorización previa y por escrito de RA-MA; su contenido está protegido
por la Ley vigente que establece penas de prisión y/o multas a quienes intencionadamente,
reprodujeren o plagiaren, en todo o en parte, una obra literaria, artística o científica.

Editado por
RA-MA Editorial
Ctra. de Canillas, 144
28043 MADRID
Teléfono: 91 381 03 00
Fax: 91 38103 72
Correo electrónico: editorial@ra-ma.com
Internet: www.ra-ma.es y wwww.ra-ma.com
ISBN: 84-7897-494-6
Depósito Legal: M-53234-2001
Autoedición: Autores
Filmación e impresión: Albadalejo, S.L.
Impreso en España
Primera impresión: enero 2002
ÍNDICE

PRÓLOGO x¡

1 INTRODUCCIÓN A LA TÓMA DE DECISIONES 1


1.1 LA COMPLEJIDAD EN LA TOMA
DE DECISIONES ........................................................................... 2
1.2 EL ANÁLISIS DE DECISIONES..................................................... 4
1.3 EL PROCESO DEL ANÁLISIS DE DECISIONES...................... ... 6
1.4 VARIABLES Y OBJETIVOS....................................................... ... 8
1.4.1 Las variables en el modelo................................................. 9
1.4.2 Estructuración de objetivos............................................•. 10
1.4.3 Ejemplo ilustrativo: Elección de un sistema
informático....................................................................... 14
1.5 GENERACIÓN DE ALTERNATIVAS......................................... 16
1.5.1 Dificultades para generar buenas alternativas...................
1.6 DISCUSIÓN ................................................................................ 21
1.7 EJERCICIOS....................................................................... .. • • 23

2 PREFERENCIAS EN CERTIDUMBRE . 25
2.1 PREFERENCIA ESTRICTA E INDIFERENCIA.........................26
2.2 RELACIONES BINARIAS..........................................................29
2.3 PREFERENCIAS DÉBILES....................................................... 33
2.4 TEORÍA DEL VALOR ORDINAL...............................................37
2.5 FUNCIONES DE VALOR MEDIBLES .......................................40
2.6 SEMIÓRDENES Y ÓRDENES DE INTERVALO......................... 47
2.7 ALTERNATIVAS MULTIATRIBUTO.......................................... 49
2.7.1 Estructuración de los objetivos..........................................49
vi FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA D ECISIÓN_____________ © RA-MA

2.7.2 Independencia preferencia! p a ra dos a t r i b u t o s ........................ 5 3


2.7.3 Descom ponibilidad aditiva de la función de valor sobre dos
a t r i b u t o s ..................................................................................................
2.7.4 Independencia preferencial y descom ponibilidad aditiva de
la función de valor para tres atributos............................... ....
2.7.5 Independencia preferencial y descom ponibilidad aditiva de
la función de valor para n atributos, n > 3 ......................... 59
2.7.6 Descomponibilidad lineal de la función de valor.................60
2.7.7 Descuento en el tie m p o ...................................................... 62
2.7.8 Descomponibilidad biyectiva y monótona de la función de
valor ....................... ..............................................................64
2.7.9 Eficiencia y optimalidad de P areto.....................................65
2.8 SOFTWARE: VISA . : ................................................................. 72
2.9 DISCUSIÓN................................................................. ) .............76
2.10 EJERCICIOS.................................................................................. 77

3 INCERTIDUMBRE Y SU MODELIZACIÓN 81
3.1 SUCESOS ALEATORIOS Y RESULTADOS............................... 82
3.2 ENFOQUES DE LA PROBABILIDAD........................................82
3.2.1 Enfoque clásico.................................................................... 83
3.2.2 Enfoque frecuentista............................................................84
3.2.3 Enfoque subjetivo.............................................................. 86
3.3 DISTRIBUCIONES DE PROBABILIDAD Y
PROPIEDADES.............................................................................88
3.3.1 Axiomas de la probabilidad................................................ 88
3.3.2 Operaciones con sucesos......................................................89
3.3.3 Probabilidad condicionada e independencia de sucesos . . . 90
3.3.4 Distribuciones de probabilidad.......................................... 92
3.4 ÁRBOLES DE PROBABILIDAD ................................................ 95
3.5 REVISIÓN DE JUICIOS Y TEOREMA
DEBAYES..................................................................................... 97
3.5.1 Teorema de B a y e s ...............................................................98
3.5.2 Efecto sobre la revisión de los juicios probabilísticos . . . • 100
3.6 EDUCCIÓN DE PROBABILIDADES...........................................103
3.6.1 Métodos de asignación......................................................... 103
3.6.2 Heurísticas y s e s g o s ............................................................ Bp
© R A -M A _________ _____________________________________________________________ ÍN DICE vil

3.6.3 Preparación para la educción.............................................115


3.6.4 Comparación de métodos. Consistencia y coherencia . . . . 117
3.6.5 Asignación de probabilidades de sucesos muy raros........... 118
3.7 DISCUSIÓN ................................................................................. 121
3.8 EJERCICIOS................................................................................. 123

4 PREFERENCIAS EN INCERTIDUMBRE 127


4.1 PREFERENCIAS SOBRE LOTERÍAS .......................................129
4.2 MÉTODOS DE ASIGNACIÓN DE LA
FUNCIÓN DE UTILIDAD ...........................................................135
4.3 ACTITUDES FRENTE AL RIESGO ..........................................140
4.4 TEORÍA DE LA UTILIDAD MULTIATRIBUTO...................... 143
4.4.1 Formas funcionales de utilidades biatributo...................... 144
4.4.2 Formas funcionales de utilidades con tres atributos........... 148
4.4.3 Generalización a utilidades multiatributo .........................150
4.4.4 Relaciones entre condiciones de independencia en utilidad
y teoremas de representación adicionales............................153
4.4.5 Métodos de asignación de funciones de utilidad
multiatributo..................................................................... 156
4.4.6 Estructuras jerárquicas y preferencias condicionales........... 159
4.5 SOFTWARE: Logical Decisions................... ...............................161
4.6 DISCUSIÓN .................................................. ................ ............. 165
4.7 EJERCICIOS................................................................................ 166

5 TABLAS Y ÁRBOLES DE DECISIÓN 173


5.1 TABLAS DE DECISIÓN............................;■...............................173
5.2 ÁRBOLES DE DECISIÓN.......................................................... 176
5.2.1 Definición........................................................................... 176
5.2.2 Evaluación ........................................................................ 179
5.2.3 Equivalencia entre tablas y árboles.................................... 183
5.2.4 Propiedades.........................................................................185
5.3 SOFTWARE.................................... ............................................ 191
5.3.1 D P L .................................................................................... 193
5.4 DISCUSIÓN..................................................................................194
5.5 EJERCICIOS.................................................................................. 196
viii fu n d a m e n t o s d e l o s s is t e m a s d e a y u d a a l a d e c i s i ó n ___________

6 DIAGRAM AS DE IN F L U E N C IA 2o
6.1 ESTRUCTURA B Á S IC A ................................................................... ...
6.2 DEFINICIÓN FORMAL...................................................................... ...
6.2.1 Descripción cualitativa.......................................................... 2Qg
6.2.2 Descripción cuantitativa....................................................... 2q^
6.3 EVALUACIÓN..................................................................................... ...
6.3.1 Transformaciones........................................................... 2Qg
6.3.2 Algoritmo de evaluación....................................................... 2^
6.4 PROPIEDADES . . . . . . . . . . ............................................................. ...
6.5 SOFTWARE .........................................................................................224

3 B ..................................................................................... ••226
6.6 D ISC U SIÓ N ............ ........................................................................... 229
6.7 EJERCICIOS........................................................................................ 232

7 M ODELOS G R Á FIC O S A LTERN A TIV O S 237


7.1 ÁRBOLES ALTERNATIVOS............................................................. 237
7.1.1 Árboles de escenarios ............................................................. 237
7.1.2 Árboles de ju e g o ...................................................................... 240
7.1.3 Formulación algebraica.............................................................245
7.2 DIAGRAMAS DE INFLUENCIA
ALTERNATIVOS............................................................................... 250
7.2.1 Diagramas de influencia con varios nodos de v a l o r ............ 250
7.2.2 Diagramas de influencia a sim é tric o s.....................................254
7.3 RESOLUCIÓN APROXIMADA MEDIANTE
MÉTODOS DE SIMULACIÓN.......................................................... 262
7.3.1 Modelos con pocas dependencias probabilísticas y
decisiones.................................................................................. 262
7.3.2 Modelos más c o m p lejo s.......................................................... 265
7.4 DISCUSIÓN .........................................................................................266
7.5 EJERCICIOS......................................................................................... 267

8 A N Á LISIS D E SE N SIB ILID A D 269


8.1 IDENTIFICACIÓN Y ESTRUCTURACIÓN
DEL PR O B LEM A ................................................................................ 270
8.2 CONSIDERACIONES DE D O M IN A N C IA ..................................... 271
© RA-MA ÍNDICE Ix

8.3 DIAGRAMAS T O R N A D O ................................................................ 277


8.4 ANÁLISIS DE SENSIBILIDAD SOBRE UN
PA R Á M E T R O ..................................................................................... 280
8.5 ANÁLISIS DE SENSIBILIDAD SOBRE DOS
PARÁMETROS CONJUNTAMENTE..............................................282
8 .6 ANÁLISIS DE SENSIBILIDAD SOBRE TRES PARÁMETROS
CONJUNTAMENTE............................................................................ 285
8.7 ANÁLISIS DE SENSIBILIDAD SOBRE LAS
PROBABILIDADES............................................................................ 286
8.7.1 Con dos alternativas............ ................................................... 287
8.7.2 Con tres alternativas * ..............................................................289
8 .8 VALOR DE LA INFORMACIÓN.......................................................292
8.8.1 Valor esperado de la información p e rfe c ta ............... .. . . . 293
8.8.2 Valor esperado de la inform ación.......................................... 294
8.8.3 Valor esperado de la información imperfecta........................ 295
8.9 DISCUSIÓN ........................................................................................296
8.10 E JE R C IC IO S........................................................................................ 297

9 D E C IS IO N E S D E G R U P O 301
9.1 AGREGACIÓN DE ORDENACIONES
INDIVIDUALES..................................................................................302
9.2 AGREGACIÓN DE JUICIOS SOBRE
PREFERENCIAS ...............................................................................305
9.2.1 Función de valor de g ru p o .......................................................306
9.2.2 Función de utilidad de g r u p o .................................................308
9.2.3 Agregación de juicios probabilísticos.................................... 311
9.3 MÉTODOS DE AGREGACIÓN DE
COM PORTAM IENTOS...................................................................... 312
9.3.1 Procesos de decisión de grupo no estructurados.................. 312
9.3.2 Procesos dé decisión de grupo estructurados.........................313
9.4 CONFERENCIA DE D ECISIÓ N ....................................................... 314
9.5 NEGOCIACIONES................................................................................316
9.5.1 Un problema de negociaciones .............................................. 317
9.6 DISCUSIÓN ..........................................................................................320
9.7 E JE R C IC IO S.......................................................................................... 321
* f u n d a m e n t o s d e l o s s is t e m a s d e a y u d a a l a d e c is ió n ^ ^
— — --------------------------------------------- ------------------------------------------------------------------------------------- s L S ^ a

10 SISTEM AS D E AYUDA A LA D E C ISIÓ N


10.1 SISTEMAS DE AYUDA A LA DEC ISIÓ N ...............
.............. • 325
10.1.1 Amplitud del térm in o....................................
í .................... ...
10.1.2 Niveles de ayuda a la decisión..................
.................... ..
10.1.3 Dominios de la actividad ...........................
...................... ..
10.1.4 Sistemas de Ayuda a la Decisión de grupo.................. 30o
10.1.5 Inteligencia Artificial y Sistemas de Ayuda a la Decisión . 33Q
10.2 SISTEMA MOIRA...............................................................................
10.2.1 Descripción del problema de contaminación..................... ^39
10.2.2 Descripción general del módulo de evaluación.................... 33,
10.2.3 Estrategias y sus consecuencias............................................ ...
10.2.4 Evaluación de las -alternativas............................................... 33*
10.2.5 Evaluación............................................................................. ...
10.2.6 Análisis de sensibilidad............................................................
10.3 SISTEMA IctNeo................................................................................ 34!
10.3.1 Descripción del problema m édico..........................................342
10.3.2 Objetivos de I c tN e o ...............................................................342
10.3.3 Estructuración........................................................................343
10.3.4 Modelización de la incertidumbre..........................................344
10.3.5 Modelización de las preferencias ..........................................347
10.3.6 Arquitectura........................................................................... 349
10.4 DISCUSIÓN....................................................................................... 353
10.5 EJERCICIOS....................................................................................... 356

A SOLUCIONES DE EJERCICIOS SELECCIONADO S 357

BIBLIOGRAFÍA 373

ÍNDICE DE MATERIAS 397


PRÓLOGO

Muchos problemas a los que debemos enfrentarnos son extremadamente com­


plejos por la presencia de varias fuentes de incertidumbre, varios objetivos y
metas conflictivos, posibles impactos de las decisiones a largo plazo y sobre dis­
tintos grupos de la población... Aunque en ocasiones es posible resolverlos con la
experiencia y la intuición, se ha probado repetidas veces que tales aproximaciones
a los problemas complejos pueden conducir a malas soluciones. Como alterna­
tiva, los Sistemas de Ayuda a la Decisión proporcionan modelos que permiten
resolver problemas de forma estructurada teniendo en cuenta todos los aspectos
relevantes del mismo.
Esta área de conocimiento no es nueva. Aunque las mayores aportaciones y
progresos en la Ciencia de la Decisión corresponden a los últimos 75 años, sus
orígenes coinciden con los albores del Cálculo de Probabilidades en el siglo XVIII,
en los escritos de Blas Pascal en que aparece implícita la noción de probabili­
dad subjetiva, que es la más apropiada para la metodología de la Teoría de la
Decisión. Son varios los autores que posteriormente aportan nuevas y notables
contribuciones, y entre ellos podríamos destacar, ya en el siglo XVIII, a Huy-
gens, que propone el concepto de esperanza matemática; a Daniel Beraoulli, que
aportó importantes ideas para el tratamiento de las decisiones en riesgo; y a otros
posteriores como Bayes, Laplace, Fisher... Ya en el siglo XX, las contribuciones
y avances son mucho más numerosos con los trabajos de Wald, von Neumann,
Neyman, Ramsey, de Finetti, Debreu, Koopmans, Arrow, Raáffa... El interés
e importancia del desarrollo del Análisis de Decisiones se va haciendo cada vez
más notable, y en los años sesenta se convierte en una materia fundamental en
muchos estudios de la Ciencia e Ingeniería en universidades y centros de inves­
tigación de todo el mundo. En 1980 se crea la Decisión Analysis Society como
parte de INFORMS (the Institute for Operations Research and the Management
Science) sociedad formada por más de 800 miembros en todo el mundo y con una
sobresaliente actividad.
El objetivo del Análisis de Decisiones es ayudar al decisor a pensar y a profun­
dizar en el problema de decisión que tiene entre manos. Más específicamente, las
herramientas del Análisis de Decisiones permiten al decisor modelizar la situación
de decisión. Se pueden crear modelos del problema, como tablas de decisión, ár­
boles de decisión y diagramas de influencia. Se puede representar cómo entiende
x |í k i i n b A M B N T O S r n U > S S1ST K M A S U B AY U D A A I.A DWC1HIÓN_______________ © HA NU

el decisor la incertidumbro inherente mediante modelos proluibllístlcoN, Líi 'Iborfu


de la Utilidad proporciona herramientas para niodoli/ar los proforoncinn dol clci*
cisor. El fin último de estos modelos os representar problemas reales y analizarlo#
para comprenderlos mejor y conseguir que la calidad do las decisión09 ronultantoa
mejore.
Con el presento libro perseguimos los siguiontos objotivos gonoralos:

• Entender lo que significa construir un modelo do un problema do decisión


y por qué es necesario.
• Introducir el proceso general de resolución do problomas do toma do deci­
siones.
• Proporcionar herramientas para tomar decisiones racionalmente, poniendo
énfasis en los métodos modernos de representación y solución do problemas
y en algunos programas informáticos.
• Ilustrar la resolución de problemas reales.
• Interpretar correctamente los resultados obtenidos dentro del problema con­
creto, entendiéndolos como una ayuda a la toma de decisiones.
• Proporcionar una base fundamental que permita al estudiante por sí mismo,
entender otras técnicas no recogidas en el curso y adaptarse a un campo en
evolución permanente.
• Descubrir su relación y complemcntaricdad con otras áreas de conocimiento
como la Inteligencia Artificial.

El texto surge por la carencia en nuestro idioma de un libro de sus caracterís­


ticas. Está concebido para que sirva de soporte a cursos de Sistemas de Ayuda a
la Decisión y de Análisis de Decisiones tanto a nivel de Licenciatura o Ingeniería
como de Doctorado. Por ejemplo, en el curso de Sistemas de Ayuda a la Decisión
de la Ingeniería de Informática de la UPM, utilizamos el material: Capítulo 1, 3
(básicamente la Sección 3.6), 4 (resumido), 5, 6, 8, 10. Los prerrequisitos no son
ni mucho menos exigentes, pues bastan unos conocimientos básicos de Teoría de la
Probabilidad y de Álgebra y Análisis Matemático, para afrontar con comodidad
el estudio de esta materia.
La elaboración de la estructura del libro sigue las etapas del ciclo del Análi­
sis de Decisiones: descripción de los elementos que conforman la estructura del
problema (Capítulo 1), modelización en certidumbre (Capítulo 2), modelización
de incertidumbre (Capítulo 3), modelización de preferencias (Capítulo 4), estruc­
turación del problema y resolución (Capítulos 5 a 7), y análisis de sensibilidad
(Capítulo 8). La última parte analiza decisiones en grupo (Capítulo 9) y final­
mente, el Capítulo 10 establece el concepto de Sistema de Ayuda a la Decisión,
© RA-M A PRÓ LO G O XÍH

englobando todo lo explicado y proporcionando dos ejemplos reales en los que


hemos trabajado en las áreas de medicina neonatal y contaminación de ecosis­
temas acuáticos por residuos nucleares.
Nuestra experiencia en Análisis de Decisiones abarca no sólo investigación sino
también docencia (cursos de doctorado, seminarios nacionales e internacionales...)
desde los inicios en la vida universitaria. Esto es de vital importancia debido a
que el Análisis de Decisiones es una disciplina en continuo avance, como ha podido
observarse en los últimos años: nuevas técnicas y software, nuevas perspectivas y
controversias en la investigación sobre los juicios en la toma de decisiones, etc.
Aunque es difícil presentar en un libro de texto el proceso interactivo de cons­
trucción de un modelo, esperamos que el lector pueda al menos captar la esencia
de este importante aspécto. Más que los resultados numéricos, lo más valioso
del Análisis de Decisiones es la introspección que provoca en el decisor sobre
el problema. Recientemente D. W. North llamó a esta disciplina “Tecnología
del Pensamiento” (Decisión Analysis Newsletter, diciembre 1997, página 10),
subrayando su carácter interdisciplinario, adjetivo tan característico de este nuevo
siglo XXI. Para ello incluimos numerosos ejemplos, bibliografía actual con las
últimas tendencias y problemas abiertos, software de utilidad para el tipo de
problemas que queremos resolver y varias direcciones de Internet interesantes.
La CICYT, la UPM, la DGESIC, el FIS, la CAM y la UE han apoyado con va­
rios proyectos algunos de los resultados de nuestra investigación aquí contenidos y
finalmente con la ayuda de CICYT TXT99-1376 acometimos la elaboración final
de este libro. Agradecemos las discusiones con Prakash Shenoy (Kansas Universi-
ty) y con nuestros compañeros de departamento. Gracias también al Profesor don
Sixto Ríos, introductor en nuestro país de esta disciplina, y a nuestros antiguos
compañeros David Ríos y Jacinto Martín que han sido elementos motivadores
para iniciar esta obra. Finalmente recordamos a nuestros familiares por su cariño
y ánimo mostrado a lo largo de estos ya más de dos años de dedicación al libro.
El diseño de la portada es obra de Julio Ramos. El símbolo □ marca fin de
ejemplo y A marca fin de demostración. Cualquier sugerencia será bienvenida en
mcbielza@fi.upm.es.

SIXTO RÍOS INSUA


CONCHA BIELZA
ALFONSO MATEOS

Boadilla del Monte, octubre de 2001


CAPÍTULO 1

INTRODUCCIÓN A LA
TOMA DE DECISIONES

En este capítulo introductorio presentamos los elementos básicos de un pro­


blema de decisión describiendo los pasos iniciales para desarrollar un modelo de
decisión, que lo definiremos como una abstracción cuantitativa o lógica do un
segmento de la realidad que se crea y utiliza para ayudar al individuo a tomar
una buena decisión.
Comenzamos motivando la necesidad del Análisis de Decisiones por la comple­
jidad que pueden llevar asociada los problemas de decisión, para posteriormente
describir el proceso de análisis y solución a través del llamado ciclo del Análisis
de Decisiones, que constituye un proceso iterativo en el que se van definiendo
y desarrollando sus componentes y relaciones hasta alcanzar el llamado modelo
requisito, esto es, un modelo que contendrá los rasgos esenciales del problema
real que se trata de resolver.
Como parte importante del ciclo del Análisis de Decisiones y previamente a
la estructuración del modelo, hay que definir el conjunto de variables y objetivos
del problema, que servirán para describir su medio o contexto, los efectos de
las decisiones, los lazos estructurales e interdependencias y las preforoncias con
respecto a las consecuencias últimas de las decisiones. Parte del capítulo so
dedicará al estudio de estas dos componentes.
Finalmente, el capítulo termina con el problema de la especificación do las
alternativas, decisiones o cursos de acción. Dejar de considerar alternativas relo-
vantes para un problema puede limitar la bondad de la decisión final, por lo quo
discutiremos las posibles dificultades que surgen para obtener buenas alternativos,
presentando algunos procedimientos que ayudarán a su identificación.
2 FUNDAMENTOS D E LOS SISTEM AS D E AYUDA A LA D ECISIÓ N © HA-M a

1.1 LA COMPLEJIDAD EN LA TOMA


DE DECISIONES
Consideremos el siguiente problema de decisión. Supongamos que el director de
una empresa se enfrenta con el problema de decidir si asociarse con otras para
formar otra empresa de mayor entidad o permanecer en la situación en que está y
en la que lleva muchos años. La decisión es muy importante para él pues aunque
tiene ciertas ventajas no está exenta de posibles inconvenientes. Analizando las
ventajas con sus colaboradores observa que parece una buena oportunidad, ya
que si se deja pasar el tiempo permaneciendo en la posición actual, fusionarse
en un futuro podría tener menores ventajas e incluso podría ser absorbida por el
grupo de empresas que se va a formar. Parece claro que una respuesta afirmativa
conllevaría un aumento en las ventas y con ellas los múltiples beneficios derivados
de éstas. Respecto a posibles inconvenientes, el primero que le surge al director
es que, dado que su empresa no es de las mayores, él pasaría a ser un ejecutivo
en el consejo de administración con menor relevancia y capacidad de decisión
que la que tiene actualmente, perdiendo independencia en muchos aspectos y con
riesgo de ir perdiendo categoría en el futuro. También es posible que algunos de
sus empleados actuales tuvieran que dejar la empresa al surgir duplicidades para
puestos de trabajo similares, aunque otros, entre ellos el director, estarían más
seguros al ser una empresa mucho mayor.
El director consulta con sus colaboradores y también con su familia, y todos
ellos le indican posibles ventajas e inconvenientes que tendría la fusión. Por
ejemplo, algunos de sus colaboradores e incluso él, tendrían en el futuro que
desplazarse a vivir a otras ciudades, con las implicaciones familiares y sociales
que esto podría tener, al cambiar de vivienda, dejar las amistades, cambiar de
centros de estudio para los hijos, etc.
Como se puede observar, parece que la decisión le resulta bastante complicada
al director, ya que han surgido múltiples aspectos a tener en consideración. Se
plantea entonces la necesidad de tomar una decisión de modo racional y coherente,
utilizando algún método que le permita tener en cuenta las distintas ventajas e
inconvenientes.
A la vista del problema observamos en primer lugar que muchos de sus aspec­
tos tienen asociada incertidumbre. Su identificación y representación cuantitativa,
posiblemente mediante juicios personales, no está exenta de notables dificultades.
Por ejemplo, es clara la incertidumbre del director respecto a su posición futura
y la de sus colaboradores, respecto a si los beneficios serán realmente mayores,
aunque en este sentido sí tiene bastante confianza, etc. Unido a esto se encuentra
su actitud frente al riesgo, que será importante a la hora de tomar la decisión
final. No tendrá el mismo comportamiento un director al que le gusta asumir
decisiones poco arriesgadas que otro que está dispuesto a admitir decisiones con
un riesgo mucho mayor.
© RA-MA CAPÍTULO 1: INTRODUCCIÓN A LA TOM A D E DECISIONES 3

También el problema incluye objetivos múltiples, muchos de los cuales serán


conflictivos, de manera que progresar en algunos conllevará la degradación en
otros. El individuo tendrá como objetivos el deseo de “maximizar el beneficio”,
“minimizar la inestabilidad en el puesto de trabajo”, “maximizar su nuevo es­
tatus”, “maximizar la satisfacción familiar y de sus colaboradores”, etc. Parece
claro que no existirá ninguna alternativa que alcance simultáneamente todos los
objetivos debido a su conflictividad, de manera que le resultará obligado consi­
derar intercambios entre objetivos. Por ejemplo, debería responder a cuestiones
como: ¿a qué cantidad de beneficio estaría dispuesto a renunciar a cambio de
aumentar su estabilidad o seguridad en el puesto de trabajo?
Ligada a cada alternativa de decisión se tendrá entonces una consecuencia o
resultado, que será escalar o vectorial según el problema sea uniobjetivo o mul-
tiobjetivo, respectivamente, y el decisor basándose en juicios personales deberá
cuantificar sus preferencias sobre las posibles consecuencias, obteniendo así los
valores o utilidades, que constituirán una entrada más del modelo de decisión.
El individuo tiene, en principio, un problema de decisión personal pero que,
a la vista de su complejidad y consecuencias, estima que debe resolverlo teniendo
en cuenta las opiniones del grupo de individuos formado por sus colaboradores.
Éstos podrían tener puntos de vista diferentes en relación con algunos aspectos
del problema, como las incertidumbres asociadas o los objetivos a considerar, con
un planteamiento distinto y tal vez más abierto, de modo que su consideración
debería tenerse en cuenta.
Finalmente, buena parte de la dificultad en el tratamiento del problema
provendrá de lo difícil que puede llegar a ser entenderlo debido a su estructura
compleja. Tal estructura será de gran ayuda para generar las alternativas de
decisión posibles, una de las cuales habrá que elegir. Además de las alternati­
vas obvias de fusión o no fusión, es posible que apoyados en el desarrollo de tal
estructura, fuera posible generar otros cursos de acción de interés para el indi­
viduo, como por ejemplo, decidir llevar a cabo la fusión un periodo de tiempo
posterior o retrasar la negociación un cierto tiempo. Además, resaltemos que en
tal estructura quedarán plasmados los múltiples aspectos que simultáneamente
tiene que considerar el individuo y la naturaleza secuencia! de algunos de ellos.
Por ejemplo, si decide la fusión, debe ver a continuación en qué puesto de trabajo
se quedaría, después qué colaboradores de su antigua empresa puede mantener
junto a él, etc.
En definitiva, hemos planteado algunos de los aspectos y rasgos básicos que
aparecen en los problemas de decisión y que trataremos a lo largo de este libro
intentando proporcionar un desarrollo y comprensión de los distintos métodos y
herramientas que se han propuesto en la literatura para mejorar el proceso de
toma de decisiones.
4 FUNDAM ENTOS DE LOS SISTEM AS D E AYUDA A LA DECISIÓN ©RA-MA

1.2 EL ANÁLISIS DE DECISIONES


El Análisis de Decisiones, como apuntan Keeney y Raiffa (1993), intenta ayudar
a los individuos a tratar con decisiones difíciles y complejas, y es un enfoque pres-
criptivo diseñado para individuos normalmente inteligentes que desean pensar con
intensidad y profundizar en problemas reales importantes. La razón obvia para el
estudio del Análisis de Decisiones es que la aplicación cuidadosa de sus técnicas
conducirá a mejores decisiones. Obsérvese que no se debe confundir una buena
decisión con un buen resultado. La primera se hace a partir del entendimiento y
estudio detallado y cuidadoso del problema. Es posible tomar buenas decisiones
y tener malos resultados, pues el Análisis de Decisiones no puede mejorar la
suerte de los individuos; si bien puede ayudar a comprender mejor el problema
en cuestión y conducir a tomar decisiones mejores.
Estas afirmaciones nos conducen a plantear el triple aspecto descriptivo, nor­
mativo y prescriptivo del Análisis de Decisiones. El Análisis de Decisiones des­
criptivo proporciona modelos que pretenden describir cómo tomamos decisiones.
El normativo proporciona modelos que sugieren cómo deberíamos tomar deci­
siones, ver von Winterfeldt (1989). Finalmente, el prescriptivo, que hasta un
tiempo relativamente reciente se consideró sinónimo de normativo pero que en
la actualidad se considera con un significado distinto, asume que el Análisis de
Decisiones es una aplicación de las ideas normativas, teniendo en cuenta los ha­
llazgos de los estudios descriptivos de decisión, para guiar la toma de decisiones
reales. Así, los análisis prescriptivos utilizan modelos normativos que conducen
la evolución de las percepciones de los decisores en la dirección de un ideal al que
aspirar reconociendo las limitaciones de sus procesos cognoscitivos reales.
Como ya hemos apuntado, tales decisiones son complejas en muchas oca­
siones debido a los muchos factores que hay que tener en cuenta simultánea-
mente. Tratamos aquí de proponer procedimientos para que las personas tomen
decisiones de acuerdo con los modelos plausibles que conduzcan a decisiones que
podrían denominarse coherentes. Es claro que existen malas y buenas decisiones
y se trata de proponer procedimientos que conduzcan a buenas decisiones, de­
nominadas racionales, ya que se ajustan a reglas de comportamiento libremente
elegidas. Suponiendo que es posible mejorar la calidad de las decisiones, veremos
en este libro cómo podría llevarse a cabo tal mejora. En los últimos sesenta años,
tomando como raíces diferentes ideas y métodos de la Estadística, la Psicología, la
Economía o la Matemática, se han desarrollado teorías más o menos sofisticadas
de cómo deben tomarse decisiones complejas, que describiremos en los capítulos
siguientes.
A la vista de tal complejidad, nos planteamos: ¿cómo puede ayudar el Análisis
de Decisiones? La estrategia más comúnmente utilizada ha sido el “divide y
vencerás”, que subyace en este proceso, por el cual el problema de decisión se
divide o descompone en partes o subproblemas más elementales, que posiblemente
serán más fáciles de manejar o tratar. Después, cada subproblema se estudia
© RA-M A CAPÍTULO 1: INTRODUCCIÓN A LA TOM A D E DECISIONES 5

aisladamente y el Análisis de Decisiones proporciona el mecanismo formal para


integrar los diferentes resultados de modo que resulte posible la elección por parte
del decisor de una alternativa o curso de acción.
Como parte fundamental del proceso del Análisis de Decisiones están los
juicios personales que emite el decisor o decisores sobre la incertidumbre inheren­
te y los valores o cantidades del problema. Los procedimientos o técnicas de la
Investigación Operativa usualmente no tienen en cuenta tales juicios subjetivos,
sino que generan decisiones óptimas en base a entradas puramente objetivas. Sin
embargo, el Análisis de Decisiones permite la inclusión de juicios subjetivos como
ingrediente completamente necesario para la toma de buenas decisiones, debien­
do ser tales juicios claros y explícitos. Así, será posible en muchas ocasiones
averiguar a través del análisis, la razón dé por qué se eligió una determinada de­
cisión, es decir, que será posible obtener una racionalidad justificable para cada
elección particular, lo que puede ser importante si se requiere su justificación.
Además de ayudar a elegir la mejor alternativa, el Análisis de Decisiones tam­
bién puede proporcionar otras ventajas y beneficios precisamente por la necesaria
profundización en los problemas. El pensamiento creativo en que se apoya puede
conducir a generar nuevas alternativas mejores que las inicialmente planteadas
o a motivar la necesidad de nueva información previamente a la elección final.
Debemos enfatizar que a lo largo de los últimos años, el papel del Análisis de De­
cisiones se ha extendido, ya que además de ser un método o conjunto de métodos
para determinar soluciones óptimas, ha adoptado un punto de vista más amplio,
pues lo que trata también es de aumentar la visión y creatividad sobre el problema
para ayudar a mejorar la toma de decisiones, Keeney (1982).
Así, en algunas situaciones se plantea el Análisis de Decisiones como condi­
cionalmente prescriptivo, French (1998), lo que significa que el objetivo consiste
más en obtener una visión amplia y profunda del problema a partir de su estruc­
turación y educción de juicios, que en obtener una solución óptima. La suposición
básica en este caso es la de racionalidad, que significa que si el individuo está dis­
puesto a aceptar un conjunto de axiomas o reglas que la mayor parte de las
personas consideraría razonables, entonces basándose en tales axiomas debería
elegir una cierta alternativa como la mejor entre todas las disponibles. Desde
luego, podría ocurrir que existiera algún conflicto entre el resultado del análisis
y lo que espera el individuo basándose en su intuición, y en tal caso habría que
explorar tales diferencias intentando comprobar si pudieran deberse a una defi­
ciente o incompleta representación de sus preferencias o a la inconsistencia de
éstas o bien a que quizás se hubieran reflejado erróneamente los rasgos básicos
del problema en cuestión. También, nótese que el análisis podría capacitar al
individuo para desarrollar una mayor y más profunda comprensión del problema
de modo que las preferencias evolucionen hacia lo prescrito por el análisis, siendo
esto en definitiva otra motivación más para el estudio del Análisis de Decisiones.
o FUNDAMENTOS DE LOS SISTEMAS D E AYUDA A LA DECISIÓN

1.3 EL PROCESO DEL ANÁLISIS DE DECISIONES


Vamos a plantear aquí el proceso del Análisis de Decisiones indicando sus etap^g
y aspectos más importantes. Conviene distinguir entre lo que se denominan
cualitativas, que incluyen desde la identificación del problema hasta su estruc­
turación, y las Jases cuantitativas, que corresponden a la asignación de entradas
numéricas y evaluación del problema.
El diagrama de flujo de la Figura 1.1, que es una modificación del de Ciernen
(1996), muestra un esquema del citado proceso que comienza con la identificación
del problema. Es la etapa inicial, que debe llevarse a cabo cuidadosamente pa»
evitar lo que se denomina error de tipo III, y que consiste en haber identificado
el problema de forma érrónea.

Figura 1.1: Diagrama de flujo del proceso de Análisis de Decisiones

La segunda etapa del proceso es la generación del árbol de objetivos también


llamado árbol de valor, que consiste en una desagregación jerárquica del objeti­
vo global del problema en objetivos de menor nivel y por tanto más específicos,
que llevarán así asociadas imas medidas con las que evaluar la ejecución de cada
posible alternativa de decisión. Es una etapa importante que incluye creatividad
y una meditada introspección, como veremos más adelante, Sección 1.4. Depea-
tiendo de si el factor tiempo influye o no en el problema o más concretamente
© RA-M A C A P ÍT U L O J: IN T R O D U C C IÓ N A LA T O M A D E D F / M J O W M 7

en los objetivos (en todos o algunos), se construirá un árbol dinámico o estático.


La mayor parte del libro se dedicará al caso estático. Sin embargo, no debernos
olvidar el caso de árboles dinámicos, cuya teoría se encuentra bastante rnenos
elaborada, Atherton y French (1997).
El tercer paso se dedicará a la determinación y/o generación de las alter­
nativas de decisión o cursos de acción posibles, uno de los cuales deberá elegir
el decisor. También requiere fuertes dosis de creatividad y con la utilización de
varios procedimientos existentes, que veremos posteriormente, Sección 1.5, y el
apoyo del árbol de objetivos citado, se deben obtener todas aquellas opciones que
pudieran ser relevantes para el problema.
El siguiente paso se refiere a la .modelización del problema y constituye uno
de los apartados fundamentales del Análisis de Decisiones. Siguiendo el principio
de “divide y vencerás”, buena parte del proceso de modelización sigue la idea
de dividir o descomponer el problema en partes más pequeñas para hacerlo más
manejable, comprender mejor sus estructuras y estimar o educir las íncertidum-
bres y los valores. Obsérvese en el diagrama de flujo que esta fase está subdívidída
en tres apartados. El primero se refiere a la modelización de la estructura del
problema, que típicamente llevaremos a cabo con un árbol de decisión o un dia­
grama de influencia. Se estudiarán en el Capítulo 5 los primeros y en el Capítulo
6 los segundos. El Capítulo 7 expone otras posibilidades. Aquí se consideraría
finalizado el análisis cualitativo del problema y comenzaría el cuantitativo con la
identificación de las incertidumbres, de modo que a continuación se cuantificaría
la incertidumbre inherente al problema mediante probabilidades, como se verá
en el Capítulo 3. Finalmente, se asignarán los valores o utilidades que mode-
lizarán las preferencias del decisor o decisores para las distintas consecuencias
posibles de las alternativas así como de los posibles intercambios entre aquéllas y
se estudiarán en los Capítulos 2 y 4.
La quinta etapa del proceso se refiere a la identificación de la alternativa más
preferida por el decisor. El conjunto de etapas anteriores habrían culminado en
una representación del problema a través de modelos matemáticos que deberán
conducir a la determinación de la mejor alternativa. Ésta será la de mayor utilidad
esperada si el problema lleva asociada incertidumbre, Capítulo 4, mientras que
si es en certidumbre, Capítulo 2, es decir, no se han identificado incertidumbres
inherentes al problema o aunque fuera así, se han modelizado bajo certidumbre
por considerar tal aproximación adecuada, entonces la alternativa a elegir sería
la de máximo valor. Los procedimientos para obtener esta alternativa sobre
estructuras de árboles de decisión o diagramas de influencia se analizan en los
Capítulos 5-7.
Finalmente, como última etapa se tiene el análisis de sensibilidad (AS), Capí­
tulo 8, que hoy en día se considera como un complemento necesario de cualquier
modelo cuantitativo y más aún en el caso de un proceso iterativo, como es el
del Análisis de Decisiones. Medíante el AS se trata de dar respuesta a las pre-
8 FUNDAM ENTOS D E LOS SIST EM A S D E AYUDA A LA D E U ia iu w ve; JU1-MA

guntas: ¿qué pasa si...? Es decir, si se introducen pequeños cambios en uno o


varios aspectos del modelo, estudiar el efecto que pudieran tener sobre la solución
óptima. Si como consecuencia de esos cambios la solución óptima sigue siéndo­
lo, tendríamos una confianza importante en ella en el sentido de que es robusta
frente a tales cambios. Por el contrario, si dejara de serlo entonces diremos que
el problema es sensible a tales cambios y posiblemente el decisor desearía revisar
aquellos aspectos para los cuales se ha producido ese cambio en la optimalidad.
Obsérvese en el diagrama de flujo que de la caja “¿Es necesario más análisis?”,
salen arcos con destino hacia las cuatro primeras etapas algunas de las cuales
habría que revisar teniendo en cuenta los aspectos sobre los que se introdujeron
cambios para estudiar la sensibilidad de la solución.
En definitiva, todo este proceso permitirá obtener nuevas percepciones del
problema que seguramente no estaban claras o no eran aparentes mediante un
estudio superficial del mismo. Así, podría ser necesario revisar la identificación
del problema o revisar el árbol dé objetivos introduciendo modificaciones en el
sentido de añadir otros objetivos o revisar las definiciones de éstos. Tal vez
fuera necesario definir y considerar nuevas alternativas, cambiar la estructura
del modelo o revisar la modelización de la incertidumbre y /o las preferencias.
Tenemos, por tanto, el ciclo del Análisis de Decisiones que describe este proceso
global de modelización y solución a través de reiteradas iteraciones hasta que el
decisor alcanza una solución satisfactoria.
Estas ideas están condensadas en el término introducido por Phillips (1984)
denominado modelo de decisión requisito. Como dice Phillips, un modelo puede
considerarse requisito solamente cuando no emergen nuevas intuiciones sobre el
problema y en tal caso el modelo contendrá todos los rasgos esenciales para su
resolución. Esto puede resultar del aludido proceso iterativo o ciclo del Análisis de
Decisiones, en el que la percepción del problema por parte del decisor en cuanto
a creencias o preferencias puede ir cambiando, alcanzando una mayor madurez a
partir de la reflexión. Así, el Análisis de Decisiones además de proporcionar un
procedimiento estructurado para pensar y meditar sobre las posibles decisiones,
también provee una estructura dentro de la cual un decisor podrá expresar sus
creencias y preferencias, es decir, los juicios subjetivos que serán críticos para
alcanzar una buena solución. Por tanto, en la resolución del problema de decisión,
el decisor deberá ciclar a través del proceso esquematizado en el diagrama de flujo
para ir refinando y mejorando el análisis del problema hasta alcanzar el modelo
requisito deseado.

1.4 VARIABLES Y OBJETIVOS


Ya indicamos que las dos primeras etapas en la resolución de un problema de
decisión eran la identificación del problema y la generación del árbol de obje­
tivos. En esta sección describiremos esos pasos dirigidos a crear una primera
© RA-MA C A P ÍT U L O i: INTRODUCCIÓN A LA TOM A D E DECISIONES 9

aproximación al modelo inicial de decisión, que esendalmente consistirá en una


descripción cualitativa de relaciones entre algunas variables. Los modelos de
decisión contendrán un conjunto de variables del sistema o problema, que descri­
birán su medio o contexto y k s efectos de las decisiones, relaciones estructurales
o interdependencias entre estas variables y preferencias respecto a los resulta­
dos de las posibles decisiones. Es claro que una parte importante del proceso
de construcción de un modelo será la determinación de las variables relevantes
y la modelización de las relaciones entre ellas, así como los objetivos que uti­
lizará el decisor o dedsores para medir su deseabilidad respecto a las posibles
consecuencias de las alternativas consideradas.

1.4.1 Las variables en el modelo

Es obvio que una buena elección de las variables para la construcción del modelo
será un paso muy importante en el proceso de decisión, que deberá considerarse
iterativo y abierto durante la modelización. Esto querrá decir que una vez hecha
la elección inicial de las variables que se consideren relevantes para el problema
a resolver, el analista de decisiones. que será el experto en Análisis de Decisiones
que ayudará al decisor a resolver su problema, debe estar abierto a la posibilidad
de suprimir o añadir variables en fundón de la mayor o menor importancia que
pudieran ir adquiriendo y de la disponibilidad de información y datos sobre ellas.
Hay distintas categorizadones de variables, aunque la más usual en este con­
texto del Análisis de Decisiones considerará dos tipos de variables: de decisión
y aleatorias o de azar. Las variables de decisión serán aquellas que controla el
decisor y variarán de acuerdo con la alternativa o curso de acción seleccionada
por éste. Las variables de azar, no controladas por el decisor, serán variables
aleatorias que quedarán descritas mediante la cuantificadón con probabilidades
de la incertidumbre asociada, es decir, que serán aquellas variables que tendrán
asociada una distribución de probabilidad. Como caso particular, podremos tener
una variable con distribución de probabilidad asociada degenerada, que denomi­
naremos variable cierta, determinística o en certidumbre.
También pueden considerarse, aveces, las variables resultado, que se utilizarán
por el decisor como medidas de eficacia o logro o ejecudón de las alternativas y
que denominamos atributos, ver Secdón 1.4.2.
Como ejemplo ilustrativo, consideremos un problema de inversión para la
ampliación de una planta de producdón en la que se manufacturan dos productos
A y B. En la Tabla 1.1. se muestran posibles variables a tener en cuenta y su
categorizadón.
1U FU N D A M EN TO S D E LOS SIST EM A S D E AYUDA A LA D E C IS IÓ N © RA-M,

Tabla 1.1: Tipos de variables en un problema de inversión

Variables de Variables Variables


decisión de azar resultado
Beneficio de
Capital a invertir Ventas de A y B
la producción
Niveles de producción
Demandas de A y B Flujo de caja
de A y B

Ampliación de Tasa interna


Estado de la economía
la maquinaria de rendimiento

Contratación de
personal adiciona!

A su vez, las variables podrán ser continuas o discretas. Así, en el ejemplo an­
terior, la variable “capital a invertir” es continua, ya que puede tomar un número
infinito no numerable de valores usualmente dentro de un recorrido especificado.
La “contratación de personal adicional” será una variable discreta, ya que puede
tomar cualquier valor dentro de un conjunto numerable, en este caso finito, de
valores. Finalmente, la “ampliación de la maquinaria” sería una variable discreta
binaria, ya que tomará únicamente dos valores, correspondientes a ampliar y a
no ampliar la maquinaria, que típicamente se asociarán a los valores numéricos 1
y 0, respectivamente.
Es evidente que a partir de los juicios del decisor y con la ayuda del analista
de decisiones se determinarán qué variables se considerarán relevantes para el
modelo y su clasificación. Esta tarea puede resultar complicada. Sin embargo las
herramientas como los árboles de decisión o los diagramas de influencia que se
estudiarán posteriormente, Capítulos 5 y 6, pueden constituir una ayuda notable
en esta parte del proceso. Además, indiquemos que la elección de las denomi­
nadas variables resultado generalmente no será algo obvio y no surgirán fácilmente
después de diferentes consideraciones causales. Para su obtención deben consi­
derarse objetivos realistas que, en definitiva, serán resultado de la consideración
explícita de lo que se pretende alcanzar. Una meditada y cuidadosa elección
de los objetivos realzará el esfuerzo de modelización reduciendo la necesidad de
posteriores revisiones y actualizaciones.

1.4.2 E structuración d e ob jetiv o s

Ya indicamos que una idea básica en el Análisis de Decisiones es la división del


problema en partes más pequeñas, ya que centrándonos en cada parte de modo
separado, es probable que el decisor consiga un mejor entendimiento del problema
© RA-M A CAPÍTULO 1: INTRODUCCIÓN A LA TOM A D E DECISIONES 11

que el que lograría a partir de una visión global. En la mayoría de los problemas
de decisión surge de forma inmediata un objetivo global que en la mayoría de
las ocasiones no tiene una sencilla traducción a una variable cuantitativa. Por
ejemplo, en la decisión de aplicación o no de un tratamiento médico, el objetivo
global debería ser “maximizar el bienestar del paciente” y parece claro que esto
depende de otros aspectos y que no es fácil su traducción o representación en
una única variable. De aquí la conveniencia o necesidad en muchos casos de la
estructuración de un árbol de objetivos que emanen del objetivo global planteado.
Esto corresponde precisamente a la segunda etapa que indicamos en el proceso
de Análisis de Decisiones (Figura 1.1) y que vamos a clarificar a continuación,
proponiendo también algunos otros términos básicos que se utilizan en ella.
En primer lugar, consideramos el concepto general ya aludido de objetivo.
Un objetivo indicará una dirección de mejora preferida y por ello, los términos
“maximizar” o “minimizar” deberán aparecer en la definición del objetivo. Ejem­
plos típicos de objetivos serán: maximización de beneficios, maximización de la
productividad, minimización de costes, etc. Otro término utilizado es el de meta,
que se refiere al deseo de alcanzar un cierto nivel prefijado por el decisor para una
determinada variable. Así, el concepto de objetivo difiere del de meta, ya que esta
última podría ser alcanzada o no. Los objetivos nunca pueden ser completamente
alcanzados y lo que es importante es su grado o nivel de logro o consecución. En
general, además, no todos los objetivos definidos en un problema podrán alcan­
zarse simultáneamente, pues por ejemplo, podría no ser posible m inim iza r los
costes a la vez que se maximiza la producción. De aquí la necesidad de realizar
intercambios entre los objetivos como medio para poder alcanzar una solución
final que resulte al menos aceptable para el decisor desde el punto de vista de
todos los objetivos introducidos.
Asociado con cada objetivo pueden existir o definirse subobjetivos, que de
hecho también son objetivos, pero que ayudan a precisar mejor las preferencias
del decisor respecto de ese objetivo del que emanan. Por ejemplo, si tenemos el
objetivo “maximizar la productividad”, dos posibles subobjetivos que ayudarían
a precisarlo mejor en términos cuantitativos podrían ser “maximizar el trabajo”
y “maximizar la inversión en maquinaria”. A su vez para estos nuevos objetivos,
podrían considerarse de nuevo subobjetivos de nivel más bajo y así sucesivamente
hasta obtener un árbol o jerarquía de objetivos. Resulta claro que al ir descen­
diendo en esa jerarquía los objetivos se irán haciendo más precisos, siendo por
ello más fácil definir variables (resultado) asociadas con ellos. Cuándo finalizar
la generación de subobjetivos en niveles cada vez más bajos del árbol vendrá de­
terminado por los juicios del decisor, que deberá basarse, por una parte, en si la
especificidad lograda con el subobjetivo alcanzado es la adecuada y, por otra, en
si el subobjetivo es suficientemente preciso como para asociarle una escala, bien
objetiva o subjetiva, y reflejar los valores de las consecuencias de las alternativas.
En resumen, la construcción de un árbol de objetivos es un proceso creativo
que debe conducir a una estructura de árbol que tendrá en su raíz un objetivo
12 FUNDAM ENTOS D E LO S SISTEM A S D E AYUDA A LA D E C IS IÓ N © RA-ifA

global que se irá subdividiendo o desagregando en una jerarquía de subobjetivcg


cada vez de niveles más bajos hasta alcanzar los (sub)objetivos de más bajo ni­
vel que proporcionarán una visión mucho más precisa y cuantificable de lo qne
conlleven las posibles alternativas de decisión.
Para cada uno de los objetivos de más bajo nivel se considerará asociado un
atributo, que se define como la medida de realización o logro del objetivo. La
forma en que se medirá el atributo así como una descripción de su unidad de
medida, será parte de la definición del atributo en cada contexto. Se consideran
básicamente dos tipos de atributos: objetivos y subjetivos.
Dentro de los atributos objetivos consideraremos en primer lugar los deno­
minados atributos naturales, que son aquellos que se encuentran directamente
relacionados con el objetivo y se miden en su escala asociada, denominada escala
natural. Por ejemplo, si un objetivo en una empresa es la “maxiimzariÓQ <je
beneficios”, el atributo natural será “número de euros ganados” en una escala
que podría ir de 0 a 5 millones, dependiendo de las características y tamaño de
la empresa. Por otra parte, tenemos los atributos sustitutivos, que se utilizan
cuando no es inmediato o posible disponer de una medida directa del logro del
objetivo, pero es posible tener un atributo que refleja el logro del objetivo con
una medida indirecta. Por ejemplo, si en la empresa se considera el objetho
“maximización de la satisfacción con el trabajo”, no parece sencillo la definición
de un atributo natural, así que habría que buscar uno sustitutivo, que podría ser
“movimiento de personal” habido en la empresa por unidad de tiempo y cuya
escala sería, tal vez de 0 a 100 (medido en personas).
La consideración de atributos subjetivos se da cuando no es posible definiruno
objetivo. En esta situación lo que se hace es introducir una escala subjetiva, per
ejemplo, de 0 a 100, y la valoración de cada alternativa en relación con el atributo
se hace subjetivamente por parte del dedsor. Por ejemplo, para un objetivo coso i
“minimizar dolor”, no resulta sencillo definir un atributo natural, pero un experto
podría introducir uno en que el enfermo o él mismo puntúe subjetivamente en
una escala las diferentes dolendas o achaques que sufra el padente. En Gómez et
al. (2000) y Ríos-Insua et aL (2000) pueden verse ejemplos de distintos atributos
utilizados con sus respectivas escalas en problemas de decisión reales.
Una vez que se disponga del árbol de objetivos y de los atributos asodados a
los objetivos de más bajo nivel, nos enfrentaríamos a la cuestión de si podemos I
considerar que esa estructura cualitativa está terminada. Se han propuesto varios
criterios para contrastar si el conjunto de objetivos y atributos elaborado es el
adecuado. Tales criterios son los siguientes (Keeney y Raiffa, 1993):

1. Completitud. Se trataría de dar una respuesta a la pregunta: ¿están meta- I


dos todos los aspectos o factores relevantes? Si la respuesta fuera positiva,
podría considerarse que el conjunto es completo y los atributos indicaran
de un modo apropiado el nivel de logro del objetivo global con respecto a
cada alternativa.
© RA -M A C A P ÍT U L O 1: IN T R O D U C C IÓ N A LA TO M A D E D E C IS IO N E S 13

2. Operatividad. Significa que el conjunto de atributos debe ser útil para el


propósito de ayudar al decisor a elegir la mejor alternativa, permitiendo
comprender las implicaciones que conllevan ésta o el resto de las alternati­
vas. Así, por ejemplo, si el decisor fuera un político que se sintiera incapaz
de evaluar o juzgar la “imagen” do las posibles localizaciones que puede te­
ner un nuevo centro comercial en una escala numérica (atributo subjetivo),
entonces el árbol no sería operativo. En tal situación debiera ser posible
una descomposición del objetivo o quizá la propuesta de un nuevo atributo
sustitutivo.

3.N o redundancia. No deben existir redundancias en el conjunto final de


objetivos y atributos, evitando así una duplicación en el impacto de las
consecuencias. El inconveniente de la redundancia está en que puede llevar
al menos a un doble conteo de modo que se estén ponderando en exceso
algunos objetivos al tomar la decisión final.
4. Descomponibilidad. Ya que posiblemente se requerirá al decisor la posterior
cuantificación de sus juicios sobre preferencias y creencias, parece razona­
ble admitir que el conjunto de objetivos, y por tanto el de atributos, sea
descomponible para facilitar tales tareas. Pensemos que un problema con
n atributos requerirá de la asignación de igual número de funciones de var
lor o utilidad, y tal vez, de varias distribuciones de probabilidad. Si estas
tareas resultan complejas, posiblemente la introducción de algunas nuevas
descomposiciones de subobjetivos puedan suponer un alivio para su reali­
zación.
5. Minirnalidad. Como complemento de los cuatro criterios anteriores está la
minimalidad del conjunto de atributos (y objetivos) para intentar mantener
el problema del menor tamaño posible. Debemos tener en cuenta que cada
vez que se subdivide un objetivo, está surgiendo la posibilidad de que se
excluyan aspectos importantes, por lo que debe buscarse un equilibrio en­
tre minimalidad y descomponibilidad. Además, si el árbol fuera demasiado
grande cualquier análisis justificado podría ser difícil de llevarse a cabo.
Un test para estas dos últimas propiedades consistiría en preguntar al de­
cisor: ¿podría resultar que la mejor alternativa fuera diferente si quitáramos
o añadiéramos un cierto objetivo o atributo del conjunto final? Si la res­
puesta fuera negativa parece lógico que podríamos reducir nuestro conjunto
sin afectar a la solución del problema.

Es claro que se requerirán reuniones reiteradas entre el decisor(es) y el anar


lista(s) antes de que el conjunto de objetivos y atributos satisfaga los criterios
anteriores. Usualmente, en las primeras etapas tal conjunto será grande e irá
disminuyendo cuando se vaya produciendo un mayor refinamiento. Una vez es­
tablecido el conjunto final, se utilizará como parte del modelo para la evaluación
14 FUN D AM EN TO S D E LOS SISTEM AS D E AYUDA A LA D EC ISIÓ N © RA -M A

de las alternativas. En todo caso y como ya apuntábamos anteriormente, debe­


mos aceptar una cierta flexibilidad, al menos en las primeras etapas del proceso,
permitiendo cambios tanto en los objetivos como en los atributos asociados.
El proceso de definición y construcción de atributos es esencialmente creativo
no siendo posible una formalización en normas o reglas, sino solamente sugerir
aspectos que ayuden en el proceso de elaboración y a conocer cuándo puede
considerarse completo tal proceso. Si el problema no es muy complicado esta
tarea podrá llevarla a cabo un único experto o un panel de expertos. Sin embargo,
en problemas complejos deberá haber una intervención mucho más amplia en la
que tal vez los niveles más altos de la jerarquía los completarían directivos de
alto nivel, mientras que al ir descendiendo intervendrían expertos o especialistas
en las diferentes áreas específicas que pudieran cubrir el problema.

1.4.3 Ejem plo ilustrativo: E lección d e un sistem a


inform ático

El siguiente ejemplo trata de ilustrar la construcción y desarrollo del árbol de ob­


jetivos y los atributos asociados, para un problema de elección de un sistema infor­
mático. Supongamos una empresa que se enfrenta con el problema de adquisición
de un nuevo sistema informático y como objetivo global se plantean “maximizar
la utilidad del sistema informático”, que corresponde a una propuesta de la di­
rección de la empresa. Este objetivo es demasiado general como para comparar
los diferentes sistemas informáticos del mercado, no siendo directamente útil y
requiriéndose así su división en subobjetivos más detallados y específicos. Ante
cuestiones planteadas por el analista de decisiones como: ¿qué constituye un sis­
tema informático de utilidad? o ¿cómo se determina que un sistema informático
lo sea?, la dirección propone los siguientes objetivos (ver segundo nivel en la
Figura 1.2):

• “Maximizar flexibilidad”: se refiere a su adaptabilidad frente a situaciones


desconocidas.
• “Maximizar productividad”: se refiere a la eficacia para la realización de
las tareas.
• “Maximizar integridad”: se refiere a la seguridad y robustez del sistema.

Estos objetivos resultan aún demasiado imprecisos o amplios, por lo que la


dirección decide proponer nuevos subobjetivos que clarifiquen y precisen más los
tres anteriores. Aquí ya comenzaría posiblemente la participación de diferentes
expertos informáticos de la empresa con un conocimiento más específico de las
diferentes áreas que comprenden los sistemas informáticos. Como subobjetivos
de flexibilidad se proponen los objetivos “maximizar la adaptabilidad” y “maxi­
mizar la generalidad” del sistema. El resto de objetivos considerados puede verse
© R A-M A C A P IT U L O 1: INTR O D U C C IÓ N A LA TO M A D E D EC ISIO N E S 15

on la Figura 1.2, que muestra la jerarquía de objetivos en forma de árbol con


varios niveles de desagregación, según la modelización propuesta por la dirección
y expertos de la empresa.

4 5

Figura 1.2: Árbol de objetivos para la evaluación de un sistema informático

A la vista de la jerarquía de objetivos desarrollada, se podrían plantear las


dos cuestiones siguientes: 1) ¿deberían proponerse objetivos en mayor detalle?
y 2) ¿en qué nivel de la jerarquía deberían definirse los atributos? La respuesta
a la primera pregunta quedaría contestada aplicando los criterios de la sección
anterior. La segunda pregunta se contesta a partir de la consideración de objetivos
hecha en el árbol. Se observa, además, que el nivel de detalle o desagregación
de los objetivos varía de unos a otros. En efecto, no todos los objetivos finales
están en el mismo nivel, pues, por ejemplo, el objetivo “maximizar la facilidad
de uso” está dos niveles por encima del objetivo “maximizar la capacidad de
desbordamiento”.
Una vez construido el árbol de objetivos, la siguiente tarea consistirá en definir
o especificar los atributos asociados con los objetivos finales, que son los que
aparecen numerados en la figura. La Tabla 1.2. proporciona los posibles atributos
asociados a tales objetivos. Si es posible se considerarán atributos naturales y si
no, se buscarán sustitutivos o subjetivos, si fuera posible. Por ejemplo, para el
objetivo “maximizar el número de usuarios que soporta el sistema” un atributo
natural es el porcentaje de usuarios que soporta y la forma de medida sería por
recuento. Para el atributo “maximizar el número de funciones que maneja”, el
atributo podría ser el porcentaje de nuevas funciones que maneja el sistema y la
forma de medida, a partir de la estimación experta.
16
10 FU
FUNND
UAAM
M EN
b n TO
1u S
a D
U EEj L
WO úS S
o IST civmu
io « E M A S D E A YUDA A LA D E C IS IÓ N _______________©
------------ —..-«i*
W RA-MA

T&bla 1.2: Atributos y su medida para el árbol de objetivos del sistema informático

Objetivo A tributo Medida


1. Maximizar el número de %de usuarios
Recuento
■usuarios que soporta que soporta
2. Maximizar el número de %de aplicaciones
Recuento
aplicaciones que soporta que soporta
3. Maximizar el número % de nuevas Estimación de
de funciones que maneja funciones expertos
4. Maximizar la capacidad Años de posible
Estimación de
de crecimiento de lá carga crecimiento de la carga
expertos
media de trabajo media de trabajo
5. Maximizar la capacidad No. de pasos sin desbord./ Especificaciones
de desbordamiento No. de pasos totales del sistema
6. Maximizar el ahorro por Euros ahorrados con Estimación de
el cambio de sistema el nuevo sistema expertos
7. Maximizar la salida No. de trabajos/
Recuento
unidad de tiempo
8. Minimizar la tasa
% de fallos producidos Recuento
de errores
9. Maximizar la facilidad Escala de 0 a 100 para
de uso Subjetiva
una muestra de usuarios
10. Minimizar el tiempo Tiempo medio en Aplicación de
medio de fallo producirse un fallo tests

1.5 GENERACIÓN DE ALTERNATIVAS


En esta sección estudiamos el problema de la especificación de las alternativas
de decisión, que constituye la tercera fase del proceso de Análisis de Decisiones.
No es una tarea sencilla y, de hecho, se ha comprobado que muchos decisores
no llevan a cabo una labor de prospectiva suficiente cuando buscan o definen
alternativas para problemas complejos, quedando fuera la consideración de al­
ternativas relevantes. Discutiremos aquí las razones por las que con frecuencia
se tiene dificultad para definir o generar buenas alternativas, y a continuación,
mostraremos algunas ayudas que permitan superar esta dificultad.

1 .5 .1 D ific u lta d e s p a ra g en era r b u e n a s a lte r n a tiv a s

La rafe de la dificultad en el ser humano para identificar buenas alternativas


parece encontrarse en el proceso básico de su razonamiento. Los investigadores del
© RA MA C A P ÍT U L O 1: IN T R O D U C C IÓ N A LA T O M A D E D E C IS IO N E S 17

comportamiento consideran que en su estadio primario el razonamiento humano


es un proceso asociativo. Es decir, cuando pensamos sobre un nuevo problema
o situación, lo hacemos mediante asociación mental con situaciones previas rele­
vantes, y más aún, tal asociación se da con relativamente poco control consciente
de nuestra parte. Se dice que el razonamiento asociativo es eficiente y eficaz en
medios estables y con escasa incertidumbre, pues al ir ganando experiencia el
ser humano va siendo cada vez más capaz de llegar rápidamente a conclusiones
precisas sobre una amplia gama de situaciones. Sin embargo, al enfrentarnos con
una nueva situación, fuera de la experiencia previa, el razonamiento asociativo es
peligroso, ya que podemos encerramos en la conclusión prematura de creer que
hemos identificado las mejores alternativas, dejando de lado otras que podrían
ser mejores.
Algunas veces estos procesos mentales conducen a generar pensamiento ex­
traordinariamente creativo, pero con frecuencia rápidamente nos bloquea en con­
clusiones prematuras. Veremos entonces cómo podemos superar dificultades que
surgen en este proceso de generación de las alternativas. Comencemos consideran­
do los casos de disponer de demasiadas o de pocas alternativas.

Disponibilidad d e un núm ero grande de alternativas

Si nos enfrentamos a una situación de decisión con un número grande de alter­


nativas, las dificultades básicas que pueden aparecer se refieren esencialmente a
dos aspectos. El primero está relacionado con el problema de cómo organizar y
planificar la información, mientras que el segundo se refiere a cómo obtener la
información necesaria sobre el conjunto de potenciales alternativas. Es claro que
en ambas situaciones la solución consistiría en la identificación de un número más
reducido de alternativas.
En particular, cuando se encuentran disponibles los datos sobre el conjunto
de alternativas y éstas se pueden analizar por procedimientos rutinarios, esto es
típicamente debido a que las alternativas son combinaciones de elementos más
simples. Una situación ilustrativa se tendría en el caso de un individuo que
acude a un restaurante con la intención de elegir el menú para una recepción. El
menú a decidir constará de tres platos, cada uno elegido de un grupo distinto.
Supongamos que el primer grupo tiene 14 posibles elecciones, el segundo 16 y el
tercero 8. El número de posibles menús entre los que puede elegir el individuo
es desde luego bastante grande. En tales situaciones se sugiere la utilización de
métodos de Investigación Operativa como programación matemática, Ríos-Insua
(1996) y Ríos-Insua et al. (1997), que podrían ser una ayuda para determinar
cuáles son las mejores para ser consideradas en el problema de decisión pero sin
tener en cuenta de manera explícita todas las posibilidades, pues seguramente la
consideración de todas consumiría mucho esfuerzo.
Otro procedimiento de reducción de alternativas se basa en la aplicación de un
proceso de cribado basándose en ciertos criterios introducidos. En la Tabla 1.3 se
18 FUNDAM ENTOS D E LO S SISTEM AS D E A YUDA A LA DECISIÓ N _______________ ©

muestra la aplicación de este método a un ejemplo de selección de la localiza^


de una fábrica de acero en una extensa región geográfica. En principio, el conjunta
de posibles alternativas era extenso. Sin embargo, en un intento de reducir tal
conjunto se introdujeron tres criterios de cribado emanados de tres objetivos con
el propósito de reducir el número de lugares candidatos a ser considerados. p0r
ejemplo, el segundo objetivo indicado en la tabla se refiere a la maximización de]a
salud/seguridad. A partir de la correspondiente consideración (emisión de C02)
y de la medida (distancia a las ciudades) se introdujo como criterio no acepta»
localizaciones situadas a una distancia inferior a 30 km de núcleos de población

Tablal.3: Ejemplo de aplicación de criterios de cribado para localización


de una fábrica
Objetivo Consideración M edida C riterio
Impacto Conflicto Localización Fuera de tierras
medio­ respecto al uso de la de cultivos >
ambiental de la tierra fábrica 100 Ha

Distancia
Salud/ Emisión Distancia
mínima a
Seguridad de C02 a ciudades
ciudades 30 km

Ubicación Pendiente
Coste de Zonas con
en tierras no de las
la fábrica pendiente <5%
cultivables tierras

Nótese que la utilización de criterios de cribado implica una, aproximación.


Así, una posible localización que se encuentre a 28 km de un núcleo de población
no sería mucho peor que otra que se encontrara a 32 km. Sin embargo, la primera
se eliminaría, mientras que la segunda permanecería en consideración. Por ello,
debemos resaltar que los criterios de cribado deben ser relativamente flexibles. En
otro caso, si los criterios fueran estrictos, se podrían estar eliminando alternativas
suficientemente atractivas como para que fueran buenas candidatas a ser la más
preferida.

D isponibilidad de un número reducido de alternativas

Cuando se dispone de un número muy reducido de alternativas y especialmente


si ninguna parece ser muy buena, la tarea que se plantea es intentar generar al­
ternativas adicionales que sean atractivas y mejores. El proceso asociativo puede
ser una ayuda aunque también una desventaja. En efecto, tal proceso podría pro­
porcionar algunas ideas que a primera vista no parezcan importantes pero que
se conviertan en útiles y puedan aprovecharse para construir nuevas alternativas.
Sin embargo, también puede ser un inconveniente, ya que rápidamente podría
© R A -M A C A PÍT U L O 1: IN TRO D U CCIÓ N A LA TO M A D E DECISIONES__ 10

proporcionar un argumento de por qué se dispone ya de todas las alternativas


posibles cuando esto podría no ser así. Por ello, con frecuencia tendremos ten­
dencia a llevar a cabo juicios rápidos y seleccionar una alternativa antes de haber
tenido una cuidadosa consideración sobre otras posibilidades.
Una ayuda para superar este inconveniente se puede conseguir con la uti­
lización de tablas de generación de estrategias que permiten generar o identificar
alternativas deseables para un posterior análisis más detallado, Howard (1988).
La Figura 1.3 ilustra un ejemplo que corresponde a un problema de decisión sobre
la posible expansión de un negocio. Todas las columnas excepto la primera repre­
sentan diferentes aspectos de las alternativas de decisión. La primera columna a
la derecha de la línea de puntos vertical indica diversos niveles de inversión, la
segunda se refiere a si debe continuar' o no' el negocio en la localización actual, y
la última, el tipo de posesión si cambiara a otro lugar el negocio.

Estrategia Inversión en Permanencia en la Tipo de tenencia


motivo ubicación actual ubicación actual en otro lugar

Status Mantener Compra


quo Finalizar
Construcción
Incrementar |\
| Invertir K Alquiler
| Continuar [■—^
Reducir
""HNinguna |

F ig u ra 1.3: Ejemplo de una tabla de generación de estrategias

La construcción o generación de alternativas se obtiene seleccionando una


entrada de cada columna desde la segunda. Un ejemplo se muestra mediante la
serie de cajas unidas por una línea continua, que consiste en un incremento de la
inversión permaneciendo el negocio en la ubicación actual. Nótese que no todas
las combinaciones son posibles y que las combinaciones se basarán en juicios del
decisor.
Por tanto, vemos que una tabla de generación de estrategias ayuda a obtener
qué tipo de estrategias tiene sentido analizar con mayor detalle, aunque usual­
mente no proporciona alternativas precisas. Ésa es la razón por la cual la columna
de la izquierda se titula estrategias motivo y no alternativas. Así, una vez que se
hubieran identificado las estrategias motivo, entonces podrían definirse las alter­
nativas específicas.
Otra posibilidad para ayudar a la generación de estrategias se tiene a partir del
conjunto de objetivos, cuya construcción se habría cubierto en la etapa anterior
del proceso. Una jerarquía de objetivos para un problema de decisión resume los
20 FU N D AM EN TO S DK LOS .SISTEM AS L>H AYUDA A KA D E C IS IÓ N © i m -m a

dosoos dol dcclsor on cuanto a lo cjuo bü dosoa alcanzar 011 la oí ©colón do Ja iriojor
alternativa. SI hay dificultades on la gonoración do buoiww alternativos, ol árbol
de objetivos deboría proporcionar idoow sobre posibles nuovos alternativos a tenor
en cuenta, ver Koonoy (1992). Los aspectos que ol docisor debo tenor en cuenta
para ostimular sus pensamientos hacia nuevas alternativas so pueden obtonor do
diforentos formas. La Figura 1.4 muestra un posible Arbol do objetivos construido
por un docisor que ostudia la posibilidad do cambiar a un trabajo mejor.

Selecolón del
mejor trabajo

IngrcHOi

Crecimiento

Figura 1.4: Árbol de objetivos para la evaluación de alternativas de trabajo

Entre las posibles guías que se sugieren para estimular la obtención de nuevas
alternativas se tiene:

1. Considerar alternativas cuyo nivel de logro para un atributo tomado indi­


vidualmente sea lo mejor posible. Es decir, se buscarían alternativas que
sean muy buenas en un atributo sin preocuparse del nivel que pudieran tener
en los restantes. Con esta idea se generarían alternativas demasiado “unidi­
mensionales” como para ser atractivas por sí mismas, pero que pueden ser
alternativas factibles que combinen niveles aceptables de otras alternativas
extremas desarrolladas mediante este procedimiento. En el citado ejemplo,
podría ser muy atractiva una alternativa que corresponde a un trabajo en
la ciudad donde se reside actualmente (atributo “minimizar la proximidad
a familiares”), aunque su ejecución en algunos de los restantes atributos
fuera bastante más baja.

2. Proponer alternativas que maximicen un objetivo particular de la jerarquía


correspondiente a un nivel superior. Así, es probable que surjan alternativas
algo más equilibradas que si consideramos únicamente un solo atributo como
se indicó en el apartado anterior. Pensemos en el objetivo “maximización
de los ingresos”. Si para una alternativa determinada los valores de los
atributos que emanan del anterior objetivo tuvieran un buen nivel, entonces
la alternativa debería tenerse en cuenta en el problema.

3. Concentrarse directamente en la generación de alternativas que proporcio­


nen un equilibrio para todos los atributos.
© RA-MA C A P ÍT U L O 1: IN TR O D U C C IÓ N A LA TO M A D E D EC ISIO N ES 21

Estos procedimientos o ideas propuestas valen para generar alternativas rele­


vantes tanto si hubiera como si no hubiera incertidumbre sobre las consecuencias.
Sin embargo, si hay incertidumbre hay también algunos métodos adicionales que
pueden ser de una ayuda notable. En todo caso, indiquemos primero que algunas
alternativas que podrían no ser relevantes bajo certidumbre podrían tener sentido
bajo incertidumbre, y por ello, deberían considerarse como nuevas posibilidades.
Así, se podrían aceptar como alternativas aquéllas con unos valores medios en
sus atributos y que, independientemente de lo que ocurriera, no tuvieran un
mal comportamiento. También podría tener sentido seleccionar una alternativa
que permitiera secuenciar las decisiones. Por ejemplo, ante la decisión de cons­
truir una carretera que uniera varias ciudades, podríamos tomar la decisión de
construir algunos tramos parciales que unan algunos de los núcleos urbanos y pos­
teriormente una vez resuelta la incertidumbre, construir otros tramos o el resto,
siempre que la incertidumbre hubiera sido favorable. En esta situación y como
ocurre en muchas decisiones secuenciales, habría que disponer de un presupuesto
adicional para mantener la opción de responder cuando la incertidumbre quedara
resuelta.
Otra posibilidad consiste en repartir el riesgo con un socio, aunque de esta
forma se pierde la oportunidad de conseguir todos los beneficios si la incertidum­
bre se resuelve favorablemente. Sin embargo, tiene la ventaja de que las pérdidas
se repartirían si los resultados fueran buenos. También existe la posibilidad de
tomar un seguro frente a los riesgos exhibidos por las incertidumbres, lo que sig­
nificaría que el decisor no querría asumir el riesgo asociado con un suceso que es
improbable pero que le podría conducir a la ruina.
Podemos entonces decir que, en todo caso, el aspecto básico para alcanzar
buenas alternativas adicionales a las ya disponibles será la creatividad e imagi­
nación que pueda desarrollar el decisor en relación con el problema en estudio,
que se complementan con algunos procedimientos e ideas como hemos apuntado
y que en el caso de incertidumbre pueden ser una ayuda para reducir sustancial­
mente el riesgo de una consecuencia poco deseable pero manteniendo al mísmn
tiempo la oportunidad de sacar provecho de resultados atractivos.

1.6 DISCUSIÓN
El Análisis de Decisiones consiste en un marco racional y un conjunto de herra­
mientas para tratar con problemas que conllevan decisiones difíciles. Su objeti­
vo básico es ayudar al decisor a pensar de manera sistemática sobre problemas
complejos para mejorar la calidad de las decisiones finales. En ese sentido, es
conveniente recordar la distinción hecha entre una buena decisión y un resultado
afortunado. A la primera se debe llegar a través de un profundo conocimiento,
meditación y comprensión del problema, mientras que lo segundo, que también
podría ser desafortunado, es independiente de la calidad de la decisión.
22 FUN D AM EN TO S D E LOS SISTEM A S D E AYUDA A LA D E C IS IÓ N © RA-MA

La estrategia global para afrontar la solución del problema debe consistir en


descomponerlo en partes más pequeñas, permitiendo así unos análisis más fáciles
y comprensibles. Posteriormente, tales partes se reunirán de nuevo para crear una
representación global de la situación de decisión. Ya que un modelo de decisión
describe interacciones entre conjuntos de variables, previamente a la creación del
modelo hay que decidir qué variables se utilizarán, incluyendo las de decisión, de
azar y de resultado o atributos, así como el árbol de objetivos, que podrá ser una
ayuda importante en la generación de las alternativas o cursos de acción, uno de
los cuales elegirá el decisor.
La incorporación de juicios subjetivos es otro aspecto importante del Análisis
de Decisiones, ya que ayudará a cuantificar creencias y preferencias, obteniendo
con ello un modelo de trabajo para el problema que, mediante la aplicación rei­
terada del ciclo del Análisis de Decisiones se convertirá en uno que sea requisito,
es decir, que contenga los elementos y rasgos esenciales del problema, con el cual
el decisor pueda ya tomar una dédsión.
A lo largo del libro iremos proponiendo diferentes referencias que guiarán
al lector a través de los distintos temas o tópicos del Análisis de Decisiones
para una mayor profundización en su estudio. Aquí nos limitaremos a citar
algunos de los libros básicos y fundamentales en Análisis de Decisiones, que
en sus primeros capítulos proponen y discuten buena parte de las ideas bási­
cas y conceptos propuestos aquí. Entre ellos citaremos von Winterfeld y Ed-
wards (1986), French (1986), Watson y Buede (1987), Ríos, Ríos-Insua y Ríos
Insua (1989), Ciernen (1996), Keeney (1992), Klein y Methlie (1995), Kirkwood
(1997), Goodwin y Wright (1998) y Hammond, Keeney y Raiffa (1999). Tam­
bién en la dirección h ttp :/ / f a cu lty . f uqua. duke. edu/daweb/lexicon.htmo en
http://www.public.asu.edu/~kirkwood o http://pespmcl.vub.ac.be/ASC
aparecen glosarios de Análisis de Decisiones donde se indica terminología básica,
hipótesis, etc.
Son muchas y variadas las aplicaciones reales del Análisis de Decisiones a
problemas importantes en ámbitos como el económico, político, militar, social,
médico, industrial... siendo algunas de ellas las que citamos a continuación:
1) decisiones sobre la exploración en campos petrolíferos, Walls, Morahan y Dyer
(1995); 2) ayuda en los procesos de adquisición de armamento militar, Buede y
Bresnick (1992); 3) selección de proyectos I+D, Hess (1993); 4) mejora de deci­
siones estratégicas empresariales, Krumm y Rolle (1992); 5) decisiones políticas
de alto nivel de un gobierno, H&maiáinen y Leikola (1996); 6) planificación es­
tratégica de organizaciones de voluntarios, Quaddus, Atkinson y Levy (1992). En
Girón (1998) se describen otras. También es interesante la revisión de la litera­
tura de AD del periodo 1970-1989 de Comer y Kirkwood (1991) publicada en
Operafáons Reseach. Estos mismos autores están preparando otro artículo para
cubrir 1990-1999 en la misma revista, y aparecerá próximamente.
H^.MA _____________ CAPITULO 1; INTRODUCCIÓN A LA TOMA DE DECISIONES 23

Para finalizar queremos resallar la íntima conexión entro el Análisis do De­


cisiones y la Inteligencia Artificial. Aunque en sus primeras décadas de desa­
rrollo ambas teorías discurrieron por caminos distintos, on los últimos años se
ha producido un apoyo mutuo entro ambas que gracias al soporte informático
ha conducido al desarrollo de los denominados sistemas de decisión inteligentes,
Holtzman (1989), que como hornos apuntado so basan en conceptos y herramien­
tas de ambas áreas, siendo su futuro a medio plazo bastante prometedor. Esto
se detallará en el Capítulo 10.

1.7 EJERCICIOS
1.1 Definir varias variables de decisión y azar para cada uno de los siguientes
problemas y considerar una clasificación doble indicando si son, por una
parte, de decisión o de azar, y.por otra, si son discretas o continuas.

(a) El jefe de personal de una empresa tiene que realizar los informes sobre
varios candidatos para un puesto de trabajo.
(b) Una empresa de alquiler de automóviles debe decidir si sustituir varios
automóviles de su flota.
(c) Un individuo debe decidir dónde irse de vacaciones el próximo verano.

1.2 Construir un árbol de objetivos identificando los correspondientes atributos


o variables resultado para cada uno de los anteriores problemas.
1.3 Describir un problema de decisión con el que se haya enfrentado reciente­
mente tratando de identificar los elementos básicos considerados así como
si hubo cierta similitud en su resolución con las etapas del cido del Análisis
de Decisiones.
1.4 Considere el lector un problema de decisión que pueda ser importante para
él. Por ejemplo, cambiar de empleo, cambiar de centro de estudios, elegir
un nuevo automóvil, vivienda u ordenador, etc. Para este problema se pide:
(a) Construir un árbol de objetivos.
(b) Identificar un atributo para cada objetivo de nivel más bajo, con­
siderando aquellos más apropiados, y proponer una medida y su escala
asociada.
(c) Aplicar los criterios de completitud, descomponibilidad, etc. al árbol
construido para comprobar lo adecuado que habría resultado para el
problema el conjunto original de atributos.
(d) Proponer posibles alternativas construyendo una tabla de generación
de alternativas primero y luego mediante el árbol de objetivos cons­
truido.
CAPÍTULO 2

PREFERENCIAS EN
CERTIDUMBRE____________

Un individuo, prácticamente desde que se levanta hasta que se acuesta, no


deja de tomar decisiones. Por ejemplo, elegir la ropa que se pondrá, el desayuno
que tomará, el instante de salida hacia el trabajo, etc. Estos son problemas de.
decisión muy simples que tienen una solución fácil. Sin embargo, existen muchos
otros que por su transcendencia no resultan tan sencillos de resolver. Pensemos
en la compra de una vivienda, la elección de una carrera universitaria, etc., sin
olvidarnos de las decisiones que deben tomar los gobernantes de un país con
repercusión sobre toda la población. Cuando a un decisor se le presenta este tipo
de problemas le sería de inestimable ayuda saber cuál es la función, si existe,
que representa su estructura de preferencias, ya que la solución más preferida
será la alternativa que haga máxima tal función. Dependiendo del ambiente en
que se encuentren los problemas de decisión los podemos clasificar dentro de dos
grupos: certidumbre o incertidumbre. El ambiente es de certidumbre cuando
las consecuencias de cada alternativa son conocidas y, por el contrario, es de
incertidumbre cuando no son conocidas. Un ejemplo de problema de decisión en
ambiente de certidumbre sería una inversión con renta fija y uno en ambiente de
incertidumbre es la inversión en acciones que cotizan en bolsa.
En este capítulo consideramos el caso de certidumbre y estudiamos los axio­
mas que sirven de soporte a los modelos de preferencias en este ambiente. Un
modelo de preferencia es un esquema abstracto que refleja las propiedades de
las preferencias de un decisor real. Consideraremos una perspectiva normati­
va, es decir, las representaciones matemáticas que utilizaremos nos indicarán las
decisiones que se deberían tomar si el decisor se considera racional y sus prefe­
rencias son consistentes. Decimos que las preferencias de un decisor racional son
consistentes cuando verifican ciertos axiomas que usando la “lógica racional” se
deberían cumplir. Por ejemplo, no es lógico decir que a un decisor racional deba
gustarle más el tiempo veraniego que el invernal, pues sería una preferencia dic-
26 FUNDAMENTOS D E LOS SISTEM A S D E A Y U D A A L A D E C IS IÓ N
§1*1
tatoriaJ. Sin embargo, si a este decisor le gusta más el verano que la prin^^M
la primavera más que el invierno, parece lógico deducir que le gusta más el Ve **
que el invierno. AHUp
En este capítulo comenzaremos estudiando las propiedades que debe verjfM
la preferencia estricta e indiferencia de un decisor racional en un problema^
decisión. A continuación realizaremos una breve introducción de las relación
binarias, al ser de este tipo las relaciones de preferencia. Una vez vista la pr^*
rencia estricta e indiferencia, estaremos en condiciones de estudiar las propiedad
que verificarán las preferencias débiles de un decisor racional. Posteriormente &
saltaremos las condiciones necesarias y suficientes para la existencia de función^
que representan las preferencias de un decisor de una forma ordinal y carc
(medible). Debido a que no siempre el decisor se comporta de forma consisten^
haremos una pequeña introducción a la perspectiva descriptiva. También con-
sideraremos las alternativas multiatributo, que son las más habituales en la vida
real, comenzando el estudio con el caso de dos atributos, donde los conceptos so¡&
más fáciles de entender, para posteriormente generalizar los resultados, i

2.1 PREFERENCIA ESTRICTA E INDIFERENCIA


Esta sección está dedicada a dos conceptos fundamentales: preferencia estricta e
indiferencia. Veremos las propiedades que debe verificar cada una de ellas, por
separado y conjuntamente, si perteneciesen a un decisor racional consistente»
Cuando se le presentan dos alternativas a y b a un decisor puede que tenga muy i
claro que para él a es preferida a 6. Por ejemplo, si en un restaurante le ofrecen ;
a una persona vegetariana que elija entre dos posibles platos: a = combinado de
espárragos, maíz, legumbres, etc., y b = filete de ternera a la plancha, claramentiJ
para este individuo el plato a es preferido al 6. Esta situación la denotaremos!
como a y b que indicará que el decisor prefiere estrictamente la alternativa o í
la 6; en otras palabras, nunca se plantearía elegir b si le dieran a elegir entre las
dos.
Las propiedades que debe verificar la preferencia estricta de un decisor racional
para que se considere consistente son:

1. Transitiva. Sean tres alternativas o, 6 y c. S i a y b y b y c entonces i

a y c.

Parece lógico considerar que las preferencias de un decisor racional sean tran­
sitivas, ya que si una alternativa es preferida a otra y esta última a una tercera,
lo normal es que la primera sea preferida a la tercera. Un argumento para justi­
ficar esta afirmación podría ser el conocido argumento de la máquina de dinero-
Consideremos una agencia de empleo nada escrupulosa y un director de empresa
© RA-M A C A PIT U L O 2: P R E F E R E N C IA S EN C ER TID U M B RE 27

que se supone racional. La agencia cuenta, entre sus clientes, con tres posibles
trabajadores a, b y c, a los cuales el director ha entrevistado y piensa que

a y b, b y c y c y a.

La agencia indica al director que c no está disponible y que debe elegir entre ayb.
El director contrata a a, ya que para él o y b, y paga a la agencia por sus servicios.
Después, la agencia “descubre” que c podría ser contratado y se lo comunica a
la empresa indicándole, además, que b es el que ahora no está disponible. La
empresa tiene contratado a a pero ahora también tiene como competidor a c. Ya
que el director tiene la última palabra y sus preferencias son c >- o, la agencia no
encontrará dificultad para que se contrate a c.en lugar de a a. Como la agencia
continúa estando en nómina, sigue recibiendo honorarios. Al poco tiempo se
informa al director de que b ha dejado de estar indisponible y que es a el que
está en esa situación. La empresa contrata a b en el lugar que ocupaba c, ya que
para el director 6 y c. Si a vuelve a estar disponible y c no, volveríamos a estar
en la situación inicial, con lo cual se entraría en un cliclo que nunca tendría fin
y por el cual siempre se le estaría pagando a la agencia. Este ciclo no se habría
producido si las preferencias del decisor hubieran sido transitivas. Por tanto, se
deduce que lo razonable es exigirle a las preferencias racionales que cumplan la
transitividad.

2. Asim étrica. Dadas dos alternativas a y b, si a y b entonces nunca puede


ser b y a.
Es claro que esta propiedad se debe verificar, ya que si una alternativa es más
preferida que otra, la menos preferida no puede ser la más preferida.

Hemos comenzado está sección suponiendo que cuando se le presentan dos


alternativas o y b a un decisor, puede tener muy claro que una es preferida a la
otra. Sin embargo, también puede darse el caso de que le sean indiferentes. Por
ejemplo, si al decisor vegetariano, en lugar de ofrecerle un plato de vegetales y
otro de carne, le presentan dos platos de vegetales, le pueden apetecer por igual.
Usaremos la notación a ~ b para indicar que el decisor es indiferente entre las
alternativas a y b, es decir, se sentirá igualmente satisfecho eligiendo a o b.
Para que las indiferencias de un decisor racional se consideren consistentes
deben verificar las propiedades siguientes:

1. Transitiva. Sean tres alternativas a, b y c. Si a ~ b y b ~ c, entonces

a ~ c.

A primera vista esta propiedad puede parecer razonable. Sin embargo, el siguien­
te ejemplo, French (1986), nos puede hacer dudar. Supongamos un decisor que
es indiferente a que en su café se le ponga un grano más o menos de azúcar. Es
M FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN

decir, es indiferente que tenga un grano o dos, dos o tres, tres o cuatro, y
sucesivamente. Si se cumple la propiedad transitiva se llegaría a la conclusión'
que le da igual-tomar una taza de café sin azúcar que tomarse la taza repleta ^
azúcar.
Este ejemplo, podría mostrar que la suposición de transitividad podría
rechazable. Sin embargo, esto no es así, ya que con lo que nos hemos encontré
do es con un conflicto entre la perspectiva (de las preferencias) descriptiva y ja
normativa. Para que podamos considerar una elección racional, sin estar influ^
ciada por nuestras limitaciones humanas (perspectiva descriptiva), asumiremos
que el decisor racional tiene poderes de discriminación infinita (perspectiva ñor.
mativa). Así, si dos tazas tienen diferente cantidad de azúcar, entonces el decisor
puede tener una preferencia entre ellas’, incluso aunque nosotros en su lugar no
pudiéramos percibir la diferencia.

2. Reflexiva. Dada cualquier alternativa a entonces a ~ a.

3. Simétrica. Sean dos alternativas a y b. Si o ~ 6 entonces 6 ~ a.

Sobre estas dos propiedades parece claro que no procede discusión alguna

Hemos indicado las propiedades que deben verificar la preferencia estricta y


la indiferencia por separado, de un decisor racional para que sea consistente. A
continuación vemos las que deben cumplir conjuntamente:

1. Transitiva. Sean tres alternativas a, 6 y c. Si a ~ b y b y c entonces

a y c,

y s i a X b y f e ~ c , entonces de nuevo se debe cumplir a y c.

2. Completa. Para cualquier par de alternativas a y 6 se debe cumplir una


de las tres siguientes afirmaciones

a y 6, a ~ 6, b y a.

Los detractores de la teoría normativa afirman que esta propiedad no siempre se


cumple, ya que a un decisor al que se le presenta un par de alternativas puede que
prefiera una a la otra o que le sean indiferentes, pero también existe la posibilidad
de que no pueda o no quiera compararlas. Pensemos, por ejemplo, en la respuesta
que daríamos a la pregunta: ¿Qué es más probable, que llueva mañana o que
Laplace muriera en 1829? Muchos dirían que no pueden compararse. Pertj
los decisores se les suele pedir que comparen alternativas que están relacioDaC^
y que les conciernen por pertenecer a sus problem%dede^táj^^^®|^^
partidarios de esta crítica deberían aclarar ciertas distinciones sutiles entre
© RA-M A C A PÍT U L O 2: PR EF E R E N C IA S EN CERTID U M B R E 29

modelos normativos y los descriptivos. La perspectiva normativa supone que


existe el decisor ideal con una capacidad de discriminación infinita, teniendo el
poder de ordenar cada par de alternativas. Sin embargo, la perspectiva descriptiva
supone que los decisores reales no tienen tal poder y necesitan ayuda para tender
hacia el ideal, y esta ayuda la proporciona el análisis descriptivo. Los modelos
normativos poseen un punto de vista estático del decisor asumiendo que tiene
un completo poder cognoscitivo y un completo entendimiento de sus creencias
y preferencias; mientras que el análisis descriptivo posee un punto de vista más
dinámico, ayudando al decisor a construir sus juicios. Como nosotros hemos
tomado una postura normativa creemos que es una propiedad que deben cumplir
las preferencias.

2.2 RELACIONES BINARIAS


La preferencia estricta e indiferencia, vistas en la sección anterior, son ejemplos
de relaciones binarias. A lo largo de este libro encontraremos muchos ejemplos
de tales relaciones. Es por ello por lo que dedicaremos esta sección a una breve
introducción de dichas relaciones.
Una relación binaria R sobre un conjunto A es un subconjunto del producto
cartesiano A x A jle pares ordenados posibles (o,b), a e A, b € A. Se escribe aRb
o bien (a, b) € R, y se lee: “el par (a, b) posee la propiedad R o está en la relación
R ”.

Ejemplo 2.1
Consideremos el conjunto formado por Juan, Pedro, Antonio y José, alumnos
de la asignatura Sistemas de Ayuda a la Decisión. Las notas que han obtenido
en el examen final de junio son 4, 8, 10 y 2, respectivamente. Si consideramos la
relación binaria “sacar mejor nota que” tenemos que
, A = {Juan, Pedro, Antonio, José}
es el conjunto de elementos y la relación binaria, R = “sacar mejor nota que”,
se puede identificar con {(Antonio, Juan), (Antonio, Pedro), (Antonio, José),
(Pedro, Juan), (Pedro, José), (Juan, José)}, ya que Antonio ha sacado más nota
(10) que Juan (4), que Pedro (8) y que José (2); Pedro (8) más que Juan (4) y
que José (2); y Juan 64) más que José (2). □

También diremos que A


I (A, R) es un sistema relacional o una estructura
relacional formada po^ un conjunto A y una relación R definida sobre A, o que
(A, R) es un conjunto A relacionado por R.
A partir de la relación binaria R podemos definir:

La relación complementaria R c como (a, b) £ R° (o, b) £ R.


FU N D A M EN TO S D E LOS SIST EM A S D E AYUDA A I.A DEOIfalÓN
© RA.i

La relación recíproca o simétrica R s que se defino (a, b) € R “ (6, a) g /j


La relación dual R d que se define (o, b) & R á (b, a) (jz R.

Ejemplo 2.1 (continuación)


Continuamos con el Ejemplo 2.1 y llamamos o = Antonio, b — Juan, c = ,
y d — Pedro.

La relación complementaria es
{(d, a ) , (6, a ) , (6, d ), (c, a ) , (c, d ), (c, 6) , (a, a ) , (6, b) , (c, c ), (d, d)}.
La relación recíproca o simétrica es
{(6, a), (d, o), (c, ¿), (6, d), (c, d), (c, 6)}.
La relación dual es
{(a, d), (o, 6), (d, 6), (a, c), (d; c), (6, c), (o, o), (b, b), (c,c), (d, d)}. □

Las anteriores tres relaciones verifican R d = (ü s)c.


Una relación binaria R puede representarse en forma matricial de forma que
el elemento de la fila i y la columna j es un número a cuando el par (o í, aj) 6 R,
con ai la alternativa de la fila i y la alternativa de la columna j , y un número
P cuando (a¿, o,-) 6 R c. Normalmente se toma a = 1, (3 = 0 (lenguaje booleano).

Ejemplo 2.1 (continuación)


La representación matricial del Ejemplo 2.1 es
a b c d
a / 0 1 1 1 \
b 0 0 1 0
c 0 0 0 0
d \ 0 1 1 0 /
La matriz también la podemos construir poniendo una x en las posiciones (t, j)
tal que (ai,aj) € R, y nada en las restantes.
a b c d
a X X X
b X
c
d X X

Otra posible representación de una relación binaria se obtiene mediante un


grafo (.4, R) donde A es un conjunto de nodos y R un conjunto de arcos, de modo
que existe un arco que va de o a b si y sólo si aRb.
© RA-MA_____________ .______________ CA PÍTULO 2: P R EFER EN C IA S EN CERTIDUM BRE 31

Ejemplo 2.1 (continuación)


E l grafo p a r a el E jem plo 2.1 es


En las secciones previas hemos introducido las propiedades transitiva, asimé­
trica, simétrica y reflexiva al estudiar la preferencia estricta e indiferencia. Ahora
las definiremos en términos más generales conjuntamente con otras nuevas.
Sea R una relación binaria sobre un conjunto A. A la negación de R la
denotaremos con Es decir, alfib significa que no es cierto que aRb.
Una relación binaria R sobre A se dice:

• Reflexiva, si para todo a 6 A, aRa.


• Irreflexiva, si para todo a 6 A, afta.
• Simétrica, si para todo a, b € A tal que aRb => bRa.
. • Asimétrica, si para todo a, b e A tal que aRb => b]¡la.
• Antisimétrica, si para todo a, b E A tal que aRb y bRa =>a = b.
• Transitiva, si para todo a, b, c € A tal que aRb y bRc =4- aRc.
• Negativamente transitiva, si Vo, b,c 6 A ta l que a^ib y bl/tc => aftc.
• Comparable o completa, si para todo o, 6 € A, aRb o bRa o ambas a la vez.

Observemos que la representación matricial de una relación binaria simétrica


o asimétrica se corresponde con una matriz simétrica o asimétrica, con respecto
a la diagonal principal, respectivamente. La matriz del Ejemplo 2.1 ilustra una
relación asimétrica.

Ejemplo 2.1 (continuación)


El Ejemplo 2.1 verifica las propiedades: irreflexiva, asimétrica, antisimétrica,
transitiva, negativamente transitiva y comparable. □
32 FUNDAMENTOS DE LOS SISTEM AS D E AYUDA A LA D EC ISIÓ N Hg |
Algunas relaciones entre estas propiedades, de fácil demostración, son (ver
Ejercicio 2.3):
1. Si i? es asimétrica, es irreflexiva.
2. Si R es irreflexiva y transitiva, es asimétrica.
3. Si i? es negativamente transitiva y asimétrica, es transitiva.
4. Si R es transitiva, irreflexiva y comparable, es negativamente transitiva.
Todas las relaciones que son transitivas se denominan órdenes. Las ordena-
ciones más importantes son:

1. Equivalencia, si R e s reflexiva, simétrica y transitiva.

Toda relación de equivalencia da lugar a una clasificación de los elementos


del conjunto A en subconjuntos del tipo R(a) = {6 | 6 6 A , bRa} llamados
clases de equivalencia. Estos conjuntos son disjuntos, no vacíos, y dos elementos
de A pertenecen a la misma clase si y sólo si son equivalentes. Por tener estas
propiedades se dice que las clases de equivalencia respecto a R constituyen una
partición de A. La indiferencia, estudiada anteriormente, es una relación de
equivalencia.

2. Orden estricto, si R es asimétrica y transitiva.

La preferencia estricta, estudiada anteriormente, es un orden estricto.

3. Orden débil, si R es comparable y transitiva.

La preferencia débil, que se verá en la siguiente sección, es un orden débil.

4. Orden lineal o simple, si R es un orden débil antisimétrico.

En la Figura 2.1 presentamos gráficamente las propiedades que cumplen los


diferentes órdenes.
| Simétrica 1 |Asimétrical

|Equivalencia| Orden Orden


estricto débil

Orden
lineal o
simple

Figura 2.1: órdenes y propiedades


© RA-MA C A P IT U L O 2: P R E F E R E N C IA S EN C E R T ID U M B R E 33

Otras ordenaciones importantes son:

• Orden parcial estricto, si R es irreflexiva y transitiva.


• Orden débil estricto, si R es asimétrica y negativamente transitiva.

2.3 PREFERENCIAS DÉBILES


En la sección primera definimos siete condiciones de consistencia que se de­
berían exigir a las preferencias estrictas e indiferencias expresadas por decisores
racionales. Sin embargo, es posible representar de forma más compacta estas siete
exigencias introduciendo un nuevo concepto, preferencia débil, que denotaremos
como a b para indicar que a es al menos tan preferida como b para el decisor.
Es decir, con la expresión a £ b est.amos diciendo que a >- 6 ó a ~ b, de forma
análoga a la relación que existe para > con respecto a > y a =.

E jem plo 2.1 (continuación)


Consideremos el Ejemplo 2.1 cambiando la relación binaria antes definida por
R = “sacar mejor o igual nota que” . En este caso, la representación matricial es

a b c d
a ( 1 1 1 1
b 0 1 1 0
c 0 0 1 0
d ^0 1 1 1


Veamos las condiciones que deben imponerse a la relación £ para que se haga
un uso racional de ella. Debido a que ésta va a constituir los cimientos sobre
los cuales construiremos la teoría de cuantificación de preferencias, las vamos a
denominar axiomas.

A xiom a 1. (Com parabilidad) a ^ b ó b ^ a o ambas a la vez, \/a,b € A.

Este axioma puede también definirse como: $ a, b € A tal que a b y b ^ a, es


decir, no existe un par de elementos a y b tal que a no sea al menos tan preferido
como b y que b no sea al menos tan preferido como a. En otras palabras, si no
asumimos comparabilidad pueden existir elementos de A que el decisor no pueda
comparar, es decir, que al presentárselos se encuentre indeciso. Sin embargo,
nosotros suponemos que un decisor racional nunca debería ser indeciso por los
motivos indicados al estudiar la propiedad de completitud en las preferencias
estrictas e indiferencias (Sección 2.1).
3) p it n d A M EN TO S d e l o s s i s t e m a s d e a y u d a a l a D E C IS IÓ N ______________ ©RA-M A

Axioma 2. (TVansitividad) Si a £ b y b £ c entonces a £ c.

Este axioma parece muy razonable. Sin embargo, debería observarse que esta
suposición no puede justificarse por el “argumento de la máquina de dinero” tal
como se hizo cuando estudiamos las preferencias estrictas, al no estar el decisor
obligado a decidirse por una o por otra. Sin embargo, sí se pueden trasladar aquí
comentarios análogos a los realizados en la Sección 2.1 al estudiar la transitividad
de la indiferencia.
Anteriormente, hemos indicado que la relación £ puede entenderse como la
combinación de >- y ~ . Formalicemos esto en términos axiomáticos.

A xiom a 3. (C onsistencia de la indiferencia y la preferencia débil)


Para cada par de alternativas a,b € A , a ~ b <=>■(a 6 y 6 £3 o).

Este axioma nos dice que dos alternativas son indiferentes si y sólo si cada
una de ellas es al menos tan preferida como la otra.

A xiom a 4. (C onsistencia de la preferencia estricta y la preferencia


débil) Para cada par de alternativas a,b € A , a y b 6 ¡¿ a.

Este axioma nos dice que si o es más preferida que b entonces b no puede ser
al menos tan preferida como o, siendo una consecuencia directa de la relación que
debería esperarse entre y y £3 .
Podría pensarse que a y b implica no sólo que b % a , sino también que a £ b.
Sin embargo, esto se obtiene directamente del Axioma 1.

E je m p lo 2.2
Sean el conjunto de alternativas A = {a, b, c, d) y las preferencias del decisor
las representadas por las siguientes matrices
fM V
a b c d a b c d a b c d
a
b
X X
X
X
X
X a
b
( X
X
X \ a
b
f X X
X
\
c X c X c
d \ X X X X d \ X X 1 d { X X /
Entonces estas preferencias verifican:
a) Axioma 1, ya que para todo par de alternativas de A hay establecida una
relación de preferencia: a £3 b, a £3 c, a £ d, d £3 o, b £ c, d £3 b, d £ c.
b) Axioma 2, ya que: a £ b , b £ c => a ^ c \ a £ d ,d £ b => a h
a~
r v d >1 d £ , c = > a>r,c;
f\j i d>~b,b>~c=>
r\j i r \j d>~c.
rv

c) Axioma 3, ya que: o r\J d & a >z d, d>z a.


© RA-MA C A PIT U L O 2: P R E F E R E N C IA S EN C ER TID U M B R E 35

d) Axioma 4, ya que: a y b < & b % , a; a y c & c % a\ b y c & c f c b ;


d y b O b 'fc d -, d y c >¡¿d. □

Las indiferencias y preferencias estrictas son consistentes si se verifican los


cuatro axiomas anteriores, como demostramos en el siguiente teorema.

Teorema 2.1
Si se cumplen los Axiomas 1, 2, 3 y 4> entonces:

i) (A, y ) es un orden estricto;


ii) (^4, ~) es una equivalencia;
iii) (^4, £3) es un orden débil.

D em ostración. Demostrar que (.A, y) es un orden estricto es equivalente a pro­


bar que >- es transitiva y asimétrica. Demostremos inicialmente la transitividad.
Sean a,b,c € -4, tal que a y b y b y c y veamos que no se puede dar que c y a.
En efecto, supongamos que se cumplen las tres sentencias y llegaremos a una
contradicción. Como b y c, por el Axioma 4 c¡£b. Por el Axioma 1, esto implica
que b £ c. Así, ^ c , c ^ a y por el Axioma 2, b £3 a. Pero a y b, y por el Axioma
4, b £ a. Esto es una contradicción, ya que se ha obtenido que b £ a y b a.
Luego c a y por el Axioma 4, a y c. Ahora, demostremos la asimetría. Sea
a y b, por el Axioma 4, b'fca. Luego b )f a.
Demostrar que {A, ~) es de equivalencia equivale a ver que ~ es reflexiva,
simétrica y transitiva. La reflexividad se demuestra de forma directa aplicando el
Axioma 1 y luego el Axioma 3. La simetría es consecuencia del Axioma 3, ya que
si a ~ b, por el Axioma 3 (a £ b y b £ a), es decir, (6 £ a y a £ b) y aplicando de
nuevo el Axioma 3, b ~ o. Para la transitividad, si a ~ 6 aplicando el Axioma 3
se obtiene ( a '£ b y b ^ j a) y si b ~ c por el Axioma 3 ( i ^ c y c ^ t ) y aplicando
el Axioma 2 a las cuatro relaciones de preferencia se llega a que a £3 c y c £ a.
Entonces, por el Axioma 3 se tiene que a ~ c.
Finalmente, que (A, £ ) es un orden débil nos lo están indicando los Axiomas
1 y 2. A

Ejemplo 2.2 (continuación)


En el Ejemplo 2.2:

i) {A, >-) es un orden estricto [1) asimétrico: a >-1 b ¡1 o; o y | I a jji


b y c <&c ) / - b - , d y b & b ) / - d ] d y c & c / d , 2) transitivo: a y b,
b y c a y c; d y b,b y c =►d y c];
36 FUN D AM EN TO S D E LOS SIST EM A S D E A YUDA A LA D E C IS IO N _______________© J U -k j* 1

ii) (A, ~) es de equivalencia [1) reflexiva: a ~ a,b ~ 6,c ~ c,d ~ »


simétrica: a ~ d = > d ~ a, 3) transitiva: a ~ d , d ~ a = ^ a ~ a , d ~ c ¿ ] ;
iii) («4, £ ) es un orden débil [1) comparable: por el Axioma 1 que vimos que ^
cumplía, 2) transitiva: por el Axioma 2 que vimos que se cumplía], q

También se verifican estas otras propiedades.

Teorema 2.2
Si se cumplen los Axiomas 1, 2, 3 y 4> se tiene que:

i) Si a ~ b y b y c entonces a y c, Va, b,c £ A;


ii) Si a y b y b ~ c entonces a y c, Va, b, c €EA\
iii) Alguna de las sentencias a y b, a ~ b, b y a son ciertas, Va, b € A.

D em ostración, i) Lo demostramos por reducción al absurdo. Supongamos que


c ^ a y como a ~ b por el Axioma 3 (a £ 6 y b 'y a). Luego, tenemos que c £ a
y a £ 6, y aplicando el Axioma 2, c £ b. Como b y c, por el Axioma 4, c £ b. La
suposición de que c £ a nos ha llevado a demostrar que c £ 6 y c 6, lo que es
una contradicción. Luego a y c.
ii) Se demuestra de forma análoga al apartado i).
iii) Dados a,b € A, existen cuatro combinaciones posibles entre ellas: a) a £ b
y b £ a; b) a ¡fc b y b a; c) a £ b y b % a; d.) a % b y b % a. Ahora, a) por el
Axioma 3 implica a ~ 6; b) por el Axioma 4, 6 >- a; c) por el Axioma 4, a y b;
d) por el Axioma 1 es imposible. A

En el Teorema 2.1 se demostró que (.4, ~ ) es de equivalencia. Por tanto, cada


elemento a £ A pertenece a una única clase de equivalencia que la denotaremos
como

I(a) == {b e A | b ~ a}

y la llamaremos clase de indiferencia de a.


Algunas propiedades de las clases de indiferencia que se obtienen si se verifican
los cuatro axiomas de consistencia son, ver French (1986), página 73:

i) a ~ b <=> /(a) = I(b).

ii) Si /(a ) y I(b) tienen algún elemento en común, entonces I(a) = I{b).

iii) Si a y b =$>c y d,Vc € I(a) y Vd € I(b).


© RA-MA __________________ CA PÍT U L O 2¡ P R EFER EN C IA S EN CERTIDU M BRE 37

2.4 TEORÍA DEL VALOR ORDINAL


En esta sección estableceremos teoremas de representación, que permiten pasar
del sistema de preferencias del decisor a una función de preferencia o de valor
que es una escala con valores en el conjunto de los números reales. Es decir,
dado un conjunto A de alternativas y sobre él una relación de preferencia débil £
de un decisor, entonces u(-) es una función de valor ordinal representando estas
preferencias, si u(-) es una función definida sobre A con valores en ]R tal que
a £ b ■O’v(a) > v(b).

Las dos ventajas principales de esta representación son: ¿) Es muy compacta,


es decir, si tenemos un conjuntó de preferencias sobre n objetos tan sólo necesi­
tamos n números reales que sabemos ordenar; ii) Es mucho más fácil identificar
el objeto más preferido maximizando una función de valor ordinal que buscando
dentro del conjunto A el elemento a* tal que a* a, Va € A.
Resaltemos que estamos usando funciones de valor que son ordinales, es de­
cir, que nos sirven para establecer únicamente la ordenación sobre la recta real.
Entonces, si tenemos por ejemplo dos alternativas o, 6 € A y una función de va­
lor ordinal d(-) que representa las preferencias de un decisor tal que v(a) = 6 y
v(b) = 1, lo que significa es que a y b y no que a es seis veces más preferida que
b.
Hemos visto la definición de función de valor ordinal representando preferen­
cias débiles. Si ahora consideramos preferencias estrictas tenemos que la repre­
sentación es
a>- b (Axioma 4) Z>% a v(b) ^ v(a) O- v(a) > v(b).
En el caso de indiferencias se cumple
o ~ b (Axioma 3 ) ^ a £ 6 y i > £ a < í > v(a) > v(b) y v(b) > v(a) v(a) = v(b).

Comencemos viendo diferentes teoremas de representación que no necesitan


que los elementos a € A sean de IR” , sino que bastará con que el decisor pueda
hacer comparaciones entre ellos. El caso de a € A de ]Rn se verá en la Sección
2.7.
Por otra parte, supondremos sucesivamente que el conjunto A es: finito,
numerable y no numerable.

T eorem a 2.3
Sea A = { ai ,. . . ,a„} un conjunto finito de alternativas. Si (A fe) verifica
los Axiomas 1, 2, 3 y 4> existe una función de valor ordinal tal que

°» aj & v(°») ^ v(ai )■


88 FUNDAMENTOS DE LOS SISTEM AS DE AYUDA A LA D EC ISIÓ N --------------------- © B A j u ’l

D e m o s tra c ió n . Para demostrar esto teorema construimos una función de valor


ordinal que represente la relación de preferencia £3 • ®ea
v (oí) = número de alternativas £ A tal que a, £
Se trata de comprobar que la función v(-) es tal que o< £ a.j v ((l¡) > v(aj).
=s>) Sea o, £ üj y a* una alternativa tal que aj £3 ak~ P°r transitividad a¿ >■^
Así, cada alternativa contada en v(aj) es también contada en v(ai). Luego o,- >■
o,- =»■v(o,) > v(a}).
<v=) Supongamos que no es cierta y llegaremos a una contradicción. Si no es
cierta es por que 3o* £ j4 y € -4 tal que v(o*¡) > v(ai) y o* oj. Pero
ak >¡r a, =$■o{ >- o*,. =í- v(at) > v(o*) [ya que por un lado tenemos que a¿ >- o* =*
a( £ o* => v(at) > v(o*) y por otro existe al menos una alternativa, at, contada
en t’(oj) pero no en v(a*) por lo que v(at) > v(ofc)]. Contradicción con nuestra
suposición. A

Ejemplo 2.3
Supongamos que las preferencias sobre el lugar de veraneo de un individuo
están representadas en la matriz siguiente, donde aparece un 1 cuando el sitio re­
presentado por la fila es al menos tan preferido como el que representa la columna

Barcelona Galicia M adrid M arbella Ttenerife Suma


Barcelona 1 1 1 3
Galicia 1 1 2
Madrid 1 1 1 1 4
Mar bella 1 1
Ttenerife 1 1 1 1 1 5

La función de valor que se obtiene es: u(Tenerife) = 5, i>(Madrid) = 4,


1/(Barcelona) = 3, v(Galicia) = 2 y t;(Marbella) = 1. Luego, el lugar más preferido
para veranear de nuestro decisor es Tenerife. □

Si en lugar de considerar la preferencia débil consideramos la preferencia es­


tricta se obtiene un resultado análogo, ver Ríos eí al. (1989), página 51: Sea
A = {ai, ■- • , a„} un conjunto finito de alternativas. Si (.A, >-) es un orden estric­
to, existe una función de valor ordinal tal que

Oj >- aj v(ai) > v (a j).

Es interesante observar que el papel del teorema de representación es intro­


ducir una escala ordinal mediante algún artificio apropiado. A continuación se
verá que el teorema de unicidad asegura que tal escala es única, salvo una clase
de transformaciones bien definidas: la de las estrictamente crecientes. Las trans­
formaciones estrictamente crecientes son conocidas como las transformación®
© RA-MA CAPITULO 2: PREFERENCIAS EN CERTIDUMBRE 80

admisibles de las funciones de valor ordinales. Son admisibles porque no afectan


a la representación de las preferencias subyacentes.

Teorem a 2.4 (de unicidad)


Sea A un conjunto finito. Entonces v : A — ►TR. y (p \ A — ►IR son dos
funciones de valor que representan a la relación de preferencia y si y sólo si
existe f , función estrictamente creciente, tal que ip(a) = f(v(a )), Va e A.

D em ostración . =>) Una función / : ]R — > ]R es estrictamente creciente si


Vx,y € IR se cumple x < y & f ( x ) < f(y ).
Definamos / : u(^4) — > IR. tal que /(u (a )) = <p(a), Va s A y veamos que es
estrictamente creciente. Sean a, b 6 .A tal que v(a) > v(b). Entonces

v(a) > v(b) ■<=>•a y b <p(a;) > \p(b) f(v (a )) > f(v(b)).

<=) Supongamos que v(-) es una función de valor representando a y y / una


función estrictamente creciente tal que f(v(a )) = ip(a), Va 6 A. Entonces

a y b<$ v(a) > v(b) f(v (a )) > f(v(b)) <p(a) > <p(b).

Así <p(-) es una función de valor que también representa a >-. A

Los dos teoremas anteriores también son ciertos cuando A es numerable, ver
Krantz et al. (1971), Roberts (1979) o Ríos et al. (1989).
Se podría pensar que lo que ocurre cuando A es numerable se puede extender
al caso no numerable. Sin embargo, esto no es cierto según podemos observar en
el siguiente ejemplo.

E jem p lo 2.4
Consideremos la ordenación lexicográfica >-¡ (así llamada porque es la que se
utiliza al ordenar las palabras de un diccionario)

( x i ,x 2) y ¡ (2/1 »3/2) x i > 2/1 ó (xi = yi, x 2 > y2).

Se puede comprobar fácilmente que es un orden estricto. Sin embargo, de­


mostraremos que no puede existir una función de valor v (x i,x 2) que lo represente.
En efecto, sea x € IR, entonces (x, 1) y ¡ (x, 0), luego si existe v(-), debe cumplirse
que v(x, 1) > v(x, 0). Entre estos dos números reales existe necesariamente un
número racional f { x ) tal que v(x, 1) > f ( x ) > v(x, 0). Tendríamos así una corres­
pondencia x — » f ( x ) entre cada número real y un racional f( x ). Veamos que
esta correspondencia es 1-1. Si y es otro número real tal que x ^ y, veamos que
f( x ) f{y )- Supongamos por ejemplo que x > y, entonces u(x,0) > v (y ,l).
Además v (y ,l) > f { y ) > v(y,0 ). Luego,

f { x ) > v ( x , 0 ) > v ( y ,l ) > f ( y ) , es decir, f ( x ) > f{y ).


40 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
©JU-M a

Este resultado es contradictorio con el hecho bien conocido de la imposibilidad


de una correspondencia 1-1 entre los reales y los racionales.

Este ejemplo pone de manifiesto que hay que añadir alguna condición a la
de orden estricto para que sea válida la existencia de la función de valor, Para
demostrar que el orden lexicográfico no puede representarse por una función de
valor hemos considerado que los números racionales son un subconjunto nume­
rable denso dentro de los reales. Una propiedad similar de densidad es la que
vamos a necesitar para asegurar la existencia de la función de valor.
Un subconjunto B de A se dice denso en el orden £3 si Vai, 02 € A con oj y 02
3 6 € B tal que 01 £3 b £3 02.
Esta noción de densidad en el orden permite dar una condición necesaria y
suficiente mediante el teorema de Birkhoff-Milgram, ver Krantz et al. (1971),
páginas 40-42 o Roberts (1979), páginas 112-117: Para cada conjunto de alter­
nativas A no numerable con la ordenación débil £3 cumpliendo los Axiomas 1,2,
3 y 4, existe una función de valor representando esa relación de preferencia si y
sólo si existe un subconjunto numerable denso en el orden de A.

2.5 FUNCIONES DE VALOR MEDIBLES

Las funciones de valor ordinales representan, como anteriormente hemos indicado,


las preferencias del decisor y nos permiten ordenar las diferentes alternativas de la
más a la menos preferida, pero no nos dice por ejemplo que a es más preferida que
b con más intensidad que c de d. Para intentar paliar este inconveniente, notemos
que cuando un decisor expresa que o £3 b es equivalente a decir que si él tuviera
6 y le dieran la oportunidad de cambiarla por o, no dudaría y cambiaría b por a.
Denotemos este intercambio como a «-» b. Existen ahora dos tipos de entidades
sobre las que el decisor debe expresar sus preferencias: las alternativas y los
intercambios entre alternativas. Por tanto, existirán dos relaciones de preferencia
débiles:
¿3 entre alternativas;
entre intercambios de alternativas.

Es decir, o £3 b y (a *-> b) ( c «-»d) significan que para el decisor o es al menos


tan preferida como b y que para él es al menos tan bueno el cambio de 6 por 0
como el de d por c.
Nuestro objetivo es encontrar funciones de valor v(-), tales que

o £ b <=> v(a) > v(b)

(o «-* b) ^3i ( c «—>d) <=> v(a) —v(b) > v(c) —v(d). ( 2 . 1)


© RA-MA CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE -II

Estas funciones se denominan funciones de valor medibles. Claramente toda


función de valor medible es una función de valor ordinal. Por tanto, como v(-)
es una función de valor ordinal que representa la relación £3 es necesario que £
sea un orden débil sobre el conjunto A de alternativas. Es decir, supondremos
que se cumplen los Axiomas 1 y 2, y ya que seguiremos usando las relaciones
de indiferencia y preferencia estricta, también supondremos que se cumplen los
Axiomas 3 y 4. Además, si escribimos V {a «-» 6) = v(a )—v(b), V(-) es una función
de valor ordinal que representa a fc¿, ya que (o <-5 b) (c «-> d) <=> V (a «-» 6) >
V (c <—> d), lo que implica que £¿ debe ser un orden débil sobre el conjunto de
intercambios de alternativas. También supondremos que la indiferencia, y la
preferencia estricta, entre intercambios de alternativas son consistentes con
de forma análoga a como ~ y >- son consistentes con £3 .
En este contexto, los axiomas que debe cumplir un decisor racional para que
sus preferencias sean consistentes son:

Axioma I. (Ordenación débil)


(i) ¿3 verifica los Axiomas 1, 2 , 3 y 4 sobre el conjunto de alternativas.
(ii) >3¿ verifica los Axiomas 1, 2, 3 y 4 sobre el conjunto de intercambios de
alternativas.

Ahora estableceremos la propiedad que relaciona £3 con . Para cada alter­


nativa a 6 ^ , a ^ a e s como no hacer nada. El decisor cambia a por ella misma,
es decir, ni es mejor ni peor. Por tanto, tiene sentido exigir lo siguiente.

Axioma II. (Consistencia de £ y £<)


Va, &, c 6 A, a £ b <=> (o <-> 6) (c «-> c).

Además, la representación (2.1) hace que la suposición sea necesaria, ya que

(a «-> b) >Zi (c <-» c) <=> v(a) - v(b) > v(c) - v(c) v(a) > v(b) & a >3 &.

e implica dos condiciones necesarias más.


La primera es:

(a <—>b) ^3i ( c «-» d) v(á) — v(b) > v(c) —v(d) <=>


v(d) — v(c) > v(b) — v(a) o (d h c) ^ (6 <-> a).

En otras palabras, si el decisor considera que el beneficio de cambiar b por a no es


menor que el beneficio de cambiar d por c, entonces debe pensar que la pérdida
de cambiar c por d es menor que la pérdida de cambiar a por 6. Así, debemos
exigir que se verifique el siguiente

Axioma III. (Consistencia de ganancias y pérdidas)


Va, b, c,d € A : (a «-> b) & (c ♦-* d) ( d «-» c) £< (6 «-> o).
42 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN

La segunda es:

(a b) >Zi (d*^> e) 1 v(a) - v(b) > v(d) - v(e) 1


(b c) >Zi (e i- 3 f ) J v(b) - v(c) > v (e) - v ( f ) ) **

v(a) —v(c) > v(d) — v ( f ) -O- (a c) (d <—>/ )

Así, debemos exiguir que se verifique el siguiente

Axioma IV . (Cancelación de intercambios)

Va, b ,c ,d ,e ,f & A : ^ (a j^ j c) h (d ^ /).

En otras palabras, si él intercambio (a <-j 6) es al menos tan bueno como


(d <—> e) y el intercambio (b > c) es al menos tan bueno como el de (e <-> /) 1
entonces el intercambio (a <—> c) es al menos tan bueno como el de (d *-> f) y
viceversa.
Estos cuatro axiomas no garantizan la existencia de una función de valor
medible; son necesarios, pero no suficientes. Para descubrir condiciones nuevas
que deban darse para asegurar la existencia de una función de valor medible
expondremos un método de construcción de dicha función. Consideraremos que
los elementos de A son cantidades monetarias a percibir por el decisor, con el
objetivo de ganar en claridad.
La primera fase para la construcción de u(-) es definir la unidad de medida.
Para conseguirlo llamaremos, sin pérdida de generalidad, ao = 0, ai £ A tales
que v ( oq) = 0 y v(ai) = 1 . A continuación preguntamos al decisor por a2 tal que

(o 2 *-> ai) (ai <-> ao),

es decir, debe especificar un a2 € A tal que le sea indiferente intercambiar 02


por ai y ai por ao- Ya que «(•) debe ser una función de valor medible tiene que
cumplirse 11( 02) - v (°i) = v(a\) - v(aa). Luego v(a2) = 2.
Una vez identificado 02, el decisor debe especificar un 03 tal que (03 «-» 02) M
(ü2 <—1 ai) y luego un 04 tal que (04 <—5 03 ) (03 02) y así sucesivamente. De
esta forma identificaremos una sucesión (an)n€]N> tal que (ai <-j ao) ~ í (<124-1
ai) (dn <-> 0 ,1- 1) ••• Además, se tiene que v(ao) = 0; u(ai) =
l;u (a 2) = 2 ; . . . \v(on) = n ;. ..
De esta forma queda definida la función u(-). En efecto, sea a € A . Entonces
si a = On para algún n, entonces v(a) = n; si a ^ an Vn, se continúa de 1»
forma siguiente. Supongamos que para algún n, a „+ i £ a £3 an. Destaquemos
esta importante suposición, la cual volveremos a tratar de forma más detallad*
posteriormente. De las anteriores relaciones obtenemos que n + 1 > v(a) -í n‘
Luego, preguntaremos al decisor por cin-\-i/2 tal que

(O n + 1 4 -1 O n + 1 / 2 ) ~ i ( a n + l/ 2 <-J“ ° n ) i
© RA-MA CAPITULO 2: PREFERENCIAS EN CERTIDUMBRE 43

de donde se obtiene que i>(an+1/ 2) = n + 1/2. Ahora On+\ >Z a-n+i/2 fc On> y por
tanto On+i £ a >z an+1/ 2 ó an+1/ 2 £ a £ a„. En el primer caso, n + l > v(a) >
n + 1/2; en el segundo caso, n + 1 /2 > v(a) > n. Supongamos que se cumple el
primer caso. Entonces, el decisor debe indicar un On+3/4 tal que

(°n+l 4-1 an+3/4) (an+3/4 4-1 °n+l/ 2)-

Argumentando de forma análoga a como se hizo anteriormente, llegamos a que


n + 1 > v(a) > n + 3 /4 ó n + 3 /4 > v(a) > n+1/2. Continuando así sucesivamente
podemos determinar un valor para v(a) dentro de un intervalo tan pequeño como
queramos. La Figura 2.2 representa el proceso gráficamente.

Figura 2.2: Método de construcción de una función de valor medible

Podemos observar que este método es intuitivo pero a su vez difícil. En primer
lugar, pensemos que el método supone que el decisor siempre puede responder a
los dos tipos de preguntas siguientes:

• Para b ,c,d E A , ¿qué a satisface (o <-> 6) (c d)?

• Para b ,c £ A , ¿qué a satisface (b <-> o) ( a «-» c)?

Esta propiedad es conocida como suposición de resolubilidad debido a que


se supone que el decisor siempre puede determinar -o resolver- la variable de la
ecuación de indiferencia. Debería observarse que no es tanto una suposición sobre
las preferencias del decisor, sino sobre el conjunto A. Suponemos que el conjunto
A es lo suficientemente grande como para que el decisor pueda siempre encontrar
a cumpliendo la ecuación de indiferencia.

Axioma V . (Resolubilidad)
(i) V6, c,d £ A ,3 a E A tal que (a “ b) (c <—>d).
44 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN_________ © ItA-k^

(ii) V6, c e A,3a e A tal que (b «-> a) (a <—■c).

En la construcción hemos asumido también que dado un a existe un entero r¡


tal que o„+i y an y a^+i £ o £ o„. Equivalentemente, no existe ningún o e ^
tal que a y a,i,Vn. Esta suposición es conocida como propiedad Arquimedia.
na. Es equivalente a la propiedad Arquimediana de los números reales: Para
cada número positivo x, tan pequeño como se quiera, y cada número positivo
y, tan grande como se quiera, existe un entero n tal que nx > y. Aquí hemos
comenzado con una unidad arbitraria de preferencia definida por (aj *-> ao);
hemos construido una sucesión 00, 01, 02, . . . tal que ( 07, «-> 00) es de valor n
unidades; y entonces exigimos que para cada alternativa o exista un entero n tal
que [fin <-• o) (o <—* oo), que implica an y a. Equivalentemente, ninguna alter­
nativa a es “infinitamente más preferida” a ao que 01 lo es a 00. Debería notarse
que la suposición Arquimediana es una condición necesaria para la existencia de
una función de valor medible: v (a )—v(ao) no puede ser infinitamente más grande
que t>(oi) —u(ao).
La sucesión 00, 01, 02, . . . es un ejemplo de una sucesión estándar (es aquella
que tiene todos sus elementos igualmente espaciados en algún sentido). Aquí
(an «-> o,i_i) (0 1 «-»Oo) para todo n. Una sucesión estándar acotada estricta­
mente se define como aquélla formada por los elementos

{On |b V OyjJ (fln 4 5 Oh—1) (Oí 4 5 oo)}

para algún valor fijado b. En otras palabras, es una sucesión estándar formada
por elementos que son menos preferidos que algún elemento fijado b.

Axioma VI. (Arquim ediano)


Cada sucesión estándar acotada estrictamente es finita.

La suposición de todos estos axiomas garantiza la existencia de una función


de valor medible como se puede ver en el siguiente

Teorema 2.5
Si se cumplen los Axiomas I- VI, entonces existe una función de valor medi­
ble que representa a £ y según (2.1). Además, los Axiomas I-IV y VI son
necesarios para tal representación.

Demostración. Vor Krantz et al. (1971), páginas 145-152 o Roberts (1979),


páginas 134-140. , Á

Como ilustración de las propiedades necesarios y suficientes para la existencia


de una función do valor medible que represento a <13 y sogún ( 2. 1), hornos visto
un método de construcción de tal función, Sin embargo, queremos destacar que
podrían haberse utilizado otros muchos métodos. Cada uno requiere sus propia8
© RA-MA CAPÍTULO 2¡ PREFERENCIAS EN CERTIDUMBRE 45

condiciones de resolubilidad y Arquimedianas, las cuales difieren en detalles pero


no en el contenido. Además, hemos considerado que los elementos de A eran
valores monetarios, pero si se quieren ver casos más generales puede hacerse en
Krantz et al. (1971) y Roberts (1979).
En la sección anterior, cuando estudiábamos las funciones de valor ordinales,
vimos que cualquier transformación estrictamente creciente de una función de
valor ordinal seguía siendo una función de valor ordinal. Podríamos pensar que
algo análogo podría ocurrir con las funciones de valor medibles, pero esto no es
cierto según podemos observar en el siguiente ejemplo.

E jem p lo 2.5
A un concurso culinario se presentan dos concursantes A y B. El concurso
se rige principalmente por las siguientes normas: i) Cada concursante debe pre­
sentar 100 platos distintos; ii) Los platos se clasificarán en 5 clases diferentes que
denotaremos por I, II, III, IV y V, entendiendo que todo plato perteneciente a la
clase I es preferido (está mejor preparado) al de la clase II, todos los de la clase
II son preferidos a los de la clase III, y así sucesivamente; iii) La clasificación se
realizará por un jurado; y iv) el concursante ganador es el que obtenga la mayor
puntuación media.
La clasificación realizada por el jurado es la que aparece en la tabla que siglue,
donde cada valor representa el número de platos, de cada uno de los participantes,
pertenecientes a las diferentes clases.

A B
I 5 30
II 65 5
m 5 25
IV 5 35
V 20 5

Es decir el 5% de los platos de A han sido clasificados en la clase I, el'659o en la


clase II, etc. El director del concurso, que ha sido sobornado por el participante
B, se aprovecha de que las normas no están claras (ver por ejemplo la norma
número iv) y de sus conocimientos en Análisis de Decisiones para hacer que
salga como vencedor B. Para conseguir este objetivo lo que hace es asignar a
todo plato perteneciente a la clase I, II, III, IV y V un valor de 90, 75, 65,
50 y 30 puntos, respectivamente. Así la puntuación media obtenida por A es
0.05 x 90 + 0.65 x 75+0.05 x 65 + 0.05 x 50+ 0.2 x 30 = 65 y por B es 0.30 x 90+
0.05 x 75 + 0.25 x 65 + 0.35 x 50 + 0.05 x 30 = 66. En este caso, B es el ganador.
Sin embargo, si a los platos de la clase I, II, III, IV y V se les hubiera valorado
con 5, 4, 3, 2 y 1 punto, respectivamente, el resultado para el concursante A
habría sido 0.05 x 5 + 0.65 x 4 -|- 0.05 x 3 + 0.05 x 2 + 0.2 x 1 = 3.3 y para el B,
0.30 x 5 + 0.05 x 4 + 0.25 x 3 + 0.35 x 2 + 0.05 x 1 = 3.2 siendo A el ganador.
46 FUNDAMENTOS d e los s ist e m a s d e a y u d a a la d e c is ió n © BA­JIA

Teóricamente lo que se ha hecho es considerar dos funciones de valor ordinales,


i>(.) y tales que
5, si o € I 90, si o 6 I
4, si a 6 II 75, si o 6 II
ü(a) = 3, si a 6 III y ¥>(«) = 65, si o € III
2, si a € IV 50, si a € IV
1, si a 6 V 30, si a € V
que representan las preferencias £ del jurado. Además, están relacionadas entre
sí por una transformación estrictamente creciente, es decir, tp(-) = /(«(•)) donde
/(1) = 30, /(2 ) = 50, /(3 ) = 65, /(4 ) = 75 y /(5 ) = 90. Este ejemplo demuestra
que la ordenación del valor medio de v(-) no necesariamente se conserva al aplicar
una transformación estrictamente creciente. Además, si v(-) fuese una función
de valor medible representando las preferencias del jurado según (2.1), entonces
</>(■) no podría representar las mismas preferencias, ya que por ejemplo para
a € I,b € II, c £ IV, d € V se tendría que cumplir v(a) —v(b) = v{c) —v(d) #
(a «-> b) (c h J) # yj(a) — tp(b) — ip(c) — <p(d) lo cual no es cierto por la
última implicación, al no ser 90 —75 = 50 —30.
Sin embargo, si en lugar de considerar la anterior ip(-) el director hubiera
considerado que

11 , si a 6 I
9, si a 6 II
tp(a) = 7, si a 6 III
5, si a e IV
3, si o 6 V
entonces el número medio de puntos para A y B serían 7.6 y 7.4, respectivamente.
En este caso, k (-) y <p(-) sí son funciones de valor medibles representando las
preferencias del jurado según (2.1). La diferencia es que ahora y¡(-) = 2xti(-)+l,
es decir, <p(-) es una transformación afín positiva de u(-). U

De forma general se tiene el siguiente resultado:


Teorema 2.6
Si se verifican los axiomas anteriores, entonces v{-) y ip{-) son dos funciones
de valor medibles representando las mismas preferencias £ y si y sdlo s*
existen dos números reales ot y ¡3 con a > 0 tal que:

<p(a) = an (a) + /3, Va S A.

Demostración. Ver Krantz et al. (1971), página 151.

Una función de la forma f(x ) = a x + ¡3 con a > 0 es conocida como un»


transformación afín positiva. Así, una función de valor medible es única sal*
vo transformaciones afines positivas. Por tanto, las transformaciones admisibles
40 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © HA-Ma

Teóricamente lo que se ha hecho es considerar dos funciones de valor ordinales,


v(-) y ¥>(•). tales que
5, si a £ I 90, si a € I
4, si a € II 75, si a € II
v{á) 3, si a 6 III y ¥>(a) 65, si a e III
2, si a £ IV 50, si a € IV
1, si a € V 30, s i a e V
que representan las preferencias £ del jurado. Además, están relacionadas entre
sí por una transformación estrictamente creciente, es decir, <p(-) = /('u(-)) donde
/(1) = 30, /(2) = 50, /(3) = 65, /(4 ) = 75 y /(5 ) = 90. Este ejemplo demuestra
que la ordenación del valor medio de v(-) no necesariamente se conserva al aplicar
una transformación estrictamente creciente. Además, si v(-) fuese una función
de valor medible representando las preferencias del jurado según (2.1), entonces
yj(-) no podría representar las mismas preferencias, ya que por ejemplo para
a 6 I, b € I I , c e IV, d € V se tendría que cumplir u(a) —v(b) = v{c) —v(d) #
(a <-> b) (c <-> d) tp(á) — ip{b) = ip(c) —<p(d) lo cual no es cierto por la
última implicación, al no ser 90 - 75 = 50 - 30.
Sin embargo, si en lugar de considerar la anterior ip(-) el director hubiera
considerado que
11, si a 6 I
9, si o € II
ip(a) = 7, si a e m
5,si a 6 IV
3, si a € V
entonces el número medio de puntos para A y B serían 7.6 y 7.4, respectivamente.
En este caso, v(-) y </?(■) sí son funciones de valor medibles representando las
preferencias del jurado según (2.1). La diferencia es que ahora tp(-) = 2 x «(•)+1,
es decir, ip(-) es una transformación afín positiva de v(-). 0

De forma general se tiene el siguiente resultado:


Teorema 2.6
Si se verifican los axiomas anteriores, entonces v(-) y <p(-) son dos funciones
de valor medibles representando las mismas preferencias £ y si y sólo si
existen dos números reales a y ¡3 con a > 0 tal que:
<p(a) = av(a) + ¡3, Va € A.

Demostración. Ver Krantz et al. (1971), página 151. A

Una función de la forma }{x ) = a x + f3 con a > 0 es conocida como una


transformación afín positiva. Así, una función de valor medible es única sal­
vo transformaciones afines positivas. Por tanto, las transformaciones admisibles
© RA-MA CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE 47

de una, función de valor medible son las transformaciones afines positivas al no


cambiar las preferencias y .
Ahora nos encontramos en condiciones de demostrar que lo que hicimos al
exponer el método de construcción de una fundón de valor medible estaba bien
hecho. Supusimos que podíamos tomar arbitrariamente un elemento ao € A y un
ai >- a® tal que v(ao) = 0 y v(a {) —1 , siendo «(•} una fundón de valor medible.
Esto es cierto, ya que si consideramos que «>(-) es la fundón de valor medible,
acabamos de ver que ésta es única salvo transformaciones afines positivas, es
decir, w(-) = cta>(-) + P con a > 0 es también una fundón de valor medible
representando las mismas preferencias que uj(-). Por tanto, tan sólo tendremos
que tomar un a > 0 y un /9 apropiados. Tbmando a = l/(a>(a.i) —<p{ao)) y ¡3 =
~'p{ao)/(.'P(al ) ~ V>(°o)) conseguimos que efectivamente v(ao) = 0 y a (oi) = 1.
Finalmente, indicaremos que en esta sección y en la anterior hemos dado
condidones necesarias y suficientes para la existencia de fundones de valor me­
dibles y fundones de valor ordinales, respectivamente. Cuando logramos repre­
sentar las preferendas de un decisor mediante una de estas fundones decimos
que nuestro problema tiene información completa sobre las preferendas del de­
cisor y el problema de dedsión es obtener la alternativa que tome mayor valor
en la fundón de valor. Es decir, se trata de resolver el problema de optimización
uniobjetivo

maxv(a).
a&A

2.6 SEMIÓRDENES Y ÓRDENES DE INTERVALO

Hemos considerado y continuaremos considerando una perspectiva normativa.


Sin embargo, no debemos olvidar que existe la descriptiva, ya que desafortunada­
mente el decisor 110 siempre actúa de forma consistente (recordemos el ejemplo
del grano de azúcar en el café). Es por esto por lo que dedicaremos esta sección
a describir brevemente dos familias de modelos descriptivos bajo certidumbre.
Los modelos normativos suponen que las relaciones de indiferenda son tran­
sitivas. Sin embargo, como anteriormente hemos indicado, esto no siempre es asi
debido prindpahnente a la falta de habilidad del dedsor para discriminar entre
alternativas. El dedsor no encuentra ningún problema a la hora de decidirse
entre dos alternativas donde para él una es “mucho mqor” que la otra. F.1 pro­
blema surge cuando no encuentra diferencias sustanciales y recurre, ante la duda,
a la indiferenda. Para niodelizar la intransitividad de la indiferencia surge el
concepto de semiorden. El modelo contempla una fundón i'(-) que representa
las preferendas intrínsecas del dedsor y una constante positiva 8 que representa
un umbral bajo el cual el dedsor 110 sabe discernir cuál es la mejor, Es decir,
48 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN

tenemos que

oy b v(a) —v(b) > 6 ( 2 .2)

a ~ b & —6 < v(a) — v(b) < 6. (2.3)

Claramente, este modelo implica la intransitividad de la indiferencia. Suponga­


mos v(á) = v(b) + (4/5) 6 y v(b) = v(c) + (4/5) S. Entonces v(a) = v(c) + (8/5) 6.
Luego a ~ 6 y 6 ~ c, pero a y c.
Se puede demostrar que la relación y definida en (2.2) es asimétrica y transi­
tiva y la relación ~ definida en (2.3) es reflexiva y simétrica. Además, para cada
par de alternativas a, b g A, una y sólo una de las siguientes relaciones puede ser
cierta: a y b,b y a, a ~ b (ver Ejercicio 2.6).
Hemos definido un semiorden en términos de su representación cuantitativa
(2.2) y (2.3). Ahora lo definiremos en términos de las propiedades de la relación.
Así diremos que la relación ^ es un semiorden si y sólo si posee las siguientes
propiedades:

1. Irreflexiva. Va G A , a / a.

2. Va, b ,c ,d e A , (a y b y b y c) => (a y d o d, y c).

3. Va, b ,c ,d e A , (a y b y c y d) =y (a y d o c y b).

4. Consistencia de ~ y y . Va, b & A , a ~ b t $ a y b y b y a .

Si >- y ~ satisfacen estas cuatro condiciones puede demostrarse que >- es


asimétrica y transitiva y que ~ es reflexiva y simétrica (ver French, 1986).
La segunda familia de modelos que consideraremos son los órdenes de inter­
valo. Una relación >- es un orden de intervalo si y sólo si cumple las propiedades
1 y 3. Por tanto todo semiorden es un orden de intervalo pero no al revés. La
representación cuantitativa son dos funciones sobre A , v(-) y <$(•) con 5 (a) > 0
Va 6 A , tal que a y b o u(a) — v(b) > 6(b).
Ambas familias modelizan la misma idea: la existencia de una preferencia es­
tricta entre dos objetos únicamente cuando un objeto es “suficientemente mejor
que el otro. Sin embargo, para el semiorden “suficientemente mejor” significa lo
mismo para todo par de objetos, ya que el 6 es constante, mientras que para el
orden de intervalo £(•) varía dependiendo de los objetos que se consideren.
© RA-MA CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE 49

2.7 ALTER N ATIVAS M ULTIATRIBUTO

2 .7 .1 E stru ctu ra ció n d e los o b je tiv o s

Hasta el momento hemos considerado los elementos del conjunto A como alter­
nativas sin estructura sobre los que el decisor podía establecer preferencias. Sin
embargo, com o se indicaba en el Capítulo 1 , en la mayoría de los problemas de
decisión lo que se tiene es un objetivo global, y para conseguirlo es necesario
alcanzar otros subojetivos y éstos a través de otros de un nivel inferior. Es decir,
el problema lo podem os representar mediante un árbol o estructura jerárquica de
objetivos com o la que aparece en la Figura 2.3.

ISubobjetivo l|Isubobjetivo 2¡

Figura 2.3: Jerarquía de objetivos

Ejemplo 2.6
Muchos nos hemos encontrado o nos encontraremos con el problema de com­
prar una casa. En este problema de decisión las alternativas del conjunto A son
las diferentes casas que se encuentran en venta y el decisor es el individuo que
quiere comprar la casa. La decisión que debe tomar el decisor es elegir la casa
más preferida. Los que hemos tenido que resolver este problema sabemos muy
bien que lo mejor no es considerar cada casa como un único ente sino que es
mejor estudiar qué es lo que verdaderamente nos gustaría que tuviera la casa
que se convertirá en nuestro hogar. Es decir, lo primero que tenemos que hacer
es identificar cuáles son nuestros objetivos. Pueden ser, por ejemplo, de tipo
económico, localización y tamaño. Dentro del primer grupo puede estar el sub-
objetivo: “minimizar el coste de la compra” ; dentro del segundo: “minimizar la
distancia entre la vivienda y el lugar de trabajo” , “minimizar la distancia entre
la vivienda y el centro educativo más próximo” , y “minimizar la distancia en­
tre la vivienda y el centro de la población” ; y dentro del tercero: “maximizar el
tamaño” . Por tanto, la jerarquía de objetivos constará de estos tres niveles donde
en el nivel inferior se encuentran los cinco objetivos anteriormente indicados.
A cada uno de los objetivos del nivel inferior, se le debe asignar un atributo.
Al objetivo del primer grupo se le puede asociar el atributo “euros” , para los
del segundo “kilómetros que hay entre la vivienda y ...” y para el del tercer
grupo “metros cuadrados que posee” . Al definir estos atributos lo que estamos
50 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© J U -lí.

haciendo es caracterizar cada casa con los valores que tom a en cada uno de ^
atributos. Por lo tanto, una casa a 6 A vendrá definida por un vector dd ~
o = (80000,15,3,1,80) donde el primer valor es el correspondiente al prim*,
atributo, el segundo al segundo, y así sucesivamente. A sí sabemos que a es nn*
casa que cuesta 80000 euros, las distancias desde la vivienda al lugar de trabajo
al centro educativo más próximo y al centro de la población son de 15, 3 y i
kilómetro, respectivamente, y tiene un tamaño de 80 m2. Ahora se trata de elegí,
aquélla representada por el vector que tenga el menor valor en las cuatro primeras
componentes y mayor en la última. No habría ninguna dificultad si los objetives
no fueran conflictivos entre sí, pero éste no es el caso en la mayoría, por no decir
en todos los problemas de decisión. Por ejemplo, el primero y el quinto pueden
ser muy conflictivos, ya que al aumentar el tamaño de la vivienda aumenta su
precio, y análogamente suele ocurrir entre el primero y el cuarto.

Así pues, suponemos que las. alternativas o decisiones posibles a e A las


podemos caracterizar mediante un conjunto de medidas que se relacionan con les
objetivos de más bajo nivel de la jerarquía, que llevan asociados un atributo cada
uno. Cada una de estas medidas debe indicar el impacto para el objetivo i de la
decisión o. Se definen como una aplicación: : A — * A i C M tal que z¡(a) = &
siendo este valor el grado con que el correspondiente objetivo es alcanzado sin
hacer referencia a los demás objetivos del decisor. Es decir, si suponemos que
tenemos n atributos, el vector ( a i , . . . ,On) caracteriza unívocamente cada una
de las decisiones posibles a £ A según la correspondencia z : A — * IR" tal que
z(a) — (z j(a ),. . . , Zn(a)) = ( a i , . . . ,On) C IR". Es decir, el conjunto A puede ser
considerado como el producto cartesiano n-dimensional: A = A i x . . . x .4„.
La primera pregunta que nos planteamos es: dado un conjunto A de alter­
nativas, ¿cuándo puede considerarse que la estructura de preferencias del decisor
se corresponde con una estructura producto? De forma matemática, si R es la
relación de preferencia sobre el conjunto A , ¿existen n funciones reales tales
que

aRb Vi(a) > v¿(6), Vt? (2.4)

La respuesta la encontramos en el Teorema 2.7, donde I representa el conjunto


de clases de equivalencia respecto de R y R^, que se define como AR^B aIS>
para algún a G A y b € B.

Teorema 2.7
Si (A , R) es un orden parcial estricto intersección de n órdenes débiles es­
trictos (A ,R i) tal que (J, R!¡) contiene un subconjunto numerable denso en d
orden (I,RÜ¡) (¿ = 1 ,... ,n), entonces existen n funciones V{ que verifican (24/!
y recíprocamente.

D em ostración . Ver Ríos et al. (1989), página 65. A


© RA-MA CAPITULO 2: PREFERENCIAS EN CERTIDUMBRE 51

Consideremos el caso particular en que A sea finito, ver Ríos et al. (1989),
página 65: Si A es finito y (A ,R ) es un orden estricto de dimensión < n, entonces
existen n funciones que verifican (2.4), y recíprocamente.

Dados los elementos a, b E A = A\ x .. . x An C E x . . . x IR y A, /.¿ e IR, se


define Xa+fib = (X a i+ fjb i, Xa^+nb^,. . . , Aa„ + /Li&n) y a > b a¡ > bi Vi,a b.
Definida la preferencia a y b, las clases de indiferencia I(a ) = {6 £ A \b ~ a} se
denominan curvas o superficies de isovalor o de indiferencia. Si existe función
de valor v(-) estos conjimtos vienen definidos como {6 e -4. | v(b) = v (a)}.

Ejemplo 2.7
Sean a ^,<22 los intereses ¿ percibir en el primér y segundo semestre del año
2002, respectivamente. Los intereses del primer semestre se pueden invertir para
generar también intereses en el segundo semestre y por tanto, se considera que
(a i,<12) ~ (ai + Aü2, 0 ) lo que significa que es equivalente recibir \a% en el primer
semestre a recibir 02 en el segundo. Aquí será A > 1 y en general, será A =
A (ai,a 2). Las líneas de indiferencia serán rectas ai + Aa2 = fe, con fe constante
(o bien curvas, si A no es constante), ver Figura 2.4.

Figura 2.4: Líneas de indiferencia


Si queremos saber cuándo existe una función de valor ordinal podemos aplicar
el Teorema 2.7. Sin embargo, comprobar la existencia de un subconjunto nume­
rable denso no resulta fácil. En el caso do alternativas multiatributo podemos

T eorem a 2.8
Sea ( A , t ) wn orden dóbil tal flua A - IRH. Si a d m fo sg wrifica
52 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
JL£MtA

• (dominancia estricta) Si ch > Vi =>•a y b

• (continuidad) Si a y b ,b y c=$ 3A e [0,1] tal que Xa + (1 —X)c ~ l>

entonces existe una función de valor ordinal representando las preferencia» del
decisor. Además, es única salvo una transformación estrictamente creciente.

Demostración. Ver Ríos et al. (1989), páginas 68-70.

En economía la condición de dominancia estricta coincide con la condición


de no saturación al desear “cuanto más mejor” . La condición de continuidad
es una condición de resolubilidad que nos dice que si tenemos tres alternativas
tal que a y b y c entonces existe otra en el segmento que une a con c que es
indiferente a b. Matemáticamente nos indica que siempre existe otra alternativa
que es combinación convexa de a y c que pertenece a la curva o superficie de
indiferencia de b, ver Figura 2.5.

Figura 2.5: Ejemplo de continuidad en las preferencias

La gran dificultad de la obtención de la función de valor que represente la


estructura de preferencia de un decisor ha llevado a buscar condiciones para dicha
estructura que faciliten la construcción de funciones de valor con más riqueza de
propiedades. Veremos sucesivamente a qué estructuras de orden corresponden
funciones de valor descomponibles, monótonas, aditivas, factoriales, etc.
La función de valor v : A — > IR es descomponible o separable, si existen R
funciones : Ai — >IR y una función / : i>i(.4i) x .. . x t>n(*4n) — * B tales qtw

v( aj , . . . ,a„) = / ( u , v „ ( o „ ) ) . (2>5)

La función / definida por (2,5) es una regla de composición, y la estructura


de orden (^4, £ ) se dice que es descomponible.
© ra ma CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE 53

Si (2.5) es del tipo f[a) = ui(ai) 4- ••■+ vn(an) la descomposición se llama


aditiva, y por la sencillez de sus propiedades es la más interesante, aunque también
existen otras descomposiciones tales como las factoriales, polinómicas, etc.

2.7.2 Independencia preferencial para dos atributos

En el estudio de la descomponibilidad de la función de valor desempeña un papel


muy relevante el concepto de independencia preferencial. Para una mejor com­
prensión de dicho concepto comenzaremos definiéndolo para el caso de dos atri­
butos para posteriormente generalizarlo a un número mayor. Así, supondremos
inicialmente que A —A\X A i. Por ejemplo, un individuo que desea comprar una
casa tan sólo podría estar interesado en dos atributos: precio y tamaño. Cuanto
menor sea el precio y mayor el tamaño más preferida será la vivienda.
El atributo A\ es preferencialmenie independiente del atributo A i si para
todo ai,i>i € |||

(ai, a) >3 (&i,a) para algún a £ A i => (ai,(3) £ (f>i,j3), V/3 e Ai- (2.6)

De forma similar, el atributo A i es preferencialmenie independiente del atri­


buto Ai si para todo 02,62 € A 2

(«>« 2) £(<*,&2) para algún a £ A i= ^ (¡3,o2) >z ((3,62), V/3 G Ai. (2.7)

Si se verifican (2.6) y (2.7), entonces Ai y A i son mutuamente independientes en


preferencia. Si en lugar de considerar la preferencia se considera la indiferencia
~, el correspondiente concepto es la sustituibilidad.
La independencia preferencial nos dice que para comparar dos alternativas es
necesario fijarse únicamente en lo que no tienen en común y olvidarse del resto.
Por ejemplo, para el decisor que quiere comprarse una casa, cuando le den a elegir
entre dos casas del mismo tamaño tan sólo debe fijarse en el precio y elegiría la
que fuera más barata. Es decir, el precio es preferencialmente independiente del
tamaño. De modo análogo, entre dos que cuesten lo mismo elegiría la que fuera
más grande. Luego el tamaño es preferencialmente independiente del precio.
Por lo tanto, ambos atributos son mutuamente independientes en preferencia.
Sin embargo, no pensemos que la independencia preferencial se verifica siempre.
Consideremos que A i es el atributo que denota la cantidad de proteínas ingeridas
por un individuo en el desayuno y la comida, y A 2 las adquiridas en la merienda
y cena. Si suponemos que lo ideal es una dieta diaria de x proteínas, tenemos
que ni A i es preferencialmente independiente de A%, ni A 2 es preferencialmente
independiente de A\. En efecto, A i no es preferencialmente independiente de
A i ya que (a i,x — ai) £ (61, a; — ai), con íii ^ a¡ y ai < ®,t>i < x, pero
(aj,x — &i) % (61,1 — 61). A i tampoco es preferencialmente independiente de
Ai ya que (x - 02, 02) £ (x - 02, 62)1 con 62 ^ 02 y 02 < £,62 < x, pero
(* ~ 62, 02,) (x —62, 62). Otra forma de darse cuenta de que no siempre existe
54 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓ N
-©ftA-M*

independencia preferencial es observando que para saber si un día se ha tomado la


cantidad ideal de proteínas tenemos que conocer los valores de Ai y A¡. Nunca
podremos saber si la dieta a es mejor que la dieta b, desde un punto de vista
proteínico, fijándonos únicamente en las primeras o en las segundas componente»
de ambos vectores.
Si suponemos que se da la independencia preferencial se pueden definir loa
órdenes preferenciales marginales sobre cada atributo. Si Ai es preferencialmente
independiente de A 2, se define el orden de preferencia marginal sobre _4j
como:

ai £.4 &i (aj, a) y (bi,a) para algún a € A i-

Análogamente, si A i es preferencialmente independiente de A i , se define el orden


de preferencia marginal sobre A i como:

02 &A2 h (a , 02) (Z (a, b¡) para algún a € A i.

Observemos que los órdenes preferenciales marginales no quedan definidos


correctamente sí no existe independencia preferencial. Por ejemplo, sería lógico
que un decisor, un día caluroso de verano, prefiriese bañarse en una piscina a leer
un libro al calor de una chimenea encendida. Sin embargo, si fuese un día gélido
de invierno seguro que sus preferencias cambiarían. Es decir, sin saber de qué
tiempo hablarnos no podernos decir si preferirnos fiarnos un baño o calentarnos
al calor de la hoguera.
Se puede demostrar de forma sencilla (ver Ejercicio 2.8) que si A¡ y Ai son
mutuamente independientes en preferencia y si £3 es un orden débil sobro A\ "AAi,
entonces los órdenes de preferencia (ZAi ^ ~A¿ Hün ambos órdenes débiles,

2.7.3 Descomponibilídad aditiva do la función de valor sobre dos


atributos

En esta sección indicaremos condiciones necesaria» y suficientes para la existencia


de una función da valor aditiva, os decir, que se pueda escribir corno la s u m a de
una función del atributo A¡ rafal otra del atributo A<¿, v(a) = v a (a\)+VA (02).
A continuación definiremos aquellas audiciones que aún no han sido planteadas

• Condición de Thomjwen, Vaj, b\, cj e A\ y Va2, b2, € A¿ tal que (ai, bi) ~
y ~ í«i,«a) entonce» (oj,&2) ~ (&i,ca). Gráficamente:
) RA-MA CAPITULO 2: PREFERENCIAS EN CERTIDUMBRE 55

• Atributo esencial. Un atributo .Ai es esencial si existen elementos ai,'6i 6


A i y C2 £ Ax tal que (a i,c 2) * ( 6i, c2). En otras palabras, un atributo es
esencial si existen puntos con diferentes valores en dicho atributo que no
son indiferentes para el decisor.

• Resolubilidad restringida.

- para todo a i , 6i,c i € A i y 02,62 6 A i tal que (c i,<22) fe ( 61, 62) fe


(a i, 02) existe d\ £ A i tal que (¿ 1, 02) ~ (61, 62)- Es decir, si sobre
la recta y = 02 existe un punto que es al menos tan bueno como
(61, 62) y un punto que no es mejor, existe un punto que es indiferente.
Gráficamente:

- paxa todo 02, 62,02 6 A 2 y 01,61 € A i tal que (01 , 02) fe (61, 62) fe
(01 , 02) existe <¿2 € A 2 tal que ( 01 ,^ 2) ~ (61, 62). Es decir, si sobre
la recta x = oí existe un punto que es al menos tan bueno como
(^1 ) ^2) y un punto que no es mejor, existe un punto que es indiferente.
Gráficamente:
56 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN

Podemos garantizar la existencia de una función de valor aditiva que repre­


sente a fe sobre A si se verifica (ver Krantz et al. (1971), Capítulo 6):

i) fe es un orden débil sobre A — A i x A i,

ii) Ai y A 2 son mutuamente independientes en preferencia,

iii) la condición de Thompsen,

iv) la condición de resolubilidad restringida,

v) cada sucesión estándar acotada estrictamente en A i o A i es finita,

vi) A i y A i son esenciales.

Además, las condiciones i)-iii) y v) son necesarias para tal representación.


Vimos que las funciones de valor eran únicas salvo transformaciones estricta­
mente crecientes y que las funciones de valor medibles eran únicas salvo trans­
formaciones afínes positivas. A continuación observaremos que las funciones de
valor aditivas son únicas salvo transformaciones afines positivas (ver Krantz et
al. (1971), Capítulo 6): Dos funciones de valor aditivas v(a) = (ai) + v A,(°i)
y w{a) = (ai) + w j^ (a i) representan la misma estructura de preferencia si
y sólo si existen a > O y j 0 , í e E tales que

VA ( ° 0 I omaM ^ + P
||||g = (*W A¿a¡ I n ­

observemos que si tenemos una función de valor aditiva v(o) = v a (<n) +


vA 3(a 2) 9 ue representa las preferencias fe, entonces (ai) y v ¿ ( a a ) son fun­
ciones de valor ordinales para los órdenes marginales fe ^ y fe ¿ , respectiva­
mente, Sin embargo, no es cierto que si « ^ ( o i ) y ( 02 ) son funciones de valor
ordinales para los órdenes marginales fe ^ y fe ¿ entonces la suma de ambas sea
una función de valor para el orden fe .
© RA-M A CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE 57

C o n s t r u c c ió n d e fu n c io n e s d e v a lo r a d itiv a s c o n d o s c o m p o n e n te s

Para el caso de dos variables: v(a) = (aj) + 11^ ( 02) el llamado método de la
sucesión estándar (de Luce-Tukey) o de la “sierra” , trata de obtener las funciones
VA ’ V-Aa >v mediante los siguientes pasos:
Paso 1. Si son a® y 0 ° los mínimos de A\ y A 2, respectivamente, ponemos
M i ( ° i ) = o y u„42(°2) = 0 .
Paso 2. Elegimos un nivel a\ tal que vj^ (a|) = 1 (es decir, elegimos una
unidad para la escala de .Ai).
Paso 3. Pedimos al decisor que fije a\ tal que (aj, a®) ~ (a?)<4)- Con esto
tenemos: « ^ ( a j ) + u ^ 2(a§).= ^ ( a ? ) + « ^ (< 4 ), o sea 1 = v jja \ ) (es decir,
aj es la unidad para A 2).
Paso 4 ■ Pedimos al decisor que fije af tal que

(°i> “ 2) ™ (<3-1,0-2) ^ vA i(ai) = 1 + 1 = 2 .

Siguiendo así se obtiene la escala de A i que viene representada en la Figura 2.6


por la función (ai). Análogamente se construye la 1/4 (0,2) y en consecuencia,
la v{a ) = ^ ( a i ) + ^ ( 02).

(a/.af) {a,,a,‘)

(a^Ya/.aJ) (a,W) (a/, O


Figura 2.6 a): Método sierra Figura 2.6 b): Función vj^ (01)
Se observa que se pueden tener comprobaciones de consistencia como conse­
cuencia de relaciones como:

(a?,a§) ~ (a ? ,o ¡) ^ ( o ? ) = v ¿ 2{a2
2).

La construcción de puntos intermedios en la escala es inmediata y permite


hacer nuevas comprobaciones.
58 FUNDAMENTOS DE LOS SISTEMAS D E AYUDA A LA DECISIÓ N _____________©_2 *¿JA j

2.7.4 Independencia preferencial y descomponibilidad aditiva de


la función de valor para tres atributos

Supongamos ahora que A = Ai x A 2 x A 3. Cuando era A — Ai x Ai definimos


la independencia preferencial de A i con respecto a A 2 y la independencia prefe­
rencial de A 2 con respecto a Ai- Para tres atributos existen seis posibilidades:

• A i preferencialmente independiente de {.A2, A 3 }. Si (ai,a,/3) fe (&i,a,jj)


para algún a 6 A 2,/? € A 3 entonces (a i,5 , 7 ) fe (61, 6, 7 ) Para tod° ¡ €
A 2 ,7 € A 3 .
• A 2 preferencialmente independiente de { Ai , A 3 }. Similar al punto primero.

• A 3 preferencialmente independiente de {A i, A 2}. Similar al punto primero.

• {A i. A 2} preferencialmente independiente de A 3 . Si ( 01 , 02, 0 ) fe (61, 62,a)


para algún a € A 3 entonces (01, 02,/?) fe (61, 62,/?) para todo./? G A3.
• {A i, A 3 } preferencialmente independiente de A 2. Similar al punto cuarto.

• {A 2, A 3 } preferencialmente independiente de A i. Similar al punto cuarto.

Si se verifican las seis propiedades anteriores se dice que los atributos Ai,^2
y A 3 son mutuamente independientes en preferencia. Para cada una de las seis
posibilidades de independencia preferencial, existen seis órdenes de preferencia
marginales denotados feA > g f c j feA , f e ^ . A ) ’ -(A i.A a) ~(A 2,A3)> resPec"
tivamente.
Para tres atributos se garantiza la existencia de una función de valor aditiva
que represente a fe sobre A si se verifica (ver Krantz et al. (1971), Capítulo 6):

i) fe es un orden débil sobre A = A i x A 2 x A 3 ,

ii) A i, A 2 y A 3 son mutuamente independientes en preferencia,

iii) la condición de resolubilidad restringida,

iv) cada sucesión estándar acotada estrictamente es finita,

v) A i, A 2 y A 3 son esenciales.

Además, las condiciones i), ii) y iv) son necesarias para tal representación.
Si observamos detenidamente las condiciones anteriores nos podría parecer
que es necesario una condición menos, la de Thompsen, para garantizar la exis­
tencia de una función de valor aditiva cuando tenemos tres atributos que cuando
tenemos dos. Sin embargo, esto no es cierto, ya que cuando hay tres atributos la
independencia mutua en preferencia implica la condición de Thompsen. El lector
que esté interesado en ver la demostración de esta implicación puede consultar
Krantz et al. (1971).
© R.A-MA CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE 09

C o n s t r u c c ió n d e f u n c io n e s d e v a lo r a d itiv a s c o n t r e s c o m p o n e n t e s

La extensión del método de la sucesión estándar o de la sierra a 3 variables es


sencilla. Se parte de un punto (a j, a®, aí¡) de mínimo valor

v(oi, ajji O3) = 0 + 0 + 0 = 0.

Tomamos a} tal que

v(a},a§,a§) 11
y determinamos y 03 tales que

(aíb ®2) a!i) ~ (°I, “ 2, O3) ~ (01, 02, 03)-

Sea af tal que

(01 , 02, 03) ~ (01, 02, 03),

será (of,o§,o§) ~ (o?,o^,o|) y (o?,o§,og) ~ (o},a§,o¿).


Así se van obteniendo a¡, o§,af, o|,o|,... y también puntos intermedios.
Supongamos que hemos determinado aproximadamente ai-5,a 2 S,a!¡-5, ten­
dremos (o®'®, O2, 03) ~ (af, o®-5, o°) ~ (dj-, 0°, o§-5) y también (o 5-5,o!p,a§) ~
(01, 02, 03), y como éste ya está construido se podrá comprobar la consistencia.

2.7.5 Independencia preferencial y descomponibilidad aditiva de


la función de valor para n atributos, n > 3

Para el caso general, A = A i x ... x An, llamemos Q = {1,... ,n ] al conjunto


de atributos y 9 au n subconjunto del mismo, 0 C fi, y 0 Csu complementario,
0 C = Í2\0. Entonces, 0 es preferencialmente independiente o separable de ©c
si las preferencias que afectan sólo a cambios en los niveles de los atributos que
pertenecen a 0 no dependen de los niveles que se fijen para los atributos de ©c.
Es decir, si 0 = {1 ,2 ,3 } se tiene que

( 0 i , 0 2, 0 3 , a 4 , . . . ,a „ ) fe (¿>1,62,63, « 4 , • • • ,<*n) &


( o i , o 2, o 3 ,/? 4 , . . . , /? „ ) fe ( 61, 62, 63, ^ 4 , . . . ,/? „ ) V/?.

Si cada subconjunto no vacío 0 es preferencialmente independiente de su com­


plementario entonces se dice que Í2 es mutuamente independiente en prefei'encia.
Para comprobar que Q es mutuamente independiente en preferencia habría que
comprobar 2n —2 condiciones, ya que existe ese número de subconj untos © C fi.
Afortunadamente, sin embargo, si se verifican ciertas independencias preferen­
ciales ello implicará que se cumplan otras. Por ejemplo, en el caso de tres
atributos, si { A i ,A 2} es preferencialmente independiente de A 3 y si { ^ 2 , ^ 3 }
60 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA K

es preferencialmente independiente de A i entonces las otras cuatro condicione»


necesarias para la mutua independencia en preferencia también se cumplen,
Ríos et al. (1989), página 82. En general, si tenemos n atributos es necesario
verificar únicamente n — 1 condiciones, pero hay que tener en cuenta que ^
n — 1 condiciones no se pueden elegir de forma arbitraria sino que deben ser
unas específicas. Concretamente, se debe verificar que {A i, A i}, i = 2 ,... ,nson
preferencialmente independientes de sus complementarios. Para más detalles ver
Gorman (1968), Keeney y Raiffa (1993) y Ríos et al. (1989).
Para el caso general la existencia de una función de valor aditiva que represente
a fe sobre A se garantiza si se verifica (ver Krantz et al. (1971), Capítulo 6):

i) fe es un orden débil sobré A = A i x •••x An,

ii) A i, A 2, ... , A n son mutuamente independientes en preferencia,

iii) la condición de resolubilidad restringida es cierta para cada atributo,

iv) cada sucesión estándar acotada estrictamente es finita,

v) todos los atributos son esenciales.

Además, las condiciones i), ii) y iv) son necesarias para tal representación.
Respecto a la unicidad se puede decir que dos funciones de valor aditivas,
v(a) = J2 ví (oí) y w(a) = J2wi(ai), representan la misma estructura de pre­
ferencias si y sólo si existen números reales a > 0 y /?i,/?2,- -- ,Pn tales que
Wí (oí) = avi(ai) + Pi,Vi (ver Krantz et al. (1971), Capítulo 6).

Construcción de funciones de valor aditivas con n componentes

La extensión del método de la sucesión estándar o de la sierra a n variables es


análoga a la del caso de dos o tres variables vistas anteriormente.
Otros posibles métodos para la construcción de funciones de valor aditivas,
tales como el método de graduación directa o el método del punto medio, pueden
verse en Ríos et al. (1989).

2 .7 .6 Descom ponibilidad lineal de la función de valor

Una función de valor es lineal si

v(a) = U)\a\ + 10202 + .. . + WnOn.

Los coeficientes w i,w 2, . . . ,w n se denominan pesos o factores de escala.


Las funciones de valor lineales son aditivas. Por tanto, existirá una función
de valor lineal representando las preferencias de un decisor si los atributos son
@ RA-M A____________________ ________C A P IT U LO 2 í PR E FE R E N C IA S EN C ERTID U M BRE 61

mutuamente indopondi ontos on proforoncia (aparto do) resto de condiciones) y si


n = 2, cuando so verifique la condición do Thompson. Pero nos preguntarnos si
la linoalidad roquioro alguna condición complementaria.

Ejemplo 2.8
Supongamos n = 3, v(a) = w\a\ + 10202+10303 y (1,7,5) ~ (4,1,5). Entonces
u(l,7,5) = v (4 ,1,5) <=> iü i+ 7 io 2 + 5íü3 = 4iüi+ 102+5103 & wi = 2w¡. Por tanto,
v(o) = w io j +10202 +10303 = iüiOi +10302 + W3O3 + (2x02 —w\)k = v(a\ —k,
02 + 2k, 03) Vfc. De donde se obtiene que (01 , 02, 03) ~ (a i —fe, 02 + 2/5, 03) para
todo 01 , 02,03 y fc. Es decir, suponiendo que la función de valor es lineal y que
se verifica la anterior indiferencia hemos obtenido que a nuestro decisor le es
indiferente la alternativa a y ella misma disminuida en fe unidades en el primer
atributo y aumentada en 2fe en el segundo. □

El Ejemplo 2.8 nos indica que para que la función de valor sea lineal es nece­
sario una condición nueva que llamaremos intercambio relativo constante. Dire­
mos que existe un intercambio relativo constante de r¿j : 1 entre y a'j sí y sólo
si para cada a

( o j , 02 , . . . j O j ,. . | , O j , . . . , o n ) ( o j , a 2, . . . ,a ¡+ T jjf e ,. . . , a j —k , . . . , an) (2 .8)

para todo k. Si v(a) = io¿o¿, el intercambio relativo constante entre o, y aj es


(wj/wi) : 1. Por tanto, la linealidad implica la existencia de intercambio relativo
constante entre todos los pares de atributos. Además, el intercambio debe ser
consistente:

• para cada i , j , Sá| = l/r¿¿ (ya que (wj/wi) = l/(t 0¿/i 0j));

• para cada i , j , l, ni = njTji (ya que (io//tu¿) = (wj/wi)(wi/wj)).

La existencia de intercambio relativo constante entre todos los pares de atribu­


tos implica que las curvas de indiferencia son rectas paralelas en dos dimensiones,
planos paralelos en tres e hiperplanos paralelos en dimensiones mayores.
Otra condición nueva es la de monotonía: Denotemos O = (0,0,... ,0); en­
tonces existe o G H ” tal que a y 0. Además, para cada 6 G IR” y cada
A > 0, b + Ao y b. La razón de la existencia de esta condición es porque cuando
suponemos que la función de valor es lineal estamos suponiendo que las prefe­
rencias aumentan de forma monótona en un sentido. Por tanto, no es posible
decir que un punto es el más preferido. Por ejemplo, supongamos el caso de la
Figura 2 .7 , donde el segmento od es perpendicular a las curvas de indiferencia e
indica el sentido del aumento de las preferencias del decisor. Claramente b no es
la alternativa más preferida sobre la recta que une o con o.
62 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© RA-Ma

Figura 2.7: Monotonía

Si A = IR", podemos garantizar la existencia de una función de valor lineal


representando las preferencias fe sobre A si y sólo si fe es un orden débil, existe
intercambio relativo constante entre cada par de atributos y existe monotonía.
Observemos que no existe la condición de mutua independencia en preferencia,
ya que ésta es una consecuencia de la condición de intercambio relativo constante.
Las funciones de valor lineales son únicas salvo transformaciones de similari-
dad. Las transformaciones de similaridad son de la forma f ( z ) = a z (a > 0). En
efecto, si A = IRn, dos funciones de valor lineales v(a) = ]T\ AjO¿ y w(a) = f^Oi
representan las mismas preferencias si y sólo si existe a > 0 tal que Ai = a/u¡ Vi
(para comprobarlo el lector puede usar la unicidad de la función de valor aditiva
y que w ( 0 , 0 , . . . , 0) = 0 = v( 0 , 0 , . .. , 0)).

2 .7 .7 D escuento en el tiem p o

En esta sección consideraremos un tipo concreto de alternativas multiatributo: El


beneficio obtenido en n años consecutivos. Es decir, los elementos 01 , 02, 03,...,
de la alternativa a representan la cantidad de dinero que recibiremos este año, el
siguiente, dentro de d os,.. . , respectivamente.
Un criterio comúnmente usado para evaluar tales alternativas, Atherton y
French (1997); French (1983) y Koutsoyiannis (1982), es el valor actual neto
(V A N ):

n
v (a ) =
¿-1

donde <7 es el factor de descuento. Sin embargo, si las preferencias del decisor
pueden ser representadas por una función de valor lineal v(a) = w¿a¡ y
mamos iu<+i/u/< = para ¡ = 1 , 2 , . . , , n - 1 y «>i = 1 , lo cual se puede hacer
© RA-MA CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE 03

sin pérdida de generalidad, entonces


Wi/Wi — (T\ =>■ = (Ti;
W3 /W2 — (72=>W3 = (T2CT1;

® n /* n -l = (Tn- 1 =$■ Wn = <Tn ■•■(T2&1 -

Así, v(a) — ai + <Tia2 + 2^103 -\------- 1- an •■•or2(Tian, que es una generalización


natural del VAN.
Será correcto usar el VAN cuando se verifiquen las condiciones del siguiente
teorema.

Teorema 2.9
La función V A N (a) = J^ILi representa las preferencias del decisor en
el sentido de que a ^ b V A N (a) ■> VAN(b) si y sólo si se verifica:
i) fe es un orden débil;
vi) la condición de intercambio relativo constante entre todos los pares de años;
iii) la monotonía;
iv) el intercambio relativo constante entre cada par de años sucesivos es cr.

D em ostración . Usar el resultado obtenido en la Sección 2.7.6 y la discusión


anterior. A

Las condiciones ii) y iv) son las más difíciles de verificarse. Existen muchos
ejemplos donde una u otra o ambas no se cumplen. Un ejemplo donde no existe
intercambio relativo constante entre un año y el siguiente es el de un individuo
que vive perfectamente con 30000 euros anuales. Entonces si sabe que este año sus
beneficios serán de 20000 euros y al que viene de 40000 euros, posiblemente estaría
dispuesto a pedir un préstamo, lo cual supondría pagar unos intereses, hasta llegar
este año a los 30000 euros. Sin embargo, si en el segundo pensara ganar 60000
euros posiblemente el préstamo que pidiera fuera de la misma cantidad, 10000
euros, ya que con 30000 euros vive satisfactoriamente cada año y no tiene que
pagar tantos intereses. Un ejemplo en el que no existe el mismo intercambio
relativo constante entre cada par de años consecutivos sería el de un decisor que
tiene una preferencia muy fuerte por recibir dinero este año en lugar del próximo,
pero una preferencia mucho más débil por recibir dinero el noveno año en lugar
del décimo.
Para permitir intercambio relativo no constante entre años, Koopmans (1960,
1972) consideró la teoría del valor aditiva. Las preferencias se dicen estacionarias
si para todo a i , 02 , . . . ,On-i,&i,&2, •• •
(a i, 02 ,• •• fe (¿ 1, 62, . . . , &n- i »“ ) &
( a , a i , 0 2 , . . . , O n - i) fe { a , b \ , b 2 , . . . , b n - i) .
64 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN

Es decir, si el decisor establece su preferencia entre dos alternativas en las qUe


el valor del último año es a en ambas, entonces esta preferencia permanecerá
inalterada si todos los valores de los años 1 , 2 , . . . ,n — 1 se retrasan un año y ej
valor común a es trasladado al primer año.

Lema 2.1
Si las preferencias del decisor satisfacen las cinco condiciones para que puedan
ser representadas por una función de valor aditiva (resultado obtenido en la Sec­
ción 2.7.5) y si, además, son estacionarias, entonces existe una función w(-) y
una constante positiva a tal que la función de valor toma la forma
n•
u(o) = y
^ 2a‘l~1w(ai).
t=l

El resultado de Koopmans permite intercambio relativo no constante porque,


aunque existe el factor constante a para todos los pares de años sucesivos, la
función w () puede ser no lineal. Sin embargo, el factor a aplicado a todos los
pares de años sucesivos es constante. Para evitar este problema, la utilización de
una función de valor de la forma

v(a) = w(ai) + 0-110(02) + 020110(03) H------- (- an ■••0'20’iio(an)

puede ser más apropiada. Para un estudio más detallado consultar Krantz et al.
(1971).
Finalmente, mostraremos con un sencillo ejemplo que el uso de una función de
valor aditiva para representar las preferencias entre este tipo de alternativas puede
ser cuestionado. En efecto, consideremos las siguientes cuatro alternativas: a =
(20,20,20,20), b = (20,20,5,40), c = (50,50,20,20), d = (50,50,5,40), donde los
valores representan miles de euros. Podría ocurrir que un decisor prefiriese o a b,
ya que con 5000 euros el tercer año le iba a ser casi imposible vivir. Sin embargo,
podría ocurrir que prefiriese d a c, ya que podría ahorrar en los dos primeros años
para hacer frente al tercer año. Nótese que en b y d se gana 5000 euros más que
en o y c, respectivamente. Las preferencias de este decisor no son mutuamente
independientes en preferencia, y por tanto no pueden ser representadas por una
función de valor aditiva.

2 .7 .8 Descom ponibilidad biyectiva y m onóton a de la función de


valor

Se tienen los siguientes resultados:


© RA-MA CAPITULO 2: PREFERENCIAS EN CERTIDUMBRE 65

T eorem a 2.10
La relación de preferencia y sobre A = A\ x ... x A n, será representable por
una función de valor biyectiva en cada variable si y sólo si >- verifica la condición
de siLstituibilidad.

D em ostración . Ver Ríos et al. (1989), páginas 76-77. A

T eorem a 2.11
La relación de preferencia y sobre A = A i x ... x A n, será representable por
una función de valor monótona en cada variable si y sólo si verifica la condición
de ser. cada atributo Ai preferencialmente independiente de su complementario
(i = 1 , . . . ,n).

D em ostración . Ver Ríos et al. (1989), página 77. A

2 .7 .9 Eficiencia y optimalidad de Pareto

En las secciones anteriores, dedicadas a las alternativas mutiatributo, hemos visto


que si se cumplen ciertas propiedades entonces las preferencias del decisor pueden
representarse mediante una función de valor ordinal o mediante una función de
valor medible. Cuando ocurre esto se dice que se tiene un problema con infor­
mación completa sobre las preferencias del decisor y el problema se reduce a un
problema de optimización uniobjetivo, ver también el final de la Sección 2.5. Sin
embargo, en la mayoría de los casos esto no es posible. Es más, cuando no existe
ninguna información sobre las preferencias del decisor, entonces lo que tenemos
es un problema de optimización vectorial o multiobjetivo y veremos que lo único
que se puede hacer es calcular el conjunto de soluciones eficientes, ya que sabemos
que la más preferida se encuentra dentro de este conjunto. Un aumento de infor­
mación sobre las preferencias del decisor nos llevará a una reducción del número
de objetivos a optimizar y /o a una reducción del conjunto de soluciones eficientes
como veremos a continuación.
Comencemos considerando el caso de información nula, es decir, cuando no
existe n i n g u n a , información sobre las preferencias del decisor y tan sólo sabemos
que es mayor cuanto mayor sea el valor de cada atributo. Claramente, si un
decisor compara dos alternativas donde la primera es al menos tan buena como
la segunda en todos los atributos y además, es estrictamente mejor en al menos
un atributo, entonces la primera es preferida a la segunda. Esta idea es la base
del concepto de eficiencia.
Se dice que a domina débilmente a b si a¿ > para ¿ = 1 , 2, . . . ,n; y que o
domina a b si o¿ > para i — 1 , 2 , . . . ,n con al menos una desigualdad estricta.
Gráficamente
ÜG FUNDAMENTOS DÉ LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-Ma

Se ve que las alternativas que están en la región B dominan a a, mientras que


las que están en la región C son dominadas por a.
El conjunto eficiente, 8 , es el conjunto de todas las alternativas no dominadas.
Es decir, £ = {a 6 A \$b 6 A tal que b domine a a}. El conjunto eficiente tam­
bién es conocido como el conjunto no dominado, conjunto de Pareto o conjunto
admisible. En las Figuras 2.8 a) y 2.8 b) aparecen ejemplos gráficos de conjun­
tos eficientes, en dos dimensiones, para conjuntos de alternativas convexos y no
convexos, respectivamente, suponiendo que cuanto más valga x e y mejor.

Se puede demostrar que si el conjunto de alternativas A es convexo, es decir,


para todo par a, b £ A y A € [0,1], Xa + (1 — A)b & A , entonces el conjunto
eficiente es la frontera derecha-superior o nordeste del conjunto A , como se puede
observar en la Figura 2.7. Por razones obvias, el conjunto eficiente se denomina
a veces frontera eficiente de A.
La gran importancia del conjunto eficiente es que el decisor puede poner toda
su atención en este conjunto, olvidándose del resto de alternativas, porque una
alternativa dominada nunca podrá ser óptima.
Un conjunto K c IR” se llama cono si Az 6 K , cuando A > 0 y z € K . Si K
es convexo, se llama cono convexo. Dado un conjunto A y un cono convexo K
en IR™, se dice que A es K-convexo, si A + K es un conjunto convexo.
La obtención de soluciones eficientes puede realizarse desde varios puntos de
vista: mediante escalarización, mediante restricciones convenientes y mediante
escalarización y restricción, que tienen en común que reducen el problema multi-
atributo a otro monoatributo.
© RA MA CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE 67

i) Mediante escalarización. La idea es intrpducir una familia de funciones


escalares / : A —♦IR que permitan caracterizar el conjunto eficiente. Según
la función / que se tome, se tendrán diferentes escalarizaciones.

• El método de las ponderaciones consiste en considerar la función f(a ) =


lüíLi AíOj con Aj > 0, Vi y X)2=i \ = 1. Algunos de los resultados que se
obtienen son:

— Sea A K --convexo con K = ]R" U {0}. Si a* es eficiente, entonces a* es


solución de

max /(a )
aeA ,
para algún A = (Ai, A2, . . . , A„).
— Si existe A = (Aj, A2, . . . , An) tal que o* es solución de

max /(a )
ae.4
y si una de las siguientes dos condiciones se verifica: i) Ai > 0, Vi; o
ii) a* es la única solución, entonces a* es eficiente.

E jem p lo 2.9
Consideremos que A = {a = (4,2), 6 = (3,2),c = (1,1)}. Claramente se puede
observar que a domina a b y a c al tener sus dos componentes mayores. Por
tanto, el conjunto eficiente consta de un único punto que es a. Si queremos
demostrar que a es eficiente, únicamente hay que considerar en el método de las
ponderaciones, por ejemplo, A = (1,1) y comprobar que a es la única solución
óptima. □

• Si consideramos la función f(a ) = A¡|a*—o »|9 con Ai > 0 Vi, Ai =


1 , a* = xnaxog a a i y l < g < o o s e tiene que si a* es solución de

min f(a )
fl€*A
para algún 1 < q < oo y si una de las dos condiciones siguientes se verifica:
i) Ai > 0 Vi; o ii) a* es la única solución, entonces a* es eficiente.

i Mediante restricciones convenientes. Consisten en considerar restricciones


adicionales obteniéndose resultados tales como

La solución a* es eficiente si y sólo si a* es solución de

m ax a/b
aeA
ai|y||

para cada k = 1 , 2 , . . . , n.
© RA-MA CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE B7

i) Mediante escalarización. La idea es ijitrpducir una familia de funciones


escalares / : A —►IR que permitan caracterizar el conjunto eficiente. Según
la función / que se tome, se tendrán diferentes escalarizaciones.

• El método de las ponderaciones consiste en considerar la función /(a) =


A«a¿ con A¿ > 0, Vi y £ " = i A¡ = 1. Algunos de los resultados que se
obtienen son:

- Sea A K -convexo con K = ]R” U {0}. Si a* es eficiente, entonces a* es


solución de

max f(a )
aeA
para algún A = (Ai, A2, . . . ,An)-
- Si existe A = (Ai, A2, ... , A„) tal que a* es solución de

max /(a )
aeA
y si una de las siguientes dos condiciones se verifica: i) > 0, Vi; o
ii) a* es la única solución, entonces a* es eficiente.

Ejemplo 2.9
Consideremos que A = {a = (4,2),b = (3,2),c = (1,1)}. Claramente se puede
observar que a domina a b y a c al tener sus dos componentes mayores. Por
tanto, el conjunto eficiente consta de un único punto que es a. Si queremos
demostrar que a es eficiente, únicamente hay que considerar en el método de las
ponderaciones, por ejemplo, A = (1,1) y comprobar que a es la única solución
óptima. Q

• Si consideramos la función /(a ) = Sjpqi Ai|a*—a¿|? con A¿ > 0 Vi, Y a =i =


1 , a* = maxag a a ¿ y l < g < c x ) s e tiene que si a* es solución de

min /(a )
a€>l
para algún 1 < q < 00 y si una de las dos condiciones siguientes se verifica:
i) A¿ > 0 Vi; o ii) o* es la única solución, entonces a* es eficiente.

ii) Mediante restricciones convenientes. Consisten en considerar restricciones


adicionales obteniéndose resultados tales como

• La solución a* es eficiente si y sólo si a* es solución de

max (ifc
asA
ai>a*Vt^fc
para cada fc = 1 , 2, . . . n.
© RA-MA CAPITULO 2: PREFERENCIAS EN CERTIDUMBRE (IB

que pueden considerarse como una etapa intermedia hacia los de información
completa, ya tratados mediante la función de valor escalar.
En un problema de decisión se dice que existe información parcial sobre la
estructura de preferencia del decisor cuando no existe tanta información como
para poder representarla mediante una función de valor escalar ni tan poca como
para no poder disminuir el tamaño del conjunto eficiente, como ocurre en el caso
de información nula. Matemáticamente, la existencia de información nula sobre
las preferencias del decisor supone resolver el problema de optimización vectorial

max a

cuya solución es la obtención dél conjunto de soluciones eficientes. Si existe infor­


mación parcial, esa información se representa mediante una función y : A —>lRro
con m < n , y el problema anterior se transforma en el siguiente de optimización
vectorial

maxj/(a)
hgA

donde se ha disminuido la dimensión. Lo ideal sería que existiese información


completa, representada por una función de valor escalar v : A —►IR, con lo que
el problema a resolver sería el de optimizar una función escalar

maxu(a).

Se puede demostrar, ver Ríos-Insua (1980), que si se verifican:

i) (A , R) es un orden estricto intersección de m órdenes débiles (A ,R i),

ii) a¿ > =>■ aRb,

iii) Si aRjb y bRjC existe Aj £ [0,1] tal que Xja + (1 — Aj)c tifoi b para j =
1 , 2 , . . . ,m ,

entonces existe una función de valor y : A - + ]Rm, tal que para a , 6 £ A es

aRb <£> yj(a) > yj(b), j = 1,2,... , m.

Además, tal función es continua y única, salvo una función estrictamente cre­
ciente.
Entre todos los métodos de solución de los problemas de decisión con informa­
ción parcial sobre las preferencias del decisor, los que siguen la filosofía interacti­
va son los que han tenido mayor aceptación, considerándose más atractivos en la
resolución de problemas multiatributo como se refleja en algunos estudios com­
parativos (Evans, 1984; Klein et al., 1986; Rosenthal, 1985; Shin and Ravindran,
1987; Zionts, 1979).
70 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-üji

Los métodos interactivos se encuentran dentro del enfoque de articulación


progresiva de las preferencias del decisor. Estos m étodos pueden caracterizarse
por el siguiente esquema: i) encontrar una solución (preferiblemente factible y
eficiente); ii) interaccionar con el decisor para obtener una reacción y respuesta
a la solución; iii) repetir los pasos i) y ii) hasta que se encuentre satisfecho o se
haya llegado a un criterio de finalización del proceso de solución.
Cuando se aplican los algoritmos interactivos a problemas del mundo real,
un factor importante es la forma de obtención de las preferencias del decisor.
La carga congnoscitiva sobre el decisor durante el proceso de solución depende
fuertemente de las formas de interacción. Algunas formas típicas de interacción
son:

i) Comparación de dos alternativas: El decisor debe comparar dos alternativas


multiatributo especificando una preferencia.

ii) Comparación vectorial: El decisor debe comparar un conjunto de alterna­


tivas y especificar la mejor, la peor o el orden de preferencia (nótese que
esto puede hacerse mediante una serie de comparaciones de pares de alter­
nativas).

iii) Tasa de intercambio: El decisor debe especificar valores precisos de las tasas
de intercambio.

iv) Intervalo de tasa de intercambio: El decisor debe especificar un intervalo


para cada tasa de intercambio.

v) Especificación de los índices y valores de intercambio: El decisor debe dar


la lista de los índices de los objetivos que se mejorarán o empeorarán es­
pecificando las cantidades asociadas.

vi) Niveles de aspiración ( o punto de referencia.): El decisor debe especificar o


ajustar los valores de las metas a las que desea aproximarse o alcanzar.

Algunos autores (Malakooti y Ravindran, 1985; Marcotte y Soland, 1985;


Zionts y Wallenius, 1976) creen que es más fácil dar respuestas a las compara­
ciones de alternativas que a los valores de intercambio o a precisar tasas de in­
tercambio. Sin embargo, los métodos que usan comparaciones de alternativas
pueden requerir, en general, más interacciones. Además, el decisor podría preferir
una cierta forma de interacción y, así, la selección de la forma de interacción es
algo subjetivo. Nótese que los intercambios pueden reemplazarse por una serie
de comparaciones de pares de alternativas (Dyer, 1973a, 1973b), aunque esto
aumentará también el número de interacciones con el decisor.
Algunos de los métodos interactivos más utilizados, dentro de una clasificación
basada en las características de sus enfoques, son:
0 r A - M A _______________________________C A P ÍT U L O 3 ; P H K K B U H N O IA S K N O B H T I D U M I lllH 71

• Métodos de reducción de la región factible, Cudti iteración do o n I o n métodos


consisto, generalmente, on tros lusos: tum laso do cálculo, donde obtono-
tnos una solución efídente quo es la mita próxima a la sol ación Ideal, on ol
sentido mlnimax, para unos posos dados. Una Caso do doolslón, on la quo ol
decisor intoruedonu con ol método y sus respuestas so usan paru construir
restricciones adicionales en la fase do reducción do la región factible. MI
método continúa repit iendo las dos fosos hastia quo ol decisor considera quo
la solución alcanzada es la do niojor compromiso.

• Métodos de dirección factible. Esta el aso os una extensión directa de los


métodos de dirección factible desarrollados para resolver problemas de pro­
gramación no lineal uniobjotivo, Ríos-Insua (1996). Comienzan con una
solución factible y realizan iterativamente dos pasos: i) dada la solución
actual encontrar una “dirección posible" (entre las que la proferencia del
decisor aumenta) llamado el paso encontrar la dirección; y ii) determinar
el tamaño del paso desde la solución actual a lo largo de la dirección posi­
ble, llamado búsqueda en la línea. En el paso para encontrar la dirección,
el decisor proporciona información sobre sus preferencias en las cercanías
de la solución actual especificando valores de intercambio entre los crite­
rios. Esto, trasladado al método del gradiente de la función de preferencia,
conduce a la selección de una nueva solución con mayor preferencia.

• Métodos de ponderaciones para los criterios. Cuando el espacio do de­


cisiones es un conjunto convexo, compacto y las funciones objetivo son
cóncavas, una solución eficiente puede obtenerse resolviendo un problema
uniobjetivo en el que los objetivos se combinan usando pesos. El dominio
de los pesos se define como el espacio de ponderaciones de los criterios,
y estos métodos conducen a la mejor solución de compromiso mediante el
examen del espacio de ponderaciones o reduciéndolo sucesivamente. Esta
clase se ha utilizado bastante en la práctica, pero está limitada, ya que
muchos métodos se aplican sólo a problemas lineales.

• Métodos de planos de corte con intercambio. Esta clase puede considerarse


como una variante de los métodos de la dirección factible. Reducen ite­
rativamente el espado de objetivos (equivalente a la reducción del espacio
factible) con planos de corte. Los métodos son aplicables a problemas no
lineales generales. Sin embargo, su mayor dificultad está en que para su
aplicadón necesitan de la determinadón de las tasas de intercambio.

• Métodos de los multiplicadores de Lagrange. Está formada por los métodos


interactivos que usan los multiplicadores de Lagrange.

• Métodos interactivos visuales. Estos métodos se caracterizan porque supo­


nen que la función de preferenda, no conodda, no cambia durante el proceso
interactivo y por la presentación de gráficas en cada iteración, que facilitan
la interacción con el decisor.
72 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A I.A DECISIÓN © JU ¿|A

• Métodos de ramificación y acotación. Los métodos de ramificación y acota,


ción dividen el espacio de decisiones on subconjuntos. Cada subconjunto m
una rama del espacio de decisiones original. Ellas a su vez se ramifican en
subcoiy untos más pequeños si una rama puede proporcionar una solución
mejor. En cada subconjunto, determinan una solución ideal y usan esa
solución para formar una cota superior para cada subconjunto. Nótese que
la solución ideal de un suconjunto domina a todos los puntos eficientes
de ese subconjunto. Cada subconjunto forma un nodo y en cada nodo las
soluciones se comparan con la solución actual interaccionando con el decisor,
Un nodo es terminal si la solución ideal perteneciente a ese subconjunto está
dominada por la actual.

Finalmente apuntemos que la clasificación no termina aquí, sino que existen


otros procedimientos tales como: métodos de relajación, métodos secuenciales
métodos de las funciones escalares, etc., que no describimos aquí.
Los métodos interactivos requieren respuestas del decisor a una serie de pre­
guntas que se realizan en cada iteración. Por tanto, la consistencia del decisor
es uno de los factores más importantes para su buen desarrollo. Ya que los de-
cisores pueden ser muy subjetivos, diferentes soluciones iniciales pueden condudr
a diferentes soluciones de mejor compromiso. Además, los métodos usan distintos
tipos de preguntas o formas de interacción y como consecuencia llevarán, en ge­
neral, a diferentes soluciones. Por tanto, todos los métodos interactivos requieren
respuestas consistentes del decisor para ser aceptables.
Usualmente hay dos formas de reducir la inconsistencia del decisor: i) com­
probando la consistencia durante el procedimiento; y ii) minimizando la carga
cognoscitiva del decisor.
Acabamos de ver que debido al enorme tamaño del conjunto eficiente se hace
necesario el uso de métodos interactivos. Estos también pueden aplicarse cuando
el conjunto eficiente es difícil de determinar. En este último caso, los métodos se
basan en aproximaciones del conjunto eficiente que van convergiendo a la solución
más preferida a medida que aumenta la información sobre las preferencias del de­
cisor. En Mateos y Ríos-Insua (1997) y Ríos-Insua y Mateos (1998) pueden verse
aproximaciones al conjunto eficiente para problemas en ambiente de certidumbre
e incertidumbre, respectivamente. En Mateos, Ríos-Insua y Nevado (1998) se
presenta una aproximación para problemas multiobjetivo discretos y en Mateos,
Ríos-Insua y Prieto (1999) un estudio computacional de las relaciones entre los
conjuntos factible, eficiente y aproximación.

2.8 SOFTWARE: VISA

Aquí describiremos brevemente el software Visual Interactive Sensitivity Analy-


sis (VISA) (Visual Thinking International Ltd, h t t p : //w w w . V i s u a l T . c o m /v t i/)
(B RA-MA C A P ÍTU LO 3l rU K I'K »K N < ilA H KN CKICI I b U M I I K K 73

pi'obloDUW nuilMit.l.rlI>1i(.c> on a m b ie n t o do cOi'fcjduiDbrc b a s a d o m i o l UHü d fí


tiiiu lunolrtll do valor lliultlatrlbuto a d it iv a
fl
v(') M ]>^IU<V<(<).
M
Puodo usarse puní ayudar u un iltiico docleoj; o u un grupo de d c c ís o r e a ( v e r
Capítulo !)). Una do lnn graudos ventajas do VISA es que lo permite al d e c i s o r / e s
dosoubriv la Importancia d o los difoi'QnfcOB al.rlbul.oH y las implicaciones d e realizar
oauiblos gradas al iiuiUíhíh do HonHibilidad (ver Capítulo 8) interactivo visual que
roali'/.a, Su uso oh rooomondado para problemas con pocas alternativas y muchos
criterios o atributos,
Los pasos nocosarios para resolver un problema con VISA son los típicos del
Análisis do Decisiones quo indicamos a continuación aplicándolos al Ejemplo 2.6.

1. Estructuración del problema. Se trata de indicarle al programa las alternati­


vas, objetivos y atributos de que consta nuestro problema. Las alternativas
se introducen de forma matricial, correspondiendo cada fila con una alter­
nativa. Los objetivos y atributos se introducen de forma gráfica observando
la jerarquía de objetivos que se va construyendo. Así en el Ejemplo 2.6 se
obtendría:

/(Coste |------------—(Precio de compra!

/ /(Control

[Viviendaf -------[Distancias^----- —(Escuela)

\ \ ''(Trabajo 1
iTamafioj-----------fn° de m2|

Estos objetivos se pueden modificar añadiendo, borrando, cambiando de


nombre, etc., sobre el mismo gráfico.

2. Cuantificación de las alternativas. Consiste en introducir el valor que alcan­


za cada alternativa en cada uno de los atributos. Las consecuencias de cada
alternativa se pueden introducir haciendo uso de una escala termométrica
o mediante un diagrama de barras presionando sobre cada atributo. Como
ilustración consideremos el atributo “distancia al trabajo”:
74 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN

----
15 -casa 2
IM tfa fr á ja i Si: J H lü J E S j

!15

s 1 ü ü
casa 1 casa 3 -casa 3
casa 2

Kms

3. Asignación de preferencias. Consta de dos pasos:

(a) Construcción de una función de valor para cada atributo. La forma de


la función de valor se puede ir cambiando únicamente haciendo click
sobre la parte de la función que se desea cambiar. Lo ilustramos con
el atributo “distancia al trabajo” :

Impad on Distancias
,100 V ?

Y
A
J

_
L
) 50
t i
i _j
í
| V -
X
~ — __
¡ 05 1° 15 Kms

(b) Determinación de pesos. Se realiza de forma directa. Lo ilustramos


con el objetivo “distancias” que posee tres subojetivos:

4. Ordenación de alternativas. Podemos observar cómo quedan ordenadas 83


alternativas de forma gráfica y numéricamente:
© RA-MA CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE 75

H Vwíénita:5cpie*HH 13
91 44 42

■ m m
casa 1 casa 3
casa 2

5. Análisis de sensibilidad. El análisis de sensibilidad visual está muy logra­


do, ya que el efecto de cualquier cambio en pesos o valores se observa de
inmediato en las diferentes pantallas que tengamos abiertas. El gráfico si­
guiente muestra lo qué ocurriría si fuéramos cambiando únicamente el peso
del atributo “distancia a la escuela más próxima” . La línea vertical indica
la situación inicial.

-intxf
Vivienda
; 100 i
¡ vcasa 2
i _— ^ ¿ -c a s a l
j 50 ~ \ -----------casa 3
1
1
i °° 05 10 Escuela

En Zapatero, Smith y Weistroffer (1997) se realiza un estudio comparativo


de VISA con otros cuatro sistemas de ayuda a la decisión multiatributo: Expert
Choice (Expert Choice, Inc., Pittsburgh, EEUU) y Criterium (Sygenex, Inc.,
Redmond, WA, EEUU), que están basados en los procesos jerárquicos analíticos
(Saaty, 1980), Logical Decisions (Logical Decisions, Inc., Golden, CO, EEUU),
basado en la Teoría de Utilidad multiatributo (Keeney y Raiffa, 1976) y VIMDA
(NumPlan, Finlandia), basado en la dirección de referencia visual (Korhonen,
1988). Estos sistemas también se compararon con el paquete Quattro Pro (Bor­
land International, Inc., Scotts Valley, CA, EEUU).
Los indicadores usados para compararlos fueron la confianza de los decisores
en los resultados y el procedimiento usado para obtener los resultados, la facilidad
percibida sobre el uso del sistema y la cantidad de tiempo necesario para obtener
la solución. En general, la opinión sobre VISA es muy favorable.
Otro software llamado HIVIEW para Windows se presenta en la dirección de
Internet h t t p : / /www. e n t e r p r is e -ls e . c o . uk/softw are. htm.
76 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN

2.9 DISCUSIÓN
Sobre modelización de preferencias en certidumbre hay materia suficiente
completar un libro entero. Sin embargo, esperamos haber recopilado las ideas
suficientes para que el lector de este tema le quede suficientemente claro en qu§
consiste la modelización de preferencias en certidumbre.
Hemos considerado la perspectiva normativa. Sin embargo, ya que nuestra
intención no es imponer nuestro punto de vista sino dejar que el lector libremente
acepte la que considere mejor, hemos indicado las críticas que se le han hecho a
la perspectiva normativa y se han indicado la existencia de otras. Concretamente
se ha dedicado una sección para hablar de semiórdenes y órdenes de intervalo.
La sección que se ha tratado más.ampliamente es la de alternativas multi­
atributo, ya que creemos que la mayoría, por no decir todos, los problemas de
decisión son multiatributo. Es precisamente por esto por lo que aún en esta sec­
ción queremos completar lo que se decía allí con el siguiente esquema que indica
los pasos a seguir para llegar al tipo de función de valor que se ha de aplicar en
cada situación de decisión.

En los artículos de Kuhn y Tucker (1951), Geofírion (1966;1967), Roy (1971),


Yu (1973), Evans (1984), Marcotte y Soland (1986), Malakooti (1988), Buchanan
(1994), Aksoy, Butler y Minor (1996), Hussein y A bd El-Ghaffar (1996), Per®
y Vanderpooten (1998), Ulungu, Teghem y Ost (1998) y los libros de White
(1976), Hwang y Masud (1978), Goicoechea, Hansen y Duckstein (1982), Zeleny
© RA-MA CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE 77

(1982), Chankong y Haimes (1983), Steuer (1986) y Kirkwood (1997) pueden


verse detalles teóricos de distintos enfoques de métodos interactivos, así como
aplicaciones potenciales a problemas de decisión con información parcial sobre
las preferencias del decisor.
Finalmente, obsérvese que la última sección la hemos dedicado a presentar el
software VISA, pero se podría haber presentado cualquier otro capacitado para
realizar todo lo que se ha indicado en este capítulo, por ejemplo, alguno de los que
se indica al final de la sección anterior. Se ha considerado éste ya que creemos que
la interfaz de usuario es bastante buena. Otra alternativa es realizar optimización
multiobjetivo vía Internet (Miettinen y Makelá, 2000).
Para determinar si el problema en cuestión debe considerarse en ambiente de
incertidumbre en lugar dé certidumbre, Kirkwood (1992) es una posible referen­
cia, en cuyo caso su estudio corresponde al Capítulo 4 de este libro.

2.10 EJERCICIOS
2.1 Un individuo tiene que realizar una de las siguientes cuatro tareas: a,b,c y
d. Sabemos que es un individuo racional consistente que nos ha indicado que
le gusta mucho más realizar la tarea a que la b y esta última muchísimo más
que la c. Sin embargo, le es indiferente realizar la i» o la d. Nos preguntamos
por la tarea que escogería si le dieran a elegir entre:

(a) la o y la c;
(b) la o y la d\
(c) la c y la d.

2.2 Consideremos el conjunto de individuos A = {o, b, c, d, e} donde a, b,c,d y


e miden 160, 175, 165, 180 y 162 cm, respectivamente. Consideremos la
relación R = “ser mas alto que” .

(a) Representar matricialmente y mediante un grafo la relación R.


(b) Indicar las propiedades que cumple la relación R.
(c) ¿Qué tipo de orden es i??

2.3 Si R es una relación binaria sobre A demostrar que:

(a) Si R es asimétrica entonces es irreflexiva;


(b) Si R es irreflexiva y transitiva entonces es asimétrica;
(c) Si R es negativamente transitiva y asimétrica entonces es transitiva;
(d) Si R es irreflexiva, transitiva y comparable, es negativamente transiti­
va.
78 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-M a

2.4 Supongamos que un decisor establece las siguientes preferencias entre las
alternativas a ,b ,c y d : a >- b y c, a y c, b ~ d y a ~ d. ¿Estas preferencias
pueden ser consideradas consistentes?

2.5 Sean el conjunto de alternativas A = {a, 6, c, d} y parte de las preferencias


del decisor las representadas por las siguientes matrices
'y r\j y
a b c d a b c d a b c el
a ( \ a ( a
X \ X \
b X b b ( X
c c c
d V x m d. V 1 d 1 X i
Suponiendo que las preferencias del decisor son consistentes, completar las
matrices anteriores.

2.6 Sea v(-) una función y 6 una constante positiva tal que a y b <=> u(a) —v(b) >
6 y a ~ b & —6 < t;(o) —v(b) < 6, entonces demostrar que

(a) >- es asimétrica y transitiva


(b) ~ es reflexiva y simétrica
(c) para cada par de alternativas a, b G A, una y sólo una de las siguientes
relaciones puede ser cierta: a y b,b y a, a ~ b.

2.7 Si >- y rv*/ satisfacen

(a) Irreflexiva. Va G A, a )/■a


(b) Va, 6, c, d G A, (a >- b y b y c) =y (a >- d ó d y c)
(c) Va, b,c,d G A , (a y b y c y d) => (a >- d ó c y b)
(d) Consistencia de ~ y >-. Va, b € A , a ~ b - & a y b y b y a,

entonces demostrar que >- es asimétrica y transitiva y ~ es reflexiva y


simétrica.

2.8 Demostrar que si A = A i x A 2, A i y A 2 son mutuamente independientes


en preferencia y si £3 es un orden débil sobre A , entonces los órdenes de
preferencia £3^ y £3^ son ambos órdenes débiles.

2.9 Demostrar que dos funciones de valor aditivas v(a) = (ai) + y


w(a) = wj^ (ai) + W A ( a 2) representan la misma estructura de preferencia
si y sólo si existen a > 0 y j 9 , 5 e E tales que

^ (a i) = • a w ^ ( a i )+ / 3
vA ,( a 2) = Qw^a(a 2) + 5.
© RA-MA CAPÍTULO 2: PREFERENCIAS EN CERTIDUMBRE 79

2.10 Sea A = A\ x x A ¿. Demostrar que si ( ^ 1, ^ 2) es preferencialmente


independiente de .A3 y si (-42) -^3) es preferencialmente independiente de
A\ entonces las otras cuatro condiciones necesarias para la mutua indepen­
dencia en preferencia también se cumplen.

2.11 Demostrar que dos funciones de valor aditivas, v(a) = i>i(aj) y w(a) =
Y2 wi(oi), representan la misma estructura de preferencia si y sólo si existen
números reales a > 0 y ¡3U /?2, ••• , /?„ tales que tu¿(aj) = av^ai) +

2.12 Construir la función de valor que represente sus preferencias sobre la ve­
locidad de procesamiento de un ordenador.

2.13 Poner ejemplos de problemas de decisión multiatributo donde los atributos


sean mutuamente independientes en preferencia y otros en los que no.

2.14 Estudiar el problema de decisión de la compra de un ordenador nuevo uti­


lizando VISA. Recordar que los pasos que se tienen que seguir son: es­
tructuración del problema, cuantificación de las alternativas, asignación de
preferencias, ordenación de alternativas y análisis de sensibilidad.
CAPÍTULO 3

INCERTIDUMBRE Y SU
MODELIZACIÓN____________

En el capítulo anterior hemos considerado el Análisis de Decisiones bajo cer­


tidumbre, es decir, el estudio de procesos de decisión en los que el factor in-
certidumbre no se consideraba relevante para la toma de decisiones. Sin em­
bargo, hay multitud de situaciones y problemas reales en los que el decisor no
tiene seguridad sobre qué ocurrirá cuando elija un determinado curso de acción.
Supongamos una empresa que debe decidir sobre la compra de un avión, que
es un bien caro, y aunque su coste monetario se conoce con certidumbre, hay
posiblemente otros factores importantes relacionados como la fiabilidad, el valor
futuro de reventa, la duración, etc. que deberían tenerse en cuenta en el momento
de la adquisición y sobre los que hay incertidumbre inherente. Así, los próximos
capítulos los dedicaremos al Análisis de Decisiones incluyendo tal característica,
adoptando como medida de la incertidumbre subyacente el enfoque probabilís-
tico, que consideramos el más adecuado al poseer una tradición y fundamentos
matemáticos suficientemente sólidos.
En este capítulo comenzaremos introduciendo algunas ideas sobre la proba­
bilidad, estudiando brevemente sus enfoques filosóficos básicos. Posteriormente
consideraremos las reglas básicas del Cálculo de Probabilidades, así como su posi­
ble representación mediante árboles de probabilidad, y la revisión y actualización
de juicios como consecuencia de la disponibilidad de nueva información. Final­
mente, estudiaremos el problema de asignación de probabilidades considerando
diferentes procedimientos y heurísticas, cuya elección dependerá de las caracterís­
ticas del problema de decisión en cuestión.
82 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN_________ © RA-ij

3.1 SUCESOS ALEATORIOS Y RESULTADOS

Para poder definir el concepto de probabilidad com o herramienta para la cuan


tificación de la incertidumbre, se requieren previamente las definiciones de loj
conceptos suceso aleatorio y resultado. Para introducirlos, consideremos el eje®,
pío de un banco que ha detectado una bolsa importante de clientes que están
insatisfechos y por ello son candidatos a abandonarlo. En un intento de evi­
tar esas posibles pérdidas, el Departamento de Fidelización decide el lanzamiento
simultáneo de tres productos específicos, denominados A, B y C. El citado depar­
tamento lleva a cabo una enumeración exhaustiva del posible efecto que podrían
tener los tres productos sobre la fidelización de los clientes. Si denomíname; «gj»
a que el producto ha tenido éxito y “No” a qué ha fracasado, la tabla que sigue
muestra las posibles situaciones o resultados que se podrían dar. Observemos que
uno y sólo uno puede presentarse al final de la campaña de fidelización.

Producto
Resultado A B C
1 Sí Sí Sí
2 Sí Sí No
3 Sí No Sí
4 No Sí Sí
5 Sí No No
6 No Sí No
7 No No Sí
8 No No No

Podríamos dar una descripción de cada uno de estos ocho resultados. Así, el
1 corresponde a que “los tres productos han tenido éxito” , el 2 a que “han tenido
éxito los productos A y B pero no el C” ..., y el 8 , “ningún producto ha tenido
éxito” .
Un suceso aleatorio o simplemente suceso consistirá en uno o más posibles
resultados. Si sólo contiene uno se dice que es un suceso elemental o swnpfeí
sin embargo, si contiene dos o más entonces se dice que es un suceso compuesto.
Por ejemplo, el resultado “sólo dos productos han tenido éxito” será un suceso
compuesto formado por los resultados 2, 3 y 4, pero el suceso “ninguno ha tenido
éxito” estará formado únicamente por el 8 , siendo un suceso elemental.

3.2 ENFOQUES DE LA PROBABILIDAD

De una manera informal diremos que una probabilidad es esencialmente una ni


dida que asigna un número del intervalo [0 , 1] a cada suceso de un experimen o.
cumple ciertas leyes matemáticas. En esta sección desarrollamos los tres enfoq
o interpretaciones básicas de la Teoría de la Probabilidad: el clásico, el Aiecu
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 83

lista y el subjetivo. Son filosóficamente distintos, por lo que ha existido y aún


existe una controversia sobre lo apropiado o válido que puede resultar cada uno
de ellos. Los dos primeros conducen a las denominadas probabilidades objetivas,
ya que diferentes personas que tuvieran acceso a la misma información llegarían
al mismo conjunto de probabiÜdades. Por el contrario, el enfoque subjetivo que
conduce a las probabilidades subjetivas, es el que adoptaremos aquí al considerar­
lo el más apropiado para el Análisis de Decisiones, y lleva posiblemente a que la
gente difiera en las probabilidades que proponga. Estudiamos a continuación las
características de cada uno de estos enfoques.

3.2.1 Enfoque clásico

Los orígenes del estudio de la probabilidad se encuentran en los juegos de azar,


considerándose el trabajo de Laplace de 1825 como el punto de partida para
su desarrollo, quien consideró que la probabilidad de un suceso era el cociente
entre el número de resultados favorables al suceso y el número total dé posibles
resultados, suponiendo todos ellos igualmente verosímiles.

Definición 3.1 (Probabilidad clásica)


Sean A i,A 2,...,An los sucesos elementales igualmente verosímiles a que da
lugar la realización de un experimento. Un suceso compuesto A será la unión de
algunos de los sucesos elementales, por ejemplo,

A = Ai1 UAÍ2 \J---\jAim.

Ya que la ocurrencia de cualquier Aik es favorable a A, su probabilidad se


toma igual al cociente m/n. Así, él enfoque clásico de la probabilidad conlleva la
utilización de la fórmula

. Número de resultados en el suceso A


Probabilidad de un suceso A =■ ——-------------- —------- —----------— -— .
Numero total de posibles resultados

Ejem plo 3.1


Una empresa produce chips que empaqueta en lotes de 100 unidades. La ex­
periencia en la fabricación durante largo tiempo demuestra que 5 chips aparecen
completamente defectuosos y sin posibilidad de arreglo, 10 se encuentran par­
cialmente defectuosos y con un pequeño arreglo sería posible que funcionaran
correctamente y, finalmente, 85 están en buen estado. Es evidente que si decidi­
mos extraer un chip al azar de un lote podríamos responder a la pregunta: ¿cuál
es la probabilidad de que el chip seleccionado esté completamente defectuoso? La
solución a esta cuestión conlleva la aplicación de la fórmula anterior, obteniendo
así una probabilidad igual a 5/100 = 0.05. ^
84 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-M a

Por tanto, para cualquier suceso A que contenga m sucesos elementales siendo
n el número total de sucesos, se debe verificar que 0 < m < n y su probabilidad
P será

P{A) = ~ .
n
Obsérvese que para poder aplicar esta definición de probabilidad a un proble­
ma, se requiere que todos los sucesos tengan la misma posibilidad de ser escogidos,
es decir, que sean igualmente verosímiles. Esto es lo que Laplace plasmó en su
famoso “Principio de la Razón Insuficiente” , que llevaría a suponer en el ejemplo
anterior que cada tipo de chip tiene las mismas posibilidades de ser escogido,
lo cual podría no ser cierto si se elige de la parte superior del lote y tal vez se
hubieran situado los defectuosos en la parte inferior. Vemos, por tanto, que en
la mayoría de los casos reales los resultados de las elecciones no serán igualmente
verosímiles y de aquí que la utilidad de este enfoque esté limitada. Por ello, la
aplicabilidad es bastante reducida y el interés en su estudio, aparte de por razones
históricas, se encuentra en que es un concepto intuitivo y en que el razonamiento
conceptual es sencillo de comprender, sirviendo como introducción a los enfoques
que siguen a continuación.

3 .2 .2 E n fo q u e fre cu e n tis ta

En el enfoque frecuentista la probabilidad sólo tiene significado en el contexto


de un experimento que se puede repetir indefinidamente. La probabilidad de
un suceso será la proporción de veces que se da el suceso en una larga serie de
pruebas repetidas del experimento en idénticas condiciones. Así, la probabilidad
se estimará repitiendo el experimento un gran número de veces o recogiendo
información relevante para el suceso y calculando la frecuencia con que hubiera
ocurrido el suceso de interés.

E je m p lo 3.2
Consideremos el experimento aleatorio consistente en lanzar un dado y obser­
var la cara que queda en la parte superior. Es claro que este experimento podría
repetirse indefinidamente en similares condiciones. Supongamos que el experi­
mento se repite hasta 10000 veces y que el resultado de interés es el número de
unos que aparecen. La Tabla 3.1 muestra los resultados para valores escogidos
del número de lanzamientos, tal como se pueden ver en la primera fila.

Tabla 3.1: Proporción de unos en el lanzamiento repetido de un dado

No. de lanzamientos 5 10 50 100 500 1000 5000 10000


No. de unos que surgen 1 1 9 14 73 167 816 1669
Proporción de unos______ 0.2 0.1 0.18 0.14 0.146 0.167 0.163 0.167
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 85

Vemos que la frecuencia relativa o proporción de unos tiende a 0.16 = 1/6,


que se alcanzaría bajo la hipótesis frecuentista de que el dado se lanzara infini­
tas veces. En la realidad, es evidente que no es posible la repetición indefinida
de un experimento aleatorio, de modo que debe aceptarse la hipótesis frecuen­
tista admitiendo su validez si el experimento se repite un número suficientemente
“grande” (no especificado) de veces. En la Figura 3.1 se muestra gráficamente
cómo al ir aumentando el número de lanzamientos la proporción de unos tiende
hacia 1 / 6 .

Proporción
de unos

Número de lanzamientos del dado

Figura 3.1: Proporción de unos en el lanzamiento repetido de un dado

Obsérvese también que la situación anterior sería cierta para un dado equi-
[ librado. Si el dado no estuviera equilibrado, posiblemente la frecuencia relativa
tendería hacia otro valor diferente, siendo entonces la probabilidad diferente de
la obtenida en el caso del dado equilibrado.
Una situación más realista sería, por ejemplo, que en el control de calidad
de las placas fabricadas para PCs en una empresa que lleva a cabo diariamente
un inspector, éste detectase 14 defectuosas entre las 90 que tiene como objetivo
controlar cada día. Se podría sugerir, de acuerdo con el enfoque frecuentista, que
la probabilidad de que una placa fuera defectuosa sea 4/90 = 0.155. Es evidente
que la fiabilidad en la estimación propuesta por el inspector mejoraría, tal como
ocurría con el lanzamiento del dado, si repite esta observación durante varios días
de modo que la estimación basada en el control durante un mes o más tiempo,
será mejor que la que se obtiene de un único día. □

D efinición 3.2 (Probabilidad frecuentista)


Dado el espacio muestral 0 asociado a un experimento aleatorio (conjunto de
resultados posibles del experimento) y un suceso A C 0 , si # A es el número de
veces que se da A en “ n" repeticiones del experimento, entonces la probabilidad
88 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN

P de A se define como

P ( A ) = lim — ,
n —*oo fi

en donde suponemos que tal límite existe.

Obsérvese que debemos entender aquí el anterior límite, no en un sentido


puramente matemático, sino más bien empírico, de manera que no habrá garantía
de que después de un cierto número de pruebas la diferencia en valor absoluto
entre el cociente #A /n y el límite, sea inferior a una cierta cantidad prefijada.
Así, deberíamos entenderlo en el sentido de que la gráfica de #A/n se aproxime
cualitativamente cada-vez más a P (A ) al aumentar n.
A la vista de los ejemplos planteados, sacamos dos conclusiones básicas re­
lativas a este enfoque. La primera se refiere al aspecto de repetición, es decir
que es esencial que el experimentó pueda realizarse de nuevo y tantas veces como
se desee. La segunda es que la probabilidad frecuentista es una propiedad del
sistema en consideración, esto es, si cambian las condiciones de la estimación de
la probabilidad ésta podría ser poco fiable. Como consecuencia surge un conflicto
entre la necesidad de disponer en el tiempo de una masa grande de datos de los
sucesos de interés y que los datos referidos a tales sucesos se hayan obtenido bajo
las mismas o similares condiciones. De aquí la necesidad de establecer juicios
para alcanzar un equilibrio entre estas dos consideraciones, lo que nos abre el
camino para el tercer enfoque.

3 .2 .3 Enfoque subjetivo

Hay muchas situaciones de decisión en las que un individuo se enfrenta por


primera vez con ella, de modo que se hace necesario estimar la probabilidad
de sucesos que sólo ocurrirán una vez. Esto es especialmente común en Análisis
de Decisiones siendo entonces la probabilidad subjetiva la única que se ajusta
a los propósitos de esta disciplina. Por ejemplo, una empresa desea estimar la
probabilidad de éxito en el lanzamiento de un nuevo producto, sobre el cual no
hay experiencia en cuanto a nivel de aceptación por los potenciales usuarios, de
m odo que un enfoque frecuentista (o clásico) no parece viable. Es posible que
la empresa tenga acceso a información relativa al lanzamiento de otros produc­
tos análogos, pero bajo condiciones de mercado diferentes. En tales situaciones,
las probabilidades deberán estimarse utilizando el enfoque subjetivo o también
llamado personal, porque las probabilidades no estarán asociadas con el sistema
b ajo observación sino con el observador del sistema. Nótese que el juicio emitido
estará posiblemente influenciado por la información pasada o por cualquier otra
información que se estime relevante. Sin embargo, a partir del juicio personal
se propondrá finalmente la estimación de la probabilidad, ocurriendo que posi­
blemente individuos distintos difieran en la estimación a pesar de disponer de 1
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 87

misma información. En este caso, la probabilidad es una representación del grado


de creencia del individuo de que ocurra un suceso particular o de que el sistema
en estudio adopte un determinado estado.
Así, si 6j representa un estado del sistema en observación, entonces su pro­
babilidad, P( 9j ) , representará el grado de creencia por parte del observador de
que el suceso 6j ocurra. Por ello, cuanto mayor sea la creencia del individuo,
mayor será la probabilidad P ( ) . Como ya hemos apuntado, la probabilidad es
entonces personal, ya que pertenece al individuo y de ahí su caracter subjetivo.
Cuando no estamos de acuerdo con alguien sobre, por ejemplo, la probabilidad de
que un equipo de fútbol determinado gane un partido, no intentamos persuadir
a esa persona de que nuestra probabilidad es mejor. Es entonces cuando puede
tener lugar una apuesta, quepara mucha gente refleja sus probabilidades subje­
tivas, como veremos después. Además, aunque podemos interpretar P (9j) como
cuantificación del grado de creencia personal, para poder denominarlo probabi­
lidad deberá verificar los axiomas de Kolmogorov. Por ello, habrá que elegir los
números P ( 6j ) que verifiquen las leyes de la probabilidad y si esto es así, diremos
que el individuo es coherente, ver de Finetti (1937, 1974, 1975) y French (1986)
para un estudio sobre posibles axiomatizaciones de la probabilidad subjetiva.
Hay personas que se consideran escépticas en relación con la estimación de
probabilidades subjetivas, considerándolas de baja calidad. Sin embargo la in­
vestigación en el área psicológica ha sido muy prolífica tratando de determinar lo
buena que puede ser la gente en la emisión de este tipo de juicios. Estas investigar
ciones han conducido a proponer algunos métodos de educción de probabilidades
con buenos resultados e incluso admitiendo la posibilidad de imprecisión en los
juicios, al no ser necesaria en muchos casos una estimación exacta, siendo posible
conformarse, por ejemplo, con un intervalo. Veremos posteriormente (Sección 3.6)
algunos de tales procedimientos que, conjuntamente con el análisis de sensibili­
dad sobre el modelo (Capítulo 8), muestran que puede ser aceptable un enfoque
de asignación de probabilidades basado en imprecisión, siendo menos estricta la
tarea de asignación para el individuo, y por tanto, más sencilla la cuantificación
de la incertidumbre del problema.
Para hacer más patente la diferencia entre los enfoques frecuentista y subje­
tivo consideremos las siguiente afirmaciones que posteriormente analizamos: “la
probabilidad de que una moneda equilibrada muestre cara es 1/ 2” y “la proba­
bilidad de que esa moneda muestre cara en la próxima tirada es 1/2” . En el caso
del enfoque frecuentista, la primera afirmación es simplemente una cuestión de
definición aunque expresada en parte de modo inverso. Es decir, se está asumien­
do que si la moneda se lanza un número muy grande de veces y muestra cara en la
mitad de los lanzamientos, entonces el suceso indicado tendrá probabilidad 1/ 2.
A tales monedas se les llama equilibradas. Por otra parte, el enfoque subjetivo
para esta misma frase es también una cuestión de definición, aunque ahora el
decisor considera que la moneda está equilibrada si piensa que los dos resulta­
dos posibles son igualmente verosímiles, de manera que su probabilidad subjetiva
88 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-M a

cuantificará esta idea con la asignación 1/2. Por tanto, para un frecuentista, ]a
probabilidad 1/2 define su concepto de moneda equilibrada, mientras que para
un subjetivista su concepto de moneda equilibrada define su probabilidad como
1/ 2 .
Para la segunda frase, sin embargo, no hay interpretación frecuentista, ya que
se está refiriendo a un suceso particular y no hay pruebas repetidas. Por tanto
no es posible dar un significado técnico al término probabilidad bajo tal contexto.
De nuevo, en el caso subjetivo, el decisor estaría considerando que es igualmente
verosímil que se dé uno de ambos resultados en el siguiente lanzamiento, dado
su actual conocimiento de la moneda. Pero obsérvese que el decisor no estaría
diciendo que la moneda está equilibrada, ya que acepta que pudiera no estarlo.
Simplemente debido a'su'estado de conocimiento presente, no tendría razón al­
guna para predecir que un resultado sea más probable que el otro. Es claro que
la observación de lanzamientos posteriores de la moneda podrían hacerle cambiar
esa creencia.

3.3 DISTRIBUCIONES DE PROBABILIDAD Y


PROPIEDADES

Presentamos ahora un conjunto de conceptos y reglas que se aplican a las pro­


babilidades, que permiten realizar cálculos con ellas y que son independientes de
los enfoques anteriormente expuestos. Plantearemos primero los axiomas de la
probabilidad.

3 .3 .1 A xiom as de la probabilidad

Las probabilidades que estimemos o calculemos para los diferentes sucesos relar
tivos a un problema particular, deberán verificar los axiomas de la Teoría de la
Probabilidad, conocidos también como axiomas de Kolmogorov. Tales axiomas
son los siguientes:

A x io m a 1. No negatividad. La probabilidad de cualquier suceso debe ser no


negativa, es decir, para todo suceso A debe ser P (A) > 0.

A x io m a 2. Certidumbre. La probabilidad del suceso 0 formado por todos los


posibles estados es la unidad, es decir, P (0 ) = 1.
Como consecuencia de este axioma y el anterior, se tendrá que para cualqmer
suceso A es 0 < P (A) < 1.

A x io m a 3. Unión de sucesos disjuntos. Si dos sucesos A y B son mutu&


mente excluyentes o disjuntos, entonces P (A U B ) = P (A) + P (B).
Este axioma se extiende a un número cualquiera de sucesos, disjuntos 2 a 2.
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 80

Existen otras axiomáticas relacionadas especialmente con la probabilidad sub­


jetiva que ya citamos, pero que no plantearemos aquí.

3.3.2 Operaciones con sucesos

Dado un suceso A entonces el suceso “A no ocurre” , se denomina suceso contrario


o complementario de A y se representa Ac. Ya que es obvio que o bien un suceso
o su contrario deben ocurrir al realizar el experimento, sus probabilidades deben
sumar la unidad, es decir,

P (j4) + P (Ac) = 1 y de aquí que P (A°) = 1 - P (A).

Si, por ejemplo, la probabilidad estimada de que concedan la realización de


un proyecto es 0.75, la probabilidad de que no lo concedan debe ser 0.25.
Supongamos que tenemos un conjunto 0 o lista exhaustiva de sucesos, es
decir, que el conjunto incluye todos los posibles sucesos que pudieran darse en
relación con el problema o experimento en cuestión. Esto se llama espacio mues-
tral, como ya hemos apuntado. Los sucesos mutuamente excluyentes, disjuntos o
incompatibles, serán aquellos en que la ocurrencia de un suceso excluye la ocurren­
cia simultánea de otro. Por ejemplo, si en el control de calidad de una placa de
un PC se detecta que funciona correctamente, no puede considerarse simultánea­
mente que ésta se encuentra defectuosa. Formalmente, si A y B son sucesos
mutuamente excluyentes, lo representaremos en la forma A fl B = 0 , en que 0
representará el suceso imposible (nunca ocurre).
Hay situaciones en que dados dos sucesos A y B resulta conveniente o necesario
obtener la probabilidad de que ocurra uno u otro suceso, que lo indicaremos AUB,
y se denomina unión de los sucesos A y B. Si tales sucesos son mutuamente
excluyentes, la probabilidad pedida vendrá dada por la regla de la adición (ver
Axioma 3)

P ( A l l B ) = P{ A) + P( B) .

Por el contrario, si los sucesos no son mutuamente excluyentes, entonces la regla


de la adición conduce a la fórmula más general

P (A U B) = P (A) + P (B) - P (A fl B ) ,

donde el último término tiene el efecto de restar el doble conteo de la unión .AuB,
por ser no disjunta. Ilustremos con un ejemplo la aplicación de la citada regla.

Ejemplo 3.3
Supongamos que para tomar una decisión en relación a la plantación tem­
prana o tardía de un cierto cultivo deseamos predecir la probabilidad de que en
la primavera próxima pudieran existir fuertes lluvias en la región (suceso A) o
90 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISION ©

desbordamiento del río que la cruza (suceso B) . Si disponemos de información


correspondiente a las últimas 15 primaveras, podemos tal vez adoptar un enfbqUe
frecuentista obteniendo que los valores de las probabilidades serán P( A) = 8/15
y P (B) = 9/15. Deseamos calcular la probabilidad de que se dé uno u otro
evento, es decir, P ( A U B ) . Para ello aplicaríamos la regla de la adición bajo
la suposición de que ambos fenómenos son mutuamente excluyentes, obteniendo
sin embargo una probabilidad mayor que 1 , lo que no es posible de acuerdo con
las leyes del Cálculo de Probabilidades (ver Axiomas 1 y 2). El error proviene
de suponer que ambos sucesos son mutuamente excluyentes, cuando no tendrían
por qué serlo. Pensemos que podría llover fuerte en el nacimiento del río que está
fuera de la región de cultivo y el río desbordarse con el consiguiente perjuicio. Por
tanto, suponiendo que. durante 5 años se hubieran producido ambos fenómenos,
el cálculo correcto de la probabilidad-anterior deberá ser

P(AUB) = P ( A ) + P ( B ) - P ( A n B ) = ^ + ^ - j ¿ = ^

evitando el doble conteo debido a que hubieran existido primaveras en que se


hubieran producido ambos fenómenos. □

La extensión de la regla de la adición a tres sucesos que no son mutuamente


excluyentes es

P(AUBUC) = P(A) + P ( B ) + P ( C ) -
- P ( A n B ) - p ( A n C ) - p ( B n C ) + P{AnBnC).

3 .3 .3 Probabilidad condicionada e independencia de sucesos

Consideremos los datos proporcionados por la Tabla 3.2, que se refieren al re­
sultado de una encuesta realizada a 500 trabajadores de un centro de llamadas
telefónicas, en que se ha estudiado si padecen o no faringitis y si han tomado o
no, durante un periodo de tiempo, un cierto tipo de medicamento.

Tabla 3.2: Resultados de una encuesta sobre faringitis

Tienen faringitis
No Sí Tbtal
Tomaron medicamento 140 87 227
No lo tomaron 95 178 273
Total 235 265 500

Deseamos determinar la probabilidad de que un trabajador tenga faring>tlS


(suceso A) haya tomado o no el medicamento. Asumiendo un enfoque frecuentó
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 91

y que el conjunto de datos es representativo, tenemos

265
P (A) = P (un trabajador tenga faringitis) = .

A esta probabilidad, que se ha calculado con los datos del margen (inferior)
de la tabla, se le denomina individual o marginal, pues no está condicionada a si
el trabajador tomó o no el medicamento.
Planteemos ahora el problema de calcular la probabilidad de que un trabar
jador tenga faringitis supuesto que ha tomado el medicamento (suceso B). Esta
probabilidad se denomina condicionada, ya que para su cálculo estamos condi­
cionando por el hecho de que el. trabajador hubiera tomado el medicamento. Se
representa por P (A |B) y su cálculo es

P ( A \ B) — P (un trabajador .tenga faringitis |ha tomado medicamento)


87
~ 227 '
Observando el numerador de la anterior probabilidad vemos que corresponde a
la intersección de los sucesos “tiene faringitis” y “ha tomado el medicamento” , es
decir, A n B. El denominador corresponde al suceso “ha tomado medicamento” ,
es decir, B. Por tanto, podemos escribir la siguiente fórmula de la probabilidad
condicionada

P ( A\ B) = P f ^ ] , (3.1)

válida siempre que el denominador, en este caso P (B), sea positivo. Si en (3.1)
despejamos P (A n B) queda

P(AnB) = P( A\ B) P ( B)
| P ( B\ A) P( A)

que se denomina regla de la multiplicación o teorema del producto y donde la


segunda igualdad se ha obtenido por simetría. Su generalización a n sucesos es
inmediata obteniéndose

P (AiC\ ■■•D An) = P (Ai) P (Ai \Ai ) - - - P( An |A i n - ' - n A n - i ) .

Otro concepto importante es el de independencia de sucesos. Dos sucesos ,4


y B se dicen (estocásticamente) independientes si la probabilidad de que ocurra
el suceso A no queda afectada por la ocurrencia del suceso B. Fbrmalmente
se expresará escribiendo que la probabilidad condicionada es la misma que la
marginal, es decir,

P ( A \ B ) = P( A)
92 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

ya que el hecho de que el suceso B haya ocurrido no afecta a la probabilidad de


que ocurra el A. Así, la probabilidad condicionada coincidirá con la marginal.
En el ejemplo anterior se tenía que P( A\ B ) = 557 ^ f§§ = P (A). Así, la
probabilidad de que un trabajador tenga faringitis está influenciada por el hecho
de haber tomado el medicamento, siendo por tanto los sucesos A y B dependientes.
Otra caracterización útil de la independencia desde un punto de vista práctico
viene dada por la relación

P(Ar\B)=P(A)P(B)

que sustituida en la fórmula (3.1) nos conduce a la definición introducida. Ob­


sérvese de esta última expresión que la independencia es simétrica en el sentido
de que si un suceso A es independiente de otro suceso B, también el suceso B
es independiente del A. Además, la independencia se traslada a los respectivos
sucesos contrarios, ya que si A y B son independientes se puede comprobar que
también lo serán los pares: 1) Ac y B; 2) A y B c\y 3) A c y B c. La definición de
independencia se extiende a más de dos sucesos. Por ejemplo, para tres: A, B,
C son mutuamente independientes si y sólo si

P ( i n B n G ) = P (A)P (B)P(C)
P ( A n B ) = P( A) P( B)
P(Ar\C)=P(A)P(C)
P{Br\C)=P{B)P(C).

Si sólo ocurre para los pares se dice que son independientes dos a dos. La primera
igualdad de arriba no implica las otras tres y estas tres no implican la primera,
ver por ejemplo, Ríos (1977).
Finalmente propondremos un resultado conocido como Teorema de la Pro­
babilidad Total: Sean A i.... An sucesos mutuamente excluyentes y que forman
un sistema exhaustivo, es decir tales que (JíLi A¿ = 0 , y sea B un suceso para
el que se conocen las probabilidades condicionadas P (B |Ai) y que se conocen,
además, las probabilidades P(Ai). Entonces
n

P{B) = P(£n©)=P^Bn = £ > (i? n^)


t=l
n
= Y JP { B \ A i)P{ Ai).
t=i

3 .3 .4 Distribuciones de probabilidad

Ya hemos apuntado anteriormente distintos enfoques para el cálculo de la pro­


babilidad de un suceso determinado. Sin embargo, en los problemas de toma
de decisiones ocurrirá que generalmente deberemos identificar todos los posi­
bles sucesos que puedan darse debido a la elección de una acción particular y
© RA-MA CAPÍTULO 3; INCERTIDUMBRE Y SU MODELIZACIÓN 93

si disponemos o hemos calculado las respectivas probabilidades de estos sucesos,


entonces tendremos el conjunto completo de sucesos con sus probabilidades, que
recibe el nombre de distribución de probabilidad.

Ejemplo 3.4
Supongamos una empresa de alquiler de ordenadores que está considerando
la posibilidad de abrir una nueva filial y pretende estimar la distribución de pro­
babilidad del número de ordenadores que serán capaces de mantener en servicio
al final del semestre. Tal distribución de probabilidad se recoge en la Tabla 3.3,
que está representada gráficamente en el diagrama de barras de la Figura 3.2.

Tabla 3.3: Distribución de probabilidad de'ordenadores en servicio


al final del semestre

No. de ordenadores en servicio . 0 1 2 3 4 5


Probabilidad 0.05 0.2 0.3 0.3 0.1 0.05

0.3 --

0. 2

0. 1

II II
1 2 3 4
Número de ordenadores en servicio

Figura 3.2: Distribución de probabilidad para el número de ordenadores en servido

Obsérvese que las probabilidades suman la unidad, ya que se han listado todos
los posibles sucesos. La tienda tiene 5 ordenadores y al final del semestre podrían
estar en servicio 0,1,..., 5. Además, vemos que el número de ordenadores en
servicio es un valor entero, es decir, no podría haber en servicio por ejemplo, 2.3
ni 4.38 ordenadores. D

Este ejemplo se corresponde con el caso de una distribución de probabilidad


discreta, que es aquella que puede tomar valores a lo sumo en un conjunto discreto
(finito o infinito numerable).
Por otra parte, están las distribuciones de probabilidad continuas, que sí
pueden tomar cualquier valor de un intervalo especificado o conjunto continuo,
94 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© RA-M a

sobre el que está distribuida la incertidumbre. En este caso no se debe pensar


en términos de la probabilidad de un valor particular, sino de la probabilidad de
que la variable.tome un valor dentro de un recorrido prefijado.

Ejemplo 3.5
Consideremos un proyecto relativo al desarrollo de un programa de ordenador
cuya duración parece razonable que lleve asociada incertidumbre, que suponemos
cuantificada con la distribución de probabilidad para el tiempo de completación
del programa tal como se tiene en la Figura 3.3.

Tiempo de completación del programa (en meses)

Figura 3.3: Punción, de densidad para el tiempo de completación del programa

En la citada figura, la curva cuyo dominio es el intervalo [1,8] (medido en


meses), recibe el nombre de función de densidad (de probabilidad). En el eje de
abscisas aparece la variable tiempo y en el de ordenadas los valores de la densidad
de probabilidad, que obviamente deben ser no negativos. La probabilidad de que
el proyecto se complete entré dos valores prefijados, por ejemplo, entre 3 y 5
meses, vendrá dada por el área bajo la curva entre esos dos puntos (zona rayada
de la figura), que en este caso es 0.40. Es evidente que el área total bajo la curva
le densidad debe ser la unidad, ya que los valores extremos del recorrido de la
/ariable, 1 y 8 meses, representan los valores extremos entre los que se tiene la
seguridad de completar el desarrollo del programa. Un resumen de la distribución
le probabilidad se muestra en la Tabla 3.4.

Tabla 3.4: Probabilidades del tiempo de completación


T. de completación del programa Probabilidad
De 1 a 3 meses 0.3
De 3 a 5 meses 0.4
De 5 a 7 meses 0.25
De 7 a 8 meses 0.05
© R A -M A CAPITULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 95

Otra forma de representar una distribución de probabilidad viene dada por


la función de distribución. En el proceso de educción de probabilidades a veces
resulta más sencillo pensar en términos de la probabilidad de que una variable
tenga un valor menor o igual que una cantidad fijada. Por ejemplo, podríamos
preguntar al decisor: ¿cuál es la probabilidad de que la completación del programa
se lleve a cabo en 5 meses o menos? La respuesta a esta cuestión en forma
reiterada para otros valores conducirá a la función de distribución, cuya gráfica
para el ejemplo anterior se muestra en la Figura 3.4.

•«a
p
i
§«
■<o11

■E
£8

0 2 4 6 8 10
Tiempo de completación de) programa (en meses)

Figura 3.4: Función de distribución para el tiempo de completación del programa

Para finalizar este apartado destaquemos que puede ser útil en determinados
problemas utilizar una distribución de probabilidad discreta como aproximación
de una continua por cuestiones computacionales. Recíprocamente, si estamos
manejando una variable discreta con un número grande de valores, podría ser
más cómodo y sencillo la resolución del problema si la tratáramos como una
variable continua, considerando un aproximación conveniente. En el Capítulo 5
volveremos sobre esto.

3.4 ÁRBOLES DE PROBABILIDAD

Un recurso que puede resultar particularmente útil para el cómputo de probabi­


lidades de determinados sucesos en la resolución de problemas complejos son los
árboles de probabilidad, que presentamos a continuación mediante un ejemplo.
Consideremos dos empresas de telefonía denominadas T\ y T¡, quo compiten
por contratar con una empresa de servicios de Internet denominada /. Sólo una
de ambas empresas podrá establecer el contrato con I y so ha estimado quo la
probabilidad de que T\ logro ol contrato es 0.7, mientras que 0.3 será la proba­
bilidad de que lo logre T¡j, Además, si lo logra Ti, la empresa l seguiría siendo
96 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© RA-M a

independiente con probabilidad 0.6 y quedaría absorbida desapareciendo con


empresa con probabilidad 0.4. Si la vencedora fuera T2, entonces las probabilj.
dades para las situaciones análogas anteriores serían 0.2 y 0 .8 , respectivamente
El árbol de probabilidad para este problema está representado en la Figura 3.5
mostrando los posibles sucesos en orden cronológico desde la rafe (izquierda) alas
hojas (derecha). Es decir, primero se considera qué empresa de telefonía contrata
con la de Internet y luego cada empresa absorbe o deja independiente a la de
Internet.

Figura 3.5: Árbol de probabilidad

Observamos que desde la raíz hasta las hojas hay cuatro caminos que corres­
ponden a los cuatro sucesos posibles que pudieran presentarse. Supongamos que
estamos interesados en conocer cuál es la probabilidad de que la empresa de Inter­
net permanezca independiente. Para ello, calcularemos primero la probabilidad
de que logre el contrato la empresa T\ e I permanezca independiente. Se tiene

P (Ti logre el contrato e I permanezca independiente) =


= P (Tí logre el contrato) x
x P ( I permanezca independiente |Ti logre el contrato)
= 0.7 x 0.6 = 0.42.

Análogamente, se obtiene que

P (T2 logre el contrato e I permanezca independiente) =


= 0.3 x 0.2 = 0.06.
© RA-MA CAPITULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 97

Entonces, la probabilidad de que la empresa 7 permanezca independiente será


la probabilidad de la unión de los sucesos anteriores, es decir,

P (7 permanezca independiente) =
Ti logre el contrato e 7 permanezca independiente U
U T2 logre el contrato e 7 permanezca independiente

y como ambos sucesos son mutuamente excluyentes, ya que sólo una de las dos
empresas puede lograr el contrato con 7, se tendrá que la probabilidad pedida
será igual a la suma de las probabilidades de ambos sucesos, es decir,

P (7 permanezca independiente) = 0.42 + 0.06 = 0.48.

Los árboles de probabilidad pueden ser útiles en el estudio de la propagación de la


evidencia y si además se añade la posibilidad de tomar decisiones, tendríamos la
herramienta del Análisis de Decisiones conocida como árboles de decisión. Estos
se estudiarán en el Capítulo 5 y constituyen un valioso modelo de representación
y evaluación en muchos casos.

3.5 REVISIÓN DE JUICIOS Y TEOREMA


DE BAYES

Esta sección la dedicamos a estudiar el proceso de revisión de las probabilidades


inicialmente propuestas para resolver un problema, a la luz de nueva información
disponible en relación con él. El centro de la discusión será el Teorema de Bayes,
que se utilizará como una herramienta normativa que nos indicará cómo llevar
a cabo la revisión aludida. Tal teorema recibe el nombre de su autor, Thomas
Bayes, que se publicó posteriormente a su muerte en 1763.
Planteamos las ideas de revisión de probabilidades con el siguiente ejemplo.
Consideremos al Director de Marketing de una empresa de informática que está
considerando la posibilidad del lanzamiento de un nuevo filtro polarizado para
monitores. Basado en la experiencia de que dispone de sus muchos años en el
puesto, estima que la probabilidad de que las ventas del filtro superen durante el
primer trimestre el punto de equilibrio financiero (las ventas comienzan a producir
beneficios) es 0.9. Sin embargo, al director le llega la información de que la
competencia va a comenzar el lanzamiento de un nuevo monitor que incluye
buena parte de las características de su filtro. Esta noticia le sugiere al director
la posibilidad de que entonces no se llegue a alcanzar el aludido punto de equilibrio
financiero. Se plantearía la cuestión: ¿cómo revisar o actualizar la probabilidad
estimada a la luz de esta nueva información? La respuesta puede venir con la
ayuda del citado teorema como mostramos a continuación.
98 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© RA-M a

3 .5 .1 Teorem a de Bayes

Observemos en primer lugar que la dependencia entre sucesos, aunque puede


conducir a modelos más complejos, tiene la contrapartida de dar la oportunidad
de aprender. Ilustrémoslo con el anterior ejemplo.
En el contexto de la llamada Estadística bayesiana, las probabilidades inicial­
mente estimadas reciben el nombre de probabilidades a priori. La estimación 0.9
propuesta por el director, constituye una probabilidad a priori. La utilización
de nueva información para modificar las probabilidades a priori conduce a las
probabilidades revisadas, que reciben el nombre de probabilidades a posteriori.
Planteamos de manera informal el Teorema de Bayes, escribiendo

P ( B ||| = P ( A p ^ ~ * P ( A I B)P(B)

(el signo oc indica proporcionalidad) de modo que P (B |A), probabilidad a pos­


teriori de B después de haber aprendido del suceso (nueva información) A es
proporcional a la probabilidad a priori P(B) del suceso B multiplicada por
P (A |B ), probabilidad de A supuesto conocido B. A P (A \B) se le conoce
como verosimilitud. Así, podemos escribir que

probabilidad a posteriori oc verosimilitud x probabilidad a priori

que permite recordar cómo es este teorema.


De una manera más formal, el Teorema de Bayes establece que si
es una partición de 0 (es decir, Bi fl Bj = 0 , Vt ^ j y Uj=1Bj = 0 ), entonces
dado cualquier suceso A

P(Bi\ A ) = K B g É É
E "= i p {A \Bj)P (Bj) ■

Ejemplo 3.6
Consideremos que en el almacén de una fábrica de filtros, cuya producción
es en la actualidad nula por estar de vacaciones, hay un lote de 500, cuya fabri­
cación fue deficiente debido a ciertos problemas no detectados, pero de los que
se conoce que hay un 60% defectuosos y el resto, un 40%, están correctos. Los
filtros se encuentran entremezclados dentro de un contenedor. Surge un pedido
urgente de un filtro de manera que habría que seleccionar un filtro correcto del
contenedor. La pregunta que nos planteamos es: ¿cuál es la probabilidad de que
el filtro seleccionado sea correcto? Parece obvio que, sin disponer de información
adicional, la probabiüdad será 0.4.
Supongamos, sin embargo, que es posible someter el filtro elegido a un sencillo
test de detección de defectos, no completamente fiable, de modo que si el filtro es
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 09

correcto hay una probabilidad 0.9 de que supere el test y 0.1 de que no lo supere.
Además, si este mismo test se le pasa a un filtro defectuoso, hay una probabilidad
igual a 0.2 de que el test indique que el filtro es correcto y 0.8 de que indique
defectuoso. Nos planteamos elegir un filtro del contenedor y someterlo al test.
¿Cuál será la probabilidad revisada de que el filtro resulte correcto si supera el
test?
En el árbol de probabilidad de la Figura 3.6 mostramos el proceso con sus
probabilidades. En particular, las dos ramas de la izquierda corresponden a los
sucesos con las probablidades a priori. Denominaremos a estos sucesos con Fc
(filtro correcto) y (filtro defectuoso). Así, las probabilidades a priori serán

P (Fc) = 0.4 y P (F d) = 0.6

y es claro que Fc y F¿ son mutuamente excluyentes (Fc fl F¿ = 0 ) y que

P(Fc UP<i) = l.

Sucesos Nueva información


Probabilidades Probabilidades Probabilidades
a priori condicionadas conjuntas

0 .4 x 0 .9 = 0.36

0.6 x 0.2 = 0.12

Figura 3.6: Árbol de probabilidad para el problema de filtros con cálculo de probabili­
dades por el Teorema de Bayes

Las ramas de la derecha representan la nueva información proporcionada por


el test y las probabilidades condicionadas de obtener esta información bajo cir­
cunstancias distintas. Si denominamos Ts al suceso superar el test (indica que el
filtro es correcto) y T¡ a fallarlo, tendremos las probabilidades condicionadas o
verosimilitudes

P (Superar el test |Filtro correcto) = P (Ti |Fc) — 0.9


ion FUNDAMENTOS d e l o s s is t e m a s d e a y u d a a l a d e c is ió n ____________© rvma

y análogamente

P (Tf |Fc) = 0.1, P (T, |Fd) = 0.2, P (T¡ \Fd) = 0.8.

Nuestro interés está en ver cómo se modifica la probabilidad a priori P (Fc) = 0.4
a la luz de la información proporcionada por la aplicación del test. Por tanto,
debemos calcular la probabilidad a posteriori P (F C |Ts), para lo que aplicamos
el Teorema de Bayes. Tenemos

P (F \ T \ - P (T a \Fc) P ( F c)
' ' c| P {T s \Fc) P ( F c) + P (T ,\ F d) P { F d)

= -------- 0,9 - °~4-------- --- 0.75.


0.9 x 0.4 + 0.2 x 0.6
Así, el resultado del test, aunque no es completamente fiable, ha llevado a revisar
la probabilidad de que el filtro sea.correcto pasando de 0.4 a 0.75. □

3 .5 .2 Efecto sobre la revisión de los juicios probabilísticos

Un aspecto interesante se refiere a la posible influencia que pueden tener las


probabilidades a priori y la nueva información disponible, sobre las probabilidades
a posteriori obtenidas de la aplicación del Teorema de Bayes. Planteamos el
siguiente ejemplo referido a un ingeniero de minas que tiene encomendada la tarea
de buscar aguas subterráneas para una localidad con importantes problemas de
sequía. Localizado un posible lugar, se le pide que, basándose en estudios previos,
proporcione una estimación de la probabilidad de encontrar agua. Una vez hecha
tal estimación, el ingeniero recibe nueva información proveniente de sus estudios
adicionales.
Si consideramos inicialmente la situación en que el ingeniero está muy poco
seguro de sí mismo, entonces una asignación razonable de probabilidades sería 0.5
para el suceso “hay agua” en el lugax indicado y también 0.5 para el complemen­
tario, es decir, “no hay agua” . Tal distribución a priori se denominaría vaga, ya
que cualquier otra distribución de probabilidad conllevaría que el ingeniero tiene
una mínima confianza como para comprometerse en una de ambas direcciones.
Parece claro que cuanto más próxima a 1 fuera la probabilidad de uno de los dos
sucesos mayor seguridad y confianza tendría en su predicción.
Supongamos ahora que el ingeniero recibe nueva información, relativa a la
realización de pruebas posteriores, que considera bastante fiables, lo que se tra­
duce en que sea 0.9 la probabilidad de que indiquen que hay agua si realmente
la hay, o dicho de otra forma, que la fiabilidad de las pruebas sea de un 90%-
Veamos cómo quedarían modificadas las probabilidades a priori si las pruebas
resultaran favorables. Obsérvese en primer lugar que la probabilidad de quo las
pruebas conduzcan a un resultado erróneo será de 0.1. Bajo la suposición de que
las pruebas que se han realizado son insesgadas, es decir, es igualmente verosímil
© RA-MA _________________CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 101

que erróneamente indiquen la existencia de agua cuando no la haya, que errónea­


mente indiquen la ausencia de agua cuando realmente la haya, vamos a calcular
las probabilidades a posteriori. Se tiene que

P (Hay agua |Pruebas favorables) =

_ ___________ _______ P(Pruebas fav.lHay agua)P(Hay agua)


/'(Pruebas fav.|Hay agua)P(Hay agua)-fP(Pniebas fav.|No hay agua)P(No hay agua)

I B ! -oo
0.9 x 0.5 + 0.1 x 0.5

y análogamente se obtiene que .

P (No hay agua |Pruebas favorables) = 0.1.

El árbol de probabilidad de la Figura 3.7 muestra también los cálculos de las


probabilidades a posteriori. Hay que observar que las probabilidades a posteriori
coinciden con las de las pruebas (verosimilitudes), lo que resulta razonable, ya
que al ser las probabilidades a priori vagas, sólo tiene influencia en el resultado
la información adicional considerada a través de las verosimilitudes.
Sucesos Nueva información

Probabilidades Probabilidades Probabilidades Probabilidades


apriori condicionadas conjuntas aposteriori

0.5 x 0.9 ■ 0.45 °-45 _ 0.9


0.50

0.5x0.1=0,05 0.05
0.50

2-1

Figura 3.7: Árbol de probabilidad mostrando el efecto sobre probabilidades a priori


vagas de información nueva muy fiable

En la Figura 3.8 se muestra una representación gráfica de la relación entre la


distribución de probabilidad a priori y la fiabilidad que proporciona la información
adicional. Se muestra en el eje de abscisas la probabilidad a priori del suceso “hay
agua” y en el eje de ordenadas su probabilidad a posteriori si las pruebas han
resultado favorables a la existencia de agua. Obsérvese que si la probabilidad de
102 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-M a

que la prueba fuera favorable si hay agua es 0.5 (fiabilidad de un 50%), entonces
tal resultado no influirá sobre las probabilidades a posteriori, que coincidirán con
las a priori, tal como lo indica la diagonal de la figura.

Probabilidad a priori de "hay agua"

Figura 3.8: Representación gráfica del efecto de la fiabilidad de nueva información sobre
las probabilidades a priori

Por otra parte, si por ejemplo la probabilidad a priori de haber agua fuera 0.6 y
la probabilidad de que las pruebas fueran favorables 0.75 si hay agua (fiabilidad de
un 75%), entonces la probabilidad a posteriori será aproximadamente de 0.82 (ver
línea de puntos en la figura). Así, considerando la distancia de la diagonal a las
curvas que están por encima, se puede ver que cuanto más fiable sea la información
adicional, mayor modificación sufren las probabilidades a priori. También, fijado
un nivel de fiabilidad de las pruebas, tal modificación será relativamente pequeña
tanto en el caso de que la probabilidad a priori sea alta, implicando en tal caso que
el ingeniero tiene gran confianza en que encontrará agua y las pruebas confirman
su creencia, como en el caso de que la probabilidad a priori sea muy pequeña
implicando una fuerte desconfianza en que no hallará agua. La influencia de las
pruebas en estos casos extremos de probabilidades a priori es por tanto mínima
sobre las a posteriori.
Finalmente, es interesante observar que si la información adicional lleva aso­
ciada una fiabilidad inferior a 0.5 también su resultado puede ser de interés, y
cuanto más baja sea tal cantidad mayor efecto tendrá sobre las probabilidades a
priori.
© RA-MA CAPÍTULO 3; INCERTIDUMBRE Y SU MODELIZACIÓN 103

3.6 EDUCCIÓN DE PROBABILIDADES

Se ha demostrado que en el proceso de estimación de probabilidades, los indi­


viduos prefieren en general pensar en términos de frecuencias relativas con que
ocurren los sucesos que en términos de probabilidades. Sin embargo, no siempre
será posible asignar frecuencias a un suceso, ya que puede ocurrir que no se haya
dado en el pasado y ni siquiera para sucesos análogos. En tales casos, como ya
hemos apuntado en anteriores secciones, hay que recurrir a la probabilidad sub­
jetiva que proporcionará una medida concisa y no ambigua de cuantificación de
la incertidumbre de sucesos, siendo por ello un elemento importante en los pro­
blemas de decisión. Se han propuesto distintos procedimientos para la educción
o asignación de probabilidades y en esta sécción estudiamos algunos de ellos, que
incluso pueden tener su utilidad aún en él caso de disponer de frecuencias pasadas
para un suceso.

3.6.1 M étodos de asignación

La tarea de asignación de probabilidades no es sencilla, por lo que hay una necesi­


dad de desarrollar métodos rigurosos y sistemáticos para medir la incertidumbre
pues en la mayoría de los problemas de decisión no es conveniente realizar la
asignación de una manera informal. Por su complejidad e importancia tales pro­
blemas requieren asignaciones probabilísticas cuidadosas y formales. Son varios
los métodos que se han propuesto para asignar probabilidades. Esencialmente
se dividen en dos grupos: los que demandan un respuesta directa por parte del
decisor en forma de una probabilidad o una cantidad y los que infieren las proba­
bilidades de forma indirecta a partir de comparaciones de apuestas. Estudiamos a
continuación algunos de ellos. Una referencia bastante detallada sobre este tema
es el libro de Morgan y Henrion (1990).

M étodos de asignación de probabilidades discretas

Describimos los tres métodos que son los más utilizados y conocidos.

A signación directa. Consiste en plantear directamente al decisor una pregun­


ta relativa a la asignación de la probabilidad del suceso en cuestión. Un ejemplo
sería: ¿cuál es la probabilidad de que el nivel de beneficios de un producto en el
periodo actual supere al obtenido en el anterior? Parece claro que dar una res­
puesta a una cuestión como la planteada no resultará en general cómodo sin una
adecuada y meditada reflexión. La respuesta del individuo deberá ser un número
en el intervalo [0,1], Este procedimiento so considera excesivamente simple y la
confianza en las respuestas dadas puedo sor bastante discutible.
104 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

A signación basada en apuestas. Este método consiste en plantear al decisor


apuestas que le motiven a participar en ellas. La idea subyacente consiste en
llegar a encontrar una determinada cantidad monetaria tal que al decisor le resulte
indiferente ganarla o perderla independientemente de en qué lado de la apuesta se
sitúe. La determinación de tal cantidad se puede llevar a cabo de manera directa
ofreciendo al individuo inicialmente una apuesta que le resulte bastante favorable
para a continuación mostrarle otra que le resulte desfavorable e ir gradualmente
ajustando la cantidad hasta alcanzar la indiferencia buscada. Entonces, el valor
esperado de las apuestas será el mismo independientemente de la elección que
haga, lo que proporcionará el valor de la probabilidad buscada. Ilustrémoslo con
un ejemplo.

E jem plo 3.7


Consideremos que el Real Madrid va a jugar la final de la Copa de Europa
contra el Barcelona y estamos interesados en determinar la probabilidad de que
la gane el Real Madrid. Al decisor se le plantearían las dos apuestas siguientes:
Apuesta 1 Ganar x euros si vence el R. Madrid
Perder y euros si pierde el R. Madrid

Apuesta 2 Perder x euros si vence el R. Madrid


Ganar y euros si pierde el R. Madrid
donde x e y son las cantidades que el decisor está dispuesto a apostar y que se
llevaría el ganador. Obsérvese que las apuestas son simétricas tal como se muestra
gráficamente en el árbol de la Figura 3.9, en que A representa el suceso “Gana el
R. Madrid” y Ac que pierde.

Figura 3.9: Árbol representativo del método de la apuesta

Si el decisor se siente indiferente entre ambas apuestas entonces en su mente los


valores esperados (promedio de las ganancias o pérdidas por las probabilidades)
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 105

deberían ser iguales, es decir,

x P (Á ) + ( - y ) P (A c) = ( - * ) P (A ) + y P (A c) .

Despejando la probabilidad P (A ), teniendo en cuenta que P (A c) = l - P ( A ) ,


se obtiene inmediatamente que

P {A ) i -I?— ,
x + y

Si en un caso concreto fuera x = 62 euros e y = 90 euros, entonces la probar


bilidad subjetiva de que gane el Real Madrid sería 90/(62 + 90) = 0.59.

A s ig n a c ió n basada en lotería s. El tercer enfoque consiste en comparar dos


loterías cada una de las cuales puede proporcionar un premio T u otro W. Por
conveniencia se supone que un premio es preferido al otro, por ejemplo supon­
gamos que sea T preferido a W (el premio T podría ser un fin de semana en
Londres, mientras que el W un bono para conciertos). Suponiendo el mismo
suceso de interés A del Ejemplo 3.7, el procedimiento consistiría en pedirle al
decisor que compare la lotería

Gana el premio T si vence el Real Madrid


Gana el premio W si pierde el Real Madrid

con la lotería

Gana el premio T con probabilidad p conocida


Gana el premio W con probabilidad 1 —p

cuya representación gráfica en forma de árbol se muestra en la Figura 3.10.

Figura 3.10: Árbol representativo para el método de lns loterías

La segunda lotería so denomina lotería de referencia, y para olla so han cons­


truido algunos mecanismos como la rueda de la probabilidad o urnas que pormiten
106 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© R A -M a

una buena especificación de la probabilidad buscada, haciendo así más fácil las
respuestas del decisor.
La idea del procedimiento consiste en proponer un valor concreto inicial de la
probabilidad p para la lotería de referencia e ir ajustando tal probabilidad hasta
que el decisor se sienta indiferente entre ambas loterías, es decir, que no sienta
preferencia por ninguna de las dos, ya que un pequeño cambio en p convertiría a
una de ellas en más favorable. Así, cuando alcance un valor de indiferencia para
p, ésa será la probabilidad buscada, en este caso la correspondiente al suceso que
gane el Real Madrid.
Hemos indicado la conveniencia de mecanismos para facilitar la especificación
de la probabilidad y el primero que se ha citado es la denominada rueda de la
probabilidad o de la fortuna, que es un dispositivo como el que se muestra en la
Figura 3.11. Consiste en un disco dividido en dos sectores con diferentes colores
(por ejemplo, blanco y negro) cuyo tamaño puede ajustarse, y con un puntero
que puede girar libremente. El funcionamiento de este artificio es. el siguiente;
consideremos a nuestro decisor que desea estimar la probabilidad de que gane
el Real Madrid. Ajustaríamos la rueda de modo que, por ejemplo, inicialmente
el sector negro ocupe el 40% (probabilidad p) del área del disco y el blanco el
restante (probabilidad 1 —p). Entonces pediríamos al decisor que eligiera una de
las dos hipotéticas loterías:

L otería 1: Si vence el Real Madrid usted ganará el premio T. Si pierde,


entonces ganará el premio W .

L otería 2: Si empujando al puntero para que gire sobre el disco, éste se


para sobre el sector negro, entonces usted ganará el premio T, mientras que si el
puntero cae sobre el sector blanco, entonces ganará el premio W .

Figura 3.11: Rueda de la probabilidad con 40% de sector negro y 60% blanco

Si el decisor decide que prefiere la lotería 1, esto implicaría que piensa que la
probabilidad de que gane el Real Madrid es superior al 40%. Se debería aumentar
el área del sector negro y plantearle la pregunta de nuevo al decisor. Reiterando
el procedimiento, eventualmente se alcanzaría un sector para el cual el decisor
se sentiría indiferente entre ambas apuestas y que proporcionaría la probabilidad
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 107

buscada. Si por ejemplo, esto ocurre para un sector negro que ocupe un 59%
de la rueda, entonces la probabilidad asignada sería 0.59. En el caso de varios
sucesos incompatibles A i, ..., An, se podría aplicar el método primero a A\, luego
a A 2, etc., y posteriormente reajustar las probabilidades asignadas para que la
suma sea 1 .
Obsérvese que este procedimiento se clasifica como de asignación indirecta,
ya que las estimaciones se obtienen sin pedirle directamente al decisor que las
proponga. Una ventaja de la rueda de la probabilidad es que da al decisor la
posibilidad de visualizar la probabilidad de que ocurra el suceso y evita el sesgo
que puede ocurrir por utilizar sólo probabilidades enteras (como 0. 1 , 0.2...), pues
la rueda da cualquier valor entre 0 y 1. Una objeción a su utilización se tiene
cuandó se pretende utilizar para estimar probabilidades de sucesos con muy alta o
baja posibilidad de que ocurran, ya qué la diferenciación entre sectores pequeños
se hará difícil.
Aunque este dispositivo es el más conocido y utilizado para educción de pro­
babilidades, también se han propuesto otros dispositivos alternativos, ya que lo
que realmente se necesita es la existencia de un experimento de referencia con
una distribución cualitativamente uniforme. Así otro de ellos, también citado
antes, consiste en utilizar una urna con una cierta cantidad (10 ó 100 ó 1000...)
de bolas de dos colores diferentes y plantear las apuestas en forma análoga a las
anteriores, modificando la composición de la urna hasta alcanzar el equilibrio y
disponer así de la probabilidad asignada. Este procedimiento tiene su origen en
el llamado método de la apuesta indicado por Savage (1954), pero que aquí se ha
complementado con el artilugio que supone utilizar una rueda de probabilidad.

M é tod os de asignación de probabilidades sobre cantidades continuas

Hemos considerado en el apartado anterior procedimientos para asignar proba­


bilidades individuales y vamos a ver aquí cómo podemos utilizarlos para la asig­
nación de probabilidades en el caso continuo. La estrategia global consiste en
utilizar los métodos anteriores para asignar algunas probabilidades acumuladas,
dibujarlas en un gráfico con los valores de la variable en el eje de abscisas y
las probabilidades en el de ordenadas, y luego ajustarles una función (de dis­
tribución) . Tkmbién podemos utilizar el procedimiento inverso, es decir, escoger
algunas probabilidades acumuladas sobre el eje vertical y encontrar los valores
de la variable asociados con ellas sobre el eje horizontal. En este último caso se
suele comenzar por los percentiles 5 y 95, luego los cuartiles 1 y 3, y finalmente,
la mediana.

E jem plo 3.8


Como ilustración del segundo enfoque vamos a considerar una empresa que
desea conocer la distribución de probabilidad de la demanda como una variable
para el próximo periodo. Supongamos quo el experto de la empresa establece,
108 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© R a -m a

basándose en procedimientos de asignación de probabilidades discretas, las s¡


guientes afirmaciones:

El percentil 0.05 es 1000 unidades


El percentil 0.95 es 9000 unidades
El cuartil 1 es 3500 unidades
El cuartil 3 es 6800 unidades
La mediana es 4600 unidades

Obsérvese que el haber propuesto que el cuartil 1 sea 3500 unidades significa
que hay una probabilidad 0.25 de que la demanda sea igual o inferior a esa canti­
dad. Que la mediana sea 4600 unidades significa que es igualmente probable que
la demanda esté por encima que por debajo de la cantidad indicada. Los puntos
y el posterior ajuste de la correspondiente función de distribución se muestran en
la Figura 3.12.

Figura 3.12: Asignación subjetiva de una función de distribución para la demanda de


un producto

O tros m étodos

Tomando como base las propuestas globales anteriores, se han desarrollado al­
gunos otros procedimientos que intentan mejorar el proceso de asignación como
el método de la probabilidad o el de alturas relativas, que describimos a conti­
nuación.

M éto d o de la probabilidad. El procedimiento denominado método de la pro­


babilidad, propuesto por St&el von Holstein y Matheson (1979), trata de superar
el inconveniente de que los individuos tienden a tener exceso de confianza en los
juicios cuando asignan una distribución de probabilidad. En general esto puede
■ i H A -M A CAPITULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 109

londucir a iisuinir por parto del decisor que los recorridos donde se sitúen los
liferentes sucesos o cantidades inciertas sean muy reducidos. De hecho, si a
|m individuo se le pregunta inicialmente por la mediana de la distribución, su
espuesta puede suponer un importante anclaje para el resto de las asignaciones.
Este método permite superar la tendencia apuntada. Los pasos para su aplicación
pon los siguientes:

1 . Establecer los valores extremos o recorrido de valores de la variable dentro


de los cuales el decisor considera que está la incertidumbre.

2. Pedir al decisor que imagine escenarios que podrían conducir al verdadero


valor situándose fuera del recorrido.

3. Actualizar el recorrido, si procede, a la vista de las respuestas del paso


anterior.

Dividir el recorrido en 6 ó 7 intervalos de aproximadamente la misma am­


plitud.

5. Preguntar al decisor por la distribución de probabilidad acumulada (función


de distribución) en cada intervalo.

6. Ajustar a mano una curva que pase a través de los puntos asignados.

7. Llevar a cabo contrastes sobre los resultados obtenidos de la forma siguiente:

(a) Dividir el recorrido en tres intervalos con igual probabilidad y averiguar


si el decisor se sentiría igualmente satisfecho de emplazar una apuesta
sobre la cantidad incierta que cae en el intervalo. Si no es así, se deben
hacer las correspondientes revisiones a la distribución.
(b) Contrastar la moda de la distribución educida. Así, por ejemplo, si
la distribución de probabilidad asignada tiene una única moda (esto
podría reconocerse examinando la función de distribución y compro­
bando si no tiene más de un punto de inflexión), preguntar al decisor
si su única mejor conjetura es el valor que deberá tomar la cantidad
incierta. Revisar de nuevo la distribución si fuera necesario.
(c) Contrastar si es igualmente probable estar dentro y fuera del intervalo
intercuartílico asignado, etc.

M é to d o de las alturas relativas. Otro procedimiento que podría set d# utili­


dad en la educción do una distribución do probabilidad discreta o do una función
de densidad do probabilidad oh ul vModo de his ft/tunu tWiiftvtu. Consiste en
pedirle ul decisor quo identifique on ol recorrido do la varialde aquellos valores
que se consideran más verosímiles y dibujar una línea vertical sobre ellos con
longitud igual a su posible verosimilitud o valoración de la probabilidad que se
110 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© RA-M a

le asignaría. Así, líneas más cortas indicarán valores con menor verosimilitud v
más largas conllevarán una asignación mayor.

Ejemplo 3.9
Consideremos como ejemplo ilustrativo de asignación de una distribución de
probabilidad discreta el correspondiente al Departamento de Urgencias de un
hospital al que se le ha pedido que especifique la distribución de probabilidad del
número de llamadas que recibe durante un domingo. Actuando como decisor el
Jefe de Guardia del hospital, establece que el número de llamadas más verosímil
es 5. El analista dibuja en el gráfico sobre el valor 5 una barra de longitud igual
a 100, ver Figura 3.13.

100

8 75
i
5 50

25

0 1 2 3 4 5 6 7 8 9 10
Número de llamadas al Servicio de Guardia en un domingo

Figura 3.13: Ilustración del método de las alturas relativas

Continuando con el proceso de educción el Jefe de Guardia revela a continua­


ción al analista que el valor 4 es aproximadamente un 80% de verosímil que el
valor 5, por lo que el analista coloca sobre el valor 4 una barra de longitud 80. El
resto de líneas se obtendrían en forma análoga. Si el Jefe de Guardia dice que es
muy improbable que puedan darse más de 10 llamadas, no se construirán líneas
sobre los valores mayores que 10. Además, para obtener las probabilidades de
cada uno de los valores se normalizarían de modo que sumen la unidad. La Tabla
3.5 muestra las longitudes de las líneas correspondientes a las alturas asignadas,
así como las probabilidades de cada uno de los valores de la variable número de
llamadas.
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 111

Tabla 3.5: Ilustración, del método de las alturas relativas

Número de Longitud de Probabilidad


llamadas la línea
0 5 5/400 = 0.0125
1 10 10/400 = 0.025
2 30 30/400 = 0.075
3 50 50/400 = 0.125
4 90 90/400 = 0.225
5 100 100/400 = 0.250
6 60 60/400 = 0.150
7 30 30/400 = 0.075
8 15 15/400 = 0.0375
9 5 5/400 = 0.0125
10 5 5/400 = 0.0125
M
£»
O
O
II


Como hemos indicado, este método de las alturas relativas también se puede
utilizar para asignar funciones de densidad de probabilidad para las distribuciones
continuas. En tal caso, el analista deberá educir la probabilidad acumulada de
algunos intervalos del recorrido de la variable y luego ajustar una curva a los
puntos superiores de las líneas de altura, que constituirá la función de distribución
de donde podrá deducirse la de densidad.

M é to d o de Raiffa-Schlaifer. Finalmente, dentro de este enfoque de dibujo


de gráficos, indicamos un último método denominado de Raiffa-Schlaifer, ya que
fueron estos autores los introductores, Raiffa y Schlaifer (1961), y en el que se
suponen los siguientes pasos: 1) el decisor conoce la moda de la distribución, o
si no fuera así, el analista le pide que proporcione tal valor modal; 2) se supone
que casi toda la distribución de probabilidad está concentrada en un intervalo
de amplitud pequeña alrededor del valor modal; y 3) la probabilidad de que la
variable esté fuera de tal intervalo es pequeña. Con esta información se espera
dibujar de forma aproximada la función de densidad de probabilidad.

Descomposición y asignación de probabilidades

Otra idea que finalmente planteamos como ayuda del proceso de asignación de
probabilidades es la descomposición y que se apoya en la idea de pensar en el
suceso de interés no aisladamente sino relacionado con otros sucesos. Planteare­
mos la descomposición con el siguiente ejemplo: consideremos una empresa que
112 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© R A-M A

tiene en bolsa una cantidad importante de acciones y desea estimar la probabili­


dad de que se incremente su precio. Entonces, en lugar de considerar las acciones
aisladamente se podría pensar en su relación con el mercado global, sobre el que
se podría obtener información probabilística a partir del índice del mercado de
valores y pensar en asignar probabilidades a las acciones pero condicionadas por
las posibles tendencias del mercado. Así, si suponemos que el mercado puede
subir o bajar, la obtención de la probabilidad de que los precios de las acciones
suban se podría descomponer de la forma:

P (Subida de los precios de las acciones) =


= P(Subida de los precios de las acciones |Subida del mercado)
x P (Subida del mercado) +
H-P (Subida dé los precios de las acciones |Bajada del mercado)
x P (Bajada del mercado)

La razón para considerar esta descomposición se encuentra en el hecho de que


podría ser más sencillo asignar probabilidades condicionadas y las probabilidades
de posibles movimientos del mercado que la asignación directa de la subida de los
precios de las acciones. En términos de árboles de probabilidad se estaría pasando
de un árbol con un único nodo a otro árbol con tres nodos, tal como se muestra
en la Figura 3.14. En Ciernen (1996) se exponen otras posibles descomposiciones.
El caso de sucesos raros se analizará en la Sección 3.6.5.
Asignación original A signación p o r d escom posición
Subida de precios

de acciones

Figura 3.14: Arboles de probabilidad para la descomposición de la variación del precio


de las acciones

3 .6 .2 H e u r ís tic a s y sesgos

El origen del estudio de la calidad de los juicios humanos en la educción de prob­


abilidades está en el trabajo pionero de Tversky y Kahneman (1974), en el que
H RA-MA CAPITULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 113

■ecogen sus experiencias de laboratorio de varios años de trabajo, El aspecto


básico de sus teorías es que el ser humano utiliza heurísticas o reglas empíricas
jen la asignación de probabilidades y aunque tales heurísticas pueden llegar a pro­
porcionar buenas estimaciones, reduciendo además el esfuerzo necesario para la
completación del proceso, también pueden conducir a juicios sistemáticamente
Nesgados. Tversky y Kahneman identifican varias heurísticas, siendo las princi­
pales las siguientes:

1 . Heurística de disponibilidad. La heurística de disponibilidad para juzgar la


probabilidad de ocurrencia de un suceso se apoya en el recuerdo de sucesos
similares al que se está juzgando. Así, los sucesos que han sido recientes,
que han producido cierta impresión o impacto, muy difundidos por medios
de comunicación, etc., son rápidamente recordados o imaginados y de aquí
que se le asignen probabilidades altas. Por el contrario, los sucesos que
están menos disponibles en la mente tenderán a recibir probabilidades más
bajas.
La idea de disponibilidad puede proporcionar una heurística fiable, ya que
los sucesos que se dan con mayor frecuencia serán más fáciles de recordar
y de aquí que las probabilidades estimadas para ellos deberían ser más fia­
bles. En muchas ocasiones, sin embargo, no se debe relacionar la facilidad
de recordar o imaginar un cierto suceso con la verdadera probabilidad de
que ocurra éste, ya que esto podría llevar a estimaciones sesgadas.

2. Heurística de representatividad. La heurística de representatividad surge


cuando hay que asignar la probabilidad de que un objeto, persona o suceso
pertenezca a una determinada categoría dentro de una clasificación o que
tal suceso se haya originado a partir de un cierto proceso. Basándose en
esta heurística, el individuo proporcionará juicios a partir de la respuesta a
la pregunta de cuán representativa es la persona, objeto o suceso de la ca­
tegoría o proceso en cuestión, comparándola con el estereotipo que se tenga
de la categoría. A mayor similaridad, mayor probabilidad de pertenencia a
la categoría.
Los sesgos que se pueden producir a partir de esta heurística son debidos a
varias causas. Entre ellas se encuentra la tendencia a ignorar lo que Tversky
y Kahneman denominan de tasas base de ocurrencia, que se refiere al hecho
de que si se sabe que en un conjunto de objetos o individuos hay un deter­
minado porcentaje de una cierta categoría y se le pregunta a un individuo
que posee esta información, cuál será la probabilidad de que un objeto en
particular pertenezca a la citada clase, entonces el individuo tiende a ig­
norar esa información conocida. Es decir, tendemos a olvidar el número
de personas que hay en cada categoría y si son o no muy probables. Otra
causa entre las varias que se han estudiado, es la esperanza de que el azar
autocorrija un proceso aleatorio, típicamente representado en los sorteos de
loterías, en que puede ocurrir que individuos busquen cifras o números que
114 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-Ma

no han aparecido durante un largo periodo de tiempo pensando que tales


números deben tener mayor probabilidad de aparecer en el siguiente sorteo.
Sin embargo, los sorteos de lotería no tienen memoria, no existiendo razón
alguna para que se “corrija” la sucesión previa de resultados.
Otro sesgo que produce es la insensibilidad al tamaño muestral: la llamada
“ley de los pequeños números" que algunas veces extrae conclusiones de
muestras pequeñas, aunque estén sujetas a más errores estadísticos que las
muestras grandes.

3. Heurística de anclaje y ajuste. Existen juicios de estimación de valores re­


lativos a situaciones como, por ejemplo, cuál será el nivel de ventas al final
de esta temporada o la. asistencia de personas a un determinado evento.
Usualmente tales estimaciones comienzan con la propuesta de un valor ini­
cial que posteriormente se ajusta hasta considerar una estimación final. El
valor inicial en nuestros ejemplos podría ser, cuál fue el nivel de ventas en
la temporada pasada o cuántas personas asistieron el pasado fin de semana
al evento. Se ha comprobado que la consideración de tales valores iniciales
y su posterior ajuste, suelen ser insuficientes para obtener una estimación
aceptable y esto es lo que se conoce como heurística de anclaje y ajuste.
Las causas encuadradas en esta heurística que pueden conducir a sesgos
también pueden ser varias. Así, se podría producir un ajuste insuficiente
en las probabilidades debido principalmente a no tener en cuenta de modo
adecuado las condiciones futuras. También se puede achacar a la sobreesti­
mación de probabilidades en sucesos que ocurren simultáneamente debido,
posiblemente, a que los individuos se anclan en la probabilidad de uno de
los sucesos individuales y a partir de aquí el ajuste es insuficiente. La
situación en cierto modo inversa también es posible, es decir, la subesti­
mación de probabilidades en sucesos disjuntos, siendo el problema análogo
debido a la tendencia de anclarse el individuo en la probabilidad de uno
de los sucesos individuales produciendo ello una tendencia a subestimar la
probabilidad. Esta causa es especialmente común en la estimación de ries­
gos, ya que suelen implicar educción de probabilidades de sucesos disjuntos,
con la aparición del consiguiente sesgo en la estimación. Finalmente, una
cuarta causa debida a esta heurística es el exceso de confianza. Puede darse
en las situaciones en que se le pide a un individuo que en vez de propor­
cionar una estimación basada en un único número, lo haga en un recorrido
o intervalo de probabilidad para un suceso, obteniendo lo que se denominan
probabilidades imprecisas. En los estudios llevados a cabo por Lichtenstein,
Fischhoff y Phillips (1982), se sugiere que los recorridos estimados son en
general de amplitud bastante reducida, es decir, que los individuos tienden
a mostrar sobreconfianza sobre la probabilidad de que su intervalo estimado
incluya al verdadero valor o valor preciso de la probabilidad.
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 115

Alternativamente, la estimación de probabilidades imprecisas en vez de va­


lores únicos tiene sus ventajas al ser mucho menos exigente el proceso de
educción y poder guardar los intervalos estimados para un posterior análisis
de sensibilidad del correspondiente modelo, ver Capítulo 8. En Ríos Insua
et al. (2000) o en Bielza et al. (2000a) pueden verse ejemplos de ello.

Existen algunos otros sesgos en la educción de probabilidades que han estu­


diado autores como Hogarth y Makridakis (1981) o Plous (1993), entre otros.
Obsérvese también que aunque se han llevado a cabo gran cantidad de trabajos
experimentales sobre el problema de sesgos en los juicios humanos para estimación
de probabilidades, dando la impresión de que el individuo muestra numerosas de­
ficiencias en el proceso, sin embargo en los últimos años se ha cuestionado gran
parte del trabajo existiendo en la actualidad una cierta controversia. En ese
sentido las críticas se han dirigido al hecho de que la mayoría de los experimen­
tos psicológicos se han llevado a cabo en laboratorios y no sobre problemas de
decisión reales, donde seguramente la motivación sería mucho mayor y con re­
sultados más fiables. Algunas referencias que tratan estos problemas son Payne,
Bettman y Johnson (1993) y Sanders y Manrodt (1994). De cualquier forma
podemos señalar que la educción es más un arte que una ciencia, y es difícil
identificar los sesgos y ayudar al decisor a evitarlos.

3.6.3 Preparación para la educción

Según Spetzler y Stáel von Holstein (1975) las técnicas de educción de proba­
bilidades tienen una mayor eficacia cuando son conducidas por un analista de
decisiones que las utiliza como parte del proceso de entrevista con el decisor. Una
preparación previa detallada de la encuesta es importante, ya que de esta forma se
reducirá el riesgo de introducción de sesgos en la educción. Como recomendación
para la preparación del proceso de educción los anteriores autores sugieren tres
fases que, brevemente, describimos a continuación:

1. Motivación. Ésta es la fase incial en la que el analista introducirá al decisor


en la tarea de asignación de probabilidades, tratando de hacerle comprender
su importancia y propósito. Además, el analista deberá investigar si existe
en el comportamiento del decisor deseos de introducir sesgos deliberadamen­
te, tal vez para beneficiarse personalmente de ciertos aspectos del problema
(si existen incentivos o está en juego el prestigio), lo cual no es deseable.

2. Estructuración. El objetivo de esta segunda fase es clarificar, definir y es­


tructurar aquellas cantidades o variables que hay que asignar. También
será conveniente determinar las escalas de medida asociadas a las variables
con las cuales el decisor se encuentre más cómodo para emitir juicios. Si
el decisor piensa que la cantidad a estimar depende de otras, una ayuda
podría ser descomponer el proceso de asignación tal vez utilizando un árbol
116 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

de probabilidad. Por ejemplo, la implementación de una nueva herramien­


ta puede depender de si varias compañías de software están de acuerdo en
colaborar para el desarrollo básico. En tal situación un decisor encontraría
que es más sencillo proponer estimaciones individualmente, es decir, basán­
dose en el número de empresas que estuvieran de acuerdo en colaborar.

3. Condicionamiento. En esta última fase se pretenden identificar los sesgos


que pudieran distorsionar los juicios del decisor, para así evitarlos en la
asignación. Es conveniente una exploración para ver cómo enfoca el decisor
su emisión de las probabilidades y así evitar inconvenientes como los cita­
dos anteriormente de anclaje y otros, consecuencia de las heurísticas que
producen los sesgos.

En la práctica, la asignación de probabilidades no es nada sencilla y suele


llevar un tiempo antes de adquirir soltura y seguridad en las asignaciones. Como
indican Shephard y Kirkwood (1994), se suele emplear una media de dos horas
para asignar sólo una distribución de probabilidad. La experiencia confirma que
cuanto más confian los decisores en la importancia de cuantificar sus juicios, con
mayor fuerza aceptan los métodos de codificación y más rápidamente se adaptan
a su uso. Incluso entonces tendemos a utilizar las heurísticas indicadas.
Un poceso de educción recomendado es el SRI (Stanford Research Institute)
desarrollado por Spetzler y Stáel von Holstein a mediados de la década de los
años setenta, ver por ejemplo Stáel von Holstein y Matheson (1979), que consiste
en cinco fases. Las tres primeras coinciden con las indicadas anteriormente, mien­
tras que las dos siguientes son la codificación y la verificación que describimos a
continuación.
En la codificación sus autores dan énfasis al comienzo de la educción utilizando
valores extremos en las preguntas con el objetivo de neutralizar posibles sesgos
y recomiendan el uso de la rueda de la probabilidad. También recomiendan la
utilización de diferentes formatos para plantear las mismas preguntas al decisor,
produciéndose así una recopilación de información redundante que puede resultar
clave en el proceso. Una detallada especificación de los juicios con frecuencia
podría llevar a inconsistencias y como resultado, tras su revisión, a una mejora
en los juicios globales. Otro punto importante que tiene que tener en cuenta el
analista es que debe estar especialmente atento a los cambios que pueda proponer
el decisor en sus respuestas al recordar alguna nueva información. Si fuera éste
el caso, deberá discutirse tal información, y si se considerara válida, revisar y
cambiar las respuestas previas.
La quinta y última fase es la verificación, que consiste en contrastar si los
juicios cuantitativos que ha dado el decisor en sus respuestas reflejan de modo
adecuado sus creencias. Esto se puede llevar a cabo en distintas formas. En
todo caso los resultados se podrían dibujar como funciones de distribución o de
densidad y discutir con el decisor su adecuación a partir de preguntas conro.
@ RA-MA_____________________ CAPITULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 117

| ¿basaría su decisión en la distribución obtenida? o ¿apostaría su dinero en un


juego de azar basándose en la distribución obtenida? También se deberían repetir
algunas de las preguntas utilizadas en la educción.
En definitiva, este protocolo y otros alternativos que se han propuesto, Wat-
I son y Buede (1987), conducen a determinar el conocimiento del experto de una
I forma más exacta que otros métodos usados comúnmente en la adquisición de
I conocimiento para sistemas expertos.

I 3.6.4 Comparación de métodos. Consistencia y coherencia

Hemos revisado varios métodos de educción de probabilidades y la cuestión que


nos podríamos preguntar és si alguno de estos métodos es mejor que los demás.
Aunque se han llevado a cabo diferentes trabajos experimentales para su com­
paración, no hay una conclusión definitiva que favorezca a algún método. Cier­
tos enfoques parecen más recomendables dependiendo del tipo de decisor y del
problema en cuestión. Unos decisores se sentirán más cómodos utilizando asig­
nación directa, mientras que otros preferirán un enfoque indirecto. 0 bien para
unos decisores puede resultar apropiado utilizar una rueda de probabilidad y para
otros urnas con bolas. En todo caso, ya que la aproximación que proporcionan
es en general pobre, hay una recomendación clara en el sentido de utilizar varios
métodos diferentes en el proceso de educción pensando también en contrastar
la consistencia de los juicios. Tal consistencia se refiere a la comprobación por
parte del analista de que las asignaciones obtenidas mediante distintos métodos
o enfoques son firmes, en el sentido de que todas conducen a las mismas o muy
parecidas estimaciones. Puede ser útil preguntar lo mismo de diferentes formas.
Si hemos asignado varias probabilidades interrelacionadas, deberán ser consis­
tentes, y su reconsideración y modificación forma parte de la verificación de las
asignaciones.
Por tanto, la consistencia parece un aspecto crucial en la educción de pro­
babilidades. La utilización de varios métodos en el proceso posiblemente revele
inconsistencias que deberán ser retroalimentadas al decisor para que las supere.
La aparición de inconsistencias no debe verse como algo completamente negativo,
sino más bien como un estímulo hacia el decisor para que éste se esfuerce y
profundice más en sus juicios. Cuando las inconsistencias no pueden eliminarse
se debe concluir que las creencias tal vez no pueden expresarse mediante una
probabilidad subjetiva o quizá estemos imponiendo una estructura equivocada
del modelo.
Otro aspecto importante es la coherencia, que ya definimos anteriormente
(Sección 3.2.3) y que también debe contrastarse. Una prueba sencilla de coheren­
cia se puede tener pidiendo al decisor que sólo eduzca la probabilidad de que
ocurra un determinado suceso y también de que ocurra el suceso contrario. Es
claro que para que el decisor sea coherente, ambas probabilidades deberán sumar
la unidad. Una variante o extensión de esta idea consiste en descomponer el suce-
118 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

so en otros posibles sucesos. Si éstos fueran mutuamente excluyentes, entonces,


una vez cuantificada su probabilidad, podrá aplicarse la regla de la adición para
comprobar la coherencia de las estimaciones.
Existen otros métodos para intentar detectar posibles deficiencias, pero en
general hay una recomendación de que la mejor solución para tal problema es que
el analista muestre al decisor sus incoherencias y permita su resolución iterativa
a partir de los axiomas de la probabilidad. Finalmente, también puede servir de
ayuda ofrecer al decisor pares de apuestas formuladas de modo que en su respuesta
debería sentirse indiferente entre ellas si su comportamiento es consistente con
las asignaciones que se hubieran hecho anteriormente.

3.6.5 Asignación dé probabilidades de sucesos muy raros

En el caso de sucesos raros, como pok ejemplo, fallo catastrófico de una central
nuclear o rotura de una presa, las probabilidades asociadas son muy pequeñas
y su asignación resulta difícil teniendo en cuenta la escasa o nula existencia de
datos históricos. La aplicación del enfoque frecuentista es imposible, de modo
que se hacen necesarias estimaciones subjetivas que pueden estar sujetas a im­
portantes sesgos resultado de la utilización de las heurísticas disponibles. Como
afirman von Winterfeldt y Edwards (1986), los sucesos raros suelen ser objeto de
noticias sensacionalistas y amplios informes, de manera que se produce un efecto
de intensificación de los sesgos en las asignaciones. Para los decisores resulta
complicado imaginar las magnitudes implicadas en tales tipos de sucesos. Así,
resulta difícil distinguir entre probabilidades como 0.00001 y 0.001, a pesar de
que la segunda probabilidad es 100 veces mayor que la primera o análogamente
entre probabilidades como 0.999 y 0.99999.
Resulta obvio que una rueda de probabilidad tendrá escasísima utilidad en
el proceso de asignación de probabilidades de esta magnitud. Sin embargo, se
han desarrollado procedimientos que permiten asignar tal tipo de probabilidades
como los árboles de sucesos y árboles de fallos que planteamos a continuación y
que se apoyan en el hecho de descomponer e identificar los factores que pueden
causar tal suceso raro.

Arboles de sucesos

Los árboles de sucesos son análogos a los árboles de probabilidad. En la Figura


3.15 se muestra un ejemplo de un árbol de este tipo en versión simplificada que
representa el hipotético fallo en una central nuclear. Cada etapa del árbol re­
presenta un factor que, en combinación con otros, podría conducir a la situación
catastrófica. Está claro que será importante que el árbol sea lo más completo
posible en el sentido de que aparezcan todos los factores que pueden Intervenir
en la generación del suceso en cuestión.
* * * « 5

PC = Funcionamiento conecto
H —Catástrofe

Figura 3.15: Árbol de


sucesos para una central nuclear

Vemos, entonces, que la aludida descomposición permite estimar, en lugar de


la probabilidad de que ocurra la catástrofe, las probabilidades de los factores que
contribuyen a ella. A partir de aquí, con la aplicación de las reglas del Cálculo
de Probabilidades (multiplicación y /o adición), podrá obtenerse la probabilidad
global de fallo. En el ejemplo de la figura se ha supuesto por simplicidad que los
factores actúan independientemente, aunque en muchas situaciones reales esto
pudiera no ser así.

Pretendemos calcular la probabilidad de que haya una catástrofe. Teniendo


en cuenta que hemos asumido la independencia de sucesos tendremos que

P (Catástrofe) =
= P (C i) + P(.C2)
= (0.01 x 0.2 x 0.1 x 0.1) + (0.01 x 0.8 x 0.05)
= 0.00002 + 0.0004 = 0.00042.

Por tanto, la probabilidad do catástrofe do 1. « . « a l n o d o » serla 0.00042.

Árboles de fallos

Los árboles de fallos adoptan un punto de vista diferente que los árboles de suce­
sos. Comienzan en su nivel más alto indicando el fallo y después se va abriendo
a través de ramas que describen las causas posibles de ese fallo. La Figura 3.16
muestra un árbol de fallos para el caso de una estación de bombeo de un oleoduc­
to, en el cual estamos interesados en determinar la probabilidad de que falle en
el próximo semestre. Se considera que el fallo o accidente puede provenir de tres
causas que serán la rotura del regulador de presión por exceso do ésta, el escape
a través de la válvula de seguridad o la rotura do la junta. Ya que si se pr uce
120 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

cualquiera de estos eventos podría causar el fallo de la estación, los tres sucesos
están conectados al nodo “fallo de la estación” mediante la disyunción “o” .

Falto de la
estación

IEscape válvu- Rotura de Rotura del


| (asegundad junta regulador

Fallo en el Fallo en el
manómetro regulador

Figura 3.16: Árbol de fallos para el problema de la estación de bombeo


1
Por otra parte, la rotura del regulador de presión se producirá si se da si­ r■t
multáneamente un fallo en el manómetro y un fallo en el regulador de entrada.
Estos dos sucesos se conectarán ambos con el nodo “rotura del regulador” me­ luí
diante la conjunción “y” .
Una vez dibujado el árbol, el decisor deberá asignar probabilidades a los ,'iáj
sucesos de las hojas, es decir, a aquellos sucesos asociados a nodos que no tienen
descendientes. La asignación de estos sucesos aparece en la citada figura. A
continuación, se escalaría por los nodos del árbol obteniendo las probabilida­ pfedí
des de los nodos intermedios hasta llegar al nodo raíz en el nivel más alto, que pbi
proporcionaría la probabilidad pedida.
En concreto comenzamos calculando la probabilidad del suceso “rotura del lS
regulador” . Ya que los sucesos de los nodos que cuelgan de él se suponen inde­ Ry
pendientes, el cálculo de su probabilidad se obtendría multiplicando las probabi­
lidades de tales sucesos, es decir,
P (rotura del regulador) i
= P (fallo en el manómetro) x P (fallo en el regulador)
| 0.1 x 0.05 8 0.005.

Estamos ya en condiciones de calcular la probabilidad del suceso “fallo de la


i
i
estación" de cuyo nodo cuelgan otros tres, cada uno con un suceso asociado de
probabilidad conocida. Ya que estos tres sucesos no son mutuamente excluyentes !V
aunque sí independientes mutuamente, aplicando la regla de la adición se tendrá
i\
P (fallo de la estación) =
= 0.004 + 0.002 + 0.005 - (0.004 x 0.002) - (0.004 X 0.005) -
-
i 0.01096.
(0.002 x 0.005) + (0.004 x 0.002 x 0.005) =
>>
s i
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 121

Obviamente este árbol es bastante sencillo y en las aplicaciones reales suelen


tener un número bastante mayor de nodos o sucesos a partir de los que el decisor
obtiene la probabilidad deseada.
Nótese que estos procedimientos pueden ser también útiles para asignar cual­
quier tipo de probabilidad, no necesariamente de sucesos raros, que no pueda
asignarse directamente. Descomponiendo el suceso en otros más manejables re­
queriremos más asignaciones, pero serán de menor dificultad. Las descomposi­
ciones las basaremos en pensar en sucesos relacionados con el suceso en cuestión,
en sucesos que pudieran conducir al suceso en cuestión y en sucesos que deben
ocurrir antes de que ocurra el suceso en cuestión. Las probabilidades asignadas
se combinarán mediante las leyes de la probabilidad.

3.7 DISCUSIÓN

En este capítulo hemos introducido el concepto de probabilidad con la idea de


proporcionar un método para cuantificar y manejar la incertidumbre, que es
un aspecto que está casi omnipresente en los problemas de decisión. Hemos
planteado los enfoques filosóficos más importantes de la probabilidad, haciendo
hincapié en que en la mayoría de los problemas prácticos las probabilidades a
utilizar serán subjetivas, cuya interpretación fue introducida por Savage (1954).
A continuación, hemos mostrado la utilidad que pueden tener los árboles de
probabilidad, antecedente de los árboles de decisión (Capítulo 5), para representar
la incertidumbre de un problema de decisión y cómo proceder para la revisión de
las probabilidades a la vista de nueva información disponible.
Después hemos descrito procesos de educción de probabilidades subjetivas por
parte de un decisor con la ayuda del analista de decisiones. En muchos textos
se exponen las técnicas de asignación de probabilidades, por ejemplo, Ciernen
(1996). Shephard y Kirkwood (1994) describen una entrevista completa y guiada
con un decisor para asignar sus creencias mediante probabilidades, que aparece
también en Kirkwood (1997). Merkhofer (1987) ilustra el protocolo SRI. Smith
(1989) indica que en la asignación de probabilidades condicionadas, al decisor
suele resultarle más sencillo una dirección de asignación que otra. Por ejemplo, en
medicina, asignar la probabilidad de una enfermedad dado cierto síntoma suele
ser más difícil que la probabilidad del síntoma dada la enfermedad (dirección
causal).
Obsérvese que la utilización de palabras para comunicar la incertidumbre
puede resultar algo peligrosa. Debemos descartar la idea de utilizar frases cuali­
tativas ambiguas como “improbable” , “raro” , “común” , etc., que han demostrado
en estudios psicológicos tener muy distintas connotaciones para personas diferen­
tes, o incluso, ser interpretadas de forma diferente dependiendo del contexto. Al
utilizar el lenguaje preciso de la probabilidad debemos obtener una mejor comu­
nicación. De hecho, ésta ha sido una de las razones del distanciamiento entre
122 FU N D AM EN TO S D E LOS S IST EM A S DF. AYU D A A I.A D E C IS IO N _______

el Análisis do Decisiones y Ir Inteligencia Artificial en los primeros años tío su


desarrollo, tal como apuntábamos en la discusión del Capítulo 1.
Hemos planteado distintos procedimientos diroctos o indirectos tanto para
distribuciones de probabilidad discretas como continuas, mostrando cómo la con­
sistencia y coherencia juegan un papel fundamental en la validación de las es­
timaciones. Hemos completado el capítulo con una descripción de un par do
procedimientos de asignación de probabilidades de sucesos muy raros.
Un método moderno de asignación de distribuciones de probabilidad para
variables interrelacionadas es el método de cópulas que puede verse en Ciernen y
Reilly (1999). La cópula es una función que permite expresar cualquier distribu­
ción de probabilidad conjunta a partir de las distribuciones marginales (Teorema
de Sklar). Esto facilita el proceso de asignación al requerirse únicamente las
distribuciones marginales y ciertas medidas de dependencia.
La dificultad que puede darse en problemas de gran dimensión es la asig­
nación, almacenamiento y gestión de las tablas de probabilidades que pueden
llegar a tener un tamaño considerable. El problema de la asignación puede evi­
tarse en gran medida en presencia de relaciones de naturaleza causal, utilizando
modelos del tipo puerta-OR, Peaxl (1988) y puerta-OR graduada, Diez (1993).
El problema de la gestión puede abordarse permitiendo comprimir o expandir las
tablas de probabilidades que están condicionadas a un gran número de variables,
facilitando a su vez la asignación. Wang y Druzdzel (2000) presentan una herra­
mienta con una interfaz de usuario para navegar por estas tablas. Además, en el
mismo trabajo, proponen mejoras de la rueda de la probabilidad.
Una medida de la validez de la predicción de las probabilidades subjetivas
se conoce como calibración, que mide hasta qué punto la probabilidad asignada
es equivalente a la proporción exacta sobre un número de asignaciones de igual
probabilidad. Es decir, la frecuencia de los resultados reales (una vez observados)
debe estar próxima a la probabilidad. Por ejemplo, si habíamos asignado 0.7 como
la probabilidad de ocurrencia sobre 20 sucesos, entonces deberían ocurrir 14 de
esos 20 sucesos si nuestra probabilidad está perfectamente calibrada. Tendrá por
tanto que medirse a largo plazo. Otro ejemplo son las predicciones meteorológicas
por ejemplo, de temperaturas mínimas diarias. En Marshall y Oliver (1995) o
Goodwin y Wright (1998) se puede ver una discusión de este concepto, que se
considera posterior al estudio de la consistencia y coherencia.
Aunque algunos de los programas de software comerciales del Análisis de
Decisiones incluyen dispositivos como, por ejemplo, una rueda de la probabilidad
para la asignación de probabilidades, unos softwares que pueden resultar de gran
utilidad para la asignación y ajuste de distribuciones de probabilidad son BestFit
y RISKview, que se pueden ver en la dirección h t t p : //www. p a lisa d e. com. L»
dirección h ttp ://w w w .sis.p itt.e d u /~ d B l/d a -so ftw z ire .h tm l expone la
yoría de los sistemas de modelización probabilística existentes.
© ra ma CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 123

3.8 EJERCICIOS
3.1 La tabla siguiente muestra la distribución de probabilidad estimada de ven­
tas de ordenadores en una tienda durante un día.

Unidades vendidas 0 1 2 3 4 5 6
Probabilidad_______ 0.10 0.15 0.30 0.20 0.15 0.05 0.05

Determinar las probabilidades de que en un día:

(a) Se vendan a lo sumo 5 ordenadores.


(b) Se vendan al menos 3 ordenadores.
(c) Se vendan entre 1 y 4 ordenadores.

3.2 Estimar las probabilidades de ocurrencia para los sucesos siguientes, indi­
cando el enfoque de la probabilidad utilizado y posibles suposiciones asu­
midas.

(a) Que funcione correctamente un chip escogido de una línea de pro­


ducción en la que se sabe que de cada 1200 fabricados, 19 resultan
defectuosos.
(b) Que se establezca un laboratorio permanente en la luna en el año 2025.
(c) Que, al lanzar dos dados al aire, la suma de los valores de las caras
superiores sea 10.

3.3 La tabla que sigue muestra los resultados de un estudio sobre fiabilidad de
307 impresoras en relación con dos características: el cabezal de impresión
y el alimentador del papel.

Funcionamiento del alimentador Funcionamiento del cabezal


Correcto Incorrecto Total
Correcto 93 32 125
Incorrecto 68 114 182
Total 161 146 307

Suponiendo que la muestra escogida es representativa de lo que se vende en


el mercado, determinar la probabilidad de que seleccionada una impresora
al azar:

(a) El cabezal funcione de modo incorrecto.


(b) El alimentador funcione de manera correcta.
(c) El cabezal o el alimentador funcionen de modo incorrecto.
(d) El cabezal funcione de modo correcto supuesto que el alimentador lo
hace incorrectamente.
124 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-M a

3.4 La probabilidad de que el índice IBEX suba al comienzo de la próxima


semana es 0.7. Si sube, entonces la probabilidad de que el valor de las
acciones de una compañía petrolífera suba es 0.9. Por el contrario, si el
IBEX no sube, entonces la probabilidad de que suban las acciones de la
citada compañía es 0.2. ¿Cuál sería la probabilidad de que las acciones de
la compañía petrolífera suban al principio de la semana entrante?

3.5 Una empresa de venta de CD’s está llevando a cabo un estudio de prospec-
tiva en una zona del país relativo a las posibles ventas del citado producto.
Sobre la base de una encuesta preliminar, el gerente estima que hay un
65% de personas que estarían dispuestas a comprar el citado producto.
Para tener mayor seguridad, debido a lo cuantioso de la futura inversión, la
■empresa decide llevar á cabo unanueva encuesta vía Internet, obteniendo
que, entre los que están dispuestos a comprar según la primera encuesta,
un 55% de personas se reafirma en ese sentido, mientras que los que no lo
estaban se muestran favorables a comprar en un 10%. Si un idividuo ha
contestado sí en esta segunda encuesta, revisar la probabilidad a priori del
gerente a la vista de los resultados obtenidos por la red.

3.6 A continuación se presentan varias situaciones de decisión sobre las que se


desea determinar posibles heurísticas que podrían utilizarse al hacer esti­
maciones e indicar sesgos que podrían surgir de tales heurísticas.

(a) Un gerente de una empresa de ventas estima el nivel de dependencia


o correlación entre las ventas del producto y los gastos realizados en
publicidad.
(b) Un médico de un hospital estima el grado de asociación entre indivi­
duos fumadores y no fumadores y la incidencia de problemas respirar
torios.

3.7 Utilizar una rueda de la probabilidad y métodos de estimación directos


para estimar las probabilidades subjetivas de los resultados de los partidos
de liga de fútbol del próximo domingo. Contrastar la consistencia entre
los métodos de asignación y utilizar la regla de la adición para evaluar la
coherencia de las probabilidades educidas.

3.8 Mediante el método de las alturas relativas y el método de la probabilidad


estimar la distribución de probabilidad del número de llamadas telefónicas
que recibes en tu casa a lo largo de un día (o una semana) de vacaciones.

3.9 Construir un árbol de fallos o un árbol de sucesos para estimar la proba­


bilidad de que un gran transatlántico que navega por aguas del norte y
próximo a una zona de conflicto se vaya a pique.

3.10 Elegir una variable aleatoria continua y asignar una distribución de proba­
bilidad acumulada con la ayuda de alguien ajeno a la clase. Utilizar un pro­
cedimiento estándar de asignación, indicando las dificultades encontradas.
© RA-MA CAPÍTULO 3: INCERTIDUMBRE Y SU MODELIZACIÓN 125

Ajustar una curva a los puntos obtenidos y señalar si podría ajustarse a


algún modelo teórico conocido.

3.11 Definir las heurísticas de la disponibilidad y de la representatividad. Dis­


cutir las diferencias entre ambas. Buscar ejemplos para las explicaciones.

3.12 Si un alumno quisiera asignar la probabilidad de aprobar este curso, ¿cómo


debería descomponer la asignación?

3.13 Después de observar muchos números rojos en la ruleta del casino, muchos
jugadores creen que es más probable que salgan los negros. A tal creencia se
le suele denominar la falacia del jugador, porque la ruleta no tiene memoria.
¿Qué heurística se está utilizando? •

3.14 En una fábrica se está pensando en instalar un sistema de seguridad elec­


trónico que desconectará automáticamente la maquinaria en caso de una
emergencia. Consistiría en 150 componentes independientes, cada una de
las cuales debe funcionar para que el sistema sea útil. Cada componente
está diseñada para que en un día cualquiera tenga un 99.5% de probabilidad
de funcionar. Estimar la probabilidad de que el sistema de seguridad com­
pleto funcione cualquier día si se tomó la decisión de instalarlo. Si piensa
que es muy alta, detecte qué heurística está utilizando.
CAPÍTULO 4

PREFERENCIAS EN
INCERTIDUMBRE

En este capítulo estudiaremos los axiomas que sirven de soporte a los modelos
de preferencias en ambiente de incertidumbre. Un problema de decisión está
en ambiente de incertidumbre cuando las consecuencias de cada alternativa del
problema no son conocidas, pero se pueden asignar probabilidades a las distintas
posibilidades que se puedan presentar. Por ejemplo, consideremos un vendedor
de melones que tiene que hacer un pedido para toda la temporada. Cada kg de
melón le cuesta 0.18 euros y su precio de venta es de 0.39 euros/kg, y el melón que
no se venda en la temporada se pudrirá. Se supone que la demanda puede ser de
1000, 2000 ó 3000 kg con probabilidades 1/4, 1/4 y 1/2, respectivamente. Esta
estimación se realizó con los métodos explicados en el Capítulo 3. El problema es
buscar la decisión óptima, con el criterio de hacer máxima la ganancia. Para ello
se dispone de la variable de decisión o alternativa “número de kg encargados” . En
el cuadro siguiente figuran, en la fila superior, las posibles demandas o estados del
ambiente, en la columna izquierda los posibles pedidos o alternativas del decisor,
y los elementos de la matriz son los resultados, consecuencias o ganancias, en
euros. Esta es una tabla de decisión, como explicaremos en el Capítulo 5.

1000 2000 3000


1000 210 210 210
2000 30 420 420
3000 -150 240 630

Si nuestro decisor supiera la cantidad de kg de melones que va a vender no


tendría ningún problema en saber la decisión a tomar. Por ejemplo, si tal cantidad
fuera 2000 kg la decisión óptima sería encargar 2000 kg obteniendo un beneficio
de 420 euros. Sin embargo, no sabe cuál va a ser el estado del mercado; tan sólo
sabe que se pueden dar tres posibles estados con las respectivas probabilidades,
Una posible regla que se podría utilizar es tomar aquella alternativa quo maximice
128 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © I

e l v a lo r e s p e r a d o d e l b e n e fic io . C on e s t a r e g l a l a a l t e r n a t i v a ó p t i m a e s enea

3 0 0 0 k g , y a q u e e l b e n e f i c i o e s p e r a d o p a r a c a d a u n a d e l a s a l t e r n a t i v a s es:

¿ 2 1 0 + ¿ 2 1 0 + ¿ 2 1 0 = 210

¿30 + ¿420 + ¿420 = 3 2 2 .5

¿ ( — 150 ) + ¿240 + ¿630 = 3 3 7 .5 .

Sin embargo, parece perfectamente racional que nuestro decisor decidiese com­
prar 2000 kg, a pesar de que el beneficio esperado de la alternativa comprar 3000
kg sea mayor, si su poder adquisitivo no pudiese hacer frente a una pérdida de
150 euros. Evidentemente* el valor que cada individuo da a una cantidad mone­
taria es diferente. Por tanto, lo que se va a hacer es asignar un valor (utilidad)
apropiado a cada posible consecuencia, que represente el valor que tiene para el
decisor esa consecuencia en una determinada escala (en nuestro caso en [-1,1]), y
calcular la utilidad esperada. Ahora la alternativa óptima para el decisor será Ja
que tenga mayor utilidad esperada.
Supongamos que se tiene la siguiente función

« ( —150) = - 1 ,
u(30) = 0.1,
u([210) = 0.4,
«(240) i 0.6,
u(420) i 0.8,
u(630) = 1.

Tomando las esperanzas de utilidad se obtiene

|0.4 + ¿ 0 .4 + ¿ 0 .4 = 0.4
¿0.1 + ¿0.8 + j0.8 = 0.625
| (-1 ) + ¿ 0 .6 + ¿1 = 0.4.

Luego, la alternativa óptima para nuestro decisor sería encargar 2000 kg.
Otro ejemplo, muy tratado en la literatura y que muestra las críticas ai criterio
del valor esperado del beneficio, lo constituye la Paradoja de San Petersburgo:
nos ofrecen la oportunidad de participar en un juego consistente en lanzar una
moneda al aire (suponemos que la moneda no está trucada y que la probabilidad
de que caiga cara es 0.5) hasta que salga cara por primera vez. Si la primera cara
aparece en la tirada rc-ésima, el premio es de 2” euros. El valor esperado de este
juego es
OO
]T 2 "(0 .5 )n = 2(0.5) + 4(0.5) 2 + 8(0.5)? + •••
© RA-MA CAPÍTULO 4: PREFERENCIAS EN INCERTIDUMBRE 129

que claramente tiene un valor infinito. Así, si el valor esperado del beneficio es
una medida de lo atractiva que puede resultar una opción incierta, deberíamos
estar dispuestos a- ofrecer cualquier cantidad, independientemente de lo grande
que sea, por tener el privilegio de jugar. El hecho de que la mayoría de nosotros
tan sólo estemos dispuestos a dar unos pocos euros por el privilegio de jugar en
este juego es la fuente de la paradoja. Esta paradoja se produce, ya que el valor
esperado del beneficio no es una medida apropiada para la elección de una opción
incierta.
El concepto de una medida numérica para describir el valor de las consecuen­
cias se incluye en la Teoría de la Utilidad, y se denomina función de utilidad a la
función que asocia a cada consecuencia un valor real que refleja su deseabilidad
por parte del decisor.
La Teoría de la Utilidad tiene sus orígenes en un trabajo de Daniel Bernoulli
publicado en 1738. Durante los siglos XVIII, XIX y primera mitad del XX, la
Teoría de la Utilidad se desarrolló de una manera confusa. Conceptos tales como
los de función de valor ordinal, funciones de valor aditivas y funciones de utilidad
no fueron correctamente entendidos y una vez que parecían claros surgían nuevas
dudas. Esto fue así hasta que Ramsay (1931), von Neumann y Morgenstern (1947)
y Savage (1954) crearon los fundamentos axiomáticos de la teoría. Por tanto, sus
implicaciones normativas no se discutieron formalmente hasta principios de los
años cincuenta. Actualmente no podemos afirmar que la Teoría de la Utilidad
sea un modelo normativo universalmente aceptado para la toma de decisiones de
forma racional pero sí uno de los más aceptados.
En este capítulo mostraremos que para cada decisor existe una función u(-)
de utilidad, cuya esperanza se utilizará para representar sus preferencias, una
vez comprobado que tales preferencias son consistentes con ciertos axiomas de
racionalidad. Von Neumann y Morgenstern (1947), Savage (1954), Luce y Raiffa
(1957), Pratt, Raiffa y Schlaifer (1965) y Fishburn (1970) han propuesto dife­
rentes conjuntos de axiomas que implican la existencia de una función de utilidad
con la propiedad de que la utilidad esperada es una herramienta para la toma
de decisiones consistente. Posteriormente indicaremos algunos de los métodos
utilizados para la asignación de la función de utilidad para después presentar las
diferentes actitudes ante el riesgo de un decisor dependiendo de la forma de su
función de utilidad. Finalmente, consideraremos el caso más usual en el que las
consecuencias están representadas por varios atributos.

4.1 PREFERENCIAS SOBRE LOTERÍAS

En los problemas de decisión en ambiente de incertidumbre el decisor se ve obli­


gado a comparar juegos o loterías sobre los que expresar sus preferencias. Una
130 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

lotería simple se representa por

l = < P l,* i ;P 2,®2;-- - \Pn,Xn >

donde p¿ > 0 es la probabilidad de ganar el premio x¡ y Y2íPí = 1- Supondremos


que el conjunto de posibles premios o consecuencias X = {x \ ,x 2, ■■■,xn} es
finito y que sin pérdida de generalidad es x\ £ £ . . . £3 xn. Una lotería
compuesta se representa por

^ Qlih', 92) ^2! ■•• >Qm,

donde es la probabilidad de ganar la lotería Es decir, una lotería compuesta


es aquella en la que los premios son de nuevo loterías. Supondremos que todas las
loterías son compuestas a lo sumo un número finito de veces. En otras palabras,
que tan sólo un número finito de veces se puede obtener como premio una lotería.

E jem plo 4.1


Un ejemplo de lotería simple se tiene cuando una persona compra un boleto
con el que sabe que puede que le toque un coche, una cámara fotográfica o nada,
con probabilidades 1/5, 1/5 y 3/5, respectivamente. Esta lotería se representa
como < 1 /5 ,Xi\ 1 /5,x%\3/5 ,23 > donde x\ = coche, x<¿ = cámara fotográfica y
X3 = nada.
Un ejemplo de lotería compuesta podría ser la misma que antes, sólo que
en lugar de ser x\ un coche, podría ser, por ejemplo, la lotería simple consis­
tente en ganar un coche o una cámara fotográfica con probabilidades 3/4 y 1/4,
respectivamente. □

Vamos a denotar a continuación con L el conjunto de loterías entre las que el


decisor debe escoger (pueden ser simples o compuestas, y todas finitamente com­
puestas, es decir, producen premios tras un número finito de aleatorizaciones), X
el conjunto de las consecuencias y A el conjunto de las consecuencias junto con
un conjunto de loterías simples y finitamente compuestas que contiene el conjun­
to L. Por tanto, L C A y X C A. Nótese que A contendrá loterías que no son
miembros de L. Más adelante especificaremos cuáles son esas loterías adicionales.
Nuestro objetivo es ver qué condiciones serán necesarias para que las preferen­
cias del decisor sobre los elementos del conjunto A sean consistentes. Además,
demostraremos que estas condiciones implican la existencia de una función de
utilidad u(-) sobre X , tal que

Xi £ xj & u (xí) > u(xj) para cada , Xj 6 X , (4.1)

y dadas

lr = < p i,X i-,p 2,X2\.. . ¡í>m ®r» > y h = < 91» “Jii <72tÍC2; ... ■,qn,x n >
© RA-MA CAPÍTULO 4: PREFERENCIAS EN INCERTIDUMBRE 131

n n
y^,Piu (x í) > y^giu(x¿) para cada I1J 2 6 L. (4.2)
t= l t= l

Las equivalencias (4.1) y (4.2) nos indican respectivamente que u(-) es una
función de valor ordinal sobre X y que la utilidad esperada sirve para representar
las preferencias del decisor sobre las loterías. Por tanto, la lotería más preferida
para el decisor será la de máxima utilidad esperada. Los axiomas que garanti­
zan las relaciones (4.1) y (4.2) se exponen a continuación. Los axiomas de la
utilidad esperada junto con la noción de probabilidad subjetiva, fueron tratar
dos inicialmente por Ramsay (1931), pero parece que fueron ignorados. Muchos
economistas referencian “funciones de utilidad de von Neumann-Morgenstem”
porque en 1947 tales autores publicaron el libró Theory of Games and Economic
Behavior donde establecen un conjuntó-de axiomas que conducen al criterio de
la maximización de la utilidad esperada. Los axiomas aparecieron en una am­
plia variedad de formas y en muchos libros de texto. Algunos ejemplos son Luce
y Raiffa (1957), Savage (1954), DeGroot (1970), y más recientemente, French
(1986), siendo los de este último autor los que indicamos a continuación.

A xiom a 1 . (O rdenación débil) Las preferencias del decisor sobre A for­


man un orden débil; es decir, £3, >- y ~ verifican los Axiomas 1-4 del Capítulo 2.

Observemos que este axioma es bastante exigente con el decisor al imponer que
sus preferencias sobre los elementos de A sean completas. Es decir, que dadas dos
loterías simples o compuestas o dada una lotería y un premio debe establecerse
una preferencia entre ellos. Sin embargo, una respuesta a los detractores de
la Teoría de la Utilidad que utilizan como arma este axioma puede verse en la
Sección 2.1.

A xiom a 2. (N o trivialidad) Para el decisor es x 1 y x„.

E jem plo 4.1 (continuación)


Es lógico que para nuestro decisor sea x\ y x 3 , es decir, prefiere que le toque
un coche a que no le toque nada. □

A xiom a 3. (R ed u cción de loterías compuestas) Sea la lotería com­


puesta l = < qi,h\q 2,h\ ■■■) 9n,ln > donde = < Pil,Xi\Pi2,X2] ■•■;p»n,®n >
para i — 1 , 2 , . . . ,n y la lotería simple l1 = < Pi,xi\p 2,X2\... \pn,x n > donde
Pj = QiPij + QiPij + . . . + qnPnj para j = 1 ,2 ,... , n. Entonces l ~ l'.

Este axioma dice que a un decisor racional que se supone consistente en sus
preferencias, debería serle indiferente una lotería compuesta y la lotería simple
obtenida de la compuesta al aplicar la regla de la probabilidad compuesta.
132 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-Ma

Una implicación directa de este axioma es que el premio o consecuencia y ]a


lotería degenerada < 0, x\', 0, 22;... ; 1, 2 ¿;... ; 0, xn > le deberían ser indiferentes
al decisor.

Ejemplo 4.1 (continuación)


La lotería compuesta

< 1/5,Zi;1/5,x 2í3/5,®3 >,

con l\ = < 3/4, ¡ci; 1/4, x^ >, debe ser indiferente a < 3/20, 1/4, x%\3/5,0:3 >.

Axioma 4. (De sustitución) Séan a,b e A tal que a ~ b. Sean 1,1' e A


loterías simples o compuestas tal que l = < ... \p,a\... > y l' = < ... ;p, 6;... >,
es decir, l y V son la misma lotería salvo que en l' hay un resultado b con
probabilidad p mientras que en l el resultado es a. Entonces l ~ l ’.

El axioma nos dice que si para un decisor dos elementos de A son indiferentes
entonces no importa si obtiene uno u otro en una lotería.

Ejemplo 4.1 (continuación)


Si la lotería I2 = < 1/ 8, 2:1; 7/8,2:3 > le es indiferente a obtener la cámara
fotográfica 22, entonces la lotería compuesta

< 1/5, £1; 1/5, ¿2; 3/5,23 > ~ < l/5,a:i; 1/5,22; 3/5,23 > .


Las loterías simples del tipo: < p, 21; 0,22;... ; 0, xn_i; 1 —p, xn > que ex­
presan que hay una probabilidad p de obtener x\ y una probabilidad 1 —p de &
obtener xn, siendo imposible la obtención de cualquier otro premio, las denotare- 4jai
mos como x\pxn, ya que constantemente necesitaremos hacer uso de ellas, y las
denominaremos loterías de referencia.
Una forma sencilla de interpretar un decisor estas loterías de referencia es
haciendo uso de la “rueda de la probabilidad” , ver Capítulo 3. La lotería xipx„
se puede entender como el juego que consiste en hacer girar el puntero de una
rueda de la fortuna que tiene dividido su fondo en dos sectores, cuyos ángulos de
6 y 360 —6 grados están en la proporción p : (1 —p). Si el puntero al terminar
de girar apunta al sector de ángulo 6 el premio es 2 j y si cae en el otro sector el
premio es xn.
© RA-MA CAPÍTULO 4: PREFERENCIAS EN INCERTIDUMBRE 133

A x io m a 5 . ( E x p e r i m e n t o d e r e fe r e n c ia ) x\pxn € A, Vp € [0 , 1).

Los oponentes a la Teoría de la Utilidad la atacan de nuevo indicando que el


decisor debe considerar además de las alternativas de b u problema de decisión,
las loterías de referencia. Esta crítica surgió, principalmente, cuando se suponía
(en los inicios de la Teoría de la Utilidad) que el conjunto A estaba formado
por todas las posibles loterías finitamente compuestas sobre el conjunto X. Esto
hacía que A fuese mucho más grande que L, el conjunto de loterías del que el
decisor podría realmente escoger. Sin embargo, nuestro conjunto A está formado
por el conjunto de premios X , el conjunto de loterías L, el conjunto de loterías de
referencia y aquellas loterías construidas a partir de L sustituyendo las loterías
de referencia por los premios que le son indiferentes. El conjunto A, aunque
mayor que L, es mucho menor que el conjunto de todas las loterías finitamente
compuestas. Además, contiene las loterías necesarias para realizar un análisis
constructivo, inicialmente separando los diferentes aspectos del problema para
que el decisor los considere aisladamente y luego combinándolos de una manera
consistente para que reflexione sobre sus preferencias entre hipotéticas loterías de
referencia. Son precisamente éstas las que le pueden aclarar sus preferencias en
L y ayudar a tomar una mejor decisión.

Ejemplo 4.1 (continuación)


Suponemos que dentro del conjunto formado por los elementos entre los
que el decisor debe establecer sus preferencias se encuentran todas las loterías
< p,xi; 1 — p,X3 > sea cual sea el valor de p,0 < p < 1. Por ejemplo,
h = < 1/ 8 , x j ; 7/ 8 , X3 > . □
Axioma 6 . (M onotonía) x\pxn £3 x\p!xn <(=>p > p'.

Este axioma nos dice que la lotería de referencia con la probabilidad mayor
de ganar x\ será al menos tan preferida como la lotería de referencia con la
probabilidad menor.

Ejemplo 4.1 (continuación)


En nuestro caso la lotería < l / 8,x i ; 7 / 8,x 3 > será menos preferida que la
lotería < 2/ 8, x\\6/ 8,13 > . □
Axiom a 7. (Continuidad) Vx, € X existe pi,0 < p¿ < 1, tal que n ~

Para ver la lógica de este axioma consideremos el siguiente ejemplo. Si a un


individuo se le da a elegir entre la lotería xipxn, con x\ = 50 euros, xn = 0 euros y
p = 0.9999, y el premio seguro x¿ = 10 euros, posiblemente prefiriese la lotería al
134 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-Ma

premio seguro. Esto es así, ya que en la lotería se tiene prácticamente asegurado


un premio de 50 euros, mientras que el premio seguro es de tan sólo 10 euros.
Sin embargo, si. el valor de p se reduce drásticamente, p — 0.0001, es normal que
deje de preferir la lotería por el valor seguro, ya que la probabilidad de ganar los
50 euros es muy pequeña en comparación con la de no ganar nada. Por tanto
sería razonable pensar que eligiera los 10 euros en lugar de arriesgarse a no ganar
nada. Si se ha producido este cambio de preferencias, es lógico pensar que habrá
un momento, antes de producirse el cambio, en el cual para cierto valor de p = pit
lo que el individuo siente entre la lotería y el premio seguro es indiferencia.
Existen principalmente dos críticas a este axioma. La primera es que hay
premios aj¿ para los cuales no existen valores de p tal que x\pxn ~ a:,-. Por ejemplo,
si a un decisor le proponemos que establezca sus preferencias entre la lotería
x\pxn, con x\ = 50 euros, x „ = muerte y p — 1, y el premio seguro x¡ =
10 euros, únicamente en este caso preferiría la lotería al premio seguro, ya que
para valores más pequeños de p,- por ejemplo para p — 0.99999999999, existe
una probabilidad, aunque sea pequeña, de morir. Es decir, no existe p¡ tal que
x\PiX„ ~ Xi. Sin embargo, supongamos que p» = 1 — 10-3 . Esto quiere decir
que hay una probabilidad de uno entre 1030 de morir. Si aplicamos el argumento
anterior, al haber una probabilidad de morir, el decisor siempre debería rechazar
la lotería y elegir el valor seguro de 10 euros. Pero en la vida real esto no es
cierto, ya que la probabilidad de tener un accidente al hacer un viaje o morir
al cruzar una calle es mucho mayor que 10-30 y sin embargo, todo el mundo lo
hace. Es más, no sólo lo hacemos sino que además pagamos dinero por hacerlo.
51 consideramos que somos individuos racionales con preferencias consistentes
y hacemos este tipo de cosas, deberíamos elegir la lotería anterior en lugar del
premio seguro.
La segunda crítica es que en la práctica es difícil obtener el valor preciso de p¡
tal que x\pixn ~ se*. Ya que si xip¡xn ~ xí , entonces ¿por qué la indiferencia no
se sigue manteniendo para otros valores tales como p!i = pi ± 10 ? La respuesta
la encontraremos en capítulos posteriores al estudiar el análisis de sensibilidad,
ya que demostraremos que el Análisis de Decisiones práctico basado en la Teoría
de la Utilidad esperada no requiere tal precisión.
Ahora ya estamos en condiciones de justificar la existencia de una función de
utilidad cumpliendo las equivalencias (4.1) y (4.2) (ver Ejercicio 4.7).

Teorem a 4.1
Si las preferencias del decisor cumplen los Axiomas 1-7, existe una función
de utilidad u(-) sobre X que representa £ según (4.1) y (4 .2).

Hemos visto las condiciones necesarias para la existencia de una función de


utilidad que represente las preferencias del decisor. Sobre la unicidad podemos
decir (ver Ejercicio 4.8) que si «(•) es una función de utilidad sobre X, entonces
iu(.) = au( •)+/?, con a > 0 , es también una función de utilidad que representa las ^
© RA-MA CAPITULO 4: PREFERENCIAS EN INCERTIDUMBRE 135

mismas preferencias. Recíprocamente, si it(-) y io(-) son dos funciones de utilidad


sobre X representando las mismas preferencias, entonces existe a > 0 y /? tal que
w(-) = au(-)+f). Es decir, existe unicidad salvo transformaciones afines positivas,
al igual que ocurría con las funciones de valor aditivas y las funciones medibles.
Así, la escala de cualquier función de utilidad puede transformarse para que los
valores extremos se encuentren donde sea conveniente, sin que el orden de las
utilidades esperadas se vea afectado. Dos funciones de utilidad relacionadas por
una transformación afín positiva se dicen estratégicamente equivalentes.

4.2 MÉTODOS DE ASIGNACIÓN DE LA


FUNCIÓN DE UTILIDAD

Básicamente existen dos tipos de métodos para asignar la función de utilidad de


un decisor: métodos de comparación de preferencias y métodos de equivalencia.
Con todos los métodos el decisor debe comparar pares de alternativas. Para
los métodos de comparación de preferencias las alternativas son completamente
conocidas y la tarea del decisor es dar información sobre sus preferencias ordinales.
En este caso son necesarias muchas comparaciones para determinar la función
de utilidad. En los métodos de equivalencia, las alternativas no son conocidas
completamente y el decisor debe especificarlas para que le sean indiferentes. En
este caso, cada indiferencia da lugar a uh valor de la función de utilidad.
Consideraremos comparaciones entre premios seguros x, y loterías de referen­
cia x\pxn. Además, supondremos que u{x\) = 1 y u (in) = 0 para considerar una
función de utilidad normalizada.
Si el decisor especifica un premio seguro x, el cual considera equivalente a
la lotería, se obtiene que u(xs) = pu(xi) + (1 —p)u(xn) = p. Los métodos que
requieren que el decisor especifique un premio seguro son llamados métodos de
equivalencia en certidumbre. Si al decisor se le pregunta por el valor de la proba­
bilidad p para que un cierto premio seguro sea equivalente a la lotería de referen­
cia x\px„ el método es de equivalencia en probabilidad. Otro grupo de métodos,
no usados tan frecuentemente, son los métodos de equivalencia en valor. Aquí
al decisor se le pide que varíe el valor de los premios en la lotería. En todos los
métodos se determina un conjunto de valores de la función de utilidad y mediante
un posterior ajuste se obtendrá la citada función u(-).

Ejemplo 4.1 (continuación)


Sabemos que las preferencias de nuestro decisor entre los premios o consecuen­
cias, son xi >- X2 y X3. Por tanto, si queremos construir una función de utilidad
normalizada u(-) podemos considerar que u(x\) = 1 y u(a¡3) = 0. Si queremos
calcular el valor de u(x 2) preguntamos al decisor, por ejemplo usando equivalen­
cia en probabilidad, que especifique el valor de p para que la lotería de referencia
x ipx$ le sea indiferente al premio seguro x%. Supongamos que el valor que indica
136 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

tras un diálogo interactivo con el analista es 0.3. Entonces u fa ) = 0.3. Hemos


utilizado las variables x i,x ¡, *3 pero recordemos que éstas representan un coche,
una cámara fotográfica y no ganar nada, respectivamente. O

La calidad de la decisión tomada depende de la fiabilidad de la función de


utilidad asignada. Desde un punto de vista normativo, que es el que estamos
considerando a lo largo de todo el libro, la función de utilidad que representa las
preferencias de un decisor no depende del método que se utilice para obtenerla
(Slovic y Tversky, 1974). Sin embargo, existen sesgos que pueden influir sobre las
preferencias del decisor. Por tanto, analizaremos brevemente de dónde pueden
proceder esos sesgos y qué se puede hacer para evitarlos a pesar de abandonar
nuestra perspectiva normativa para introducirnos en la descriptiva.
Las fuentes potenciales de sesgo pertenecen a uno de los cuatro grupos si­
guientes:

1. Violación de la condición de invarianza. La decisión no sólo depende de la


estructura sino también de la presentación de la decisión. Existen, como
anteriormente hemos indicado, varios métodos para preguntar al decisor so­
bre sus preferencias. Cada uno de ellos induce a diferentes formas de proce­
samiento de la información. Por consiguiente, cada uno puede producir
una respuesta diferente aun cuando el problema tenga la misma estructura,
Tversky y Kahneman (1981). Esto lleva a que se produzcan paradojas.
Una recopilación de éstas aparecen en von Winterfeldt y Edwards (1986) y ii
Hogarth (1987). Aquí tan sólo expondremos algunas de ellas.

(a) “Efectos de encuadrado". Tversky y Kahneman (1981) demostraron


cómo la actitud ante el riesgo de los individuos puede cambiar depen­
diendo de la forma en que se le presente el problema de decisión. El
ejemplo que ponen dichos autores para demostrar dicha paradoja es:
Una epidemia se produce en Asia. Los expertos esperan que 600 per­
sonas mueran de la enfermedad. Para combatir la epidemia pueden
aplicarse dos programas, pero debido a que los recursos son limitados
tan sólo se aplicará uno.
Programa A : 400 personas se salvarán.
Programa B: Existe un 80% de probabilidad de que sean salvadas
las 600 personas y un 20% de que no se salve nadie. ¿Cuál de estos
dos programas prefiere?
Ahora consideremos estos dos programas:
Programa C: 200 personas morirán.
Programa D: Existe un 20% de probabilidad de que 600 personas
mueran y un 80% de que nadie muera.
¿Prefiere C o D?
Observemos que el Programa A es el mismo que el C y que el B es el
mismo que el D, tan sólo depende de si se piensa en términos de vidas
CAPITULO 4: PREFERENCIAS EN INCERTIDUMBRE 137
R A -M A

salvadas o muertes. Muchas personas preferirán el Programa A en la


primera opción pero el D en la segunda. La razón de esta inconsisten­
cia es que las personas tienden a ser aversas al riesgo cuando tratan
con ganancias pero les atrae el riesgo cuando se trata de pérdidas.
(b) “Paradoja de Aliáis” (Aliáis, 1953; Aliáis y Hagen, 1979):
Supongamos dos situaciones de decisión Si y 52, y en cada una de
ellas el decisor debe elegir una de entre dos opciones

anar 1 millón de euros con probabilidad 1


Ganar 2.5 millones de euros con probabilidad 0.10
Ganar 1 millón de euros con probabilidad 0.89
Ganar nada-con probabilidad 0.01

Ganar 1 millón de euros con probabilidad 0.11


C:
Ganar nada con probabilidad 0.89
52
Ganar 2.5 millones de euros con probabilidad 0.10
D:
Ganar nada con probabilidad 0.90

Empíricamente se demostró que el 82% de los subjetos encuestados


eligieron A sobre B y el 83% eligieron D sobre C. Pero se puede de­
mostrar que elegir A en la situación 5i y D en la situación S2 está
en contra de la maximización de la utilidad esperada. En efecto, sea
u(0) = 0 y «(2500000) = 1, entonces

Eu{A) = u(1000000)
Eu{B) = 0.1+ 0.89i¿(1000000).

Así, A es preferida a B si y sólo si

«(1000000) > 0.10 + 0.89u(1000000)

u(1000000) > 0.91.

Para la situación Si,

Eu(C) = O.llu(lOOOOOO)
Eu(D) I 0.10.

Así, D es preferida a C si y sólo si

u( 1000000) < 0.91.


38 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-ma

Lógicamente, u(1000000) no puede ser mayor y menor que 0.91 al mis­


mo tiempo. Así, elegir A y D no es consistente con la utilidad espera­
da. Kahneman y Tversky han atribuido esta inconsistencia al “efecto
de certidumbre”, por el cual los individuos tienden a sobrevalorar las
consecuencias ciertas más que las inciertas.
(c) “Paradoja de Ellsberg” (Ellsberg, 1961):
Una urna contiene 90 bolas entre rojas, azules y amarillas. 30 de las
bolas son rojas, y las 60 restantes entre azules y amarillas, siendo la
proporción de azules y amarillas desconocida. Se toma aleatoriamente
de la urna una única bola.
a. Supongamos que le ofrecen la elección entre los juegos A y B:
A: Ganar 1000 euros si se saca una bola roja.
B: Ganar 1000 euros si se saca una bola azul.
b. Ahora supongamos .que le ofrecen elegir entre los juegos C y D:
C: Ganar 1000 euros si se saca una bola roja o amarilla.
D: Ganar 1000 euros si se saca una bola azul o amarilla.
Muchas persona prefieren A en el primer caso y D en el segundo. Pero
estas decisiones son contrarias a la utilidad esperada. En efecto, en la j
primera opción
£u(A) = (l/3)u(1000)
Eu(B) = P(azui)ic(1000).
Así, A es preferido a B si y sólo si i
a
(l/3)u(1000) > P(o£uZ)u(1000)
o
1/3 > P(azvl).
Pero en la segunda opción
Eu(C) = (l/3)u(1000) -f P(amarilla)u(1000)
Eu(D) = P(azul)u(1000) + P(amarilla)u(1000).
Así, D es preferido a C si y sólo si
1/3 < P(azví).
Lógicamente, P{azul) no puede ser mayor y menor que 1/3 al mismo
tiempo. Esta inconsistencia se produce debido a que las personas tien­
den a alejarse de los juegos arriesgados con probabilidades vagas. Los
investigadores han intentado entender este fenómeno descriptivamente
y prescriptivamente. Einhorn y Hogarth (1985) presentan un modelo
psicológico del proceso. Frisch y Barón (1988) definen vaguedad en
términos de falta de información que podría tener un impacto sobre la
asignación de probabilidades.
© RA-MA CAPÍTULO 4: PREFERENCIAS EN INCERTIDUMBRE 139

2. Violación de la dominancia estocástica. Una alternativa es preferida aunque


sea estocásticamente dominada.

3. Violación de la transitividad. La alternativa a es preferida a 6, &es preferida


a c pero a no es preferida a c.

4. Violación del axioma de sustitución. Se encuentra tal violación si por ejem­


plo el premio seguro de 30 euros es preferido a la lotería consistente en un
premio de 40 euros con probabilidad 0.8, mientras que a su vez la posibili­
dad de ganar 30 euros con probabilidad 0.25 no es preferida a la de ganar
40 euros con probabilidad 0.2 (la proporción entre las dos probabilidades
es la misma en ambos casos). Es decir,

30 X

0.2 0.8
40 0

Las violaciones de la dominancia estocástica (grupo 2) son insignificantes en


la construcción de la función de utilidad, ya que al decisor nunca se le pide que
compare alternativas dominadas estocásticamente. Las violaciones de la transi­
tividad (grupo 3) se evitarán con chequeos de consistencia.
La percepción subjetiva de probabilidades puede considerarse como una expli­
cación de la violación del axioma de sustitución (grupo 4). Esto se ha probado en
estudios empíricos, ver McCord y de Neufville (1986). En general, probabilidades
bajas son sobreestimadas en relación a certezas, mientras que las probabilidades
grandes son infravaloradas, Tversky (1977). Con estas dos observaciones puede
evitarse la violación del axioma de sustitución.
Además de estos sesgos que representan errores sistemáticos, existen desvia­
ciones no sistemáticas de la Teoría de la Utilidad que son debidas a los errores de
medida. Para aliviar las necesidades de información y anticiparse a los errores no
sistemáticos se le permite al decisor proporcionar información incompleta sobre
sus preferencias. En lugar de asignar valores concretos a un valor seguro o a un
equivalente en probabilidad, se le permite asignar un intervalo proporcionando el
extremo inferior y superior.
Los sesgos del grupo 1 y 4 y los errores no sistemáticos pueden evitarse usando
procedimientos que utilicen varios métodos de obtención de la función de utilidad
usando información incompleta sobre las preferencias del decisor, von Nitzsch y
Weber (1988), Gallego et al. (1998), Gómez et al. (2000) y Ríos Insua et al.
(2000).
140 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© R a -m a

4.3 ACTITUDES FRENTE AL RIESGO

Cada persona tiene su propia actitud frente al riesgo. Algunas sienten verdadera
pasión hacia el riesgo, y les gustan las situaciones límite, el juego, por arriesgado
que sea, etc. Sin embargo, otras prefieren lo seguro frente a lo que entrañe
algo de azar. La actitud hacia el riesgo de un decisor varía dependiendo de
muchos factores tales como su nivel de riqueza, las necesidades del momento, las
aspiraciones, el estado de ánimo, etc. Como veremos a continuación, la función
de utilidad representará la actitud frente al riesgo del decisor.
Con la intención de hacer la terminología de esta sección más intuitiva, supon­
dremos que todas las consecuencias son monetarias. Indirectamente estaremos
asumiendo que cada consecuencia puedé representarse por un valor y que cuanto
mayor sea el valor, mejor.
Cada lotería tiene asociada dos esperanzas:

• el valor monetario esperado

• la utilidad esperada

P(xí)u(xi) si X es variable
aleatoria discreta
E(u,p) =
fx p(x)u(x)dx si X es variable
aleatoria continua

Asociada con la utilidad esperada de una lotería está su equivalente en cer­


tidumbre, xc¡ que representa el valor monetario con el que el decisor se siente in­
diferente a la lotería Así, u(xc) — E(u,p) o, equivalentemente, xc = u_ 1(E(u,p))-
La prima al riesgo de una lotería es p = E (p )—xc, es decir, es la cantidad máxima
del valor monetario esperado que el decisor está dispuesto a pagar (en el sentido
de pérdida de oportunidad) para evitar el riesgo asociado con una lotería.

Ejemplo 4.2
i
Supongamos un decisor al que le es indiferente la lotería < 0.5,1000; 0.5,0 > I
y el premio seguro 400 euros. En este caso, el equivalente en certidumbre es 400
euros. Esto significa que para nuestro decisor cualquier cantidad superior a ésta J
es preferida a la lotería y que cualquier cantidad inferior es menos preferida <Iue i]
la lotería. La prima al riesgo es p = (0.5 x 1000 + 0.5 x 0) - 400 = 100, es decir,
nuestro decisor está dispuesto a pagar, como mucho, 100 euros en media a cambio
© R A -M A CAPÍTULO 4: PREFERENCIAS EN INCERTIDUMBRE 141

de evitar el riesgo asociado al juego. Al ser mayor el valor monetario esperado


de la lotería que el equivalente en certidumbre, o lo que es lo mismo la prima al
riesgo positiva, el decisor presenta aversión al riesgo.
Supongamos que el equivalente en certidumbre es 600 euros. La prima al
riesgo es de -100 euros, lo que significa que al decisor le tendrían que pagar hasta
100 euros por abandonar una oportunidad de jugar a esa lotería. Al ser menor
el valor monetario esperado de la lotería que el equivalente cierto, o lo que es lo
mismo la prima al riesgo negativa, el decisor presenta afición al riesgo.
Supongamos que el equivalente en certidumbre es 500 euros. La prima al
riesgo es 0 euros. Al ser igual el valor monetario esperado de la lotería que el
equivalente en certidumbre, o lo que es lo mismo la prima al riesgo nula, el decisor
presenta neutralidad frente el riesgo. □

En el ejemplo anterior se ha visto que el signo de la prima al riesgo de una


lotería nos indicaba la actitud del decisor ante el riesgo. Pasemos a definirlo
formalmente. Un decisor es averso al riesgo si para cada lotería su prima al
riesgo es no negativa. Es decir, si siempre prefiere recibir una cantidad de dinero
igual al valor monetario esperado de una lotería que la lotería misma. Un decisor
siente afición al riesgo si para cada lotería su prima al riesgo es no positiva; es
decir, si siempre prefiere la lotería a recibir una cantidad de dinero igual a su valor
monetario esperado. Un decisor es neutral ante el riesgo si para cada lotería la
prima al riesgo es cero; es decir, le es indiferente la lotería y percibir una cantidad
de dinero igual a su valor monetario esperado.
Matemáticamente, si la lotería es < p,x\\ 1 —p, X2 > se tiene que E(p) =
p x i + (1 —v )x 2 y B (u ,p ) — pu(x\) + (1 —p)u(x 2) verificándose

Un decisor tiene aversión al riesgo p > 0 •<=>


p xi + (1 —p )x 2 - u~ 1 (pu(x 1) + (1 - p)u(x 2)) > 0
p x 1 + (1 - p ) x 2 > u~l {jpu(x1) + (1 -p )u (x i))
u(pxi + (1 - p )x ¡) > pu(x 1) 4- (1 - p ju fa ).

Observemos que la última desigualdad es la definición de concavidad de la


función u(-). Por tanto, un decisor tiene aversión al riesgo si y sólo si su función
de utilidad es cóncava. Lo hemos demostrado para el caso de loterías con dos
consecuencias y para el caso general se hace usando la desigualdad de Jensen,
que puede verse en DeGroot (1970).
Análogamente, se puede demostrar que un decisor siente afición al riesgo si y
sólo si su función de utilidad es convexa. Al ser las funciones lineales funciones
cóncavas y convexas al mismo tiempo tenemos que representan a decisores que
son aversos y a su vez sienten afición al riesgo, es decir, son neutrales frente el
riesgo.
1J2 FUNDAMENTOS D E LOS SISTEM AS D E AYUDA A LA DECISIÓ N © RA-MA

Las tres actitudes ante el riesgo quedan representadas en el siguiente gráfico


Utilidad

afición al riesgo
(convexa)

Valores

La concavidad o convexidad de una función de utilidad nos permite por tanto


describir en términos cualitativos la actitud ante el riesgo: aversión, afición o
neutralidad. Sin embargo, no nos permite comparar la actitud frente al riesgo de
dos individuos. No pensemos que con una simple comparación visual de las dos
curvas de utilidad va a ser suficiente para saber cuál es más averso o tiene mayor
afición al riesgo, pensando que a mayor concavidad mayor aversión y a mayor
convexidad mayor afición. Esto no es así, ya que según hemos visto la función
de utilidad de un decisor es única salvo transformaciones afines positivas. Y una •
transformación afín positiva de una función cóncava da lugax a una función más t
cóncava, representando ambas funciones las mismas preferencias.
Pratt en 1964 (Pratt, Raiffa y Schlaiffer, 1964) sugirió una forma de medir la {
aversión al riesgo para una función de utilidad mediante la función
*
¡I í Bh I <>
asumiendo, por supuesto, que la función de utilidad es dos veces diferenciable. ^
La función r(x) se conoce como aversión local al riesgo en x. Esta función tiene !¡¡
las siguientes propiedades (ver Ejercicio 4.9): i) no se ve afectada por transfor- «
maciones afines positivas (la derivada de una constante es cero); ii) r(x) < 0 B
para funciones convexas (una función de utilidad convexa estrictamente creciente 9
posee la primera y segunda derivada mayor que cero); iii) r(x) > 0 para fun- u
ciones cóncavas (una función de utilidad cóncava estrictamente creciente posee la
primera y segunda derivada mayor y menor que cero, respectivamente). Luego
r(x) < 0 => afición al riesgo,
r(x) = 0 =>• neutralidad al riesgo,
r(x) > 0 => aversión al riesgo.
C A PÍTU LO 4: PR E FE R E N C IA S EN IN C ERTID U M BRE 143
I © RA-MA

■ Además, si la aversión local al riesgo de un decisor es uniformemente mayor que


I la de un segundo decisor, entonces el primero poseerá una mayor prima al riesgo
■ que el segundo (ver Ejercicio 4.10): dadas u\(-) y uj(-) dos funciones de utilidad,
■ para ceida lotería sea p¡ la prima al riesgo dada por «,'(•), 1 = 1 , 2, entonces

si ri(x) > r2(x), Vx =►p1 > p2.

■ Así el primer decisor será más averso al riesgo que el seguin !«*».
La función r(x) es conocida como aversión local al riesgo porque si rj (x) >
I t 2(x) para a < x < b, entonces px > p2 para cada lotería con sus premios en
■ el rango a < x < b. Así, ri(x) > ^ (x ) para a < x < b nos permite concluir
I que dentro de la región a < x < b la primera función de utilidad modeliza más
I aversión al riesgo que la segunda.
Consideremos ahora un individúo con cierta riqueza s cuya función de utilidad
I es «(•). Si varía s, es natural que tenga otra curva de utilidad w(-), pues el dinero
I ya no tiene el mismo valor para él. Supongamos que su riqueza aumenta en t
I unidles. Entonces parece natural admitir que su nueva función de utilidad será
I w(x) = u(x + t), ya que recibir un premio de x euros después del aumento de su
I fortuna, equivale a recibir x + t antes del aumento.
Supongamos que el decisor tiene una aversión local al riesgo rj (x) decreciente.
I Esta representa preferencias que al aumentar la riqueza del decisor le conducen a
I una disminución de su aversión al riesgo. Si su riqueza aumenta en i unidades, la
I nueva función de aversión local al riesgo será r2(x) = n (x + t) < n (x ). Resulta
I así, del teorema de Pratt, que un incremento en la riqueza del decisor le conduce
I a reducir la prima al riesgo asociada a cualquier lotería.
Esto coincide con la observación de que una persona cuya riqueza aumenta, va
teniendo menor aversión al riesgo. Estas observaciones nos dicen que si la función
' de utilidad de un decisor es u(x) = ax 2 + bx + c, entonces su función de aversión
local al riesgo es creciente (ver Ejercicio 4.2), lo que hace pensar que, en general,
una función de utilidad cuadrática no será una adecuada representación de las
preferencias de un decisor. Sin embargo, si u(x) = —e~cx(c > 0), es de aversión
al riesgo constante y si u(x) = a + b(e~cx —kelx) (b, c ,k ,l> 0), es de aversión al
riesgo decreciente (ver Ejercicio 4.2). Esto ha llevado a utilizar funciones de este
tipo para representar la función de utilidad de un decisor cuya preferencia tenga
las características citadas, y determinar los parámetros (o, 6, c, k, l) mediante la
asignación de cantidades indiferentes en incertidumbre a unas cuantas loterías
adecuadamente propuestas.

4.4 TEORÍA DE LA UTILIDAD MULTIATRIBUTO


En el Capítulo 2 estudiamos los tipos de funciones do valor que existían si las
consecuencias estaban estructuradas como vectores de niveles de atributos. Ahora
realizaremos un estudio análogo para las funciones do utilidad.
144 F U N D A M E N T O S D E LO S S IST EM AS D E A Y U D A A L A D ECISIÓ N © ItA -M j

4.4.1 Formas funcionales de utilidades biatributo

Comencemos considerando dos atributos, es decir, el espado de consecuencias es


X x Y\ así (se, y) representa una consecuencia. Estamos interesados en saber qué
condiciones son necesarias y suficientes para que exista una función de utilidad
aditiva u(x,y) = kxux (x) + kyuy(y), con kx, ky constantes de escala positivas.
Comenzamos considerando el concepto de independencia en utilidad. Se dice
que X es independiente en utilidad de Y si las preferencias entre loterías que se
diferencian en los valores de X son independientes del valor fijado para la Y.

Ejemplo 4.3
Consideremos las cuatro loterías siguientes donde los premios (x, y) son canti­
dades monetarias, en miles de euros, que recibirá el decisor ahora, x, y el próximo
año, y :

h =< 1/ 2, (20,40); 1/ 2, (60,40) >


l2 = < 1/2, (30,40); 1/2, (40,40) >
Z3 = < 1/ 2, (20,50); 1/ 2, (60,50) >
U =< 1/2, (30,50); 1/2, (40,50) > .

Así, ¿i representa que existe la misma probabilidad, 1/2, de ganar ahora 20000
euros y el próximo año 40000 que ganar ahora 60000 y el próximo 40000. En las
loterías l\ y I2 las cantidades a percibir en el segundo año coinciden, 40000 euros,
tan sólo se diferencian en las de este año, por lo que parece razonable que al
establecer el decisor preferencias entre ellas considere únicamente los valores del
primer año. Igualmente ocurre con las loterías I3 y ¿4. Además, las cantidades de
dinero a percibir el primer año coinciden: la de li con la de ¿3 y la de ¿2 con la
de ¿4. Por tanto, como tan sólo el decisor debe fijarse en la cantidad a recibir el
primer año, debe verificarse que

U-

Si se verifica dicha equivalencia se está comprobando que para nuestro decisor,


X es independiente en utilidad de Y. Sin embargo, no decimos que todos los
decisores actuarían así, ya que podría ocurrir que para alguno I2 £ ¿1 y ¿3 £ Ut
al tener la necesidad de juntar entre los dos años como mínimo 70000 euros.
No obstante, a pesar de la anterior objeción, la condición de independencia cu
utilidad se verifica generalmente. O

Si X es independiente en utilidad de Y, entonces (ver Ejercicios 4.1 y 4.11):

1. X es preferencialmente independiente de Y|
R A -M A CAPÍTULO 4: PREFERENCIAS EN INCERTIDUMBRE 145

2. Para un yo fijado

_ u (x,y) = a(y)u (x,y0) + 0(y), V(x,y) e X x Y ,

donde cc(y) > 0 y las funciones at(y) y ¡3(y) se definen con respecto a yo
(el recíproco también se verifica). Análogamente, Y es independiente en
utilidad de X si y sólo si para un xo fijado

u (x,y) = 7 (x)u(xo,y) + <5(x), V(x,j/) e X x Y,

donde 7 (x) > 0 y las funciones 7 (x) y 6(x) se definen con respecto a xo.

3. Si u(x, y) es una función de utilidad sobre X x Y normalizada por u ( x q , yo) =


0 y u (x i,y i) = 1 tales qué {xu yo) y (x 0,y0) y (xo,2/i) X {xo,yo), Y es
independiente en utilidad de X , entonces

u(x, y) = u (x,y0) + u(x 0,y) + ku(x,y 0)u(x 0,y) (4 .3)

o equivalentemente

«(x ,y ) = kx ux {x) + kYuY{y) + kxYUx[x)uY{y)

donde

i) u x {x ) es una función de utilidad sobre X normalizada por ux(xo) = 0


y « x (x i ) = 1 .
ii) uy(y) es una función de utilidad sobre Y normalizada por uyíjja) = 0
y uY\yi) = 1 .
iii) kx = u ( x i ,y 0).
iv) ky = u ( x 0,yi).
v) kxY = 1 — kx - k y y k = kXY/(kx ky).

Además, la independencia en utilidad mutua (X independiente en utilidad


de Y e Y independiente en utilidad de X ) es una condición necesaria para
esta representación, que se denomina multilineal.

Si k ^ 0 tenemos

u(x, y) 3 u (x,y0) + u(x 0,y) + ku(x,yo)u(xo,y) &


[1 + ku (x,y) ] = [1 + ku(x,yo)][l + ku(x0,y)\.

Por esta razón se dice que la mutua independencia en utilidad generalmente


conduce a una función de utilidad multiplicativa.
Si k fuese cero tendríamos que u(x, y) es una función de utilidad aditiva sobre
X x Y . Para garantizar la existencia de una función de utilidad aditiva se debe
verificar (ver Ejercicio 4 .12):
146 F U N D A M E N T O S D E LOS S IS T E M A S D E A Y U D A A LA D E C I S I Ó N
-- ------- -------------------------------------------------- --------- ~ |

(a) X e Y son mutuamente independientes en utilidad,

(b) (*o,2/o) y (*i, 2/i) son tales que u(x 0,y0) = 0 y u(x\,yi) = 1, y taj
(*i,2/o) y (*0,2/0) y (*0,2/1) y (xo,yo).

(c) para algún *2,«3 £ X , y2,y3 € Y, tal que (*2,2/2) ^ (*2,2/3) y (x* I
(*3,2/2),

< 1/ 2, (*2,3/2); 1/ 2 , (*3,2/3) > ~ < 1/ 2 , (*2,2/3); 1/ 2 , (*3,2/2) > (4,4)

Es decir, si u(x,y) es una función de utilidad sobre X x y y se cumplen todas


las condiciones anteriomente indicadas, entonces

u(x,y) = u(x, yo) + w(*o, y)

o equivalentemente

u(x,y) = kx ux {x) + kYuY(y).

Decimos que X e Y son independientes aditivamente si para todo x, x1 6 X


e y ,y ' e Y

< 1/ 2, (*,2/); 1/ 2 , (*',2/') > ~ < 1/ 2 , (*,2/'); 1/ 2, (*',y) > .

Existe otra posible caracterización de la función de utilidad aditiva utilizando la


definición anterior. En efecto (ver Ejercicio 4 .13), suponiendo que u(x,y) es una
función de utilidad sobre X x Y y que X e Y son independientes aditivamente,
entonces si (*0,2/0) y (*1,2/1) son tales que u(*o,2/o) = 0 y u (*i, 2/i) = 1, entonces

«(*> y ) = u(*>2/o) + u(*o, 2/) (4-5)


o equivalentemente

w(*,2/) = kx u,x (x) + kYuY(y)

donde

i) ux (x) es una función de utilidad sobre X normalizada por ux(*o) —0 y


*Of(*l) = 1 -
ii) uY(y) es una función de utilidad sobre Y normalizada por uY(yo) = 0 y
u y(yi) = 1 -

iii) kx — u(xi,yo).

iv) ky = u(xo,yi)'
© RA-MA C A P ÍT U L O 4: P R E FE R E N C IA S EN IN C E R TID U M B R E 147

Además, la independencia aditiva es una condición necesaria para esta repre­


sentación.
Observemos qué la diferencia entre las dos caracterizaciones está en que en la
primera se necesita que se verifique la indiferencia

< 1/2,(*1,2/1); 1/2, (*2,2/2) > ~ < 1/2, (*1,2/2); 1/2, (*2,2/1) >

sólo para algún * i,* 2 e X , y\,V2 € Y, mientras que en la segunda es para todo
x\, *2 G X , 2/1,7/2 £ Y ■Sin embargo, no pensemos por eso que la primera es menos
restrictiva, pues la primera también requiere que exista mutua independencia en
utilidad.
Existe una manera interesante dé interpretar el parámetro k. Considere­
mos las loterías: < 1/ 2 , (* 1 , 2/ 1); 1/ 2 , (* 2,J/2) > y < 1/ 2, (* 1, 2/2); 1/ 2, (* 2, 2/1) >,
ilustradas en la figura siguiente

Supongamos que las preferencias son crecientes en cada atributo. Utilizando


la función de utilidad (4.3) es fácil comprobar que

< 1/ 2,( * 1, 2/1); 1 / 2 ,(* 2, 2/2) > >- < 1/ 2,(* 1, 2/2); 1/ 2,(* 2, 2/ 1) ><=*•k > 0
< 1/ 2, (* 1, 2/1); 1/ 2 , (* 2, 2/2) > ~ < 1/ 2, (* 1, 2/2); 1/ 2, (* 2, 2/1) > & k = 0
< 1/ 2,( * 1, 2/1); 1/ 2 ,( * 2, 2/2) > -< < 1/ 2,(* 1, 2/2); 1/ 2, (* 2, 2/1) > & k < 0

Las consecuencias (*1,2/1) y (*2,2/2) son tales que en ambos atributos tienen unos
valores pequeños o grandes. Por el contrario, con (*1,2/2) y (*2>J/i), se tiene un
gran valor de un atributo o de otro, pero no un gran (pequeño) valor de ambos.
Pensando de esta forma, si < 1/ 2, (*1,2/1); 1/2, (*2,2/2) > es preferida, es como si
necesitásemos un aumento del atributo X para complementar un aumento en Y
yendo de (*1,2/1) a (*2,2/2)- Por otro lado, preferir < 1/2, (* 1, 2/2); 1/2, (®2>J/i) >
implica que es importante que al menos el valor de un atributo sea grande, y dado
un gran nivel de X , el aumento de preferencia debido a un aumento en Y no es
148 FUNDAMENTOS D E LOS SISTEM AS D E AYUDA A LA D E C IS IÓ N © r a -m a

mucho. Así uno de los dos atributos puede ser considerado como el sustituto del
otro.
Ilustremos estos conceptos con dos ejemplos para mayor claridad. Conside­
remos un individuo cuyos ingresos proceden de dos fuentes diferentes y que sus
preferencias son cuanto más dinero ingrese mejor. Considerando como atributos
el dinero que recibe de cada fuente, tenemos que uno es sustituto del otro. Es
decir el aumento de ganancias en uno compensa la pérdida en el otro.
Para ilustrar el caso de dos atributos que se complementan, sea una persona
que tiene dos hijos y considera como atributos el grado de salud de cada uno de
sus hijos. Claramente el que uno de los hijos esté perfectamente no compensa que
el otro pudiera estar muriéndose. Por tanto, un atributo complementa al otro y
no lo sustituye.
Además, la función de utilidad representada en (4.3) puede reescribirse como
(ver Ejercicio 4.14)

u (x,y) = u (x}y0) + u(rc0, 2/)[l + ku(x,y0)]. (4.6)

De (4.6), es claro que si u(xo,y) es creciente en Y entonces

du(x,y) du{x,y)
&y X = X\
dy
X = X2

para u(x 2}y0) > u (xlfy0).


Así, si k es negativo (positivo, cero) y u(x$,y) creciente, el aumento en utilidad
causado por una aumento incremental en Y es más pequeño (más grande, igual)
para cantidades más preferidas de X . En este sentido, k puede interpretarse como
un parámetro que indica la manera en la que la cantidad de un atributo afecta al
valor del otro. Para u creciente, si k es positivo, cantidades más preferidas de X
complementan cantidades más preferidas de Y. Si k es negativo, cantidades más
preferidas de un atributo son sustituías del otro. Y en el caso aditivo, cuando
k = 0, no existe interacción de preferencia entre X e Y.

4 .4 .2 Formas funcionales de utilidades con tres atributos

Aquí presentaremos cuatro resultados para las funciones de utilidad con tres
atributos, X\y X i y X$. Empezaremos con el resultado más restrictivo y ter­
minaremos con el menos restrictivo.
R esultado 1 . Si las preferencias sobre loterías en X u X% y dependen
únicamente de sus distribuciones de probabilidad marginales para estos atributos
y no de su distribución de probabilidad conjunta, entonces

u ( x 1, 052, £3) = 8 ^ 2 (3 3 3 ) + /C3 Ü3 (xs). (4‘7'


© RA-MA _______________ CAPÍTULO 4: PREFERENCIAS EN INCERTIDUMBRE 149

Este resultado es la función de utilidad aditiva de tres atributos. Las funciones

I i
de utilidad w, « i, «2 y U3 de (4.7) pueden ser escaladasdeOalyfej, A^yAfc s
constantes de escala. Usando un conjunto más débil de suposiciones, tenemos

Resultado 2. Si X\ es independiente en utilidad de {X 2,Xs}, y si {X \,X t}


■y {X i,X 3} son preferencialmente independientes de X 3 y X 2, respectivamente,
entonces
«(*1, ®2, X3) = k\Ui(xi) + ktflvfa) + ^3113(13)
+kk\k^,u\(xi)‘w¡(x2) + kk\k3ui(xi)u3(x3) (4.8)
+kf^k3u2(x 2)u3(x3) + k2k\ (ari)«2 (*2)«3 (13).

u, « 1, « 2, «3 y &i, Az, A3 en (4.8). tienen el mismo significado que en (4.7)


Además, k es una constante de escala adicional. Claramente si k = 0, entonces
(4.8) se reduce a la forma aditiva (4.7). Si k / 0, entonces multiplicando cada
lado de (4.8) por k, sumando 1, y factorizando, obtenemos la función de utilidad
multiplicativa que aparece en (4.9)

3
ku(xi,x 2, x3) + 1 = 22 [kkiUi(xi) + 1]. (4.9)
i=l

Existen dos características importantes a resaltar en el Resultado 2: usa las


suposiciones de independencia en utilidad y de independencia preferencial, y estas
suposiciones afectan a conjuntos de atributos solapantes. Ambas características
' son muy importantes en la especificación de las funciones de utilidad multiatri­
buto. Ya que hemos usado la notación «2 y «3 en este resultado, implícitamente
indicamos que puede ser demostrado que X 2 y X 3 son independientes en utilidad
de sus conjuntos complementarios de atributos.
Siendo más generales se tiene
Resultado 3. Si X i, X% y X 3 son independientes en utilidad de sus respec­
tivos complementarios, entonces

u(xi, x¡, X3) = k\U\(xi) + k w v fa ) + ¿ 3143(2:3)


+ki 2kik2ui(xi)u 2(x 2) + ki3kik3ui(xi)u 3 (x3)
+k2sk2k3U2(x 2)U3(x3) + ki23kik2k3Ui(x1)u2(x2)U3(x3).
(4.10)

De nuevo las funciones de utilidad u, «i, U2, U3 y las constantes de escala ki,
¿ 2, k3 son definidas igual que anteriormente. Además, es necesario asignar las
constantes de escala adicionales ki2, &13, Afc3 y &123- La expresión (4.10) denota
una función de utilidad multilineal en tres atributos. Obsérvese que las funciones
de utilidad multiplicativa y aditiva son casos especiales de la multilineal.
Como caso más general en esta sección tenemos
150 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © ra -ma

R esu lta d o 4. Si X 2 y X 3 son independientes en utilidad de sus respectivos


complementarios { X l , X 3} y entonces

U(XÍ,X2,X3) = kim ixx) + Í2{xi)u 2{x2) + U U)


H-/23 (®1)u 2(X2)U3 {X3 ), ’ '

donde

h { x l) = u{xi,x*2, x l ) - u { x u xl,xf),
/ 3 ( » l ) = w (ii,x ^ ,a :^ ) -u(xi,x%,x%),
/2 3 (® l) =u(xi,x%,xl) -u(xi,xi,x$) -u{xx,xl,xl) + u(xi,x%,x%).

En (4.11), de nuevo, cada función de . utilidad es escalada de 0 a 1, con


(x j,® 2,£ 3 ) siendo la consecuencia mejor y (a ?,£«2,£ 3) la peor. Si / 2, h Y /23 son
de ciertas formas, entonces es fácil ver que los resultados (4.7), (4.8), o (4.10), y
por tanto, las funciones de utilidad aditiva, multiplicativa y multilineal, son casos
especiales de (4.11).

4 .4 .3 Generalización a utilidades m ultiatributo

Hemos comenzado realizando el estudio para el caso de dos atributos y hemos


continuado con el caso de tres atributos con la intención de que se vean con
mayor claridad los conceptos introducidos. Sin embargo, la generalización de los
desarrollos realizados es fácil.
Para el caso general, X = X\ x . . . x X n, recordemos que Q = {1 ,... , 71}
es el conjunto de atributos y © un subconjunto del mismo, © C íí, y 0 C su
complementario, ©c = Í2\©. Entonces, © es independiente en utilidad de 0 Csi
las preferencias para las loterías en © que tienen fijado el nivel de los atributos
de ©c en z no dependen del nivel fijado z. Por definición, se tiene que si 0 es
independiente en utilidad de ©c, también es preferencialmente independiente de
©c. Los atributos X i> ... ,X n son mutuamente independientes en utilidad si todo
© es independiente en utilidad de ©c. Si se verifica la independencia en utilidad
mutua entonces (Keeney y Raiffa, 1993)

u (x ) = I J27=i h u i(xi) + f c j ] 2=i h k ju i(x i)u j(x j)


j> i
+fc2 £ ? = i k ik jk iu i( x i) u j( x j) u i( x i) (4.12)
i>* ¡
¡¡-----+ kn~ 1kik 2 •••knUi(Xi)U2(X2) •••Un(®n)

donde

1 . u está normalizada por u(x^} rr§, ••• ,a;X) = 0 y u (x j, x 2l •••, ®J) = 1*

2. uí ( xí )
es una función de utilidad sobre normalizada por úi($?) ~ ® ^
uí(®Í) = 1 , ¿ = 1 , 2 , , , . ,n.
© RA-MA C A P IT U L O 4: PR E FE R E N C IA S EN IN CERTID U M BRE 151

3. ki = u { x ¡ , ^ ) , donde designa (x$ ,■■■,z°_i,z°+1,--- ,x°).

4. fe es la constante de escala solución de la ecuación 1 + fe = IE.1U + li­

cuando fe» = 1, entonces fc = 0 y (4.12) se reduce a la función de utilidad


aditiva
n
u(x ) = Y l ki'H{Xi)-
1=1

Sin embargo, cuando 2S = i k 7^ 1> entonces fe / 0, y multiplicando (4.12) por


fc, sumándole 1 a cada lado de la igualdad y factorizando obtenemos la función
de utilidad multiplicativa:
n
[1 + fcu(a:)] — JJ[1 + fefeiu(xj)]. (4.13)
i=i

En el caso general, demostrar la mutua independencia en utilidad supone


verificarlo para 2" —2 subconjuntos de atributos. Sin embargo, afortunadamente,
con tan sólo probar n condiciones a lo sumo es suficiente, ver Ejercicio 4.6. Lo
que sí se debe tener en cuenta es que no son n condiciones cualesquiera sino que
deben ser imas específicas.
Dadas las condiciones que aseguran la forma funcional (4.12) es importante
saber si es aditiva o multiplicativa. Un procedimiento es tomar dos atributos,
por ejemplo X\ y X<¿. Luego elegimos dos valores de X \, y a/{, entre los que el
decisor tiene una preferencia, y similarmente, elegimos dos cantidades de X 2, por
ejemplo, a/2 y x^. Posteriormente, fijamos el resto de atributos a un nivel,
Entonces si, además de las condiciones que aseguran la forma funcional (4.12), el
decisor siente que

< 1/2, ( 4 , 4 ,3 + 2); 1/2, (zí, 4 ' , ^ ) > ~ < 1/2, (®í,ai'á,^ 2); 1/2,| f | ,4 ,| | ¡ >,

la función de utilidad debe ser aditiva. Si no le son indiferentes estas dos loterías,
entonces la función de utilidad debe ser multiplicativa.
Ahora estudiaremos el caso de que la mutua independencia en utilidad no se
cumpla pero sí que cada es independiente en utilidad del conjunto de atributas
complementario X f i = 1,2, ••• , n. En este caso, tenemos una función de utilidad
multilineal:

u(x) = kiUiixi) + £ j> ( kijui{xi)uj { x})


+ £ ?„, E l > i k {j¡u i(x i)u j(x j)u i(x i) (4.14)
+ •••+ &l2—«Ul (®1 )li2(®ü) ’ ’ ’ Wn(*»)i
152 FU N D A M E N T O S D E LOS S IST EM A S D E A Y U D A A L A D E C IS IÓ N
© RA -M A

donde

1 . u está normalizada por u(x®, x®, ••• , x~¿) = 0 y u(x\, x%, ••• , £*) = i,

2. U{(xí) es una función de utilidad sobre X*, normalizada por = oy


ui(x i) = 1, ¿ = 1 ,2 ,.. . ,71.

3. Las constantes de escala son

hj = u(z*, a j, x?.) - k i - k j
= u(xí, x*jt s?-) - u (e í,x ? ) -
k ji = u (xf, x*p e? , x ? ¡) - % - fcii - % - k i - k j - k i
= ^{x i , xj , x i,^i3i) - . u (x *’ xj ^ j ) - u(xh x h^ii)
- u ( x ¿ , a + u ( x ; , x ? ) + u (xj,xV ) + u (x f,x ?),
kl2-n = u(x*) — fcl...(i-l)(»+l)...n — •••— ¿ i j >i kij ~ Yli ki
= i - £< ) + ••■+ ( - i )n_2

Finalmente, los atributos X i , . . . , X n son aditivamente independientes si para


todo © y todo nivel x ,x ' e y, y' para los atributos de © y ©c, respectivamente,
se verifica

< 1 / 2 , (x ,y ); 1/ 2, (a;',y') > ~ < 1/ 2 , {x,y')\ 1/ 2 , (s ',y ) > .

Cuando se cumple la independencia aditiva entonces la función de utilidad es


aditiva:
n n
u(x) = 2 ju ( x i ,x ¿ ) = } j kj Uj(xj).
i=l t=l

donde

1. u está normalizada por u{xJ , ••• , x „ ) = 0 y u(x\,rrj, ••• , a;*) = 1.

2 . Ui(x{) es una función de utilidad sobre X i, normalizada por u^x^) = 0 y


Ui(x¿) = 1 , i = 1 , 2 , . . . ,n.

3. h = u ( x f ^ ) , i = 1 ,2 ,... ,n.

Además, la independencia aditiva es una condición necesaria para esta repre­


sentación.
Las condiciones necesarias y suficientes para tener una función de utilidad
aditiva pueden establecerse de otra forma (Teorema de Pollak): la preferencia
entre < (sí,x$); ¿ , (* ?,$ ?) > y < i , (a * ,^ '); i , ( s f .s j) > es la misma para
todo Xi (para cualquier xf, xj).
© RA-MA CAPITULO 4: PREFERENCIAS EN INCERTIDUMBRE 153

Diferentes tipos de funciones de valor y utilidad se relacionan de la siguiente


forma: Si 0 , = { l , t } es preferencialmente independiente de 0?, y X\ es inde­
pendiente en utilidad de los otros atributos, la función «(•) debe tener una de las
tres formas siguientes (ver Ejercicio 4.15):

u(x) S _ e~“ (*), (c > o)


u(x) = v(x)
u(x) = e00^ , (c > 0)

donde v(-) es la función de valor aditiva


n
v (x ) = y^ /kiVi(xi).
i=l

4.4.4 Relaciones entre condiciones de independencia en utilidad


y teoremas de representación adicionales

Veamos algunas implicaciones de diferentes conjuntos de condiciones de inde­


pendencia en utilidad. Nos interesará implicar condiciones de independencia en
utilidad de mayor orden a partir de condiciones de orden menor.
Diremos que ©i C fi y ©2 C fi están solapados si su intersección es no vacía
y si ninguno contiene al otro. Luego, si ©i y ©2 son dos subconjuntos solapados
de fi e independientes en utilidad de sus complementarios entonces (ver Ejercicio
4.16):

i) ©i fl ©2 es independiente en utilidad de su complementario.

ii) ©i U ©2 es independiente en utilidad de su complementario.

iii) (©i fl 0 §) U (©i fl © 2) es independiente en utilidad de su complementario.

iv) ©i n ©§ y ©f n ©2 son independientes en utilidad de sus complementarios.

De un modo directo podemos decir que cuantas más propiedades de indepen­


dencia en utilidad se verifiquen, más sencilla será la asignación de la función de
utilidad. Con esto en mente, vamos a construir un “teorema encadenado” usando
los resultados anteriores.
Comencemos definiendo cadena independiente en utilidad como una colección
de subconjuntos de fi, C = {© 1,. . . , ©r}, verificando: i) cada ©,- es independiente
en utilidad de su complementario y ii) existe una ordenación tal que cada ©¿ se
solapa al menos con uno de sus predecesores en la ordenación.
Queremos encontrar cadenas independientes en utilidad que contengan el
número máximo posible de elementos. Esto nos permitirá aprovecharnos de las
154 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © ftA-M A

propiedades de independencia en utilidad para simplificar la forma funcional im­


plícita de la función de utilidad.
Sean { © i , i .. , ©k} tal que cada 0 ; es independiente en utilidad de su com­
plementario y { © j , . . . , 0 r} ,r < fc, una cadena independiente en utilidad. Esta
cadena es una cadena independiente en utilidad maximal si ningún 0 ¿, j =
r + 1 , . . . , fc se solapa con ©j, l = 1 , . . . , r.
Sea { © i , . . . , ©r} una cadena independiente en utilidad maximal. Cada
0 j , j < r, divide el conjunto de atributos en Qj y Qj. Existen 2r posibles sub­
conjuntos de X construidos como intersecciones de los Qj o Qj para cada j < r.
Cada intersección, excepto n j= 1© j, es un elemento de la cadena independiente
en utilidad maximal { © i , . . . ,© r } si es no vacío.
Una propiedad es que cada posible unión de los elementos en una cadena
independiente maximal definida sobre X es independiente en utilidad de su com­
plementario en X . Un ejemplo ,de la potencia de este resultado se muestra en el
Ejercicio 4.6.
A lo largo de esta sección, consideraremos un nuevo atributo Xo dentro de
X para denotar al atributo que no es ni preferencialmente independiente ni in­
dependiente en utilidad de su complementario.
Con estas nuevas condiciones de independencia podemos crear extensiones de
las funciones de utilidad multiplicativa y multilineal. La forma multiplicativa de
(4.13) se extiende para el caso de que existan cadenas independientes en utili­
dad maximales de la siguiente manera (ver Ejercicio 4.17): Dado el conjunto de
atributos X = { X o ,X i ,. . . ,X n} donde X i,i = 1 ,... ,n, son elementos de una
cadena independiente en utilidad maximal, entonces

u(xo, xo) = u ( x o i ^ o ) + [ « ( x o ,$ o ) - w (io ,® o )]u (a :o i * o ) , (4-15)

y si E ”=i kí = !>
n n
t i ( x 8 ,x 0) = Y u f a r f ) = ^2kui{xi), (4.16]
¡=1 *=1

° si £ " = i | É N j
n n
1 + ku{xo, xo) = JJ[1 + ku(xit¡^)] = JJ[1 + kkiUi(xi)], (4'17
«=i <=i

donde
1. sci = ( x o ,x i ,... ,x<_i,,a¡¿+i , . . . ,x n), i = 0 , 1 , . . . ,n.
2. u(a:g,* ? ,. .. , a;°) = 0, |(® o,«í)| ■• , 0 = 1-
3. u í ( x $ ) = 0, u í (x -) = 1, i = 1 , 2 , . . . ,n.

4. ki = u (x * ,^ ) , t = 1 , 2 , ,n,
© ra -ma ULO 4: PREFEREN CIAS EN INCERTIDUMBRE 105

5. fc es la solución de
n
i + f c = n ( i +A:fci).
i=l

Sin embargo, hay situaciones en las que existe más de una cadena independien­
te en utilidad maximal entre el mismo conjunto de atributos. Por ejemplo, si X se
particiona en {Z q, Z\, Zi } y 2¿ es independiente en utilidad de su complementario
¿ = 1,2, tenemos que Z\ y Z-¿ son cadenas independientes en utilidad maximales.
Podemos entonces deducir formas funcionales de funciones de utilidad con más
de una de dichas cadenas considerando conjuntos de hipótesis de independencia
en utilidad sobre atributos no solapantes. Así, la forma multilineal de (4.14) se
extiende de la siguiente manera (ver Ejercicio 4.18): Si X = {-Xi,... ,Xn} se
puede expresar como {Z q,Z i ,. .. ,Zm} donde Zi,l = 1 ,2 ,..., m, es independien­
te en utilidad de su complementario,, entonces la función de utilidad u(x) puede
representarse por

u (x) = g[z0,U i(zi),U 2(z2),... ,Um{Zm)],

donde u¡,l = 1 ,2 ,... , m, es una función de utilidad sobre Z¡. El resultado


específico es

u (x ) = u(zo) + EEi f i { z o ) M zi) + Em¡=i fij(zo)ui(zi)uÁ zj ) + ,


«j<m (4.18)
H------ 1- f ( z0 )u i(zl)u2(z2) ■••Um(zm),

donde
M zo) = u(zo,z¡,z$i) - u(z0ízf,-^ol),
fij(z 0) = u(z 0,zf,z^,z°olj) - u(zo,z¡,z$,zgy)
-u (z o , z f , z *, ¿gy ) + u(z0, Z,°, ),

f ( z o)= w(zo,2o) - E £ l w(^0, + Em¡=l


l<j<m
- E m¡=l U(Z0> z l< z °j, zk’ z0ljk) + ■■■ + (-l)mu(zo, zj,..., *“,).
l<j<m
j<k<m
La importancia de estos dos últimos resultados es que pueden usarse repetidas
veces para ir simplificando la expresión de una función de utilidad multiatributo.
Esto es, los atributos designados por Xi en (4.16) y (4.17), y por Z¡ en (4,18),
pueden ser atributos vectoriales y poseer propiedades de independencia en utili­
dad entre sus respectivas componentes. Si éste es el caso, entonces los resultados
anteriores se pueden usar para especificar las funciones de utilidad ii¡ (®¿) en (4.16)
y (4.17)o u i(zi) en (4.18). El siguiente ejemplo ilustra esto y servirá para aclarar
las definiciones.
156 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© RA-MA

Ejemplo 4.4
Supongamos que queremos asignar una función de utilidad u sobre el conjunto
de atributos X = { X i ,.. . ,_Xg}. Además, supongamos que Yj es independiente
en utilidad de j = 1 , 2 , . . . , 6, donde

Y1 = {X 2,X 3},
Y2 = {X 4,X 5,X 6},
Y3 = {X 5},
Y4 = {X 5,X 6,X 7 ,X 8},
ys = {X 8},
Y6 = {X 8)X 9}.

Existen dos cadenas independientes en utilidad maximales en X: {Yi} y


{ 1^2, 14 . 3^ }. I 3 e I 5 no están en la segunda cadena porque Y3 HYj¡ para j = 2,4,6
es Y3 o el vacío. Lo mismo ocurre con V5, por tanto, por definición de cadena
independiente en utilidad, I 3 y I 5 son excluidos. Así, podemos definir Z\ —Yj
y Z 2 = Y2 U Y4 U Y6 y usar (4.18) para escribir

u(x) = u(zq) + /i(^o)ui(zi) + /2(zo)u2(z2) + /12 (-zo)wi (zi) W2(2$) • (4.19)

Existe claramente sólo un elemento en Yi, pero {Y2, Y4, Y^} tiene
cinco elementos: X 4, X 7, Xg y Xg. Aplicando (4.16)

« 2(^ 2) = kiu'^Xi) + fc56u 56(x 5, * 6 ) + + ksll's (xg) + kgV^(xg), (4.20)

o (4.17)

(4.21)

donde T = {4, (5,6), 7, 8,9}.


Considerando sólo los atributos {X^-Xb}, existe otra cadena independiente
en utilidad que es Yz = {X 5}. Así, por (4.18),

u'56(xs,x6) = u6(xe) + fe{x 6)u'5(x5). (4.22)

Combinando (4.19)-(4.22) se obtiene el desglose de u(x) consistente con las


suposiciones especificadas. □

4.4.5 Métodos de asignación de funciones de utilidad


multiatributo

El siguiente cuadro sistematiza las condiciones para adoptar una u otra forma de
función de utilidad multiatributo.
CAPÍTULO 4: PREFERENCIAS EN INCERTIDUMBRE 157
© RA-MA

Existe función de utilidad


¡ multiatributo

Existe un atributo X, independiente en utilidad


del complementario y {Xt, X,}, para todo i (íPt),
es preferencialmente independiente de su
complementario

Si No
Cada atributo es
Los atributos son independiente en
aditivamente utilidad del
independientes complementario
\
\V
S i/ \N o . vNo
/ —-X——
1Forma 1 Forma Forma Otras
aditiva | | multiplicativa | ¡multilinealj formas

La asignación de una función de preferencia es más un arte que una cuestión


científica, como ya indicábamos en el capítulo de ambiente de certidumbre (Capí­
tulo 2). Las etapas de la metodología y las dificultades de su aplicación práctica
son análogas a las señaladas en dicho capítulo.
Las etapas son cinco:

1. Introducción de terminología e ideas. La idea básica es familiarizar al de­


cisor con el método que usaremos para la asignación de su función de uti­
lidad. Para ello identificaremos los diferentes objetivos y atributos (preferi­
blemente estructurados jerárquicamente) y consecuencias que se conside­
rarán en el problema, a ser posible representándolos gráficamente; el rango
y escala de cada atributo y la dirección de incremento de preferencia en
cada uno de ellos.

2. Identificación de condiciones de independencia relevantes. En esta etapa


se comprobarán las independencias (independencia aditiva, independencia
en utilidad) que existen entre los atributos para saber el tipo de función
de utilidad multiatributo (aditiva, multiplicativa, multilineal) que debemos
considerar.

3. Asignación de las funciones de utilidad componentes. Se trata de obtener


las funciones de utilidad para cada uno de los atributos. En la Sección 4.2
indicamos cómo se pueden asignar estas funciones de utilidad Uí (xí).

4. Asignación de los pesos o factores de escala. Una vez que sabemos el tipo
de función de utilidad multiatributo que tenemos que considerar y cuáles
son las funciones de utilidad componentes, tan sólo nos queda por calcular
los parámetros que relacionan esas funciones para que quede perfectamente
158 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© R A -M A

determ in ada la fu n ción d e u tilid a d m u ltia trib u to . P o r ejem p lo, si sabemos


que ésta es aditiva, d e b e m o s ca lcu la r las con sta n tes k \ , k i , . . . t kn de Ja
expresión.

n
u (x ) = k jU i(x j).
t=l

L a form a d e obten er el valor d e las con stan tes es e sta b lecien d o tantas rela­
ciones d e indiferencia entre pares d e alternativas c o m o con stan tes haya. Ca­
d a indiferencia d a lugar a una ecu a ció n cuyas in cóg n ita s so n las constantes
&i, ••• , kn- P or tan to, se o b te n d rá un sistem a d e ecu acion es cuya solu­
c ión son los valores d e las con stan tes d e la fu n ció n d e u tilida d lineal. Por
ejem p lo, para obtener k\ se le p u ed e pregu ntar al d e ciso r p o r el valor de la
p rob abilid ad p i para qu e se verifique

,a£) > ~ ,®“),

d on d e (x * , x 2, . . . , x * ) es la alternativa fo rm a d a p o r t o d o s los valores más


preferidos d e cad a a tribu to y ( x j , x § , . . . , x ° ) es la form a d a p o r los valores
m enos preferidos, es d ecir, u ( x i , x 2, ■■■ ,x £ ) = 1 y w (x ?, x § , . . . , x ° ) = 0,
y X i es un valor cualquiera del prim er atribu to. E n ton ces, un a vez que el
d ecisor indique el valor d e p i p o d e m o s calcular el valor d e k\

P i u ( x J , x 5 ,... ,x * ) + ( l - p i ) u ( x ? , x § , . . . , x ° ) = w ( x i , x § , . . . , x ° )
Pi = h u i ( x i ) + p i/ u i(x i).

L a últim a equivalencia se tiene p o r ser u ¿ (x ¿ ) = 0 V i. p i y u i ( x i ) son valores


con cretos, y a que el prim ero es p ro p o rcio n a d o p o r el d ecisor y el segundo es
c o n o c id o p orque sabem os quién es u i ( - ) (en el p a so 3 ). P a ra obtener k 2 se le
p regu nta al decisor p or el valor d e la p rob a b ilid a d p2 p ara qu e se verifique

< P2 >(x l>x 2 >- •• i^rDi 1 ~P2> (*11*21- •• >x n) > ~ (® 1 .»2 , ••• . * » ) .

d on d e x ¡ es u n valor cualquiera d el segun do atrib u to. E ntonces, una vez


qu e el d ecisor indiqu e el valor de p2 p o d e m o s calcular el valor d e k 2

P 2 u ( x í , x J ,... ,X * ) + ( 1 - P 2 M X 1 , X § , . . . ,X ° ) = U ( X ? ,X 2 ,.. . , * ° )
& P 2 = feiU i(x5) + k 2 U2 ( x 2) + fe3W3(x § ) H-------- h knUnlx®)
k 2 = P 2 /W 2 (* 2 )-

E l resto d e p arám etros se calcu la d e fo rm a an áloga.


@ b a -m a C A PITU LO 4: PREFEREN CIAS EN IN CERTID U M BRE 159

5, Chequeo de ¡a consistencia. Los chequeos de la consistencia se usan para


detectar errores en la función de utilidad del decisor. Un error significa
que la función de utilidad asignada no representa sus preferencias cuando
se contrasta sobre ejemplos hipotéticos.
Un método para chequear la validez de una función de utilidad consiste
en presentarle al decisor pares de alternativas XjX7 para que indique la
más preferida y posteriormente comprobar que efectivamente la función de
utilidad hace la misma ordenación. Este tipo de chequeo se puede repetir
tantas veces como sea necesario. Puede comenzarse con comparaciones
sencillas e ir aumentando la complejidad progresivamente. En Keeney y
Raiffa (1993) se muestran más métodos.
En la práctica, la imaginación del. analista no se forzará en su intento por
desarrollar chequeos eficientes y efectivos de consistencia. Y si la consis­
tencia produce discrepancias con las preferencias previas indicadas por el
decisor, estas discrepancias deben presentarse al decisor y parte del proceso
de asignación debería repetirse para obtener preferencias consistentes. Una
vez que el decisor y el analista estimen que la función de utilidad obtenida
representa las verdaderas preferencias del decisor, se debe proseguir con el
análisis.

4.4.6 Estructuréis jerárquicas y preferencias condicionales

Supongamos que los atributos para un problema de decisión particular se han


estructurado como muestra la siguiente figura:

Además, supongamos que Y\ e Y¿ son mutuamente independientes en utilidad.


Entonces sabemos que (ver Sección 4.4.1)

« (y i.i/a ) = h M y i) + kju2(3/2) + fci2«i(i/i)u2(y2).


El próximo paso para obtener u(') debería ser escribir u i(’) y uj(-) en función
de las funciones de utilidad de los atributos 1, 2 y 3, y 4, respectivamente. Esto
se podría conseguir, basándose en resultados obtenidos anteriormente, si todos
160 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © HA-Ma

los Xi son independientes en utilidad de su complementario. Sin embargo, la


comprobación de esta independencia puede ser complicada debido a la dimensión
del problema. Afortunadamente, no necesitamos suposiciones tan fuertes, ya que
al ser Y\ independiente en utilidad de Y¿ tan sólo nos debemos preocupar de que
X\ sea condicionalmente independiente en utilidad de X i si Y¿ toma, por ejemplo
el valor y®. X\ es condicionalmente independiente en utilidad de dado j/J, sj
el orden de preferencia de las loterías que comprenden cambios sobre el nivel del
atributo X\ no depende del nivel de X 2 dado y\. Entonces si X\ y X 2 lo son dado
fi>
14/2

u {x i,x 2,y°) = u {xx,xl,yl) + tt(a¡?, ^ 2, 3/ 2) + ku(xi, x%, y\)«(a:?, x2,y°) (4.23)

donde u(a;j,X2, j/2) = 0 y k es una constante que se obtiene empíricamente.

E j e m p l o 4 .5

Consideremos el problema de decisión multiatributo de la legislación del uso


del cinturón de seguridad en los autobuses, representado por la jerarquía de ob­
jetivos de la siguiente figura.

Nuestro interés en este ejemplo es asignar una función de utilidad u(x). Clara­
mente u (x) puede también escribirse como u(y\,yi) o u (x i,x 2,x 3 ,x i). Una forma
razonable de comenzar a estructurar u puede ser con la condición de indepen­
dencia aditiva analizada en la Sección 4.4.1. En primer lugar comprobamos esta
condición para los atributos Y\ e Y¿. Supongamos que no se verifica. Pero sí se
aerifica que Y\ e Y2 son mutuamente independientes en utilidad. Entonces, por
14.3),

u(yi,V2) = u(yi,y°) + u (j/? ,¡/2) + fcu (y i, S /a M v i.J fc ) (424)

londe ^( 2/ 1, 2/°) 1 i
Si queremos simplificar « ( 2/ 1, 2/2) Y u (2/i,2/2) tanto como sea posible y supone-
nos que X i y X 2 son mutuamente condicionalmente independientes en utilidad
© r a -m a CAPÍTULO 4: PREFERENCIAS EN INCERTIDUMBRE 161

dado y®» entonces, por (4.23),

u(yi,y°)
= w (*l,* 2,y 2) + u (x ? ,x 2, 2/§) +kiu(xi,x%,y%)u(x 1,x 2,y%)

donde «(y ?, 2/ 2) = «(»,§, ^212/2) = 0- Obsérvese que la escala de u no ha sido aún


especificada.
Ahora fijémonos en u(y^, y2) = u(¡/J, 2:3 , 2:4). Supongamos que únicamente X 4
es condicionalmente independiente en utilidad de X 3 dado y\. Esto significa (ver
Keeney y Raiffa, 1993; Teorema 5.6),

u(y\,x 3,2:4). = u{y\, x$,x\) [1 - u{y\, 2:4)] , .


+tt(yj, x3, a4 )u(j/J, a$, x4)

donde el origen y la escala vienen dados por u(y^,x^,x^) —0 y u(y\,x®,z!^ = 1-


Como (4.24), (4.25) y (4.26) tienen todos el mismo origen y la escala es sólo
especificada en (4.26), podemos directamente sustituir (4.25) y (4.26) en (4.24)
para obtener una expresión para u(x 1, 2:2,* 3,* 4) en términos de u(xi,x 2,x¡,x°),
u(x i >* 2, * 3, * 4) , u(%i, a¡2j * 3 , * 4), u(x%, x%, * 3, * 4) w(*i, >x 3, *4), k y k\ donde el
origen y la escala de u son establecidos por u(x\, x 2, 2:3, x±) = 0 y u(2:®, x®, * 3, * 4) =
1, respectivamente. Así, en este ejemplo, aprovechando las condiciones de inde­
pendencia e independencia condicional, la asignación de la función de utilidad u
de cuatro atributos se ha simplificado a través de la asignación de cinco funciones
de utilidad de un atributo y dos constantes de escala. □

Estos y otros resultados pueden verse en Keeney y Raiffa (1993), al igual que
condiciones necesarias y suficientes para asegurar las suposiciones de independen­
cia.

4.5 SOFTWARE: Logical Decisions


En esta sección describiremos brevemente el software Logical Decisions for Win­
dows (LDW), Logical Decisions (1998) y http://www.logicaldecisions.com,
que servirá de ayuda a los decisores que tengan que resolver problemas de decisión
complejos. Hemos elegido éste, ya que presenta las siguientes ventajas:

1. Permite el uso de cualquier tipo de objetivo (discreto, continuo, creciente,


decreciente...).

2. El número de alternativas y objetivos que podemos considerar es ilimitado.

3. Las alternativas pueden describirse probabilísticamente,

4. Los objetivos se pueden representar jerárquicamente para ver sus relaciones.


152 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© r a -m a

5. Usa una interfaz gráfica para la asignación de preferencias.

6. Realiza análisis de sensibilidad sobre los pesos de los objetivos (ver Capí­
tulo 8). ~

Los pasos necesarios para resolver un problema con LDW son los típicos del
Análisis de Decisiones que indicamos a continuación aplicándolos al Ejemplo 2.6.

1. Estructuración del problema. Se trata de indicarle al programa las alternati­


vas, objetivos y atributos de que consta nuestro problema. Las alternativas
se introducen de forma matricial, correspondiendo cada fila con una alter­
nativa. Los objetivos y atributos se introducen de forma gráfica para ir
• observando la jerarquía de objetivos que se va construyendo. Así, para el
Ejemplo 2.6 se obtendría:.

Estos objetivos se pueden modificar añadiendo, borrando, cambiando de


nombre, etc. sobre el mismo gráfico.

2. Cuantificación de las alternativas. Consiste en introducir el valor que al­


canza cada alternativa en cada uno de los atributos. En el Ejemplo 2.6 los
valores que alcanzan las alternativas en cada atributo son valores concretos
que han sido introducidos directamente en LDW. Sin embargo, LDW está
dotado de tres métodos alternativos para definir estos niveles:

(a) Niveles probábiUsticos. Los niveles de las alternativas sobre cada atri­
buto pueden expresarse como distribuciones de probabilidad.
(b) Niveles con categorías. Los niveles de las alternativas sobre cada atri­
buto se obtienen con la suma ponderada de varios subatributos llama­
dos categorías.
© RA-MA CAPÍTULO 4: PREFERENCIAS EN INCERTIDUMBRE 163

(c) Niveles definidos por etiquetas. Los niveles de las alternativas sobre
cada atributo se definen con etiquetas en lugar de números explícitos.

3. Asignación de preferencias. Logical Decisions necesita las preferencias del


decisor para saber cómo convertir los valores de los atributos a unidades
comunes de utilidad y cómo calcular la importancia relativa de los atributos
y objetivos. Además, LDW consta de herramientas que nos permiten iden­
tificar los efectos de diferentes preferencias y aquellos juicios de preferencias
que son cruciales para el análisis. La asignación de preferencias consta de
tres pasos:

(a) Definición de un conjunto de preferencia. Los conjuntos de preferencia


son donde LDW almacena los juicios de preferencia de un decisor o
un grupo homogéneo de decisiores. En estos conjuntos existe toda
la información que LDW necesita para calcular la ordenación de las
alternativas para el objetivo global. El cuadro de diálogo sobre el
conjunto de preferencia siguiente consta de un recuadro denominado
“Ñame” donde se puede cambiar el nombre del conjunto de prefe­
rencia. En el recuadro “Reset” se pueden elegir tres opciones para
inicializar las partes que se deseen de la información sobre las prefe­
rencias contenida en el conjunto de preferencia. En el recuadro “Goals
with a MUF” es donde se seleccionan los objetivos que tienen su propia
función de utilidad en el conjunto de preferencia. El “Status” indica
el estado de la asignación de preferencias para el conjunto de pre­
ferencia. En los dos recuadros “Defaults” se seleccionan los métodos
de asignación utilizados para convertir los valores de los atributos a
unidades comunes de utilidad y para la asignación de pesos.

Ñame: [NEW PREF. SET

Reset Goals Wüh a MUF:


Coste
r All SUFs Distancias

r AO MUF*
r AH Category Mulljplieit

Common Un’rts Default: Werght Assessment Default:

Iradeoffs

(b) Construcción de una función de utilidad pora cada atributo. LDW


asigna por defecto una función de utilidad lineal (es decir, una recta)
164 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © R A-M A

con utilidad cero para el valor menos preferido y uno para el más
preferido. Sin embargo, si la función de utilidad del decisor no es
linea], como por ejemplo la que aparece en la siguiente gráfica, puede
introducirla de forma sencilla haciendo uso únicamente del ratón.
íH U n U H $ M D W l.-,{4 w «: SIlF te M M itíej.:-'

ÍS J
Cancel

C t lt r f J Dnmt.. . . T m*y J Ñ S ñ v T T l . . TlfiShr .í¡ M ttlC . . .1 .


m A
(c) Determinación de pesos. Los pesos representan la importancia relativa
de cada atributo. LDW proporciona varios métodos para la asignación
de pesos. El método que aparece en la siguiente gráfica es el conoci­
do como tradeoffs o intercambios, que está basado en la idea de que
alternativas preferidas igualmente deberían tener igual utilidad.

Centro
(Kms)

Trabajo (Kms)

A I A-B
Trabajo (Kms): 15 í 10
Centro (Kms); 1 5 -4
© RA-MA CAPÍTU LO 4: PREFERENCIAS EN INCERTIDUMBRE 165

4. Ordenación de alternativas.

Ranking for ViviendaGoal

Altemative Utüity
casa 1 0.917 í i
casa 2 0.448 I 1
casi 3 0.425 I I

Prefercncc Set= NEW PREF. SET

5. Análisis de sensibilidad. En la gráfica están representadas las utilidades


de las distintas alternativas según el valor del peso del atributo “Precio de
compra” . Se observa que lá mejor alternativa es la “casa 1” para pesos
inferiores a 0.7; y la “casa 3” para pesos superiores a 0.7. La línea vertical
nos indica el peso que estamos considerando originalmente para el atributo
“Precio de compra” . Ya se estudiará esto en el Capítulo 8.

Si queremos saber cómo se comporta LDW con respecto a otros sistemas


de ayuda a la decisión multiatributo puede verse el artículo de Zapatero et al.
(1997). En ese mismo artículo también se indica que LDW es un software que
gusta mucho o disgusta, pero son pocos los que se encuentran en una postura
intermedia. Además, es alabado por su facilidad de uso, uso inteligente de gráficos
y colores, flexibilidad y velocidad de cálculo. Sin embargo, es criticado por lo largo
que resulta todo el proceso y la imposibilidad de cambiar un peso de un atributo
sin realizar de nuevo intercambios (tradeoffs).

4.6 DISCUSIÓN
La validación de la axiomática que conduce a la hipótesis de la utilidad esperada
es origen de la interminable discusión de si la Teoría de la Decisión es simple­
mente normativa o debe considerarse además descriptiva del comportamiento en
166 FUNDAMENTOS DE LOS SISTEM AS D E A YUDA A LA D ECISIÓ N © UA-MA

la práctica del hombre real. Ríos y Ríos Insua (1998) indican que mientras no
se encuentren otros modelos que se ajusten mejor que éstos, se deben considerar
normativos y descriptivos de las decisiones humanas en diversos grados de apro­
ximación, suficientemente satisfactorios en la práctica corriente. Para obtener
una visión de puntos de vista se puede leer Aliáis y Hagen (1979), Bacharach y
Hurley (1991), Edwards (1992), Gardenfors y Shlin (1988), Ríos (1994) y Stigum
y Wenstftp (1983).
En este capítulo hemos estudiado problemas de decisión en ambiente de in­
certidumbre donde las posibles consecuencias y el número de estados eran finitos.
Sin embargo, existen ocasiones en las que se hace necesario el uso de funciones
de utilidad sobre conjuntos infinitos de consecuencias, pero este estudio no lo
trataremos aquí, ya que el soporte matemático necesario se encuentra al margen
de las expectativas de este libro. El lector que esté interesado puede consultar
Bernardo y Smith (1994), DeGroot (1970) y Fishburn (1970,1982). No obstante,
observemos que el espíritu de estos desarrollos se diferencian poco del caso finito.
Los Axiomas 1-7 tan sólo difieren en pequeños detalles técnicos para adaptarse
al caso infinito, siendo la misma racionalidad la que subyace en cada axioma.
La Teoría de la Utilidad multiatributo tiene una vasta y creciente literatura.
Indudablemente la mejor introducción, y realmente, la referencia más importante
actualmente es Keeney y Raiffa (1993). Otras referencias son Arrow (1965),
Ballestero y Romero (1998), Farquhar (1983, 1984), Fishburn (1982), French
(1983) y Keeney(1992) .
En este capítulo sólo se han considerado condiciones de independencia. Sin
embargo, en muchos casos prácticos sería más razonable considerar condiciones
de dependencia. Las preferencias del decisor sobre un atributo pueden depender
de los niveles de los otros atributos. Varios investigadores, quizás más notable­
mente Farquhar y Fishburn (Farquhar, 1981, 1983; Farquhar y Fishburn, 1981;
Fishburn y Farquhar, 1982), han desarrollado el marco necesario en el que iden­
tificar la forma funcional de la función de utilidad dado el conjunto apropiado de
condiciones de dependencias e independencias. Sin embargo, no presentaremos
este marco ya que se requieren resultados matemáticos muy sofisticados.
Finalmente, obsérvese que no hemos considerado las preferencias entre alter­
nativas multiatributo donde cada atributo representa el beneficio obtenido en un
año. En Atherton y French (1997) se presenta un resumen de trabajos recientes
sobre este tema.

4.7 EJERCICIOS

4.1 Consideremos un problema de decisión on ambiente de incertidumbre. Su­


pongamos que el espacio do las consecuencias se puede representar como
X X Y. Demostrar que si X es independiente en utilidad de Y entonces A
es preferencialmente independiente de Y.
@ r a -m a C A PÍTU LO 4: PR EFEREN CIAS EN INCERTIDUM BRE 167

4 2 Si las preferendas de un decisor se representan mediante una función de


utilidad «(•), demostrar que si

(a) u(x) = ax2 + bx + c, entonces su función de aversión local al riesgo es


creciente;
(b) u(x) = —e~cx(c > 0), entonces su función de aversión local al riesgo
es constante;
(c) u(x) = a+b(¡e~cx—ke!x) (b, c, k , l > 0), entonces su función de aversión
local al riesgo es decreciente.

4.3 Un señor llega a un banco con unos ahorros y le pregunta a uno de los
empleados qué es lo que puede hacer con ese dinero. El banquero le dice
que tiene cuatro alternativas posibles: i) invertirlos a renta fija, con lo que
obtendría un beneficio de 1000 euros; ii) comprar acciones del tipo A, con lo
que el beneficio sería de: 10000' euros con probabilidad 0.3, 3000 euros con
probabilidad 0.5 y de -2000 euros con probabilidad 0.2; iii) comprar acciones
del tipo B , con lo que el beneficio sería de: 8000 euros con probabilidad
0.4, 4000 euros con probabilidad 0.5 y de -500 euros con probabilidad 0.1;
iv) comprar acciones del tipo C, con lo que el beneficio sería de: 4000 euros
con probabilidad 0.8, 3000 euros con probabilidad 0.1 y de -500 euros con
probabilidad 0.1. El diente no tiene muy claro cuál es la opción que prefiere
y pide ayuda al banquero. Este le pregunta por el valor p en cada uno de
los siguientes casos:

(a) 8000 ~ < p , 10000; 1 - p , -2000 >


(b) 4000 ~ < p , 10000; 1 - p , -2000 >
(c) 3000 ~ < p , 10000; 1 - p, -2000 >
(d) -500 ~ < p, 10000; 1 - p , -2000 >

y recibe la respuesta 0.8, 0.6, 0.5, y 0.2, respectivamente.


¿Cuál de las inversiones le recomendará el banquero? ¿Cuál le recomendaría
si se basara en el valor esperado del beneficio?

4.4 Juan y Pedro poseen como capital 20000 euros cada uno. Suponemos que
ambos tienen la misma función de utilidad

u(x) = (x -2 0 0 0 0 )1/3.

A Juan le regalan una billete de lotería que tiene como premio 300 euros
con probabilidad 0.5, o nada con la misma probabilidad. Si Juan le vende el
billete a Pedro por 5 euros, comprobar que ambos salen ganando. ¿Cuánto
puede cobrar, como máximo y mínimo, Juan a Pedro por el billete de tal
forma que la venta resulte ventajosa para ambos?
108 F U N D A M EN TO S D E LOS S IST EM AS D E A Y U D A A L A D E C ISIÓ N © RA-MA

4.5 En un problema de restauración de ecosistemas acuáticos contaminados por


radiación nuclear, se. consideran como atributos de interés: x\ = impacto
social, * 2■= impacto medioambiental y X3 = impacto económico. Suponien­
do que los atributos son mutuamente independientes en utilidad y que las
constantes de escala son k\ = 0.4, k2 = 0.3, kz = 0.2, determinar la forma
de la función de utilidad como función de las utilidades de cada atributo.

4.6 Dados los atributos X i,X 2, . ■■,X n, probar que los siguientes resultados
son equivalentes:

(a) Todos los atributos son mutuamente independientes en utilidad.


,n, es independiente, en utilidad de X i.
(c) {X¿,-X¿+i,... ,X n} ,i = 2 ,3 ,... , 71, es independiente en utilidad de su
complementario y {X i,X 2, ■■. , -Xn-i} es independiente en utilidad de
su complementario.
(d) {X í ,X í+i } , í = 1 ,2 ,... ,ti — 1,n > 3, es independiente en utilidad de
su complementario.
(e) X i (o cualquier otro) es independiente en utilidad de su complemen­
tario y {X i,X i},i = 2 ,3 ,... , 71,71 > 3, es preferencialmente indepen­
diente de su complementario.

4.7 Demostrar que si las preferencias del decisor cumplen los Axiomas 1-7,
existe una función de utilidad «(•) sobre X que representa £ según (4.1) y
(4.2).

4.8 Demostrar que si «(•) es una función de utilidad sobre X , entonces w(-) =
au(-) + P, con a > 0, es también una función de utilidad que representa las
mismas preferencias. Recíprocamente, si u(-) y tu(-) son dos funciones de
utilidad sobre X que representan las mismas preferencias, entonces existe
a > 0 y P tal que io(-) = cm(-) + /?.

4.9 Demostrar que la función de aversión local al riesgo en x, r(x ), posee las
siguientes propiedades:

(a) no se ve afectada por transformaciones afines positivas,


(b) r(x) < 0 para funciones cóncavas,
(c) r(x) > 0 para funciones convexas.

1.10 Demostrar que para cada lotería si pi es la prima al riesgo dada por u¿(-)>
t = 1, 2; entonces

si rj(x ) > i'2(x), Vx =*• p! > p2

donde r\(x) y r 2($) son las funciones de aversión local al riesgo asociadas
a ui(-) y u2('), respectivamente.
R A -M A C A P ÍT U LO 4: P R EFER E N C IA S EN INCERTIDUMBRE 109

14.11 Demostrar que si X es independiente en utilidad de Y entonces

(a) para un yo fijado

u{x,y) = a(y)u(x,y0) + ¡3(y), V(x,y) € X x Y,

donde a (y) > 0 y las funciones a(y) y /3(y) se definen con respecto a yo
(el recíproco también se verifica). Similarmente, Y es independiente
en utilidad de X si y sólo si para un xo fijado

u(x,y) = 7 (x)u(x0,y) + 6(x), V(a:,y) € X x Y,

donde 7 (x) > O.y las funciones j(x ) y ¿(x) están definidas con respecto
a xo-
(b) si u(x, y) es una función de utilidad sobre X x Y, Y es independiente
en utilidad de X y (xo,yo) y (xi,yi) son tales que u(xo,yo) = 0,
u (xi,yi) = 1, (xi,y0) >- (xo,yo) y (xo,yi) V (xo,yo), entonces

u(x,y) = u(x,y 0)+ u (x 0,y)+ku(x,yo)u(xo,y)

o equivalentemente

u(x,y) = kx ux {x) + kYuy (y) + kxYUx{x)uY(y)

donde
i) u x(x) es una función de utilidad sobre X normalizada por
u x {xq) = 0 y ux (xi) = 1.
ii) uy(y) es una función de utilidad sobre Y normalizada por
wy(yo) = 0 y uy(yi) = 1.
iii) kx = u(xi,y0).
iv) kY = u(x 0,yi).
v) k xy = 1 —kx - ky y k = kxy/kxky.
Además, la mutua independencia en utilidad es una condición nece­
saria para esta representación.

4.12 Demostrar que si u(x, y) es una función de utilidad sobre X x Y y se verifica:

(a) X e Y son mutuamente independientes en utilidad,


(b) (xo,yo) y (xi,yx) son tales que u(xo,yo) = 0 y tt(xj,j/i) = 1, y tal que
(®i,yo) H (xo,yo) y (®o,yi) pj (®o,ifo)-
(c) para algún x2, X3 6 X , y2, 2/3 € Y, tal que (x2, y2) * (#2, 2/3) y (x2, y2) 16
(X3,V2),

< 1/2, (x2,y2); 1/2, (x3,y3) > ~ < V 2>(*2, 2/3); 1/2, (*s,w) >
170 F U N D A M E N T O S D E LO S SIST EM AS D E A Y U D A A L A D E C ISIÓ N

entonces
u{x,y) = u (x ,y o ) + u(xo,y).

4.13 Demostrar que si u (x ,y ) es una función de utilidad sobre X x Y y X e y


son aditivamente independientes, entonces, si (xo,yo) y (* 1, 2/1) son tales
que u (x 0,yo) = 0 y u f a , y ! ) = 1,
u(x,y) = u(x,y0) + u (x 0,y)
o equivalentemente
u(x,y) = kx ux (x) + kYuY{y)
donde

i) u x(x) es una función de utilidad sobre X normalizada por u x{xo) = o


y ux f a ) = 1.
ii) uY(y) es una función de utilidad sobre Y normalizada por uY(yo) —0
y uY(yi) = 1.
iii) kx = u fa ,y 0).
iv) kY = u fa ,y 1).

Además, la independencia aditiva es una condición necesaria para esta re­


presentación.

4.14 Demostrar que la función de utilidad representada en (4.3) puede rees-


cribirse como
u(x,y) = u(x,y0) + u(xo,3/)[l + ku(x,y0)]
y si u fa , y) es creciente en Y entonces

para u fa ,y o ) > u fa ,y o ).
4.15 Demostrar que si X — X\ x ... x X n y 0 ( = {1 ,¿} preferencialmente inde­
pendiente de 0?, y X i es independiente en utilidad de los otros atributos.
Entonces la función u(-) debe tener una de las tres formas siguientes:

u(x) = -€-«<*>, (c > 0)


u(x) = v(x)
u{x) = e ^ ) , (c > 0)
donde v(-) es la función de valor aditiva

v (x ) =s'5 2 kiVi(xi),
I © RA-MA CAPÍTULO 4'. PREFERENCIAS EN INCERTIDUMBRE 171

4.16 Demostrar que si 0 i y 02 son dos subconjuntos solapados de Í2 e indepen­


dientes en utilidad de sus complementarios entonces

(a) 0 i fl 0 2 es independiente en utilidad de su complementario.


(b) 0 i U 02 es independiente en utilidad de su complementario.
(c) ( 0 i fl © 2 ) U (0 f fl © 2 ) es independiente en utilidad de su complemen­
tario.
(d) ©i fl © 2 y QJ fl © 2 son independientes en utilidad de sus complemen­
tarios.

4.17 Demostrar que si el conjunto de atributos X = { X q,X i , ... ,X n} donde


X i,i = 1 ,... ,ra, son elementos de una cadena independiente en utilidad
maximal, entonces

u (x o ,zo ) = u (x 0,Xq) + ¡u(x0,Xq) - u(xo,Xq)]u(xq,xo), .

y si E ”=i i 1 1
n n
u (Xq,X o) = ) j j ,(x j ,x (¿) = ^ kjlLi(Xj),
»'=1 t= l

0 si Z )Í L i h É i
n n
1 + ku(xo, xo) = JJ[1 + ku(xi, x?)] = JJ[1 + &&¿ííí(x¿)],
¿=l f=i

donde
i) x¿ = ( x o ,x i,... ,x¿_i,x¿+i , . . . ,x „ ) ,i = 0 ,1 ,... ,71.
ii) u(xg, x j,... , x°) = 0, u(x¡5, x*,.. •, x*) = 1.
iii) Ui(x¿) = 0, Ui(x*) = 1, i = 1 ,2 ,... ,n.
iv) ki = u(x*, x¿), ¿ = 1 ,2 ,... , n.
v) k es la solución de

1 -t- k —JJjl "t"

4.18 Demostrar que si X —{X \,... ,Xn} se puede expresar como {Zo,.. . , Zm}
donde Zi,l = 1,2, •••, m, es independiente en utilidad de su complemen­
tario, entonces la función de utilidad u(x) puede representarse por
172 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
©RA-M

donde u¡, l = 1,-2,... , m, es una función de utilidad sobre Z¡. El resultad


específico es
m m
= u{z0) + 2’ 2 fi(z 0)u i(z i)+ flA Zo)Ul{Zl)Uj{.Zj) +
1=1 1=1
l<j<m
• •+ f ( z o ) u i ( z i ) U 2 ( Z 2 ) • ■ •U m (Z m ),

donde

fl(z o ) =
i ü u ( z o ,Z Í ,Z ¿ ,Z g y ) - u (2 o , ^ * ,2 ° ,^ o y )
-« (¿ ü , S g y ) + Ú (zo , z f , z ? , ^ . ) ,

fik M “ (*0, *C¡) - E S l iírfl2 °,* o j) + E mi=i u(zo, M zj , zOii)


l< j< m J J
- £ j = i K S zQ jA > Toijk) + •••
j<k<m
+ (-l)mu(*o,*!>••• ,-&)•
APÍTULO 5

tablas y ár bo les de
DECISIÓN

Como se ha visto en capítulos anteriores, el Análisis de Decisiones se basa


en los principios de la Teoría de la Probabilidad y en un conjunto de axiomas
derivados de la Teoría de la Utilidad. Las creencias del decisor sobre la ocurrencia
de los estados se modelizan mediante una distribución de probabilidad que se ac­
tualiza mediante la fórmula de Bayes, ver Capítulo 3. Las preferencias del decisor
sobre las consecuencias y sus actitudes frente al riesgo se modelizan mediante una
función de utilidad (afín única) u(a, 6), que indica la utilidad obtenida cuando se
toma la alternativa a y se da el estado 9, ver Capítulo 4. Finalmente, en dicho
capítulo se vio que la alternativa preferida desde una perspectiva bayesiana era
la de máxima utilidad esperada.
La creciente disponibilidad de potentes ordenadores nos está llevando al trata­
miento de problemas cada vez más complejos dentro de este marco coherente de la
Teoría de la Decisión bayesiana. Pero a su vez, ello exige mejores herramientas de
representación de problemas y conlleva difíciles problemas computacionales. Éste
será el tema principal en el capítulo que ahora nos ocupa. Estudiamos dos formas
clásicas de estructurar y evaluar problemas de decisión, ambas matemáticamente
equivalentes. Se exponen en profundidad, junto con el software existente en la
actualidad. Varios inconvenientes importantes sugieren buscar nuevos modelos
de representación, lo que analizaremos en los dos capítulos posteriores.

5.1 TABLAS DE DECISIÓN


Supongamos que una persona tiene que elegir una alternativa de un conjunto.
El problema de decisión puede ser extremadamente complejo debido a la pre­
sencia de factores como metas y objetivos múltiples y conflictivos entre sí, vari®5
lentes de incertidumbre multidimensionales, un entorno cambiante e i ui o
174 F U N D A M E N T O S P E LO S S IST E M A S D E A Y U D A A L A D E C IS IÓ N © R A-M a

por las decisiones ya tomadas, distintos grupos afectados por las decisiones, etc
La incertidumbre obliga a tomar decisiones sin conocer con seguridad determi­
nados factores externos que no se controlan (estados) y que van a influir en la
consecuencia de la decisión tomada.
Las tablas de decisión, a veces llamadas matrices de estrategias, tienen sus
orígenes en el trabajo de von Neumann y Morgenstern (1944) sobre juegos en
forma normal. Expresan la idea básica de que las consecuencias de elegir una
decisión no dependen sólo de ésta -en las filas de la tabla- , sino también de
tales estados -en las columnas-, de forma que si el decisor conociese el verdadero
estado (teniendo así un problema de decisión en ambiente de certidumbre, ver
Capítulo 2), podría predecir la consecuencia de su elección con certeza:

decisión + estado —> consecuencia.

Si .A es el conjunto de decisiones a, 0 es el conjunto de estados 9 (exhaustivo


y mutuamente excluyente) y C es el conjunto de consecuencias c, la asignación se
representa

o -f- 9 —f c(a, 9) EC

que, escrito en forma tabular, constituirá la tabla de decisión. Los valores de


la tabla indicando consecuencias podrán ser, en general, preferencias sobre las
consecuencias, expresadas mediante una función de utilidad.
Así, en el caso discreto, si suponemos que hay n alternativas denotadas
ai,...,an, y m estados 9i,...,9m, el decisor es capaz de asignar it(ai,0j), Vi, j,
es decir, la utilidad obtenida cuando se toma la alternativa a¿ y se presenta el
estado 9j. Estos valores se organizan en formato tabular como la Tabla 5.1.

Tabla 5.1: Tabla de decisión genérica

01 92 Om
ai u(ai,0i) u (a i,0 2) .
02 u(a2,0 i) u(a2,92) . * w(d2> ®m)

Q-n u(an,9 i) u(an,02) . $m)

Para resolver el problema, asignada una distribución de probabilidad sobre


el conjunto de estados dada por p(9j) = P j, (Pj > 0 , £ P j = 1), calculamos la
utilidad esperada de cada alternativa a¡
m
= £«(<*»)•
j= i
La evaluación de la tabla conduce a la decisión do in&xi:ima utilidad esperada,
denotada a*, que se propone como alternativa óptima

mex E u (üí) = Eu(a*).

Para el caso de .4 ,0 continuos se procede de forma similar proponiéndose ti*


tal que Eu(a*) = msxa^ E u ( a ) donde

lo que típicamente será un problema de programación no lineal.

Ejemplo 5.1 (desarrollo de software)


Una compañía de software está pensando en ampliar la gama de productos que
vende en el mercado. Actualmente ofrece programas de gestión a otras empresas
pero quiere expandir su negocio hacia el mundo del ocio y entretenimiento. El
director sabe que otras empresas se han beneficiado con este tipo de producto.
Sin embargo, poner en marcha esta idea le costará muy caro, y ha observado
en los últimos meses que el precio de venta de estos programas lúdicos no es
demasiado alto.
Las posibilidades son: ai, poner en marcha la idea contratando nuevo personal
especializado; 02, ponerlo en marcha a menor coste mediante la formación del
personal actual; y 03, no ponerlo en marcha. Los beneficios dependen de si el
precio de este tipo de software se incrementa respecto al actual. Se estima que
la probabilidad de que ocurra este incremento (d\) es de 0.5, de que se mantenga
(62) 0.3 y de que disminuya (#3) 0.2. En la Tabla 5.2 se indican las utilidades
asociadas a cada par (a¿, Qj).

Tabla 5.2: Utilidades para el problema del software

61 62 #3
ax 90 30 -50
a2 50 10 -20
03 0 0 0

Obsérvese cómo el programa de contratación de nuevo personal proporciona


utilidades considerables si los precios son buenos, pero reporta grandes pérdidas
si los precios bajan debido a los gastos no rentabilizados. La asignación de esta
función de utilidad se lleva a cabo con métodos estándar de la Teoría de la
Utilidad ya explicados anteriormente (Capítulo 4). Se comprueba primero que
las preferencias del decisor satisfacen los axiomas requeridos por esta teoría, se
asigna la utilidad de algunas consecuencias y después, mediante herramientas de
análisis numérico, se puede ajustar una función a los datos obtenidos.
170 FUND AM EN TO S D E LOS S IST EM AS D E A Y U D A A L A D E CISIÓ N

Las utilidades esperadas son

Eu(ai) = 90 x 0.5 + 30 x 0.3 - 50 x 0.2 = 44


Eu(a2) = 50 x 0.5 + 10 x 0.3 - 20 x 0.2 = 24
Eu(aa) = 0.

Por tanto, la opción óptima será ai, contratar a personal especializado, con
una utilidad máxima esperada de 44. Q

5.2 ÁRBOLES DE DECISIÓN


Las tablas de decisión constituyen la forma más elemental de representación de un
problema de decisión. Si bien nos han servido para ilustrar los conceptos básicos,
son muy limitadas desde un punto de vista práctico, ya que sólo permiten un
momento de elección.

5.2.1 D efinición

Los problemas de decisión reales suelen ser dinámicos, existiendo varias decisiones
encadenadas a tomar y la alternancia de la ocurrencia de distintos fenómenos
aleatorios. Por ejemplo, una compañía que está diseñando chips a partir de
varios materiales nuevos superconductores, debe elegir primero entre ellos y en
una etapa posterior, a partir del posible éxito o fracaso de su implantación, quizá
tenga que elegir si el diseño debe ser modificado aunque ello reporte más gastos
y no garantice tampoco el éxito, etc.
Si tratásemos de representar esto mediante una tabla resultaría muy farra­
goso, como veremos después en la Sección 5.2.3. Adoptamos entonces una repre­
sentación alternativa más flexible y expresiva: la de árboles de decisión, cuyos
orígenes los encontramos en Raiffa y Schlaifer (1961), a partir también de los
trabajos de von Neumann y Morgenstern (1944) sobre juegos en forma extensiva.
Un árbol de decisión es un árbol con tres tipos de nodos:

• de decisión (nodos rectangulares), del que emergen ramas que representan


las decisiones posibles que se pueden tomar en ese instante;

• de azar (nodos circulares), cuyas ramas representan los estados posibles que
se pueden dar en ese instante;

• de valor (terminales), que representan la utilidad de las consecuencias aso­


ciadas a la sucesión de decisiones y estados desde el nodo raíz hasta ese
nodo. A menudo a esta sucesión o camino se le denomina escenario.
@ RA-MA CAPÍTULO 5: TABLAS Y ÁRBOLES DE DECISIÓN 177

Para construir el árbol se comienza identificando el nodo raíz, que corres­


ponderá al primer hecho que se observa en el tiempo: una toma de decisión o
la presencia de un factor de incertidumbre. Se continúa desde la raíz incluyendo
nodos de azar o de decisión marcando los distintos caminos a seguir, hasta alcan­
zar un nodo terminal, en el que se indicará la consecuencia correspondiente. Por
tanto, el tiempo transcurre de izquierda a derecha, desde la raíz hasta los nodos
de valor. El decisor puede escoger qué rama de un nodo rectangular seguir pero
no qué rama de un nodo de azar, pues estarán determinadas por circunstancias
que se encuentran fuera de su control. La Figura 5.1 es el árbol equivalente a la
tabla de decisión genérica de la Tabla 5.1. La secuencia dibujada expresa que el
estado 9j es desconocido cuando se toma la decisión Oj,: Vi, j.

Figura 5.1: Árbol de decisión genérico

Ya hemos construido el esqueleto del árbol representando información cuali­


tativa del problema, es decir, el proceso de decisión con sus elementos: objetivos,
alternativas y fuentes de incertidumbre. La especificación completa del proble­
ma debe incluir también el conocimiento cuantitativo, reflejando básicamente las
relaciones entre los elementos y los juicios del decisor a través de probabilidades
y utilidades.
Se completa entonces el árbol de decisión incluyendo las utilidades en los
nodos terminales y las probabilidades en las ramas de cada nodo de azar. En los
nodos terminales, la asignación de un valor a un resultado final se realiza bajo la
hipótesis de que ese resultado se ha alcanzado sin necesidad de consideraciones
probabilísticas. En cada nodo de azar, las probabilidades en las ramas deben
sumar uno e indican probabilidades condicionadas a que los sucesos a su izquierda
ya han ocurrido y las decisiones previas se han tomado.
178 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© RA-M a

Ejem plo 5.1 (desarrollo de software) (continuación.)


La Figura 5.2 representa el árbol de decisión completo para el problema del
software. D indica la decisión a tomar, P es el estado del precio del software
lúdico. Nótese, en los nodos terminales, la presencia de las utilidades de las
consecuencias de cada camino del árbol, y en los nodos de azar, las probabilidades
de los posibles estados de los precios.

Figura 5.2: Árbol de decisión para el problema del software

Antes de evaluar el árbol de decisión debemos aseguramos de que se han


definido claramente y refinado todos los elementos del problema, pues las prime­
ras estructuraciones suelen incluir especificaciones bastante pobres e incompletas.
Para ello se puede pasar el test de claridad. (Howard, 1988). Con éste contrasta­
mos si un clarividente que tuviera acceso a toda la información futura, podría
determinar inequívocamente cuál sería el resultado de cualquier suceso, sin uti­
lizar ningún juicio e interpretación. Si la especificación del problema pasa el test
de claridad, todas las personas involucradas en el problema de decisión pien­
san de la misma forma sobre sus elementos sin que haya malentendidos en sus
definiciones.
Así, en el ejemplo anterior, la compañía de software debe preguntarse en el
nodo P cuáles son los posibles estados de los precios y cómo se medirán (en dólares
o en euros). Tendrá que aclarar qué significa que el precio sube y cuál es el periodo
para el que estima las probabilidades de cambios en los precios del software. TJ
vez decir que el estado del precio puede consistir en subir, mantenerse o bajar no
pase el test de claridad, pues lo que para unos es subir para otros es mantenerse.
H © RA-MA CAPÍTULO 5: TABLAS Y ÁRBOLES DE DECISIÓN 179

Esto podría arreglarse definiendo “subir” como una subida promedio superior
■ gj 10% en el último mes, pasando entonces el test. Definir sucesos y decisiones
I para que pasen el test significa especificar claramente los valores de cada variable
I aleatoria, la alternativa de cada decisión y las consecuencias. Por tanto, el test
I tiene lugar a lo largo de las ramas del árbol que es donde se han especificado los
I detalles críticos. Cuando todos los elementos pasan el test, entonces ya puede
I resolverse el árbol de decisión.

I 5.2.2 Evaluación

I El árbol de decisión consiste en un conjunto de estrategias o políticas que indican


planes dé acción sobre qué elección se hará én cada punto de decisión que puede
alcanzarse con tal plan. Así, en el- ejemplo de los chips, una estrategia sería:
escoger un material determinado y si falla, modificar su diseño.
La evaluación de los árboles de decisión tiene como objetivo identificar una
estrategia óptima. Se realiza de forma eficiente mediante el método regresivo de
la programación dinámica (principio de optimalidad, Bellman y Dreyfus, 1962).
Regresivo hace referencia a que se trabaja hacia atrás, en el orden inverso al
orden en que los sucesos y decisiones realmente ocurren, es decir, trabaja de
derecha a izquierda. No podemos decidir qué hacer hoy hasta que hayamos
decidido qué hacer mañana, lo cual puede estar influenciado por las decisiones de
hoy. Por tanto, las últimas decisiones se analizan primero porque determinan las
consecuencias de decisiones anteriores.
La idea principal es que, suponiendo que hemos tomado ciertas decisiones y
la naturaleza ha adoptado ciertos estados, habremos llegado a un nodo que podrá
ser:

• terminal, y le asignaremos la utilidad de la consecuencia;

• de azar, y le asignaremos la utilidad esperada máxima, a partir de ese nodo;

• de decisión, y le asignaremos la utilidad esperada de la decisión de máxima


utilidad esperada, a partir de ese nodo.

Partiendo de los nodos terminales, aplicamos sucesivamente este proceso re­


gresando hacia el nodo raíz y encontrando una estrategia óptima, es decir, de
máxima utilidad esperada. Se dice entonces que el problema es analizado en
forma extensiva.
Formalizando la idea, el nodo i lleva asociado un tipo y ramas (fe,- =
1,2,3... valiendo 1 para U =terminal). Cada rama j de un nodo i tiene un nodo
sucesor n¿¿. Si j es una rama de un nodo de azar i, lleva asociada una probabilidad
Pijfa), donde s¡ son los valores de todas las variables de los nodos predecesores
de i. El mejor valor asociado a cada nodo i dependerá de s¿, se denotará por
y vendrá dado por:
180 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN -® « A-m ¿

u(c(sí)) si U = terminal

Í maxv(riij, (s¿, i —>j) )

Sg
si í¿ = decisión

/ jVjjHji ^j ) ) Píj(sí) si t% azar


j=i

donde (s¿, ¿ —>j ) indica que ha ocurrido s¿ y se transita del nodo i al j. Si i es el


Ejem plo 5.2
nodo raíz, (com s¿
entonces pra de h elicóp tero).
= 0.
La Comunidad Autónoma de Madrid (CAM) está pensando en comprar (C)
un helicóptero paxa contar con más recursos frente a los incendios forestales.
En algunas situaciones extremas, interesa poder contar con helicópteros que sean
muy maniobrables. Se puede decir que este tipo de compra püede presentar
los estados (E ) muy maniobrable (ei), medianamente maniobrable (e2), o poco
maniobrable (e3), incrementándose los precios y la eficiencia de los pilotos según
aumenta esta capacidad. Antes de decidir sobre j la compra, la CAM tiene la
opción (P) de realizar una prueba simulada que medirá la mínima distancia a
la que puede aproximarse a un recinto de difícil acceso. Esta prueba tendrá un
coste determinado y sus resultados (i?) no serán predicciones explícitas sobre
la maniobrabilidad del helicóptero, sino que tan sólo se emitirá un informe en
términos de apto (ra) o no apto (rn). El problema se representa en el árbol de la
Figura 5.3.
La secuencia cronológica del árbol de decisión consiste, primero, en decidir
si encargar o no la prueba, observar después los resultados de ésta (en caso de
encargarla), y a continuación, decidir si comprar o no el helicóptero. Aún queda
alguna incertidumbre residual en el problema y que afecta a la utilidad: ver cuál
es el estado del helicóptero, que se desvelará en caso de comprarlo. Nótese cómo
cualquier asimetría estructural queda representada explícitamente en el árbol:
por ejemplo, vemos que los resultados de la prueba se obtendrán sólo si la CAM
decide encargar que se realice.
En este ejemplo parece lógico pensar que la CAM deba comprar (no comprar)
el helicóptero después de obtener un resultado de apto (no apto), pero no siempre
es así. Dependerá de sus creencias específicas a priori sobre las posibilidades del
helicóptero, de cómo perciben la pericia del piloto que hará la prueba, y de la
valoración de las posibles consecuencias. Los tres nodos C de la Figura 5.3 no
son idénticos: el conocimiento que tiene la CAM es diferente en cada caso y por
tanto, sus creencias sobre el helicóptero diferirán.
Especificamos la información cuantitativa haciendo patente estas ideas. La
distribución de probabilidad a priori sobre los estados de maniobrabilidad viene
dada por: P (ei) = 0.3, P (e2) = 0.4. Puesto que el piloto puede cometer errores y
D r a -m a CAPÍTULO 5: TABLAS Y ÁRBOLES DE DECISIÓN 181

coste
de la prueba
en estos
casos

Figura 5.3: Árbol para el problema del helicóptero

la prueba es sólo simulada, se asigna P(ra|ej) = 0 .9 , P ( r a | e 2 ) = 0 .6 5 , P(ra|e3) =


0 .1 5 .

Pero en el árbol se necesitan las probabilidades de E\R y de R, que podemos


calcular mediante el Teorema de Bayes:

P(ra) = P(ra|ei)P(ei) + P(ra|e2)P(e 2) + P(ra|e3)P(e3) =


= 0 .9 x 0 .3 + 0 .6 5 x 0 .4 + 0 . 1 5 x 0 .3 = 0 .5 7 5

M i l 1 -F W e .)« _ 0 .9 x 0 .3 _ „ „
P( ra ) 0 .5 7 5

P ( r a | e 2) P ( e 2) 0 .6 5 x 0 .4
m iJ = P (ra ) 0 .5 7 5

P ( r a | e 3) P ( e 3) 0 . 1 5 x 0 .3

P (ra ) 0 .5 7 5

A n á lo g a m e n t e s e c a l c u l a r í a n la s c o n d i c i o n a d a s a q u e la p r u e b a d io no apto (rn ).

T o d a s a p a r e c e n e n e l á r b o l d e l a F i g u r a 5 .4 .

L a s c o n s e c u e n c i a s y s u s u t i l i d a d e s s e a s ig n a n c o m o y a so h a v is t o e n c a p ítu lo s

a n t e r i o r e s , c o m e n z a n d o c o n u n a j e r a r q u í a d e o b j e t i v o s . E n e s t e c a s o in t e r e s a r á n
182 F U N D A M E N T O S D E L O S S IS T E M A S D E A Y U D A A L A D E C IS IO N
© J U -v

e, 0.470
0.85

0.43
0.00

0.25
0.85

0.43

0.00

0.25

0.86
0.44
0.01

0.26

Figura 5.4: Evaluación del árbol del problema del helicóptero

aspectos como minimizar el coste de la prueba y del helicóptero, minimizar el


riesgo de los pilotos y la extensión quemada..., con fines de dar buena imagen y
mantener sanos los bosques. Supongamos que tras el proceso de asignación, la
función de utilidad toma los valores que aparecen en los nodos terminales (Figura
5.4). Supongamos también que el coste de la prueba es de 600 euros, lo que ya
se ha tenido en cuenta en dichos valores.
La Figura 5.4 presenta la evaluación del árbol. En cada nodo E calculamos
la utilidad esperada y la escribimos sobre el nodo. Por ejemplo, en el primero:

0.470 x 0.85 4- 0.452 x 0.43 + 0 = 0.594.

Moviéndonos hacia atrás, en la decisión C, como 0.594 > 0.25, quiere decir que es
mejor comprar. Dibujamos dos barras paralelas cortando el camino de la opción
no elegida. La utilidad esperada “ganadora” se copia en el nodo de decisión
donde ahora es tratado como un nodo terminal para la rama apto. Continuando
el proceso hasta el nodo raíz P , leemos del árbol en las ramas seleccionadas una
política óptima para la CAM: realizar la prueba; si el resultado es apto, comprar
el helicóptero; si no es apto, no comprarlo. La utilidad máxima esperada es 0.448.
El estudio debe completarse con análisis de sensibilidad, como veremos en el
Capítulo 8. En general, el análisis de sensibilidad estudia cómo cambia la política
0 RA-MA CAPITULO 5: TABLAS Y ÁRBOLES DE DECISIÓN 183

óptima si modificamos los juicios iniciales (probabilidades y utilidades) en un


entorno. Detectaremos así las variables más sensibles a los cambios, cuidando
entonces el método de asignación de tales juicios. Por ejemplo, hemos supuesto
que el coste de la prueba venía dado y por tanto no es negociable. Sin embargo,
con frecuencia no es así y podemos investigar cuánto estaría dispuesta a pagar la
CAM por la prueba (como máximo) para que le compensase y a partir de ahí,
negociar el precio. Con ello se da un valor a la información que uno espera ganar
de una fuente. Obsérvese que el árbol aconseja comprar el helicóptero si no se
hiciese la prueba. Estos resultados adicionales también son útiles para el análisis
de sensibilidad.
Por otra parte, debemos señalar que la estrategia obtenida en el ejemplo se
ha sugerido a partir de la información disponible en el momento de construir el
árbol. Si ésta fuera distinta según pasa el tiempo, la CAM podría cambiar su
percepción y, por tanto, su recomendación. □

5.2.3 Equivalencia entre tablas y árboles

Como ya hemos indicado, las tablas y árboles de decisión son herramientas


matemáticamente equivalentes. Dado un problema en forma de árbol, puede
representarse en forma de tabla, y viceversa. Por ejemplo, vimos el árbol equiva­
lente a la tabla del problema del desarrollo del software (Ejemplo 5.1, Figura 5.2).
En el sentido inverso, es obvio que la tabla equivalente a un árbol es farragosa al
tener que contener la enumeración de las posibles estrategias, pues sólo permite
un punto de decisión. Como consecuencia, antes de la evaluación, se requiere
un preproceso para calcular, además de las estrategias posibles, la distribución
conjunta de todas las variables aleatorias del problema, y los cálculos no son
locales.
Apliquemos las ideas al problema del helicóptero.

Ejemplo 5.2 (compra de helicóptero) (continuación)


Para construir la tabla de decisión de este problema debemos identificar cuáles
son los estados (para las columnas) y cuáles las alternativas (para las filas). Los
estados vienen dados por la variable aleatoria bidimensional [R,E), es decir,
por todas las posibles combinaciones de resultados de la prueba y de estados de
maniobrabilidad del helicóptero. La función de probabilidad de dicha variable
aleatoria discreta se obtiene, por las leyes de la probabilidad, a partir de las
probabilidades condicionadas y las marginales según

P(R,E) = P(R\E)P(E) = P(E\R)P(R).

Eas alternativas serán las estrategias posibles. Cada una debe indicar si se
hace la prueba o no. Denotamos: A\ = hacer la prueba; A2 = no hacerla. Si se
^acei debe indicar también si comprar (c) o no (->c) ante cada posible resultado
]t*í4 FU N D AM EN TO S D E LOS SISTEM AS D E A Y U D A A L A DECISIÓ N © r a -m a

de la prueba. Hay cuatro posibilidades si so escoge A\, que denotamos por 1^


funciones a* siguientes:

fli(ra) = c ; oi(rn) = c
aa(ra) = c ¡ ai (rn) = ->c
03 (ra) = -ic ¡ a3 (rn) = c
04(ra) = ->c ; 04 (rn) = -ic.

Por ejemplo, 0.3 indica que no se comprará el helicóptero si el resultado de la


prueba es apto, y se comprará si no es apto.
Finalmente, la tabla de decisión es la Tabla 5.3. La distribución de probabili-
dad.de los estados aparece junto a ellos. Para calcular las utilidades, se procede de
la forma siguiente. Por ejemplo, si queremos obtener la utilidad que corresponde
a la primera fila y segunda columna, vemos que va asociada a realizar la prueba
(Ai), obtener resultado apto (ra), comprar (ai(ra) = c) y obtener un helicóptero
medianamente maniobrable (eg). Por tanto, su utilidad es 0.43. Recuérdese que
las utilidades se tenían en la Figura 5.4.

Tabla 5.3: Tabla de decisión del problema del helicóptero

(ra,e!) (ra,e2) (ra,e3) (rn,ei) (rn,e2) (m,e3)


0.27 0.26 0.045 0.03 0.14 0.255 útil. esp.
( Ai , a i ) 0.85 0.43 0 0.85 0.43 0 0.427
( A i , <12) 0.85 0.43 0 0.25 0.25 0.25 0.448
(Ai, <13) 0.25 0.25 0.25 0.85 0.43 0 0.229
( Ai >04) 0.25 0.25 0.25 0.25 0.25 0.25 0.250
( A2, c) 0.86 0.44 0.01 0.86 0.44 0.01 0.437
(A2i - ic) 0.26 0.26 0.26 0.26 0.26 0.26 0.260

La última columna corresponde a la utilidad esperada asociada a cada es­


trategia. Las tablas de decisión contienen, por tanto, las utilidades esperadas de
todas las estrategias, no sólo de la óptima. El máximo es 0.448, en la segunda fi­
la, que lleva asociada la misma estrategia que obtuvimos resolviendo el problema
mediante un árbol de decisión.
Obsérvese que al resolver el problema mediante un árbol, la máxima utilidad
esperada viene dada por

max ER\P max Ee \r¡p u(P, R, C, E)

mientras que con una tabla es

max
P
max
a
Ee E ri\e ip u' (P ,R , a(R) , E)

y puede demostrarse que ambas expresiones son equivalentes.


@ RA-MA CAPÍTULO 5: TABLAS Y ÁRBOLES DE DECISIÓN 185

Como consecuencia, una forma alternativa (y poco eficiente) de resolver un


árbol de decisión sería a partir de su' tabla de decisión equivalente. Se dice
entonces que el problema es analizado en forma normal.

5.2.4 Propiedades

Las tablas de decisión, los árboles, y cualquier otro modelo gráfico presentan ven­
tajas e inconvenientes que hacen aconsejable su uso (o desuso). Estas propiedades
se refieren a la forma en que el modelo ayuda a la representación del problema y
a su solución -propiedades de representación- y también a cuáles son los requisi­
tos computacionales para obtener la solución y generar las salidas -propiedades
computacionales- Ambos tipos de propiedades, a veces solapantes, son básicas
a la hora de estructurar el problema, asignar probabilidades, presentar los resul­
tados del análisis, etc. En esta sección analizamos las propiedades de los árboles
de decisión que servirán para compararlos con otros métodos alternativos que se
introducirán posteriormente.

Expresividad
Los árboles son herramientas muy intuitivas y fáciles de comprender al repre­
sentarse todos los caminos posibles que recorreríamos en un problema dado. La
representación explícita de la cronología del proceso de decisión (de izquierda a
derecha del árbol) y del estado de información en cada nodo le hacen ser simple y
flexible. Además, la estructura del problema y la estrategia óptima se representan
conjuntamente en el árbol resultando muy sencilla la lectura de la solución.

Modelización sencilla de asimetrías


Al representar todos los caminos o escenarios posibles, resulta muy apropiado
el tratamiento de asimetrías mediante un árbol de decisión. Decimos que un
problema de decisión es asimétrico si: el número de escenarios en su árbol co­
rrespondiente es menor que el cardinal del producto cartesiano del espado de
estados de todas las variables (aleatorias y de decisión), o bien, existen al menos
dos escenarios en los que difiere el orden temporal relativo de dos variables. Por
tanto, en un problema simétrico todos los escenarios tienen las mismas variables
y en la misma secuencia. En el problema del helicóptero (Ejemplo 5.2), se tienen
dos asimetrías: los resultados de la prueba sólo se conocen si se decide realizar la
prueba; el estado del helicóptero sólo se revelará si se decide comprarlo.
Las estructuras asimétricas se hacen patentes en un árbol, y puesto que la
evaluación se realiza sobre el mismo, la carga computacional se reduce conside­
rablemente al aprovechar estas estructuras.
186 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

Crecimiento exponencial
A pesar de su capacidad descriptiva, los árboles se vuelven excesivamente com­
plejos cuando aumenta el número de nodos de azar y /o de decisión. Precisa­
mente, debido a la representación explícita de acciones y eventos, cada nodo
añadido al árbol expande su tamaño exponencialmente de forma que solamente
pueden mostrarse a nivel de detalle modelos pequeños y relativamente simples.
En un problema simétrico con n variables, cada una con 2 posibles valores, hay
2n caminos posibles (y nodos terminales). Así, sería muy difícil representar un
problema con, por ejemplo, 30 variables.
Esto repercute en los requisitos computacionales, que también se incrementan
exponencialmente, pues el algoritmo es esencialmente una técnica de enumeración
al atravesar todos los caminos del árbol.
Se han propuesto algunas soluciones para este problema entre las que desta­
camos la de representar el árbol de forma esquemática (ver Cali y Miller, 1990).
Sin embargo, se pierde mucha información en la mayoría de los casos; por ejemplo,
cuando se tienen estructuras altamente asimétricas y con muchas dependencias.
El árbol esquemático del ejemplo del helicóptero se muestra en la Figura 5.5.

Figura 5.5: Árbol esquemático del problema del helicóptero

Otras soluciones se basan en la habilidad de los propios lenguajes de progra­


mación para listar y enumerar todos los caminos posibles del árbol y seleccionar
los mejores.

Aprovecham iento de la rep lica ció n d e s u b á r b o le s o co a le s c en c ia


Otra solución al problema del crecimiento exponencial consiste en reducir ol
tamaño del árbol aprovechando subárboles repetidos dentro de la estructura geiio-
ral. Esta replicación, llamada coalescencia, ver Cali y Miller (1990), ocurre como
consecuencia de alguna forma de independencia entre las variables del modelo.
Por ejemplo, supongamos tres variables X , Y, Z representadas en ese orden en un
árbol de decisión. Si la función de utilidad sólo depende de y y de Z , y Z &
® RA-MA CAPÍTULO 5: TABLAS Y ÁRBOLES DE DECISIÓN 187

probabilísticamente independiente de X dado Y (es decir, P (Z \ X ,Y ) = P(Z\Y)),


los cuatro subárboles que nacen en Z son iguales dos a dos, ver Figura 5.6. El
tamaño del árbol se reduce y, por tanto, se realizan menos cálculos.

p
/~\y— lili

tfS |

----- ufy*)

Figura 5.6: Coalescencia no separable

Esta coalescencia es no separable, existiendo otros tipos que aprovechan la


separabilidad de la función de utilidad, Cali y Miller (1990). En cualquier caso,
el problema es detectar esta propiedad: normalmente es el analista el que la
detecta ad hoc y no el propio algoritmo.

R epresentación deficien te d e relaciones probabilísticas


La propia estructura del árbol es incapaz de mostrar las relaciones de dependencia
o independencia probabilística. Así, de la Figura 5.7, únicamente después de una
inspección detenida de las cantidades numéricas que aparecen en las ramas de
Y , para un valor fijo de X , deducimos que Y es independiente de X sólo en el
árbol de la derecha. En un árbol de mayor tamaño esta tarea ad hoc resulta casi
imposible.

0.2 0.5

Figura 5.7: Detección de relaciones probabilísticas en árboles de decisión


188 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN ©RA-MA

Como consecuencia, el algoritmo de resolución de árboles no explota las


propiedades de independencia, algo que sí harán otros métodos gráficos obte­
niendo ahorros computacionales.

El problema de los dos árboles


Típicamente, las probabilidades que se requieren en el árbol de decisión no se
obtienen directamente de los datos conocidos del problema, dados de forma na­
tural por el decisor. En el ejemplo del helicóptero, se conocen las probabilidades
de R\E y de E y sin embargo, se necesitan las de E\R y las de R. La dirección
de asignación más cómoda o intuitiva no siempre coincide con la dirección de­
mandada por el árbol. La Figura 5.8 muestra los dos árboles a que da lugar esta
situación en nuestro problema ejemplo.-

Figura 5.8: Problema de los dos árboles en el ejemplo del helicóptero

Cuando resolvimos el problema, calculamos las probabilidades del árbol re­


querido (el de la derecha) mediante la regla de Bayes. Sin embargo, cuando se
implementa la evaluación de un árbol de decisión, se procede de la forma siguien­
te. Multiplicando las probabilidades de cada camino en el árbol de la izquierda
se obtienen las probabilidades conjuntas de (E, R) , escritas en este caso en los
nodos terminales, que son fácilmente situadas en el árbol de la derecha. En éste
se completa ahora el nodo raíz haciendo P (R ) = JjSg P (E , R) y finalmente, se
obtiene P (E ) = • Nótese que en caso de tener más de dos variables aleato­
rias, este proceso que trabaja con la distribución conjunta de todas las variables
se hace intratable.
Además de la inconveniencia de este preproceso de probabilidades antes de
representar el árbol y de la forma poco eficiente de hacerlo, requerir ambos árboles
puede crear confusión entre el analista y el decisor.

Los dos últimos problemas son problemas de modelización de la incertidum­


bre. El siguiente se refiere a las restricciones de información, es decir, a la
secuencia en que deben sucederse las variables en los caminos del árbol.
© RA-MA CAPÍTULO 5: TABLAS Y ÁRBOLES DE DECISIÓN 189

Orden co m p leto d e las restriccion es d e inform ación


Los árboles de decisión requieren un orden completo sobre la posición relativa de
sus nodos y ésta no siempre está especificada. Si éste es el caso, teniendo en su
lugar un orden parcial, aunque la solución final no se vea afectada por el orden que
decidamos escoger, el esfuerzo computacional requerido para resolver el problema
puede variar en cada caso. De hecho, dependiendo de cómo se complete el orden,
puede haber o no coalescencia con el ahorro que ello conlleva.
Volvamos al ejemplo de la Figura 5.6. Supongamos que no se han especifi­
cado restricciones sobre la posición de Y respecto a Z en el árbol y tengamos
dos secuencias posibles de representación: X ,Y ,Z o X ,Z ,Y . Con la primera
tendríamos el árbol con coalescencia de dicha figura; con la segunda no habría
coalescencia, pues P (Y \ Z ,X ) ^ P(Y\Z), y efectuaríamos más operaciones. El
problema es que no existe una guía de cómo elegir entre las dos representaciones.

Capacidad para tratar utilidades separables


Si la función de utilidad es separable en otras funciones definidas en dominios de
menor tamaño, podrían realizarse los cálculos de forma más local consiguiendo
menos requisitos de memoria en el proceso de solución. El árbol de decisión
es a menudo capaz de ello. Aunque el dominio de cada pequeña función no
es explícito, tan sólo se han de situar las utilidades en las ramas apropiadas
en vez de acumularlas en el nodo terminal. Por ejemplo, en muchos proyectos
de construcción y en adquisiciones de sistemas complejos a lo largo de varias
etapas, los costes pueden tener lugar antes de la finalización del proyecto. En
ese caso, el coste de tomar una decisión temprana puede afectar a la elección;
en decisiones posteriores el mismo coste puede ser irrelevante para las decisiones
futuras porque es un coste que ya ha bajado o que está financiado por diferentes
fuentes no vinculadas. Por ejemplo, los presupuestos para la construcción de una
empresa pueden venir separados de los de operación, pudiendo éstos provenir en
parte de los beneficios debidos a la presencia del nuevo edificio.

Ejemplo 5.2 (compra de helicóptero) (continuación)


En el ejemplo del helicóptero el coste de la prueba es sólo función de P.
Podemos decir entonces que la función de utilidad es factorizable de forma aditiva:
Se puede escribir como u(P, C ,E ) = v (C ,E ) — 1 /6 10- 4 io(P), donde w (P) es la
función que indica el coste de la prueba: w (P = hacer prueba)= 600 euros;
w(P = no hacer prueba)= 0 euros, y v es la función: v (c,ei) = 0.86, v(c, ej) =
0.44,v (c ,e 3) = 0.01 = 0.26.
Para aprovechar esta separabilidad, escribiremos los valores de v en los nodos
terminales, y el resto de operaciones se harán al llegar al nodo P, ver Figura 5.9.
Obsérvese que esto es correcto. ¡§
190 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© R A -M a

Figura 5.9: Árbol de decisión con. utilidad separable para el problema del helicóptero

C o m p le jo tratam ien to d e variables aleatorias continuéis


En muchos problemas el número de estados que puede presentar una variable
aleatoria puede ser muy grande o incluso infinito. Considérese, por ejemplo, los
niveles posibles de coste que pueden resultar al desarrollar un nuevo producto.
Esta variable se representará mediante una distribución de probabilidad continua
y no es tan obvio cómo incorporarla al árbol de decisión.
Una posibilidad es discretizarla, es decir, usar una distribución discreta como
aproximación, encontrando puntos representativos de la distribución. Por ejem­
plo, aproximamos la variable coste usando costes de tres tipos: altos, medios
y bajos. Evidentemente, si se eligen pocos puntos, pueden no representar bien
la variable, especialmente cuando las colas de la distribución son pesadas. En
cambio, si se eligen demasiados puntos resulta un modelo muy costoso computa-
cionalmente.
Existen varios métodos para realizar esta discretización. Una forma simple
de hacerlo es la introducida por Keefer y Bodily (1983), denominada método
de Pearson-Tukey extendido para distribuciones con sólo un máximo local. Se
basa en utilizar la mediana y los percentiles 5 y 95, asignándoles probabilidades
0.63, 0.185 y 0.185, respectivamente. También demuestran que la aproximación
Swanson-Megill extendida, que usa la mediana y los percentiles 10 y 90 asignán­
doles probabilidades 0.4, 0.3 y 0.3 respectivamente, es bastante precisa. En la
misma línea está el trabajo de Zaino y D ’Errico (1989).
Normalmente es esencial que la discretización no distorsione de forma sig­
nificativa la media, varianza, y otros momentos importantes de la distribución.
© RA-MA CAPITULO 5: TABLAS Y ÁRBOLES DE DECISIÓN 191

En esa idea se basan muchos métodos: el de Miller y Rice (1983) basado en


cuadratura gaussiana, el de “medias por grupos” (McNamee y Celona, 1987), el
de “medianas por grupos” (ver, por ejemplo, Ciernen, 1996), o el de Smith (1993)
de ajuste de momentos. Otras veces se busca minimizar la pérdida de informa­
ción que introducen los errores en la regla de decisión, como en el método de los
centroides (Merkhofer, 1987).
Otra posibilidad de tratar variables continuas es utilizar distribuciones conoci­
das, a partir de las que sabemos fácilmente tomar esperanzas y calcular cualquier
probabilidad. Para calcular esperanzas no triviales puede acudirse a técnicas de
integración numérica o de simulación. En cualquier caso, estas ideas podrían in­
corporarse al algoritmo de evaluación de los árboles de decisión si bien la propia
representación está diseñada para un número finito de ramas en cada nodo. El
problema se complica no sólo computaciónalmente sino también en la asignación:
asignar una distribución condicionada a una variable aleatoria continua resulta
siempre una tarea nada sencilla.

5.3 SOFTWARE

El periodo de planificación que representa el árbol es arbitrario. En el ejemplo


del helicóptero, aunque la CAM lo compre y resulte maniobrable, probablemente
no terminará ahí la historia y habrá ramificaciones en el futuro. Puede decidir
si usarlo sólo para determinadas operaciones de incendios, o venderlo, o incluso,
puede ver restringidas otras opciones a largo plazo por falta de presupuesto. Sin
embargo, no deben formularse árboles que traten de cubrir periodos muy largos
en el futuro, pues llevaría a modelos demasiados complejos e intratables. No
olvidemos que el árbol es un modelo, y por tanto, una simplificación del problema
real. Por el contrario, tampoco se deben desatender las necesidades del decisor
buscando formas demasiado sencillas del modelo de preferencias o creencias e
incluyendo pocos nodos en el árbol por su crecimiento desmesurado; se trata de
adquirir un compromiso entre la realidad y la práctica.
Para esta tarea puede resultarnos de gran ayuda el software disponible en el
mercado. Los paquetes informáticos desarrollados para este fin permiten mostrar,
modificar y analizar árboles de decisión de gran tamaño, algo que puede resultar
muy tedioso sin tener estas herramientas. Para más información puede consul­
tarse Buede (1996), que revisa 29 paquetes diferentes. En la revista OR/MS
Today de Agosto de 1998 también hay un análisis comparativo similar (puede
verse en h ttp : //lio n h r t p u b . com/orms/surveys/das/dasl .html).
Destacamos aquí los siguientes, sin ánimo de hacer un recorrido exhaustivo y
teniendo presente su continua evolución:

• Supertree de Strategic Decisions Group Systems Inc. (Menlo Park, CA),


ver McNamee y Celona (1987). Está escrito en APL y fue el primer paquete
192 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © r a -m a

de Análisis de Decisiones completo comercializado. Su interfaz no resulta


demasiado fácil de usar y tiene algunas limitaciones en cuanto al número
máximo de nodos terminales. Tiene la posibilidad de calcular el valor de la
información y el análisis de sensibilidad se realiza con el paquete Sensitivity
conceptos que se verán en el Capítulo 8. Se ejecuta bajo DOS. La dirección
de la compañía creadora es h t t p : //www. s d g . com.

• E xp ression Tree de Cheung y Kirkwood (Department of Management,


Arizona State University). Puede conseguirse a través de Internet, en la
dirección h t t p : //www. p u b lic . asu. edu/~kirkw ood. Es un buen paquete
para aprender árboles de decisión, pese a que no dispone de una interfaz
gráfica de usuario. Permite introducir expresiones algebraicas para determi­
nar las utilidades de los nodos terminales del árbol. El uso de parámetros,
variables de probabilidad y expresiones algebraicas facilita la introducción
y modificación de árboles de gran tamaño. Se pueden realizar análisis de
sensibilidad sobre algún parámetro, probabilidad o tolerancia al riesgo de
la función de utilidad exponencial.
Una ventaja respecto a la mayoría de las versiones de estudiante de los pa­
quetes comerciales es que no tiene limitaciones sobre el tamaño del modelo
o la velocidad de ejecución. Sin embargo, no permite utilidades no exponen­
ciales o multiatributo, gráficos, y compatibilidad de intercambio de ficheros
con otros programas externos u hojas de cálculo.
Desarrollado inicialmente a finales de 1980 para la enseñanza, necesita unos
requisitos de hardware mínimos. Se ejecuta bajo MS-DOS versión 2 o pos­
terior.

• A r b o ris t de Texas Instruments Inc. (Dallas), permite la conexión con


hojas de cálculo como Lotus 1-2-3. Tal vez ya está superado por la mayoría
de los programas que indicamos aquí.

• P recision T ree de Palisade Corporation (Newfield, NY), representa y re­


suelve árboles en las hojas de cálculo de Microsoft Excel usando objetos
estándar de Excel. Permite anáfisis de sensibilidad. Se recomienda Pen­
tium, Windows 95 y 16 MB RAM y ha de tenerse instalado el Microsoft
Excel 5.0. Más información en h ttp ://w w w .p a lisa d e.com .

• T te e P la n de Decisión Support Services (San Francisco, CA) es un software


gratuito para crear y resolver árboles de decisión con Excel.
Disponible en h ttp ://w w w .treep la n .com .

• D A T A de TreeAge Software Inc. (Boston). L a versión 3.0 es para Microsoft


Windows y ofrece numerosas ventajas. Dispone de una rueda de la fortuna
para la asignación de probabilidades. Requiere Windows 3.1 o superior, 4
MB RAM (8 MB para Windows 95). Está escrito en C + + .
Más información en h t t p : //www. tr e e a g e . com y en el Capítulo 6.
C A P ÍT U L O fl! T A U L A H Y A R B O L E » D E D E C IS IÓ N 103
I @ RA-MA __— -------— —

n p L de Cali y Miller (ADA DeCislon Sysfcorris, Menlo Park, C A ), cb un


* celente software para entorno Window», «imilar a DATA. Lo detallarnos
en la sección siguiente.
Más información on h ttp ://w w w .a d a in c.com /softw a re/Ín d ex,h tm l.

5.3.1 DPL

DPL son las siglas de Decisión Programming Language, un entorno de progra­


mación diseñado para problemas de Análisis de Decisiones, Escrito en C, es una
aplicación para Windows con las consecuentes ventajas. Contiene un editor inte­
grado para especificar los problemas en un lenguaje propio, un compilador, una
unidad de ejecución, una gran variedad de formas para mostrar los resultados y
el análisis, y varias posibilidades de análisis de sensibilidad. Tiene una interfaz
gráfica con la que dibujar un modelo, que después se traduce automáticamente al
lenguaje DPL. También pueden convertirse hojas de cálculo en programas DPL.
En la ventana principal se listan cronológicamente los comandos ejecutados, los
mensajes de error, y los resultados de los análisis, registrándose la sesión com­
pleta. DPL resuelve problemas con millones de caminos, incluso en procesadores
lentos (por ejemplo, 386) en tiempos muy buenos.

Ejemplo 5.2 (compra de helicóptero) (continuación)


El problema del helicóptero se puede escribir en DPL como se puede observar
en la Figura 5.10. El código fuente siempre consta de dos secciones: (1) definición
de datos, donde se especifican las variables, los valores que toman y las relaciones
entre ellas; (2) secuencia del proceso de decisión, donde se ordenan las decisiones a
tomar y el estado de información en cada una. En este caso, hemos aprovechado
algunos de los recursos de la sintaxis del lenguaje DPL: la etiqueta “a” y el
comando perform proporcionan formas de abreviar la declaración de estructuras
repetidas, mientras que “v ~ ” indica que se obtendrán los valores de v (utilidades)
que se puedan calcular viniendo por ese camino, ya que el estado del helicóptero
E no se puede conocer si no se compra, ver manual del DPL (1995).
En vez de escribir el código fuente, podríamos haber dibujado el modelo con
la opción draw, ver Figura 5.11. DPL facilita esta tarea permitiendo usar árboles
esquemáticos, etiquetas sobre los subárboles repetidos (en la figura aparece la
etiqueta “a” ), utilidades separables, asimetrías, etc. La opción convert to code
transforma el dibujo en código fuente.
La política óptima se muestra en forma de árbol en líneas más gruesas, ver
Figura 5.12. Sólo se muestra la parte del árbol necesaria para ver las decisiones
del camino óptimo, quedando la posibilidad de expandir el resto si se desea.
La versión utilizada en este problema ha sido la 3.10.26 avanzada de estudian­
te. La edición de estudiante no incluye las facilidades para optimizar tiempos
de ejecución (incluyendo la simulación Montecarlo) ralentizando el análisis de
194 F U N D A M E N T O S D E LO S S IS T E M A S D E A Y U D A A L A D E C ISIÓ N

decisión P, {hacer,no_hacor} ¡
decisión C.{c,no_c}¡
chance E. {el ,c2,c3 }={0,3,0.4,0.3};
valué v|P,C,E“
//P.hacer,C.c
0.85,0.43,0, //el,e2,e3
//P.hacer,C.no c
0.25,0.25,0.25, l/eI,e2,e3 “
//P.no hacer,C.c
0.86,0.44,0.01; //el,e2,e3
chance R. {ra,m}|E=
{0.9,0.1), //E.el
{0.65,0.35}, //E.e2
{0.15,0.85}; //E.e3

sequence:

decide
to P.hacer then
gamble on R then a: decide
fo C.c then
gamble on E and get v
to C.no_c and get v~
to P.no_hacer then
perform a

Figura 5.10: Código fuente en DPL para el problema del helicóptero

modelos grandes. DPL también utiliza los diagramas de influencia que será el
tema central del próximo capítulo, entendiendo entonces sus múltiples ventajas.

5.4 DISCUSIÓN

Los árboles de decisión son extremadamente útiles para ayudar a los decisores a
entender y comunicar la estructura del problema al que se enfrentan, a determi­
nar los escenarios posibles que pueden resultar si se toma una acción particular.
El método para evaluarlos permite analizar problemas complejos como una serie
de problemas de decisión más pequeños. Todo el proceso puede conducir a un
pensamiento creativo y a generar opciones que no habían sido consideradas pre­
viamente. Existen varias teorías sobre la creatividad que podrían considerarse
dentro de la Psicología y que deberían formar parte de la esencia de toda empre­
sa. Ciernen (1996) dedica todo un capítulo a este tema destacando los diferentes
bloques a los que un individuo se enfrenta -perceptivos, culturales, emocionales,
del entorno- que dificultan encontrar soluciones a los problemas. Keeney (1992)
hace hincapié en la primacía que tienen los valores que asigna el decisor en el pro­
ceso de decisión definiendo el pensamiento basado en el valor que puede ayudar
a crear nuevas alternativas en el problema. Tener conciencia de estas barreras
CAPÍTULO 5: TABLAS Y ÁRBOLES DE DECISIÓN 195

Estado

Figura 5.11: Árbol de decisión dibujado con DPL para el problema del helicóptero

Figura 5.12: Política óptima del problema del helicóptero generada con DPL

y algunas técnicas para romperlas, como la conocida tormenta de ideas o brain-


storming, pueden ayudar a potenciar la creatividad, en nuestro caso aplicada a
situaciones de toma de decisiones.
Una de las fases más complejas en el Análisis de Decisiones de un problema es
asignar su estructura, fundamental en la creación del modelo. Es evidente que no
hay una representación correcta o errónea de un problema ni existe una técnica
normativa para extraer del decisor la estructura del problema. Es más un arte
que una ciencia. A través de las conversaciones entre el analista y el decisor, éste
juzga cuándo el árbol obtenido es una buena representación de su problema a
medida que va desarrollando el entendimiento sobre el mismo. Von Winterfeldt
y Edwards (1986) y Keller y Ho (1989) exponen ideas sobre la estructuración de
decisiones, tema de discusión más reciente. Von Winterfeldt (1980) recomienda
poner mucho esfuerzo en esta fase y estar abierto a posibles revisiones.
198 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

Los árboles de decisión ya aparecen en los primeros libros de Análisis de De­


cisiones, pues fueron las herramientas básicas desde los años 60, ver por ejemplo,
Raiffa (1968), LaValle (1978), Holloway (1979), Lindley (1985), French (1986), si
bien estos autores no hacen demasiado hincapié en aspectos de construcción de
modelos al estar interesados principalmente en los fundamentos de la Teoría de
la Decisión.
Durante muchos años se han publicado diferentes aplicaciones de los árboles
de decisión con gran éxito. Por ejemplo, en Goodwin y Wright (1998), Capítulo
6, se referencian trabajos para decisiones relacionadas con el código postal de 9
dígitos en EEUU, con el uso del fuego en la gestión de bosques (para controlar
pestes y enfermedades, por ejemplo), con la reorganización de las sucursales de
una compañía, o con la elección entre dos lugarés para perforar petróleo.
La resolución de árboles de gran tamaño requiere refinamientos del pro­
cedimiento básico aquí descrito que reconozcan las asimetrías, dependencias de
caminos más complicadas que las que hemos visto, eviten cálculos repetidos, y al­
macenen eficientemente la información o los resultados que se usan repetidamente.
En esto trabajan las compañías de software actualmente y muchos investigadores.
Por ello, y a través del estudio de sus propiedades, hemos detectado que los
árboles de decisión presentan varios inconvenientes. Uno de los más importantes
es su crecimiento exponencial que afecta a la representación y a los cálculos.
La clave es quizá la imposibilidad de separar la representación del problema de
su solución, ambas mezcladas en el árbol haciéndolo difícilmente automatizable.
Precisamente, los diagramas de influencia, que será el tema del siguiente capítulo,
surgieron en un principio para solucionar esta cuestión.

5.5 EJERCICIOS

5.1 María tiene que asistir a una clase a las 15:00 horas. Está comiendo en un
restaurante y no tiene mucho tiempo. No sabe si pedir sólo café o café con
postre. Definir los estados posibles respecto a si se sirvió con rapidez el
postre y sobre cómo le sentó. Identificar las consecuencias. Representar la
información en una tabla de decisión.
Si decide antes que tal vez puede preguntar al camarero de qué está hecho
el postre y estimar las probabilidades de que sea servida dentro del límite
de tiempo que tiene para ir al trabajo, representar el nuevo problema.

5.2 Un representante de un escultor de fama no demasiado reconocida está or­


ganizando una exposición de su obra en Madrid durante una semana. Debe
decidir cuánto gastar en dar publicidad al evento y cuenta con tres op­
ciones: oí, anunciarlo en la prensa especializada; 02 , anunciarlo además en
las principales radios; as, anunciarlo además en las principales televisiones.
La demanda de visitantes a la exposición se puede clasificar en poca, media
¡P RA-MA CAPÍTULO fi: TABLAS Y ÁRBOLES DE DECISIÓN 197

o mucha, obteniendo en cada caso unos beneficios en miles de euros, como se


indica en la tabla siguiente. Entre paréntesis se indican las probabilidades
de cada nivel de demanda si se adopta la opción indicada.

poca inedia mucha


ai -60 60 480
(0.4) (0.55) (0.05)
a2 -180 -60 360
(0.1) (0.35) (0.55)
03 -480 -360 60
(0.05) (0.15) (0.8)

Determinar la decisión qué conducirá al máximo beneficio esperado. Ex­


plicar qué representación gráfica resulta más apropiada para el problema.

5.3 Como dice Ciernen (1996), todos los libros de texto de Análisis de Decisiones
tienen al menos un ejemplo sobre perforación de petróleo. Probablemente
se debe a que en 1960, C. J. Grayson publicó una de las primeras tesis
doctorales aplicadas usando Teoría de la Decisión, y su área de aplicación
era la del petróleo. Reproducimos aquí una versión de Raiffa (1968).
Un jeque árabe quiere decidir si perforar o no cierta zona. No sabe si
el terreno está seco, húmedo o empapado de petróleo. La tabla siguiente
muestra los beneficios netos obtenidos en cada caso.

perforar no perforar
seco -70000 0
húmedo 50000 0
empapado 200000 0

El coste de la perforación es de 70000 euros. Así, el beneficio neto de 50000


euros de la tabla se interpreta como un beneficio de 120000 euros menos
el coste de 70000 euros por la perforación. Las probabilidades de que el
terreno esté seco, húmedo o empapado son, respectivamente, 0.5, 0.3 y 0.2.
Pagando 10000 euros, el jeque puede encargar un sondeo sísmico que le
reportará información sobre la estructura geológica del lugar. Con él se
revelará si el terreno no tiene estructura (es decir, es malo), tiene estruc­
tura abierta (regular) o cerrada (es lo mejor). Las probabilidades de los
resultados del test sísmico condicionadas a la cantidad real de petróleo se
presentan a continuación. Encontrar la estrategia de máximo beneficio es­
perado.

seco húmedo empapado


sin estructura 0.6 0.3 0.1
abierta 0.3 0.4 0.4
cerrada 0.1 0.3 0.5
198 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © R A -M A

5.4 Un banco que gestiona un gran número de cuentas corrientes ha contratado


un estudio de mercado para informar sobre las comisiones y los servicios
del banco, que no sean competitivos con otros bancos de la región. Los
resultados le aconsejan que como no oferte un mejor servicio a sus clientes
actuales, muchos de ellos abandonarán la firma y se irán a la competencia.
El personal del banco prepara entonces una oferta a sus clientes que contiene
incentivos para disuadirles de cambiarse de banco. El director del banco
debe decidir si hacer esa oferta y cómo hacerla. Suponemos que el coste de
hacer la oferta es insignificante. Aparte de esta decisión, otros elementos
importantes son: la respuesta de cada cliente (quedarse/irse), si cada cliente
que se queda tiene saldos positivos/negativos en sus cuentas, y el beneficio
. resultante de la oferta y los distintos saldos. Se estima que el 90% de los
clientes tienen saldos positivos -buenos clientes-. Si a un buen cliente se le
hace la oferta, hay una probabilidad de 0.9 de que se quede, mientras que
sin oferta, sólo se quedará el .80%. El 93% de los malos clientes que reciben
la oferta permanecerá en el banco y el 90% no permanecerá. Un cliente que
es bueno y se queda en el banco produce un beneficio neto de 120 euros,
mientras que uno malo reporta una pérdida de 1000 euros. Se supone que
el banco no pierde ni gana nada si un cliente se va. Representar el árbol de
decisión de este problema y evaluarlo.

5.5 Un médico tiene que decidir si llevar a cabo una peligrosa operación a una
persona de la que se sospecha que padece cierta enfermedad. Si tiene la
enfermedad y la opera, la probabilidad de recuperación es sólo de 0.5; sin
operación de 0.05. Por otra parte, si no tiene la enfermedad y se opera hay
un 0.2 de probabilidad de muerte como resultado de la operación, mientras
que no hay posibilidad de morir si no se realiza la operación. Aconsejar al
médico. Puede suponerse que siempre hay sólo dos posibilidades, morir o
recuperarse.

5.6 Sean A ,B ,C tres variables aleatorias de un problema de decisión en el


que se conocen las probabilidades: P(e) = 0.1,P(a|6) = 0.7, P(a\~>b) =
0.2, P(b\c) = 0.8, P(6|—ic) = 0.15. Supongamos que A y C son probabilísti-
camente independientes dado B, y que todas las variables son binarias. Si
en el árbol de decisión asociado debe escribirse primero el nodo A y después
B o C, explicar el problema de los dos árboles en este caso calculando el
requerido para el proceso de solución.

5.7 Demostrar que el procedimiento para resolver el problema del helicóptero


aprovechando la separabilidad de la función de utilidad (Figura 5.9) es
correcto.

5.8 El Ayuntamiento de cierta localidad está estudiando si construir un paso


subterráneo (P) a fin de disminuir el tráfico (T) y el número de accidentes
(A) en cierta zona conflictiva. El ingeniero encargado del estudio conside­
ra dos aspectos fundamentales: el número de muertos por accidente (M)
5) RA-MA CAPÍTULO 5: TABLAS Y ÁRBOLES DE DECISIÓN 199

registrados en la localidad y el número de quejas (Q) al Ayuntamiento por


cuestiones urbanísticas.
T puede ser fluido ti o denso A — ai indica pocos accidentes y A = 02
muchos; M valdrá m i si hay un número moderado de muertos y 7712 si hay
un número elevado; qi indica pocas quejas y q2 muchas; pi es la decisión
de construir el paso subterráneo y P2 la de no construirlo. La probabilidad
de que haya pocos accidentes es del 32%. Suponemos que las variables
aleatorias A y Q son condicionalmente independientes dado T, y que T y
M lo son también, dado A. Si hay pocos accidentes, el 60% de las veces
se observan pocas muertes, y el 50% tráfico fluido. Por otra parte, si hay
muchos accidentes, el 10% de las veces se observan pocas muertes, y el 30%
tráfico fluido. Además, se sabe' que cuando el tráfico es fluido, el 80% de
las veces se reciben pocas quejas, mientras que cuando es denso tan sólo el
25%.
Si la función de utilidad del ingeniero es u(pi, ai) = 100,u (p i,a 2) = —5,u(p2,
ai) = 110 ,tt(p 2>a2) = —8, encontrar una decisión óptima con la ayuda de
un árbol de decisión. Calcular primero los dos árboles de la misma forma
que haría un programa software de árboles. Indicar si es simétrico y contar
el número de escenarios.

5.9 En una editorial se ha estropeado una gran máquina fotocopiadora y costará


3200 euros cada día que la máquina esté estropeada. El operario tiene tres
opciones inmediatas:

(a) Devolver la máquina al proveedor que ha accedido a recogerla, reparar­


la y devolverla gratis, sin compensar a la editorial por las pérdidas pro­
ducidas mientras se realiza la reparación. Si alguna otra persona ha
intentado repararla previamente, el proveedor no accederá a repararla.
Si se devuelve la máquina, el proveedor garantizará devolverla funcio­
nando en 10 días.
(b) Llamar a una compañía local de especialistas en este tipo de máquinas.
Le cobrarán 20000 euros por la reparación y estiman que hay una
probabilidad de 0.3 de devolverla funcionando en 2 días. Sin embargo,
hay una probabilidad de 0.7 de que les lleve 4 días repararla.
(c) Intentar repararla él mismo. Estima que hay una probabilidad de
0.5 de arreglarla en 5 días. Pero si al cabo de los 5 días no lo ha
conseguido, tendrá que decidir si llamar a la compañía local o hacer
un segundo intento de reparación inspeccionando una parte diferente
del mecanismo. Esto le llevaría 2 días más, y él estima que este segundo
intento será satisfactorio con una probabilidad de 0.25. Si falla en este
intento no tendrá más opción que llamar a la compañía local. Podemos
suponer que la distribución de probabilidad del tiempo de reparación
de la compañía no se verá afectada por ningún trabajo que el operario
haya realizado.
2oo F U N D A M E N T O S D E LOS S IS T E M A S n ú A Y U D A A 1,A DHC1BIÓN____________ © HA-MA

Suponiendo quo el objetivo del operario o h minimizar los coste) esperado»,


indicar qué curso do acción (lobería escoger,

5.10 El riesgo de inundación en una zona cercana a un río lia crecido recien­
temente. Esto se debe a las mareas altas de la primavera y al desarrollo
de sistemas de drenaje más eficientes de los granjeros de las colínas cer­
canas, lo que significa que después de fuertes lluvias el agua entra en el
río más rápidamente. Se está construyendo una barrera en la boca del
río pero las autoridades deben decidir cómo proporcionar protección ante
desbordamientos durante los dos años hasta que se termine de construir la
barrera. Es sólo probable que ocurran inundaciones durante el periodo de
marea alta de la primavera y la altura, del río entonces no puede predecirse
con certeza. Si se prodúce inundación algún año, las autoridades tendrán
que compensar pagando 3 millones de euros. Actualmente, consideran tres
opciones:

(a) No hacer nada y esperar que la inundación no tenga lugar durante esos
dos años. Las orillas naturales del río detendrán la inundación siempre
que la altura del agua sea menor que 9 metros. Hay una probabilidad
de 0.3 de que la altura exceda esta cantidad en cualquier año.
(b) Levantar una barrera provisional barata para una altura de 10 me­
tros. Costaría 1 millón de euros levantarla y se cree que hay sólo una
probabilidad de 0.08 de que la altura del agua exceda esta barrera. Sin
embargo, si esto ocurriese durante el primer año, se estima que con
probabilidad 0.4 la barrera se dañaría dejándola inservible para el se­
gundo año. Las autoridades tendrían entonces que decidir si repararla
a un coste de 0.6 millones de euros o dejar el río sin protección durante
el segundo año.
(c) Levantar una barrera más cara. Los costes fijos serían de 1.3 millones
de euros y habría un coste adicional de 0.03 millones por cada metro
levantado. Por razones técnicas, la altura será de 10 ó 12 metros, y
se cree que no habrá posibilidad de que se dañe la barrera si hubiese
inundaciones. La probabilidad de que el agua exceda la barrera de 12
metros en cualquier año es de 0.005.

Dibujar un árbol de decisión para representar el problema. Determinar


una estrategia óptima suponiendo que el objetivo es minimizar los costes
esperados.
CAPÍTULO 6

d ia g r a m a s d e
INFLUENCIA

Hemos comprobado lo difícil que es manejar muchas decisiones por su tamafin


y estructura compleja. Los métodos vistos pueden ayudar a estructurar y resolver
un problema de decisión a partir de una representación gráfica: encontramos la
alternativa de máxima utilidad esperada a partir de la representación del proble­
ma mediante una tabla o un árbol de decisión. Sin embargo, como ya indicamos,
los inconvenientes de los árboles de decisión han conducido a buscar nuevos for­
malismos gráficos. En este capítulo estudiaremos los diagramas de influencia.
Hasta hace relativamente poco tiempo los árboles se presentaban como la úni­
ca forma de representar y evaluar un problema de decisión dinámico, con varias
decisiones encadenadas a tomar. Los diagramas de influencia fueron concebidos
inicialmente como método de representación más compacta de problemas, Miller
et al. (1976), Howard y Matheson (1981), que después se traducían a un ár­
bol para ser evaluados. El decisor podía representar el problema tal y como lo
percibía, pues los diagramas de influencia son lo suficientemente intuitivos como
para facilitar la comunicación entre decisores y analistas. Pero el problema debía
transformarse en una representación diferente para ser evaluado.
En los años 80 se introdujeron algoritmos de evaluación de diagramas de
influencia que funcionaban directamente sobre el propio diagrama, ver Olmsted
(1983) y Shachter (1986), convirtiéndose hoy en día en un lenguaje gráfico de
modelización que puede utilizarse tanto en Análisis de Decisiones como en infe­
rencia probabilística, ver Shachter (1988).
En este capítulo aprenderemos a utilizar los diagramas de influencia para
representar y resolver problemas de decisión. Destacaremos los principales bene-
ficios que obtenemos al usarlos: capacidad de utilizar directamente una repre­
sentación que es natural para el decisor, mayor eficiencia desde el punto de vista
«Wiputacianal... También señalaremos más posibilidades de los diagramas y al-
202 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

gunas desventajas, lo que conducirá a introducir el siguiente capitulo en el que


se exponen modelos alternativos.

6.1 ESTRUCTURA BÁSICA


Antes de dar la definición formal de diagrama de influencia, motivaremos su
descripción y cómo se utiliza para formular problemas de decisión.
Un diagrama de influencia es un grafo con tres tipos de nodos: de azar,
de decisión, y un nodo de valor, dibujados respectivamente, mediante círculos,
rectángulos y un rombo. Los dos primeros son análogos a los de los árboles
de decisión. El de valor tiene relación- con los nodos terminales de los árboles.
Existen dos tipos de arcos dirigidos: arcos condicionales, que apuntan a nodos de I
azar o al de valor, y arcos informativos, que lo hacen a nodos de decisión.
Consideremos primero un diagrama que contiene sólo nodos de azar. Con ca-
da nodo hay asociada una variable aleatoria y existe subyacente una distribución
de probabilidad conjunta para todas las variables aleatorias. Ésta puede descom­
ponerse en un conjunto de distribuciones condicionadas, que el decisor asignará,
y que viene indicada a través de los arcos del diagrama. Así, si el arco (i,j) es
parte del diagrama, entonces la distribución asignada para la variable aleatoria j
está condicionada al valor de la variable i. Cuando un nodo de azar no tiene arcos
dirigidos hacia él, entonces la distribución asignada es una distribución marginal
(no condicionada).
Para el caso de dos nodos de azar, tenemos las posibilidades mostradas en la
Figura 6.1.

® — * 0 Q y—® ® @

Figura 6.1: Posibilidades con dos nodos de azar

Los nodos de la figura representan variables que son independientes y no


tienen arcos entre ellos (observar la figura que se encuentra más a la derecha),
o son dependientes y hay un arco de uno a otro. En ese caso, uno tiene una
distribución marginal asociada y el otro una distribución condicionada. La di­
rección del arco puede invertirse utilizando el Teorema de Bayes. Nótese que
un arco condicional representa dependencia probabilística y no necesariamente
causalidad ni precedencia temporal, de forma que el significado del diagrama (la
distribución de probabilidad conjunta) es el mismo independientemente de la di­
rección de los arcos. Los arcos simplemente representan un orden de asignación
de las probabilidades condicionadas.
Para el caso de tres nodos de azar hay más posibilidades, algunas de las cuales
aparecen en la Figura 6.2.
© RA-MA
CAPÍTULO

a)

b)

«0

d)

Figura 6.2: Algunas posibilidades con tres nodos de azar

Los casos a) y b) muestran independencia total o parcial. El caso c) muestra


dependencia completa entre las variables aleatorias asociadas teniendo descom­
puesta la distribución conjunta de la siguiente forma:

P (A , B, C) = P(C\A, B)P(B\A)P(A).

En el caso d) encontramos independencia condicional. Las dos variables de los


extremos (A y C ) son dependientes, pero sólo a través de su dependencia directa
con la variable central (B ). Si se conoce el valor de esta variable, entonces las
otras dos son independientes, es decir, P(C\A,B) = P(C\B). La descomposición
es entonces: P(C\B)P(B\A)P(Á). Nótese que los ciclos no están permitidos, pues
sería imposible calcular la distribución conjunta subyacente.
Cuando el diagrama de influencia posee nodo de valor se dice que es orien­
tado. Supondremos que sólo hay una variable aleatoria asociada con el nodo de
valor de la que es necesario calcular su esperanza y que representa la utilidad
esperada del resultado. En general, podríamos guardar más información que el
valor esperado como momentos adicionales, una lotería completa, o incluso, un
vector de loterías. Si vamos a tomar decisiones la utilidad esperada se usará para
comparar alternativas. Las variables asociadas con los nodos que inciden en el
nodo de valor son los atributos de la función de utilidad del decisor. Indican qué
variables condicionan la utilidad esperada, representando entonces dependencia
funcional.
Supongamos ahora que tenemos también nodos de decisión en el diagrama de
influencia. Cada nodo representa una elección entre un conjunto de alternativas.
Los arcos (informativos) que inciden en un nodo de decisión indican precedencia
temporal, es decir, la variable en el origen del arco es información disponible y
conocida en el momento de tomar la decisión que se encuentra en el nodo destino
del arco.
204 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

La Figura 6.3 ilustra varios casos con un nodo de cada tipo, uno de azar, uno
de decisión y el de valor.

e)

Figura 6.3: Algunas posibilidades con un nodo de cada tipo

En el caso a), la utilidad depende de la variable aleatoria, que a su vez depende


de la decisión. El caso b) es similar, pero el nodo de valor depende de la decisión
y de la variable aleatoria. En el caso c), el nodo de valor tiene las mismas
dependencias que en el anterior, pero la variable aleatoria es independiente de la
decisión. En el caso d), la variable aleatoria se observa antes de tomar la decisión
y como el decisor está mejor informado que en c) en el momento de la decisión,
debería producir una utilidad esperada mayor o igual a la del caso c). Finalmente,
en el caso e), se observa la variable aleatoria, pero no tiene efecto sobre el nodo
de valor y puede considerarse irrelevante respecto a la decisión.
Aquí tampoco se permiten los ciclos. Un ciclo que involucre una decisión y
una variable aleatoria violaría la voluntad del decisor, ya que implicaría que puede
inferir algo sobre una decisión que aún no ha tomado. Si el ciclo está formado sólo
por nodos de decisión, entonces se contradice la hipótesis de precedencia en el
tiempo. Además, no se puede invertir un arco que incide en un nodo de decisión
o que parte de un nodo de decisión, pues cambiaría el significado del diagrama.
Es más, sólo podemos invertir arcos entre nodos de azar.

E jem p lo (com pra de helicóptero) (continuación del Ejemplo 5.2)


Utilizamos uno de los ejemplos del capítulo anterior. En la Figura 6.4 se
muestra el diagrama de influencia asociado.
La información de los arcos informativos indica que: se toma antes la decisión
P que la decisión C\ no hay ninguna información disponible antes de tomar la
decisión P\ y se conocen los resultados R de la prueba al elegir C. De aquí deduci­
mos la secuencia de las variables en el tiempo: P ,R ,C y finalmente E. Además,
© RA-MA CAPITULO fl: DIAGRAMAS DE INFLUENCIA 205

Figura 6.4: Diagrama de influencia del problema del helicóptero

los arcos condicionales nos informan de que: la distribución de probabilidad de


R está condicionada a E, y también a P (los resultados de la prueba dependen
de la decisión de realizarla y del estado del helicóptero); en E tendremos su dis­
tribución marginal (al no haber arcos que incidan en E)\ y la función de utilidad
depende de las tres variables P, C, E que tienen arco hacia el nodo de valor v. O

Como podemos observar, con los diagramas de influencia la representación


del problema es muy compacta.

6.2 DEFINICIÓN FORMAL


Podemos ya definir formalmente un diagrama de influencia y desarrollar la no­
tación necesaria para explicar y demostrar el algoritmo de evaluación.

6.2.1 D escripción cualitativa

La definición formal es la siguiente:

Definición 6.1 (.Diagrama de influencia)


Un diagrama de influencia es un grafo dirigido acíclico G = (N, A) donde:

• El conjunto N de nodos se particiona en conjuntos D, C, V que designan,


respectivamente:

— D, al conjunto de nodos de decisión (rectangulares), que modelizan


decisiones a tomar;
— C, al conjunto de nodos de azar (circulares), que modelizan cantidades
inciertas que influyen en el problema;
— V, al conjunto de nodos de valor (romboidales), que modelizan las
utilidades (esperadas).
206 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

• El conjunto A de arcos incluye arcos de dos clases dependiendo del tipo de


nodo al que van dirigidos:

— informativos, si van a nodos de decisión, e implican precedencia tempo­


ral, es decir, la variable en el origen del arco es información disponible
y conocida en el momento de tomar la decisión que se encuentra en el
nodo destino del arco;
— condicionales, si van a nodos de valor o de azar, y representan depen­
dencia, funcional o probabilística, respecto de los valores de los nodos
antecesores. No implican causalidad ni precedencia en el tiempo.

Para comprobar si el grafo de un diagrama de influencia es acíclico podemos


acudir a resultados conocidos de la teoría de grafos (Lawler, 1976). Por ejemplo:

Proposición 6.1
Un grafo dirigido no tiene ciclos si y sólo si alguna lista de nodos tiene todos los
sucesores de cada nodo siguiéndole en la lista.

Al describir el proceso de evaluación de un diagrama de influencia nos resul­


tará más cómodo trabajar en términos de predecesores y sucesores de un nodo
del grafo que con el conjunto A de arcos.

Definición 6.2 (Sucesores y predecesores)


El conjunto de sucesores directos S(t) de un nodo i se define como

S(i) = { j 1 N : (i , j ) I A },

mientras que los sucesores indirectos (o simplemente sucesores) son el conjun­


to de nodos que se encuentran en los caminos dirigidos que parten del nodo i.
Análogamente, el conjunto de predecesores directos de i es { j € N : (j, i) 6 A} y
los predecesores indirectos (o simplemente predecesores) son el conjunto de nodos
que se encuentran en los caminos dirigidos hacia él nodo i.

Distinguiremos entre los dos tipos de predecesores directos:

Definición 6.3 (Predecesores condicionales e informativos)


Los predecesores directos de un nodo i de valor o de azar se denominan predece­
sores condicionales C {i); los de un nodo i de decisión, predecesores informativos
I(i).
Si el valor de una variable aleatoria se conoce de manera exacta cuando cono­
cemos los valores de sus predecesores, el nodo correspondiente es determinístico
y se suele dibujar como un círculo de bordes dobles. Estos nodos son importantes
por sus simplificaciones computacionales, pero conceptualmente son de azar, con
una distribución degenerada asociada.
R A -M A CAPÍTULO 0: DIAGRAMAS DE INFLUENCIA 207

6.2.2 Descripción cuantitativa

La modelización tiene lugar a varios niveles (Johnson et al., 1986). Como hicimos
con los árboles de decisión, dibujado el grafo que representa la descripción cualitar
tiva del problema (nivel estructural o gráfico), se procede a incluir la información
cuantitativa (nivel numérico) para dejar el diagrama totalmente especificado.
Para cada nodo i del diagrama de influencia, se especifica un conjunto Í2¿, una
variable Xi, y una aplicación. La notación íí j con J = {j'i,..., j n} c N indicará
el producto cartesiano x •••x fljn. De igual forma, X j denotará el vector
aleatorio (X jl t ...,X jn).
Si i es de decisión, Xi es la decisión que se toma del conjunto íí¿; si i es de azar,
Xi es lá variable aleatoria asociada con espacio muestral fi¡, sobre la que se define
la distribución de probabilidad dada por 7r»(®<|a:c(«)) = P fó i — xi\Xcu) — xc(i))>
si i es de valor, Xi es la utilidad esperada, con dominio en ílc(i) y Ia aplicación
es U : ííc(t) —> fí¡! la utilidad esperada en función de los predecesores directos.
Las aplicaciones de los nodos de azar 7r y de valor U las da inicialmente el de­
cisor como entrada del algoritmo de evaluación del diagrama y se irán redefiniendo
a medida que avance éste. Para los nodos de decisión, el algoritmo calculará su
aplicación asociada: d* : que indica las alternativas óptimas dado
el estado de información del decisor en el momento de tomar la decisión, y la
ofrecerá como resultado del proceso. Al finalizar el algoritmo, el nodo de valor v
no tendrá predecesores (C(v) = 0 ) y U contendrá la máxima utilidad esperada.
Por tanto, la definición formal de diagrama de influencia incluye al grafo
dirigido acíclico G = (N, A), con nodos N y arcos A, donde N está particionado
en los conjuntos D, C y V. Pero también incluye, para cada nodo i, un conjunto
fit- y una aplicación d*, 7r¿ o U, dependiendo del tipo de nodo.
Como hicimos en los árboles de decisión, también es conveniente pasar el test
de claridad (Howard, 1988) antes de evaluar el diagrama de influencia.

Ejemplo (com pra de helicóptero) (continuación del Ejemplo 5.2)


Para nuestro ejemplo del helicóptero, incluimos la información cuantitativa
que completa la definición del problema. Ésta se suele presentar en forma tabular.
La Tabla 6.1 contiene la información de los nodos de decisión (con las posibles
alternativas) y de azar (con la distribución de probabilidad asociada); la Tabla
6.2, la del nodo de valor, con las utilidades correspondientes a cada combinación
de predecesores.
Nótese que se ha añadido a R el estado ~ir que indica “no hay resultados” y
que permite construir ir(R\P,E), ya que sólo se observan resultados si se lleva a
cabo la prueba. De esta forma simetñzamos el problema.
208 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © r a -m a

Tabla 6.1: Tibias de los nodos de decisión y azar del problema del helicóptero

hacer no hacer
E
R ei «2 63 ei e2 e3
ei 0.3 ra 0.9 0.65 0.15 0 0 0
¿2 0.4 rn 0.1 0.35 0.85 0 0 0
e3 0.3 ->r 0 0 0 1 1 1

Tabla 6.2: Tabla del nodo de valor del problema del helicóptero

P C E U P C E u
hacer c ¿i 0.85 no hacer c 0.86
ei
É2 0.43 62 0.44
63 0 e3 0.01
->c ei 0.25- -iC ei 0.26
e2 0.25 e2 0.26
63 0.25 63 0.26

6.3 EVALUACIÓN

En esta sección describimos cómo resolver un problema de decisión modelizado


mediante un diagrama de influencia. La idea es esencialmente la misma que en
los árboles de decisión, pero se aprovecha la estructura gráfica del diagrama para
obtener ventajas computacionales. El algoritmo combina ideas de programación
dinámica y de evaluación de probabilidades en redes bayesianas.
Veamos primero unas definiciones que necesitaremos posteriormente, después
las transformaciones que experimenta el diagrama y finalmente el algoritmo.
Supondremos que el diagrama de influencia es regular y orientado.

D efin ición 6.4


Un diagrama de influencia es orientado si tiene exactamente un nodo de valor.

D efin ición 6.5


Un diagrama de influencia es regular si

1. el nodo de valor (si existe) no tiene sucesores, y

2 . existe un camino dirigido que contiene todos los nodos de decisión.

La propiedad 2 equivale a requerir un orden total de las decisiones, algo


razonable cuando sólo hay un decisor. Como consecuencia, cualquier información
disponible en el momento de tomar una decisión lo estará en decisiones posterio­
res.
© RA-MA CAPÍTULO 6: DIAGRAMAS DE INFLUENCIA 209

P ro p o sició n 6 .2
Si el nodo de decisión i precede al nodo de decisión j en un diagrama de influencia
regular, entonces el nodo i y sus predecesores informativos deben ser predecesores
informativos de j : { i } U I(i) C I (j).

Esta propiedad requerirá normalmente la adición de arcos, llamados de memo­


ria, que hagan explícito ese orden total de las decisiones. La Figura 6.5 muestra
la adición de arcos de memoria.

Figura 6.5: Adición de arcos de memoria

Obsérvese que mientras en el árbol de decisión esto estaba implícito, en el


diagrama de influencia del ejemplo del helicóptero (ver Figura 6.4) se ha añadido
el arco de memoria (P C ) .

6.3.1 Transformaciones

Gráficamente, el diagrama experimenta una serie de transformaciones que no


modifican la política óptima ni la máxima utilidad esperada. Numéricamente,
estas transformaciones redefinen las aplicaciones asociadas a cada nodo, calcu­
lando en los de decisión las soluciones óptimas del problema. Las transforma­
ciones son de dos tipos: eliminación de nodos (de azar o decisión predecesores
directos del nodo de valor v), que es básicamente una aplicación del principio
de la programación dinámica estocástica, e inversión de arcos (de azar), donde
se aplica el Teorema de Bayes. Cada vez que se elimine un nodo se borrará del
conjunto actual de nodos N y sus arcos incidentes se borrarán del conjunto actual
de áreos A.

Definición 6.6 (Nodo sumidero)


Un nodo de azar o de decisión es un sumidero si no tiene sucesores.
210 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © R A -M A

Independientemente del valor que tome la variable asociada a un sumidero


como ningún otro nodo se ve afectado, el sumidero puede eliminarse del diagrama
de influencia reduciendo así su tamaño.

P roposición 6.3 (Eliminación de sumideros)


Se puede borrar un nodo sumidero de un diagrama de influencia orientado y
regular.

El algoritmo no necesita conocer las distribuciones de probabilidad de los


nodos de azar sumideros, y podría evaluarse un diagrama incompleto si todos los
nodos de azar de los que se desconoce su distribución condicionada fueran (o se
convirtieran después) en sumideros. Si el sumidero fuera un nodo de decisión,
entonces cualquier alternativa sería óptima.
La Figura 6.6 ilustra la eliminación de sumideros. El primer diagrama se
convierte en el segundo, y éste en el tercero pues al eliminar un sumidero pueden
crearse sumideros nuevos. En general, cualquier nodo que no sea predecesor
indirecto del nodo de valor puede considerarse un sumidero y puede, por tanto,
ser eliminado.

1) 2)

C H O -O
3)

Figura 6.6: Eliminación de sumideros

T e o re m a 6.1 (Eliminación de un nodo de azar)


Si el nodo de azar i precede directamente al nodo de valor v y éste es su único
sucesor en un diagrama de influencia regular y orientado, puede eliminarse por
esperanza condicionada, heredando v los predecesores de i.

D e m o s tra ció n . La Figura 6.7 ilustra el proceso.


Los predecesores condicionales del nodo de valor después de eliminar el nodo
i son:

C moy(v) — C'vleJ(v) U C (i) \


rA-M A CAPITULO 6: DIAGRAMAS DE INFLUENCIA 211

f^ C C Q \C (v )^ ^ C Q )ríC (^ ^ C (v )\C C O \{i^ $~Cp)\CW >

Figura 6.7: Eliminación de un nodo de azar

Como la esperanza condicionada con respecto a Jíj sólo afecta al nodo de valor,
la nueva función acumulada en v se calcula de la forma siguiente:

J7nUCV(x^nuev(tj)) 4 E(Xv\XC™*(y) — XQaa•»(«))


= JÍ(7nu«v(t,))|X(7n««v(uJ = XCnu*v(tl))
= = ÍCf, AcmIev(„) = X(7nu.v(u))P(Jfi = = Ici'“"(ü))
X{€0{
— E(XV|-^C7vieá(v ) = = ® i|-^ C (t) = xC(i))
ti&k
= 53 ^ ^ (v jK N s c c » ))
xtSOi

para todo icn w ^ j € La primera igualdad se debe a las propiedades


de la esperanza condicionada.
Si el lector encuentra complicada la notación utilizada Cmuev y C7^ para los
nuevos y antiguos predecesores respectivamente, puede utilizar las letras: A =
C(i)\C(v),B — C (i)n C {v) y C = C(?)\C(»)\{i}, quedando tal vez expresiones
más sencillas de entender. A

Los nodos de decisión pueden eliminarse del diagrama maximizando la utili­


dad esperada. Sin embargo, primero debe eliminarse cualquier predecesor condi­
cional de v que no sea observable en el momento de tomar la decisión, mediante
esperanza condicionada. Por tanto, el nodo de decisión i se puede eliminar sólo
cuando todos los predecesores directos del nodo de valor (excepto i) precedan
directamente a i. La Figura 6.8 ilustra el proceso.

Teorema 6.2 (Eliminación de un nodo de decisión)


Si en un diagrama de influencia regular y orientado no hay sumideixvs, el nodo de
decisión i £ 0 (v ), verificando C(v)\{t} C /(*)» puede eliminarse inoxixnizando
utilidad esperada ( condicionada), registrándose la mejor decisión, v no hereda
l°s predecesores de i, pudiendo aparecer por tanto nuevos sumidews.
2J2 f u n d a m e n t o s d e l o s s is t e m a s d e a y u d a a l a d e c is ió n

Figura 6.8: Eliminación de un nodo de decisión

Demostración. Primero debemos probar que el nodo de valor es el único


sucesor del nodo i. Si no fuera así, existiría algún nodo j v que es también
sucesor de i. Como el diagrama no contiene sumideros, debe haber un camino
dirigido de j a v. Sea fc (posiblemente j ) el penúltimo nodo de tal camino. Por
construcción, fc es un sucesor de i y un predecesor condicional de v. Por las
hipótesis del teorema, fc debe ser entonces predecesor informativo de i, lo que
significa que hay un ciclo y llegamos a una contradicción.
Los predecesores condicionales del nodo de valor después de eliminar el nodo
i son:

Cmuev(u) 1 \ {¿}.

Las hipótesis aseguran que la utilidad esperada depende sólo de las variables
que se conocen cuando se toma la decisión correspondiente al nodo i. Por tanto,
la utilidad esperada óptima viene dada por

¡7nuev(xc »„ev(l))) max U (xcrv¡.j/„\)


¡ IjEOi 1l

y la política óptima se determina mediante

£C(a;Ci,u.v(v) ) «— arg max [ / ( x ^ . j ^ )

para todo xcnu' v(«) £ ficnu*v(u)- Nótese que aunque las variables Xj(¿)\c(«) *
conocen en el momento de tomar la decisión, son irrelevantes y no desempeñan
ningún papel, pues la utilidad esperada no depende de ellos. Por tanto, dj :
í2/(t)nc(«) g &i- A

Es interesante guardar varias decisiones, si es que hay empates, para obtener


el conjunto de todas las estrategias posibles. También es útil guardar, junto a
el valor de la utilidad esperada correspondiente.
La transformación final es la inversión de arcos entre nodos de azar, y es 1»
implementación del Teorema de Bayes. Como veremos después (Tteorema 6.4),
surge al intentar eliminar un nodo de azar y no poder hacerlo por tener otros
nodos de azar como sucesores. En la Figura 6.9 vemos el proceso.
CAPÍTULO 0: DIAGRAMAS DE INFLUENCIA 213

Figura 6.9: Inversión d e arcos

T eorem a 6.3 (Inversión de arcos)


Dado el arco (i , j ) entre los nodos de azar i y j , si no existe otro camino dirigido
entre i y j en un diagrama de influencia regular, puede sustituirse p or el arco (j, i)
mediante la aplicación del Teorema de Bayes, con herencia mutua de predecesores.

Demostración. Los predecesores condicionales de cada nodo de azar, después


de la inversión del arco (i , j ) son:

C nuav(¿) «- U \ {i}
Cmuev(i) I S | S H

La inversión añade arcos de los predecesores condicionales de cada nodo al otro


nodo, si es que no existen ya, teniendo así ambos nodos el mismo estado de
información antes de la inversión del arco. El requisito de que no exista otro
camino dirigido entre i y j es necesario y suficiente para asegurar que no se cree
ningún ciclo al añadir estos arcos.

Aplicando el Teorema de la Probabilidad Total y por independencia condi­


cional,

'Rj (®/|®0"uov(?)) * = ®j|-^Q7nuov(j) = ® cmi*v(j))

“ / , P fó j = ®í)-^(7nuov(j) = 2'Cnuev(j)) P f ó i — 2'i|-^Cnuov(j) = x CnMV(j))


mm

X) P fó j = xj\X cvl,¡(j) —xCvl,l(j)) P{Xi —®í|-^C7vl°J(¿) = x Cvl*J(t))

y p or el T e o r e m a d e B a y e s ,

^i ( ^ i |X C m,.v/A ) <— P ( X i — X\ |^Tf’ nu«v(¿) —

_ ^ f ó j ~ X j , X j = Xi\X(jnutv(j\ = ¡CpnUBV(j))

P \ X j = X j |A’cfnu»v(j) = ¡E0nu.y(j))
214 FUNDAM ENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © R A-M a

■. s P(Xj — a;t|X0 vi.j(i) — gQvi«j(j))


= P (X j = Xj\Xc ^ ( j ) - X c^ U )) p ( X . = a:i |XCnu.v(j) = x Cn»'V{j))

TTj* 1(x j |a:Cvi'j (j))7^ ^(a'i|a'Cvl8i(i))


“ v r f^ x jlx c ^ ))

para todo cc¿ € £l%,Xj E íljji^jnuov^j E ¡Ti^/nuev. A

6 .3 .2 A lg o r it m o d e e v a lu a ció n

Combinamos las transformaciones básicas expuestas obteniendo un procedimiento i


que puede evaluar cualquier diagrama de influencia regular y orientado. Eliminará
todos los nodos hasta que sólo' permanezca el de valor. En ese momento se 1
habrán obtenido las decisiones óptimas (acumuladas en cada nodo de decisión) y I
la máxima utilidad esperada (acumulada en u).
El siguiente teorema justifica el paso más importante del algoritmo de evalúa- !
ción:

T eorem a 6.4 (Existencia de nodo de azar eliminable)


Si en un diagrama de influencia orientado y regular no hay sumideros y se han
añadido los arcos de memoria, y si v tiene predecesores pero no puede eliminarse '
ningún nodo de decisión, entonces existe un nodo de azar que es predecesor condi­
cional de v pero no es predecesor informativo de ningún nodo de decisión, y puede
eliminarse, tal vez tras inversión de arcos.

D em ostración . Supongamos primero que el diagrama no tiene nodos de de­


cisión. En ese caso se tiene fácilmente el resultado, ya que todos los predecesores
condicionales de v son nodos de azar sin sucesores de decisión.
Supongamos entonces que al menos hay un nodo de decisión. Como las de­
cisiones están completamente ordenadas por ser un diagrama regular, hay algún
nodo de decisión j que corresponde a la última decisión. Como se añadieron
los arcos de memoria, cualquier predecesor' informativo de un nodo de decisión
debe también preceder directamente a j. Por tanto, buscamos algún nodo i €
c n c (v )\i(j).
Supongamos que j £ C(y). Como el nodo j no puede eliminarse por hipótesis,
es porque debe existir i € C(v) \ (I ( j ) U { j } ) . Si i fuese un nodo de decisión,
entonces i € I(J) U { j } por los arcos de memoria, y sería una contradicción.
Luego, i es de azar y existe algún nodo t G C f l C(v) \ I (j).
Si por el contrario, j $ C (v), como el diagrama no tiene sumideros, debe
contener un camino dirigido de j a v. Sea i el penúltimo nodo del camino. Por
© r a -m a CA PITU LO 0: DIAGRAMAS D E INFLUENCIA 215

co n stru cción , i e C n C(v) y como no puede haber ciclos, i f I(j). Por tanto,
ie C r \ C {v )\ i(j)- A

Durante la ejecución del algoritmo, cuando tomemos un nodo de azar i 6 C(v)


para ser eliminado y tenga muchos otros sucesores (de azar), habrá que invertir
los arcos hacia éstos antes de poder eliminar el nodo i. Hay que tener cuidado
entonces para que no se formen ciclos (ver Ejercicio 6.1). Debido a la ausencia
de ciclos en el diagrama, siempre podremos encontrar algún orden de inversiones
que no cree ciclos.
Podemos enunciar ya el algoritmo de evaluación de diagramas de influencia
(Olmsted, 1983; Shachter, 1986):

1. V erificar que e l diagrama de influencia es regular, orientado,


y añadir aireos de memoria

2. Eliminar sumideros

3. Mientras C(v) ^ 0 ,

Si 3 i E C D C(v) : S(i) — {u }, eliminar nodo de azar i


s i no, s i 3¿ G D D C (v ): C'(u)\{¿} C I{i),
eliminar nodo de decisión i
eliminar sumideros creados
s i no, encontrar i £ C fl C(v) : D fl S(i) = 0
mientras C fl S(i) 0
encontrar j € C fl S (i): 3' otro camino de i a j
in v e rtir (i,j)
elim inar nodo de azar i

Ejemplo (com pra de helicóptero) (continuación del Ejemplo 5.2)


Utilizamos este algoritmo para resolver el ejemplo del helicóptero. Obsérvese
que el diagrama de influencia (ver Figura 6.4) es regular y orientado. No tiene
nodos sumideros ni requiere arcos de memoria, pues ya habíamos añadido el arco
{P,C). Podemos entonces aplicar el algoritmo.
En el primer paso sólo se puede eliminar E. Sin embargo, al tener un sucesor
de azar R, no se podrá eliminar hasta que hayamos invertido el arco (E,K).
Numéricamente esta inversión da lugar a la Tabla 6.3.
Los cálculos (ver Teorema 6.3) se corresponden con las fórmulas
, ( n{R\P,E)n(E)
ir{R\P) = n(R\P, E)ir{E) y tt(£|fl, P) = — ^ j p ) '
E
216 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © R A -M a

Tabla 6.3: Tablas de inversión de (E, R)

P hacer no hacer
R hacer no hacer E ra m T ra rn -ir
ra 0.575 0 Cl 0.470 0.07 X X X 0.3
rn 0.425 0 e2 0.452 0.33 X X X 0.4
-ir 0 1 ®3 0.078 0.60 X X X 0.3

Nótese la presencia de x en dichas tablas, resultante de la operación indetermina­


da 0/0. Ha aparecido como consecuencia de la inversión al tener probabilidades
cero en la distribución conjunta. Al hacer simétrico el problema, hemos intro­
ducido muchas probabilidades nulas y esto incrementa la posibilidad de tener
0/0. Debemos recordar que una probabilidad condicionada P(a\b) está definida
sólo para b con P(b) > 0 y por eso no debemos esperar calcular todas las condi­
cionadas al invertir arcos. De cualquier forma, como se verá a continuación, este
valor x no tendrá influencia en el problema, pues como podemos observar en la
tabla de 7r(J?|P =no hacer), todos los caminos por R ^ -ir estarán cortados.
Invertido el arco •(E ,R ), eliminamos E. La Tabla 6.4 es la almacenada en v
una vez eliminado E (ver Teorema 6.1). La Figura 6.10 muestra los diagramas
resultantes, donde se observa que E hereda el nodo P en la inversión y v hereda
el nodo R al eliminar E.

Tabla 6.4: Tablas de eliminación de E

P R C U P R C V
hacer ra c 0.594 no hacer ra c 1.31a;
- IC 0.25 -1c 0.78a;
rn c 0.201 rn c 1.31x
-1c 0.25 -1c 0.78x
-ir c 1.28a; ->r c 0.437
-1c 0.75a; -1c 0.26

Figura 6.10: Eliminación del nodo E


(£) RA-MA CAPÍTULO 6: DIAGRAMAS DE INFLUENCIA 217

Procedemos ahora a eliminar el nodo de decisión C, pues todos los predece­


sores condicionales de v son predecesores informativos de C. En la Tabla 6.5
expresamos en cada situación las decisiones óptimas a tomar en C mediante la
función <TC, ver Teorema 6.2. Por ejemplo, ¿¿(hacer, ra) = c pues 0.594 > 0.25.
Después eliminamos R por esperanza condicionada utilizando tanto la distribu­
ción de probabilidad n(R\P) que obtuvimos en la Tabla 6.4 como la tabla actual
del nodo de valor (en la Tabla 6.5). Finalmente eliminamos P obteniendo d*p. En
la Figura 6.11 se observan las transformaciones del diagrama: en a) eliminamos
C\ en b) R, y en c), P.

Tabla 6.5: Tablas de eliminación de C,R y P

p R U
hacer ra 0.594 c
m 0.25 -1c p U
-ir 1.28* c hacer U dp
0.448
no hacer ra 1.31* c no hacer 0.437 0.448 hacer
m 1.31* c
->r 0.437 c

a) b) c)

Figura 6.11: Eliminación de nodos a) C, b) R, c) P

Como se puede observar, la estrategia óptima es hacer la prueba; comprar el


helicóptero si el resultado de ésta es apto y no comprarlo si no lo es, La máxima
utilidad esperada del problema es 0.448, □

Al principio del capítulo dijimos que el nodo de valor tenía relación con los
nodos terminales del árbol de decisión. Podemos identificar ambos antes de la
evaluación del diagrama de influencia. Después, a medida que va siendo evaluado,
el nodo de valor se corresponde con las utilidades esperadas que van escribiéndose
sobre los nodos del árbol en el proceso de solución hacia atrás.

6.4 PROPIEDADES

En esta sección exponemos las principales ventajas y doBvonliftJiwdo loa (Ungíamos


de influencia, estableciendo la comparación con los árboles do decisión vistos on ol
218 FU N D A M EN TO S D E LO S S IS T E M A S D E A Y U D A A u ^ “ "-M A

capítulo anterior. Nos referiremos de nuevo tanto a propiedades de representación


como a propiedades computacionales.

Compacidad
Las soluciones propuestas al problema del crecimiento exponencial de los árboles
de decisión, por ejemplo, representarlo de forma esquemática, no son del todo
satisfactorias. Con los diagramas de influencia la representación del problema es
mucho más compacta que con los árboles de decisión. Cada variable añadida al
problema expande su tamaño linealmente. Para el problema del helicóptero, el
diagrama sólo tiene 2 nodos de azar, 2 de decisión, 1 nodo de valor y 7 arcos
dirigidos, mientras que el árbol tiene 4 nodos de azar, 4 de decisión, 12 nodos
terminales y 19 ramas que deben ser identificadas.
Como ya se ha indicado, ésta fue de hecho la propiedad en la que se basaron
sus creadores para introducir este tipo de diagramas, como parte de un proyec­
to para el Departamento de Defensa de Estados Unidos. Es un buen ejemplo
de cómo la demanda de una aplicación compleja puede estimular la innovación.
Como consecuencia, facilitan la comunicación entre el analista y el decisor y la
representación del conocimiento humano, dando a simple vista una idea global
del problema Modelizar aspectos tales como inferencia, predicción y decisión
resulta sencillo incluso para el decisor y pueden ser discutidos a un nivel no nece­
sariamente técnico.
Una de las claves está en separar siempre la descripción cualitativa del proble­
ma (el grafo) de la cuantitativa (las tablas asociadas a cada nodo), apareciendo,
por el contrario, unidas en los árboles de decisión. Por esta razón, los detrac­
tores de los diagramas de influencia critican el hecho de tener que acudir a ese
segundo nivel cuantitativo para conocer los detalles del problema (tanto los datos
de entrada como los de salida), resultando muy limitada la información que se
puede obtener del diagrama a simple vista. Pero ése es el precio que pagamos
por sacrificar los detalles.
A su vez, esta compacidad organizada en un grafo hace que el algoritmo sea un
algoritmo de reducción de nodos más que de enumeración de los caminos posibles.
El árbol de decisión trabaja con escenarios y representa las relaciones entre cada
posible combinación de decisiones y resultados que pudieran ocurrir. El diagrama
de influencia trabaja con variables (nodos) y representa las relaciones entre ellas.
Va eliminando nodos del modelo, lo que supone una reducción multiplicativa del
número de caminos. En teoría, debe ser capaz de resolver problemas en un tiempo
lineal, lo que supone una gran ventaja frente a la explosión combinatoria de los
árboles.

Representación eficiente de relaciones p robabilísticas


El decisor puede dar directamente las probabilidades condicionadas en la r
en que las tenga asignadas, sin necesidad de realizar ningún preproceso
C A P Í T U L O 0: DIAGRAMAS DE INFLUENCIA 21!)
© r a -m a

re resentar el problema. De hecho, el cálculo de las distribuciones necesarias


ara la resolución del problema se irán obteniendo durante la evaluación del
diagrama, dictadas por las inversiones de arcos. En el ejemplo del helicóptero
se representaban directamente las distribuciones Tr(E),ir(R\P)E) y luego se iban
obteniendo las distribuciones requeridas 7t(jB|íí,P),7r(ü|P). Esto significa que
no se tiene el problema de los dos árboles que tenían los árboles de decisión. Los
diagramas de influencia resultan entonces muy intuitivos, tendiendo un puente
entre el análisis y la formulación.
Además, las relaciones de dependencia e independencia probabilística se mues­
tran de forma explícita a través de los arcos dirigidos a nodos de azar. Dadas
dos variables aleatorias en un diagrama, se puede deducir si son condicional­
mente independientes o no (Dawid, 1979), por ejemplo, a través del concepto de
la d-separación (ver, por ejemplo, Pearl, 1988, 2000). Esto se ha estudiado mu­
cho en las redes bayesianas, que son diagramas de influencia con nodos de azar
únicamente. A veces han recibido otros nombres como diagramas de influencia
probabilísticos (Shachter, 1988), redes causales, diagramas de relevancia (Howard,
1990), sistemas expertos probabilísticos (Spiegelhalter et al., 1993). Una buena
referencia es Cowell et al. (1999). Por el contrario, no hay nada en la estruc­
tura de los árboles que ayude a determinar las dependencias entre las variables
aleatorias. Por eso los árboles ni siquiera detectan los sumideros (irrelevantes)
que aparecerían cerca de su parte terminal.

Sólo probabilidades condicionadas


Los diagramas de influencia sólo pueden manejar distribuciones de probabili­
dad condicionadas que normalmente sí están disponibles en modelos causales
probabilísticos. Sin embargo, en otros modelos gráficos no siempre se tiene la
distribución conjunta expresada de esa forma y tendremos que preprocesar las
probabilidades disponibles antes de poder representar el problema como un dia­
grama de influencia, tarea a menudo innecesaria para resolverlo. Por ello algunos
autores han creado estructuras que admiten descomposiciones arbitrarias de la
distribución conjunta, por ejemplo las redes de evaluación de Shenoy (1992a).
Nótese que esta inconveniencia también la comparten los árboles de decisión.
El proceso de solución tiene la propiedad de que al eliminar un nodo de
azar, el diagrama resultante es un diagrama de influencia, con nuevamente dis­
tribuciones condicionadas en los nodos de azar. Precisamente esta demanda de
distribuciones condicionadas para cada nodo de azar en cada etapa conduce a
realizar divisiones innecesarias (para la solución). Éstas tienen lugar en algu­
nas operaciones de inversión de arcos y equivalen a las que hacía el árbol de
decisión durante el preproceso de probabilidades. Las redes de evaluación de
Shenoy (1992a) consiguen evitar tales divisiones en muchos casos mediante un
algoritmo denominado de fusión. Tiene similaridades con el algoritmo de paso
de mensajes descrito en Lauritzen y Spiegelhalter (1988) para redes bayesianas.
En Alberite (1995) se encuentra el software ValNet para trabajar con redes de
220 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
J L S í -ma

evaluación. Ndilikiiikesha (1994) con sus diagramas de influencia potenciales y


Jensen, Jensen y Dittmer (1994) modifican el algoritmo estándar de diagrama
de influencia para hacerlo tan eficiente como el de fusión.

Computación local y aprovechamiento de la independencia condicional


El proceso de reducción de nodos e inversión de arcos está basado en la inde.
pendencia condicional, explícita en el diagrama, que era a su vez la base de 1»
coalescencia. Ello proporciona reducciones considerables en el número de cál­
culos, el tiempo de ejecución y los requisitos de memoria. Recordemos que gj
árbol no explota estas características consiguiendo a lo sumo detectar la coale»,
cencia ad hoc, dependiendo fuertemente de cómo se modelicen las restricciones
de información.
A diferencia de los árboles, el algoritmo de diagramas de influencia utiliza
computación local para calcular las condicionadas deseadas durante el proceso
de solución. El Teorema de Bayés permite pasar de un orden de .asignación a
un orden cronológico, y opera usando sólo las variables que realmente necesita.
Esto facilita resolver problemas grandes en los que la distribución conjunta se
descompone en condicionadas que afectan a pocas variables. Por el contrario, ya
vimos cómo en los árboles se solía operar “sin conocer” el Teorema de Bayes, con
la definición de probabilidad condicionada a partir de la distribución conjunta de
todas las variables aleatorias, haciendo los cálculos de manera ineficiente al no
explotar las independencias condicionales.
Por ejemplo, para eliminar el nodo A del primer diagrama de la Figura 6.12,
invertimos el arco (A, B ) obteniendo el segundo diagrama del que ya puede elimi­
narse A.

Figura 6.12: Computación local

La operación realizada en la inversión es local, en este caso, sin intervenir C-

P (B \ A )P {A )
( 1 ’ T .Á P (B \ A )P (A Y

Se está explotando que A y C son condicionalmente independientes dado B-


El algoritmo lo detecta por la presencia de los arcos (A ,B ), (B ,C ) y la ausencia
de (A ,C ). Sin embargo, el árbol haría los cálculos de forma no local, con a
CAPÍTULO 6: DIAGRAMAS DE INFLUENCIA 221
@ r a -m a

distribución conjunta y sin emplear la regla de Bayes:

2 , ^ PM B O P(B\C\ = p / d in n _
= ’ ' ' ' P (C ) ’ (■ I' 1°> ~ P (B \ 0)P (C )'
A,B

En realidad, P(A\B, C ) obtenida en el árbol coincide con P(A\B) que obtuvimos


en el diagrama, pero el árbol no puede detectar esa independencia condicional.

O r d e n p a r c i a l d e la s r e s t r i c c i o n e s d e i n f o r m a c i ó n
En cada problema de decisión existen ciertas restricciones de información sobre el
orden en que se van conociendo las variables. Para la representación, los árboles
requerían un orden completo sobre la posición relativa de sus nodos que afectaba
luego al esfuerzo computacional realizado. En los diagramas de influencia ocurre
algo diferente. El orden parcial expresado por el decisor es representado direc­
tamente en el diagrama a través de los arcos informativos dirigidos a’ nodos de
decisión.
Durante la evaluación del diagrama, como en los árboles, se respetarán las
restricciones de información, pues si una variable A ha de suceder antes que otra
B, entonces B se eliminará antes que A. La secuencia completa de eliminación
de nodos elegida, en caso de existir varias, influirá en el esfuerzo computacional,
como se verá a continuación.

Dependencia del ord en de eliminación de nodos


La eficiencia del algoritmo de evaluación depende del orden de eliminación de no­
dos, si es que existen varias ordenaciones, lo que depende a su vez de la estructura
del diagrama.
Distinguimos dos casos. El primero es cuando se tienen dos (o más) nodos de
azar preparados para ser eliminados. Esto ocurre por ejemplo cuando, debido al
orden parcial de las restricciones de información, no hay razones para imponer
la precedencia de una variable sobre otra en el proceso de decisión. Por ejemplo,
después de decidir ingresar a un paciente en el hospital, no habrá restricciones
sobre cuál de las variables aleatorias “coste de estancia” o “riesgos de ser admi­
tido” debe ocurrir primero. Los arcos informativos se encargan de reflejar esta
situación. El segundo caso sucede cuando existen dos o más arcos candidatos
para ser invertidos. En la Figura 6.13 se ilustran ambos casos.
Todas las posibles secuencias de eliminación conducen a la solución final pero
involucran un esfuerzo computacional diferente. En el diagrama a) de la Figura
6.13 sólo pueden eliminarse los nodos de azar A o B. En cualquiera de los ca­
sos elegidos, v heredará sus predecesores incrementando el tamaño de su tabla
asociada. Este incremento dependerá del dominio de los predecesores A l, A2,B1
y de las etapas sucesivas del algoritmo. En el diagrama b), S no puede elimi­
narse hasta que v sea su único sucesor (Teorema 6.1). Así, la única posibilidad
222 FUNDAMENTOS d e l o s s is t e m a s d e a y u d a a l a d e c is ió n ______ _ _ _ _ _ © ra .Ma

Figúra 6.13: Casos de diagramas de influencia con varias secuencias de eliminación de


nodos

es invertir el arco (5, SI) o el (£>, 52), con herencia mutua de predecesores (Teo­
rema 6.3). Por tanto, el orden elegido puede influir también en el tamaño de las
distribuciones de probabilidad almacenadas en los nodos de azar involucrados y
en consecuencia, en el esfuerzo computacional. Este es un aspecto clave en pro­
blemas reales. En Bielza et al. (2000) se utiliza un diagrama de influencia con 56
nodos para la gestión de ictericia en recién nacidos del hospital Gregorio Marañón
de Madrid. Requiere del orden 1016 posiciones de memoria para almacenar todas
las probabilidades y utilidades esperadas, excediendo la capacidad de cualquier
ordenador personal.
Encontrar la secuencia óptima de eliminación es un problema de optimización
NP-completo (Arnborg, Corneil y Proskurowski, 1987), siendo entonces una difi­
cultad inherente a los diagramas de influencia independientemente del algoritmo
empleado para su evaluación. Podemos entonces utilizar heurísticas para encon­
trar una buena secuencia. Una de ellas, debida a Kong (1986), se H p .n n rm n a “un
paso hacia delante” pues propone eliminar aquella variable que conduzca sólo en
esa iteración a cálculos sobre un espacio de menor tamaño. Así, en la Figura
6.13 a), deberíamos eliminar primero B porque su eliminación conlleva cálcu­
los en {A ,D ,B ,B 1 }, mientras que eliminar A conduce a trabajar en el espacio
{A ,D ,B ,A 1 ,A 2 }, seguramente de mayor tamaño.

Dificultad para modelizar asimetrías


Como hemos podido comprobar en el problema del helicóptero, los diagramas
de influencia sólo se ajustan a problemas de decisión que sean simétricos o casi
simétricos, que son más fáciles de implementar. En el caso de tener un problema
asimétrico se usan técnicas para convertirlo en simétrico. Esto conlleva un au­
mento del tamaño del problema, pues normalmente se definen estados artificiales
p oco intuitivos, y por tanto, se incrementa la carga computacional. Además, la
interpretación de las soluciones se hace más difícil. Los árboles, por el contrario,
CAPÍTULO (I: D IA G R A M A S D E IN F L U E N C IA 223
-----

ln disonados precisamente para aprovechar las asimetrías desde el punto de


^sta de la representación y de la solución.
En nuestro ejemplo, la asimetría por observar los resultados de la prueba sólo
ol caso do realizada nos obligó a añadir el arco (P, R) y a definir un nuevo
estado artificial -ir para la variable R, que indicaba mediante una distribución
degenerada on ->r que no se iban a obtener resultados si no se hacía la prueba,
^ Tibia 6.1. La asimetría debida a que no se observa el estado del helicóptero
si so decide no comprarlo se solucionó escribiendo utilidades iguales cuando el
estado es ->c: i7(hacer, -»c,e*)=0.25 y í/(no hacer, -ic,e¿) = 0.26, Vi = 1,2,3 (ver
Tabla 6.2).
Como las asimetrías son muy frecuentes en problemas reales, ahondaremos
más en ello en el siguiente capítulo, pues existen modificaciones de los diagramas
de influencia estándar que tratan de resolver estas cuestiones.

I n c a p a c id a d para tratar utilidades separables


Los diagramas de influencia vistos no pueden aprovechar la localidad que se ob­
tiene en los cálculos cuando se utilizan funciones de utilidad separables. Para
ello deberían crearse diagramas con varios nodos de valor, como veremos en el
próximo capítulo. Los árboles de decisión, por el contrario, sí son capaces de
aprovechar tales estructuras.

Complejo tratam ien to de variables aleatorias continuas


En cuanto al tratamiento de variables aleatorias continuas, las ideas expuestas
en el capítulo anterior sirven también aquí. Los diagramas de influencia fueron
ideados para variables que toman un conjunto finito de valores. Si bien podemos
representar fácilmente relaciones entre variables aunque sean continuas o mixtas,
la incorporación, cuantitativamente hablando, de variables con un número infini­
to de valores es aún un tema abierto. En Shachter y Kenley (1989) se estudian
modelos gaussianos. Poland (1994) utiliza una aproximación paramétrica, ajus­
tando mixturas de distribuciones gaussianas a las variables aleatorias continuas.
A pesar de que las mixturas son manejables, esta aproximación tiene un campo de
aplicación restringido al no permitir el uso de otras distribuciones. Otros modelas
más generales requieren acudir a la simulación, ver Bielza, Müller y Ríos Insua
(1999), o bien utilizar algún tipo de heurística, como la miope modificada por
una trayectoria de referencia, ver Ríos Insua et al (1997). Otras posibilidades
residen en el empleo de esquemas inteligentes de discretización.

Para finalizar esta sección, en la Tabla 6.6 mostramos un resumen comparativo


de varias propiedades de los árboles de decisión y los diagramas de influencia.
224 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

Tabla 6.6: TUbla comparativa de diagramas de influencia y árboles de decisión

DIAGRAMAS ÁRBOLES
1. palabra clave indep. condicional escenario
2. compacidad si no (explosión
combinatoria)
3. represent. probabilidades directa con preproceso
(condicionadas) (problema dos árboles)
4. relaciones probabilísticas explícitas no (se detectan ad hoc)
5. modelización de asimetrías no sí
6. algoritmo reducción nodos enumeración caminos
7. computación local sí no
para condicionadas
8. aprovechan indep. condicional . sí no

6.5 SOFTWARE

Para el manejo de los diagramas de influencia es aconsejable disponer de algún


software que permita resolver problemas de gran tamaño. Las referencias sobre
esto citadas en el capítulo anterior vuelven a ser útiles: Buede (1996) y la revista
OR/MS Today de agosto de 1998. Destacamos los siguientes programas que
consideramos más representativos:

• In D ia de Decisión Focus, Inc. (Los Altos, CA), escrito en Pascal, es un pro­


grama muy sencillo para representar y analizar problemas de decisión me­
diante diagramas de influencia. Dispone de una interfaz gráfica de usuario
y un menú de comandos jerárquico con opciones de actuación sobre el grafo
(borrar, mover, actualizar, consultar, grabar), evaluación del diagrama con
la posibilidad de que el nodo de valor sea un nodo de lotería (es decir,
trabajar con su distribución en lugar de con su esperanza), análisis de sen­
sibilidad no muy elaborado, y cálculo del valor de la información. Tiene
limitaciones en el tamaño del problema y ayuda mínima para la impresión.
La versión 2.0 se ejecuta bajo DOS 3.0 o superior y requiere unos requisitos
mínimos del sistema. Más información en el manual de InDia (1991).

• P recision T ree de Palisade Corporation (Newfield, NY), representa y re­


suelve árboles o diagramas de influencia directamente en Microsoft Excel
usando objetos estándar de Excel. Los diagramas de influencia admiten sólo
un nodo de valor. Es parte de Decisión Tools Suite, un conjunto integrado
de cinco productos para Análisis de Decisiones y riesgos. Se recomienda
Pentium, Windows 95 y 16 MB RAM y ha de tenerse instalado el Microsoft
Excel 5.0. Más información en h ttp://w w w .p alisad e.com o en el manual
de PrecisionTree (1999). En la misma línea funciona Crystal Ball, de
Decisioneering Inc. (Denver, CO).
© r a -m a
CAPÍTULO 6: DIAGRAMAS DE INFLUENCIA 225

• DA TA de TreeAge Software Inc. (Boston). Utiliza una técnica mixta,


aprovechando las ventajas de los árboles y de los diagramas: se sirve de los
diagramas de influencia para definir el problema y para aplicar la fórmula
de Bayes, pero sólo se lleva a cabo la solución sobre el árbol deducido a
partir de este diagrama. La versión 3.5 distribuye modelos por Internet,
es decir, accede a modelos y los evalúa usando visualizadores estándar de
Internet. Los requisitos de instalación se indicaron en el Capítulo 5. Más
información en h t t p : / /www. treea ge. com y en el manual DATA (1999).

• D PL de Cali y Miller (ADA Decisión Systems, Menlo Park, CA). Similar


a DATA, lo detallamos en la sección siguiente completando así lo indicado
en el capítulo anterior. Maxwell. (1996) revisa tres paquetes: InDia, DPL
y Demos. ■.
Más información en http://www.adainc.com/software/index.html.

• Analytica de Lumina Decisión Systems Inc. (Los Gatos, CA), proporciona


una interfaz visual intuitiva para crear y manejar modelos complejos me­
diante diagramas de influencia jerárquicos y matrices “inteligentes” . Está
disponible para Windows 95 y NT, y para Macintosh.
Más información en h ttp : //www. lumina. com.

• N E T IC A , con información en h ttp : / /www. norsys. com, página comercial


de Norsys Software Corp. (Vancouver, Canadá), empresa dedicada al de­
sarrollo de herramientas informáticas para la aplicación de redes de creen­
cias y diagramas de influencia. Existe una versión de libre distribución de
NETICA, aunque para la mayoría de las aplicaciones de Norsys se necesita
comprar la licencia. Es interesante su librería de redes de creencias, donde
se exponen algunas de las que han aparecido en la literatura.

• GeNIe, desarrollado por el laboratorio de Sistemas de Decisiones de la Uni­


versidad de Pittsburgh, sirve en general para inferencia en redes bayesianas
mediante gran variedad de métodos y para diagramas de influencia. Es
gratuito y de uso no comercial, para investigación básica, enseñanza y uso
personal. Puede leer y guardar ficheros en la mayoría de formatos utiliza­
dos por otros programas similares. Se ejecuta bajo Windows 95/NT. Este
grupo también distribuye el motor de razonamiento, llamado SMILE, acce­
sible a través de una interfaz C /C + +. Lo pueden usar los programadores
para construir sus propios programas de redes bayesianas. Más información
en http://www2. s i s . p i t t . edu/~genie.

El gran número de paquetes de software que se venden en el mercado es


muestra de la sencilla automatización de estos algoritmos, Los árboles o los
diagramas de influencia aportan un algoritmo mejor o peor, pero su valor depende
posteriormente de su implementación, afectando a los requisitos de memoria y al
226 FUNDAM ENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

tiempo de análisis. Obviamente, también se mide si un producto es bueno por su


facilidad de uso, lo que entra dentro de la Ingeniería del Software.
En Internet puede encontrarse información muy rica y variada. Por ejemplo,
en h ttp ://w w w .a u a i.org encontramos la página de la sociedad Association Jor
Uncertainty in Artificial Intelligence. Contiene las actas de los famosos congresos
de Uncertainty in Artificial Intelligence, celebrados anualmente desde 1985, con
artículos y tutoriales sobre modelos gráficos y las últimas tendencias. Además,
posee una lista excelente de enlaces relacionados. Este grupo tiene una lista
de distribución muy interesante que actúa como principal foro electrónico de
discusión de la comunidad.
Otras fuentes útiles son las revistas OR/MS Today, OR/MS Tomorrow y sobre
todo, Decisión Analysis Newsletter. La lista de distribución electrónica DAList de
la Decisión Analysis Society de INFORMS (h t t p : //www. in f orms. org/Society/
DA), mantenida desde Fuqua School of Business (Duke University), es también
interesante, con artículos, enlaces a sitios relacionados, etc.

6 .5 .1 DPL

Como indicamos en la sección del Capítulo 5 dedicada al DPL, un fichero DPL


contiene dos secciones. La definición de datos equivale a especificar el diagrama de
influencia asociado, mientras que la sección de secuencia del proceso de decisión
equivale al correspondiente árbol de decisión. Precisamente, la separación de las
dos secciones en el programa fuente permite al DPL sacar provecho de las ventajas
de cada método: los diagramas de influencia son mejores para representar las
relaciones probabilísticas y los árboles para describir la secuencia de decisión. En
ese sentido es una técnica híbrida. No se trata de duplicar la representación del
mismo problema sino de complementarse.
El algoritmo utilizado es el de los árboles de decisión. Sin embargo, DPL
reduce internamente el árbol explotando las propiedades estructurales del pro­
blema, detectadas a partir de su diagrama de influencia asociado. Las ventajas
son obvias: no tiene el problema de los dos árboles, por lo que puede especificar las
relaciones probabilísticas en cualquier orden, maneja fácilmente asimetrías y uti­
lidades separables, aprovecha la coalescencia automáticamente, usa computación
local y el Teorema de Bayes para las probabilidades condicionadas.

E jem plo (compra de helicóptero) (continuación del Ejemplo 5.2)


Ya vimos las dos secciones del código fuente de este ejemplo (Figura 5.10).
También vimos que podía dibujarse directamente el modelo (árbol y diagrama de
influencia) convirtiéndose después automáticamente al lenguaje DPL. Por ello no
mostram os ahora el diagrama por ser idéntico al de la Figura 6.4. No obstante, los
arcos informativos no son absolutamente necesarios al encontrarse tal información
en el árbol asociado.
© RA-MA CAPITU LO G: DIAGRAMAS DE INFLUENCIA 227

Además de la estrategia óptima ya mostrada (ver Figura 5.12), DPL ofrece


distribuciones de probabilidad llamadas perfiles de riesgo, indicando la incer­
tidumbre asociada con la estrategia óptima o con otra de interés. Éstos muestran
el rango de posibles valores bajo dicha estrategia, es decir, los valores (utilidades)
que podrían alcanzarse y con qué probabilidad si se sigue la estrategia. Se sue­
len mostrar en forma de histograma o de función de distribución. Por ejemplo,
para la estrategia óptima, el diagrama de barras para nuestro ejemplo sería el de
una variable que toma los valores 0, 0.25, 0.43 y 0.85 con probabilidades 0.045
(=0.575 x 0.078), 0.425, 0.260 (=0.575 x 0.452) y 0.270 (=0.575 x 0.470), res­
pectivamente. Equivalentemente, la función de distribución aparece generada por
DPL en la Figura 6.14. La linea vertical marca la utilidad máxima esperada del
problema, 0.448.

09
. -

08
. -

0.7- ---------------------------- — ---------- -J

0.6-

0.5

0.4-
0.3

02-
0.1
'*■ I i -r— —i------ 1— — i------ ,------ ,------ ,-----
o 0.1 0l2 H 0.4 H Olí 07 OS

Figura 6.14: Perfil de riesgo para la estrategia óptima del problema del helicóptero

Este tipo de información nos ayuda a comprender el riesgo que conlleva un


determinado plan de acción. □

Con DPL la entrada de datos para cada nodo se solicita en forma de árbol,
adjuntando la información de dependencia probabillstica y funcional, ver Figu­
ra 6.15.
Pero en muchos casos, las relaciones de dependencia tienen efecto sólo en las
probabilidades o en las utilidades, no en ambas. Por ello, mediante diferentes
colores de flechas en el diagrama de influencia se puede indicar, por ejemplo,
que la probabilidad para un nodo de azar A depende de una decisión D pero las
utilidades no dependen de ella, como ocurre en la Figura 6.15. DPL entonces
requiere del usuario menos datos a introducir, ver Figura 6.16.
J'/H KU N D AM K N T08 !>/'■l/OH 8JHTEMA8 1)14 AYUOA A (>A D B C I8 IÓ N
SLÍÜ-ma

- í

-fl
-3 0

lO

■50

. de dlatos usual
al/'0,2
yfl2
Áa3 0.7 lD
0.1
■£)
al/ 0.5
\a2
Áa3 0.3

Figura 6.16: Entrada de datos para distribuciones de probabilidad (izquierda) y utili­


dades (derecha)

DPL detecta los sumideros avisando de ello. Se pueden incluir restricciones


(por ejemplo, tiempo, presupuesto). La especificación de las utilidades es muy
flexible pudiendo definirse la función de utilidad a partir de expresiones referidas a
otras variables. Todas estas facilidades revierten en el manejo eficiente y efectivo
de modelos grandes.
Respecto a otros conceptos del Capítulo 8, con DPL también podemos realizar
análisis de sensibilidad, calcular la probabilidad de que ocurra un determinado
evento si se sigue la política óptima, estudiar qué variables pueden eliminarse,
calcular el valor esperado de la información perfecta o imperfecta, etc. Como
contrapartida, el hecho de exigir al usuario conocer los dos modelos gráficos puede
ser un inconveniente.
_____________________________CIAV(TU U ) Oí P lA O ltA M A H DE INFLUENCIA 220

0.(> DISCUSIÓN
Los dioramas do Influencia han cloinos(¡rudo sor una hornunlonta potente a lo
Iwko do los últimos años como marco para discutir dlforontos formulaciones del
problema con los decisores antes de iniciar la asignación más elaborada y de­
tallada do costes, probabilidades, alternativas reales y resultados. Mientras los
modelos c u a n tit ativos son, por naturaloza, efímeros, las relaciones en los modelos
cualitativos son mucho mis robustas, rompiéndose sólo cuando hay un cambio
dramático cualitativo en el entorno, Representan directamente el razonamiento
visado por el decisor y enseguida lo hacen suyo. Esto no ocurre con los números.
No se aceptan tan fácilmente.
A pesar de tal robustez se debe ajustar el modelo junto al decisor para que
aprenda sobre la estructura del problema y, especialmente, sobre la estructura de
creencias como una forma de análisis de sensibilidad. Esto es muy sencillo con los
diagramas de influencia. De las sentencias iniciales de irrelevancia reflejadas en él
se pueden hacer numerosas deducciones utilizando el álgebra de relevancia (Pearl,
1988). Se basa en los axiomas de independencia condicional de Dawid (1979),
quien los introdujo sin ninguna conexión gráfica. Dawid probó que el esquema
propuesto no sólo servía para el razonamiento probabilístico sino también para
otras formas de razonamiento. Como consecuencia, se consiguió tener un marco
unificado para todas las formas de razonamiento que explotan la independencia
condicional.
Aun así, podemos tender a representaciones iniciales con las que el decisor
no esté contento, en cuyo caso lo más indicado es comunicarse con personas
expertas en el dominio del problema que den su opinión. La toma de decisiones
en grupo (Capítulo 9) dará pistas para esto. Una cuestión abierta es generalizar
los diagramas de influencia para que representen problemas de múltiples decisores.
Con la introducción de los diagramas de influencia (Howard y Matheson,
1981) comenzó el uso estadístico de los grafos dirigidos. Pero fueron Pearl (1986)
y Lauritzen y Spiegelhalter (1988) quienes establecieron gráficamente las rela­
ciones de dependencia e independencia probabilística utilizando grafos dirigidos.
Por entonces se consideraba muy compleja la especificación de incertidumbre y
computación con el método probabilístico de razonamiento, lo que cambió profun­
damente con esta nueva visión que explota la estructura modular natural de los
modelos gráficos. El desarrollo que han alcanzado los diagramas de influencia crea
nuevas posibilidades en Análisis de Decisiones para construir sistemas inteligentes
(Capítulo 10) usándolos como marco de representación del conocimiento y de re­
glas probabilísticas.
El uso de grafos dirigidos para expresar la factorización de la distribución
conjunta es conveniente cuando la incertidumbre la describe un experto. Sin
embargo, en problemas en los que se induce el modelo de probabilidad a partir
de datos, pueden ser más apropiados otros modelos gráficos como los grafos no
CAPITULO 6: DIAGRAMAS DE INFLUENCIA 229
© r a -m a

6.6 DISCUSIÓN
Los diagramas de influencia han demostrado ser una herramienta potente a lo
largo de los últimos años com o marco para discutir diferentes formulaciones del
problema con los decisores antes de iniciar la asignación más elaborada y de­
tallada de costes, probabilidades, alternativas reales y resultados. Mientras los
modelos cuantitativos son, por naturaleza, efímeros, las relaciones en los modelos
cualitativos son mucho más robustas, rompiéndose sólo cuando hay un cambio
dramático cualitativo en el entorno. Representan directamente el razonamiento
usado por el decisor y enseguida lo hacen suyo. Esto no ocurre con los números.
No se aceptan tan fácilmente.
A pesar de tal robustez se debe ajustar el m odelo ju n to al decisor para que
aprenda sobre la estructura del problem a y, especialmente, sobre la estructura de
creencias com o una forma de análisis de sensibilidad. E sto es muy sencillo con los
diagramas de influencia. De las sentencias iniciales de irrelevancia reflejadas en él
se pueden hacer numerosas deducciones utilizando el álgebra de relevancia (Pearl,
1988). Se basa en los axiomas de independencia condicional de Dawid (1979),
quien los introdujo sin ninguna conexión gráfica. Dawid probó que el esquema
propuesto no sólo servía para el razonamiento probabilístico sino también para
otras formas de razonamiento. Com o consecuencia, se consiguió tener un marco
unificado para todas las formas de razonamiento que explotan la independencia
condicional.
Aun así, podemos tender a representaciones iniciales con las que el decisor
no esté contento, en cuyo caso lo más indicado es comunicarse con personas
expertas en el dominio del problema que den su opinión. La tom a de decisiones
en grupo (Capítulo 9) dará pistas para esto. Una cuestión abierta es generalizar
los diagramas de influencia para que representen problemas de múltiples decisores.
C on la introducción de los diagramas de influencia (Howard y Matheson,
1981) comenzó el uso estadístico de los grafos dirigidos. Pero fueron Pearl (1986)
y Lauritzen y Spiegelhalter (1988) quienes establecieron gráficamente las rela­
ciones de dependencia e independencia probabilística utilizando grafos dirigidos.
P or entonces se consideraba muy com pleja la especificación de incertidumbre y
com putación con el m étodo probabilístico de razonamiento, lo que cambió profun­
damente con esta nueva visión que explota la estructura modular natural de los
m odelos gráficos. El desarrollo que han alcanzado los diagramas de influencia crea
nuevas posibilidades en Análisis de Decisiones para construir sistemas inteligentes
(C apítulo 10) usándolos com o marco de representación del conocimiento y de re­
glas probabilísticas.
El uso de grafos dirigidos para expresar la factorización de la distribución
conjunta es conveniente cuando la incertidumbre la describe un experto. Sin
em bargo, en problemas en los que se induce el m odelo de probabilidad a partir
de datos, pueden ser más apropiados otros modelos gráficos com o los grafos no
© R A -M A C A P I T U L O 0; D IA G R A M A S D E IN F L U E N C IA 231

Olí (Pearl, 1988) o puerta-OR generalizada (por ejemplo, Henrion, 1989; Diez,
1993). Se tienen varias causas produciendo un ofocto, y bajo ciertas hipótesis, so
requieren sólo las probabilidades del ofocto dado que únicamente una causa está
presente (el resto ausento), Es decir, se requiero un número de asignaciones lineal
respecto al número do causas en vez do exponencial, corno on ol caso general.
En el diagrama de 56 nodos comentado para ictericia neonatal, ver Bielza et al.
(2000), el ahorro del número de asignaciones fue del 70%.
Para el nodo de valor y los de decisión en problemas de tamaño considerable,
el orden de eliminación de nodos inverso al temporal tiende a crear tablas muy
grandes (mayores que las de las redes bayesianas de complejidad similar). Las
asociadas a cada nodo de decisión pueden contener variables irrelevantes para la
toma de esa decisión y resulta de interés eliminarlas. Nielsen y Jensen (1999)
estudian esto introduciendo diagramas de influencia con sólo un orden temporal
parcial especificado. Fagiuoli y Zaffalon (1998) usan un criterio de d-separación
para la identificación de estas variables irrelevantes. Nilsson y Lauritzen (2000)
también usan ese criterio una vez que el diagrama de influencia se ha convertido
en un árbol de uniones. Fernández del Pozo, Bielza y Gómez (2001) investi­
gan el problema del almacenamiento de grandes tablas de datos y extracción
de conocimiento de las mismas, con ideas de matrices dispersas generalizadas y
heurísticas para optimización combinatoria.
Recientemente se ha introducido el principio de evaluación perezosa para
mejorar la eficiencia de la inferencia en redes bayesianas. Se trata de mantener las
descomposiciones de los potenciales y posponer los cálculos tanto como sea posi­
ble. Madsen y Jensen (1999) trasladan estas ideas a la resolución de problemas de
decisión simétricos consiguiendo disminuir el número de operaciones aritméticas
realizadas.
Durante el algoritmo de evaluación, aparte de la heurística de Kong para
encontrar buenas secuencias de eliminación de nodos, Ezawa (1986), Mellouli
(1987), Olmsted (1983) y Zhang (1993) exponen otras. Gómez y Bielza (2000)
utilizan un algoritmo genético consiguiendo mejoras notables. Smith (1989) pro­
pone un algoritmo para identificar en qué orden debemos invertir los arcos para
que se minimice el número de arcos adicionales en el grafo, pues cada vez que
introducimos uno perdemos información.
Una vez construido el modelo puede ocurrir que debamos tratar casos par-
cialmente observados, bien en nodos de azar, bien en nodos de decisión. Este es
un tipo de información que debe aprovecharse reduciendo la incertidumbre del
modelo mediante su propagación por el mismo, Ezawa (1998). En el Capítulo 10
se explicará con más detalle.
Bielza y Ríos Insua (1998) comentan éstas y otras cuestiones. En Cali y
Miller (1990) encontramos un estudio comparativo de árboles y diagramas de
influencia, y del uso del DPL. Shenoy (1994) compara los dos modelos con las
redes de evaluación. Para más detalles técnicos puede consultarse el texto de
232 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © R A -M A

Oliver y Smith (1990). Las siguientes referencias muestran modificaciones de


la técnica de evaluación de los diagramas de influencia estándar: Smith (1988),
Shachter y Peot (1992), Ndilikilikesha (1994), Jensen, Jensen y Dittmer (1994)(
Zhang, Qi y Poole (1994), Goutis (1995).
Si se está interesado en las redes bayesianas, puede utilizarse software co­
mo Hugin (h ttp ://w w w .h u gin .d k ) o Dxpress (h ttp ://w w w .k ic .c o m ). La pági­
na h t t p : / /www. e s . brown. e d u /r e s e a r c h /a i está dedicada a la Inteligencia Ar­
tificial, con dos enlaces interesantes. Uno de ellos dedicado a incertidumbre
en Inteligencia Artificial y otro a redes bayesianas y diagramas de influencia.
La página h t t p : / /b a y e s . s t a t . W ashington. e d u /a lm o n d /b e lie f. html contiene
software para manipular modelos gráficos como redes bayesianas y diagramas de
influencia.
Desafortunadamente aún existe una separación entre la teoría y la práctica
de los diagramas de influencia en problemas complejos (Henrion, 1989). En el
Capítulo 7 se darán versiones mejoradas de estos diagramas que resuelven algunas
de las desventajas que presentan en su forma estándar.

6.7 EJERCICIOS

6.1 Pensar un ejemplo en el que al tomar un nodo de azar i € C (y) para


ser eliminado teniendo muchos sucesores (de azar), se obtenga un cido al
realizar las inversiones de arcos.

6.2 Pensar en la equivalencia existente entre las condiciones requeridas para


eliminar cada tipo de nodo de un diagrama de influencia y de un árbol
de decisión. Deducir a qué equivale la operación de inversión de arcos del
diagrama de influencia en un árbol de decisión. Deducir por qué se producen
herencias en ciertas transformaciones de un diagrama de inflnpnría

6.3 Resolver de forma cualitativa (sin hacer cálculos) el diagrama de influencia


siguiente

6.4 Resolver un problema simétrico utilizando primero un árbol de decisión


y luego un diagrama de influencia. Comparar los tiempos de ejecución
CAPÍTULO 8: DIAGRAMAS DE INFLUENCIA 233
@ r A-MA

y el número de cálculos realizados. Analizar su complejidad algorítmica.


Repetir el experimento con un problema asimétrico.

6.5 Si en la Figura 6.12 se elimina primero B en vez de A, indicar las operaciones


realizadas hasta poder eliminar B. Decir si son locales y de qué forma se
aprovecha la independencia condicional. ¿Qué harían los árboles en este
caso?

6.6 Crear un diagrama de influencia en el que existan varias secuencias de elimi­


nación de nodos. Resolverlo utilizando cada vez una secuencia diferente.
Comparar el esfuerzo computacional requerido en cada caso. Deducir qué
heurística podría haber dado una buena secuencia en este caso.

6.7 Indicar qué propiedades de los diagramas de influencia son propiedades de


representación y cuáles son computacionales.

6.8 Resolver el Ejercicio 5.8 utilizando un diagrama de influencia. Indicar cuán­


tas secuencias posibles de eliminación de nodos existen.

6.9 Una compañía eléctrica debe decidir si construir un reactor de diseño avan­
zado, un reactor de diseño convencional, o ninguno. El reactor avanzado
conlleva más riesgo pero, en caso de éxito, proporciona más beneficios. A
partir de experiencias previas, se estima que un reactor convencional tiene
probabilidad 0.98 de no fallar una vez construido y 0.02 de fallar. Por otra
parte, un reactor avanzado tiene probabilidad 0.660 de no fallar (ae), 0.244
de tener un accidente leve (al), y 0.096 de tener un accidente grave (ag).
Los beneficios si se decide construir un reactor convencional son de 8 millo­
nes de euros si no hay fallo, y de -4 millones si hay un fallo. Los beneficios
si la firma construye un reactor avanzado son de 12 millones de euros si
no falla, -6 millones si hay un accidente limitado, y -10 millones si hay
un accidente grave. La función de utilidad de la compañía es la función
beneficio y por tanto, el objetivo es maximizar el beneficio neto esperado.
Antes de tomar esta decisión, la firma puede realizar un test caro sobre
las componentes críticas del reactor de diseño avanzado que reduciría la
incertidumbre sobre este tipo de reactor. Los resultados del test se pueden
clasificar en malos (m ), buenos ( 6) o excelentes (e). El coste del test es
de 1 millón de euros. Si se realiza el test, sus resultados están muy rela­
cionados con el éxito o fracaso del reactor avanzado. Las verosimilitudes
de los resultados del test son: P(b\ae) — 0.182, P(e\ae) = 0.818, P(m|ol) =
0.288, P(b\al) = 0.565, P(e\al) = 0.147, P(m\ag) = 0.313, P(b\ag) = 0.437,
y P(e\ag) = 0.250. Si los resultados del test son malos, la opción avanzada
no es viable, pues la Agencia de Regulación Nuclear no permitirá este tipo
de reactor. La compañía debe decidir si realizar este test o no.
234 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISION © RA-MA

Se pide:

(a) Representar el problema mediante un árbol de decisión. Mostrar el


preproceso de probabilidades realizado.
(b) Resolver el árbol de decisión. Indicar la estrategia óptima y el máximo
beneficio neto esperado.
(c) Indicar qué propiedades posee este árbol.
(d) Representar el diagrama de influencia asociado y resolverlo.
(e) ¿Cuándo merece la pena realizar el test?

6.10. Juan está considerando comprar un coche usado a un comerciante por 6000
euros. El precio del mercado de coches similares sin defectos es 6600, pero
excepto el coche ya indicado del comerciante, Juan no sabe de otro que esté
en venta. Juan no sabe si tal.coche es una “estafa” o es una “ganga” . De los
10 subsistemas principales que hay en un coche, la “ganga” tiene un defecto
serio en un subsistema exactamente, mientras que la “estafa” lo tiene en
6 . En cualquiera de los casos cada subsistema tiene la misma probabilidad
de ser defectuoso. La probabilidad de que el coche considerado sea una
“estafa” es 0.2. El coste de reparar un defecto es 240 euros, y de reparar 6
defectos es 1200.
Por 360 euros adicionales, Juan puede comprar el coche con una “garantía
anti-estafa” . Ésta pagará normalmente el 50% de los costes de reparación
de cualquier defecto, pero si el coche es una “estafa” , entonces pagará el
100 % de los costes de reparación.
Antes de comprar el coche, Juan tiene la opción de que un mecánico lo
examine durante una hora. El mecánico le ofrece las tres alternativas si­
guientes t i ,t 2,t 3 :

• t\: Probar el subsistema de dirección, por 54 euros;


• Í 2-" Probar los subsistemas eléctricos y de combustible, por 78 euros;
• Í3 : Realizar dos pruebas en secuencia en la que Juan puede autorizar
la realización de la segunda una vez que conoce el resultado de la
primera. El mecánico examina primero el subsistema de transmisión
por 60 euros y le da a Juan el resultado. Si Juan lo aprueba, el
mecánico procederá a examinar el subsistema diferencial con un coste
adicional de 24 euros.

Todos los tests garantizan encontrar un defecto en los subsistemas si el


defecto existe.

(a) Observar que Juan tiene que tomar varias decisiones: ¿Debería optar
por dejarle el coche al mecánico para que lo revisara? Si es así, ¿qué
CArtTUt.O 0: DIAGRAMAS OI) INI'I UWNU1A UHh

test debería hacer ol mecánico? Si escoge ol tj, ¿debería pinar úeapilÓM


del primn test o continuar con ol Segundo? ¿Debería eomprar ol cocho
o no? Si decide comprarlo, ¿debería comprar la garantía o no?
Modelizar ol problema do decisión do Juan como un Arbol de decisión
0 un diagrama «.io influencia. 131 modelo debe Inolulr todos Ion aspecto»
dol probloma: alternativas, posible valores de las variables ¡tloutorlfui y
sus probabilidades, rostricclones do información y consecuencias. Uí)tU'
01 beneficio noto para valorar las consecuencias, Documentar ndo
criadamente ol modelo,
(b) Resolver ol problema, do decisión modelli»ado on la pregunta anterior y
escribir una estrategia óptima con palabras y su beneficio neto espe­
rado. Documentar cómo se llegó a las respuestas.

6,11 Un laboratorio farmacéutico quiero realizar experimentos con un proceso


que requiero una sustancia química altamente tóxica. Por seguridad, todos
los químicos han de llevar un equipo protector. 131 jefe del laboratorio
debe decidir entro dos tipos do trajes. Ambos cuestan aproximadamente lo
mismo poro están hechos de material diferente. El trajo A os muy rígido,
grueso y completamente impermeable. El traje B os monos rígido y monos
grueso, pero podría ser más permeable, Cada una de estas características
influirá en el éxito del experimento pues puedo perjudicar el rendimiento de
los químicos o su seguridad. Además do estar protegidos de la sustancia,
necesitan poder ver bien, oir bien, moverse libremente y tener movilidad on
los dedos. Las características precisas de los t rajes son inciert as,
Dado el siguiente programa cu DPL que define el modelo, representar ol
correspondiente diagrama de influencia y resolverlo.

decisión Traja. { A , Bí­


chanos Rigidez, {mucha,poca}|Traje«
{0.7}, // Traje.A
{0.2}; // Traje.B
chance Permeabilidad, {mucha, poca}|Traje“
{0.25}, // Traje.A
{0.6}; // Traje.B
chance Sensibilidad_dactilar. {perjudicada,no_perjudicada}|
Rigidez,Permeabilidad*
//Rigidez.mucha
{0.5}, // Permeabilidad.mucha
{1.0}, // Permeabilidad.poca
//Rigidez,poca
{0.1}, // Permeabilidad.mucha
{0.6}; // Permeabilidad.poca
FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN

chance Libertad_mov.{perjudicada,no.perjudicada})
R igidez,Permeabilidad*
//Rigidez.mucha
{0.5}, // Permeabilidad.mucha
{i.0}, // Permeabilidad.poca
//Rigidez.poca
{0.0}, // Permeabilidad.mucha
{0.5}; // Permeabilidad.poca
chance Proteccion_gases.{perjudicada,no.perjudicada}|
Permeabilidad»
{0.9}, // Permeabilidad.mucha
{0.1J-; //■ Permeabilidad, poca
chance Movilidad_dedos.{perjudicada,no.perjudicada}|
Rigidez*
{1.0}, // Rigidez.mucha
{0.2}; // Rigidez.poca
valué Seguridad|Libertad_mov,Proteccion_gases=
//Libertad.mov.perjudicada
100, // Proteccion.gases.perjudicada
60, // Proteccion.gases.no.perjudicada
//Libertad.mov.no.perjudicada
77, // Proteccion.gases.perjudicada
0; // Proteccion.gases.no.perjudicada
valué Rendim.,trabajo|Movilidad_ dedos,
Sensibilidad_dactilar=
//Movilidad.dedos.perjudicada
100, // Sensibilidad_dactilar.perjudicada
75, // Sensibilidad.dactilar.no_perjudicada
//Movilidad_dedos.no.perjudicada
50, // Sensibilidad.dactilar.perjudicada
0; // Sensibilidad_dactilar.no.perjudicada
valué Control.experimento = 2 * Seguridad + Rendim.trabaj
sequence:
make a min decisión to Traje then
gamble on Movilidad.dedos then
gamble on Proteccion.gases then
gamble on Libertad.mov then
gamble on Sensibilidad.dactilar and
get Control.experimento
CAPÍTULO 7

MODELOS GRÁFICOS
ALTERNATIVOS___________

En este capítulo expondremos otros modelos gráficos, algunos diseñados para


resolver los inconvenientes que presentan los árboles de decisión o los diagramas
de influencia. La primera parte se centrará en árboles alternativos destacando
su gran utilidad en casos muy particulares. Básicamente tratarán de resolver
el problema de los dos árboles o el crecimiento exponencial. La segunda parte
ahondará en los diagramas de influencia desde dos perspectivas: diagramas que
explotan la estructura separable de la función de utilidad, y diagramas ideados
para modelizar estructuras asimétricas. Finalizaremos el capítulo con métodos
de simulación que parecen ser por el momento la única solución aproximada a
problemas de gran tamaño y complejidad.

7.1 ÁRBOLES ALTERNATIVOS

7.1.1 A r b o le s d e escen arios

Uno de los inconvenientes de los árboles de decisión era el llamado problema de los
dos árboles, ver Capítulo 5. Consistía en el preproceso de probabilidades antes
de representar el árbol para obtener las probabilidades requeridas. Su cálculo
no era eficiente al trabajar con la distribución conjunta. Con la idea de evitar
dicho preproceso, Shenoy (1995) describe un método para resolver los árboles de
decisión llamado método de poda. Esto sugiere una ligera variante de los árboles
de decisión que llamaremos árboles de escenarios.

Ejemplo 7.1 (com pra de helicóptero) (continuación del Ejemplo 5.2)


Utilizamos el ejemplo de los dos capítulos anteriores. En la Figura 7.1 se
representa el problema mediante un árbol de escenarios.
238 FUN D AM EN TO S D E LOS SISTEMAS D E A Y U D A A L A D ECISIÓN © RA-MA

Las utilidades en negrita corresponden a la fase de solución y no son por tanto


parte de la representación.
probab. del utilidad
utilidad camino ponderada

0 .8 5 0 .2 7 0.23

0 .4 3 0 .2 6 0.1118

0 .0 0 0 .0 4 5 0

0 .2 5 0 .5 7 5 0.1437

0 .8 5 0 .0 3 0.0255

0 .4 3 0 .1 4 0.0602

0 .00 0 .2 5 5 0

0 .2 5 0 .4 2 5 0.1063

0 .8 6 0 .3 0.258

0 .4 4 0 .4 0.176

0 .0 1 0 .3 0.003

0 .2 6 1 0.26

Figura 7.1: Árbol de escenarios para el problema del helicóptero


A diferencia del árbol de decisión, en estos árboles no hay que especificar las
probabilidades (condicionadas) en las ramas de los nodos de azar. En su lugar, al
final de cada camino (del nodo raíz a un nodo terminal) se indica la probabilidad
del escenario asociado, denominada probabilidad del camino. Su cálculo se realiza
multiplicando todas las probabilidades de las variables en el camino y se indica en
una columna junto a la de utilidades. Así, la Figura 7.1 nos indica, por ejemplo,
que P (R =apto, E = e 2¡P =hacer prueba, C =comprar)= 0.65 x 0.4 = 0.26, que
se interpreta como la probabilidad de alcanzar el nodo terminal correspondiente,
condicionado a una estrategia del decisor que haga alcanzable ese nodo terminal.
Es simplemente la probabilidad de todos los sucesos del camino condicionado a
todas las acciones en el camino.
U A i -ii U L U 7: M O D ELO S GRAFICOS ALTERNATIVOS m b
0j£MA

^ v a lu a ció n

La resolución requiere calcular primero las utilidades ponderadas en cada nodo


terniiual) multiplicando la utilidad y la probabilidad del camino, anotándolas
pjj una tercera columna, ver Figura 7.1. Después comienza la poda de nodos
procediendo hacia atrás como en el método usual de los árboles de decisión. Los
nodos de azar se podan sumando las utilidades ponderadas que se encuentran al
gjjal de sus ramas. Los de decisión se podan maximizando de la forma usual.

Ejemplo 7.1 (com pra de helicóptero) (continuación del Ejemplo 5.2)


Al aplicar este proceso al problema del helicóptero obtenemos los números
que aparecen en negrita en la Figura 7.1. Por ejemplo, en el nodo E situado más
arriba encontramos 0.3418 que es el resultado de la operación 0.23 + 0.1118 + 0.
Y en el nodo C situado en el centro del árbol, cortamos la rama correspondiente
a comprar porque 0.0857 < 0.1063.' La estrategia óptima es la misma, que ya
habíamos obtenido en anteriores ocasiones. □

Sean £ el conjunto de escenarios e y una estrategia. Y sea L (x ) una función


que vale 0 si el escenario x tiene probabilidad 0 de ocurrir y 1 en otro caso. La
probabilidad tt de un camino tiene la propiedad de que n (y es una distribución
de probabilidad, es decir, J^xeS(7ríj/)(íC) = lv Si el decisor escoge la estrategia
y , su utilidad esperada es X)a.e£[(7r£y) w](x)> donde u(x) es la función de utilidad
bajo el escenario x. El fundamento del método reside entonces en observar que
un problema de decisión consiste en encontrar una estrategia y que maximice

£ [(» x & x = x u) x £yKx) = X lM ® )x “ (*))x £*(*)•


x&£ xd£

El método de poda resuelve precisamente este problema mediante programación


dinámica determinística.
Efectivamente no se tiene entonces el problema de los dos árboles: como este
método de poda maneja solamente probabilidades conjuntas (de caminos) no es
necesario calcular probabilidades condicionadas, pues dichas conjuntas pueden
obtenerse directamente de las condicionadas del enunciado. No obstante, trabaja
por ello en el espacio global de todas las variables exigiendo mayores requisitos
de memoria.
Como los árboles de decisión, los de escenarios utilizan computación local para
identificar una estrategia óptima y calcular su utilidad esperada. El crecimiento
^ponencial del tamaño de estos árboles es también aquí una desventaja. Además,
®los árboles de decisión estándar pueden hacerse más eficientes usando el método
de inversión de arcos (que usan los diagramas de influencia) e identificando la
coalescencia, no ocurre lo mismo con los árboles de escenarios.
En general, en problemas que requieren una revisión bayesiana de las proba-
240 fu n d a m e n t o s p e l o s s is t e m a s d e a y u d a a l a d e c i s i ó n © RA-MA

bilidades, el método de poda para resolver un árbol de decisión, que hemos


llamado árbol de escenarios, resulta más eficiente que el método convencional
(suponiendo que en éste calculamos las condicionadas a partir de la conjunta
y no con inversión de arcos). Shenoy (1995) compara ambos métodos para un
problema simétrico genérico.

7.1.2 Arboles de juego

Los árboles de juego son muy similares a los árboles de decisión. Fueron propues­
tos inicialmente por von Neumann y Morgenstern (1944) y después Kuhn (1953)
los generalizó. Por tanto son más antiguos que los árboles de decisión, sobre los
que tuvieron mucha influencia, y más generales. En esta sección vamos a adaptar
las técnicas de los árboles de juego al Análisis de Decisiones según hace Shenoy
(1998). Será algo natural, pues un problema de decisión puede considerarse como
un juego en el que sólo hay un jugador.
Una de las principales diferencias entre los árboles de juego y los de decisión
está en la forma de codificar las restricciones de información. Así, si en el mo­
mento de tomar una decisión D no se conoce el verdadero valor de una variable
aleatoria X , entonces el nodo X debe ir después del nodo D (más a la derecha) en
el árbol de decisión. En cambio, en el árbol de juego no tiene por qué ser así y X
puede preceder a D. La secuencia de nodos de azar y de decisión por los caminos
hacia los nodos terminales no representan restricciones de información. Éstas
vienen representadas mediante los llamados conjuntos de información. Siempre
habrá tantos conjuntos de información como nodos de decisión haya en el árbol
de decisión correspondiente.
Los conjuntos de información forman una partición del conjunto de todos los
nodos de decisión, y todos los nodos de un mismo conjunto de información co­
rresponden a la misma variable de decisión. Cuando el decisor va a tomar una
decisión, se encuentra siempre en un conjunto de información y sabe en cuál, pero
no sabe concretamente en cuál de sus nodos está situado. Sí recuerda la infor­
mación pasada y las decisiones ya tomadas. Los caminos del árbol intersecarán
como mucho una vez a cada conjunto de información.

E je m p lo 7.1 (co m p ra d e h e licó p te ro ) (continuación del Ejemplo 5.2)


Nuestro problema se representa mediante el árbol de juego de la Figura 7.2.
Los números en negrita corresponden a la fase de solución y no son por tanto
parte de la representación.
Nótese que no se conoce el estado del helicóptero E en el momento de tomar
la decisión C de comprarlo o no comprarlo, y sin embargo la variable aleatoria E
se representa antes que C. En vez de codificar esta falta de conocimiento del valor
de E al tomar C , usamos conjuntos de información denotados por I\yh ,h y h -
h representa el hecho de que el decisor no conoce el estado del helicóptero en el
CAPÍTULO 7: MODELOS GRÁFICOS ALTERNATIVOS 241

Figura 7.2: Árbol de juego para el problema del helicóptero

momento de decidir si realizar o no la prueba. I 2 indica que se sabe que se tomó


la decisión de no hacer la prueba en P pero no se conoce el estado del helicóptero.
En I¡ e Í 4, se eligió realizar la prueba (en P) y se observó su resultado R, que fue
apto en ¿3 y no apto en I 4, pero no se conoce el estado del helicóptero. El hecho
de que I\ preceda a los conjuntos I2, h , J4 indica que la decisión de realizar o no
la prueba precede a la decisión de comprar o no el helicóptero.

Gracias a los conjuntos de información podemos representar las variables


aleatorias en cualquier orden sobre el árbol de juego. Sólo hay que dibujar una
variable aleatoria X antes que una variable de decisión D en el caso en que X sí
se haya observado al tomar D.
Esta flexibilidad nos permite representar cualquier problema sin realizar ningún
preproceso evitando el problema de los dos árboles. En nuestro ejemplo vemos
representadas directamente las probabilidades sobre las ramas de los nodos de
azar tal y como venían dadas en el enunciado del problema. En el caso de que
242 F U N D A M E N T O S DE LO S SISTEMAS DE AYUDA A LA DECISIÓN © R A -M A

tengamos un modelo de probabilidad causal y usemos la secuencia de nodos para


representar causalidad o tengamos un modelo de red bayesiana, no será necesario
el preproceso, pudiendo utilizar tal secuencia de variables de azar en el árbol
de juego. La revisión bayesiana de las probabilidades es parte del proceso de
solución. Por tanto, mientras en los árboles de decisión la secuencia de nodos
únicamente representaba información, en los de juego puede representar tiempo
causalidad, etc.

Evaluación

Siguiendo la metodología de la Teoría de Juegos, la primera idea para resolver


el árbol de juego es reducirlo, a una forma estratégicamente equivalente, cons­
truyendo la tabla de decisión asociada. Esto implica la enumeración de todas las
estrategias posibles, formadas en nuestro ejemplo por cuaternas que especifican
una acción en cada conjunto de información Ji, I 2, Í 3 , Í 4, y la enumeración de las
configuraciones conjuntas de todas las variables aleatorias. Como se vio en el
Capítulo 5, esta forma estática de resolver el problema es computacionalmente
intratable si hay muchos conjuntos de información o muchas variables aleatorias.
La resolución utiliza entonces programación dinámica hacia atrás generalizan­
do el procedimiento de los árboles de decisión. Si cada conjunto de información
fuese unitario, obtendríamos el método de los árboles de decisión. Un árbol
de decisión puede considerarse un árbol de juego en el que todos los conjuntos
de información son unitarios. Pero para conjuntos de información generales, se
eliminarán a la vez todos los nodos de un mismo conjunto de información, al
corresponder a una misma variable de decisión. En este proceso resultará elegida
una alternativa de dicha variable y será la que tomará el decisor cuando se halle
en este conjunto de información.
Para eliminar los nodos de decisión que forman un conjunto de información
Ik se siguen los siguientes pasos:

1 . Calcular las probabilidades de alcanzar Ik para cada camino desde el nodo


raíz a Ik, multiplicando las probabilidades que encontramos en las ramas
atravesadas. Aunque no sumen 1 , desde un punto de vista computacional no
va a hacer falta una normalización para conseguir que sea una distribución
de probabilidad.

2. Para cada alternativa de la variable de decisión asociada a Ik, calcular su


utilidad (máxima) esperada, utilizando las probabilidades del paso 1 y las
utilidades máximas esperadas acumuladas al final de cada rama de los nodos
de decisión de Ik en el proceso recursivo hacia atrás.
3. Identificar la alternativa de la variable de decisión que corresponde a la
máxima utilidad esperada, que será la misma en todos los nodos de decisión
de Jfc. Cortar las ramas de las alternativas no escogidas.
CAPÍTULO 7: MODELOS GRÁFICOS ALTERNATIVOS 243
© RA -M A

Ejemplo 7.1 (com pra de helicóptero) (continuación del Ejemplo 5.2)


Para eliminar los tres nodos de I\ en el problema del helicóptero, calculamos
primero las probabilidades (conjuntas de E y R), que son para cada uno de los
I tres nodos (de arriba a abajo) 0.3 x 0.1 = 0.03,0.4 x 0.35 = 0.14, y 0.3 x 0.85 =
0.255, respectivamente. Indican la probabilidad de estar en cada uno de esos tres
nodos, dadas las decisiones y estados anteriores. Para el paso 2, calculamos para
C =comprar su utilidad esperada: 0.85 x 0.03 + 0.43 x 0.14 + 0 x 0.255 = 0.0857.
Para C = no comprar sería: 0.25x0.03+0.25x0.14+0.25x0.255 = 0.10625. Como
0.10625 > 0.0857, escogemos la alternativa no comprar en todos los nodos de h
y escribimos sobre ellos 0.25, es decir, la utilidad máxima de dicha alternativa.
Cortamos las ramas de la alternativa C =comprar.
El proceso continúa hacia atrás, eliminando de forma análoga los nodos de
decisión. Para los nodos de azar el esquema es el mismo que en los árboles de
decisión. La Figura 7.2 señala en negrita los resultados. Después de eliminar los
nodos de J4, se eliminan los de J3 , luego los nodos R o los de (en cualquier
orden), a continuación los de I\ y por último el nodo E. Los cálculos, por ejemplo,
en h son: para P = hacer prueba, 0.79x0.3+0.367x0.4+0.2125x0.3 = 0.448, que
es mayor que para P = no hacer prueba, 0.86x0.3+0.44x0.4+0.01x0.3 = 0.437
La estrategia óptima se lee sobre los caminos no cortados: hacer la prueba (en
Ji); si el resultado es apto se debe comprar el helicóptero (en I3) y si no lo es, no
se compra (en I 4). □

A la vista del ejemplo podemos pensar que un árbol de juego es siempre más
frondoso que su árbol de decisión equivalente. Pero en general esto no tiene por
qué ser así (ver Ejercicio 7.3). En cuanto al número de nodos terminales, será el
mismo en problemas simétricos, pero en asimétricos dependerá de la estructura
particular del problema. En cuanto al número de nodos de decisión, típicamente
será mayor en los árboles de juego, pues suelen encontrarse cerca de los nodos
terminales y, además, cada conjunto de información puede contener más de un
nodo. Así ocurre en nuestro ejemplo, con 4 nodos de decisión en el árbol de
decisión y 12 en el de juego. En cuanto al número de nodos de azar, la situación
suele ser la inversa, pues se posicionan más cerca del nodo raíz en los árboles de
juego que en los de decisión.
Desde una perspectiva computacional, el método de resolución utiliza, como
los árboles de decisión, computación local para calcular una estrategia óptima,
aunque es conceptualmente más complejo. No se realizan divisiones, pues la cons­
tante de normalización (que es siempre positiva) sería la misma para los valores a
comparar en el paso 3 y por tanto no la calculamos. Por último, algunos cálculos
del paso 1 pueden simplificarse: Si los caminos hacia los nodos de decisión del
conjunto de información a eliminar comparten subcaminos o tienen ramas con la
misma probabilidad, las cantidades involucradas pueden ignorarse al calcular las
probabilidades de alcanzar el conjunto de información.
344 FUNDAMENTOS Dfl I.OS SISTEMAS OH AYUDA A l,A DECISION____________ © UA-MA

Un inconveniente do loa árboles do juego o h In posible dificultad pura identi­


ficar los conjuntos do información cuando haya gran núinoro do variables on ol
problema. Además, como los ilrholoH do decisión y a diferencia de los diagramas
do influencia, presentan explosión combinatoria, no explotan las independencias
condicionalos 011 la distribución conjunta (al 110 sor representados explícitamente),
y no utilizan computación local para calcular probabilidades.
Rn nuestro ejemplo particular, so puado comprobar quo so realizan rnás cálcu­
los con ol árbol do juogo quo con ol do decisión. So debo a quo 011 este último no
teníamos la variable E después do la decisión do no comprar, pues ora irreJovanto,
Además, on I2, h e Í 4, esa decisión de no comprar lleva asociada una utilidad
constante (0.25 ó 0.26) quo os independiente dol valor do E y no es aprovechada
para ahorrar cálculos. Esta diferencia en la'eficiencia no es siempre así, pudiendo
encontrar problemas donde sucede lo contrario.
En general, los árboles de juego son idóneos para problemas de decisión
pequeños y muy asimétricos, y que requieren revisión bayesiana de probabili­
dades. Para problemas simétricos o casi simétricos y con muchas variables son
mejores ios diagramas de influencia.
Para hacerlos más eficientes, igual quo hicimos en los árboles de decisión,
podemos generalizar el método de poda para resolver también árboles de juego
(Shenoy, 1995). Primero representamos el árbol de juego en su forma usual pero
sin incluir las probabilidades sobre las ramas de los nodos de azar. Recordemos
que se trabaja con probabilidades conjuntas, escritas en una columna junto a las
utilidades.
La eliminación de los nodos de decisión (en cada conjunto de información) se
realiza como en el método estándar de árboles de juego. La única diferencia es
que ahora se utilizan las probabilidades del camino en lugar de las probabilidades
de alcanzar el conjunto de información.

E jem plo 7.1 (com p ra de h e licó p te ro ) (continuación del Ejemplo 5.2)


En la Figura 7.3 aparece todo el proceso p ara el problem a del helicóptero.
Por ejemplo, en el conjunto I4, la sum a de las utilidades ponderadas da, para
C =com prar, 0.0255 -I- 0,0602 -|- 0 = 0.0857, y p ara C =110 com prar, 0.0075 +
0.035 -|- 0.0638 = 0.1063. Luego, elegim os no com prar en ca d a nodo de ¿4. La
p oda de los nodos de azar es igual que en los árboles de escenarios. □

El m étodo de poda para resolver árboles de ju e g o os siem pre m ás eficiente


que ol m étodo convencional, C o m p aran do las op eracion es de am bos métodos, las
realizados por el m étodo usual en ca d a co n ju n to de in form ación en el paso 1 son
dol m ism o orden quo las dol m étodo de p o d a p ara ca lcu la r las probabilidades de
los cam inos. Igual ocurro con las m ultip licacion es p a ra elim inar los conjuntos de
inform ación con el m étodo usual, y p a ra h allar las utilidades ponderadas con el
m étodo de poda. Sin em bargo, al elim in ar nodos de a za r, el m étodo convencional
CAPÍTULO 7: MODELOS GRÁFICOS ALTERNATIVOS 245

probab, utilidad
utilidad x camino ponderada

0 .8 5 0 .2 7 0.23
0 .2 5 0 .2 7 0.068

0 .8 5 0 .0 3 0.0255

0 .2 5 0 .0 3 0.0075
0.86 0 .3 0.258

0 .2 6 0 .3 0.078
0 .4 3 0 .2 6 0.1118

0 .2 5 0 .2 6 0.065
0 .4 3 0 .1 4 0.0602

0 .2 5 0 .1 4 0.035
0 .4 4 0 .4 0.176

0 .2 6 0 .4 0.104
0.00 0 .0 4 5 0
0.25 0 .0 4 5 0.0113
q comprar
0.00 0 .2 5 5 0
no comprar 0 .2 5 0 .2 5 5 0.0638
0.01 0 .3 0.003
0 .2 6 0 .3 0.078

Figura 7.3: Árbol de juego para el problema del helicóptero utilizando el método de
poda

requiere multiplicaciones que no se realizan con el método de poda.


Nótese que el método de poda (tanto para árboles de escenarios como de
juego) no aprovecha la separabilidad de la función de utilidad al trabajar con
la distribución conjunta y por tanto, no dividir. Sin embargo, ya vimos que los
árboles de decisión sí contaban con esa ventaja. En la Sección 7.2.1 lo veremos
también para los diagramas de influencia.

7 .1 .3 F o r m u la c ió n a lg e b r a ic a

Basado en los árboles de decisión pero evitando su crecimiento exponencial, Kirk­


wood (1993) propone un método algebraico para resolver y representar problemas
de decisión de gran tamaño. Es decir, las relaciones entre las variables se formulan
usando variables y funciones algebraicas.
El problema se formula mediante una tabla con una fila para cada valor de
las variables del problema (azar y decisión) y sólo una fila para el nodo de valor.
246 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A 1,A DECISIÓN © R A -M A

Cada nodo t tiene asociado un tipo ti y una variable Los valores que Se
asignan a la rama j vienen dados por una función do valor de rama fij(s) qy0
puede depender del estado s, donde s incluye los valores actuales de todas las
variables a lo largo del camino del nodo raíz a i. También pueden depender de
s la probabilidad de la rama P ij(s), para cada rama do un nodo de azar, y Ja
función nodo siguiente n y (s ).

E jem p lo 7.1 (c o m p r a d e h e lic ó p t e r o ) (continuación del Ejem plo 5.2)


La Tabla 7.1 contiene la formulación algebraica del problem a del helicóptero,
donde
0.26 C = -iC
i? = r a ,P = -0.01
0.86 C =
M C ) = { W 'P ií(R > P ) = I 7 R = r n ,P = -0.01
0.44 C = C.J
P = 0
0.01 C =

0.452 R = ra, P = ■-0 .0 1


P42(R> P ) = 0.33 R = rn, P = -0 .0 1
0.4 P = 0
0.078 R = ra, P = •-0 .0 1
P4S(R, P ) = 0.6 R = rn, P = -0 .0 1
0.3 P = 0

Tabla 7.1: Formulación algebraica del problema del helicóptero

índice var. tipo No. índice f. valor f. prob. i. nodo


nodo nodo nodo ramas rama de rama de rama siguiente
i Vi ti bi 3 M s) Pii(s)
1 P decisión 2 1 -0.01 2
2 0 3
2 R azar 2 1 ra 0.575 3
2 rn 0.425 3
3 C decisión 2 1 c 4
2 -i c 5
4 E azar 3 1 U i(C ) P ti(R , P ) 5
2 /« (< ? ) P M P ) 5
3 /« (C ) Pís (R) P ) 5
5 V terminal 1 1 E + P


L a ta b la d e fo r m u la c ió n c o n tie n e t o d o s lo s d e t a l l e s n e c e s a r i o s p a r a lo s c á l­

c u lo s . E s t a r e p r e s e n t a c i ó n c o m p a c t a e s l a p r i n c i p a l v e n t a j a y d i f e r e n c i a c o n lo s
CAPÍTULO 7: MODELOS GRÁFICOS ALTERNATIVOS 247
^ RA-MA

boles de decisión. En Kirkwood (1993) hay un ejemplo de un modelo cuyo árbol


de decisión tiene 25272 nodos terminales que se formula con sólo 15 nodos. Se
consigue esta compacidad con las funciones nodo siguiente y valor de rama. Con
las primeras describimos las asimetrías. Con las segundas, se aprovecha la sepa-
rabilidad de la función de utilidad, evitando el cálculo de cada valor de utilidad
en cada rama terminal.
Observamos, sin embargo, algunas desventajas. La primera es, de nuevo, el
problema de los dos árboles, pues hemos tenido que calcular las probabilidades
de la tabla a partir de las dadas en el enunciado del problema. Como ocurría en
los árboles de decisión, no se da un método eficiente para calcularlas ni existe una
representación explícita de las relaciones probabilísticas. La segunda es también
compartida por los árboles de decisión y se refiere a que la función nodo siguiente
nos obliga a describir las restricciones de información como un orden completo.
Como normalmente se dispone de uno parcial, al completarlo puede no escogerse
la forma más eficiente (computacionalmente) de hacerlo y desaprovechar la posi­
bilidad de tener quizá coalescencia. En nuestro ejemplo sólo hay un orden posible
y no se detecta este inconveniente.

Evaluación

Conceptualmente es similar al árbol de decisión y es fácil de implementar. Con


la información de la tabla, podemos definir recursivamente la utilidad esperada
Eu[i|s] para el nodo i dado el estado s:

' max Eu[nij(s)\{vi : Sil (s) >s}] si U = decisión


1<7<6»
bi
} Eu[nij(s)\{vi: fij(s), s}]p¿j(s) si U = azar
i=i
u (fn (s)) si ti = terminal
o i£ u [n ji(s )| {i;¿ : / i i ( s ) , s } ] si í< = auxiliar

donde {i>¿ : /¿¿ (s), s} es el estado formado aumentando el estado s con un valor
para Vi determinado por fij(s). Los nodos auxiliares son similares a los deter-
minísticos de un diagrama de influencia y pueden verse como nodos de azar o de
decisión con una sola rama. Simplifican la estructura del modelo aunque no es
necesario usarlos en la formulación.
Para resolver el problema hay que calcular i?i¿[l|0], donde 1 es el nodo raíz y O
el estado actual, conteniendo entonces la máxima utilidad esperada del problema.
Para obtenerla se van atravesando recursivamente los caminos desde la raíz hasta
cada terminal, evaluando cada valor de la rama, probabilidad de la rama y nodo
siguiente según se va alcanzando cada nodo. El valor de la rama se añade al
estado actual y por tanto s representa la posición en que nos encontramos en el
CAPÍTULO 7: MODELOS GRÁFICOS ALTERNATIVOS 247
RA-MA

árboles de decisión. En Kirkwood (1993) hay un ejem plo de un modelo cuyo árbol
de decisión tiene 25272 nodos terminales que se formula con sólo 15 nodos. Se
consigue esta compacidad con las funciones nodo siguiente y valor de rama. Con
las primeras describimos las asimetrías. Con las segundas, se aprovecha la separ
rabilidad de la función de utilidad, evitando el cálculo de cada valor de utilidad
en cada rama terminal.
Observamos, sin embargo, algunas desventajas. La primera es, de nuevo, el
problema de los dos árboles, pues hemos tenido que calcular las probabilidades
de la tabla a partir de las dadas en el enunciado del problem a. C om o ocurría en
los árboles de decisión, no se da un m étodo eficiente para calcularlas ni existe una
representación explícita de las relaciones probabilísticas. La segunda es también
compartida por los árboles de decisión y se refiere a que la función nodo siguiente
nos obliga a describir las restricciones de información com o un orden completo.
Como normalmente se dispone de mió parcial, al com pletarlo puede no escogerse
la forma más eficiente (computacionalmente) de hacerlo y desaprovechar la posi­
bilidad de tener quizá coalescencia. En nuestro ejemplo sólo hay un orden posible
y no se detecta este inconveniente.

E v a lu a ció n

Conceptualmente es similar al árbol de decisión y es fácil de implementar. Con


la información de la tabla, podemos definir recursivamente la utilidad esperada
Eu[í|s] para el nodo i dado el estado s:

max Eu[n¿j(s)|{'ui : s}] si U = decisión


1
h
)E u [n j j (s) |{ví : f e (s ), s}] pió (s) si = azar
j =i
si ti = terminal
■Ei¿[n¿i(s)|{v¿: /¡ i ( s ) ,s } ] si = auxiliar

donde {u¿ : s } es el estado formado aumentando el estado s con un valor


para determinado por fij(s). Los nodos auxiliares son similares a los deter-
minísticos de un diagrama de influencia y pueden verse com o nodos de azar o de
decisión con una sola rama. Simplifican la estructura del modelo aunque no es
necesario usarlos en la formulación.
Para resolver el problema hay que calcular E u[ 1|0], donde 1 es el nodo raíz y 0
el estado actual, conteniendo entonces la máxima utilidad esperada del problema.
Para obtenerla se van atravesando recursivamente los caminos desde la raíz hasta
cada terminal, evaluando cada valor de la rama, probabilidad de la rama y nodo
siguiente según se va alcanzando cada nodo. El valor de la rama se añade al
estado actual y por tanto s representa la posición en que nos encontramos en el
© RAM A CAPÍTULO 7: MODELOS GRÁFICOS ALTERNATIVOS 240

donde, recursivamente, vamos obteniendo:

Eu[4\{C : c , R :r n ,P : -0.01}]
= 0.07 x (0.86 - 0.01) + 0.33 x (0.44 - 0.01) + 0.6 x (0.01 - 0.01) = 0.201

y
Eu[5\{C : -ic, R : rn,P : -0.01}] = 0.26 - 0.01 = 0.25.

Sustituimos en (7.4)

J5u[3|{J? : m ,P : -0Í01}] = max{0.201,0.25} = 0.25,

alcanzado en C : ~>c. Podemos ahora sustituir también en (7.2) y tener

Eu[2\{P : -0.01}] = 0.575 x 0.594 + 0.425 x 0.25 = 0.448.

Para poder tener (7.1), sólo queda calcular Eu[3\{P : 0}] = max{Eu[4|{C' :
c,P : 0}],.Eii[5|{C' : -<c,P : 0}]} que se realizaría de forma similar, obteniendo
max{0.437,0.26} = 0.437, alcanzado en C : c.
Luego, Eu[ 1|0] = max{0.448,0.437} = 0.448, alcanzado en P : -0.01. □

La expresión de la solución puede generalizarse, permitiendo que b¡,tj y


sean funciones de s. Así, 6¿(s) indicaría situaciones en las que la distribución de
una variable aleatoria o las alternativas disponibles en un nodo de decisión depen­
dan de la historia del proceso. Esto puede presentarse en problemas asimétricos.
Situaciones prácticas para í¿(s) y i>¿(s) son más difíciles de imaginar. Concep­
tualmente, esto último nos permitiría modelizar cualquier problema secuencial
con un solo nodo.
El algoritmo es fácilmente implementable decidiendo una buena estructura
de datos para el estado s. Kirkwood (1993) estudia este aspecto y Kirkwood
(1994) presenta el algoritmo general en Pascal. Kirkwood (1998) desarrolla un
algoritmo (en lenguaje C) para calcular no sólo las utilidades esperadas sino el
perfil de riesgo. Si se implementa llevando control de los valores ya calculados
puede evitarse repetir muchos cálculos, producidos al visitar todos los nodos
terminales del árbol construido en el barrido hacia delante.
Se puede realizar análisis de sensibilidad (ver Capítulo 8) de forma compacta.
Por ejemplo, el análisis de sensibilidad del coste de la prueba para el problema
del helicóptero se haría definiendo

_ / COSTE j = 1
i »| ¡ 0 § ¡ 2
_® HA MA

, jalculwido /Tu[l|{COSTE: 0.000At}],/o - 1, 2 ,..., 10. Et decir, doflnimoi una


' -iiblo do oslado (COSTO) quo no oh una variable <ln un nodo y l’OBOlvORiOB
el modelo con COSTE - -0.005,-0.01.... -0.08.
l>uo v Shenoy (1090) proponen una modificación (lo <¡hI¡(> método quo solu­
ciona los tros inconvenientes señalados: preproceso do probabilidadoh uní,oh do
representar la tabla do formulación, no reconocer la «oaJosconcla y roquorir un
orden completo do las restricciones do información, ha modificación consiste on
una representación algebraica do una rod do ovaluación.
Stonebraker (1993) y Stonebrakor y Kirkwood (.1997) utilizan una aproxi­
mación algebraica que permite incluir variables de decisión y/o aleatorias conti­
nuas, extendiendo el método de Kirkwood..

7.2 DIAGRAMAS DE INFLUENCIA


ALTERNATIVOS
Dado que, como vimos en el Capítulo 6, los diagramas de influencia no parecen ser
muy útiles para resolver problemas asimétricos, presentamos en esta sección una
serie de variantes de estos diagramas que van a cubrir ésta y otras dificultades.

7.2.1 Diagramas de influencia con varios n od os de valor

Los diagramas de influencia con varios nodos de valor están diseñados para
aprovechar la naturaleza separable (ver Capítulo 4) de la función de utilidad.

Definición 7.1 (Punción separable)


Sea x € M 1 y sean q subvectores x i,x 2,...,x q tales que sus componentes son un
subconjunto de las componentes de x. Una junción g es separable si
9 q
9(x) = ^ 2 9i 0 5(®) = ^ (x‘ ) •
*=l í=i
Si se da el caso de tener una función de utilidad que se descompone de forma
aditiva y /o multiplicativa en funciones definidas sobre conjuntos de pocas varia­
bles, sería deseable representarlo explícitamente sobre el grafo simplificando la
formulación del modelo y el número de operaciones a realizar. La separabilidad
va a permitir, bajo ciertas condiciones, que los operadores de esperanza y ma-
ximización utilizados en el algoritmo de evaluación de diagramas de influencia,
se apliquen únicamente a alguna(s) componente(s), en vez de a toda la función.
Así, las operaciones se realizan sobre dominios de menor dimensión. Inicial­
mente propuesto por Olmsted (1983), el desarrollo completo se debe a Tatman y
Shachter (1990).
^ u v MA v/A H lT l-O r M O W I . O S U R A L I C O S Al I T H N A l l V O S M»

Prim eram ente reprosontaniws In estru ctu ra separable sobre ol g ra fo dol di«-
v'raiua \U' in flu e n cia I^ w om von& m ow el \\wíck> nodo tío valor on un coi\|unto d e
nodos vio valor vio do s tipos, I vvs ,'«Anodo,< »ír valor ropnvsonttm cad a míninut
I ,\vu\poueute do U\ función vio utilidad» I a agregación do <wtas com ponen tos da
[ v\\n\v' resultado uwovos nodws do valo r llam ados « g w i l «/<>,« «Ir cafar, Sprrf.il nodos
yunta si vesuHau al s u m a r las co m p o n en tes, o nodos p roducto si resultan «I ntul-
jhv|¡v\vvla'i Ibudrau co m o predecesores a su s respectivas com ponentes y llevaran
la etiqueta ^ si os n od o «urna» o 11 si os n odo producto.

Hay e x a cta m e n te un u o d o do valor sin suv'tvsores quo representa In función


objetivo del p roblem a, So llam a u o d o vio valor íwwíww/ y sera un snpernodo tío
valor siem pre q u e se tonga m as vio un novio vio valor, Por tanto, los subnodoa
vio valor tiouon co m o p re d o iw o re s nodos vio a sa r y vio decisión, m ientras quo los
su^vrnodos vio v a lo r sólo tien en (sop or o sub)n odos tío valo r corno predecesores,
linios lv\s uvhIws vio valor n o p ued en tenor m ás vio un sut'osor, generando como
consecuencia un a e s tr u c tu ra vio árbol,' Su rara os el nodo tío valor torm inal y sus
hojas los subnodw s vio valor,

l a s e stru ctu ra s je r á r q u ic a s vio la fim eion vio utilidad (o do valor) vistas en el


C apítu lo 4 (o en el - '\ p\u\ion ser representadas ahora con varios nodos do valor
solvre ol d ia gram a vio iutluonv'ia,

t\¡em p lo T. \ ( w w \ p \ d o U o lic ó p t o v o ) (coutilinación del E¡jomplo 5,2)

1 a tVavcióu d o u tilid a d d el p roblem a del helicóptero «\s separable pues era


U suma vio de® co m p o n en tes: <»(/',(', K) m \'((\b ') - l/ti 10 ~ * w (P)s Recorde­
mos que te in d ica b a el co s te vio la prueba: to(.P hacer prueba)» 600 euros,
v,\}' - n o h a cer p r u e b a ) - 0 eu ro s. tvera la función: c(c,c> ) * 0,86, e(c,<?j) 0,4-1,
t\c,e$) - 0,0 U t'( h') 0,2tí, l V u o ta r e m o s $:(/*) a la función — 1 / 6 10 4 «>(/'),

U'uoukvs e n to n ces tre s n o d o s do valor: c , i (subnodos vio valor) y ol p r e g a d o


vio estos dos, t«, q u e os u n su p e rn o d o sum a y coincido con ol uodo do valor
terminal, l a F ig u r a i\4 a m o stra la nueva rep.r\wntaoióu, l a ra b ia 7,2 contieno
la inform ación c u a n tita tiv a a so c ia d a a los n uevos nodos,

Figura 7.4: D fo g m n * vio intluencia del problem a vlol helicóptero con varios nodos de
>«K>r
252 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

Tabla 7.2: TUbla de los nodos do valor del problema del helicóptero

c E V
c e\ 0.86
0.44 P z
ea
C3 0.01 hacer -0.01
0.26 no hacer 0
-IC ei
es 0.26
e3 0.26

Evaluación

Basándose en las propiedades especiales de los operadores esperanza y maxa-


mización cuando se aplican a una función de utilidad separable, se reescriben las
transformaciones usuales de los diagramas de influencia y resulta un algoritmo
ligeramente modificado (Tatman y Shachter, 1990). Para la eliminación de los
nodos de decisión y de azar se exigen ciertas condiciones. Además, hay veces en
que es necesario reducir un fragmento de la estructura de los nodos de valor, te­
niendo entonces una nueva transformación llamada fusión de nodos de valor. Se
ofrecen también algunas heurísticas que ayudan a escoger un orden de eliminación
de nodos.

E jem plo 7.1 (com p ra d e h e licó p te ro ) (continuación del Ejemplo 5.2)


En vez de entrar en los detalles, resolvemos paso a paso nuestro problema
con este nuevo planteamiento. A partir de la Figura 7.4, debemos comenzar
invirtiendo el arco (E, R). Como esta operación no afecta a la función de utilidad,
los cálculos y los resultados coinciden con los vistos en el diagrama convencional
(ver Capítulo 6). Sólo mostramos el diagrama resultante tras esta inversión, ver
Figura 7.5.

Figura 7.5: Inversión del arco (E,R)


RA-MA CAPÍTULO 7: MODELOS GRÁFICOS ALTERNATIVOS 253

La operación siguiente es la eliminación del nodo de azar E. Como éste tiene


un único sucesor que es un nodo de valor, v, podemos eliminar E mediante espe­
ranza condicionada sobre v (en lugar de sobre u). Esto se debe a las propiedades
de la esperanza. La Figura 7.6 aclara el proceso junto con la Tabla 7.3.

Figura 7.6: Eliminación del nodo E

Tabla 7.3: Tabla de eliminación de E

p R C V P R C V
hacer ra c 0.604 no hacer ra c 1.31®
->c 0.26 -1c 0.78®
m c 0.211 rn c 1.31®
— >c 0.26 ->c 0.78®
-»r c r 1.31® -»r c 0.437
-1c 0.78# -1c 0.26

Como podemos observar, la esperanza que hemos calculado viene dada por la
expresión Y1e v (C, E)P{E\P, R ), mientras que en el diagrama convencional era
E s u(P ,C ,E )P (E \P,R ). Ahora trabajamos en dominios más pequeños, con el
consiguiente ahorro de memoria.
El paso siguiente es eliminar C. Para ello hay que maximizar en C la función
de utilidad u, que es suma de z y v. Por tanto, bastará con maximizar en C la
función v, pues z no es función de C. Comprobadas las condiciones de eliminación
de un nodo de decisión, modificamos el diagrama según indica la Figura 7.7a).
Los cálculos aparecen en la Tabla 7.4.
Continuamos eliminando R, procediendo como con E, aplicando el operador
esperanza únicamente a v e n lugar de a u, Figura 7.7b). Para eliminar P , fusio­
namos antes sus dos nodos de valor sucesores v y z, en el nodo u (Figura 7.7c))
y maximizamos después. La Tabla 7.4 muestra los resultados.
Obsérvese en la Figura 7.6 que antes de eliminar C podíamos haber fusionado
v y z en u, trabajando a partir de aquí con u solamente. La razón es clara:
ai ser los predecesores de z, predecesores también de v, la fusión de v y z no
hace aumentar el número de operaciones para resolver el problema. Debemos
Figura 7.7: Eliminación de nodos a) C, b) R, c) P

Tabla 7-4: labias de eliminación de C, R y P

p R V
hacer ra 0.604 c
m 0.26 c p V u
-1
u i <rp
->r 1.31a: c hacer 0.458 0.448
0.448 hacer
no hacer ra 1.31x c no hacer 0.437 0.437
m 1.31* c
->r 0.437 c

por tanto fusionarlos disminuyendo el número de nodos (de valor) del diagrama.
Esta heurística es la llamada regla del subconjunto.
Por otra parte, el software DPL ya comentado en capítulos anteriores también
permite la inclusión de varios nodos de valor. Mostramos el código fuente en DPL
en la Figura 7.8 para que pueda compararse con el correspondiente código del
Capítulo 5 (Figura 5.10), donde no se había declarado la separabilidad de la
función de utilidad. □

Evidentemente, el algoritmo aprovechará más la localidad de las operaciones


cuanto más descompuesta esté la función de utilidad y cuanto menores sean los
dominios (es decir, menor número de variables) de las funciones componentes.

7 .2 .2 Diagram as de influencia asim étricos

La asimetría es una característica muy común en los problemas reales y hasta la


fecha, de muy difícil tratamiento. Como se vio en los dos capítulos anteriores,
los árboles de decisión sí pueden manejar asimetrías, pues por ejemplo, la posi­
bilidad de que ciertas elecciones sean sólo relevantes si ocurren ciertos estados se
representa fácilmente introduciendo nodos de decisión únicamente en las ramas
relevantes. Pero la idea en esta sección es buscar representaciones más eficientes,
com o los diagramas de influencia. Los estándar “simetrizan” los problemas, por
lo que resultan inútiles si hay mucha asimetría.
CAPÍTULO 7; MODELOS GRÁFICOS ALTERNATIVOS 255

decisión P. {hacer,no_hacer};
decisión C. {c,no_c};
chance E. {el ,e2,c3}={0.3,0.4,0.3};
valué v|C,E“
//C.c
0.86,0.44,0.01, //el,e2,e3
//C.no c
0.26,0.26,0.26; //el,e2,e3
valué z|P=
-0.01, //P.hacer
0; //P.no_hacer
valué u=v+z;
chance R.{ra,m}|E=
{0.9,0.1}, //E.el
{0.65,0.35}, //E.e2
. {0.15,0.85}' //E.e3

sequence:

decide
to P.hacer and get z then
gamble on R then a: decide
to C.c then
gamble on E and get v
to C.no_c and get v~
to P.no_hacer and get z then
perfoim a

Figura 7.8: Código en DPL para el problema del helicóptero, con utilidad separable

Ejemplo 7.1 (com p ra de helicóptero) (continuación del Ejemplo 5.2)


En el ejemplo del helicóptero tenemos dos tipos de asimetrías: la debida a R
cuando P =no hacer prueba, y la debida a E cuando C =no comprar. Si dibu­
járamos el árbol de decisión equivalente al diagrama de influencia con el que hemos
trabajado siempre (Figura 6.4), sería un árbol simétrico de secuencia P ,R ,C ,E.
R tendría la nueva rama jjr con la distribución degenerada P(-ir|no hacer prue-
ba)=l y también P(-ir|hacer prueba)=0, para bloquear caminos imposibles: si
no se hace la prueba, no se observan sus resultados y las combinaciones (no hacer,
ra) o (no hacer, rn) son imposibles. E aparecería después de C =no comprar, con
utilidad constante al final de las ramas que parten de mi mismo E (0.25 en las
de P = hacer prueba y 0.26 en el resto). Al no comprar el helicóptero, su estado
E no llega a observarse y se obtiene la misma utilidad independientemente del
valor que tome E . Las probabilidades en sus ramas pueden ser cualesquiera pues
la utilidad esperada en E al ser eliminado será dicha constante.
Otra forma de resolver esta segunda asimetría sería definiendo un nuevo esta­
do ficticio para E , ne=ningún estado, que se tendrá con seguridad cuando no se
compre el helicóptero. Esta solución con distribuciones degeneradas es análoga
256 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

a la de la primera asimetría no necesitando especificar las utilidades en los es­


tados añadidos con probabilidad cero. Además, la forma de resolver la primera
asimetría y el eliminar R más tarde que E, hace que las especificaciones en B
sean baldías para los caminos que luego corta R. □

Existen otros tipos de asimetrías, como cuando se dispone únicamente de


ciertas alternativas de una decisión en determinados puntos del problema, así
como de otras distintas en otros puntos, bajo otro escenario condicionante. Sería
el caso del problema del helicóptero si de antemano no se comprara nunca cuando
no se hiciera la prueba, por resultar demasiado arriesgado, por ejemplo. Como el
diagrama de influencia asume que existe sólo un conjunto de alternativas asocia­
do a cada nodo de decisión, y que siempre están todas disponibles, tendríamos
que forzar a las no disponibles a que-nunca fueran óptimas. Para ello podemos
asignarles una utilidad con valor alto muy negativo que actúe como penalización.
Otra asimetría aparece cuando se materializa una variable aleatoria u otra
distinta, pero nunca ambas. Por ejemplo, si decidimos perforar una zona A en
vez de otra B en busca de agua, después observaremos la variable aleatoria A l
sobre el estado de dicha zona, pero nunca observaremos la variable B 1 sobre el
estado de la zona B. Si perforásemos B , la situación es la contraria.
En problemas grandes y muy asimétricos, no es tan obvio introducir este
tipo de recursos (alternativas y estados artificiales, probabilidades y utilidades
degeneradas) para convertir un problema en otro simétrico equivalente. Más
aún, la simetrización puede aumentar el espacio de un problema hasta en un 90%
(ver un ejemplo en Liu y Shenoy, 2000). Además, sería preferible poder trabajar
directamente con el propio problema original.
Ese es un tema de investigación muy actual. Los principales trabajos se re­
sumen a continuación. Smith, Holtzman y Matheson (1993) describen los diagra­
mas de influencia con árboles de distribución que expondremos con más detalle
a continuación. Fung y Shachter (1990) proponen los diagramas de influencia
contingentes, en muchos aspectos similares a los anteriores. Cali y Miller (1990)
exponen el DPL capaz de tratar muchas asimetrías. Covaliu y Oliver (1995)
introducen los diagramas de decisión secuenciales, que pueden considerarse en
parte como una combinación de diagramas de influencia y el método algebraico
de Kirkwood. Shenoy (2000) extiende sus redes de evaluación (Shenoy, 1992a)
al caso asimétrico con evaluaciones indicadoras para las asimetrías. Demirer y
Shenoy (2000) proponen una solución basada en las redes de evaluación, las redes
de evaluación secuenciales, a algunas limitaciones del método de Covaliu y Oli­
ver (1995). Qi y Poole (1995) transforman los diagramas de influencia en grafos
de decisión (Qi, 1994) y tienen relación con las redes bayesianas. Liu y Shenoy
utilizan la teoría de funciones de creencia de Dempster-Shafer en sus redes de con­
figuraciones (Liu y Shenoy, 1995) y en sus redes de evaluación con evaluaciones
toscas (Liu y Shenoy, 2000). Nielsen y Jensen (2000) modifican los diagramas
de influencia con dos tipos de nodos de decisión, uno de los cuales sirve para
@ RA-MA C A PÍT U LO 7: MODELOS GRÁFICOS ALTERNATIVOS 257

paxtir el problema en otros más pequeños simétricos que se resuelven de la forma


tradicional. Es un híbrido de diagramas de decisión secuenciales y diagramas de
influencia. Bielza y Shenoy (1999) comparan varios de los métodos anteriores y
exponen numerosos problemas abiertos. No parece que ninguno sea superior a
todos, si bien los más recientes proporcionan soluciones más elaboradas y con
¡ menos inconvenientes.
Para mostrar las ideas principales que se manejan en esta literatura, desarro­
llamos en mayor detalle el trabajo de Smith, Holtzman y Matheson (1993). En
lugar de usar tablas, la distribución condicionada asociada a cada nodo del diar
grama de influencia se representa mediante los llamados árboles de distribución.
Sus caminos muestran los escenarios condicionantes de la distribución que se está
describiendo, y conducen a distribuciones atómicas donde se indican las distribu­
ciones de probabilidad (para los nodos de azar), el conjunto de alternativas (para
los de decisión) o las utilidades (esperadas) (para el nodo de valor), asignarlas en
cada escenario condicionante.

Ejemplo 7.1 (com pra de helicóptero) (continuación del Ejemplo 5.2)


Para este problema, las condicionadas se muestran en la Figura 7.9.

Figura 7.9: Árboles de distribución para cada nodo: E, P, R, C y de valor

Al no tener E predecesores condicionantes, su distribución se representa con


una sola distribución atómica. Para P ocurre lo mismo, teniendo un único con­
junto atómico de alternativas.
258 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

En la parte condicionante no importa el orden de las variables ni el tipo de


nodo que representan, la relación de dependencia entre ellas ni sus probabilidades.
Por eso sólo se. enumeran con su nombre y se dibujan todas igual.
La Hist.rihnr.irtn de R, condicionada a P y E , tiene tres distribuciones atómicas
estocásticas y una determinística. Obsérvese cóm o se perm ite que las distribu­
ciones atómicas tengan conjuntos diferentes de valores posibles para diferentes
escenarios condicionantes. La distribución atóm ica determinística está compar­
tida por todos los valores de E , es decir, se asigna independientemente del valor
de E , dado P = n o hacer. No dibujamos etiquetas en E para expresarlo y como
el nodo y sus ramas se han colapsado en un punto, decim os que la distribución
de R está colapsada a través de E dado P = n o hacer. Podem os así representar
la independencia condicional entre variables que se da sólo dados ciertos estados
particulares de otras variables..
Este patrón de simplificación es una forma de coalescencia, donde ahora este
concepto es mucho más amplio, abarcando situaciones en que varios escenarios
condicionantes comparten la misma distribución atóm ica o en que varios valores
de cierta variable condicionante hacen lo mismo con to d o un subárbol del árbol
de distribución asociado. Se dice entonces que la distribución está compartida.
Este es el caso de la distribución de C, pues presenta el mismo conjunto atómico
de alternativas {c, -ic} disponibles en los tres escenarios condicionantes. Ob­
sérvese que sólo se representan los escenarios condicionantes posibles: aparecen
(hacer,ra), (hacer,rn) y (no hacer,-ir) y no aparecen (hacer,-ir), (no hacer,ra) y
(no hacer,rn). Al omitir las ramas correspondientes, el árbol de distribución que­
da recortado. Esta propiedad depende de los predecesores, no de la variable cuya
distribución se está definiendo. Sus ramas sí van etiquetadas, a diferencia de las
de las distribuciones colapsadas.
El árbol de distribución para el nodo de valor muestra la ausencia del nodo
E en los caminos que pasan por C = ->c. Así hacemos explícito que la función
de utilidad no depende de E si C = ->c. De nuevo, la distribución está colapsada
a través de la variable E dado C = ->c. □

Aunque no se ilustra en nuestro ejemplo, puede haber además distribuciones


no especificadas donde determinadas distribuciones atómicas de un nodo de azar
pueden dejarse sin especificar porque no son requeridas durante la fase de solución
(Smith, Holtzman y Matheson, 1993).

Evaluación

El algoritmo para resolver este tipo de diagramas es conceptualmente el mis­


m o que para los diagramas de influencia convencionales. Sin embargo, Smith,
Holtzman y Matheson distinguen diferentes casos que se pueden dar incluyendo
distribuciones determinísticas, compartidas, recortadas y no especificadas, que al
ser reconocidos consiguen ahorros computacionales notables.
@ R A -M A CAPÍTULO 7: MODELOS GRÁFICOS ALTERNATIVOS 250

E je m p lo 7 .1 ( c o m p r a d e h e l i c ó p t e r o ) (continu ación del E jem p lo 5 .2)


Como la novedad está a nivel numérico, sólo mostramos los árboles de dis­
tribución asociados á cada paso, pero no los diagramas de influencia, que son
análogos al caso usual.
Primero se elimina el nodo E , para lo que hay que invertir el arco (E, R).
Añadimos antes el arco (P, E ) , lo que supone no realizar ningún cálculo; sim­
plemente el nuevo árbol de distribución de E contiene una distribución atómica
compartida por los dos nuevos escenarios condicionantes. Después se estudia,
para cada escenario condicionante, el tipo de estructura que tienen, la distribu­
ción a priori y la de verosimilitud (la de E y fi, respectivamente). Para el
escenario condicionante P =hacer, las distribuciones son generales, invirtiendo
el arco de la forma estándar. Pára el escenario P =no hacer, P(fl|E,no hacer)
está colapsada a través de E, pues comparte una distribución atómica para todos
los valores de E . Esto implica que la distribución que vamos a obtener, P(ñ|no
hacer), debe ser esa distribución atómica compartida: P(R|E,no hacer)=P(-R|no
hacer). Además, la distribución a posteriori coincide con la a priori:

n, „ , D , x P(R\E,no hacer)P(E|no hacer)


P{E\R, no hacer) = ' - , DI— \ = P(E no hacer).
P(R\ixo hacer) v '

Por tanto, para P =no hacer, no se requiere ningún cálculo. Los árboles de dis­
tribución de R y E después de la inversión del arco se muestran en la Figura 7.10.

P R E

Figura 7.10: Distribuciones de R y E después de invertir el arco (E,R)

Antes de eliminar E hay que añadir los arcos (C, E) y (R, v), sin necesidad de
realizar ningún cálculo y conservando en los árboles de distribución resultantes
las situaciones de coalescencia y recortes. Al eliminar E, se invierte el arco
(E, v) , calculando sólo la nueva distribución de v, lo que equivale a calcular la
esperanza, ver Figura 7.11. La operación se lleva a cabo, de nuevo, considerando
cada escenario condicionante por separado.
de LOS SISTEMAS PE AYUDA A LA DECISIÓN © R A -M A

P R C U
0.594
0.25
0.201
0.25
0.437
0.26

Figura 7.11: Distribución de v después de eliminar E

Debemos remarcar que en algunoscasos no se han realizado cálculos, específi­


camente en los dos escenarios condicionantes que tienen C = ~>c en la distribución
de v (Figura 7.9). Ahora se debe a que la distribución de v está colapsada a través
de E, dado C = ->c. Es decir,

U (P, R, -te) = ^ / U(P,R,^c1E)P{E\P,R>^c)


B
= U{P, -ic)P(E\P, R) = U(P, —|c) 2 P(E\P, R) = U(P, —’c).
B £

Los siguientes pasos se realizan de forma análoga. Primero, eliminamos C maxi-


mizando U en los estados de C permitidos por su árbol de distribución. Segundo,
eliminamos R utilizando la distribución de v resultante en el paso anterior y la
de R de la Figura 7.10. Para P = n o hacer, la distribución de R es determinística
tomando sólo el valor -ir. Por tanto, no se requieren cálculos y nos limitamos
a seleccionar la distribución atómica de v correspondiente a ü = - r (que es, en
este caso, también determinística). La nueva distribución de v toma sólo los va­
lores 0.448 en el escenario P =hacer prueba y 0.437 en el escenario P = n o hacer
prueba. Por último, eliminamos P. □

Para problemas simétricos, estos diagramas son equivalentes a los conven­


cionales. Siguiendo a Smith, Holtzman y Matheson (1993), podríamos comparar
los dos tipos de diagramas de influencia midiendo el tamaño de las distribuciones
de nuestro problema del helicóptero. Para ello tomamos tres medidas, que para
la distribución de R aparecen calculadas en la Tabla 7.5.
La diferencia en el número de escenarios condicionantes se debe a que la dis­
tribución de R está colapsada a través de E, dado P = n o hacer. Si existiera algún
recorte también influiría en esta diferencia. El número de distribuciones atómi­
cas es el mismo que el de escenarios condicionantes porque R no tiene ninguna
distribución atómica compartida. La diferencia en el número de pares valor-
probabilidad es más acusada y se debe a que en la nueva representación podemos
manejar distribuciones atómicas que tengan conjuntos diferentes de valores posi-
CAPÍTULO 7: MODELOS GRÁFICOS ALTERNATIVOS 261
jtA-M A

Tabla 7.5: Tamaño de la distribución de R

distribución No. escenarios No. distribuciones pares


de R condicionantes atómicas valor-probab.
diagrama 6 6 18
convencional
diagrama 4 4 7
asimétrico

bles. Por el contrario, el uso de tablas en los diagramas convencionales obligaba


a definir un conjunto común de valores para todos los escenarios condicionantes.
Con los árboles de distribución podemos no representar los escenarios condi­
cionantes imposibles mediante las distribuciones recortadas. Distinguimos así las
combinaciones de estados posibles e imposibles de las variables del problema.
También podemos representar distintas formas de coalescencia (entre ellas las
distribuciones colapsadas). Con los diagramas convencionales, la compartición
de subárboles por ciertos escenarios condicionantes era imposible representarla
y aprovecharla. Por ello, ya no necesitamos utilizar recursos como el de asig­
nar utilidades degeneradas en los caminos simetrizados. Por Último, también
podemos mezclar diferentes tipos de distribuciones atómicas (para nodos de azar
y de decisión), pues estos árboles relacionan la información condicionante y las
distribuciones que se asignan a cada estado de información.
Como consecuencia, ahora es sencillo detectar los valores posibles de las va­
riables aleatorias, las alternativas disponibles, las combinaciones imposibles y
las distribuciones idénticas. La mejora de los diagramas de influencia conven­
cionales es obvia, proporcionando una representación más compacta y expresiva
que las tablas usuales. Las estructuras introducidas -colapsadas, recortadas,
compartidas o no especificadas- permiten representar y manejar muchos tipos de
asimetrías de forma sencilla.
Como también son diagramas de influencia, explotan las hipótesis de inde­
pendencia condicional. En cuanto haya independencias y además asimetrías, es
preferible usar esta versión de diagramas de influencia (u otra de las indicadas
arriba), pues captan las asimetrías como los árboles de decisión prácticamente.
En defensa de los árboles de decisión, señalemos que pueden capturar asimetrías
globales de todo el problema. Es lo que hace DPL cuando etiqueta partes del ár­
bol repetidas, como ya vimos. En cambio, los diagramas de influencia asimétricos
sólo captan asimetrías localmente, es decir, en cada distribución de cada variable.
Un inconveniente de estos diagramas es tener que añadir estados artificiales
(como -ir en nuestro problema). Precisamente algunas de las investigaciones
recientes antes citadas dirigen sus esfuerzos a este tipo de aspectos. Otros incon­
venientes son más sutiles y específicos, ver Bielza y Shenoy (1999).
262 F U N D A M E N T O S D E LOS S IST E M A S D E A Y U D A A L A D E CISIÓ N © RA MA

7 .3 R E S O L U C I Ó N A P R O X I M A D A M E D I A N T E

M É T O D O S D E S I M U L A C I Ó N

7.3.1 Modelos con pocas dependencias probabilísticas y


decisiones

Los problemas de decisión reales son complejos y es necesario el uso de software


potente que realice los cálculos. Pero a menudo, incluso estos métodos exac­
tos son incapaces de resolverlos y sólo podemos obtener soluciones aproximada­
mente óptimas. Los métodos gráficos hasta ahora estudiados tienen problemas
computacionales al manejar, por ejemplo, variables continuas de azar y /o de
decisión: el Teorema de Bayes y los cálculos de esperanzas con variables conti­
nuas requieren típicamente aproximaciones analíticas (normal, de Laplace...) o
integración numérica (regla del trapecio, métodos de cuadratura...). Además,
maximizar la utilidad esperada sobre una variable de decisión continua requiere
típicamente una búsqueda iterativa (sección áurea, Fibonacci, rejillas, etc.). Es­
tos dos problemas incrementan la carga computacional en problemas de gran
dimensión.
Una posibilidad ya comentada en la Sección 6.4 es utilizar simulación. Con
ella conseguimos que el propio ordenador ayude a desarrollar el modelo de incer­
tidumbre asociado al problema. El ordenador generará valores aleatorios de las
variables aleatorias implicadas de acuerdo a su propia distribución de probabili­
dad, hasta que estén todas fijadas. Después calculará la consecuencia (o utilidad)
asociada al escenario. La repetición de este proceso muchas veces permitirá ex­
traer estadísticos descriptivos de la (aproximada) distribución de la utilidad para
las distintas alternativas (media, desviación típica, probabilidad de una utilidad
muy pequeña, etc.) y gráficos (histogramas, perfil de riesgo), que pueden usarse
de diversas formas para tomar una decisión apropiada.
Es decir, el ordenador juega muchas veces al juego representado por el mo­
delo, para ofrecernos ideas sobre las probabilidades de varios posibles resultados.
El decisor examinará las consecuencias de varios escenarios, teniendo una apro­
ximación del comportamiento de las distintas alternativas.

E je m p lo 7 .2 ( la n z a m ie n to d e p e r ió d ic o )

Supongamos que queremos decidir si lanzar al mercado un nuevo periódico so­


bre ofertas inmobiliarias en nuestra población. Estimamos que deberíamos poder
venderlo a un precio competitivo de 0.5 euros cada uno. El mercado potencial
se estima en 700000 periódicos al año. Pero al ser un producto competitivo no
sabemos si podremos vender tantos. Nos preguntamos si el nuevo negocio nos
proporcionará un valor esperado positivo.
Hay muchas fuentes de incertidumbre. El tamaño del mercado (TAI) es desco­
nocido pero nuestra asignación subjetiva lo inodeliza como una normal de media
CAPÍTULO 7: MODELOS GRÁFICOS ALTERNATIVOS 263
© RA-MA

700000 periódicos y desviación típica 100000. La proporción (P) del mercado que
captaremos es también desconocida, entre 0 y 100%. Nuestros conocimientos en
el sector nos llevan a modelizarla aproximadamente cómo una variable aleatoria
discreta que toma los valores 15%, 20%, 25% y 30% con probabilidades respectivas
0.15, 0.25, 0.45, 0.15.
Los costes variables {C V ) siguen una distribución uniforme entre 0.2 y 0.4
euros por periódico. Los costes fijos (C F ) son también normales de media 25000
euros y desviación típica 400 euros. El cálculo del beneficio neto vendrá dado por

beneficio neto = (TM x P/100) x (0.5 —CV) - CF.

Para resolver el problema; tenemos primero que generar valores de las distintas
distribuciones, lo cual es sencillo al ser todas independientes y de generación
estándar. En la Tabla 7.6 se muestra un fragmento de los 500 valores generados
para cada una de las cuatro distribuciones.

Tabla 7.6: Algunos valores generados aleatoriamente para cada distribución

TM P CV CF
809784.8 30 0.299 25215.33
736703.7 25 0.325 25130.55
683171.1 25 0.265 24843.18
696563.5 30 0.202 24913.20
546616.1 25 0.303 24981.80

Se utilizó el programa estadístico S-Plus (Venables y Ripley, 1994), pero


puede realizarse con cualquier generador de números aleatorios, utilizando des­
pués métodos como el de la transformación inversa o la variante polar de Marsa-
glia (ver, por ejemplo, Ríos Insua, Ríos-Insua y Martín, 1997) para conseguir las
distribuciones deseadas.
Los valores generados se introducen ahora en la fórmula del beneficio neto y
estudiamos esta variable para extraer conclusiones. La Tabla 7.7 muestra algunas
de sus medidas resumen.
Finalmente, mostramos su histograma en la Figura 7.12. El beneficio medio es
de 7880.78 euros, lo que es esperanzador. Sin embargo, el perfil de riesgo indicado
en el histograma nos informa de varias posibilidades de obtener pérdidas. En
concreto, el beneficio neto fue positivo el 68.8% de las veces. Si consideramos que
es suficientemente grande, deberíamos lanzar nuestro periódico, no siendo así en
caso contrario.
264 FUNDAM ENTOS D E LOS SISTEM AS D E A Y U D A A L A D ECISIÓ N © RA -M A

Tabla 7.7: Estadísticas resumen (en euros) de la distribución del beneficio neto

Mínimo -21298.49
Cuartil inferior -2167.21
Media 7880.78
Mediana 6279.96
Cuartil superior 16010.93
Máximo 49319.81
Desv. típica 12333.95

I I-----1-----1----- 1-----1-----1-----1-----1----- 1----- 1----- 1----- 1----- 1----- 1---


-2 5 0 0 0 -1 5 0 0 0 -5 0 0 0 0 5000 15000 25000 35000 45000

beneficio neto

Figura 7.12: Histograma del boucVudo neto para el problema del periódico

Podríamos realizar ahora una aproximación discreta de la distribución (ver


Capítulo 5) del beneficio neto para introducirla en nuestro modelo gráfico. Esta
estrategia es apropiada si la simulación se usa como análisis auxiliar para construir
un modelo de probabilidad de una parte especialmente compleja de un problema
muy grande.
Con la simulación hemos examinado la distribución de probabilidad de dis­
tintas ganancias asociadas con el negocio. Si nuestro problema contuviese otras
alternativas, podríamos comparar sus respectivos histogramas que revelarían cuál
;s la más arriesgada, incluso aunque tuviesen valores esperados similares.
Nótese que podemos resolver así problemas de tamaño moderado, incluso uti-
izando una hoja de cálculo. Kirkwood (1997) es un texto dedicado especialmente
J uso de hojas de cálculo para resolver problemas de decisión. También pueden
© R A -M A C A P IT U LO 7: MODELOS GRÁFICOS ALTERNATIVOS 265

usarse programas específicos de Análisis de Decisiones, que suelen contener la


posibilidad de la simulación. Uno de los cinco productos integrados en Decisión
Tools Suite (ver Capítulo 6), @RISK, es de los más populares.

7.3.2 Modelos más complejos

Si en el ejemplo de la sección anterior escribimos la expresión del beneficio neto


esperado, nos daremos cuenta de su complejidad, incluso teniendo independencia
de las variables aleatorias. Las integrales podían haberse aproximado por méto­
dos numéricos, pero resulta más conveniente la integración Montecarlo (ver, por
ejemplo, Ríos Insua, Ríos-Insua y Martín, 1997), que es lo que hemos hecho. La
potencia de la simulación es evidente al permitirnos resolver el problema de una
forma muy sencilla y directa.
Desafortunadamente esto no siempre es así. Tomemos un problema con dos
nodos de decisión D y T y dos de azar X e Y, todos con dominios binarios.
La secuencia en el árbol de decisión es D,X,T,Y, con dependencia completa.
Podemos simular de la distribución conjunta a partir de las condicionadas, como
es usual. Pero el hecho de tener varias estrategias nos obliga a instanciar valores
para las decisiones, con la consecuente explosión combinatoria. Así, fijaríamos
primero, por ejemplo, D — d\ y generaríamos de X\d\. Si el resultado es x2,
ahora tendríamos que generar de Y\dt,X2,ti, pero también de Y|di,X2,Í2>etc.
Siguiendo el enfoque estadístico bayesiano, podemos incluir incertidumbre en
los parámetros de las distribuciones asignadas, complicando más la modelización
de la incertidumbre y, por tanto, el modelo de simulación. Al principio uno puede
tender a incluir todas las posibles fuentes de incertidumbre en el modelo. Después,
el análisis de sensibilidad determinará cuáles son las que realmente afectan a los
resultados del modelo, ver Capítulo 8. Cuantas más fuentes de incertidumbre
haya, más importante es realizar un mayor número de simulaciones.
Para problemas más complejos debemos entonces proceder de otra forma. Ya
que existen numerosos métodos de simulación para redes bayesianas, ver por ejem­
plo, Pearl (1987), York (1992) o Brewer, Aitken y Talbot (1996), una posibilidad
es convertir el diagrama de influencia en una red bayesiana (Cooper, 1988). Sin
embargo, tal método requiere esencialmente la evaluación de la utilidad esperada
para cada alternativa.
Otras aproximaciones no muy alejadas de esta línea se encuentran en Jen-
zarli (1996), Shachter y Peot (1992), Jensen, Jensen y Dittmer (1994), y Zhang
(1998), que trabajan también con redes bayesianas o con estructuras típicas en
esa literatura, como los árboles de uniones. Charnes y Shenoy (1997) trabajan
más cerca de los diagramas de influencia. Pero todos ellos resultan intratables en
presencia de espacios de decisión continuos.
Bielza, Míiller y Ríos Insua (1999) proponen un método sencillo de simulación
Montecarlo basado en cadenas de Markov, simulando de un modelo aumentado
m f u n d a m e n t o s d e l o s s i s t e m a s d e a y u d a A LA DECISION (£> KA-MA

¿e probabilidad. En este método se considera una distribución artificial sobre el


espacio producto de decisiones y estados, de forma que su marginal en el espacio
de decisiones es proporcional a la utilidad esperada de la decisión y, en conse­
cuencia, la solución óptima coincide con la moda de la marginal. Una ventaja de
este método es su aplicabilidad a problemas con espacios continuos, con modelos
de probabilidad no conjugados, funciones de utilidad arbitrarías... Sin embargo,
por las dificultades de la programación dinámica para afrontar problemas de deci­
siones secuenciales estocásticos, actualmente sirve para problemas con estructura
no secuencial (los nodos de decisión no pueden tener com o predecesores a nodos
de azar que tengan a su vez distribuciones que dependen de otros nodos de de­
cisión). Para generalizarlo, tal vez podrían usarse resultados de métodos recientes
en programación dinámica^ como la programación dinámica neural (Bertsekas y
Tsitsiklis, 1997) o el método de alcanzabilidad.

7.4 DISCUSIÓN

En los tres últimos capítulos hemos presentado los modelos gráficos existentes
para el tratamiento de problemas de decisión. Hemos analizado tanto la capaci­
dad para captar las características principales del problema en su representación
gráfica, como la disponibilidad de un algoritmo eficiente de solución.
No es sencillo establecer criterios sobre los que valorar la bondad de un mode­
lo gráfico. Por ejemplo, sería deseable estudiar cómo crecen los costes computar
cionales en función de la dimensión del problema. Pero esto es difícil al depender
de la estructura del problema, ya que el tiempo de ejecución de cualquier paso del
algoritmo de solución está muy relacionado con el tamaño de las distribuciones
implicadas. Otro factor influyente es la propia implementación (software y hard­
ware): como cada método utiliza un algoritmo diferente, cualquier comparación
va ligada a su implementación, pues hará variar la eficiencia computacional real.
Otro aspecto a considerar es la introducción de costes adicionales, que pueden
incluso superar a los beneficios reales. Por ejemplo, costes por definir las variables
y sus dominios para reflejar asimetría o por especificar los árboles de distribu­
ción (en la versión asimétrica de los diagramas de influencia), o por preprocesar
probabilidades (en los árboles de decisión).
Las desventajas/ventajas desveladas en cada método gráfico pueden darnos
ideas de por dónde investigar. Podemos pensar, por ejemplo, en combinar varios
de estos métodos. Así, en Bielza y Shenoy (1999) se adapta la técnica de Smith,
Holtzman y Matheson (1993) al caso de varios nodos de valor. Para los árboles
de decisión, se propone evitar el preproceso usando conjuntos de información o
al menos hacerlos más eficientes utilizando redes bayesianas.
Hemos indicado el gran interés actual y el potencial de la simulación. Su lento
avance en Análisis de Decisiones puede deberse a que los problemas de decisión
considerados tradicionalmente requieren estructuras relativamente pequeñas, con
al (1997). Con éstas se selecciona un subconjunto de estrategias a estudiar,
udiendo conducirnos a decisiones subóptimas.
Otro aspecto a investigar sería en la búsqueda de grafos más generales para
representar de forma efectiva problemas de horizonte infinito.
Como ya se indicó en el capítulo anterior, los congresos anuales de Uncertaín-
ty in Artificial Intelligence tienen siempre información de última hora. Muchas
de las referencias utilizadas se han tomado de allí. En la dirección de la De­
cisión Analysis Society americana http://www.informs.org/Society/DA, tam­
bién hay información valiosa.
Para el futuro, podemos esperar un programa que integre varios modelos
gráficos y el decisor elija el más conveniente para su problema particular. Para
ello, puede analizar su estructura y preguntarse qué tipo de cuestiones espera
resolver. Más aún, sería deseable que esta elección la realizara un ordenador a
través de un sistema experto que actuara como un analista guiando al decisor
a través del ciclo del Análisis de Decisiones. Tal vez estos sistemas estarían
limitados a dominios específicos, como la localización de una central de energía o
decisiones de mercado. Esto se tratará en el Capítulo 10.

7.5 EJERCICIOS

7.1 Escoger algún problema del capítulo anterior y representarlo y resolverlo


como un árbol de escenarios. Hacer lo mismo pero como un árbol de juego.
Comparar la eficiencia computacional de ambos.

7.2 Resolver el árbol de juego del ejercicio anterior con el método de poda.
Concluir qué método es mejor.

7.3 Dado el árbol de juego de la figura siguiente, construir el correspondiente


árbol de decisión. Discutir sobre el número de nodos de uno y de otro.
Contar el número de operaciones binarias que requiere el árbol de decisión
y el de juego para encontrar una estrategia óptima.

0.3 3
268 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

7.4 Sean dos variables aleatorias X , Y y una variable de decisión D. Suponga­


mos que X toma dos valores e Y toma tres valores. Supongamos un árbol
de juego donde se ha dibujado primero X , luego Y y luego D . Denotemos
D i,...,D e a los seis nodos de decisión resultantes. Indicar cómo son los
conjuntos de información en cada uno de los siguientes casos y dibujar el
árbol de decisión correspondiente:

(a) X e Y se conocen al tomar la decisión D .


(b) No se conocen ni X ni Y al tomar D .
(c) Se conoce X al tomar D pero no se conoce Y .
(d) Se conoce Y al tomar D pero no se conoce X .

7.5 Resolver el Ejercicio 6.10 de la compra del coche de segunda mano utilizando
un diagrama de influencia asimétrico.

7.6 Resolver el problema del helicóptero por simulación.

7.7 Un experto en finanzas quiere examinar la incertidumbre respecto al éxito o


fallo de cuatro proyectos de inversión. Asigna la probabilidad de éxito de ca­
da proyecto individualmente según: p\ = 0.4,p<¿ = 0.65,P3 = 0.5,p± = 0.45.
La independencia entre sus resultados es razonable al ser ejecutados los
proyectos por diferentes personas y en diferentes segmentos del mercado.
Sin embargo, el experto no está completamente seguro de esas probabili­
dades y señala que podrían desviarse com o mucho 0.08 en cualquier direc­
ción. Indicar cómo puede incorporarse esta incertidumbre sobre las proba­
bilidades en la simulación.
CAPÍTULO 8

a n á l is is d e
SENSIBILIDAD

El análisis de sensibilidad desempeña un papel fundamental en la estruc­


turación y evaluación de los problemas de decisión si usamos técnicas del Análisis
de Decisiones. Además, en todos los procedimientos cuantitativos el análisis de
sensibilidad es necesario, ya que las salidas dependen de las entradas. Así el
analista deberá variar las entradas para observar el efecto que se produce en las
salidas. Si pequeños cambios en las entradas producen efectos sustanciales en las
salidas, el decisor debería reflexionar sobre los juicios emitidos y asegurarse de
que los valores usados representan fielmente sus creencias y preferencias. Sin em­
bargo, si los efectos son mínimos cuando se realizan variaciones medias o grandes,
el decisor no debe preocuparse de reasignar sus creencias y preferencias.
Los diferentes papeles que desempeña el análisis de sensibilidad dentro del
Análisis de Decisiones pueden verse desde diferentes perspectivas: técnica, cog­
noscitiva y grupo. Técnicamente, el análisis de sensibilidad ayuda al analista
a planificar el análisis para evitar cálculos innecesarios sin perder en fiabilidad.
Cognoscitivamente el decisor aprende sobre sus juicios descubriendo la importan­
cia que tienen para él cada uno de ellos. Aprende a centrarse en lo verdaderamente
importante pasando el resto a segundo lugar. Los grupos pueden realizar análisis
de sensibilidad sobre los parámetros con los que están en desacuerdo y centrar
toda su atención en los importantes, evitando el debate sobre aquellos que no lo
sean.
Este capítulo lo hemos comenzado con una pequeña introducción que resalta
la importancia del análisis de sensibilidad en los problemas de decisión y conti­
nuará mostrando el papel que desempeña en cada una de las fases del Análisis
de Decisiones. En primer lugar, demostraremos cómo el análisis de sensibilidad
es crucial a la hora de identificar y estructurar el problema de decisión. A conti­
nuación veremos que otra utilidad del análisis de sensibilidad es la reducción del
conjunto de soluciones de interés para el decisor para facilitarle la labor de elegir
270 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

la más preferida. Posteriormente, presentaremos el diagrama tornado como una


herramienta para estudiar el efecto en la utilidad esperada de cambiar el valor
de un parámetro permaneciendo el resto en sus valores originales. Entendemos
por parámetro cualquier valor (utilidades, costes, probabilidades, etc.) suscepti­
ble de cambio. También indicaremos otra posible forma de ver este efecto pero
sobre la solución óptima. No sólo estudiaremos el efecto del cambio de un úni­
co parámetro sino también el efecto sobre la solución óptima cuando se realizan
cambios en los valores de dos y tres parámetros a la vez. Realizando el anterior
estudio identificaremos las variables relevantes del problema de decisión. Después
investigaremos la sensibilidad a las probabilidades para asegurar las asignaciones
realizadas o detectar la necesidad de revisión, y terminaremos indicando cómo
obtener el valor esperado de la información para determinar si merece la pena
recoger más información sobre el problema.

8.1 IDENTIFICACIÓN Y ESTRUCTURACIÓN


DEL PROBLEMA

La importancia del análisis de sensibilidad en esta etapa se debe a que puede


permitir al decisor reconsiderar la naturaleza del problema. La pregunta que se
le plantea es si está resolviendo el problema correcto. La respuesta no necesita un
análisis cuantitativo sino pensar de nuevo cuidadosamente en el problema, ya que
resolver uno diferente o satisfacer objetivos diferentes pueden llevar a soluciones
muy distintas de las buscadas.
Al error que se comete cuando resolvemos un problema de decisión erróneo lo
llamaremos de tipo III para diferenciarlo de los que se producen en Estadística
que usualmente se denotan como errores de tipo I y ü . Por tanto, diremos que
se ha producido mi error de tipo III cuando el problema de decisión ha sido
erróneamente identificado.
Un ejemplo de error de este tipo sería el no considerar la distancia de la
vivienda al trabajo como un objetivo en el Ejemplo 2.6. La solución del pro­
blema posiblemente no se adaptará a las necesidades del decisor, no porque la
forma de resolver el problema no sea adecuada sino porque ha sido formulado
incorrectamente. Otro ejemplo, muy común en medicina, es tratar los síntomas
en lugar de las causas que provocan cierta enfermedad. En efecto, en el caso
de cáncer de pulmón el objetivo de los médicos y de la sociedad es reducir el
número de muertes provocadas por este mal. Sin embargo, las investigaciones
se han dirigido más a encontrar tratamientos médicos caros en lugar de realizar
campañas que conciencen a la población de lo perjudicial que puede ser fumar
a pesar de estar probado que es más efectivo, para lograr el objetivo, realizar lo
segundo que lo primero. Para evitar que surjan errores de tipo III, lo mejor es
no dejar de preguntarse si la modelización del problema coincide con la situación
real.
CAPITULO 8: ANÁLISIS DE SENSIBILIDAD 271
© RA-MA

También podemos hablar sobre análisis de sensibilidad en el contexto de la


estructuración del problema. Muchos problemas de decisión pueden ser repre­
sentados de diferentes formas. El análisis de sensibilidad puede ayudar a decidir
entre las múltiples representaciones identificando la perspectiva del problema más
apropiada y lo que verdaderamente importa al decisor. Esto supone, por ejem­
plo, en los árboles de decisión y diagramas de influencia decidir si ciertos nodos
pueden ponerse como determinísticos, si deberían detallarse más sus dominios (re­
finamiento conceptual), cambiar alguna dependencia (refinamiento estructural),
etc., ver Poh y Horvitz (1993). Horsch y Poole (1996) proponen una técnica para
un refinamiento iterativo flexible de soluciones, útil en el caso en que los costes
de computación sean muy altos y necesitemos disponer de una solución que no
necesariamente será óptima.

8.2 CONSIDERACIONES DE DOMINANCIA

En una fase inicial podemos usar el análisis de sensibilidad para descartar malas
alternativas. Nos preguntamos si podemos encontrar una alternativa que pueda
terminar siendo mejor que otra. Si no se puede es que la primera está dominada
por la segunda y debería ignorarse.
Supongamos que el modelo analítico de decisión usado ordena las alternati­
vas mediante una función de evaluación $ (-,• ), es decir, la alternativa Oí es al
menos tan preferida a la aj si y sólo si W (a¿,u>) > \Er(a,j,w), siendo w el vector
de parámetros. Por ejemplo, la función de evaluación $ (•, •) en los problemas
de decisión multiatributo en certidumbre puede ser la función de valor aditiva,
multiplicativa, y en los árboles de decisión y diagramas de influencia la utili­
dad esperada. Inicialmente el decisor proporciona valores concretos wq para los
parámetros y restricciones sobre otros posibles valores de los mismos a los que
también considera aceptables. Llamemos W a este conjunto de restricciones.
Claramente el decisor estará interesado en investigar la repercusión del cambio
de wq por otros valores de W.
Puede ocurrir que algunas alternativas sean mejores que otras independiente­
mente del elemento que tomemos de W. En estas circunstancias, diremos que Oj
domina (débilmente) a si

$ (o*,w ) > (dk,w) , Vio 6 W.

Si la desigualdad es estricta para al menos un w £ W , entonces la dominancia


® estricta. Este concepto de dominancia es simplemente una prolongación de las
ideas de ordenación de Pareto.
Encontrar las alternativas no dominadas supone resolver varios problemas de
Programación matemática. La alternativa o» domina a la alternativa si y sólo
272 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© R A-M A

si el valor óptimo del objetivo, z*, del siguiente problema es no negativo

min z = (ai,w) — (ak,w)


sa : W E W

Si z* es positivo, sabemos que a¿ domina estrictamente a a^. Si es cero, de­


beríamos comprobar si o*, domina a Oj.
Un segundo concepto identifica las alternativas que son óptimas para algún
w € W. Llamaremos a tales alternativas potencialmente óptimas. Matemáticas-
mente, ai es potencialmente óptima si para algún w E W

y (an, w) > $ (ak, w) , Yo*; E A

donde A es el conjuntó dé alternativas.


Si queremos saber si a¿ es potencialmente óptima tendremos que resolver de
nuevo un problema de optimización

min z = Zi
sa : w e W
\Er(ai,w) — (ak,w) +Z i > 0, V k ^ i .

Zi se entiende como la cantidad necesaria que hay que sumar a 'I/ (ai,w) para
que sea mayor o igual que $ (ak,w) para cada k ^ i y sea cual sea el valor de
w E W. Si el valor mínimo de z¿ es no positivo, entonces '3/ (ai,w) es siempre mayor
o igual que '£ (a*¡,u;) para cada a*¡, y por tanto a¿ es potencialmente óptima. El
recíproco también es cierto.
Parece razonable considerar las alternativas no dominadas únicamente. Sin
embargo, si conociésemos con seguridad el valor de w, propondríamos aquella a3-
que maximizase (a¿,iu); como sólo sabemos que w E W , nuestra solución final
estará entre las potencialmente óptimas, Ríos Insua y French (1991) y Ríos Insua
(1990). El siguiente resultado aparece en Ríos Insua (1990): “para cada w E W
hay una alternativa no dominada que es potencialmente óptima” . Es decir, el
conjunto no dominado incluye maximizadores de la función de evaluación para
cada w E W. Sin embargo, de ahí no se deduce ninguna implicación entre ambos
conceptos de solución, es decir, ni una alternativa potencialmente óptima ha de
ser no dominada ni una no dominada ha de ser potencialmente óptima.
Un tercer concepto es el de optimalidad, potencial adyacente. Los parámetros
iniciales del decisor, wo, no son arbitrarios. Son con los que el decisor está,
en algún sentido, más de acuerdo. Durante el análisis, según se va adentrando
en el problema, puede cambiar su percepción de los parámetros y la pregunta
que surge es: ¿cuánto debe cambiar wq para que la alternativa óptima deje de
serlo? Llamemos ao a la alternativa que ocupa el primer lugar en la ordenación
al considerar los parámetros u>o, es decir,

$ (ao,it>o) & (a/c,m) > Va*. € A.


.,IA CAPÍTULO 8: ANÁLISIS DE SENSIBILIDAD 273
© r a - m a _____________________________________________— ----------------------------------------------------------- — --------------------

Sor T'Fo subconjunto de W para el que «o es óptima, y de forma general, sea


)Vjb ol subconjunto de W para el que a*, es óptima. Entonces a* es potencialmente
óptima adyacente a ao si Wq fl Wk ^ 0 . Es decir, a*. es potencialmente óptima
adyacente a oo si Wo y Wk poseen una parte común, ver Figura 8.1.

Figura 8.1: Optimalidad potencial adyacente

La optimalidad potencial adyacente localiza a las alternativas que pueden


competir en optimalidad con ao pero no identifica el grado de proximidad en que
se encuentra cada competidora. Supongamos que a*, es potencialmente óptima
adyacente a ao- Sea w € Wk y d (•, •) una distancia en W, es decir, en términos
matemáticos d(-, •) es una métrica. Entonces la d(w,wo) más pequeña nos indi­
cará el grado de proximidad en que se encuentra a* para alcanzar la optimalidad.
Así, para cada alternativa a& potencialmente óptima adyacente a ao, tendremos
que resolver el siguiente problema de optimización

min d ( w , wo)
sa : w £ Wk

Sin embargo, surge un nuevo problema sobre qué métrica deberíamos usar
para calcular d (w, wq) ■Técnicamente no existe una respuesta, pero lo más acon­
sejable es la utilización de varias métricas, usualmente

• Euclídea: d (w,wq) = yJ 2i= i (wi ~ woi)2

• Máxima desviación absoluta: d (w, wq) = max¡=1 \w¡ - u)o¡|

• Suma de las desviaciones absolutas: d (w,wo) — X/¡=i \Wl _ ■

Resumiendo, los pasos a seguir para reducir el conjunto de soluciones de


interés para el decisor son:

1. Identificar las altenativas no dominadas.


M i i i;lU > A M IW I OH l ) h l-OH H IH T M A H I M A Y V I M A f.A H KtSIH lO N £> " A Ma

2, Mnconti'íiv d en tro <Ut lo» anUii'ioiw Ja» quo nca/i p o to icia lflw n to ópiiniiin,

,'i, J'/flCOnlriu Iíui a l t e r n a t i v a * p o t e n c í i o l m o n t o ó p t i m a * HÚyDAXiliU'M a o,i¡ y <íf.


íj/j/la ca«o <:l rnnnov enrubio n<iw}iwi0f un l/irminon da vnríiui m étrica*, fiobi'a
w p a r a c a m b ia ;. da o p t im a lid a d ,

E j e m p l o 8.J

EJ M in iste rio d e F om en to mu:n a mlMibtX la re a liza ció n di; u n a obra, Para


avaluar a Joíi >íiU:ic.i>U-m candid ato» co n sid era don ob^fitívoii', VfÚíí'mÚ'MT a\ C09t4
de realización del tr a b a jo y m a x im iza r <:J n iim ero d e trab ajad o re» , El &naJi»ta,
con un equ ip o dal rninítUti ¡<>, co n stru y e lina función cío valor '//j (•) p aya ol j;r¡fíi<;r
o b je tiv o y o tr a '¿^(') p a r a <:I « efu n do, U na ve/, ani/udioAiui huí condicionan de
in d ep en d en cia, a co n se ja al m in isterio la u tiliza ció n <Je un a función de valor adi-
tí v a p a r a la represen fcaei ón d e »y# preferencia», eíí d e cir, un a función del tipo
?;(') <= v)i vf(’) + W2V2O)' A dem án, d ecid e q u e Wj = 0.8 y W2 “ 0,7, Sin ern-
b a rg o , otro» po»ible» valore» qu e p odrían torn ar Jow pono# o factorc# de ewealu
#on w j <" [0,25,0,4/5] y = ) — vj). f‘)n la T a b la 8,3 «o p resen ta n Jo» diferente*
c a n d id a to ; (altern ativa» ) ron el valor quo torn a 0/1 c a d a u n a d e la# funcional) do
valo r,

J abJa 8, J; Valore» de la* alternativa* an la* funcione* de valor

n i) V'Á') */('): o .3 v i( ') -i- 0 ,7^2 (-)


A 1,0 0,2 0 A\
13 0,4 0,7 0,61
C 0,5 0,5 0,5
D 0,8 0.7 0,73
23 0,0 0,3 0,40
F 0,6 0,4 0.46
0 0,0 0-6 0,60
U 0,4 0,6 0.54

11 0,2 1-0 0.76

Corno v(‘) — 0 .3 vj (-) -1* 00 la fu n ció n que r e p r e s e n t a la« preferencias


JeJ M in is te rio d e F o m e n t o , ¡oh candidato» quedan ordenado» ííegún la 'labia 8 .2 .

T a b la 8,2; O rdenación de candidatos


no
Io 2" ó 5" 6" 7o 8o 0"
1 IJ G li H C E F A

Por tanto, el r/jáe preferido o» ul c a n d id a to L


© B.A-MA CAPÍTULO 8: ANÁLISIS DE SENSIBILIDAD 275

Si consideramos ahora todos los posibles pesos y resolvemos los problemas de


optimimización

m= min v(-) M= max v(-)


s-a- W! e [0.25,0.45] i i e [0.25,0.45]
W l + V)2 = 1 W \ + Vil, — 1

obtenemos que el mínimo valor, m, y el máximo valor, M, para cada candidato


son los que aparecen en la Tabla 8.3.

Tabla 8.3: Mínimo y máximo valor para cada alternativa

[m, M]
A [0.4,0.56]
B [0.565,0.625]
C 0.5
D [0.725,0.745]
E [0.45,0.57]
F [0.45,0.49]
G [0.675,0.735]
H [0.51,0.55]
I [0.64,0.8]

Gráficamente se muestra en la Figura 8.2.

Alternativas

Figura 8.2: Intervalos de valores para cada alternativa

Luego, I domina a A , B , C , E , F y H . En efecto, podemos, por ejemplo,


mostrar que I domina (estrictamente) a A, ya que la solución óptima para el
276 F U N D A M E N T O S D E LOS SIST EM A S D E A Y U D A A L A DECISIÓ N
© RA -M A

problema de optimización

= v (l)-v (A )
Wx € [0.25,0.45]
W\ 4- W2 = 1

verifica z* — 0.64 — 0.56 = 0.08 > 0. Por tanto, el conjunto de alternativas no


dominadas está formado por D, G e I.
Para comprobar si D y G son potencialmente óptimas resolvemos los proble­
mas de optimización

min zq min zq

wi e [0.25,0.45] W! £ [0.25,0.45]
sa : 1«1 + 1Ü2 = 1 W\ + W2 — 1
sa
v(D) —v(I) + zd > 0 v(G) —t;(I) + z q > 0
v(D) —v(G) + zd > 0 v(G) —v(D) + Z q, > 0

obteniendo para el primer problema w\ = 0.36364, W2 = 0.63636 con =


—0.027273 y para el segundo problema w\ = 0.45, w 2 = 0.55 con Zq = 0.01.
Luego D es una alternativa potencialmente óptima, mientras que G no lo es.
No es necesario demostrar que la alternativa I es potencialmente óptima, ya que
si miramos la Tabla 8.1 observamos que existen pesos para los que I es la más
preferida.
Estudiamos ahora la optimalidad potencial adyacente. En la gráfica siguiente
se observa que los posibles pesos son los que aparecen en negrita en la recta.
Este conjunto de pesos lo podemos dividir en dos subconjuntos: uno cuyos pesos
hacen que D y I y otro que hacen que I >- D.
CAPITULO 8: ANÁLISIS DE SENSIBILIDAD 277
© RA-MA

Gráficamente también se puede observar que los pesos más proximos a Wj =


q 3 ti>2 = 0.7 según la norma euclídea, que hacen que I y D, son = 0.3,
W2 _ 0.6 siendo dicha distancia

d ((0.3,0.6), (0.3,0.7)) = y (0.3 — 0.3)2 + (0.6 —0.7)2 = 0.047.

Por tanto, el ministerio debería centrar su atención en las alternativas I y D,


eligiendo I, si cree que el peso del primer objetivo w\ pertenece a [0.250,0.334],
o D, si cree que el peso pertenece a [0.334,0.45]. □

8.3 DIAGRAM AS TORNADO

Para descubrir la importancia relativa de cada parámetro en la decisión a tomar


podemos usar la técnica gráfica denominada diagrama tomado. Este diagra­
ma muestra cuánto puede variar el valor esperado o utilidad esperada de una
alternativa al cambiar una cantidad específica.

Ejemplo 8.2
Una empresa dedicada a la realización de software comercial está planteán­
dose sacar uno nuevo al mercado y quiere estimar el tiempo que se espera le
llevará realizarlo. Las variables a considerar y las relaciones entre ellas están
representadas en el siguiente diagrama de influencia
278 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN
© J U -M A

en el que se han asignado cuantitativamente los siguientes valores para las pro­
babilidades y tiempos:

1. Diseño del software: complejo [P(complejo) = 0.5] y sencillo.

2. Programa del software: fácil [Tiempo(fácil) = 6 meses, P(fácil |complejo)


= 0.2 y P(fácil |sencillo) = 0.4 ] y difícil [Tiempo(difícil) = 10 meses],

3. Test del software: positivo [Tiempo(positivo) = 3 meses, P(positivo |fácil)


= 0.6 y P(positivo |difícil) = 0.3] y negativo [Tiempo(negativo) = 6 meses].

4. Escribir el manual: fácil [Tiempo(fácil) = 6 meses, P(fácil |complejo, fácil)


■ = 0.4, P(fácil |complejo, difícil) = 0.1', P(fácü |sencillo, fácil) = 0.8, P(fácil
|sencillo, difícil) = 0.5,] y difícil [Tiempo(difícil) = 9 meses].

5. Revisar el manual: muchos cambios [Tiempo(muchos cambios) = 4 meses,


P(muchos cambios |positivo) = 0.5 y P(muchos cambios |negativo) = 0.6]
y pocos cambios [Tiempo(pocos cambios) = 2 meses].

6. Tiempo en imprimir el manual: 4 meses.

7. Tiempo en terminar el software = Programa del software + Test del soft­


ware.

8. Diseño del embalaje: imaginativo [Tiempo(imaginativo) = 2 meses y P(ima-


ginativo) = 0.5] y simple [Tiempo(simple) = 1 mes].

9. Tiempo en imprimir el embalaje: 2 meses.

10. Tiempo empleado en el embalaje = Diseño del embalaje + Tiempo en


imprimir el embalaje.

11. Tiempo en terminar el manual — Escribir el manual + Revisar el manual


+ Tiempo en imprimir el manual.

12. Tiempo total = Tiempo en terminar el software + Tiempo en terminar el


manual + Tiempo empleado en el embalaje.

Tomamos las variables que influyen directamente en los tiempos. Consideran­


do como valores base (originales), mínimo y máximo para algunos tiempos de
cada variable los que aparecen en la Tabla 8.4, se obtiene el diagrama tornado
que aparece en la Figura 8.3.
C A P ÍT U L O 8l A N Á lABlti DB tilSNUlBlLlDAD 270
i I' A MA

I (tblíl Bi4l VulOJ'OlJ bitMü, m ín im o y máximo

Tiempo ilc V/U'luliltl 1ilWfí M/wíwio MAxírno


1’i'i i|i,riniin, (litrll) Ó r> 1
'IWil, (punitivo) a 2 4
Knorlhlv mmimil (l’rtcll) ’o 4 7
It.ovlrim' nininm1 (ponun ramillón) 2 1 4
Dltioflor oiiiliiilnjii (linngliialilvo) 2 1 3
Imprimir ümbixlujo 2 1 4
Imprimir miuiiml 4 2 1

32.00]
Tiempo t'ii imprimir ul i u h ü u u í
3/30,002 6 / 33.062

Tiempo 011 imprimii' ol oinl>iili\jo

Ravisiu' ol miumnl (pocos cambioi)

ÜBOribil' ol miiminl ( fácil)

Diserto dol ombiilnjo (iiruiginntivo)


1 /■31.602

Programa soflwiu'o (fáoil)

Test dol soíhvnro (positivo)

Figura 8.3: Diagrama tornado

Los parámetros ti variar son por tanto los tiempos de la Tabla 8.4. Las barras
representan el rango para el tiempo total esperado de realización del software
cuiuido cada parámetro varía de un extremo al otro de su rango, permaneciendo
el resto en sus valores base. Por ejemplo, si consideramos 2 meses como tiempo
mínimo para imprimir el manual, entonces el tiempo esperado para terminar el
software es de 30.082 meses (se ha obtenido sustituyendo el 4, tiempo necesario
para imprimir el manual, por 2, y resolviendo el diagrama con ese nuevo valor). Si
so consideran 5 meses como tiempo máximo para imprimir el manual, la duración
do realización del software so espera que sea de 33.082 meses (so ha obtenido
sustituyendo 4 por 5). La línea vertical indica el tiempo esperado cuando todas
las variables están en sus valores base. O

Por tanto, los extremos do las barras que aparecen on el diagrama tornado se
obtienen sustituyendo ol valor buso de cada parámetro por los valores mínimos
880 1HJNDAMWNM'Otí 1)10 U)M HINTI0M AH 1)14 A Y U D A A I,A l)IOOIIII(')N @ HA MA

y máximos. Dütípuófcl 80 oi'douan liui barrita por longitud nlhiiuido inii/i arriba Iiui
m»is largas, El gráfico i'Ofiullituiliü i’ooilüi'da n/ií u mi tornado y do ahí ol nombro
dol diagrama, En ol t\J(ampio atiliudoi' ol (iloinpo on Imprimí),1 ol manual doboría
cousidtííivi'so iui\h cuidadütiiuiumliü, pitos ol lilornpo íiotol oyporado do roallzación
dol software oh aouslblo a éli Lo mismo ocurro con la Hoguuda varlablo, ol tiempo
on imprimir ol embalaje. Latí doiriiití pueden ptíffliaiiücür on huí-) valorow bono, Poro
las dos primeras tal v e / i deberían modoll/.ui'No cotilo variables aleatorios on von do
ser dotenninísticaa.
Utilizando diferentes colores on cuida barra puedo maréame adomrin si ha cam­
biado la decisión óptima.

8.4 ANÁLISIS DE SENSIBILIDAD SOBRE UN


PARÁMETRO
El análisis do sensibilidad sobre un parAmet.ro sirvo, a diferencia do los diagramas
tornado, para estudiar la sensibilidad de la decisión óptima al cambiar el valor
del parámetro a través de un rango especificado. Es decir, si queremos estudiar
el efecto sobre la solución óptima al variar el valor del parámetro V sobre el
intervalo [a, 6], lo que inicialmente se tiene que decidir es el número de puntos n
del intervalo que se quieren calcular. Luego, se obtiene el valor de cada decisión
cuando el parámetro V toma los valores a, a + ••• >b y ®1 resto de parámetros
permanecen con su valor inicial. Finalmente, para que el decisor pueda ver más
claramente lo que suponen los cambios de valor en V, se representan los resultados
gráficamente sobre un sistema de coordenadas. En el eje de abscisas se sitúan
los valores de y y en el de ordenadas los valores (en certidumbre) o utilidades
esperadas (en incertidumbre) de cada decisión. Los puntos adyacentes obtenidos
para cada decisión se unen entre sí para saber dónde se cambia de solución óptima
(en el supuesto de que se produzca tal cambio). En la siguiente figura queda
representado todo lo indicado anteriormente.
E je m p lo 8 .3

Una empresa tiene la opción de fabricar el producto A o el producto B.


Los costes de fabricación de los productos A y B son de 60000 y 100000 euros,
respectivamente, mientras que los precios de venta son 400000 y 750000 euros.
La fabricación de ambos productos puede realizarse correcta o incorrectamente.
la fabricación de A y B se realizará correctamente con probabilidades 0.95 y
0.6, respectivamente. Si los productos se fabrican incorrectamente no se pueden
vender. Por el contrario, si los productos son fabricados correctamente el mer­
cado los adquirirá con probabilidad 0.6. La empresa desea saber qué producto
debe fabricar para obtener un beneficio esperado máximo. El árbol de decisión
que representa el problema es el siguiente

La solución con mayor beneficio esperado, 350000 euros, es la fabricación del


producto B, como indica la figura.
Supongamos ahora que el empresario precavido quiere saber hasta cuánto
puede aumentar el coste de fabricación del producto B para que la fabricación
de B continúe siendo la solución óptima. Para ello es necesario realizar análisis
de sensibilidad sobre el valor del coste de B considerando, por ejemplo, que éste
puede variar entre 100000 y 200000 euros y el resto de valores permanecen fijos.
En la Figura 8.4 se presenta el resultado de este análisis de sensibilidad.

Coste B (en miles)

Figura 8.4: Análisis de sensibilidad sobre el coste de fabricación de B


282 F U N D A M E N T O S D E LO S S IST EM A S D E A Y U D A A L A DECISIÓ N © RA-M A

En la Figura 8.4 se observan en el eje de abscisas los diferentes valores del coste
de fabricación del producto B que desea considerar el empresario, y en el eje de
ordenadas el beneficio esperado on euros de cada alternativa. La gráfica muestra
que hasta que el coste de B no llega a ser de 130000 euros la solución óptima
continúa siendo la producción de B. Es decir, que para costes de fabricación del
producto B inferiores a 130000 euros la solución óptima es la fabricación del
producto B y para costes superiores a este valor, el óptimo es la fabricación del
producto A. □

8.5 ANÁLISIS DE SENSIBILIDAD SOBRE DOS


PARÁMETROS CONJUNTAMENTE
Los diagramas tornado y el análisis de sensibilidad sobre un parámetro propor­
cionan considerable información, aunque están limitados a realizar cambios en
un solo parámetro. Si queremos saber qué ocurre cuando cambiamos varios
parámetros a la vez el problema se complica. Sin embargo, es importante de­
tectar la sensibilidad global ante cambios en múltiples parámetros considerados
simultáneamente, pues podría ocurrir, por ejemplo, que una decisión sea insensi­
ble a la variación de los parámetros considerados individualmente pero sensible
a su variación simultánea. Como veremos, existen técnicas gráficas para estudiar
la interacción entre dos o tres parámetros.
Como ejemplo ilustrativo general, supongamos que estamos interesados en
considerar el impacto producido al cambiar los valores de dos parámetros, v\ y
V2, al mismo tiempo. El impacto puede referirse a observar si cambia la decisión
óptima o simplemente el valor de cualquier variable de interés. En la siguiente
figura el espacio rectangular representa los posibles valores que pueden tomar
estos parámetros y el segmento AB representa los valores de ambos parámetros
para los que un tercero, V3 , toma un determinado valor x.

v,
© R A -M A C A P IT U L O 8: ANÁLISIS D E SENSIBILIDAD 283

Gráficamente se puede observar que cuando consideramos el punto llamado


«valor base” obtenemos un valor para U3 mayor que x. Pero el decisor puede
desear saber cómo se comportarán los dos parámetros conjuntamente para que el
valor de v¡ sea menor que x. Si aumentamos un poco el valor de v\ y disminuimos
otro poco el valor de 1)2 con respecto al valor base logramos que v¡ sea menor que
x. Sin embargo, haciendo estos cambios individualmente puede que V3 no deje de
ser mayor que x.

Ejemplo 8.2 (continuación)


Supongamos que estamos interesados en saber cómo varía el “tiempo en ter­
minar el manual” , v¡, al variar las variables “escribir el manual (fácil)” , i>i, y
“revisar el manual (pocos cambios)” , ^ . Concretamente, nos gustaría conocer
los valores de vi y i>2 que hacen qué la variable V3 tome valores mayores, iguales
y menores que 11 .
Sabemos que “Tiempo en terminar el manual = Escribir el manual + Revisar
el manual + Tiempo en imprimir el manual” , es decir, 113 = v\ +V 2 + “Tiempo
en imprimir el manual” . Como vi € [4,7], v2 £ [1,4] (ver Tabla 8.4), los ejes
de coordenadas variarán en esos intervalos. También sabemos que el tiempo en
imprimir el manual es 4. Y el valor base es el punto (6,2) de la Figura 8.5 donde
= 6 + 2 + 4 = 12 . Además para v\ = 4 tenemos que 4 + + 4 = 11, de
donde v 2 = 3 y para vi = 6 tenemos que 6 + v¡ + 4 = 11, de donde V2 = 1. Es
decir, 113 = 11 es la recta que pasa por los puntos (4,3) y (6,1). Gráficamente se
muestra en la Figura 8.5.

v,

Figura 8.5: Análisis de sensibilidad sobre v\ y V2

E je m p lo 8.3 (continuación)
Supongamos que el empresario está interesado en estudiar el efecto de ver qué
ocurriría si el coste de fabricación de A variara entre 60000 y 70000 euros y el
284 FUN D AM EN TO S D E LOS SISTEMAS D E A YU D A A L A DECISIÓN © R A -M í

de B entre 100000 y 200000 euros. La Figura 8.6 muestra el resultado de est


análisis de sensibilidad.

Producto A
El Producto B
1

100.000^ v ........r
Valor base 60.000 £3.000 65.000 68.000 70.000

Coste A (en miles)

Figura 8.6: Análisis de sensibilidad sobre los costes de fabricación de A y B

Los posibles costes de A aparecen en el eje de abscisas y los costes de B en


el eje de ordenadas. Se observa gráficamente que para toda la región inferior la
solución óptima es la fabricación del producto B, mientras que en la superior la
óptima es la fabricación del producto A. Así, mostramos las regiones para las
que diferentes estrategias son óptimas y por esta razón a este tipo de gráficos
se les denomina de regiones de estrategias. La recta que separa ambas regiones
se llama umbral y designa indiferencia entre las alternativas adyacentes. Dicha
recta se obtiene igualando el beneficio esperado de ambos productos. Es decir,
el beneficio esperado para los productos A y B es respectivamente 0.95(400000 -
Coste A) + 0.05(-Coste A) y 0.6(750000 - Coste B) + 0.4(-Coste B), y se tiene
que cumplir que ambos sean iguales. Simplificando se obtiene la recta Coste B =
Coste A + 70000. La región superior e inferior, donde el producto A y B poseen
beneficio esperado mayor, respectivamente, se corresponde con los costes de A
y B que verifican Coste B > Coste A + 70000 y Coste B < Coste A + 70000,
respectivamente. Por ejemplo, si el coste de A es 62000 euros y el de B 124000
euros la solución óptima es la fabricación del producto B, mientras que si el coste
de A es de 65000 euros y el de B 150000 euros la solución óptima es la fabricación
del producto A. □

El decisor debe examinar la proximidad del valor base al umbral y compararla


con sus creencias sobre los valores de los dos parámetros a examen para deducir
qué posibilidades tiene la alternativa óptima de cambiar ante las variaciones de
los parámetros. En el ejemplo último, si el empresario creyese que es bastante
probable que el coste de B supere los 130000 euros, concluiría que la optimalidad
C A P ÍT U LO 8: ANÁLISIS D E SENSIBILIDAD 285
r A -M A

la alternativa “producto B” es muy sensible al valor del “coste de fabricación


j6 B” . Tal vez esta situación indicaría que hay que modelizar la incertidumbre
obre los costes con distribuciones de probabilidad.

8.6 ANÁLISIS DE SENSIBILIDAD SOBRE TRES


PARÁMETROS CONJUNTAMENTE

gste análisis es análogo a los dos anteriores sólo que ahora se consideran los
cambios de tres parámetros.

Ejemplo 8.3 (continuación)


Supongamos que el empresario está interesado en estudiar qué ocurriría si
el coste de fabricación de A variara entre 60000 y 70000 euros y el de B entre
100000 y 200000 euros, y además, que el precio de venta de B fluctuara entre
700000 y 750000 euros. La Figura 8.7 presenta los resultados de este análisis de
sensibilidad.

Producto A
15 Producto B

ci
u
OQ

.Ventas B s 700000
100.000
Valor base'✓'So.ooo 63.000 65.000 68.000 70.000

Coste A (en miles)

Figura 8.7: Sensibilidad sobre tres parámetros. Precio de venta de B = 700000 euros

La figura muestra dos regiones: en la inferior, la solución óptima es la fabri­


cación del producto B, mientras que en la superior es la fabricación del producto
A, cuando el precio de venta de B es de 700000 euros. Sin embargo, si el precio
de venta del producto B es de 750000 euros las correspondientes regiones son las
que aparecen en la Figura 8.8. Obsérvese cómo ha aumentado la región donde el
Producto B es óptimo, algo lógico teniendo en cuenta que el precio de venta de
B es mayor.
280 F U N D A M E N T O S D E LOS SIST EM A S P E A Y U D A A L A DECISIÓN © RA-MA

Coste A (en miles)

Figura 8.8: Sensibilidad sobre tres parámetros. Precio de venta de B = 750000 euros


Como puede observarse, al variar tres parámetros simultáneamente resulta
más difícil construir e interpretar los gráficos, más aún si en lugar de dos alterna­
tivas se tuvieran más. Para cuatro o más parámetros es casi imposible. La falta
de una representación gráfica dificulta entonces la estimación de la verosimilitud
de atravesar el umbral. Por ello algunos autores han basado esta verosimilitud
en el cálculo de la distancia del punto base al umbral más próximo, ver por
ejemplo, Ríos Insua y French (1991), Buckley (1988), Schneller y Sphicas (1985).
Se tienen nuevas dificultades para la elección de una métrica adecuada debido a
que las unidades de medida de los parámetros pueden no ser comparables, o por
las diferentes pero equivalentes formas de definirlos. Además, la falta de guías
establecidas para diferenciar entre “sensibilidad” e “insensibilidad” puede dar lu­
gar a una interpretación arbitraria de los resultados. En Felli y Hazen (1998) se
detallan estas cuestiones y se proponen indicadores mejores de la sensibilidad.

8.7 ANÁLISIS DE SENSIBILIDAD SOBRE LAS


PROBABILIDADES

En esta sección estudiamos el efecto que produce la variación de unos paráme­


tros concretos, las probabilidades. Los resultados reforzarán la seguridad en las
asignaciones hechas o indicarán que debemos revisarlas.
CAPITU LO 8: ANÁLISIS DE SENSIBILIDAD 287
@ RA-MA

Ejemplo 8.4
Un decisor dispone de 10000 euros para invertir. Debe decidirse entre inver­
tirlo a plazo fijo o en bolsa durante un periodo de tres años. La inversión a plazo
gjo le supondría unos intereses de 3000 euros. Sin embargo, el beneficio obtenido
en bolsa depende del comportamiento de ésta cada año (subida o bajada). Se
sabe que en el primer año la probabilidad de subida o bajada de la bolsa es la
misma. Sin embargo, la del segundo y tercer año es desconocida. Tan sólo se sabe
que el tercer año bajará sabiendo que el segundo ha subido con una probabilidad
un 20% inferior a la de bajada el tercer año sabiendo que el segundo también
bajó. Es decir, si la probabilidad de bajada de la bolsa el segundo y tercer año,
supuesto que el año anterior también bajó, es 3 y r, respectivamente, entonces
llamando s a la probabilidad de que baje en el tercer año supuesto que ha subido
en el segundo se verifica que s = 0.8r. Llamando V\,V2 y V3 a las variables que
representan el comportamiento de la bolsa el primer, segundo y tercer año, res­
pectivamente, el problema queda representado en el siguiente árbol de decisión
donde los valores finales representan las ganancias (o pérdidas) en miles de euros.

8.7.1 C o n d o s alternativas

Ahora crearemos un gráfico de sensibilidad para las probabilidades desconocidas


(? y r del Ejemplo 8.4). En general no tienen por qué ser desconocidas y quizá
sólo nos interese cambiarlas. Tal gráfico mostrará las probabilidades para las que
el valor (utilidad) esperado de una decisión es mayor que el de una segunda.
288 FUN D AM EN TO S D E LOS SISTEMAS D E A Y U D A A L A DECISIÓN © RA-M A

(continuación)
E je m p lo 8 .4
En primer lugar calculamos el beneficio esperado para la decisión “invertir en
bolsa” :

0.5{?[-10r - 5(1 - r)] + (1 - g)[4(0.8r) + 6(1 - 0.8r)]} +


+0.5{g[r + 3(1 - r)] + (1 - g)[5(0.8r) + 10(1 - 0.8r)]}.

Simplificando

q(—0.7r - 9) - 2.8r + 8.

El beneficio esperado de la decisión “invertir en bolsa” es mayor que el de


“invertir a plazo fijo” siempre que

q(—0.7r. - 9) - 2.8r + 8 > 3,

es decir,
2.8r - 5
q < —0.7r —9 ’

El gráfico de regiones de las dos estrategias es el que aparece en la Figura 8.9.


í

Figura 8.9: Sensibilidad sobre dos probabilidades

La curva que separa las dos regiones A y B, representa los valores de q y r


para los que el beneficio esperado de la decisión “invertir a plazo fijo” es igual al
de la decisión “invertir en bolsa” . Para estos valores de q y r el decisor debe sentir
indiferencia entre elegir invertir en bolsa sus 10000 euros e invertirlos a plazo fijo.
Para los valores de q y r pertenecientes a la región que hemos denotado como A el
decisor debe preferir “invertir en bolsa” a “invertir a plazo fijo” . Por el contrario,
si q y r pertenecen a B el decisor debe preferir “invertir a plazo fijo” que “invertir
en bolsa” .
Vemos de nuevo que la importancia de la Figura 8.9 está en que si el decisor
no conoce con exactitud los valores de q y r y tan sólo sabe que, por ejemplo,
CAPITULO 8: ANALISIS DE SENSIBILIDAD 289
© RA -M A

q g [0.15,0.25] y r G [0.3,0.4], rectángulo que contiene a A en la Figura 8.9,


entonces observando la gráfica se puede ver que la decisión que debe tomar es
“invertir en bolsa”' al estar el rectángulo completamente contenido en la región
A. La decisión no es sensible a la asignación de las probabilidades. Sin embargo,
si el decisor cree que son razonables los valores q G [0.25,0.42] y r G [0.48,0.6], el
otro rectángulo de la Figura 8.9, dependiendo de los valores que tomen q y r será
aconsejable una decisión u otra. En este caso, la decisión óptima no está clara y
el decisor debería reflexionar sobre dichas probabilidades hasta que consiga que
el rectángulo esté completamente incluido en la región A o en la región B. □

Resumiendo, podemos decir que el valor de este gráfico está en que propor­
ciona una guía para determinar cuánto esfuerzo es necesario para modelizar la
incertidumbre en un problema de decisión. Desde otro punto de vista, el gráfico
puede revelar si la decisión es sensible a la incertidumbre en el problema y a la
modelización de esta incertidumbre. •

8.7.2 Con tres alternativas

En el Ejemplo 8.4 (y en los anteriores) hemos considerado únicamente dos alter­


nativas: invertir en bolsa o invertir a plazo fijo. Debido precisamente a esto el
gráfico tiene dos regiones. Ilustramos con el siguiente ejemplo qué sucede cuando
existen tres alternativas.

Ejemplo 8.5
Sea el mismo decisor del Ejemplo 8.4 que desea invertir sus 10000 euros. Sin
embargo, supongamos ahora que la inversión la quiere hacer a un solo año y tiene
tres opciones: a plazo fijo, en bolsa con bajo riesgo y en bolsa con alto riesgo.
Supongamos también que las probabilidades del comportamiento de la bolsa son
desconocidas. En el siguiente árbol de decisión representamos el problema.
200 F U N D A M E N T O S D E LO S S IS T E M A S D E A Y U D A A L A D E C IS IÓ N © R A -M A

Pora construir el gráfico de regiones de estrategias, debemos comparar las


alternativas dos a dos. Primero comencemos comparando “invertir a plazo fijo”
con “invertir en bolsa con bajo riesgo” y veamos para qué valores de p y q ]a
primera alternativa es mejor que la segunda:

500 > -lOOp + 200? + 1000(1 - p - q ).

Resolviendo para q en función de p obtenemos

5 11
q > s - J p-
En la Figura 8.10 la región A representa los valores de p y q para los que “invertir
a plazo fijo” es mejor que “invertir en bolsa con bajo riesgo” . Obsérvese que los
posibles valores que pueden tomar p y q son los que aparecen en el triángulo y
no en el cuadrado del Ejemplo 8.4 ya que p + q < 1.

Figura 8.10: Regiones de optimalidad de dos alternativas

Ahora comparemos “invertir en bolsa con bajo riesgo” e “invertir en bolsa


con alto riesgo” . El beneficio esperado de “invertir en bolsa con bajo riesgo” es
mayor que el de “invertir en bolsa con alto riesgo” cuando

—lOOp + 200q +1000(1 —p — q) > —1000p + 100g + 1600(1 —p — q).

Resolviendo para q en función de p obtenemos

6 15
? > 7 - y ¡>-

En la Figura 8.11 la región BCDG representa los valores de p y q para los


que “invertir en bolsa con bajo riesgo" es mejor que “invertir en bolsa con alto
@ R A -M A C A P ÍT U L O 8: ANÁLISIS D E SENSIBILIDAD 291

riesgo” . La línea discontinua que aparece en la Figura 8.11 es la obtenida en


el paso anterior (en la Figura 8.10). Por tanto, en la región BCDFH la mejor
alternativa es “invertir a plazo fijo” y la peor “invertir en bolsa con alto riesgo” .
Sin embargo, en la región OAHG ocurre todo lo contrario, por lo que la mejor
alternativa consiste en “invertir en bolsa con alto riesgo” y la peor en “invertir
a plazo fijo” . En la región ABH la alternativa “invertir a plazo fijo” es mejor
que “invertir en bolsa con bajo riesgo” , mientras que “invertir en bolsa con bajo
riesgo” es peor que “invertir en bolsa con alto riesgo” . En la región FGH lo mejor
es “invertir en bolsa con bajo riesgo” .

Figura 8.11: Regiones de optimalidad para tres alternativas

Si el decisor estuviera seguro de que los valores de p y q no pertenecen a la


región ABH podríamos dar por finalizado el análisis de sensibilidad, ya que en
cualquiera de las otras regiones sabemos cuál es la alternativa más preferida. Si
no fuera el caso o estuviésemos interesados en completar la gráfica comparando
las alternativas “invertir a plazo fijo” e “invertir en bolsa con alto riesgo” se
procedería de forma análoga a los casos anteriores, es decir, el beneficio esperado
de “invertir a plazo fijo” es mayor que el de “invertir en bolsa con alto riesgo”
cuando

500 > —lOOOp + 100g +1600(1 - p - q ) .

Resolviendo para q en función de p obtenemos

11 26
I E H
En la Figura 8.12, en la subregión ALH de la región ABH la alternativa mejor
ahora es “invertir en bolsa con alto riesgo” , mientras que en LBH lo mejor es
‘invertir a plazo fijo” .
292 F U N D A M EN T O S D E LOS SIST EM AS D E AYU D A A LA DECISIÓN
© R A -M A

Figura 8.12: Regiones de optimalidad para tres alternativas (continuación)

Con el análisis completo el decisor puede pensar en qué valores pueden tomar
P Y Q y elegir aquella alternativa que tenga un mayor beneficio esperado. □

8.8 VALOR DE LA INFORMACIÓN


En problemas de decisión con incertidumbre los decisores, a veces, pueden re­
copilar información con la intención de reducir la incertidumbre. Esta recopi­
lación puede ser realizada consultando a expertos, realizando análisis estadísticos
o matemáticos, investigando, o simplemente leyendo libros, revistas y periódicos.

Ejem plo 8.5 (continuación)


Consideremos el Ejemplo 8.5 con p = 0.2 y q = 0.3. Es decir, consideremos
el problema de decisión representado por el árbol de decisión o el diagrama de
influencia de la Figura 8.13. La decisión óptima es invertir en bolsa con alto
riesgo.

Figura 8.13: Árbol de decisión y diagrama de influencia para el Ejemplo 8.5


.... CAPÍTULO 8: ANÁUHIB DE 8 BNfWilLIDAD W,
@ RA-MA______________ _______________________ — ---------------------— ------- • -

En el Ejemplo 8.5 el comportamiento del mercado es incierto y tul vez f e


obtiene la citada solución óptima porque el decisor es optimista «obre lo q u e
hará el mercado. Sin embargo, si existiese la posibilidad de saber el verdadero
comportamiento del mercado podría ser de una gran utilidad conocer eJ valor
que tiene esa información o cuánto se estaría dispuesto a pagar por ella. En al
siguiente apartado tratamos este tema.

8.8.1 Valor esperado de la información perfecta

Supongamos que el decisor pudiera consultar a un experto con información per­


fecta (como un clarividente), entendiendo que la información proporcionada por
un experto es perfecta si siempre es correcta. Entonces, el valor esperado de la
información perfecta es la diferencia entré lo que se espera ganar haciendo uso de
esa información y lo que se espera ganar sin utilizar tal información. Ilustrémoslo
con el Ejemplo 8.5.

Ejemplo 8.5 (continuación)


Disponer de información perfecta significa que el decisor conoce lo que sucede­
rá en el mercado antes de que se decida por la forma de inversión. Es decir, supone
considerar en el diagrama de influencia de la Figura 8.13 el arco que va desde el
nodo de azar “Mercado” al nodo de decisión “Inversión” , ver Figura 8.14.

Figura 8.14: Diagrama de influencia con información perfecta

Resolviéndolo obtenemos que la solución óptima tiene un beneficio esperado


de 1050 euros. Recordemos que el diagrama de influencia de la Figura 8.13 daba
la solución de 630 euros. Por tanto, lo que se espera ganar con la utilización de la
información perfecta es 1050 —630 = 420 euros y es por tanto la cantidad máxima
que el decisor estaría dispuesto a pagar al experto por la información perfecta. Es
decir, si adquirir la información perfecta nos cuesta menos de 420 euros interesará
obtenerla, en otro caso, no. El árbol de decisión que se corresponde con este
estudio es el que aparece en la Figura 8.15. Incluye la oportunidad de obtener
información perfecta. Y ésta es la alternativa mejor incrementando el beneficio
esperado en 420 euros. Ahora no siempre decidirá invertir en bolsa con alto riesgo
sino que dependerá de lo que diga el experto. El 50% de las veces dirá que el
mercado no sube y entonces el decisor invertirá a plazo fijo.
294 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

-1000
100

1600

-100
200

100

500

-1000
-100
500
100
200
500
1600
100
500

Figura 8.15: Árbol de decisión con la alternativa de información perfecta

8.8.2 Valor esperado de la información

El concepto de valor esperado de la información fue introducido por Howard


(1966). La información perfecta es la mejor situación posible. Nada puede ser
mejor que resolver toda la incertidumbre de un problema. Cuando toda la incer­
tidumbre queda resuelta, para cada estado conocemos cuál será el resultado. Así,
el valor esperado de la información perfecta proporciona una cota superior para el
valor esperado de la información. Por tanto, el valor esperado de cualquier fuente
de información está comprendido entre cero y el valor esperado de la información
perfecta.
La motivación para estudiar el valor de la información es examinar situa­
ciones en las que la información está disponible y mostrar cómo tomar decisiones
sistemáticamente respecto a qué fuente de información seleccionar y cuánta infor­
mación de un experto puede merecer la pena. Estrictamente hablando, esto es lo
que puede hacer el análisis del valor de la información. Pero también desempeña
un papel sutil y elegante en la estructuración de decisiones y en el proceso com­
pleto del Análisis de Decisiones de desarrollar un modelo de decisión requisito.
Efectivamente, ya hemos visto que entre los pasos que debemos seguir para rea­
lizar el análisis de sensibilidad está: encontrar los parámetros más sensibles a
CAPÍTULO 8: ANÁLISIS DE SENSIBILIDAD 295
© r a -m a

las decisiones haciendo uso de los diagramas tornado (estas variables pueden re­
querir una modelización probabilística), así como aplicar análisis de sensibilidad
sobre las probabilidades. Un paso posterior en la estructuración de un modelo
probabilístico será calcular el valor esperado de la información perfecta para cada
suceso incierto. Este análisis indicaría dónde el analista o decisor tendría que cen­
trar sus efuerzos en el proceso de modelización. Es decir, si el valor esperado de la
información perfecta es muy pequeño para un suceso, entonces tiene poco sentido
emplear mucho esfuerzo en reducir la incertidumbre recopilando información. Sin
embargo, si el valor esperado de la información perfecta es relativamente grande,
merece la pena realizar el esfuerzo para recoger la información relativa al suceso.

8.8.3 Valor esperado de la información imperfecta

En la práctica es raro que tengamos acceso a información perfecta, pues nuestras


fuentes de información usualmente están sujetas a un error considerable.

Ejemplo 8.5 (continuación)


Supongamos que el decisor contrata a un economista especializado en predecir
tendencias del mercado. Su información es imperfecta porque puede cometer
errores. La tabla siguiente caracteriza sus aciertos en términos probabilísticos:

Verdadero estado del mercado


Economista Sube Se mantiene Baja
predice
Sube 0.8 0.15 0.2
Se mantiene 0.1 0.70 0.2
Baja 0.1 0.15 0.6

Podemos ver que el economista es mejor cuando el mercado sube y es más


probable en cambio que cometa errores cuando el mercado baja. El nuevo dia­
grama de influencia, ver Figura 8.16, incluye un nodo de azar representando las
predicciones del economista. Su distribución de probabilidad asociada es precisa­
mente la de la tabla anterior.

Figura 8.16: Diagrama de influencia con información imperfecta


200 FUNDAMENTOS OB LOS SISTEMAS 1)10 AYUDA A LA DECISIÓN____________ © R A -M A

La solución de oslo diagrama da un beneficio máximo esperado de 862.44


ouroa. La diferencia con los 030 euros obtenidos sin información (Figura 8.13)
nos proporciona el valor esperado de la información imperfecta, 232.44 euros.
Con el árbol do decisión so procedería análogamente. Por tanto, el decisor nunca
querría pagar más do 232.44 euros por la predicción del economista, □

8.9 DISCUSIÓN

En este capítulo, dedicado al análisis de sensibilidad en problemas de decisión,


hemos comenzado resaltando su importancia en la identificación y estructuración
del problema, continuando con consideraciones de dominancia con el objetivo de
reducir el conjunto de soluciones de interés para el decisor. Posteriormente se ha
estudiado la influencia en la solución óptima debida a cambios en los valores de
uno, dos o tres parámetros conjuntamente, finalizando con la consideración de
información parcial sobre las creencias del decisor. Respecto a esto último, puede
existir información parcial también sobre las preferencias del decisor. Es decir,
las preferencias y creencias no son representadas con valores concretos sino, por
ejemplo, con intervalos de valores. Ríos Insua y Martín (1994) muestran la necesi­
dad de estudiar la sensibilidad conjunta de probabilidades y utilidades. También
en los diagramas de influencia bajo información parcial (Bielza, Ríos Insua y
Ríos-Insua, 1996) que permiten representar restricciones sobre las utilidades y
probabilidades indicando imprecisión. Se obtienen estrategias no dominadas co­
mo primer paso hacia el desarrollo de una aproximación al análisis de sensibilidad
en diagramas de influencia, un tema en el que aún falta mucho por hacer. Fertig
y Breese (1993) y Kim y Lee (2000) también tratan los diagramas de influencia
imprecisos, los primeros modelizando con intervalos y los segundos usando redes
neuronales en la construcción del diagrama.
En Martín, Bielza y Ríos Insua (1995) se consideran problemas continuos
de decisión con preferencias y creencias imprecisas dando una aproximación del
conjunto de soluciones no dominadas mediante técnicas de simulación. Sirve
también para el caso de precisión pero equivale a un método de búsqueda aleatoria
pura.
En ambiente de certidumbre ocurre lo mismo: en ciertos problemas de decisión
existe información parcial sobre las preferencias del decisor tanto en los pesos
como en las funciones de valor de cada atributo, teniendo un intervalo de posibles
pesos y una clase de funciones de valor. Por tanto, en el análisis de sensibilidad
deben tratarse ambas imprecisiones. Para ver el tratamiento de estos problemas
puede consultarse Gallego et al. (1998), Ríos-Insua et al. (1999) y Mateos, Ríos-
Insua y Gallego (2001).
Para terminar citaremos otras referencias interesantes. Los libros de Ríos
Insua y Ruggeri (2000) y Saltelli, Chan y Scott (2000) contienen mucha informa-
@ R A -M A C A P ÍT U LO 8: ANÁLISIS D E SEN SIBILID A D 207

ción (y reciente) sobre análisis de sensibilidad. El libro de Walley (1091) es una


referencia obligada para el tema de imprecisión.
Felli y Hazen (1999) muestran una relación entre el diagrama tornado y el
valor esperado de la información. Otros temas son, por ejemplo, el análisis de
sensibilidad mediante simulación (por ejemplo, Butler, Jia y Dyer, 1997; Doubilet
et al., 1985) y el análisis de sensibilidad de redes bayesianas que está bastante
desarrollado (por ejemplo, Coupé et al., 1999) por ser más sencillo que en otros
modelos gráficos como los diagramas de influencia.

8.10 EJERCICIOS

8.1 Una empresa de fabricación de ordenadores está planificando la producción


del próximo año. Se estima que la demanda puede ser de 100, 200 ó 300
ordenadores con probabilidades 0.2, 0.6 y 0.2, respectivamente. El coste de
fabricación de cada ordenador es de 1000 euros. Sin embargo, el precio de
venta es de 10000 euros. De años anteriores se sabe que la probabilidad de
que un ordenador vendido sea defectuoso es 0.1. Solucionar el defecto le
supone a la empresa 100 euros por ordenador defectuoso. Si la producción
no satisface la demanda, entonces por cada unidad no satisfecha supone
a la empresa un coste de 10 euros. El empresario desea saber cuál de
las alternativas, fabricar 100, 200 ó 300 ordenadores, le proporcionaría un
mayor beneficio esperado. También está interesado en estudiar el cambio
que se produciría en el beneficio esperado:

(a) si en lugar de ser 20000 euros, el coste de venta de 200 ordenadores


defectuosos de los 300 producidos variara entre 15000 y 30000 euros;
(b) si en lugar de ser 10000 euros, el coste de venta de 100 ordenadores
defectuosos de los 100 producidos variara entre 9000 y 10500 euros;
(c) si en lugar de ser 300000 euros, el coste de fabricación de 300 orde­
nadores variara entre 250000 y 300000 euros.

8.2 Considerar el ejercicio anterior suponiendo que la probabilidad de que un


ordenador vendido esté defectuoso no es conocida. Llamar a esta probabi­
lidad p y a su complementaria q. Mostrar en el plano, representando en el
eje de abscisas los valores de p y en el eje de ordenadas los valores de q, las
regiones de valores de p y q donde fabricar 100, 200 y 300 ordenadores sean
las mejores soluciones.

8.3 Una persona desea comprarse un coche. Los objetivos que van a influir en
su decisión son los que aparecen en la siguiente jerarquía de objetivos:
298 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © R A -M A

Para los objetivos del nivel inferior se han obtenido las funciones de va­
lor v\,V2,V3 ,Vi y V5, respectivamente, que representan las preferencias del
decisor. En la siguiente tabla aparecen las diferentes alternativas con los
valores que toman en cada una de las funciones de valor.
Coche Vi v2 V3 n V5
Seat 1 0 0.5 0.7 0.4
Peugeot 0.5 0.5 0.6 1 0.5
Mercedes 0 1 0.9 0.8 1
Audi 0.2 0.8 1 0.9 0.9
Fiat 0.7 0.5 0.8 0.6 0.5
La función de valor global del decisor es v(-) = w iV i(-)+w 2v2(-)+W 3V3 (-) +
W4V4(-) + w 5v5(-) con Wi = 0.4, w 2 — 0.2, w 3 = 0.1, W4 = 0.1 y ws = 0.2.
Se desea saber qué coche debería comprar y cuál es la ordenación según
sus preferencias de las distintas marcas. Sabiendo que la suma de los pesos
debe ser la unidad y que si se aumenta un peso el resto disminuye de forma
proporcional, calcular los valores que puede tomar w\ para que la alternativa
más preferida continúe siéndolo. Hacer lo mismo para w2, 103, w± y 105.

8.4 Considerar el ejercicio anterior y suponer que w\ e [0.35,0.55], w2 6


[0.15,0.25], 103 £ [0.05,0.15], 6 [0.05,0.25] y w s e [0.15,0.25]. Calcular el
conjunto de soluciones no dominadas. Dentro de éste, el de potencialmente
óptimas y el de potencialmente óptimas adyacentes a la óptima.

8.5 Un persona puede ir a su trabajo por tres carreteras diferentes A, B y C. El


tiempo que tarda en llegar depende del estado de la carretera que puede ser
congestionada, normal o muy fluida. Las probabilidades de que la carre­
tera A esté en cada uno de los estados son 0.1, 0.3 y 0.6, respectivamente,
mientras que para B son 0.4, 0.2 y 0.4, respectivamente. Sin embargo, las
probabilidades para C son desconocidas. Se sabe que si toma la carretera
A y el tráfico está congestionado, normal o muy fluido el tiempo necesario
para llegar al trabajo es 5, 3 y 2 horas, respectivamente. Si se toma la
carretera B los tiempos son 4.5, 4 y 1 horas, respectivamente. Si se toma
la carretera C los tiempos son 4, 3.5 y 1.
c a p i t u l o 8: ANÁLISIS DE SENSIBILIDAD 299
©R e ­

(a) ¿Qué relación debe haber entre la probabilidad de que la carretera C


esté congestionada y la probabilidad de que esté normal para que el
decisor deba tomar la carretera C si desea tardar lo menos posible (en
media) en llegar a su trabajo?
(b) ídem para que la persona deba tomar la carretera A.
(c) ¿Es aconsejable el uso de la carretera B en algún caso?

g.6 Considerar el ejercicio anterior y suponer que la probabilidad de que la


carretera C esté congestionada y normal sea 0.5 y 0.1, respectivamente. Si
en lugar de suponer que el tiempo necesario para llegar al trabajo por la
carretera B con tráfico muy fluido es 1, suponemos que puede variar entre
0.5 y 2 horas, representar gráficamente las soluciones óptimas para cada
valor de ese intervalo.

8.7 Considerar el ejercicio anterior .pero suponer además que el tiempo necesario
en llegar al trabajo no sólo depende del estado del tráfico de la carretera
por donde se circula sino también del estado de ánimo del conductor, que
puede encontrarse en tres niveles: alto, medio y bajo con probabilidades
0.7, 0.2 y 0.1, respectivamente. Si el estado de ánimo del conductor es alto,
el tiempo que tarda en llegar se reduce en un 20%; si es medio, el tiempo
ni se reduce ni aumenta, y si es bajo aumenta en un 30%. Obtener un
diagrama tornado variando en un intervalo de longitud 1 todos los posibles
tiempos para llegar al trabajo con el fin de ver el efecto sobre el tiempo
total esperado.

8.8 Considerar el Ejercicio 6.10 (Capítulo 6). Se pide:

(a) Mostrar el perfil de riesgo asociado con la estrategia óptima. Dibujar


el perfil acumulado.
(b) Considerar la decisión óptima de qué test (si se hace alguno) realizar
antes de decidir si se compra el coche (con o sin garantía) o no. Evar
luar la sensibilidad de esta decisión al coste de cada test. Mostrarla
sobre un gráfico del beneficio esperado frente a cada coste indicando
la alternativa (no test, ti, t2, tz) preferida en cada caso.

8.9 En el ejemplo del helicóptero (Capítulos 5, 6 y 7), calcular el valor del coste
de la prueba que se estaría dispuesto a pagar por hacer dicha prueba.

8.10 Construir y resolver el árbol de decisión del Ejemplo 8.5 con información
imperfecta.

8-ll Considerar el Ejercicio 5.8 (Capítulo 5). Suponer que ahora u(pi,ai) = 80
en vez de 100. ¿Cambia la alternativa óptima? Calcular el valor esperado
de la información perfecta del estado del tráfico T señalando el significado
de ese valor.
CAPÍTULO 9

DECISIONES DE GRUPO

A t r a v é s d o l o s a n t e r i o r e s c a p í t u l o s d e l lib r o h e m o s d is c u t id o lo s p ro b le m a s d e
d e c is ió n esen cialm en te d e s d e e l p u n t o d o v i s t a d e u n ú n ic o d e c is o r , Biendo s u o b je ­
t i v o f u n d a m e n t a l l a u t i l i z a c i ó n d o l A n á l i s i s d e D e c is io n e s p a r a m e jo r a r ol p r o c e s o
d e d e c i s i ó n . C o r n o l i e m o s v i s t o , l a s e n t r a d o s m á s im p o r t a n t e s p a r a la fo rm u la c ió n
y s o l u c i ó n d e l p r o b l e m a s o n , p o r u n a p a r t e , l a m o d e liz a c ió n c u a lit a t iv a y b ú s q u e ­
d a d e s o l u c i ó n a t r a v é s d e l a e s t r u c t u r a c i ó n d e l p r o b le m a m e d ia n te , p o r e je m p lo ,
un á r b o l d o d e c is ió n o un d i a g r a m a d e in f lu e n c ia , y p o r o tr a , la m o d e liz a c ió n
c u a n t i t a t i v a r e f e r i d a a l a a s i g n a c i ó n d e c r e e n c ia s m e d ia n t e p r o b a b ilid a d e s y d e
p r e f e r e n c i a s m e d i a n t e f u n c i o n e s d e v a l o r o u t i lid a d .

A u n q u e n o s h e m o s c e n t r a d o e n p r o c e s o s d e d e c is ió n in d iv id u a le s , e x is te n n u ­
m e r o s o s p r o b l e m a s i m p o r t a n t e s e n l o s q u e la s d e c is io n e s d e b e n s e r to m a d a s n o
s o la m e n te p o r un in d iv id u o s i n o p o r g r u p o s d e in d iv id u o s , q u e p o s e e n in fo r­
m a c ió n r e l e v a n t e s o b r o e l p r o b l e m a e n c u e s t i ó n y q u e d e b e n te n e r s e e n c u e n ta
c o n ju n ta m e n te e n l a d e c is i ó n fin a l. P a r e c e c l a r o q u e , e n g e n e r a l, lo s in d iv id u o s
d e u n g r u p o t e n d r á n d i f e r e n t e s c r e e n c i a s , p r e f e r e n c ia s y p e r c e p c io n e s s o b re un
m is m o p r o b l e m a , d e m o d o q u e e l o b j e t i v o q u e n o s p la n t e a m o s e n e s te c a p ítu lo es
t r a s l a d a r a u n c o n t e x t o d e g r u p o l o s p r i n c i p i o s d e d e c i s i ó n q u e h e m o s d e s a rr o lla d o
a n iv e l in d iv id u a l. E s d e c i r , s i d i f i e r e n l a s o p in io n e s y v a lo r e s d e lo s in d iv id u o s ,

¿ c ó m o p o d r í a n r e s o l v e r s e o c o n j u g a r s e t a l e s d if e r e n c ia s ?

R e s u l t a o b v i o q u e u n g r u p o d e p e r s o n a s i m p l i c a d a s e n u n p r o c e s o d e d e c isió n

a p o r t a r á n s u s c o n o c i m i e n t o s , e x p e r i e n c i a y c r e a t i v i d a d d e m o d o q u e l a p o s ib ilid a d

d e p a s a r p o r a l t o c i e r t o s s u c e s o s o a lte r n a tiv a s s e rá m en or q u e en el caso de un

ú n ic o i n d i v i d u o . R e a l m e n t e , l a s i n e r g i a d e l c o n j u n t o d e in d iv id u o s q u e fo r m a n e l

g r u p o p o d r í a c o n d u c i r a u n a m a y o r c a l i d a d d e l a d e c i s i ó n q u e l a s im p le s u m a d e

la s p a r t e s i n d i v i d u a l e s .

E n e s t e c a p í t u l o d e s c r i b i r e m o s d i f e r e n t e s f o r m a s d e c o m b in a r lo s j u ic io s in d i­

v i d u a l e s p a r a a l c a n z a r u n j u i c i o d e g r u p o . E s e n c i a l m e n t e o l e n f o q u e b á s ic o d e e s te

P ro b le m a d e d e c i s i ó n d e g r u p o s e d e n o m in a d e agregación de comportamientos y

c o n d u c i r á a j u i c i o s d e g r u p o a p a r t i r d e l a c o m u n i c a c i ó n e n t r e s u s m ie m b r o s e n
302 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © R A -M A

procesos de discusión que pueden ir desde la consideración de discusiones abiertas


hasta procesos de comunicación más o menos estructurados entre sus miembros.
Una ventaja interesante que surge en la obtención de los juicios de grupo es
que en general se tendrá mayor información sobre los recorridos de las utilidades
y probabilidades, pudiéndose utilizar para llevar a cabo un posterior análisis de
sensibilidad y ver el efecto sobre la decisión tomada. También la participación de
un conjunto de personas implicadas en un mismo problema podrá tener una mayor
entrega hacia el proceso de implementación de la decisión que eventualmente se
alcance.
Comenzaremos introduciendo el problema de agregación de ordenaciones in­
dividuales mostrando el resultado central que constituye el Teorema de Imposi­
bilidad de Arrow con algunas de siis críticas y objeciones que han sido una moti­
vación importante para el desarrollo de otros procedimientos, como los estudiados
en la siguiente sección, basados en la agregación de juicios sobre preferencias. A
continuación expondremos métodos de agregación de comportamientos no estruc­
turados y estructurados, y que sirven para motivar el procedimiento denominado
conferencia de decisión. Finalmente estudiaremos problemas que requieren nego­
ciaciones para su posible resolución.

9.1 AGREGACIÓN DE ORDENACIONES


INDIVIDUALES

Una forma obvia de que un grupo alcance decisiones se consigue mediante algún
tipo de votación. Sin embargo, esto puede conducir a resultados paradójicos
como mostraremos con una serie de ejemplos, comenzando con el procedimiento
de votación más sencillo y utilizado que es la regla de la mayoría simple.
Consideremos un problema en el que participan tres directivos de una empresa
que pretenden llegar a un acuerdo sobre cuál sería el lugar más adecuado para
situar una nueva filial. Hay disponibles tres posibles localizaciones a, b y c, y los
tres directivos establecen sus respectivas preferencias (donde y i corresponde a la
preferencia estricta del individuo ¿ = 1,2,3) dadas por

Individuo Preferencia
1 o >~i b c
2 b >-2 c >~2 a
3 cy^gy^b

Entonces, utilizando la relación y g para indicar la preferencia estricta del grupo,


la regla de la mayoría simple conduciría a que

a y g b, ya que dos de los tres individuos prefieren o a 6


b y g c, ya que dos de los tres individuos prefieren b a c
c yga ya que dos de los tres individuos prefieren c a á
© R A-M A CAPÍTULO !): DECISIONES DE CHUPO__ 303

¡ y tendríamos que a y g b >-g c pero también c y g o, que indica que las preferen­
cias del grupo no son transitivas. Por tanto, la regla de la mayoría simple puede
conducir a preferencias de grupo no transitivas, resultado que se conoce como
paradoja de Condorcet.
En muchas situaciones prácticas es rara la comparación simultánea de todas
las alternativas, siendo por ello muy poco utilizada la citada regla de la mayoría.
En su lugar, se consideran comparaciones secuenciales, es decir, se comparan
pares de alternativas cada vez. Por ejemplo, el grupo podría comparar primero
a y b, eliminar la peor alternativa y comparar la alternativa preferida con c.
Es decir, el grupo elegiría c, ya que de los tres individuos dos preferirían a a
b, y a continuación de los tres individuos dos preferirían c ao . Sin embargo,
si el grupo comenzara considerando la elección entre b ye, entonces b sería la
más preferida y al compararla con a, sé obtendría la alternativa a como la más
preferida. Finalmente, si se comenzara con la comparación de o y c, entonces b
sería la más preferida.
Por tanto, la alternativa que fuera seleccionada con este procedimiento de
comparaciones pareadas simplemente quedaría determinada por el orden en que
las alternativas fueran consideradas y no por las preferencias de los miembros del
grupo. Este tipo de dificultades u objeciones llevaron a Arrow (1951) a plantearse
si existiría un método satisfactorio para determinar preferencias de grupo cuando
las preferencias de sus miembros se expresan mediante ordenaciones. Propuso
seis condiciones que consideró debía cumplir un procedimiento satisfactorio.
Veamos tales condiciones y, para ello, consideremos un grupo de n individuos
cada uno con su orden de preferencia £i, i = 1, ...,n, con orden de prefe­
rencia para el grupo. Arrow se planteó el problema de cómo debería formarse
la ordenación de a partir de ordenaciones individuales Con tal
objetivo sugirió los siguientes axiomas que codifican los requisitos mínimos de
justicia, equidad y racionalidad, pero que desafortunadamente mostró que eran
mutuamente contradictorios. Los axiomas son:

Axioma 1. (O rden débil) Los órdenes £ i, .„, y son órdenes débiles.

Axiom a 2. (N o trivialidad) El grupo posee al menos dos miembros (n > 2)


y hay al menos tres alternativas.

Axiom a 3. (D om in io universal) está definido siempre que lo estéu


y, y
' V i ) •••) n-jTl'

Parece razonable suponer que la preferencia de grupo esté definida siempre que lo
estén las preferencias individuales, sin que exista la posibilidad de quo ol proceso
de votación termine sin un resultado definitivo.

Axiom a 4. (In depen dencia de alternativas irrelevantes) Si se dejan de


considerar una o más alternativas y las relaciones de preferencia para ¡os restantes
304 FUN D AM EN TOS D E LOS SISTEMAS D E AYU D A A L A DECISIÓN © R A -M A

alternativas permanecen invariantes para todos los miembros del grupo, entonces
la preferencia de grupo para las restantes alternativas debería ser idéntica a la
preferencia original de grupo para esas mismas alternativas.
Este axioma exige que la preferencia de grupo entre dos alternativas no debería
depender de la presencia o ausencia de cualesquiera otras alternativas. Obsérvese
que la hipótesis de independencia de alternativas irrelevantes no siempre se da
trivialmente, como se puede comprobar con la aplicación de la regla de conteo de
Borda, ver French (1986) y Ejercicio 9.7.

Axioma 5. (Principio de Pareto para preferencias estrictas) Si cada


individuo considera a b, entonces a y g b.
Esto significa que si cada miembro de grupo prefiere una determinada alternativa
a otra, entonces ésa debe ser la preferencia de grupo, enfatizando el papel esencial
que tiene la unanimidad dentro de una democracia.

Axioma 6. (No dictadura) No existe ningún individuo cuyas preferencias


se conviertan automáticamente en preferencias del grupo independientemente de
las preferencias de los otros miembros.
Este último axioma afirma que no existe un dictador, es decir, que ningún indi­
viduo será capaz de imponer sus preferencias al grupo.

El famoso Teorema de Imposibilidad de Arrow establece que los axiomas


1-6 son mutuamente inconsistentes, es decir, que no es posible que se constituya
un grupo de individuos (con ningún procedimiento de agregación) que satisfaga
simultáneamente todas las suposiciones. Formalmente establecemos:

Teorema 9.1 (de Imposibilidad de Arrow)


No existe un grupo de individuos que permita definir a partir de £ i, ...,^n
de modo que sea consistente con los Axiomas 1-6.

No daremos aquí una demostración del teorema, que se puede ver en Arrow
(1951) o French (1986), pero sí algún comentario relativo a él, ya que ha atraído
la atención de muchos investigadores. Obsérvese en primer lugar que el teorema
no afirma que para todo posible grupo y para toda decisión de ese grupo al menos
uno de los axiomas no debe cumplirse, sino que para cada grupo existe al menos
un conjunto de posibles preferencias individuales tal que la construcción de
no verifica al menos uno de los axiomas. Así, sugiere que es imposible obtener
un sistema verdaderamente democrático para resolver las diferencias de opinión,
de manera que cualquier método que se proponga tendrá algún inconveniente.
A la vista de este resultado muchos autores se han preguntado si sería posible
idear algún procedimiento que sea razonablemente aceptable. Uno de ellos, Ferrel
(1985), argumenta que el procedimiento denominado votación por aprobación en
que los individuos del grupo votan a favor de todas las alternativas que consideran
al menos aceptables y el grupo a continuación elige la opción que reciba el mayor
número de votos, es sencillo y robusto, Como se puede observar, el método es
tan excesivamente simple que ignora las preferencias individuales. Sin embargo,
como contrapartida, se tiene un procedimiento que evita ciertos resultados o
situaciones paradójicas que han mostrado otros procedimientos. En todo caso
parece interesante la consideración de métodos que tengan en cuenta las prefe­
rencias individuales y eso es lo que estudiaremos en la siguiente sección.

9.2 AGREGACIÓN DE JUICIOS SOBRE


PREFERENCIAS

Como habíamos indicado, el Teorema de Imposibilidad de Arrow se refiere a


situaciones en que los individuos han propuesto únicamente su orden de prefe­
rencia sobre las alternativas disponibles. Sin embargo, si tales individuos además
establecen una intensidad de preferencia entre los pares de alternativas, lo que
podría medirse mediante una función de valor en el caso de certidumbre o median­
te una función de utilidad en situaciones de incertidumbre, puede aprovecharse
de forma adecuada tal información adicional para intentar alcanzar una decisión
para el grupo, a la que se podría llegar agregando los valores o utilidades de los
individuos del grupo. El problema que conlleva tal agregación es el de la com­
paración de las intensidades de preferencia de los diferentes individuos del grupo.
Por ejemplo, supongamos dos amigos, María y Juan, que tienen que escoger en­
tre tres destinos para pasar las vacaciones juntos: Roma, París o Londres. Ya
que ambos deben elegir entre los tres posibles destinos, establecen para ello sus
preferencias relativas. Tales preferencias se muestran en la Tabla 9.1, dentro de
una escala de 0 a 10, en la que 0 representa la asignación menos preferida y 10
la más preferida. Obsérvese que la intensidad de preferencia que muestra María
respecto de ir a Roma en vez de a París es sensiblemente mayor que la de ir a
París respecto a ir a Londres.

Tabla 9.1: Preferencias mostradas

Destino María Juan


Roma 10 6
París 3 ■ 10
Londres 0 0

Si nos basamos, por ejemplo, en el promedio de valoraciones pura la elección


de destino, el mayor corresponde a Roma con valor 8, siendo ésta por tanto la
elección de grupo. Sin embargo, esta solución asume que el movimiento en la
escala de valor de 0 a 10 de María representa el mismo incremento en preferencia
306 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © RA-MA

que si nos movemos de 0 a 10 en la de Juan. Pero esto no será en general así


sino que debería considerarse una escala común de intensidad de preferencia tal
com o se muestra en la Figura 9.1, donde podem os ver que a M aría le preocupa
menos un movimiento de su mejor a su peor elección que a Juan.

io - - 1 0 ~ r París

9 --
8 --
7 --
6 --
5 -- 10 T Roma

4 --
3 --
' -2 .
1 --
o
Escala de valor Escala de valor Escala de valor
común deMaria de Juan

Figura 9.1: Medidas de valor individuales frente a una escala común

Los valores de ambos individuos medidos en una escala común serían los que
se muestran en la Tabla 9.2. Puede verse que ahora el mayor promedio, que es
5.75, correspondería a París, siendo por tanto la elección de grupo.

Tabla 9.2: Preferencias en una escala común

Destino María Juan


Roma 5 6
París 1.5 10
Londres 0 0

Como observamos, la solución propuesta conlleva una comparación de las


intensidades de preferencia entre ambos individuos. Nos preguntamos si esto es
posible. French (1986) indica diferentes formas en que en un nivel teórico esto
podría llevarse a cabo. Sin embargo, muestra también que la dificultad práctica
es notable. En todo caso, resulta claro que en ausencia de cualquier método obvio
que permita hacer comparaciones de intensidades de preferencia entre individuos,
la búsqueda de una función de valor o de utilidad de grupo será en vano. No
obstante, su obtención podría ser una ayuda importante para que los miembros
del grupo clarifiquen sus visiones personales del problema y comprendan mejor
los puntos de vista de los restantes miembros y con ello puedan lograr una mejor
decisión final.

9 .2 .1 Función de valor de grupo

En esta subsección se trata el problema de la obtención de una función de valor


de grupo, inicialmente considerado por Arrow (1951) y Fleming (1952), que de-
© R A -M A CAPÍTULO 9; DECISIONES DE GRUPO 307

nominaron de bienestar social ordinal, y dirigido esencialmente a la búsqueda de


condiciones de existencia de la citada función basada en las funciones de valor
individuales.
Planteemos de manera formal este problema. Sea un conjunto de individuos
j. ¿ = 1,..., n, cada uno con su función de valor Vi y sea X el espacio de conse­
cuencias con elementos x. Se desea determinar una función de valor de grupo v„
a partir de las funciones de valor individuales, es decir, una función

vg (x ) = f (*>i W (x )), (9.1)

ya que el objetivo fundamental del grupo será maximizar el bienestar de los n


individuos. V\,...,Vn designarán n atributos medidos mediante las respectivas
funciones de valor individuales v\,...,vn: El objetivo será entonces determinar
la forma más apropiada de la función f en el modelo (9.1), cuya formulación es
análoga a la presentada en el Capítulo 2 en los modelos de decisión individuales
en certidumbre. Así, su formalización se apoyará en los resultados propuestos
entonces, siendo diferentes en los tipos de consideraciones necesarias por paite
del grupo de individuos para formalizar su estructura de preferencia.
En el modelo (9.1), denominado de “certidumbre pura” , las estructuras de
preferencia individuales quedan determinadas por las correspondientes funciones
de valor, que se suponen conocidas, de modo que las preferencias del grupo para
las consecuencias x se recogen a través de las funciones i>¡, sobre las que debe
hacerse una normalización de escalas previamente a la consideración de compara­
ciones interpersonales, tal como mostramos en el ejemplo inicial de la sección.
Supongamos, por tanto, que existe la función / de (9.1) y que se cumplen las
condiciones:

1) Independencia preferencial. Los atributos {V i,^ } son preferencial­


mente independientes de su complementario para todo i ^ j con n > 3 (ver
Capítulo 2).
2)Asociación positiva ordinal. Sean A y B dos alternativas igualmente
preferidas por el grupo. Si A se cambia o A! de manera que algún individuo Ij
prefiere A' a A, permaneciendo el resto de individuos indiferentes, entonces A'
es preferida a B por él grupo.

Obsérvese que la condición 1) implica que para dos individuos Ij e (j i),


si los restantes n —2 individuos sienten indiferencia entre un par de consecuencias,
entonces la preferencia del grupo por éstas vendrá dada por la que establezcan Ij
e I{, siendo independiente del nivel de las preferencias del resto de los individuos.
La 2) establece que / es una función monótona positiva de sus argumentos, es
decir, que si el valor Vj para el individuo Ij se incrementa, permaneciendo los
restantes valores V{, i j , fijos, entonces la preferencia del grupo aumenta.
308 FUNDAMENTOS DE LOS SISTEMAS DE AYUDA A LA DECISIÓN © R A -M A

Dadas estas suposiciones y teniendo en cuenta los resultados del Capítulo 2 es


de esperar que dispondremos de una función de valor aditiva. Es decir, se tiene
el siguiente

Teorema 9.2
«f ' #
Supongamos n > 3. Se verifican las condiciones 1) y 2) si y sólo si ' V

v 9 (x ) = (Vi (x ) ) = v* W » (9-2)
Í= 1 1=1

donde, para todo i,

a) Vi es una función de valor para el individuo Ii con escala entre 0 y 1 .

b) que es una transformación monótona positiva de su argumento V{, es la


función de valor de grupo sobre Vi que refleja la comparación interpersonal
de las preferencias de los individuos.

c) v* definida como (■)) es otra función de valor para Ii, definida en una
escala consistente para reflejar la comparación interpersonal de preferencias
del grupo.

La demostración de este resultado puede verse en Keeney y Raiffa (1993).


Obsérvese que este resultado parece contradecir el Teorema de Imposibilidad de
Arrow, pues una vez asignada la función de valor aditiva (9.2), parece satisfacer las
suposiciones análogas a las de Arrow cuando los valores de los individuos, tomados
de sus funciones de valor, se sustituyen por sus correspondientes ordenaciones.
Esto es cierto. Sin embargo, obsérvese que implícitamente se ha añadido un
elemento a la formulación que Arrow excluyó, que es precisamente la comparación
interpersonal de preferencias introducida por la función v[ de (9.2).

9 .2 .2 Función de utilidad de grupo

Consideramos aquí el problema análogo al de la subsección anterior pero en am­


biente de incertidumbre, es decir, suponemos un grupo de n individuos Ii,...,In
que se enfrentan con una situación de decisión en incertidumbre, de manera que
resulta natural suponer que cada uno tiene su utilidad individual para medir la
preferencia sobre los resultados así como sus respectivas probabilidades personales
para los estados de la Naturaleza. Trataremos aquí también de proponer reglas
de racionalidad de grupo que permitan pasar de las ordenaciones individuales a
la ordenación óptima para el grupo.
Consideramos que para cada consecuencia x el vector (u\ (x) ,...,Un(x)) =
(Ui, ..., Un) constituye los n atributos de la consecuencia x medidos mediante
RA-MA____________________________________ CAPÍTULO 9; DECISIONES DE G R U P O 309

las funciones de utilidad individuales uj,...,un. Así, el grupo define Ui, ■■■, Un
como un conjunto de atributos, de manera que ¡7¿ mide el grado con el que está
optimizando el bienestar del individuo El modelo “de incertidumbre pura”
toma la forma

ug (x) = h(ui ( x ) , ...,Un (x))

y el objetivo será determinar una expresión para h apropiada al problema en


consideración.
Al igual que el modelo (9.1) en ambiente de certidumbre, éste tiene algunas
hipótesis implícitas análogas como, por ejemplo, que las preferencias del grupo
sobre las consecuencias x se recogen a. través de la funciones u¿ que representan
las estructuras de preferencia de los individuos. Además, la formulación es idén­
tica a la presentada en el Capítulo 4 para un único decisor y podemos entonces
apoyarnos en los resultados allí expuestos.
Como trabajo pionero en esta área citaremos el de Harsanyi (1955), que inves­
tigó condiciones de consistencia de la función de utilidad de grupo, proponiendo
condiciones necesarias y suficientes para que una función de utilidad de grupo ug
sea de la forma aditiva, es decir,
n

M x ) = Y L XiUi
»=i

con Aj constantes positivas, siendo por tanto ug un promedio ponderado de las


funciones de utilidad individuales. Las condiciones de Harsanyi son: a) la fun­
ción de utilidad de grupo y las individuales verifican los axiomas de la utilidad
esperada (Sección 4.1); y b) si dos alternativas, definidas mediante distribuciones
de probabilidad sobre las consecuencias x, son indiferentes para cada individuo,
entonces el grupo las considera indiferentes. Son varios los trabajos que discuten
estas condiciones, especialmente la b), que se refiere al sentimiento individual de
cada individuo y no a posibles comparaciones interpersonales.
Expondremos a continuación condiciones de existencia para la función de
utilidad de grupo en los casos aditivo (diferentes a las de Harsanyi) y multilineal.
Las condiciones necesarias para la utilidad de grupo aditiva son:

3) Independencia aditiva. El conjunto de atributos U\,...,Un es indepen­


diente aditivamente (ver Sección 4.4).

4) Equivalencia estratégica. La función de utilidad condicional de gi'upo


u[ sobre el atributo Ui, que designa la utilidad del individuo Ii, es estratégicamente
equivalente (induce las mismas preferencias) a la función de utilidad individual
Ui.
310 F U N D A M E N T O S D E LO S S IST EM A S P E A Y U D A A L A D E CISIÓ N © RA-MA

Establecemos el siguiente

Teorema 9.3.
Supongamos n > 2. Se verifican las condiciones 3) y 4) si y sólo si
n
u9 (x ) = Y l XiUi (x) (9.3)
Í=1
con Ui (i — 1, ...,n) función de utilidad, para él individuo i con escala entre 0 y
1 , y Xi > 0 constantes de escala.

La demostración puede verse en Keeney y Raiffa (1993). Para asignar los fac­
tores de escala A¿, se requieren comparaciones interpersonales de las preferencias
individuales. El hecho de que las A¿ sean positivas asegura la asociación positiva
ordinal de las preferencias individuales y las del grupo (condición 2). Obsérvese
que la condición de equivalencia estratégica indica que como el grupo piensa que
el individuo expresa honradamente sus preferencias, entonces desea usar la
función de utilidad del individuo i como su propia función de utilidad paxa medir
el impacto sobre el individuo i.
La siguiente condición se utiliza en lugar de la 3) para la existencia de una
función de utilidad de grupo más general que la (9.3).

5) In d ep en d en cia en utilidad. El atributo Ui (i = 1, ...,n) es indepen­


diente en utilidad de los demás atributos U\,..., ..., Un (ver Sección
4. 4).

Obsérvese que la condición 5) es algo más débil que la 3) y que desempeña


el mismo papel que la independencia estocástica en la Teoría de la Probabilidad.
El resultado sobre existencia de una función de utilidad multilineal de grupo es
el siguiente:

Teorema 9.4
Supongamos n > 2. Si se verifican las condiciones 4) y 5), entonces
n n
Ug (x) = XiUi (x) + ^ XijUi (x) Uj (x) -|------- 1- (9.4)
t=i t=i,j>i
+A l 2...n«l (pí)-” Un (x)

con Ug y Ui, i = l,...,n , con escala entre 0 y 1, y las X's constantes de escala
con 0 < < 1, Vi.

En la citada referencia de Keeney y Raiffa (1993) pueden verse las demostra­


ciones de estos teoremas así como otras descomposiciones de la función de utilidad
de grupo y procedimientos de asignación para las constantes de escala.
© r a -m a CAPÍTULO 9: DECISIONES DE GRUPO 311

9.2.3 A gregación de ju icios probabilísticos

Ya hemos visto en ..el Capítulo 3 y siguientes que en los problemas de decisión


bajo incertidumbre se utilizan probabilidades para cuantifícar la incertidumbre
de los sucesos, bien a partir de probabilidades objetivas o bien de probabilidades
subjetivas si hay que asignarlas a partir de juicios probabilísticos personales. En
la subsección anterior hemos considerado la agregación de preferencias en el caso
de incertidumbre y vamos a estudiar aquí la agregación de probabilidades como un
complemento de lo anterior, ya que también podría ser necesaria su consideración
en un problema de decisión de grupo.
Es fácil encontrar problemas en los que es necesario agregar probabilidades,
como mostramos con la siguiente situación.-

Ejemplo 9.1
Supongamos que una empresa va á lanzar al mercado un nuevo producto del
que se espera que alcance un cierto nivel de ventas, aunque podría no lograrse
por dos causas: la aparición de un producto similar por parte de la competencia
(suceso A) y la falta de interés por el producto por parte del segmento poblacional
al que va dirigido (suceso B). La empresa desea estimar la probabilidad de que
el producto alcance el nivel deseado y para ello encarga la estimación de las
probabilidades de los sucesos indicados a sus dos expertos y cuyos resultados
aparecen en la Tabla 9.3.

Tabla 9.3: Estimación de probabilidades en el lanzamiento del producto

Estimación del P(A) P(B) p (A n s )1


Experto 1 0.5 0.1 0.05
Experto 2 0.9 0.3 0.27
Promedio = 0.16
Promedio de
0.7 0.2 0.14
las estimaciones
"1." .. . . . .
B a jo h ip ótesis de independencia

Obsérvese que la asignación de la probabilidad de grupo difiere dependiendo


de cómo se lleve a cabo el cálculo del promedio. Si multiplicamos las probabi­
lidades de cada experto y promediamos obtendremos la probabilidad 0.16. Por
el contrario, si primero promediamos las probabilidades de los expertos para
los sucesos individuales y luego multiplicamos estos promedios, obtenemos como
probabilidad 0.14. T al diferencia nos muestra alguno de los inconvenientes que
pueden surgir en el proceso de agregación. O

Con el o b jetivo de superar este tipo de problemas se han sugerido una señ<
de procedimientos altern ativos de agregación de probabilidades. Uno de tales en
al» r — i m I M m r i m f í na ayuda a u i j m m ó N ------------------ ^ m

ftumíi() rmM;<> m amUUmtr la «filmación de la* probabilidad** <.1« un mimbro


Z n o («mío Información M«« “ ««*•»’ í;,ro miembro í'ara r<'mar «*•*
rtlm a d on * utilizando para «lio la formulad* Itoy*. Son varío» lo* método» d*
«arrollado» (JIJOno apoyan «ri e»tc enfoque que requieren también la* a»lgnack**
0 odueoloflflH do loo Individuo» expertos, pero que re«ultan má# eampJfcadQg ^uu>
la simple consideración d e promedio».
O iro enfoque utilizado o» «I de la consideración do pvotm ájp) poiihrado» de
|iu< probabilidades indi viduales. Sin embargo, «e ha com probado que hay e»ca#i
evidencia de que conduzca a mejores asignaciones quo el prom edio simple. Winkler
(1971.) y Seaver, vori Winfcerfwldl; y Edy/ards (1978), E sto ha inducido a varíoa
autores como Ferré) (1,985) y von W interfeld y Edv/ardíj (1980) a afirmar que
01 enfoque má» pragmático para agregación de probabíl idados debe ser el rnág
simple, es decir, el p rom v i io «imple (igual ponderación) de las probabilidades
individuales, a pesar de que se mostró en el Ejem plo 9,1 que puede no resultar el
método ideal.

9.3 MÉTODOS DE AGREGACIÓN DE


COMPORTAMIENTOS
En la sección anterior hemos desarrollado algunos métodos de agregación de pre­
ferencias y resulta claro que, en ausencia de procedimientos que permitan com­
paraciones interpersonales de preferencias, la búsqueda de una fundón de valor
o utilidad de grupo resultará infructuosa. A pesar de ello, los conceptos de va­
lor y utilidad aún podrían resultar útiles en los procesos de decisión de grupo,
ya que la obtención de los valores y utilidades individuales podría ayudar a los
miembros del grupo a conseguir una mejor comprensión del problema y a una
mayor apreciación de los puntos de vista de los restantes individuos. De hecho,
la consideración de un simple promedio de los valores o utilidades individuales
podría ser una ayuda para tener un modelo inicial aproximado del problema.
En todo caso, la utilización de análisis de sensibilidad serviría para contrastar
el efecto de utilizar valores y utilidades individuales. Con todo ello se podrían
tener conclusiones como, por ejemplo, que ciertas decisiones serían preferidas a
otras con independencia de qué funciones de preferencia individuales hubieran si­
do utilizadas, conduciendo en definitiva a un debate con una mayor información y
conocimiento del problema. Esta referencia a la discusión o debate de los miem­
bros del grupo nos conduce a los métodos de agregación de comportamientos que
estudiaremos a continuación.

9.3.1 Procesos de decisión de grupo no estructurados

En muchos de los numerosos trabajos de investigación sobre descripción de la


decisión de grupo, una de las conclusiones más importantes se refiere a posibles
© RA-MA CAPÍTULO 9: DECISIONES DE GRUPO 313

deficiencias bien documentadas del proceso. Por ejemplo, la presencia de indivi­


duos de peso en un grupo de decisión podría inhibir las posibles contribuciones
de los individuos de menor nivel en la jerarquía, o bien individuos locuaces o
extrovertidos podrían dominar con sus opiniones la discusión. En ese sentido
Janis (1982) ha detectado y documentado dentro de los procesos de decisión de
grupo el fenómeno que él denominó “pensamiento de grupo” , que es esencialmente
la supresión de ideas que resultan críticas para la dirección de la discusión en que
se mueve el grupo. Se refleja en una tendencia a estar de acuerdo con los puntos
de vista o posiciones que se percibe que favorecen al grupo. Tal como observa
Janis, esto podría conllevar juicios rápidos y obligaciones sobre determinadas
actuaciones. Sin embargo, tales grupos cohesivos podrían desarrollar racionali­
zaciones sobre la invulnerabilidad de las decisiones del grupo y con ello inhibir
la propuesta de ideas críticas. Tales inconvenientes del “pensamiento de grupo”
sería probable que condujeran a un conjunto deficiente e incompleto de posibles
decisiones o cursos de acción. Esa búsqueda incompleta a través del espacio de
decisiones es probable que dé como resultado dejar de examinar los riesgos de las
decisiones más preferidas y de los planes de contingencia si no pueden tomarse
las decisiones preferidas. Estas y otras deficiencias llevan a la recomendación de
considerar procesos de grupo estructurados.

9.3.2 Procesos de decisión de grupo estructurados

El conocimiento de los factores que pueden degradar el proceso de decisión de


grupo combinado con la creencia implícita de que los juicios de grupo potencial­
mente podrían realzar las decisiones, ha conducido a una serie de procedimientos
denominados estructurados que tratan de superar los inconvenientes anterior­
mente señalados. Uno de tales métodos, quizá el más conocido y utilizado dentro
de esta clase, es el método Delphi introducido por Dalkey (1969,1972), que bási­
camente es un proceso iterativo de grupo para llevar a cabo juicios cuantitativos.
Las fases de este método son:

1. Los miembros del grupo comienzan proporcionando su opinión sobre la


verosimilitud de sucesos futuros o bien cuándo se darán tales sucesos o qué
impactos tendrán. En la mayoría de las ocasiones tales opiniones se obtienen
como respuestas a cuestionarios que se completan individualmente por los
miembros del grupo.

2. Los resultados de los cuestionarios se resumen estadísticamente, general­


mente en términos de recorridos y medianas. Se pasan tales resultados a
los miembros del grupo nuevamente con el cuestionario, permitiéndose en
esta segunda fase una discusión anónima y escrita donde se justifiquen las
posibles discrepancias de los individuos.

3. El resultado final del procedimiento es un “consenso de grupo” cuantifi-


cado típicamente a partir de las medianas de las respuestas a la segunda
31-1 FU N D A M E N T O S D E LOS S IST EM AS D E A Y U D A A L A DECISIÓN
© RA-MA

pasada del cuestionario (a veces se les pasa el cuestionario más veces) a los
miembros del grupo.

Con este método se considera que con la reiteración de respuestas a los cues­
tionarios conociendo cada miembro del grupo el resumen estadístico del anterior
los valores medianos de las respuestas del grupo se aproximarán a los verdaderos
valores de los resultados que se desean predecir. Los usuarios de este método
piensan que la mejora resulta de los cambios de opinión de los menos expertos e
inseguros en el tema en cuestión que serán arrastrados por los más expertos con
un conocimiento más preciso.
Se han propuesto muchas variantes del método Delphi incluyendo la con­
sideración de ponderaciones individuales de los miembros del grupo de acuerdo
con su nivel de conocimientos para reflejar la contribución de su opinión en la
valoración final. De hecho, el nombre Delphi se ha convertido en un término
general que refleja un proceso de decisión de grupo respondiendo sus miembros a
cuestionarios y considerando la posterior realimentación. O’Connor (1973), Lin-
stone y Turoff (1975), Párente y Anderson-Parente (1987), Rowe, Wright y Bolger
(1991) y Rowe y Wright (1996) son algunas referencias en las que se pueden ver
variantes y mejoras del método.
Sin embargo, los tests experimentales sobre estos procedimientos como forma
de mejora de la precisión en los juicios han conducido a variados resultados que
indican que suele haber una ligera mejora sobre el promedio de las opiniones
individuales, pero raras veces tal resultado es mejor que el que propone el miembro
más experto del grupo. Se ha argumentado también, Ferrel (1990), que el motivo
de la pobre ejecución de estos métodos es que la información que se comparte entre
los individuos es bastante reducida al utilizarse únicamente resúmenes estadísticos
y no haber discusión entre sus miembros, debido a la condición de anonimato, lo
que no ayuda al individuo a construir un escenario alternativo con el que proponer
predicciones revisadas.
Así, como contraste a los métodos Delphi, ha surgido en época algo más re­
ciente la llamada conferencia de decisión, que describimos a continuación. En
ella desaparece la condición de anonimato, constituyendo un enfoque de decisión
sodalmente interactivo y dirigido a generar un entendimiento del problema com­
partido por todos los miembros del grupo para alcanzar un posterior compromiso
de decisión.

9.4 CONFERENCIA DE DECISIÓN

El procedimiento conocido como conferencia de decisión fue propuesto por el


consultor estadounidense C. Peterson a finales de los 70, como un método de
decisión de grupo basado en la discusión para alcanzar en un tiempo razonable
una alternativa final de decisión.
© RA -M A CAPITULO 9: DECISIONES DE GRUPO 315

Básicamente una conferencia de decisión es una reunión del grupo de indivi­


duos en diferentes sesiones a lo largo de dos o tres días en los que se conjuga el
Análisis de Decisiones con los procesos de grupo y las tecnologías de la informair
ción, en un intento de resolver un problema complejo de decisión. Típicamente,
las sesiones las dirige un analista de'-decisiones al que presentan los distintos
miembros del grupo sus puntos de vista y opiniones sobre el problema en cuestión,
tratando éste de facilitar la interacción dentro del grupo y que se compartan los
conocimientos. En último término otro analista de decisiones utiliza tecnología
de ayuda a la decisión interactiva para modelizar los puntos de vista individuales
y de grupo, tal vez para la evaluación de alternativas multiatributo. Tales salidas
las plantea el analista a los miembros del grupo explicándoles la lógica subyacente
de los métodos de modelizacióh utilizados. Sólo cuándo los decisores aprecien los
métodos será cuando más probablemente acepten las decisiones basadas en los
modelos en vez de sus propios juicios intuitivos.
Por tanto, el objetivo fundamental que subyace a una conferencia de decisión
es que el analista proporcione una síntesis de las técnicas del Análisis de De­
cisiones