Algoritmos para La Vida Cotidiana - Brian Chistian & Tom Griffiths

Página 1
Página 4
2
3
Derechos de autor
William Collins
Una huella de HarperCollins Publishers
1 London Bridge Street
Londres SE1 9GF
www.WilliamCollinsBooks.com
Este eBook publicado por primera vez en Gran Bretaña por William Collins en 2016
Publicado por primera vez en los Estados Unidos por Henry Holt and Company, LLC en 2016
Copyright © 2016 por Brian Christian y Tom Griffiths
Brian Christian y Tom Griffiths afirman el derecho moral

ser identificados como los autores de este trabajo
Un registro de catálogo para este libro es

disponible en la Biblioteca Británica
Todos los derechos reservados bajo las convenciones internacionales y panamericanas de derechos de autor. Mediante el pago de la
tarifas requeridas, se le ha otorgado el derecho no exclusivo e intransferible de acceder y leer el
texto de este libro electrónico en pantalla. Ninguna parte de este texto puede reproducirse, transmitirse, descargarse,
descompilado, modificado por ingeniería inversa o almacenado o introducido en cualquier almacenamiento y recuperación de información
sistema, en cualquier forma o por cualquier medio, ya sea electrónico o mecánico, ahora conocido o en el futuro
inventado, sin el permiso expreso por escrito de HarperCollins.
Fuente ISBN: 9780008166090

Edición de libro electrónico © Abril de 2016 ISBN: 9780007547982
Versión: 2016-04-05
Página 5
Dedicación
Para nuestras familias
Página 6
Contenido
Cubrir
Pagina del titulo
Derechos de autor
Dedicación
Introducción
Algoritmos para vivir
1 parada óptima
Cuando dejar de mirar
2 Explorar / Explotar
Lo último frente a lo mejor
3 Clasificación
Hacer orden
4 Almacenamiento en caché
Olvídalo
5 Programación
Lo primero es lo primero
6 Regla de Bayes
Página 7
Prediciendo el futuro
7 Sobreajuste
Cuándo pensar menos
8 Relajación
Dejalo deslizar
9 Aleatoriedad
Cuándo dejarlo al azar
10 Redes
Cómo nos conectamos
11 Teoría de juegos
Las mentes de los demás
Conclusión
Bondad computacional
Notas
Bibliografía
Índice
Expresiones de gratitud
También por Brian Christian
Sobre los autores
Sobre el editor
Página 8
Introducción
Algoritmos para vivir
Imagina que estás buscando un apartamento en San Francisco, posiblemente el

ciudad estadounidense más angustiosa para hacerlo. El sector tecnológico en auge
y las estrictas leyes de zonificación que limitan las nuevas construcciones han conspirado para hacer
ciudad tan cara como Nueva York, y según muchos más
competitivo. Los nuevos listados suben y bajan en minutos, se abren
Las casas están atestadas y, a menudo, las llaves acaban en manos de quien pueda.
Primero, físicamente imponga un cheque de depósito al propietario.
Un mercado tan salvaje deja poco espacio para el tipo de investigación y
deliberación que teóricamente se supone que caracteriza las acciones de la
consumidor racional. A diferencia de, digamos, un cliente de un centro comercial o un comprador en líne
comparar opciones antes de tomar una decisión, el aspirante a san franciscano
tiene que decidir instantáneamente de cualquier manera: puede tomar el apartamento que está
actualmente mirando, abandonando a todos los demás, o puede alejarse, nunca para
regreso.
Asumamos por un momento, en aras de la simplicidad, que solo te importa
acerca de maximizar sus posibilidades de obtener el mejor apartamento disponible.
Su objetivo es reducir los arrepentimientos gemelos, Scylla-and-Charybdis del "one
que se escapó ”y la“ piedra sin remover ”al mínimo absoluto. usted
me enfrento a un dilema desde el principio: ¿Cómo va a saber que un apartamento
es de hecho el mejor a menos que tenga una línea de base para juzgarlo? Y como estan
Página 9
establecer esa línea de base a menos que observe (y pierda ) una serie de
apartamentos? Cuanta más información recopile, mejor conocerá
oportunidad correcta cuando la ve, pero es más probable que tenga
ya lo pasó.
Entonces, ¿Qué haces? ¿Cómo se toma una decisión informada cuando el
¿El mismo acto de informarlo pone en peligro el resultado? Es una situación cruel
bordeando la paradoja.
Cuando se les presenta este tipo de problema, la mayoría de las personas intuitivamente
decir algo en el sentido de que requiere algún tipo de equilibrio entre
mirando y saltando, que debe mirar suficientes apartamentos para establecer
un estándar, luego tome lo que satisfaga el estándar que ha establecido.
Esta noción de equilibrio es, de hecho, precisamente correcta. Lo que la mayoría de la gente no
decir con certeza cuál es ese equilibrio. Afortunadamente, hay una
respuesta.
Treinta y siete por ciento.
Si quiere las mejores probabilidades de conseguir el mejor apartamento, gaste el 37% de
su búsqueda de apartamento (once días, si se ha dado un mes para la
buscar) explorando opciones sin comprometerse. Deje la chequera en casa;
solo estás calibrando. Pero después de ese punto, prepárese para
comprometerse, con depósito y todo, en el primer lugar en el que vea que supera
lo que sea que ya hayas visto. Esto no es meramente una satisfacción intuitiva
compromiso entre mirar y saltar. Es probadamente óptimo
solución.
Sabemos esto porque encontrar un apartamento pertenece a una clase de
problemas matemáticos conocidos como problemas de "parada óptima". El 37%
La regla define una serie simple de pasos, lo que los científicos de la computación llaman un
“Algoritmo”: para resolver estos problemas. Y resulta que apartamento
La caza es solo una de las formas en que la detención óptima asoma la cabeza en el día a día.
vida. Comprometerse o renunciar a una sucesión de opciones es una estructura que
aparece en la vida una y otra vez, en encarnaciones ligeramente diferentes. Cuantos
veces para rodear la cuadra antes de entrar en un espacio de estacionamiento? Que tan lejos
¿Empujar su suerte con una empresa arriesgada antes de cobrar? Cuánto tiempo
esperar una mejor oferta en esa casa o coche?
Página 10
El mismo desafío también aparece en un entorno aún más tenso: las citas.
La detención óptima es la ciencia de la monogamia en serie.
Los algoritmos simples ofrecen soluciones no solo para la búsqueda de un apartamento, sino también
todas esas situaciones en la vida en las que nos enfrentamos a la cuestión del óptimo
parada. La gente lidia con estos problemas todos los días, aunque seguramente
Los poetas han derramado más tinta sobre las tribulaciones del noviazgo que sobre el estacionamiento.
—Y lo hacen, en algunos casos, con considerable angustia. Pero la angustia
es innecesario. Matemáticamente, al menos, estos son problemas resueltos.
Cada inquilino, conductor y pretendiente agobiado que ve a su alrededor a medida que avanza
durante una semana típica es esencialmente reinventar la rueda. Ellos no necesitan
un terapeuta; necesitan un algoritmo. El terapeuta les dice que encuentren lo correcto,
cómodo equilibrio entre impulsividad y pensamiento excesivo.
El algoritmo les dice que el saldo es treinta y siete por ciento.
***
Existe un conjunto particular de problemas a los que se enfrentan todas las personas, problemas que son
resultado directo del hecho de que nuestra vida se desarrolla en un espacio y un tiempo finitos.
¿Qué debemos hacer y dejar sin hacer en un día o en una década? Qué grado
de desorden deberíamos abrazar, y ¿cuánto orden es excesivo? Qué
El equilibrio entre las nuevas experiencias y las favorecidas hace que la mayor
¿vida plena?
Estos pueden parecer problemas exclusivos de los humanos; Ellos no están. Para
más de medio siglo, los científicos de la computación han estado lidiando con y
en muchos casos resolviendo los equivalentes de estos dilemas cotidianos. Cómo
¿Debería un procesador dedicar su "atención" a realizar todo lo que el usuario pide?
de ella, con la mínima sobrecarga y en el menor tiempo posible? Cuando
¿Debería cambiar entre diferentes tareas y cuántas tareas debería tomar?
en primer lugar? ¿Cuál es la mejor forma de utilizar su memoria limitada?
¿recursos? ¿Debería recopilar más datos o tomar una acción basada en los datos que
¿ya tiene? Aprovechar el día puede ser un desafío para los humanos, pero
las computadoras que nos rodean están capturando milisegundos con facilidad. Y ahí está
mucho podemos aprender de cómo lo hacen.
Página 11
Hablar de algoritmos para vidas humanas puede parecer extraño

yuxtaposición. Para muchas personas, la palabra "algoritmo" evoca lo arcano
e inescrutables maquinaciones de big data, gran gobierno y grandes empresas:
cada vez más parte de la infraestructura del mundo moderno, pero apenas una
fuente de sabiduría práctica u orientación para los asuntos humanos. Pero un algoritmo
es solo una secuencia finita de pasos que se utilizan para resolver un problema, y los algoritmos son
mucho más amplio, y mucho más antiguo, que la computadora. Mucho antes
Los algoritmos fueron usados por máquinas, fueron usados por personas.
La palabra "algoritmo" proviene del nombre del matemático persa
al-Khwārizmī, autor de un libro de técnicas para hacer
matemáticas a mano. (Su libro se llamaba al-Jabr wa'l-Muqābala, y
el "al-jabr" del título a su vez proporciona la fuente de nuestra palabra "álgebra".)
Los primeros algoritmos matemáticos conocidos, sin embargo, son anteriores incluso a
El trabajo de Khwārizmī: una tablilla de arcilla sumeria de cuatro mil años encontrada
cerca de Bagdad describe un plan para una división larga.
Pero los algoritmos no se limitan únicamente a las matemáticas. Cuando cocinas
pan de una receta, estás siguiendo un algoritmo. Cuando tejes un
suéter de un patrón, estás siguiendo un algoritmo. Cuando pones un
borde afilado en un trozo de pedernal mediante la ejecución de una secuencia precisa de golpes
con la punta de una cornamenta, un paso clave en la fabricación de herramientas de piedra fina, estás
siguiendo un algoritmo. Los algoritmos han sido parte de la tecnología humana.
desde la Edad de Piedra.
***
En este libro, exploramos la idea del diseño de algoritmos humanos, buscando

mejores soluciones a los desafíos que las personas enfrentan todos los días. Aplicando el
El lente de la informática en la vida cotidiana tiene consecuencias a muchas escalas.
Más inmediatamente, nos ofrece sugerencias prácticas y concretas sobre cómo
resolver problemas específicos. La parada óptima nos dice cuándo mirar y cuándo
saltar. La compensación explorar / explotar nos dice cómo encontrar el equilibrio
entre probar cosas nuevas y disfrutar de nuestros favoritos. La teoría de la clasificación dice
nosotros cómo (y si) organizar nuestras oficinas. La teoría del almacenamiento en caché nos dice cómo
llena nuestros armarios. La teoría de la programación nos dice cómo ocupar nuestro tiempo.
Pagina 12
En el siguiente nivel, la informática nos da un vocabulario para

comprender los principios más profundos en juego en cada uno de estos dominios. Como
Carl Sagan dijo: "La ciencia es una forma de pensar mucho más que un cuerpo
del conocimiento." Incluso en los casos en que la vida es demasiado complicada para que podamos esper
Análisis numérico estricto o una respuesta lista, utilizando intuiciones y conceptos.
perfeccionado en las formas más simples de estos problemas nos ofrece una manera de entender
las cuestiones clave y avanzar.
En términos más generales, mirar a través de la lente de las ciencias de la computación puede enseña
acerca de la naturaleza de la mente humana, el significado de la racionalidad y el
la pregunta más antigua de todas: cómo vivir. Examinar la cognición como medio de
resolver los problemas fundamentalmente computacionales planteados por nuestro
El medio ambiente puede cambiar por completo la forma en que pensamos sobre la racionalidad human
La noción de que estudiar el funcionamiento interno de las computadoras podría revelar
cómo pensar y decidir, qué creer y cómo comportarse, podría golpear
mucha gente no sólo es tremendamente reduccionista, sino que de hecho está equivocada. Incluso si
la informática tenía cosas que decir sobre cómo pensar y cómo actuar,
querríamos escuchar Observamos las IA y los robots de la ciencia ficción,
y parece que la suya no es una vida que ninguno de nosotros quisiera vivir.
En parte, eso se debe a que cuando pensamos en computadoras, pensamos en
sistemas deterministas, fríamente mecánicos: máquinas que aplican
lógica deductiva, tomar decisiones enumerando exhaustivamente las opciones,
y encontrar la respuesta exacta sin importar cuánto tiempo y
tener que pensar. De hecho, la persona que primero imaginó las computadoras había
algo esencialmente como esto en mente. Alan Turing definió la noción misma
de computación por una analogía con un matemático humano que cuidadosamente
trabaja a través de los pasos de un largo cálculo, produciendo un inconfundible
respuesta correcta.
Por lo tanto, puede resultar sorprendente que esto no sea lo que las computadoras modernas
que están haciendo cuando se enfrentan a un problema difícil. Simple
la aritmética, por supuesto, no es particularmente desafiante para una computadora moderna.
Más bien, se trata de tareas como conversar con personas, reparar un archivo dañado o
ganar un juego de Go: problemas en los que las reglas no están claras, algunos de los
falta la información requerida, o encontrar exactamente la respuesta correcta
Página 13
requieren considerar un número astronómico de posibilidades, que ahora plantean

los mayores retos de la informática. Y los algoritmos que
Los investigadores han desarrollado para resolver las clases más difíciles de problemas que han
alejó a las computadoras de una dependencia extrema en el cálculo exhaustivo.
En cambio, abordar las tareas del mundo real requiere sentirse cómodo con el azar,
intercambiando tiempo con precisión y usando aproximaciones.
A medida que las computadoras se adaptan mejor a los problemas del mundo real, proporcionan
no solo algoritmos que las personas pueden tomar prestados para sus propias vidas, sino una mejor
estándar contra el cual comparar la cognición humana misma. Sobre el pasado
década o dos, la economía del comportamiento ha contado una historia muy particular sobre
seres humanos: que somos irracionales y propensos a errores, debido en gran parte a
el hardware idiosincrásico y con errores del cerebro. Esta historia de autocrítica
se ha vuelto cada vez más familiar, pero algunas preguntas siguen siendo molestas. Por qué
son niños de cuatro años, por ejemplo, todavía mejor que un millón de dólares
supercomputadoras en una serie de tareas cognitivas, incluida la visión, el lenguaje y
razonamiento causal?
Las soluciones a los problemas cotidianos que surgen de la informática
contar una historia diferente sobre la mente humana. La vida está llena de problemas que son
simplemente, difícil . Y los errores que comete la gente suelen decir más sobre
las dificultades intrínsecas del problema que sobre la falibilidad de los
sesos. Pensando algorítmicamente sobre el mundo, aprendiendo sobre el
estructuras fundamentales de los problemas que enfrentamos y sobre las propiedades de
sus soluciones, pueden ayudarnos a ver qué tan buenos somos en realidad y mejor
entender los errores que cometemos.
De hecho, los seres humanos se enfrentan constantemente a algunos de los
los casos más difíciles de los problemas estudiados por los informáticos. A menudo, la gente
necesidad
informacióndeparcial
tomar decisiones
y un mundomientras se enfrenta
que cambia a la incertidumbre,
rápidamente. las
En algunos de limitaciones
esos casos, de tiempo,
incluso las ciencias de la computación de vanguardia aún no han logrado
algoritmos siempre correctos. En determinadas situaciones, parece que
Es posible que los algoritmos no existan en absoluto.
Incluso donde no se han encontrado algoritmos perfectos, sin embargo, la batalla
entre generaciones de informáticos y la realidad más intratable
Página 14
Los problemas mundiales ha arrojado una serie de conocimientos. Estos preceptos duramente ganados
están en desacuerdo con nuestras intuiciones sobre la racionalidad, y no suenan
algo parecido a las estrechas prescripciones de un matemático que intenta forzar
el mundo en líneas limpias y formales. Dicen: No siempre consideres todos tus
opciones. No busque necesariamente el resultado que le parezca mejor cada vez.
En ocasiones, ensucia. Luz de viaje. Deja que las cosas esperen. Confía en tus instintos
y no lo pienses demasiado. Relajarse. Tirar una moneda. Perdona, pero no olvides. Para
tu propio yo sea sincero.
Vivir con la sabiduría de la informática no suena tan mal después
todos. Y a diferencia de la mayoría de los consejos, está respaldado por pruebas.
***
Así como el diseño de algoritmos para computadoras fue originalmente un tema que cayó
en las grietas entre disciplinas, un extraño híbrido de matemáticas y
ingeniería, por lo que también el diseño de algoritmos para humanos es un tema que
no tiene un hogar disciplinario natural. Hoy en día, el diseño de algoritmos dibuja
no solo en informática, matemáticas e ingeniería, sino también en campos afines
como las estadísticas y la investigación de operaciones. Y mientras consideramos cómo los algoritmos
diseñado para que las máquinas puedan relacionarse con las mentes humanas, también debemos buscar
ciencia cognitiva, psicología, economía y más.
Nosotros, sus autores, conocemos este territorio interdisciplinario. Brian
Estudió ciencias de la computación y filosofía antes de continuar con sus estudios de posgrado.
en inglés y una carrera en la intersección de los tres. Tom estudió
psicología y estadística antes de convertirse en profesor en UC Berkeley,
donde pasa la mayor parte de su tiempo pensando en la relación entre
cognición y computación humana. Pero nadie puede ser un experto en todos los
campos que son relevantes para diseñar mejores algoritmos para humanos. Entonces como parte
de nuestra búsqueda de algoritmos para vivir, hablamos con las personas que surgieron
con algunos de los algoritmos más famosos de los últimos cincuenta años. Y nosotros
les preguntó, a algunas de las personas más inteligentes del mundo, cómo su investigación
influyó en la forma en que abordaron sus propias vidas, desde la búsqueda de su
esposas para clasificar sus calcetines.
Página 15
Las siguientes páginas comienzan nuestro viaje a través de algunos de los más importantes
desafíos que enfrentan las computadoras y las mentes humanas: cómo administrar
espacio finito, tiempo finito, atención limitada, incógnitas desconocidas, incompleto
información y un futuro imprevisible; cómo hacerlo con gracia y
confianza; y cómo hacerlo en una comunidad con otros que son todos
simultáneamente tratando de hacer lo mismo. Aprenderemos sobre lo fundamental
estructura matemática de estos desafíos y sobre cómo las computadoras son
diseñado, a veces en contra de lo que imaginamos, para aprovechar al máximo
ellos. Y aprenderemos sobre cómo funciona la mente, sobre sus características distintas pero
formas profundamente relacionadas de abordar el mismo conjunto de problemas y hacer frente a la
mismas limitaciones. En última instancia, lo que podemos ganar no es solo un conjunto de
conclusiones para los problemas que nos rodean, no solo una nueva forma de ver el
estructuras elegantes detrás incluso de los dilemas humanos más peludos, no sólo un
reconocimiento de las tribulaciones de los humanos y las computadoras como profundamente
pero algo aún más profundo: un nuevo vocabulario para el mundo que nos rodea
nosotros, y la oportunidad de aprender algo verdaderamente nuevo sobre nosotros mismos.
Página 16
1 parada óptima
Cuando dejar de mirar
Aunque todos los cristianos comienzan una invitación de boda declarando solemnemente
su matrimonio se debe a un arreglo divino especial, yo, como
filósofo, me gustaría hablar con más detalle sobre esto ...
—JOHANNES KEPLER
Si prefiere al Sr. Martin a cualquier otra persona; si crees que es el

el hombre ms agradable con el que ha estado en compaa, por qu
¿Tu dudas?
—JANE AUSTEN, EMMA
Es un fenómeno tan común que los consejeros universitarios incluso

tiene un término de jerga para eso: la "gota de pavo". Vienen los novios de la escuela secundaria
casa para el Día de Acción de Gracias de su primer año de universidad y, cuatro días
más tarde, regrese al campus como soltero.
Brian, angustiado, fue a ver a su propio consejero universitario.
primer año. Su novia del instituto había ido a una universidad diferente.
varios estados de distancia, y lucharon con la distancia. Ellos también
Luché con una pregunta más extraña y más filosófica: ¿qué tan buena
relación que tenían? No tenían un punto de referencia real de otros
relaciones por las que juzgarlo. El consejero de Brian reconoció que el suyo era un
Página 17
clásico dilema de primer año, y fue sorprendentemente indiferente en su

consejo: "Recopilar datos".
La naturaleza de la monogamia en serie, en general, es que sus practicantes son
frente a un problema fundamental e inevitable. Cuando te has encontrado
suficientes personas para saber quién es tu mejor pareja? ¿Y si adquirir el
los datos le cuestan ese mismo partido? Parece el último Catch-22 del corazón.
Como hemos visto, este Catch-22, este angustiado cri de coeur de primer año, es
lo que los matemáticos llaman un problema de "parada óptima", y puede
realmente tengo una respuesta: 37%.
Por supuesto, todo depende de las suposiciones que esté dispuesto a hacer.
sobre el amor.
El problema de la secretaria
En cualquier problema de parada óptima, el dilema crucial no es qué opción

elegir , pero cuántas opciones incluso considerar . Estos problemas resultan
tienen implicaciones no solo para los amantes y los inquilinos, sino también para los conductores,
propietarios de viviendas, ladrones y más.
La regla del 37%* deriva del rompecabezas más famoso de la parada óptima,
que ha llegado a conocerse como el "problema de la secretaria". Su configuración es mucho
como el dilema del buscador de apartamentos que consideramos antes. Imagina
estás entrevistando a un grupo de candidatos para un puesto como secretaria, y tu
El objetivo es maximizar la posibilidad de contratar al mejor candidato en el
piscina. Si bien no tiene idea de cómo asignar puntajes a solicitantes individuales,
puede juzgar fácilmente cuál prefiere. (Un matemático podría decir que
tienen acceso sólo a los números ordinales , los rangos relativos de la
solicitantes comparados entre sí, pero no con los números cardinales , sus
calificaciones en algún tipo de escala general). Entrevista a los solicitantes en
orden aleatorio, uno a la vez. Puedes decidir ofrecer el trabajo a un candidato.
en cualquier momento y se garantiza que aceptarán, dando por terminada la búsqueda. Pero si
usted pasa por alto a un solicitante, decide no contratarlo, se va para siempre.
Se considera ampliamente que el problema de la secretaria ha hecho su primera
aparición impresa, sin mención explícita de secretarias, en la edición de febrero
Página 18
Número de 1960 de Scientific American , como uno de los varios acertijos planteados en Martin
La querida columna de Gardner sobre matemáticas recreativas. Pero los orígenes de
el problema es sorprendentemente misterioso. Nuestra propia búsqueda inicial dio como resultado
poco más que especulaciones, antes de convertirse en un detective inesperadamente físico
trabajo: un viaje por carretera hasta el archivo de los papeles de Gardner en Stanford, para
sacar cajas de su correspondencia de mediados de siglo. Papel de lectura
la correspondencia es un poco como escuchar a escondidas a alguien que está al teléfono:
solo está escuchando un lado del intercambio y debe inferir el otro. En
nuestro caso, sólo teníamos las respuestas a lo que aparentemente era el propio Gardner
buscar el origen del problema hace cincuenta años. Cuanto más leemos, el
más enredada y confusa se volvió la historia.
El matemático de Harvard Frederick Mosteller recordó haber oído hablar de la
problema en 1955 de su colega Andrew Gleason, que había oído hablar
de otra persona. Leo Moser escribió desde la Universidad de Alberta para
decir que leyó sobre el problema en "algunas notas" de RE Gaskell de
Boeing, a quien él mismo acreditó a un colega. Roger Pinkham de Rutgers escribió
que escuchó por primera vez del problema en 1955 de la Universidad de Duke
matemático J. Shoenfield, “y creo que dijo que había escuchado la
problema de alguien en Michigan ".
"Alguien en Michigan" era casi con certeza alguien llamado Merrill
Inundación. Aunque en gran medida no se le ha oído hablar de las matemáticas externas, Flood's
La influencia en la informática es casi imposible de evitar. El esta acreditado
popularizar el problema del viajante de comercio (que discutimos en
más detalles en el capítulo 8), ideando el dilema del prisionero (que
discutir
Es Flooden el capítulo
quien hizo el 11), e incluso
primer con la posibilidad
descubrimiento conocidodede
acuñar el término
la Regla del 37%,"software".
en 1958,
y afirma haber estado considerando el problema desde 1949, pero
él mismo señala a varios otros matemáticos.
Baste decir que, venga de donde venga, el problema de la secretaria
demostró ser un acertijo matemático casi perfecto: simple de explicar, diabólico
para resolver, concisa en su respuesta e intrigante en sus implicaciones. Como un
Como resultado, se movió como la pólvora a través de los círculos matemáticos de la década de 1950,
difundido de boca en boca, y gracias a la columna de Gardner en 1960 llegó
Página 19
para agarrar la imaginación del público en general. En la década de 1980, el problema y

sus variaciones habían producido tanto análisis que había llegado a ser
discutido en los artículos como un subcampo en sí mismo.
En cuanto a las secretarias, es encantador ver a cada cultura poner lo suyo
giro antropológico en los sistemas formales. Pensamos en el ajedrez, por ejemplo, como
europeo medieval en su imaginería, pero de hecho sus orígenes se encuentran en la octava
India del siglo; fue "europeizado" con mano dura en el siglo XV
siglo, cuando sus shahs se convirtieron en reyes, sus visires se convirtieron en reinas, y su
los elefantes se convirtieron en obispos. Asimismo, los problemas óptimos de frenado han tenido un
encarnaciones, cada una reflejando las preocupaciones predominantes de su
tiempo. En el siglo XIX, estos problemas fueron tipificados por el barroco
loterías y mujeres que eligen pretendientes masculinos; a principios del siglo XX
siglo por los automovilistas de vacaciones en busca de hoteles y por pretendientes masculinos
elegir mujeres; y en el empuje de papel, dominado por hombres a mediados del siglo XX
siglo, por jefes masculinos que eligen asistentes femeninas. El primer explícito
mencionarlo por su nombre como el "problema de la secretaria" parece ser en un 1964
papel, y en algún lugar del camino se quedó el nombre.
¿De dónde el 37%?
En su búsqueda de una secretaria, hay dos formas en las que puede fallar:
temprano y parando tarde. Cuando te detienes demasiado temprano, dejas lo mejor
solicitante sin descubrir. Cuando te detienes demasiado tarde, esperas un mejor
solicitante que no existe. La estrategia óptima requerirá claramente
encontrar el equilibrio adecuado entre los dos, caminar por la cuerda floja entre
buscando demasiado y no lo suficiente.
Si su objetivo es encontrar al mejor candidato, sin conformarse con nada menos,
Está claro que a medida que avanza en el proceso de entrevista, ni siquiera debería
considere contratar a alguien que no sea el mejor que haya visto hasta ahora. Sin embargo,
simplemente ser el mejor pero no es suficiente para una oferta; el primer solicitante,
por ejemplo, por supuesto, será el mejor hasta ahora por definición. De manera más general,
Es lógico pensar que la velocidad a la que nos encontramos con los solicitantes "mejores hasta ahora"
bajará a medida que avancemos en nuestras entrevistas. Por ejemplo, el segundo
Página 20
El solicitante tiene una probabilidad del 50/50 de ser el mejor que hemos visto hasta ahora, pero el quinto
el solicitante solo tiene una probabilidad de 1 en 5 de ser el mejor hasta ahora, el sexto tiene una probabi
probabilidad en 6, y así sucesivamente. Como resultado, los mejores solicitantes se convertirán constante
más impresionantes a medida que continúa la búsqueda (por definición, nuevamente, son mejores
que todos los que vinieron antes), pero también se volverán más y más
infrecuente.
Bien, sabemos que tomar el primer candidato mejor hasta ahora que encontremos
(también conocido como el primer solicitante, punto) es precipitado. Si hay cien solicitantes,
también parece apresurado hacer una oferta al siguiente que sea mejor,
porque ella era mejor que la primera. Entonces, ¿cómo procedemos?
Intuitivamente, hay algunas estrategias potenciales. Por ejemplo, hacer un
oferta la tercera vez que un solicitante supera a todos los vistos hasta ahora, o tal vez el
Cuarta Vez. O quizás aceptando al próximo mejor candidato para que lo acompañe
después de una larga "sequía", una larga racha de pobres.
Pero da la casualidad de que ninguna de estas estrategias relativamente sensatas
en la parte superior. En cambio, la solución óptima toma la forma de lo que llamaremos
la regla de mirar-luego-saltar : Usted establece una cantidad de tiempo predeterminada para
"Buscar", es decir, explorar sus opciones, recopilar datos, en los que
categóricamente no elijas a nadie, por impresionante que sea. Después
punto, ingresa a la fase de "salto", preparado para comprometerse instantáneamente con cualquier perso
que eclipsa al mejor candidato que vio en la fase de búsqueda.
Podemos ver cómo surge la regla de mirar-luego-saltar al considerar cómo
el problema de la secretaria se desarrolla en los grupos de solicitantes más pequeños. Con tan solo
una solicitante, el problema es fácil de resolver: ¡contrátela! Con dos aspirantes,
tiene un 50/50 de posibilidades de éxito sin importar lo que haga. Puedes contratar el
primer solicitante (que resultará ser el mejor en la mitad del tiempo), o descartar al
primero y, por defecto, contrata al segundo (que también es el mejor la mitad del tiempo).
Agregue un tercer solicitante y, de repente, las cosas se pondrán interesantes. los
las probabilidades si contratamos al azar son de un tercio, o el 33%. Con dos solicitantes
no podía hacer nada mejor que el azar; con tres, ¿podemos? Resulta que podemos, y
todo se reduce a lo que hacemos con el segundo entrevistado. Cuando vemos
primer solicitante, no tenemos información ; siempre parecerá ser la
mejor aún. Cuando vemos al tercer solicitante, no tenemos agencia — tenemos que
Página 21
haga una oferta al solicitante final, ya que hemos despedido a los demás. Pero
cuando vemos al segundo solicitante, tenemos un poco de ambos: sabemos
si es mejor o peor que la primera, y tenemos la libertad de
contratarla o despedirla. ¿Qué pasa cuando la contratamos si ella es
mejor que la primera demandante y despedirla si no lo es? Esto resulta
ser la mejor estrategia posible frente a tres candidatos; usando esto
enfoque es posible, sorprendentemente, hacerlo igual de bien en los tres candidatos
problema como con dos, eligiendo al mejor candidato exactamente la mitad del tiempo. *
Enumerar estos escenarios para cuatro solicitantes nos dice que deberíamos
todavía comienzan a dar un salto tan pronto como el segundo solicitante; con cinco solicitantes en
la piscina, no debemos saltar antes de la tercera.
A medida que crece el grupo de solicitantes, el lugar exacto para trazar la línea entre
mirar y saltar se asienta en el 37% de la piscina, lo que da como resultado la Regla del 37%: mira
en el primer 37% de los solicitantes * , sin elegir ninguno, luego prepárese para dar el salto
alguien mejor que todos los que has visto hasta ahora.
Página 22
Cómo elegir de manera óptima una secretaria.
Como resultado, seguir esta estrategia óptima finalmente nos da un 37%

posibilidad de contratar al mejor candidato; es uno de los problemas curiosos
simetrías matemáticas que la propia estrategia y sus posibilidades de éxito
trabajar hasta el mismo número. La tabla de arriba muestra el óptimo
estrategia para el problema de la secretaria con diferentes números de solicitantes,
demostrando cómo la posibilidad de éxito, como el punto para cambiar de
buscando dar un salto: converge en un 37% a medida que el número de solicitantes
aumenta.
Una tasa de fracaso del 63%, cuando se sigue la mejor estrategia posible , es una
hecho aleccionador. Incluso cuando actuemos de manera óptima en el problema de la secretaria,
todavía fallan la mayor parte del tiempo, es decir, no terminaremos con el mejor
solicitante en la piscina. Esta es una mala noticia para aquellos de nosotros que enmarcaríamos
Página 23
el romance como una búsqueda de "el indicado". Pero aquí está el lado positivo. Intuición
sugeriría que nuestras posibilidades de elegir al mejor candidato deberían
disminuyen constantemente a medida que crece el grupo de solicitantes. Si estuviéramos contratando al
por ejemplo, en un grupo de cien solicitantes tendríamos un 1% de posibilidades
de éxito, y en un grupo de un millón de solicitantes tendríamos un 0,0001%
oportunidad. Sin embargo, sorprendentemente, la matemática del problema de la secretaria no cambia.
Si se detiene de manera óptima, sus posibilidades de encontrar lo mejor
solicitante en un grupo de cien es el 37%. Y en un grupo de un millón, cree
lo sea o no, su probabilidad sigue siendo del 37%. Por lo tanto, cuanto más grande sea el grupo de solicita
más valioso se vuelve el conocimiento del algoritmo óptimo. Eso es verdad
es poco probable que encuentre la aguja la mayor parte del tiempo, pero es óptima
detenerse es su mejor defensa contra el pajar, no importa cuán grande sea.
Salto del amante
La pasión entre los sexos ha aparecido en todas las épocas ser tan
casi lo mismo que siempre se puede considerar, en algebraico
lenguaje, como una cantidad dada.
—THOMAS MALTHUS
Me casé con el primer hombre al que besé. Cuando les digo esto a mis hijos
casi vomitan.
—BARBARA BUSH
Antes de convertirse en profesor de investigación de operaciones en Carnegie Mellon,

Michael Trick era un estudiante de posgrado que buscaba el amor. "Me di cuenta de que el
Se ha estudiado el problema: ¡es el problema de la secretaria! Tenía una posición para
completar [y] una serie de solicitantes, y mi objetivo era elegir al mejor solicitante
para la posicion." Así que corrió los números. No supo cuantas mujeres
podría esperar encontrarse en su vida, pero hay una cierta flexibilidad en el
Regla del 37%: se puede aplicar al número de solicitantes o al tiempo
sobre cuál está buscando. Asumiendo que su búsqueda duraría siglos
Página 24
dieciocho a cuarenta, la regla del 37% dio 26,1 años como el punto en el que
cambiar de mirar a saltar. Un número que, como sucedió, era exactamente
La edad de Trick en ese momento. Así que cuando encontró a una mujer que encajaba mejor
que todos aquellos con los que había salido hasta ahora, sabía exactamente qué hacer. Saltó. "I
no sabía si ella era perfecta (las suposiciones del modelo no permiten
yo para determinar eso), pero no había duda de que cumplía con los requisitos
para este paso del algoritmo. Así que me propuse ”, escribe.
"Y ella me rechazó".
Los matemáticos han tenido problemas con el amor desde al menos el
decimoséptimo siglo. El legendario astrónomo Johannes Kepler es hoy
quizás mejor recordado por descubrir que las órbitas planetarias son elípticas
y por ser una parte crucial de la "Revolución Copernicana" que incluyó
Galileo y Newton y trastocaron el sentido de la humanidad de su lugar en el
Cielos. Pero Kepler también tenía preocupaciones terrestres. Después de la muerte de su primer
esposa en 1611, Kepler se embarcó en una larga y ardua búsqueda para volver a casarse,
finalmente cortejando a un total de once mujeres. De los primeros cuatro, a Kepler le gustaba
el cuarto el mejor ("debido a su complexión alta y cuerpo atlético") pero no
cesar su búsqueda. "Se habría resuelto", escribió Kepler, "si no hubieran
el amor y la razón me obligaron a tener una quinta mujer. Este me convenció con
amor, humilde lealtad, economía del hogar, diligencia y el amor que ella
dio a los hijastros ".
"Sin embargo", escribió, "continué".
Los amigos y parientes de Kepler siguieron haciéndole presentaciones,
y siguió mirando, pero a medias. Sus pensamientos permanecieron con
Número cinco. Después de once noviazgos en total, decidió que buscaría
No más. “Mientras me preparaba para viajar a Ratisbona, regresé al quinto
mujer, me declaré y fui aceptado ". Kepler y Susanna
Reuttinger se casó y tuvo seis hijos juntos, junto con los niños.
del primer matrimonio de Kepler. Las biografías describen el resto de Kepler
la vida doméstica como un momento particularmente pacífico y alegre.
Tanto Kepler como Trick, de maneras opuestas, experimentaron de primera mano algunos
de las formas en que el problema de la secretaria simplifica demasiado la búsqueda del amor. En
el problema clásico de la secretaria, los candidatos siempre aceptan el puesto,
Página 25
previniendo el rechazo experimentado por Trick. Y no pueden ser

“Recordado” una vez pasado por alto, contrariamente a la estrategia seguida por Kepler.
En las décadas transcurridas desde que se introdujo por primera vez el problema de la secretaria, una
Se han estudiado diversas variantes del escenario, con estrategias para
la parada óptima funcionó en varias condiciones diferentes. los
posibilidad de rechazo, por ejemplo, tiene un sencillo
solución: proponer temprano y con frecuencia. Si tiene, digamos, una probabilidad del 50/50 de ser
rechazado, entonces el mismo tipo de análisis matemático que arrojó el 37%
La regla dice que debe comenzar a hacer ofertas después de solo una cuarta parte de su búsqueda.
Si es rechazado, siga haciendo ofertas a todas las personas mejores que haya visto hasta que
alguien acepta. Con una estrategia de este tipo, sus posibilidades de éxito general:
es decir, proponer y ser aceptado por el mejor solicitante del grupo,
también sea del 25%. Probabilidades no tan terribles, tal vez, para un escenario que combina
el obstáculo del rechazo con la dificultad general de establecer la propia
estándares en primer lugar.
Kepler, por su parte, denunció la "inquietud y la duda" que
lo empujó a seguir buscando. “¿No había otra forma para mi inquietud
que el corazón se contente con su destino ”, se lamentaba en una carta a un confidente,
“Que al darse cuenta de la imposibilidad del cumplimiento de tantas otras
deseos? " Aquí, de nuevo, la teoría de la parada óptima proporciona alguna medida de
consuelo. En lugar de ser signos de degeneración moral o psicológica,
la inquietud y la duda resultan ser parte de la mejor estrategia
para escenarios donde las segundas oportunidades son posibles. Si puede recordar el anterior
solicitantes, el algoritmo óptimo le da un giro al familiar Look-Then-
Regla de salto: un período sin compromiso más largo y un plan de respaldo.
Por ejemplo, suponga que una propuesta inmediata es algo seguro pero tardío
las propuestas se rechazan la mitad del tiempo. Entonces las matemáticas dicen que debes seguir
mirar sin comprometerse hasta que haya visto al 61% de los solicitantes, y luego solo
Saltar si alguien en el 39% restante de la piscina demuestra ser el mejor hasta ahora.
Si todavía estás soltero después de considerar todas las posibilidades, como lo hizo Kepler,
luego regresa al mejor que se escapó. La simetría entre estrategia
y el resultado se mantiene en este caso una vez más, con sus posibilidades de terminar
Página 26
con el mejor candidato en este escenario de segundas oportunidades permitidas también

siendo 61%.
Para Kepler, la diferencia entre la realidad y la secretaria clásica
El problema trajo consigo un final feliz. De hecho, el giro del clásico
El problema también funcionó bien para Trick. Después del rechazo, completó
obtuvo su título y consiguió un trabajo en Alemania. Allí, "entró en un bar, se cayó
amor con una mujer hermosa, se mudaron juntos tres semanas después, [y]
la invitó a vivir en los Estados Unidos 'por un tiempo' ”. Ella estuvo de acuerdo, y seis
años después, se casaron.
Saber algo bueno cuando lo ve: información completa
El primer conjunto de variantes que consideramos (rechazo y recuerdo) alteró la

los supuestos del clásico problema de la secretaria de que las propuestas oportunas siempre son
propuestas aceptadas y tardías, nunca. Para estas variantes, el mejor enfoque
permaneció igual que en el original: mira sin comprometerse por un tiempo, luego
prepárate para saltar.
Pero hay una suposición aún más fundamental del secretario
problema que podríamos poner en duda. Es decir, en el problema de la secretaria
no sabemos nada sobre los solicitantes más que cómo se comparan con uno
otro. No tenemos un sentido objetivo o preexistente de lo que hace que
un buen o un mal candidato; además, cuando comparamos dos de ellos,
saber cuál de los dos es mejor, pero no cuánto. Es este hecho que
da lugar a la inevitable fase de "mirada", en la que corremos el riesgo de dejar pasar un
excelente solicitante temprano mientras calibramos nuestras expectativas y estándares.
Los matemáticos se refieren a este género de problemas de parada óptimos como
juegos de información ".
Podría decirse que esta configuración está muy lejos de la mayoría de las búsquedas de
socio, o incluso una secretaria. En lugar de eso, imagina que tuviéramos algún tipo de
criterio objetivo: si todas las secretarias, por ejemplo, hubieran
examen calificado por percentil, en la forma del SAT o GRE o LSAT. Ese
es decir, la puntuación de cada solicitante nos dirá dónde se encuentran entre todos los mecanógrafos
Página 27
quién tomó la prueba: un mecanógrafo del percentil 51 está justo por encima del promedio, un
mecanógrafo percentil es mejor que tres de cada cuatro examinados, y así sucesivamente.
Suponga que nuestro grupo de solicitantes es representativo de la población en
grande y no está sesgado ni seleccionado por sí mismo de ninguna manera. Además, supongamos que
Decidimos que la velocidad de escritura es lo único que importa para nuestros solicitantes.
Luego tenemos lo que los matemáticos llaman "información completa" y todo
cambios. "No se necesita acumular experiencia para establecer un estándar", ya que
un artículo seminal de 1966 sobre el problema lo expresó, “y una opción rentable puede
a veces se hace de inmediato ". En otras palabras, si un percentil 95
El solicitante pasa a ser el primero que evaluamos, lo sabemos al instante y
puede contratarla con confianza en el lugar, es decir, por supuesto, asumiendo que no
Creo que hay un candidato del percentil 96 en el grupo.
Y ahí está el problema. Si nuestro objetivo es, nuevamente, conseguir la mejor persona para
el trabajo, todavía tenemos que sopesar la probabilidad de que haya una mayor
solicitante por ahí. Sin embargo, el hecho de que tengamos información completa nos da
todo lo que necesitamos para calcular esas probabilidades directamente. La posibilidad de que nuestro
El próximo solicitante que se encuentre en el percentil 96 o superior siempre será 1 de cada 20, para
ejemplo. Por lo tanto, la decisión de si detenerse se reduce completamente a cómo
muchos solicitantes nos quedan por ver. La información completa significa que no
Necesito mirar antes de saltar. En su lugar, podemos usar la regla de umbral , donde
Aceptamos inmediatamente a un solicitante si está por encima de cierto percentil. Nosotros
no es necesario mirar a un grupo inicial de candidatos para establecer este umbral, pero
Sin embargo, debemos ser muy conscientes de la cantidad de mirada que queda
disponible.
Las matemáticas muestran que cuando quedan muchos solicitantes en el grupo,
debería dejar pasar incluso a un muy buen candidato con la esperanza de encontrar
alguien aún mejor que eso, pero a medida que sus opciones disminuyan, debería ser
preparado para contratar a cualquiera que sea simplemente mejor que el promedio. Es familiar, si
no es exactamente inspirador, mensaje: frente a las escasas selecciones, baje su
normas. También deja claro lo contrario: con más peces en el mar, levante
ellos. En ambos casos, lo que es crucial, las matemáticas le dicen exactamente cuánto.
La forma más fácil de comprender los números de este escenario es comenzar en
al final y pensar al revés. Si te quedas con el último solicitante, por supuesto,
Página 28
necesariamente estás obligado a elegirla. Pero al mirar el siguiente

último solicitante, la pregunta es: ¿está por encima del percentil 50? Si
sí, entonces contratala; si no, vale la pena tirar los dados sobre el último solicitante
en cambio, dado que sus probabilidades de estar por encima del percentil 50 son 50/50 por
definición. Del mismo modo, debe elegir al penúltimo solicitante si es
por encima del percentil 69, el cuarto a último solicitante si está por encima del
78th, y así sucesivamente, siendo más selectivo, más solicitantes quedan. No importa
qué, nunca contrate a alguien que esté por debajo del promedio a menos que esté totalmente fuera de
opciones. (Y dado que todavía está interesado en encontrar el mejor
persona en el grupo de candidatos, nunca contrate a alguien que no sea el mejor que ha
visto hasta ahora.)
La posibilidad de terminar con el mejor solicitante en este
La versión informativa del problema de la secretaria llega al 58%, todavía lejos de
una garantía, pero considerablemente mejor que la tasa de éxito del 37% ofrecida por
la regla del 37% en el juego sin información. Si tiene todos los hechos, puede
tener éxito la mayoría de las veces, incluso cuando el grupo de solicitantes crece arbitrariamente
grande.
Página 29
Umbrales de parada óptimos en el problema de la secretaria de información completa.
El juego de información completa ofrece, por tanto, un inesperado y algo

comida para llevar extraña. Es más probable que la búsqueda de oro tenga éxito que la búsqueda de
amor. Si está evaluando a sus socios en función de algún tipo de objetivo
criterio, digamos, su percentil de ingresos, entonces tienes mucho más
información a su disposición que si lo que busca es una nebulosa
respuesta ("amor") que puede requerir tanto experiencia como comparación con
calibrar.
Por supuesto, no hay ninguna razón por la que el valor neto o, para el caso, escribir
velocidad: debe ser lo que está midiendo. Cualquier criterio que
proporciona información completa sobre la posición de un solicitante en relación con el
la población en general cambiará la solución de la regla de mirar-luego-saltar
a la regla del umbral y aumentará drásticamente sus posibilidades de encontrar
el mejor candidato del grupo.
Hay muchas más variantes del problema de la secretaria que modifican su
otras suposiciones, tal vez haciéndolo más en línea con el mundo real
desafíos de encontrar el amor (o una secretaria). Pero las lecciones por aprender
de parada óptima no se limitan a citas o contrataciones. De hecho, tratando de
tomar la mejor decisión cuando las opciones solo se presentan una por una es
también la estructura básica de vender una casa, estacionar un automóvil y renunciar cuando
estás por delante. Y todos, en un grado u otro, son problemas resueltos.
Cuando Vender
Si modificamos dos aspectos más del clásico problema de la secretaria, encontramos

nosotros mismos catapultados del reino de las citas al reino de los bienes raíces.
Anteriormente hablamos sobre el proceso de alquilar un apartamento como un óptimo
problema de parada, pero ser propietario de una casa no tiene escasez de parada óptima
cualquiera.
Imagínese vender una casa, por ejemplo. Después de consultar con varios reales
agentes inmobiliarios, pones tu lugar en el mercado; una nueva capa de pintura, algunas
paisajismo, y luego solo es cuestión de esperar a que lleguen las ofertas.
Página 30
A medida que llega cada oferta, normalmente debe decidir si la acepta o

rechazarlo. Pero rechazar una oferta tiene un costo: otra semana (o
mes) de los pagos de la hipoteca mientras espera la próxima oferta, que no
garantizado para ser mejor.
Vender una casa es similar al juego de información completa. Conocemos el
valor objetivo en dólares de las ofertas, indicándonos no solo cuáles son mejores
que cuál, sino también cuánto. Además, tenemos información
sobre el estado más amplio del mercado, lo que nos permite al menos aproximadamente
predecir la gama de ofertas que puede esperar. (Esto nos da el mismo "percentil"
información sobre cada oferta que tuvimos con el examen de mecanografía anterior).
La diferencia aquí, sin embargo, es que nuestro objetivo no es en realidad asegurar el single
la mejor oferta: es ganar la mayor cantidad de dinero a través del proceso en general. Dado
que esperar tiene un costo medido en dólares, una buena oferta hoy supera a una
un poco mejor dentro de varios meses.
Teniendo esta información, no necesitamos mirar evasivamente para establecer un
umbral. En su lugar, podemos poner uno en marcha, ignorar todo lo que está debajo y
tome la primera opción para superarlo. Por supuesto, si tenemos una cantidad limitada de
ahorros que se acabarán si no vendemos antes de cierto tiempo, o si esperamos
obtener solo un número limitado de ofertas y no más interés a partir de entonces, entonces
debería rebajar nuestros estándares a medida que se acercan tales límites. (Hay una razón por la que
los compradores de viviendas buscan vendedores "motivados"). Pero si ninguna de las preocupaciones n
creer que nuestras espaldas están contra la pared, entonces simplemente podemos concentrarnos en un
Análisis coste-beneficio del juego de la espera.
Aquí analizaremos uno de los casos más simples: donde sabemos con certeza
el rango de precios en el que vendrán las ofertas, y dónde todas las ofertas dentro de ese
rango son igualmente probables. Si no tenemos que preocuparnos por las ofertas (o nuestra
ahorros), entonces podemos pensar puramente en términos de lo que podemos
espere ganar o perder esperando un mejor trato. Si rechazamos la corriente
ofrecer, la posibilidad de una mejor, multiplicada por lo mucho mejor que
¿Espera que lo sea, más que compensar el costo de la espera? Mientras gira
, las matemáticas aquí son bastante limpias, lo que nos da una función explícita para detener
precio en función del costo de esperar una oferta.
Página 31
A este resultado matemático en particular no le importa si está vendiendo un
mansión por valor de millones o un cobertizo destartalado. Lo único que le importa
es la diferencia entre las ofertas más altas y más bajas que probablemente
recibir. Al conectar algunas cifras concretas, podemos ver cómo esto
El algoritmo nos ofrece una cantidad considerable de orientación explícita. Para
Por ejemplo, digamos que el rango de ofertas que esperamos va desde $ 400,000 a
$ 500.000. Primero, si el costo de esperar es trivial, podemos estar casi
infinitamente exigente. Si el costo de obtener otra oferta es solo de un dólar,
maximizar nuestras ganancias esperando a alguien dispuesto a ofrecernos
$ 499,552.79 y ni un centavo menos. Si esperar cuesta $ 2,000 por oferta, deberíamos
aguanta hasta $ 480.000. En un mercado lento donde esperar cuesta
$ 10,000 por oferta, deberíamos aceptar cualquier valor superior a $ 455,279. Finalmente, si espera
cuesta la mitad o más de nuestro rango esperado de ofertas, en este caso, $ 50,000
entonces no hay ventaja alguna en resistir; lo haremos mejor por
tomando la primera oferta que aparece y terminando. Mendigos
no pueden elegir.
Umbrales de detención óptimos en el problema de la venta de viviendas.
Página 32
Lo fundamental a tener en cuenta en este problema es que nuestro umbral depende

solo en el costo de la búsqueda. Dado que las posibilidades de que la próxima oferta sea una buena
uno, y el costo de averiguarlo, nunca cambia, nuestro precio final no tiene
razón para bajar cada vez más a medida que avanza la búsqueda, independientemente de nuestra suerte
configúrelo una vez, incluso antes de comenzar, y luego simplemente lo mantenemos rápido.
Laura Albert McLay de la Universidad de Wisconsin-Madison,
experta en optimización, recuerda recurrir a su conocimiento de la parada óptima
problemas a la hora de vender su propia casa. "La primera oferta que recibimos
fue genial ", explica," pero tuvo un costo enorme porque nos querían
para mudarse un mes antes de que estuviéramos listos. Hubo otro competitivo
oferta ... [pero] simplemente aguantamos hasta que obtuvimos la correcta ". Para muchos
vendedores, rechazar una buena oferta o dos puede ser un estresante
propuesta, especialmente si las que siguen inmediatamente no son mejores. Pero
McLay se mantuvo firme y se mantuvo tranquilo. "Eso hubiera sido realmente,
realmente difícil ", admite," si no supiera que las matemáticas están de mi lado ".
Este principio se aplica a cualquier situación en la que reciba una serie de ofertas.
y pagar un costo para buscar o esperar el próximo. Como consecuencia, es relevante
a casos que van mucho más allá de vender una casa. Por ejemplo, los economistas han
usó este algoritmo para modelar cómo las personas buscan trabajo, donde fácilmente
explica el hecho aparentemente paradójico de los trabajadores desempleados
y vacantes sin cubrir existentes al mismo tiempo.
De hecho, estas variaciones en el problema de parada óptima tienen otro,
propiedad aún más sorprendente. Como vimos, la capacidad de "recordar" un pasado
La oportunidad era vital en la búsqueda del amor de Kepler. Pero en la venta de casas y
búsqueda de empleo, incluso si es posible reconsiderar una oferta anterior, e incluso si
esa oferta está garantizada para estar todavía sobre la mesa, no obstante, nunca debe
hazlo. Si no estaba por encima de su umbral, entonces no estará por encima de su
umbral ahora. Lo que pagó para seguir buscando es un costo irrecuperable. No
compromiso, no lo adivine. Y no mires atrás.
Cuando aparcar
Página 33
Encuentro que los tres principales problemas administrativos en un campus son

sexo para los estudiantes, atletismo para los exalumnos y estacionamiento para los
facultad.
—CLARK KERR, PRESIDENTE DE UC BERKELEY, 1958–1967
Otro dominio donde abundan los problemas óptimos de frenado, y donde

Mirar hacia atrás también es generalmente desaconsejable: es el automóvil. Los automovilistas aparecen
parte de la literatura más antigua sobre el problema de la secretaria y el marco
de movimiento constante hacia adelante hace que casi todas las decisiones de viaje en automóvil se conv
problema de parada: la búsqueda de un restaurante; la búsqueda de un baño;
y, lo que es más grave para los conductores urbanos, la búsqueda de una plaza de aparcamiento. OMS
Es mejor hablar con él sobre los entresijos del estacionamiento que con el hombre descrito por
el diario Los Angeles Times como “la estrella de rock de aparcamiento”, UCLA Distinguido
Profesor de Urbanismo Donald Shoup? Condujimos desde el norte
California para visitarlo, asegurándole a Shoup que dejaríamos mucho tiempo
para tráfico inesperado. "En cuanto a la planificación de" tráfico inesperado ", creo que
debería planificar el tráfico esperado ”, respondió. Shoup es quizás más conocido
por su libro El alto costo del estacionamiento gratuito , y ha hecho mucho para
avanzar en la discusión y la comprensión de lo que realmente sucede cuando
alguien conduce a su destino.
Deberíamos sentir lástima por el pobre conductor. La plaza de aparcamiento ideal, como Shoup
lo modela, es uno que optimiza un equilibrio preciso entre la "pegatina
precio ”del espacio, el tiempo y las molestias de caminar, el tiempo que se tarda
buscando el espacio (que varía enormemente según el destino, la hora del día, etc.),
y el gas se quemó al hacerlo. La ecuación cambia con el número de
pasajeros en el automóvil, que pueden dividir el costo monetario de un espacio pero no el
el tiempo de búsqueda o el paseo. Al mismo tiempo, el conductor debe tener en cuenta que
el área con la mayor oferta de estacionamiento también puede ser el área con más
demanda; el estacionamiento tiene un componente teórico del juego, ya que intentas ser más astuto
los otros conductores en la carretera mientras ellos a su vez están tratando de ser más astutos que usted.
Dicho esto, muchos de los desafíos del estacionamiento se reducen a un solo número:
la tasa de ocupación. Esta es la proporción de todos los lugares de estacionamiento que están
Página 34
actualmente ocupado. Si la tasa de ocupación es baja, es fácil encontrar un buen

Estacionamiento. Si es alto, encontrar cualquier lugar para estacionar es un desafío.
Shoup sostiene que muchos de los quebraderos de cabeza del estacionamiento son consecuencias
de ciudades que adoptan políticas que dan como resultado tasas de ocupación extremadamente altas. Si
el costo de estacionamiento en un lugar en particular es demasiado bajo (o, ¡horrores!)
nada en absoluto), entonces hay un gran incentivo para estacionar allí, en lugar de para
aparcar un poco más lejos y caminar. Así que todo el mundo intenta aparcar allí, pero
la mayoría descubre que los espacios ya están llenos y la gente acaba desperdiciando
tiempo y quemando combustibles fósiles mientras navegan en busca de un lugar.
La solución de Shoup consiste en instalar parquímetros digitales que
capaz de adaptarse a los precios que aumentan con la demanda. (Esto ha sido ahora
implementado en el centro de San Francisco.) Los precios se establecen con un objetivo
tasa de ocupación en mente, y Shoup argumenta que esta tasa debe ser
en algún lugar alrededor del 85%, una caída radical de los casi 100% empaquetados
bordillos de la mayoría de las ciudades importantes. Como señala, cuando la ocupación pasa del 90% al
95%, admite solo un 5% más de automóviles, pero duplica la longitud de
la búsqueda de todos.
El impacto clave que tiene la tasa de ocupación en la estrategia de estacionamiento se convierte en
claro una vez que reconocemos que el estacionamiento es un problema óptimo para detenerse. Como
conduces por la calle, cada vez que ves algún lugar vacío ocasional
tienes que tomar una decisión: ¿deberías tomar este lugar o acercarte un poco más?
a tu destino y prueba suerte?
Suponga que está en una carretera infinitamente larga, con lugares de estacionamiento uniformemen
espaciados, y su objetivo es minimizar la distancia a la que termina caminando
tu destino. Entonces la solución es la regla de mirar y luego saltar. los
Parando de manera óptima, el conductor debería pasar por alto todos los lugares vacantes que ocurren m
que una cierta distancia del destino y luego tomar el primer espacio que
aparece a partir de entonces. Y la distancia a la que cambiar de mirar a
El salto depende de la proporción de lugares que es probable que se llenen: el
tasa de ocupación. La tabla de la página siguiente muestra las distancias para algunos
proporciones representativas.
Página 35
Cómo encontrar aparcamiento de forma óptima.
Si esta calle infinita tiene una tasa de ocupación de la gran ciudad del 99%, con solo el 1%
de lugares vacantes, entonces debe tomar el primer lugar que vea comenzando en casi
70 lugares, a más de un cuarto de milla, de su destino. Pero si Shoup
se sale con la suya y las tasas de ocupación bajan a solo un 85%, no es necesario que empieces
mirando seriamente hasta que estés a media cuadra de distancia.
La mayoría de nosotros no conducimos por carreteras perfectamente rectas e infinitamente largas. As
con otros problemas de parada óptimos, los investigadores han considerado una variedad
de ajustes a este escenario básico. Por ejemplo, han estudiado el óptimo
estrategia de estacionamiento para casos en los que el conductor puede hacer giros en U, donde menos
los espacios de estacionamiento están disponibles a medida que uno se acerca al destino, y
donde el piloto compite contra pilotos rivales que también se dirigen a la
mismo destino. Pero cualesquiera que sean los parámetros exactos del problema, más
los lugares vacantes siempre harán la vida más fácil. Es una especie de política
Página 36
Recordatorio a los gobiernos municipales: estacionar no es tan simple como tener un

recurso (puntos) y maximizar su utilización (ocupación). El estacionamiento también es
un proceso , un problema de parada óptimo, y es uno que consume
atención, tiempo y combustible, y genera tanto contaminación como congestión. los
La política correcta aborda todo el problema. Y, contraintuitivamente, vacío
manchas en bloques muy deseables pueden ser una señal de que las cosas están funcionando
correctamente.
Le preguntamos a Shoup si su investigación le permite optimizar su propia
viajar, a través del tráfico de Los Ángeles a su oficina en UCLA. Lo hace
podría decirse que el mayor experto mundial en estacionamiento tiene algún tipo de secreto
¿arma?
Él lo hace: "Voy en bicicleta".
Cuando dejar de fumar
En 1997, la revista Forbes identificó a Boris Berezovsky como el hombre más rico de
Rusia, con una fortuna de aproximadamente $ 3 mil millones. Sólo diez años antes había
estado viviendo con el salario de un matemático de la Academia de
Ciencias. Hizo sus miles de millones aprovechando las relaciones industriales que había
formado a través de su investigación para fundar una empresa que facilitó la interacción
entre los fabricantes de automóviles extranjeros y el fabricante de automóviles soviético AvtoVAZ.
La empresa de Berezovky se convirtió entonces en un distribuidor a gran escala de los coches que
AvtoVAZ producido, utilizando un esquema de pago a plazos para aprovechar
de hiperinflación en el rublo. Utilizando los fondos de esta asociación,
compró la propiedad parcial de AvtoVAZ, luego la televisión ORT
red, y finalmente la empresa petrolera Sibneft. Convertirse en uno de una nueva clase
oligarcas, particip en la poltica, apoyando la religin de Boris Yeltsin
elección en 1996 y la elección de Vladimir Putin como su sucesor en 1999.
Pero fue entonces cuando cambió la suerte de Berezovsky. Poco después de la elección de Putin,
Berezovsky se opuso públicamente a las reformas constitucionales propuestas que
ampliar el poder del presidente. Su continua crítica pública a Putin
llevó al deterioro de su relación. En octubre de 2000, cuando Putin
Cuando se le preguntó acerca de las críticas de Berezovsky, respondió: “El estado tiene un
Página 37
garrote en sus manos que usas para golpear solo una vez, pero en la cabeza. No tenemos
usé este garrote todavía ... El día que nos enojemos mucho, no dudaremos ".
Berezovsky abandonó Rusia permanentemente el mes siguiente y se exilió en
Inglaterra, donde continuó criticando el régimen de Putin.
¿Cómo decidió Berezovsky que era hora de dejar Rusia? Hay alguna manera,
tal vez, pensar matemáticamente en el consejo de "dejar de fumar mientras estás
adelante"? Berezovsky en particular podría haber considerado esta misma pregunta
él mismo, ya que el tema en el que había trabajado todos esos años como un
matemático no era otro que la parada óptima; él fue el autor del primero
(y, hasta ahora, el único) libro enteramente dedicado al problema de la secretaria.
El problema de dejar de fumar mientras está por delante se ha analizado en
varias formas diferentes, pero tal vez la más apropiada para Berezovsky
caso, con disculpas a los oligarcas rusos, se conoce como el "ladrón
problema." En este problema, un ladrón tiene la oportunidad de realizar un
secuencia de robos. Cada robo proporciona alguna recompensa, y hay una
posibilidad de salirse con la suya cada vez. Pero si atrapan al ladrón,
es arrestado y pierde todas sus ganancias acumuladas. ¿Qué algoritmo debería
seguir para maximizar su toma esperada?
El hecho de que este problema tenga solución es una mala noticia para la película de atracos.
guiones: cuando el equipo está tratando de sacar al viejo ladrón de su retiro
para un último trabajo, el ladrón astuto solo necesita hacer cálculos. Es más,
los resultados son bastante intuitivos: la cantidad de robos que debes realizar
es aproximadamente igual a la posibilidad de escapar, dividida por la posibilidad de obtener
atrapó. Si eres un ladrón habilidoso y tienes un 90% de posibilidades de escapar
cada robo (y un 10% de posibilidades de perderlo todo), luego retirarse después de 90/10 = 9
robos. ¿Un aficionado torpe con un 50/50 de posibilidades de éxito? El primero
tiempo, no tienes nada que perder, pero no presiones tu suerte más de una vez.
A pesar de su experiencia en la parada óptima, la historia de Berezovsky termina tristemente.
Murió en marzo de 2013, encontrado por un guardaespaldas en el baño cerrado con llave de
su casa en Berkshire con una ligadura alrededor de su cuello. El oficial
La conclusión de un examen post mortem fue que había cometido
suicidio, ahorcándose después de perder gran parte de su riqueza a través de una serie de
casos legales de alto perfil que involucran a sus enemigos en Rusia. Quizás debería
Página 38
se detuvieron antes, acumulando solo unas pocas decenas de millones de dólares, digamos,
y no meterse en política. Pero, ay, ese no era su estilo. Uno de sus
amigos matemáticos, Leonid Boguslavsky, contaron una historia sobre Berezovsky
de cuando ambos eran investigadores jóvenes: en un viaje de esquí acuático a un
lago cerca de Moscú, el barco que habían planeado utilizar se averió. Aquí está
cómo lo cuenta David Hoffman en su libro The Oligarchs :
Mientras sus amigos iban a la playa y encendían una hoguera, Boguslavsky y Berezovsky se dirigieron a
el muelle para intentar reparar el motor ... Tres horas después, lo habían desmontado y vuelto a montar
el motor. Todavía estaba muerto. Se habían perdido la mayor parte de la fiesta, pero Berezovsky insistió en que
tenía que seguir intentándolo. "Probamos esto y aquello", recuerda Boguslavsky. Berezovsky no daría
hasta.
Sorprendentemente, no darse por vencido, nunca, también aparece en el

literatura de parada óptima. Puede que no lo parezca de la amplia gama de
problemas que hemos discutido, pero hay tomas de decisiones secuenciales
problemas para los cuales no es ninguna regla óptima de parada. Un ejemplo simple es
el juego del
siguiente "triple
juego o nada".
tantas vecesImagina que tienes
como quieras: $ 1.00
apueste y puedes
todo jugar
su dinero y tenga un
50% de probabilidad de recibir el triple de la cantidad y 50% de probabilidad de perder su
participación entera. ¿Cuántas veces deberías jugar? A pesar de su sencillez, hay
no es una regla de parada óptima para este problema, ya que cada vez que juegas, tu
las ganancias promedio son un poco más altas. A partir de $ 1.00, obtendrá $ 3.00 la mitad
el tiempo y $ 0.00 la mitad del tiempo, por lo que, en promedio, espera terminar el primer
ronda con $ 1.50 en el bolsillo. Entonces, si tuviste suerte en la primera ronda,
las dos posibilidades de los $ 3.00 que acaba de ganar son $ 9.00 y $ 0.00—
para un retorno promedio de $ 4.50 de la segunda apuesta. Las matemáticas muestran que
siempre deberías seguir jugando. Pero si sigue esta estrategia,
eventualmente perderá todo. Algunos problemas se evitan mejor que se resuelven.
Siempre parando
Espero pasar por este mundo solamente una vez. Cualquier bien por tanto que yo
puedo hacer, o cualquier amabilidad que pueda mostrar a cualquier criatura semejante, permítame
Página 39
hazlo ahora. No dejes que lo posponga ni lo descuide, porque no pasaré por este camino.
de nuevo.
—STEPHEN GRELLET
Pasa la tarde. No puedes llevártelo contigo.

—ANNIE DILLARD
Hemos analizado casos específicos de personas que enfrentan problemas de frenado en

sus vidas, y está claro que la mayoría de nosotros encontramos este tipo de problemas,
de una forma u otra, a diario. Ya sea que se trate de secretarias, prometidos o
apartamentos, la vida está llena de paradas óptimas. Entonces la pregunta irresistible es
si —por evolución, educación o intuición— seguimos realmente el
mejores estrategias.
A primera vista, la respuesta es no. Aproximadamente una docena de estudios han producido
el mismo resultado: la gente tiende a detenerse temprano, dejando a los mejores solicitantes sin ser visto
Para tener una mejor idea de estos hallazgos, hablamos con Amnon de UC Riverside
Rapoport, que ha estado ejecutando experimentos de parada óptimos en el
laboratorio durante más de cuarenta años.
El estudio que sigue más de cerca el problema clásico de la secretaria fue
dirigido en la década de 1990 por Rapoport y su colaborador Darryl Seale. En esto
la gente del estudio pasó por numerosas repeticiones del problema de la secretaria,
con 40 u 80 solicitantes cada vez. La tasa general a la que las personas
encontró que el mejor candidato posible era bastante bueno: alrededor del 31%, no lejos de
el 37% óptimo. La mayoría de la gente actuó de una manera consistente con la
Regla de mirar-luego-saltar, pero saltaron antes de lo que deberían tener más
de las cuatro quintas partes del tiempo.
Rapoport nos dijo que tiene esto en cuenta cuando resuelve las soluciones óptimas.
detener los problemas en su propia vida. En la búsqueda de un apartamento, por
Por ejemplo, lucha contra su propio impulso de comprometerse rápidamente. “A pesar de que por
naturaleza soy muy impaciente y quiero tomar el primer piso, trato de
¡controlarme!"
Pero esa impaciencia sugiere otra consideración que no se toma en cuenta.
cuenta en el problema clásico de la secretaria: el papel del tiempo. Después de todo, el
Página 40
todo el tiempo que estás buscando una secretaria, no tienes una secretaria.
Además, pasa el día realizando entrevistas en lugar de
hacer su propio trabajo.
Este tipo de costo ofrece una posible explicación de por qué las personas se detienen temprano
al resolver un problema de secretaria en el laboratorio. Seale y Rapoport mostraron
que si se imagina que el costo de ver a cada solicitante es, por ejemplo, del 1%
del valor de encontrar la mejor secretaria, entonces la estrategia óptima sería
se alinean perfectamente con el lugar donde las personas realmente cambiaron de mirar a saltar
en su experimento.
El misterio es que en el estudio de Seale y Rapoport, no hubo un costo por
buscar. Entonces, ¿por qué la gente en el laboratorio podría estar actuando como si hubiera uno?
Porque para las personas siempre hay un costo de tiempo. No viene del
diseño del experimento. Viene de la vida de las personas.
Los costes de tiempo "endógenos" de la búsqueda, que no suelen
capturado por modelos de parada óptimos, podría proporcionar una explicación para
por qué la toma de decisiones humana diverge rutinariamente de las prescripciones de
esos modelos. Como dice el investigador de detenciones óptimas Neil Bearden, “Después
buscando durante un tiempo, los humanos tendemos a aburrirnos. No es irracional
aburrirse, pero es difícil modelar tan rigurosamente ".
Pero esto no hace que los problemas de frenado óptimos sean menos importantes; eso
en realidad los hace más importantes, porque el flujo del tiempo convierte a todos
toma de decisiones en una parada óptima.
“La teoría de la parada óptima se ocupa del problema de
elegir un momento para tomar una acción determinada ”, abre el libro de texto definitivo sobre
parada óptima, y es difícil pensar en una descripción más concisa de la
condición humana. Decidimos el momento adecuado para comprar acciones y el momento adecuado
venderlos, seguro; pero también el momento adecuado para abrir la botella de vino que hemos
estado esperando para una ocasión especial, el momento adecuado para interrumpir
alguien, el momento adecuado para besarlos.
Visto de esta manera, el problema de la secretaria es el más fundamental pero el más
suposición increíble: su estricta serialidad, su inexorable marcha unidireccional
—Se revela como la naturaleza del tiempo mismo. Como tal, la premisa explícita de
El problema de parada óptima es la premisa implícita de lo que debe ser
Página 41
viva. Es esto lo que nos obliga a decidir basándonos en posibilidades que aún no hemos
visto, esto nos obliga a adoptar altas tasas de fracaso incluso cuando actuamos
óptimamente. No se repite ninguna elección. Es posible que volvamos a tener opciones similares , pero nu
ese exacto. La vacilación, la inacción, es tan irrevocable como la acción. Qué
el automovilista, encerrado en el camino de un solo sentido, está al espacio, estamos al cuarto
dimensión: realmente pasamos por este camino, pero una vez.
Intuitivamente, pensamos que la toma de decisiones racional significa exhaustivamente
enumerando nuestras opciones, sopesando cada una con cuidado y luego seleccionando
lo mejor. Pero en la práctica, cuando el reloj (o el ticker) avanza, pocos
Los aspectos de la toma de decisiones (o del pensamiento en general) son tan importantes
como éste: cuándo parar.
Página 42
*Usamos negrita para indicar los algoritmos que aparecen a lo largo del libro.
Página 43
*Con esta estrategia tenemos un 33% de riesgo de despedir al mejor solicitante y un 16% de riesgo de nunca
conocerla. Para elaborar, hay exactamente seis posibles ordenamientos de los tres solicitantes: 1-2-3, 1-3-
2, 2-1-3, 2-3-1, 3-1-2 y 3-2-1. La estrategia de mirar al primer solicitante y luego saltar
quien la supere tendrá éxito en tres de los seis casos (2-1-3, 2-3-1, 3-1-2) y fracasará en el
otros tres, dos veces por ser demasiado exigente (1-2-3, 1-3-2) y una vez por no ser lo suficientemente exigente (3-2-
1).
Página 44
*En realidad, solo un cabello por debajo del 37%. Para ser precisos, la proporción matemáticamente óptima de solicitantes
mirar es 1 / e , la misma constante matemática e , equivalente a 2.71828…, que aparece en
cálculos de interés compuesto. Pero no necesita preocuparse por saber e con doce decimales
lugares: cualquier valor entre el 35% y el 40% proporciona una tasa de éxito extremadamente cercana al máximo. Para
Para más detalles matemáticos, consulte las notas al final del libro.
Página 45
*Más sobre los peligros computacionales de la teoría de juegos en el capítulo 11.

Página 46
2 Explorar / Explotar
Lo último frente a lo mejor
Tu estómago retumba. Vas al restaurante italiano que conoces

y amor, o el nuevo lugar tailandés que acaba de abrir? Tomas tu mejor
amigo o contactarse con un nuevo conocido que le gustaría conocer mejor?
Esto es demasiado difícil, tal vez te quedes en casa. ¿Cocinas una receta que
¿Sabes que va a funcionar o buscar en Internet una nueva inspiración? Nunca
mente, ¿qué tal si pides una pizza? ¿Obtiene su "habitual" o pregunta
sobre los especiales? Ya estás agotado antes de llegar al primer bocado.
Y la idea de grabar un disco, ver una película o leer un
libro, ¿ cuál? —Ya no parece tan relajante.
Todos los días nos vemos constantemente obligados a tomar decisiones entre opciones.
que difieren en una dimensión muy específica: ¿intentamos cosas nuevas o nos quedamos con
nuestros favoritos? Entendemos intuitivamente que la vida es un equilibrio entre
novedad y tradición, entre lo último y lo más grande, entre tomar
riesgos y saborear lo que conocemos y amamos. Pero al igual que con el look-or-jump
dilema de la búsqueda de apartamentos, la pregunta sin respuesta es: ¿qué equilibrio?
En el clásico Zen de 1974 y el arte del mantenimiento de motocicletas , Robert
Pirsig critica el abridor de la conversación "¿Qué hay de nuevo?", Argumentando que el
pregunta, "si se persigue exclusivamente, da como resultado un desfile interminable de trivia
y la moda, el limo del mañana ". Apoya una alternativa tan ampliamente
superior: "¿Qué es lo mejor?"
Página 47
Pero la realidad no es tan sencilla. Recordando que cada "mejor" canción y

El restaurante entre tus favoritos comenzó humildemente como algo simplemente "nuevo"
para
y portiloestanto,
un recordatorio
lo nuevo es de que es posible
realmente que
digno de alaún haya
menos mejores
parte éxitos atención.
de nuestra desconocidos por ahí:
Los aforismos desgastados reconocen esta tensión pero no la resuelven. "Hacer
nuevos amigos, pero conserve los viejos / Esos son de plata, estos son de oro ”y“ Hay
no hay vida tan rica y rara / Pero un amigo más podría entrar allí ”son ciertos
suficiente; ciertamente, su escansión es intachable. Pero no nos dicen
cualquier cosa útil sobre la proporción de, digamos, "plata" y "oro" que hace que el
la mejor aleación de una vida bien vivida.
Los informáticos han estado trabajando para encontrar este equilibrio durante más
de cincuenta años. Incluso tienen un nombre para ello: el intercambio explorar / explotar.
Explorar / Explotar
En inglés, las palabras "explorar" y "explotar" vienen cargadas con

connotaciones opuestas. Pero para un informático, estas palabras tienen mucho
significados más específicos y neutrales. En pocas palabras, la exploración se está acumulando
información, y la explotación es utilizar la información que tienes para obtener una
buen resultado conocido.
Es bastante intuitivo que nunca explorar no es una forma de vivir. Pero también es
Vale la pena mencionar que nunca explotar puede ser tan malo. En el
definición de la ciencia de la computación, la explotación en realidad viene a caracterizar
muchos de los que consideramos los mejores momentos de la vida. Una reunión familiar
juntos en las vacaciones es explotación. También lo es un ratón de biblioteca que se instala en un
silla de lectura con una taza de café caliente y un favorito querido, o una banda
tocando sus mayores éxitos ante una multitud de admiradores adoradores, o una pareja que ha
resistió la prueba del tiempo bailando "su canción".
Además, la exploración puede ser una maldición.
Parte de lo bueno de la música, por ejemplo, es que constantemente hay
cosas nuevas para escuchar. O, si eres un periodista musical, parte de lo que
Lo terrible de la música es que constantemente hay cosas nuevas que escuchar.
Ser un periodista musical significa girar el dial de exploración hasta el final
Página 48
11, donde no hay más que cosas nuevas todo el tiempo. Los amantes de la música pueden
imagina trabajar en periodismo musical como un paraíso, pero cuando
Tienes que explorar constantemente lo nuevo, nunca podrás disfrutar de los frutos de tu
el conocimiento, un tipo particular de infierno. Pocas personas saben esto
experiencia tan profunda como Scott Plagenhoef, el ex editor en jefe de
Pitchfork . "Intentas encontrar espacios cuando trabajas para escuchar
algo que solo quieres escuchar ”, dice sobre la vida de un crítico. Su
Necesidades desesperadas de dejar de vadear melodías inauditas de dudosa calidad.
y escuche lo que amaba eran tan fuertes que Plagenhoef pondría
sólo música nueva en su iPod, para hacerse físicamente incapaz de
abandonando sus deberes en esos momentos en los que realmente, realmente, realmente
quería escuchar a los Smith. Los periodistas son mártires, explorando para que
otros pueden explotar.
En informática, la tensión entre exploración y explotación
toma su forma más concreta en un escenario llamado el "bandido multi-armado
problema." El nombre extraño proviene del término coloquial para una tragamonedas de casino.
máquina, el "bandido de un brazo". Imagina entrar en un casino lleno de
diferentes máquinas tragamonedas, cada una con sus propias probabilidades de obtener una recompens
Por supuesto, es que no te dicen esas probabilidades de antemano: hasta que comiences a jugar,
no tendrá idea de qué máquinas son las más lucrativas ("sueltas", como
los aficionados a las máquinas tragamonedas lo llaman) y cuáles son solo sumideros de dinero.
Naturalmente, está interesado en maximizar sus ganancias totales. Y es
claro que esto implicará una combinación de tirar de los brazos
diferentes máquinas para probarlas (explorar) y favorecer la mayoría
máquinas prometedoras que ha encontrado (explotación).
Para tener una idea de las sutilezas del problema, imagine que se enfrenta a
solo dos maquinas. Uno que hayas jugado un total de 15 veces; 9 veces pagó
y 6 veces no lo hizo. El otro lo has jugado solo dos veces, y una vez
pagó y una vez no lo hizo. ¿Cuál es más prometedor?
Simplemente dividir las ganancias por el número total de tirones le dará la
"valor esperado" de la máquina, y por este método la primera máquina claramente
sale adelante. Su registro de 9 a 6 hace un valor esperado del 60%,
mientras que el registro 1–1 de la segunda máquina arroja un valor esperado de solo
Página 49
50%. Pero hay más que eso. Después de todo, solo dos tirones no son realmente
muchisimo. Así que hay un sentido en el que todavía no sabemos qué tan bueno es el
En realidad, la segunda máquina podría serlo.
Elegir un restaurante o un álbum es, en efecto, cuestión de decidir
qué brazo tirar en el casino de la vida. Pero entendiendo el explorar / explotar
La compensación no es solo una forma de mejorar las decisiones sobre dónde comer o qué
escucha a. También proporciona información fundamental sobre cómo nuestros objetivos deben
cambian a medida que envejecemos, y por qué el curso de acción más racional no siempre
tratando de elegir lo mejor. Y resulta estar en el corazón de, entre otros
cosas, diseño web y ensayos clínicos, dos temas que normalmente no
mencionado en la misma oración.
Las personas tienden a tratar las decisiones de forma aislada, a concentrarse en encontrar cada vez
el resultado con el valor esperado más alto. Pero las decisiones son casi
nunca aislado, y el valor esperado no es el final de la historia. Si eres
pensando no solo en la próxima decisión, sino en todas las decisiones que está tomando
va a hacer aproximadamente las mismas opciones en el futuro, la exploración / explotación
La compensación es crucial para el proceso. De esta manera, escribe el matemático Peter
Whittle, el problema de los bandidos "encarna en forma esencial un conflicto evidente
en toda acción humana ".
Entonces, ¿cuál de esos dos brazos deberías tirar? Es una pregunta capciosa. Eso
depende completamente de algo que aún no hemos discutido: cuánto tiempo
planea estar en el casino.
Aprovecha el intervalo
"Carpe diem", insta a Robin Williams en una de las escenas más memorables
de la película de 1989 Dead Poets Society . Aprovechen el día, muchachos. Haz tu vida
extraordinario."
Es un consejo increíblemente importante. También es algo contradictorio en sí mismo.
Aprovechar un día y aprovechar una vida son dos esfuerzos completamente diferentes. Nosotros
tienen la expresión "Come, bebe y diviértete, porque mañana moriremos", pero
quizás también deberíamos tener su inverso: "Empiece a aprender un nuevo idioma o
un instrumento, y charlar con un extraño, porque la vida es larga, y
Página 50
quién sabe qué alegría podría florecer durante muchos años ”. Cuando
equilibrando las experiencias favoritas y las nuevas, nada importa tanto como
el intervalo durante el cual planeamos disfrutarlos.
"Es más probable que pruebe un nuevo restaurante cuando me mudo a una ciudad que
cuando me vaya ", explica el científico de datos y bloguero Chris Stucchio,
veterano de lidiar con la compensación explorar / explotar tanto en su trabajo como en
su vida. "En general, voy a restaurantes que conozco y amo ahora, porque sé
Me iré de Nueva York bastante pronto. Mientras que hace un par de años
me mudé a Pune, India, y solo comía jodidamente en todos los lugares que no
parece que me va a matar. Y cuando salía de la ciudad volví a
todos mis viejos favoritos, en lugar de probar cosas nuevas ... Incluso si encuentro un
un lugar un poco mejor, solo voy a ir allí una o dos veces, así que ¿por qué tomar
¿el riesgo?"
Una propiedad aleccionadora de probar cosas nuevas es que el valor de la exploración,
de encontrar un nuevo favorito, solo puede disminuir con el tiempo, ya que el resto
las oportunidades para saborearlo disminuyen. Descubriendo un café encantador en tu
anoche en la ciudad no te da la oportunidad de volver.
La otra cara es que el valor de la explotación solo puede aumentar con el tiempo.
El café más encantador que conoces hoy es, por definición, al menos como
encantador como el café más encantador que conociste el mes pasado. (Y si tienes
encontró otro favorito desde entonces, podría ser más. Así que explore
cuando tenga tiempo para utilizar el conocimiento resultante, explote cuando
estás listo para sacar provecho. El intervalo marca la estrategia.
Curiosamente, dado que el intervalo hace la estrategia, entonces al observar el
estrategia también podemos inferir el intervalo. Tomemos Hollywood, por ejemplo:
Entre las diez películas más taquilleras de 1981, solo dos fueron secuelas. En
1991, eran tres. En 2001, eran cinco. Y en 2011, ocho de los diez primeros
Las películas más taquilleras fueron secuelas. De hecho, 2011 estableció un récord para
mayor porcentaje de secuelas entre los principales lanzamientos de estudios. Entonces 2012
inmediatamente rompió ese récord; el próximo año volvería a romperlo. En
Diciembre de 2012, el periodista Nick Allen miraba hacia adelante con palpable fatiga
al año que viene:
Página 51
El público recibirá una sexta ración de X-Men más Fast and Furious 6 , Die Hard 5 , Scary
Película 5 y actividad paranormal 5 . También habrá Iron Man 3 , The Hangover 3 y
segundas salidas para Los Muppets , Los Pitufos , GI Joe y Bad Santa .
Desde la perspectiva de un estudio, una secuela es una película con una base de fans garantizada:
una fuente de ingresos, una cosa segura, una proeza. Y una sobrecarga de señales de cosas seguras
un enfoque a corto plazo, como con Stucchio cuando salía de la ciudad. los
es más probable que las secuelas sean éxitos este año que las películas nuevas, pero
¿De dónde vendrán las queridas franquicias del futuro? Tal secuela
el diluvio no solo es lamentable (ciertamente los críticos creen que sí); también es algo
conmovedor. Al entrar en una fase casi puramente centrada en la explotación, la película
la industria parece indicar la creencia de que está cerca del final de su intervalo.
Una mirada a la economía de Hollywood confirma esta corazonada. Beneficios de
los estudios cinematográficos más grandes se redujeron en un 40% entre 2007 y 2011, y las entradas
las ventas han disminuido en siete de los últimos diez años. Como dice The Economist ,
"Exprimidos entre el aumento de los costos y la caída de los ingresos, los grandes estudios han
respondió tratando de hacer más películas que creen que serán un éxito: por lo general
secuelas, precuelas o cualquier cosa con personajes con reconocimiento de nombre ".
En otras palabras, están tirando de los brazos de las mejores máquinas que tienen.
antes de que el casino los descarte.
Ganar-quedarse
Encontrar algoritmos óptimos que nos digan exactamente cómo manejar el

El problema de los bandidos armados ha demostrado ser un desafío increíble. De hecho, como Peter
Whittle relata, durante los esfuerzos de la Segunda Guerra Mundial para resolver la pregunta "entonces
agotó las energías y las mentes de los analistas aliados ... que la sugerencia era
hizo que el problema se dejara caer sobre Alemania, como el último instrumento
de sabotaje intelectual ".
Los primeros pasos hacia una solución se dieron en los años posteriores a la guerra,
cuando el matemático de Columbia Herbert Robbins demostró que hay una
estrategia simple que, aunque no es perfecta, viene con buenas garantías.
Página 52
Robbinsyconsideró
máquinas, específicamente
propuso una el caso
solución llamada en el que
Win-Stay, hay exactamente dos ranuras
Lose-Shift
algoritmo: elige un brazo al azar y sigue tirando de él mientras se mantenga
pagando. Si el brazo no da resultado después de un tirón en particular, cambie a
el otro. Aunque esta simple estrategia está lejos de ser una solución completa,
Robbins demostró en 1952 que funciona mejor que el azar.
Siguiendo a Robbins, una serie de artículos examinó la "permanencia en un ganador"
principio más. Intuitivamente, si ya estuvieras dispuesto a tirar de un brazo, y
acaba de dar sus frutos, eso solo debería aumentar su estimación de su valor, y
solo deberías estar más dispuesto a tirar de él de nuevo. Y de hecho, ganar-quedarse gira
ser un elemento de la estrategia óptima para equilibrar la exploración y
explotación en una amplia gama de condiciones.
Pero perder el turno es otra historia. Cambiar de brazos cada vez que uno falla es un
movimiento bastante precipitado. Imagina ir a un restaurante cien veces, cada vez
tener una comida maravillosa. ¿Sería suficiente una decepción para inducir
que te rindas? Las buenas opciones no deben ser penalizadas con demasiada fuerza por
siendo imperfecto.
Más significativamente, Win-Stay, Lose-Shift no tiene ninguna noción de la
intervalo sobre el que está optimizando. Si tu restaurante favorito
te decepcionó la última vez que comiste allí, ese algoritmo siempre te dice
debería ir a otro lugar, incluso si es su última noche en la ciudad.
Aún así, el trabajo inicial de Robbins sobre el problema de los bandidos con múltiples brazos comenzó
a partir de una literatura sustancial, y los investigadores lograron un progreso significativo en
los próximos años. Richard Bellman, matemático de RAND
Corporation, encontró una solución exacta al problema para los casos en los que
saber de antemano exactamente cuántas opciones y oportunidades tendremos en
total. Al igual que con el problema de la secretaria de información completa, el truco de Bellman fue
esencialmente para trabajar hacia atrás, comenzando por imaginar el tirón final y
considerando qué máquina tragamonedas elegir dados todos los resultados posibles
de las decisiones anteriores. Habiendo descubierto eso, entonces recurrirías al
penúltima oportunidad, luego la anterior, y la anterior a esa,
todo el camino de regreso al principio.
Página 53
Las respuestas que surgen del método de Bellman son férreas, pero con
muchas opciones y una visita prolongada al casino, puede requerir una experiencia vertiginosa, o
imposible — cantidad de trabajo. Es más, incluso si somos capaces de calcular
todos los futuros posibles, por supuesto, no siempre sabemos exactamente cuántos
oportunidades (o incluso cuántas opciones) tendremos. Por estas razones, el
El problema de los bandidos armados múltiples permaneció efectivamente sin resolver. En Whittle's
palabras, "rápidamente se convirtió en un clásico y un sinónimo de intransigencia".
El índice de Gittins
Sin embargo, como sucede tan a menudo en matemáticas, lo particular es la puerta de entrada a
el universal. En la década de 1970, la corporación Unilever pidió a un joven
matemático llamado John Gittins para ayudarlos a optimizar algunos de sus medicamentos
Ensayos. Inesperadamente, lo que obtuvieron fue la respuesta a un acertijo matemático.
que había quedado sin resolver durante una generación.
Gittins, que ahora es profesor de estadística en Oxford, reflexionó sobre la
pregunta planteada por Unilever. Dados varios compuestos químicos diferentes,
¿Cuál es la forma más rápida de determinar qué compuesto es probable que sea
eficaz contra una enfermedad? Gittins trató de plantear el problema de la manera más
forma general que podía: múltiples opciones a seguir, una probabilidad diferente de
recompensa por cada opción, y una cierta cantidad de esfuerzo (o dinero, o tiempo) para
ser distribuidos entre ellos. Fue, por supuesto, otra encarnación del
Problema de bandidos con múltiples brazos.
Tanto las compañías farmacéuticas con fines de lucro como la profesión médica que
servicio se enfrentan constantemente a las demandas competitivas de los
explorar / explotar la compensación. Las empresas quieren invertir dinero en I + D en
descubrimiento de nuevos medicamentos, pero también quieren asegurarse de que su rentable corriente
las líneas de productos están floreciendo. Los médicos quieren recetar los mejores
tratamientos para que los pacientes reciban la atención que necesitan, pero también quieren
Fomentar estudios experimentales que puedan resultar incluso mejores.
En ambos casos, en particular, no está del todo claro cuál es el intervalo relevante
debería ser. En cierto sentido, tanto las compañías farmacéuticas como los médicos están interesados en
el futuro indefinido . Las empresas quieren estar teóricamente para siempre,
Página 54
y en el aspecto médico, un gran avance podría ayudar a las personas que

ni siquiera he nacido todavía. Sin embargo, el presente tiene mayor prioridad: una
Un paciente curado hoy se considera más valioso que uno curado a la semana o un
año a partir de ahora, y ciertamente lo mismo puede decirse de las ganancias. Economistas
referirse a esta idea, de valorar el presente más que el futuro, como
"Descuento".
A diferencia de los investigadores anteriores, Gittins se acercó al bandido de múltiples brazos
problema en esos términos. Concibió el objetivo como maximizar las recompensas, no
por un intervalo de tiempo fijo, pero por un futuro que es infinito pero descontado.
Tal descuento no nos es ajeno a nuestras propias vidas. Después de todo, si
visita una ciudad para unas vacaciones de diez días, entonces debería hacer su
decisiones de restaurantes con un intervalo fijo en mente; pero si vives en el
ciudad, esto no tiene mucho sentido. En cambio, puede imaginarse el
el valor de las recompensas disminuye a medida que avanzan en el futuro: a usted le importa
más sobre la comida que vas a comer esta noche que la comida a la que vas
comer mañana, y más sobre la comida de mañana que una al año desde
ahora, con los detalles de cuánto más dependiendo de su particular
"Función de descuento". Gittins, por su parte, asumió que el
El valor asignado a las recompensas disminuye geométricamente: es decir, cada restaurante
La visita que realiza vale una fracción constante de la anterior. Si, digamos, tu
cree que hay un 1% de probabilidad de que lo atropelle un autobús en un día determinado, entonces
Deberías valorar la cena de mañana en el 99% del valor de la de esta noche, aunque solo sea
porque es posible que nunca puedas comerlo.
Trabajando con este supuesto de descuento geométrico, Gittins
investigó una estrategia que pensó que "al menos sería una buena
aproximación ”: pensar en cada brazo del bandido de múltiples brazos
por separado de los demás, y tratar de calcular el valor de ese brazo en su
propio. Lo hizo imaginando algo bastante ingenioso: un soborno.
En el popular programa de televisión Deal or No Deal , un concursante
elige uno de los veintiséis maletines, que contienen premios que van desde un
centavo a un millón de dólares. A medida que avanza el juego, un personaje misterioso
llamado, el banquero llamará periódicamente y ofrecerá al concursante varios
sumas de dinero para no abrir el maletín elegido. Depende del concursante
Página 55
decidir a qué precio están dispuestos a tomar una cosa segura sobre la incertidumbre
del premio maletín.
Gittins (aunque muchos años antes del primer episodio de Deal or No Deal
al aire) se dio cuenta de que el problema de los bandidos con múltiples brazos no es diferente. Para
cada máquina tragamonedas de la que sabemos poco o nada, hay algunas
tasa de pago garantizada que, si se nos ofrece en lugar de esa máquina,
hacernos bastante contentos de no volver a tirar de su mango nunca más. Este número, que
Gittins llamó el "índice de asignación dinámica", y que el mundo ahora
conocido como el índice de Gittins, sugiere una estrategia obvia en el casino
piso: siempre toca el brazo con mayor índice. *
De hecho, la estrategia del índice resultó ser más que una buena
aproximación. Resuelve completamente el bandido de múltiples brazos con
pagos geométricamente descontados. La tensión entre exploración y
la explotación se resuelve en la tarea más simple de maximizar una sola cantidad
eso explica ambos. Gittins es modesto sobre el logro: "No es
bastante el último teorema de Fermat ", dice con una sonrisa, pero es un teorema
que puso fin a un importante conjunto de preguntas sobre la exploración / explotación
dilema.
Ahora, calculando realmente el índice de Gittins para una máquina específica, dado
su historial y nuestra tasa de descuento, todavía está bastante involucrado. Pero una vez
se conoce el índice de Gittins para un conjunto particular de suposiciones, se puede usar
para cualquier problema de esa forma. Fundamentalmente, ni siquiera importa cuántos
los brazos están involucrados, ya que el índice para cada brazo se calcula por separado.
En la tabla de la página siguiente, proporcionamos los valores del índice de Gittins para up
a nueve éxitos y fracasos, asumiendo que una recompensa en nuestro próximo tirón es
vale el 90% de una recompensa ahora. Estos valores se pueden utilizar para resolver una variedad de
problemas cotidianos de bandidos armados múltiples. Por ejemplo, bajo estos
suposiciones, debería, de hecho, elegir la máquina tragamonedas que tiene una pista
récord de 1 a 1 (y un valor esperado del 50%) sobre el que tiene una pista
récord de 9–6 (y un valor esperado del 60%). Buscando lo relevante
coordenadas en la tabla muestra que la máquina menos conocida tiene un índice
de 0.6346, mientras que la máquina más jugada obtiene solo 0.6300. Problema
resuelto: prueba suerte esta vez y explora.
Página 56
Al observar los valores del índice de Gittins en la tabla, hay algunos otros
observaciones interesantes. Primero, puede ver el principio de ganar-permanecer en funcionamiento:
a medida que avanza de izquierda a derecha en cualquier fila, las puntuaciones del índice siempre aume
si un brazo es el correcto para tirar, y ese tirón es un ganador, entonces
(siguiendo el cuadro de la derecha) solo puede tener más sentido tirar del
mismo brazo otra vez. En segundo lugar, puede ver dónde lo llevaría a perder el turno.
problema. Tener nueve victorias iniciales seguidas de una derrota te da un índice de
0,8695, que sigue siendo más alto que la mayoría de los demás valores de la tabla, por lo que
probablemente deberías quedarte con ese brazo durante al menos otro tirón.
Valores del índice de Gittins en función de las ganancias y las pérdidas, asumiendo que una recompensa la próxima vez vale el 90%
de una recompensa ahora.
Pero quizás la parte más interesante de la tabla es la entrada superior izquierda. A

registro de 0-0 (un brazo que es completamente desconocido) tiene un valor esperado
de 0,5000 pero un índice de Gittins de 0,7029. En otras palabras, algo que tienes
ninguna experiencia en absoluto es más atractiva que una máquina que usted
saber paga siete de cada diez veces! A medida que baja por la diagonal, observe
que un registro de 1 a 1 produce un índice de 0,6346, un registro de 2 a 2 produce
0,6010 y así sucesivamente. Si ese 50% de rendimiento exitoso persiste, el índice
Página 57
en última instancia, converge en 0.5000, ya que la experiencia confirma que el
de hecho, la máquina no es nada especial y quita el "bono" que estimula
exploración adicional. Pero la convergencia ocurre con bastante lentitud; los
El bono de exploración es una fuerza poderosa. De hecho, tenga en cuenta que incluso una falla en
el primer tirón, que produce un registro de 0 a 1, lo convierte en un índice de Gittins
eso todavía está por encima del 50%.
También podemos ver cómo cambia la compensación explorar / explotar a medida que cambiamos
la forma en que estamos descontando el futuro. La siguiente tabla presenta exactamente
la misma información que la anterior, pero asume que una recompensa próxima
el tiempo vale el 99% de uno ahora, en lugar del 90%. Con el futuro ponderado
casi tan fuerte como el presente, el valor de hacer un descubrimiento casual,
en relación con tomar una cosa segura, sube aún más. Aquí, un totalmente no probado
máquina con un registro 0-0 vale una probabilidad garantizada del 86,99% de
¡pagar!
Valores del índice de Gittins en función de las ganancias y las pérdidas, asumiendo que una recompensa la próxima vez vale un 99%
de una recompensa ahora.
El índice de Gittins, entonces, proporciona una justificación formal y rigurosa para

preferir lo desconocido, siempre que tengamos la oportunidad de explotar el
Página 58
resultados de lo que aprendemos de la exploración. El viejo adagio nos dice que "el
el césped siempre es más verde al otro lado de la cerca ", pero las matemáticas nos dicen
por qué: lo desconocido tiene la posibilidad de ser mejor, incluso si realmente lo esperamos
que no sea diferente, o si es probable que sea peor. El novato no probado es
vale más (a principios de la temporada, de todos modos) que el veterano de aparentemente
igual capacidad, precisamente porque sabemos menos de él. Exploración en
en sí mismo tiene valor, ya que probar cosas nuevas aumenta nuestras posibilidades de encontrar el
mejor. Por lo tanto, teniendo en cuenta el futuro, en lugar de centrarse solo en el
presente, nos impulsa hacia la novedad.
El índice de Gittins proporciona una solución sorprendentemente sencilla para
el problema de los bandidos armados múltiples. Pero no necesariamente cierra el libro
en el rompecabezas, o ayúdanos a navegar por todas las ventajas y desventajas de explorar / explotar
la vida cotidiana. Por un lado, el índice de Gittins es óptimo solo bajo algunos
supuestos. Se basa en el descuento geométrico de recompensas futuras, valorando
cada tirón en una fracción constante de la anterior, que es algo que
una variedad de experimentos en economía y psicología del comportamiento sugieren
la gente no lo hace. Y si hay un costo por cambiar entre opciones, el
La estrategia de Gittins tampoco es óptima. (La hierba al otro lado de
la cerca puede parecer un poco más verde, pero eso no necesariamente garantiza
escalar la valla, y mucho menos sacar una segunda hipoteca).
lo que es más importante, es difícil calcular el índice de Gittins sobre la marcha. Si tu
Lleve consigo una tabla de valores de índice que puede optimizar sus opciones gastronómicas,
pero el tiempo y el esfuerzo involucrados pueden no valer la pena. ("Espera, puedo resolver
este argumento. Ese restaurante estuvo bien 29 de 35 veces, pero este otro
uno ha sido bueno 13 de 16 veces, por lo que los índices de Gittins son ... Oye,
¿A dónde fueron todos? ")
En el tiempo transcurrido desde el desarrollo del índice de Gittins, tales preocupaciones
han enviado informáticos y estadísticos en busca de métodos más sencillos y
Estrategias más flexibles para hacer frente a bandidos armados múltiples. Estas
Las estrategias son más fáciles de aplicar para los humanos (y las máquinas) en una variedad de
situaciones que procesar el índice de Gittins óptimo, sin dejar de proporcionar
rendimiento comparablemente bueno. También interactúan con uno de nuestros mayores
los miedos humanos con respecto a las decisiones sobre qué oportunidades tomar.
Página 59
Arrepentimiento y Optimismo
Lamenta, he tenido algunos. Pero igualmente, muy pocos como para mencionarlos.
-FRANK SINATRA
En lo que a mí respecta, soy optimista. No parece ser de mucha utilidad ser

Algo más.
—WINSTON CHURCHILL
Si el índice de Gittins es demasiado complicado, o si no estás en una situación bien

caracterizado por descuentos geométricos, entonces tiene otra opción:
centrarse en el arrepentimiento . Cuando elegimos qué comer, con quién pasar el tiempo o
qué ciudad para vivir, el arrepentimiento cobra gran importancia, presentado con un conjunto de bueno
opciones, es fácil torturarnos a nosotros mismos con las consecuencias de hacer
Mala decisión. Estos lamentos son a menudo por las cosas que no hicimos, la
opciones que nunca probamos. En las memorables palabras del teórico de la gestión
Chester Barnard, “Intentar y fallar es al menos aprender; fallar intentar es sufrir
la inestimable pérdida de lo que podría haber sido ".
El arrepentimiento también puede ser muy motivador. Antes de que decidiera empezar
Amazon.com, Jeff Bezos tenía un puesto seguro y bien pagado en el
empresa de inversión DE Shaw & Co. en Nueva York. Comenzando un en línea
librería en Seattle iba a ser un gran salto, algo que su jefe
(ese es DE Shaw) le aconsejó que lo pensara detenidamente. Dice Bezos:
El marco que encontré, que hizo que la decisión fuera increíblemente fácil, fue lo que llamé, que
solo un nerd llamaría: un "marco de minimización de arrepentimientos". Entonces quise proyectarme
Adelante a los 80 años y diga: “Bien, ahora estoy mirando hacia atrás en mi vida. Quiero haber minimizado
la cantidad de arrepentimientos que tengo ". Sabía que a los 80 años no me iba a arrepentir de haberlo intentado
esta. No me iba a arrepentir de haber intentado participar en esta cosa llamada Internet que pensé
iba a ser un gran problema. Sabía que si fallaba no me arrepentiría, pero sabía que
una cosa de la que podría arrepentirme es no haberlo intentado nunca. Sabía que eso me perseguiría todos los días
y así, cuando lo pensé de esa manera, fue una decisión increíblemente fácil.
La informática no puede ofrecerte una vida sin arrepentimientos. Pero puede,

potencialmente, ofrecerle justo lo que Bezos estaba buscando: una vida con un mínimo
Página 60
arrepentirse.
El arrepentimiento es el resultado de comparar lo que realmente hicimos con lo que
han sido mejores en retrospectiva. En un bandido de múltiples brazos, Barnard's
De hecho, la "pérdida inestimable" se puede medir con precisión, y al arrepentimiento se le asigna un
número: es la diferencia entre el pago total obtenido siguiendo un
estrategia particular y la recompensa total que teóricamente podría haber sido
obtenido simplemente tirando del mejor brazo cada vez (si sólo hubiéramos sabido
desde el principio cuál fue). Podemos calcular este número para diferentes
estrategias, y busque aquellas que la minimicen.
En 1985, Herbert Robbins disparó por segunda vez contra el bandido de múltiples brazos.
problema, unos treinta años después de su trabajo inicial en Win-Stay, Lose-Shift.
Él y su colega matemático de Columbia Tze Leung Lai pudieron demostrar
varios puntos clave sobre el arrepentimiento. Primero, asumiendo que no eres omnisciente, tu
La cantidad total de arrepentimiento probablemente nunca dejará de aumentar, incluso si elige
la mejor estrategia posible, porque incluso la mejor estrategia no es perfecta
cada vez. En segundo lugar, el arrepentimiento aumentará a un ritmo más lento si elige el mejor
estrategia que si eliges a otros; es más, con una buena estrategia lamento
La tasa de crecimiento disminuirá con el tiempo, a medida que aprenda más sobre el problema.
y son capaces de tomar mejores decisiones. En tercer lugar, y más específicamente, el
El mínimo arrepentimiento posible, asumiendo nuevamente la no omnisciencia, es el arrepentimiento de
aumenta a una tasa logarítmica con cada tirón del mango.
El arrepentimiento creciente logarítmicamente significa que haremos tantos
errores en nuestros primeros diez tirones como en los siguientes noventa, y tantos en nuestro
primer año como en el resto de la década combinada. (La primera década
Los errores, a su vez, son tantos como cometeremos durante el resto del siglo).
Esa es una medida de consuelo. En general, no podemos esperar de manera realista
algún día para no tener más arrepentimientos. Pero si seguimos un arrepentimiento
minimizando el algoritmo, cada año podemos esperar tener menos arrepentimientos nuevos
que hicimos el año anterior.
Comenzando con Lai y Robbins, los investigadores de las últimas décadas han establecido
acerca de buscar algoritmos que ofrezcan la garantía de un arrepentimiento mínimo. De
los que han descubierto, los más populares se conocen como Upper
Algoritmos de Confidence Bound .
Página 61
Las presentaciones visuales de estadísticas a menudo incluyen las llamadas barras de error que se ext
por encima y por debajo de cualquier punto de datos, lo que indica incertidumbre en la medición;
las barras de error muestran el rango de valores plausibles que la cantidad
medido podría haberlo hecho. Este rango se conoce como "confianza
intervalo ", y a medida que obtenemos más datos sobre algo, el intervalo de confianza
se encogerá, reflejando una evaluación cada vez más precisa. (Por ejemplo, un
La máquina tragamonedas que ha pagado una vez de cada dos tiradas tendrá una mayor
intervalo de confianza, aunque el mismo valor esperado, como una máquina que tiene
pagó cinco veces en diez tirones.) En un problema de bandidos con múltiples brazos, un Upper
El algoritmo Confidence Bound dice, simplemente, elegir la opción para
cuál es la parte superior del intervalo de confianza más alto.
Al igual que el índice de Gittins, por lo tanto, los algoritmos de límite de confianza superior
Asigne un solo número a cada brazo del bandido de múltiples brazos. Y eso
El número se establece en el valor más alto que el brazo podría tener razonablemente, basado
sobre la información disponible hasta el momento. Así que un límite de confianza superior
al algoritmo no le importa qué brazo ha funcionado mejor hasta ahora; en cambio, es
elige el brazo que razonablemente podría funcionar mejor en el futuro. Si tu
nunca antes había estado en un restaurante, por ejemplo, entonces, por lo que sabe,
podría ser genial. Incluso si ha ido allí una o dos veces y ha probado un
algunos de sus platos, es posible que no tenga suficiente información para descartar
la posibilidad de que aún pueda resultar mejor que su favorito habitual. Igual que
el índice de Gittins, el límite superior de confianza es siempre mayor que el
valor esperado, pero cada vez menos a medida que adquirimos más experiencia con un
opción particular. (Un restaurante con una sola crítica mediocre todavía conserva una
potencial de grandeza que está ausente en un restaurante con cientos de
revisiones.) Las recomendaciones dadas por Upper Confidence Bound
Los algoritmos serán similares a los proporcionados por el índice de Gittins, pero
son significativamente más fáciles de calcular y no requieren la suposición de
descuento geométrico.
Los algoritmos de límite de confianza superior implementan un principio que
ha sido apodado "optimismo ante la incertidumbre". Optimismo, muestran
puede ser perfectamente racional. Al centrarse en lo mejor que podría ser una opción ,
Dada la evidencia obtenida hasta ahora, estos algoritmos dan un impulso a
Página 62
posibilidades de las que sabemos menos. Como consecuencia, naturalmente inyectan un

dosis de exploración en el proceso de toma de decisiones, saltando a nuevos
opciones con entusiasmo porque cualquiera de ellas podría ser el próximo gran
cosa. El mismo principio ha sido utilizado, por ejemplo, por Leslie del MIT.
Kaelbling, que construye "robots optimistas" que exploran el espacio alrededor
ellos aumentando el valor del terreno inexplorado. Y claramente tiene
implicaciones también para las vidas humanas.
El éxito de los algoritmos Upper Confidence Bound ofrece una
justificación en beneficio de la duda. Siguiendo los consejos de estos
algoritmos, debería estar emocionado de conocer gente nueva y probar cosas nuevas.
asumir lo mejor de ellos, en ausencia de evidencia en contrario. En
A largo plazo, el optimismo es la mejor prevención para el arrepentimiento.
Bandidos en línea
En 2007, el director de producto de Google, Dan Siroker, se ausentó para

únete a la campaña presidencial del entonces senador Barack Obama en Chicago.
A la cabeza del equipo de "New Media Analytics", Siroker trajo uno de los
prácticas web que se relacionan con el botón rojo brillante D ONATE de la campaña . los
El resultado fue nada menos que asombroso: $ 57 millones en donaciones adicionales.
fueron criados como resultado directo de su trabajo.
¿Qué le hizo exactamente a ese botón?
Él A / B lo probó.
Las pruebas A / B funcionan de la siguiente manera: una empresa redacta varios
versiones de una página web en particular. Quizás prueben diferentes colores o
imágenes, o diferentes titulares para un artículo de noticias, o diferentes arreglos
de elementos en la pantalla. Luego, asignan aleatoriamente a los usuarios entrantes a estos
varias páginas, generalmente en igual número. Un usuario puede ver un botón rojo,
mientras que otro usuario puede ver uno azul; uno puede ver D ONATE y otro
puede ver C ONTRIBUTE . Las métricas relevantes (p. Ej., Tasa de clics o
ingresos medios por visitante). Después de un período de tiempo, si
Se observan efectos estadísticamente significativos, la versión "ganadora" es
Página 63
normalmente bloqueado en su lugar, o se convierte en el control de otra ronda de

experimentos.
En el caso de la página de donaciones de Obama, las pruebas A / B de Siroker fueron
revelador. Por primera vez los visitantes al sitio de la campaña, un D Oñate y G ETA
El botón G IFT resultó ser el de mejor rendimiento, incluso después del costo de
Se tuvo en cuenta el envío de los obsequios. Para el boletín de noticias de larga data
suscriptores que nunca se había dado dinero, P ARRENDAMIENTO D ONATE trabajaron los mejores,
quizás apelando a su culpa. Para los visitantes que ya habían donado en el
En el pasado, C ONTRIBUTE funcionó mejor para asegurar donaciones de seguimiento: la lógica
siendo tal vez que la persona ya había "donado" pero siempre podía
“Contribuir” más. Y en todos los casos, ante el asombro de la campaña
equipo, una simple foto en blanco y negro de la familia Obama superó
cualquier otra foto o video que se le ocurra al equipo. El efecto neto de todos
estas optimizaciones independientes fueron gigantescas.
Si ha utilizado Internet básicamente durante la última década, entonces
ha sido parte del problema de exploración / explotación de otra persona. Compañías
quieren descubrir las cosas que les hacen ganar más dinero mientras
simultáneamente haciendo todo lo que puedan: explorar, explotar. Grande
empresas de tecnología como Amazon y Google comenzaron a realizar pruebas A / B en vivo en
sus usuarios a partir de 2000, y durante los años siguientes Internet
se ha convertido en el experimento controlado más grande del mundo. Que son estos
empresas que exploran y explotan? En una palabra, tú: lo que sea que
te hace mover el mouse y abrir tu billetera.
Las empresas A / B prueban la navegación de su sitio, las líneas de asunto y el tiempo de
sus correos electrónicos de marketing y, a veces, incluso sus características y
precios. En lugar de "el" algoritmo de búsqueda de Google y "el" Amazon
flujo de pago, ahora hay permutaciones incalculables e insondablemente sutiles.
(Google probó infamemente cuarenta y un tonos de azul para una de sus barras de herramientas en
2009.) En algunos casos, es poco probable que algún par de usuarios tenga la
misma experiencia.
El científico de datos Jeff Hammerbacher, ex gerente del grupo de datos en
Facebook, una vez le dijo a Bloomberg Businessweek que "las mejores mentes de mi
generación está pensando en cómo hacer que las personas hagan clic en los anuncios ". Considéralo
Página 64
el aullido de los millennials , lo inmortal de Allen Ginsberg, vi lo mejor

mentes de mi generación destruidas por la locura ”fue para la Generación Beat.
La opinión de Hammerbacher sobre la situación fue que esta situación "apesta".
Pero independientemente de lo que uno haga con ella, la web está permitiendo una
ciencia experimental del clic que nunca había sido
soñado por los especialistas en marketing del pasado.
Sabemos lo que le sucedió a Obama en las elecciones de 2008, por supuesto. Pero
¿Qué pasó con su director de análisis, Dan Siroker? Después de la
inauguración, Siroker regresó al oeste, a California, y con su compañero Googler
Pete Koomen cofundó la empresa de optimización de sitios web Optimizely. Por el
Ciclo de elecciones presidenciales de 2012, su empresa contaba entre sus clientes
tanto la campaña de reelección de Obama como la campaña de los republicanos
retador Mitt Romney.
Aproximadamente una década después de su primer uso tentativo, las pruebas A / B no
ya es un arma secreta. Se ha convertido en una parte tan profundamente arraigada de cómo
los negocios y la política se llevan a cabo en línea para que se tomen efectivamente para
otorgado. La próxima vez que abra su navegador, puede estar seguro de que
colores, imágenes, texto, tal vez incluso los precios que ve, y ciertamente los anuncios
—Provienen de un algoritmo de exploración / explotación, que se ajusta a sus clics.
En este particular problema de bandidos con múltiples brazos, usted no es el jugador;
eres el premio gordo.
El proceso de las pruebas A / B en sí se ha perfeccionado cada vez más
tiempo. La configuración A / B más canónica: dividir el tráfico de manera uniforme entre
dos opciones, ejecutar la prueba durante un período de tiempo determinado y, a partir de entonces, dar
todo el tráfico hacia el ganador, puede que no sea necesariamente el mejor algoritmo para
resolver el problema, ya que significa que la mitad de los usuarios están atrapados
opción inferior mientras continúe la prueba. Y las recompensas por encontrar un
un mejor enfoque son potencialmente muy altos. Más del 90% de los
aproximadamente $ 50 mil millones en ingresos anuales provienen actualmente de pagos
publicidad, y el comercio en línea comprende cientos de miles de millones de dólares
un año. Esto significa que explorar / explotar algoritmos potencia eficazmente, tanto
económica y tecnológicamente, una fracción significativa de Internet
sí mismo. Los mejores algoritmos para usar siguen siendo muy controvertidos, con rival
Página 65
estadísticos, ingenieros y blogueros discutiendo sin cesar sobre el óptimo

forma de equilibrar la exploración y la explotación en todos los negocios posibles
guión.
Debatir las distinciones precisas entre varias tomas de la
El problema de explorar / explotar puede parecer irremediablemente arcano. De hecho, estos
las distinciones resultan ser inmensamente importantes, y no se trata solo de presidenciales
elecciones y la economía de Internet que están en juego.
También son vidas humanas.
Ensayos clínicos en ensayo
Entre 1932 y 1972, varios cientos de hombres afroamericanos con

sífilis en el condado de Macon, Alabama, no fue tratada deliberadamente por médicos
profesionales, como parte de un experimento de cuarenta años realizado por el Departamento de Salud P
Servicio conocido como el Estudio de Sífilis de Tuskegee. En 1966, Salud Pública
El empleado de servicio Peter Buxtun presentó una protesta. Presentó una segunda protesta en
1968. Pero no fue hasta que dio a conocer la historia a la prensa, apareció en el
Washington Star el 25 de julio de 1972 y fue la noticia de primera plana del New
York Times al día siguiente, que el gobierno de Estados Unidos finalmente detuvo el estudio.
Lo que siguió a la protesta pública y la subsecuente
audiencia, fue una iniciativa para formalizar los principios y estándares de
ética medica. Una comisión celebrada en la Conferencia pastoral de Belmont
Center en Maryland resultó en un documento de 1979 conocido como Belmont
Reporte. El Informe Belmont establece una base para la práctica ética de
experimentos médicos, de modo que el experimento de Tuskegee, un atroz,
incumplimiento inequívocamente inadecuado del deber de la profesión sanitaria con respecto a su
pacientes, es posible que nunca se repita. Pero también señala la dificultad, en muchos
otros casos, de determinar exactamente dónde se debe trazar la línea.
“La máxima hipocrática 'no hacer daño' ha sido durante mucho tiempo un
principio de ética médica ”, señala el informe. “[El fisiólogo]
Claude Bernard lo extendió al ámbito de la investigación, diciendo que uno debería
no dañar a una persona independientemente de los beneficios que puedan recibir los demás.
Sin embargo, incluso evitar el daño requiere aprender qué es dañino; y en el
Página 66
proceso de obtención de esta información, las personas pueden estar expuestas al riesgo de
dañar."
Por tanto, el Informe Belmont reconoce, pero no resuelve, la
tensión que existe entre actuar sobre la base de los mejores conocimientos y recopilar
más. También deja en claro que la recopilación de conocimientos puede ser muy valiosa
que algunos aspectos de la ética médica normal pueden suspenderse. Clínico
la prueba de nuevos medicamentos y tratamientos, señala el informe, a menudo requiere arriesgarse
daño a algunos pacientes, incluso si se toman medidas para minimizar ese riesgo.
El principio de beneficencia no siempre es tan inequívoco. Un problema ético difícil

permanece, por ejemplo, sobre la investigación [sobre enfermedades infantiles] que presenta más que un mínimo
riesgo sin perspectiva inmediata de beneficio directo para los niños involucrados. Algunos han argumentado
que tal investigación es inadmisible, mientras que otros han señalado que este límite descartaría
muchas investigaciones prometen grandes beneficios para los niños en el futuro. Aquí de nuevo, como con todos los duros
casos, los diferentes reclamos cubiertos por el principio de beneficencia pueden entrar en conflicto y
forzar decisiones difíciles.
Una de las cuestiones fundamentales que ha surgido en las décadas transcurridas desde la
El Informe Belmont es si el enfoque estándar para realizar estudios clínicos
los ensayos realmente minimizan el riesgo para los pacientes. En un ensayo clínico convencional,
los pacientes se dividen en grupos, y cada grupo se asigna para recibir un
tratamiento diferente durante la duración del estudio. (Solo en casos excepcionales
¿Se detiene un ensayo antes de tiempo?) Este procedimiento se enfoca decisivamente en
resolver la cuestión de qué tratamiento es mejor, en lugar de proporcionar
el mejor tratamiento para cada paciente en el propio ensayo. De esta manera opera
exactamente como la prueba A / B de un sitio web, con una cierta fracción de personas que reciben
una experiencia durante el experimento que eventualmente resultará inferior.
Pero los médicos, al igual que las empresas de tecnología, están obteniendo información sobre
¿Qué opción es mejor mientras avanza el juicio? Información que podría ser
utilizado para mejorar los resultados no solo para los pacientes futuros más allá del ensayo, sino
para los pacientes que se encuentran actualmente en él.
Hay millones de dólares en juego en experimentos para encontrar el óptimo
configuración de un sitio web, pero en ensayos clínicos, experimentando para encontrar
los tratamientos óptimos tienen consecuencias directas de vida o muerte. Y un creciente
Página 67
La comunidad de médicos y estadísticos cree que lo estamos haciendo mal: que

Deberíamos tratar la selección de tratamientos como un bandido de múltiples brazos.
problema, y tratando de obtener mejores tratamientos para las personas incluso cuando
el experimento está en curso.
En 1969, Marvin Zelen, un bioestadístico que ahora está en Harvard,
propuso realizar ensayos "adaptativos". Una de las ideas que sugirió fue una
algoritmo aleatorio de "jugar al ganador", una versión de Win-Stay, Lose-
Turno, en el que la posibilidad de utilizar un tratamiento determinado aumenta en cada
gana y disminuye por cada pérdida. En el procedimiento de Zelen, comienzas con un sombrero.
que contiene una bola para cada una de las dos opciones de tratamiento en estudio.
El tratamiento para el primer paciente se selecciona dibujando una pelota al azar.
del sombrero (la pelota se devuelve después). Si el tratamiento elegido es un
éxito, pones otra bola para ese tratamiento en el sombrero, ahora tienes
tres bolas, dos de las cuales son para el tratamiento exitoso. Si falla, entonces
pones otra bola para el otro tratamiento en el sombrero, haciéndolo más
probablemente elijas la alternativa.
El algoritmo de Zelen se utilizó por primera vez en un ensayo clínico dieciséis años después, para
un estudio de oxigenación por membrana extracorpórea, o "ECMO", un
enfoque audaz para el tratamiento de la insuficiencia respiratoria en los lactantes. Desarrollado en
la década de 1970 por Robert Bartlett de la Universidad de Michigan, ECMO toma
sangre que se dirige a los pulmones y la expulsa del cuerpo,
donde es oxigenado por una máquina y devuelto al corazón. Es un drástico
medida, con riesgos propios (incluida la posibilidad de embolia), pero
ofreció un posible enfoque en situaciones en las que no quedaban otras opciones.
En 1975, ECMO salvó la vida de una niña recién nacida en el condado de Orange,
California, para quienes ni siquiera un ventilador proporcionaba suficiente oxígeno.
Esa chica ahora ha celebrado su cuadragésimo cumpleaños y está casada con
hijos propios. Pero en sus inicios, la tecnología ECMO y
El procedimiento se consideró altamente experimental y los primeros estudios en adultos.
no mostró ningún beneficio en comparación con los tratamientos convencionales.
De 1982 a 1984, Bartlett y sus colegas de la Universidad de
Michigan realizó un estudio en recién nacidos con insuficiencia respiratoria. El equipo
estaba claro que querían abordar, como ellos mismos lo expresaron, “la cuestión ética de
Página 68
negar un tratamiento no probado pero que podría salvar vidas ", y

"Reacios a negar un tratamiento que salve vidas de pacientes alternativos simplemente
para cumplir con la técnica de asignación aleatoria convencional ". Por lo tanto, se dirigieron a
Algoritmo de Zelen. La estrategia dio como resultado que a un bebé se le asignara la
Tratamiento "convencional" y morir, y once bebés seguidos son
asignaron el tratamiento ECMO experimental, sobreviviendo todos. Entre
Abril y noviembre de 1984, una vez finalizado el estudio oficial, diez
bebés adicionales cumplieron los criterios para el tratamiento con ECMO. Ocho fueron tratados
con ECMO, y los ocho sobrevivieron. Dos fueron tratados de forma convencional y
ambos murieron.
Estos son números llamativos, pero poco después de que la Universidad de
El estudio de Michigan sobre ECMO se completó y se vio envuelto en una controversia.
Tener tan pocos pacientes en un ensayo que reciben el tratamiento convencional desviado
significativamente de la metodología estándar, y el procedimiento en sí fue
altamente invasivo y potencialmente riesgoso. Después de la publicación del artículo, Jim
Ware, profesor de bioestadística en la Escuela de Salud Pública de Harvard, y
sus colegas médicos examinaron los datos cuidadosamente y concluyeron que ellos
"No justificó el uso rutinario de ECMO sin más estudios". Así que Ware y
sus colegas diseñaron un segundo ensayo clínico, todavía tratando de equilibrar el
adquisición de conocimientos con el tratamiento eficaz de los pacientes pero utilizando un
diseño menos radical. Asignarían pacientes al azar a ECMO
o el tratamiento convencional hasta que un número preespecificado de muertes fue
observado en uno de los grupos. Luego cambiarían a todos los pacientes en
el estudio para el tratamiento más eficaz de los dos.
En la primera fase del estudio de Ware, cuatro de cada diez bebés que recibieron
el tratamiento convencional murió, y los nueve de los nueve bebés que recibieron ECMO
sobrevivió. Las cuatro muertes fueron suficientes para desencadenar una transición al segundo
fase, donde los veinte pacientes fueron tratados con ECMO y diecinueve
sobrevivió. Ware y sus colegas estaban convencidos y concluyeron que "es
difícil defender éticamente una mayor aleatorización ".
Pero algunos ya habían concluido esto antes del estudio de Ware, y estaban
vocal al respecto. Los críticos incluyeron a Don Berry, uno de los líderes mundiales
expertos en bandidos armados múltiples. En un comentario que se publicó junto a
Página 69
en el estudio Ware en Statistical Science , Berry escribió que "la aleatorización

pacientes a la terapia sin ECMO como en el estudio de Ware no era ético ... En mi
vista, el estudio de Ware no debería haberse realizado ".
Y, sin embargo, incluso el estudio de Ware no fue concluyente para todos en el campo médico.
comunidad. En la década de 1990 se realizó otro estudio sobre ECMO,
inscribiendo a casi doscientos niños en el Reino Unido. En lugar de
utilizando algoritmos adaptativos, este estudio siguió los métodos tradicionales,
dividir a los bebés al azar en dos grupos iguales. Los investigadores
justificó el experimento diciendo que la utilidad de ECMO “es controvertida
debido a la interpretación diversa de la evidencia disponible ". Mientras giraba
, la diferencia entre los tratamientos no fue tan pronunciada en el
Reino Unido como había sido en los dos estudios estadounidenses, pero los resultados
no obstante, se declararon "de acuerdo con las conclusiones preliminares anteriores
que una política de apoyo de ECMO reduce el riesgo de muerte ”. El costo de eso
¿conocimiento? Veinticuatro bebés más murieron en el grupo "convencional"
que en el grupo que recibió tratamiento con ECMO.
La dificultad generalizada para aceptar los resultados de la clínica adaptativa
Los juicios pueden parecer incomprensibles. Pero considere esa parte de lo que
El advenimiento de la estadística hizo para la medicina, a principios del siglo XX,
era transformarlo de un campo en el que los médicos tenían que persuadirse unos a otros
de formas ad hoc sobre cada nuevo tratamiento en uno donde tenían claro
directrices sobre qué tipo de pruebas eran y no eran convincentes.
Los cambios en la práctica estadística estándar aceptada tienen el potencial de alterar
este equilibrio, al menos temporalmente.
Después de la polémica sobre ECMO, Don Berry pasó de las estadísticas
departamento de la Universidad de Minnesota al MD Anderson Cancer
Center en Houston, donde ha utilizado métodos desarrollados al estudiar
bandidos armados múltiples para diseñar ensayos clínicos para una variedad de cáncer
tratos. Si bien sigue siendo uno de los críticos más vocales de randomized
ensayos clínicos, él no es de ninguna manera el único. En los últimos años, las ideas que ha
por lo que luchamos están finalmente comenzando a entrar en la corriente principal. En
En febrero de 2010, la FDA publicó un documento de "orientación", "Adaptativo
Diseñar ensayos clínicos para fármacos y productos biológicos ”, que sugiere, a pesar de una
Página 70
larga historia de apegarse a una opción en la que confían: que por fin podrían ser
dispuesto a explorar alternativas.
El mundo inquieto
Una vez que se familiarice con ellos, es fácil ver bandidos con varios brazos.
casi en todas partes donde miremos. Es raro que tomemos una decisión aislada
donde el resultado no nos proporciona ninguna información que usaremos
para tomar otras decisiones en el futuro. Así que es natural preguntar, como hicimos con
parada óptima, qué tan bien la gente generalmente tiende a resolver estos problemas—
una cuestión que ha sido ampliamente explorada en el laboratorio por
psicólogos y economistas del comportamiento.
En general, parece que la gente tiende a sobreexplorar, para favorecer la nueva
desproporcionadamente sobre los mejores. En una simple demostración de esto
fenómeno, publicado en 1966, Amos Tversky y Ward Edwards
llevó a cabo experimentos en los que a las personas se les mostró una caja con dos luces encendidas
y le dijo que cada luz se encendería en un porcentaje fijo (pero desconocido)
del tiempo. Luego se les dio 1,000 oportunidades para observar
qué luz se encendió, o apostar al resultado sin llegar a
observarlo. (A diferencia de una configuración de problema de bandidos más tradicional, aquí uno podrí
no haga un “tirón” que sea tanto una apuesta como una observación a la vez; Participantes
no sabría si sus apuestas habían valido la pena hasta el final.) Esto es puro
exploración versus explotación, enfrentando la obtención de información directamente
contra su uso. En su mayor parte, la gente adoptó una estrategia sensata de
observando por un tiempo, luego apostando en lo que parecía ser el mejor
resultado, pero constantemente pasaban mucho más tiempo observando de lo que pensaban
debería tener. Cuanto mas tiempo? En un experimento, se encendió una luz
El 60% del tiempo y el otro 40% del tiempo, una diferencia ni
particularmente descarado ni particularmente sutil. En ese caso, la gente eligió
observe 505 veces, en promedio, colocando apuestas las otras 495 veces. Pero el
las matemáticas dicen que deberían haber comenzado a apostar después de solo 38 observaciones—
dejando 962 oportunidades para sacar provecho.
Página 71
Otros estudios han arrojado conclusiones similares. En la década de 1990, Robert

Meyer y Yong Shi, investigadores de Wharton, realizaron un estudio en el que las personas
se les dio a elegir entre dos opciones, una con una posibilidad de pago conocida
y una desconocida, específicamente dos aerolíneas, una aerolínea establecida con un
tasa de puntualidad conocida y una nueva empresa sin un historial todavía. Dado
el objetivo de maximizar el número de llegadas a tiempo durante un período de
tiempo, la estrategia matemáticamente óptima es volar inicialmente solo el nuevo
aerolínea, siempre que la establecida no sea claramente mejor. Si en algún momento es
evidente que el portador conocido es mejor, es decir, si el índice de Gittins de
la nueva opción cae por debajo de la tasa de puntualidad del operador familiar, entonces usted
Debería cambiar con fuerza al familiar y nunca mirar hacia atrás. (Dado que en este
configuración, no puede obtener más información sobre la nueva empresa una vez que
dejar de volarlo, no tiene oportunidad de redimirse.) Pero en el
experimento, la gente tendía a utilizar la aerolínea no probada muy poco cuando era
bueno y demasiado cuando era malo. Tampoco hicieron descansos limpios
lejos de él, a menudo continuando alternando, particularmente cuando ninguna aerolínea
salía a tiempo. Todo esto es consistente con la tendencia a explorar en exceso.
Finalmente, los psicólogos Mark Steyvers, Michael Lee y E.-J.
Wagenmakers han realizado un experimento con un bandido de cuatro brazos, pidiendo a un
grupo de personas para elegir qué brazo jugar en una secuencia de quince
oportunidades. Luego clasificaron las estrategias que los participantes parecían
usar. Los resultados sugirieron que el 30% estaba más cerca de la estrategia óptima,
47% más se parecía a Win-Stay, Lose-Shift, y el 22% parecía moverse en
aleatorio entre seleccionar un nuevo brazo y jugar con el mejor brazo encontrado hasta ahora.
Una vez más, esto es coherente con la exploración excesiva, como ganar-quedarse, perder-turno y
de vez en cuando probar un brazo al azar, ambos llevarán a la gente a intentar
otras cosas que no sean la mejor opción al final del juego, cuando deberían ser
puramente explotador.
Entonces, aunque tendemos a comprometernos con una nueva secretaria demasiado pronto, parece q
tendemos a dejar de probar nuevas aerolíneas demasiado tarde. Pero así como hay un costo para no
tener una secretaria, hay un costo por comprometerse demasiado pronto con un particular
aerolínea: el mundo podría cambiar.
Página 72
El problema estándar de los bandidos armados múltiples asume que las probabilidades
con los que los brazos se amortizan se fijan en el tiempo. Pero eso no es necesariamente
cierto en las aerolíneas, restaurantes u otros contextos en los que la gente tiene que hacer
elecciones repetidas. Si las probabilidades de una recompensa en los diferentes brazos
cambiar con el tiempo, lo que se ha denominado un "bandido inquieto", el problema
se vuelve mucho más difícil. (De hecho, es mucho más difícil que no hay
algoritmo para resolverlo por completo, y se cree que nunca lo habrá).
Parte de esta dificultad es que ya no se trata simplemente de explorar un
mientras y luego explota: cuando el mundo puede cambiar, continuar
explorar puede ser la elección correcta. Podría valer la pena volver a eso
restaurante decepcionante que no has visitado en algunos años, por si acaso es
bajo nueva dirección.
En su célebre ensayo "Walking", Henry David Thoreau reflexionó sobre
cómo prefería viajar cerca de casa, cómo nunca se cansaba de
su entorno y siempre encontraba algo nuevo o sorprendente en el
Paisaje de Massachusetts. “De hecho, hay una especie de armonía que se puede descubrir
entre las capacidades del paisaje dentro de un círculo de diez millas '
radio, o los límites de una caminata por la tarde, y los sesenta años y diez
de la vida humana ”, escribió. "Nunca te resultará muy familiar".
Vivir en un mundo inquieto requiere cierta inquietud en uno mismo. Entonces
Mientras las cosas sigan cambiando, nunca debes dejar de explorar por completo.
Aún así, las técnicas algorítmicas perfeccionadas para la versión estándar del
Los problemas de los bandidos con múltiples brazos son útiles incluso en un mundo inquieto. Estrategias
como el índice de Gittins y el límite de confianza superior proporcionan razonablemente
Buenas soluciones aproximadas y reglas generales, especialmente si las recompensas no
cambiar mucho con el tiempo. Y muchos de los beneficios del mundo son posiblemente
más estático hoy que nunca. Un parche de bayas puede ser uno maduro
semana y podrida la siguiente, pero como dijo Andy Warhol, "Una Coca-Cola es una Coca-Cola".
Tener instintos sintonizados por la evolución para un mundo en constante cambio no es
necesariamente útil en una era de estandarización industrial.
Quizás lo más importante, pensar en las versiones de los brazos múltiples
El problema de los bandidos que tienen soluciones óptimas no solo ofrece algoritmos,
también ofrece conocimientos. El vocabulario conceptual derivado del clásico
Página 73
forma del problema: la tensión de explorar / explotar, la importancia de la

intervalo, el valor alto de la opción 0-0, la minimización del arrepentimiento, da
nosotros una nueva forma de dar sentido no solo a los problemas específicos que surgen
ante nosotros, sino de todo el arco de la vida humana.
Explorar ...
Si bien los estudios de laboratorio pueden ser esclarecedores, el intervalo de muchos de los
Los problemas más importantes que enfrentan las personas son demasiado largos para estudiarlos en el
Aprender la estructura del mundo que nos rodea y formar relaciones sociales duraderas.
las relaciones son tareas de toda la vida. Así que es instructivo ver cómo
El patrón general de exploración temprana y explotación tardía aparece a lo largo del
curso de la vida.
Una de las cosas curiosas de los seres humanos, que cualquier desarrollo
El psicólogo aspira a comprender y explicar, es que tardamos años en
llegar a ser competente y autónomo. Hay que preparar caribúes y gacelas
huir de los depredadores el día que nacen, pero los humanos necesitan más de un
año para dar sus primeros pasos. Alison Gopnik, profesora de desarrollo
psicología en UC Berkeley y autora de The Scientist in the Crib , tiene un
explicación de por qué los seres humanos tienen un período tan extenso de
dependencia: "te da una forma de desarrollo de resolver el problema
compensación de exploración / explotación ". Como hemos visto, buenos algoritmos para
jugar bandidos con múltiples brazos tienden a explorar más temprano, explotando la
conocimiento resultante más tarde. Pero como señala Gopnik, “la desventaja de
es que no obtienes buenas recompensas cuando estás en la exploración
escenario." De ahí la infancia: "La infancia te da un período en el que puedes
simplemente explore las posibilidades y no tendrá que preocuparse por las recompensas
porque las recompensas las están cuidando las mamás y los papas y los
abuelas y niñeras ".
Pensar en los niños como simplemente estar en la exploración transitoria
etapa de un algoritmo de por vida podría proporcionar algún consuelo para los padres de
niños en edad preescolar. (Tom tiene dos hijas en edad preescolar muy exploradoras,
y espera que estén siguiendo un algoritmo que tenga un mínimo de arrepentimiento).
Página 74
también proporciona nuevos conocimientos sobre la racionalidad de los niños. Puntos Gopnik
que "si miras la historia de la forma en que la gente ha pensado
acerca de los niños, por lo general han argumentado que los niños son cognitivamente
deficientes en varias formas, porque si se analizan sus capacidades de explotación,
se ven terribles. No pueden atarse los zapatos, no son buenos a largo plazo
planificando, no son buenos para enfocar la atención. Esas son todas las cosas que
los niños son realmente horribles en ". Pero presionando botones al azar, siendo muy
interesado en juguetes nuevos, y saltar rápidamente de una cosa a otra son
todas las cosas en las que los niños son realmente buenos. Y esos son exactamente lo que
debería estar haciendo si su objetivo es la exploración. Si eres un bebé, ponte cada
objeto de la casa en tu boca es como tirar cuidadosamente de todas las manijas
en el
Decasino.
manera más general, nuestras intuiciones sobre la racionalidad se basan con demasiada frecuenci
por explotación en lugar de exploración. Cuando hablamos de decisión
toma, generalmente nos enfocamos solo en la recompensa inmediata de una sola decisión
—Y si trata cada decisión como si fuera la última, entonces sólo
la explotación tiene sentido. Pero a lo largo de la vida, vas a ganar mucho
decisiones. Y es realmente racional enfatizar la exploración: la nueva
en lugar de lo mejor, lo emocionante en lugar de lo seguro, lo aleatorio en lugar de
el considerado — para muchas de esas opciones, particularmente en etapas tempranas de la vida.
Lo que consideramos el capricho de los niños puede ser más sabio de lo que creemos.
... y explotar
Había llegado a una coyuntura en mi vida lectora que es familiar para aquellos
que han estado allí: en el tiempo asignado que me queda en la tierra, ¿debería
leer más y más libros nuevos, o debería dejar de
consumo, vano porque es interminable, y empiece a releer esos
libros que me habían dado el placer más intenso en mi pasado.
—LYDIA DAVIS
Página 75
En el otro extremo de los niños pequeños tenemos a los ancianos. Y pensando en

envejecimiento desde la perspectiva del dilema explorar / explotar también proporciona
algunas ideas sorprendentes sobre cómo deberíamos esperar que nuestras vidas cambien a medida que
el tiempo continúa.
Laura Carstensen, profesora de psicología en Stanford, ha pasado su
carrera desafiando nuestras ideas preconcebidas sobre el envejecimiento. Particularmente, ella
ha investigado exactamente cómo y por qué cambian las relaciones sociales de las personas
a medida que envejecen. El patrón básico es claro: el tamaño de las redes sociales de las personas.
(es decir, el número de relaciones sociales en las que se involucran) casi invariablemente
disminuye con el tiempo. Pero la investigación de Carstensen ha transformado la forma en que
Debería pensar en este fenómeno.
La explicación tradicional de que los ancianos tienen menores
redes es que es solo un ejemplo de la disminución de la calidad de vida que
viene con el envejecimiento: el resultado de la disminución de la capacidad de contribuir a la
relaciones, mayor fragilidad y desvinculación general de la sociedad. Pero
Carstensen ha argumentado que, de hecho, las personas mayores tienen menos
relaciones por elección. Como ella dice, estas disminuciones son "el resultado de
procesos de selección de por vida mediante los cuales las personas de manera estratégica y adaptativa
cultivar sus redes sociales para maximizar las ganancias sociales y emocionales y
minimizar los riesgos sociales y emocionales ".
Lo que Carstensen y sus colegas encontraron es que la contracción de las
redes con el envejecimiento se debe principalmente a la "poda" de las relaciones periféricas
y centrar la atención en su lugar en un núcleo de amigos cercanos y familiares
miembros. Este proceso parece ser una elección deliberada: a medida que las personas se acercan
al final de sus vidas, quieren centrarse más en las conexiones que están
el más significativo.
En un experimento que prueba esta hipótesis, Carstensen y su colaborador
Barbara Fredrickson pidió a la gente que eligiera a quién preferirían gastar treinta
minutos con: un miembro de la familia inmediata, el autor de un libro que
leído recientemente, o alguien que habían conocido recientemente que parecía compartir su
intereses. Las personas mayores prefieren al miembro de la familia; los jóvenes eran
igual de emocionado de conocer al autor o hacer un nuevo amigo. Pero en un momento crítico
giro, si a los jóvenes se les pidiera que imaginaran que estaban a punto de
Página 76
mudarse por todo el país, también preferían al miembro de la familia. En otro

estudio, Carstensen y sus colegas encontraron el mismo resultado en el otro
dirección también: si se les pidiera a las personas mayores que imaginaran que un médico
avance les permitiría vivir veinte años más, su
las preferencias se volvieron indistinguibles de las de los jóvenes. los
El punto es que estas diferencias en las preferencias sociales no tienen que ver con la edad como tal.
- se trata de donde la gente se percibe a sí misma en el intervalo
relevante para su decisión.
Ser sensible a cuánto tiempo te queda es exactamente lo que
sugiere la informática del dilema explorar / explotar. Pensamos en el
joven como estereotipadamente voluble; los viejos, estereotipados a su manera. En
De hecho, ambos se comportan de manera completamente apropiada con respecto a sus
intervalos. El perfeccionamiento deliberado de una red social hasta el máximo
relaciones significativas es la respuesta racional a tener menos tiempo para
disfrútelos.
Reconocer que la vejez es una época de explotación ayuda a proporcionar nuevos
perspectivas sobre algunos de los fenómenos clásicos del envejecimiento. Por ejemplo,
mientras vas a la universidad, un nuevo entorno social lleno de personas que
no me he reunido: suele ser un momento positivo y emocionante, ir a una jubilación
hogar, un nuevo entorno social lleno de personas que no ha conocido, puede
ser doloroso. Y esa diferencia es en parte el resultado de dónde estamos en el
explorar / explotar el continuo en esas etapas de nuestras vidas.
La compensación explorar / explotar también nos dice cómo pensar en los consejos de
nuestros mayores. Cuando tu abuelo te dice qué restaurantes son buenos,
debería escuchar, estas son perlas obtenidas de décadas de búsqueda. Pero
cuando solo va al mismo restaurante a las 5:00 p. m. todos los días, debe
siéntase libre de explorar otras opciones, aunque probablemente sean peores.
Quizás la percepción más profunda que surge de pensar en la vida posterior como un
oportunidad de explotar el conocimiento adquirido durante décadas es la siguiente: la vida debe ser
mejor con el tiempo. Lo que un explorador intercambia por conocimiento es placer. los
El índice de Gittins y el límite de confianza superior, como hemos visto, inflan el
atractivo de opciones menos conocidas más allá de lo que realmente esperamos, ya que
las sorpresas agradables pueden dar sus frutos muchas veces. Pero al mismo tiempo, este
Página 77
significa que la exploración conduce necesariamente a decepcionar a la mayoría

ocasiones. Desplazar la mayor parte de la atención hacia las cosas favoritas.
debería aumentar la calidad de vida. Y parece que sí: Carstensen ha
encontró que las personas mayores generalmente están más satisfechas con sus
redes, y a menudo informan niveles de bienestar emocional que son más altos
que los de los adultos más jóvenes.
Así que hay mucho que esperar al ser ese restaurante de última hora de la tarde.
regular, saboreando los frutos de las exploraciones de una vida.
Página 78
*El resumen básico de esta sección: git mientras que los Gittins son buenos.
Página 79
3 Clasificación
Hacer orden
Ahora bien, si la palabra que deseas encontrar comienza con (a) entonces
Mire al principio de esta Tabla, pero si con (v) mire hacia el
fin. De nuevo, si tu palabra comienza con (ca) mira al principio del
letra (c) pero si está con (cu) entonces mire hacia el final de esa letra. Y
así de todos los demás. &C.
—ROBERT CAWDREY, UNA MESA ALFABÉTICA (1604)
Antes de que Danny Hillis fundara la corporación Thinking Machines, antes de

inventó la famosa supercomputadora paralela Connection Machine, fue
un estudiante universitario del MIT, que vive en el dormitorio de estudiantes y horrorizado por su
calcetines de compañero de cuarto.
Lo que horrorizó a Hillis, a diferencia de muchos estudiantes universitarios, no fue su
higiene del compañero de cuarto. No era que el compañero de cuarto no lavara los calcetines; él
hizo. El problema fue lo que vino después.
El compañero de cuarto sacó un calcetín de la canasta de ropa limpia. El siguiente
sacó otro calcetín al azar. Si no coincidía con el primero, arrojó
Luego, continuó este proceso, sacando los calcetines uno por uno y
arrojándolos hacia atrás hasta que encontró una cerilla para el primero.
Con solo 10 pares de calcetines diferentes, seguir este método supondrá
promedio de 19 tirones simplemente para completar el primer par, y 17 tirones más para
Página 80
Completa el segundo. En total, el compañero de cuarto puede esperar ir a pescar en el

obstaculizar 110 veces solo para emparejar 20 calcetines.
Era suficiente para que cualquier científico informático en ciernes solicitara una habitación.
transferir.
Ahora bien, la forma en que se deben clasificar los calcetines es una buena manera de conseguir que la
científicos hablando con una extensión sorprendente. Una pregunta sobre los calcetines publicada en el
El desbordamiento de pila del sitio web de programación en 2013 provocó que doce
mil palabras de debate.
"¡Los calcetines me confunden!" confesó el legendario criptógrafo y Turing
El galardonado científico informático Ron Rivest a nosotros dos cuando
Sacó a relucir el tema.
Llevaba sandalias en ese momento.
El éxtasis de la clasificación
La clasificación es la esencia misma de lo que hacen las computadoras. De hecho, de muchas formas
fue la clasificación que dio origen a la computadora.
A finales del siglo XIX, la población estadounidense crecía a
30% cada década, y el número de "sujetos de investigación" en los EE. UU.
El censo había pasado de solo cinco en 1870 a más de doscientos en 1880.
La tabulación del censo de 1880 tomó ocho años, apenas terminando en
el momento en que comenzó el censo de 1890. Como dijo un escritor en ese momento, fue un
me pregunto “los empleados que se afanaron en los irritantes trozos de papel de conteo ... no
volverse ciego y loco ". Toda la empresa amenazaba con colapsar bajo
su propio peso. Había que hacer algo.
Inspirado en los billetes de tren perforados de la época, un inventor de la
El nombre de Herman Hollerith ideó un sistema de tarjetas manila perforadas para
almacenar información, y una máquina, a la que llamó la Máquina Hollerith, para
contarlos y clasificarlos. Hollerith recibió una patente en 1889, y el
El gobierno adoptó la Máquina Hollerith para el censo de 1890. Nadie tenia
he visto algo parecido. Un observador asombrado escribió: "El aparato
funciona tan infaliblemente como los molinos de los dioses, pero los golpea hasta
velocidad." Otro, sin embargo, razonó que la invención tenía un uso limitado:
Página 81
“Como nadie lo usará más que los gobiernos, es probable que el inventor no obtenga
muy rico." Esta predicción, que Hollerith recortó y guardó, no
probar completamente correcto. La firma de Hollerith se fusionó con varias otras en 1911
para convertirse en la Compañía de Computación-Tabulación-Grabación. Unos años
más tarde se le cambió el nombre a International Business Machines o IBM.
La clasificación continuó impulsando el desarrollo de la computadora a través de la
próximo siglo. El primer código jamás escrito para una computadora con "programa almacenado"
era un programa para una clasificación eficiente. De hecho, era la capacidad de la computadora para
superan a las máquinas de clasificación de tarjetas dedicadas de IBM que convencieron a los EE. UU.
gobierno su enorme inversión financiera en un propósito general
La máquina estaba justificada. En la década de 1960, un estudio estimó que más de un
una cuarta parte de los recursos informáticos del mundo se gastaba en
clasificación. Y no es de extrañar, la clasificación es esencial para trabajar con casi cualquier
tipo de información. Ya sea para encontrar el más grande o el más pequeño, el
más común o más raro, contando, indexando, marcando duplicados o simplemente
buscando simplemente lo que desea, generalmente todos comienzan bajo el
capucha con una especie.
Pero la clasificación es incluso más omnipresente que esto. Después de todo, uno de los principales
razones por las que las cosas se ordenan es para mostrarse de forma útil a los ojos humanos,
lo que significa que la clasificación también es clave para la experiencia humana de
información. Las listas ordenadas son tan omnipresentes que, como el pez que pregunta,
“¿Qué es el agua?”, Debemos trabajar conscientemente para percibirlos. Y
luego los percibimos en todas partes.
Nuestra bandeja de entrada de correo electrónico normalmente muestra los cincuenta mensajes princ
miles, ordenados por hora de recepción. Cuando buscamos restaurantes en Yelp
se nos muestra la primera docena de cientos, ordenados por proximidad o por
clasificación. Un blog muestra una lista recortada de artículos, ordenados por fecha. El Facebook
el servicio de noticias, la transmisión de Twitter y la página de inicio de Reddit se presentan como
listas, ordenadas por alguna medida patentada. Nos referimos a cosas como Google
y Bing como "motores de búsqueda", pero es un nombre poco apropiado: son
realmente ordenar motores. ¿Qué hace que Google sea tan dominante como medio de
acceder a la información del mundo es menos que encontrar nuestro texto dentro
cientos de millones de páginas web; sus competidores de la década de 1990
Página 82
hacer esa parte lo suficientemente bien, pero que ordena esas páginas web tan bien, y solo
nos muestra los diez más relevantes.
La parte superior truncada de una inmensa lista ordenada es, en muchos sentidos, el
interfaz de usuario universal.
Las ciencias de la computación nos brindan una forma de comprender lo que sucede detrás
las escenas en todos estos casos, lo que a su vez puede ofrecernos una idea de
esos momentos en los que somos nosotros los que hacemos el pedido, con nuestras facturas, nuestras
papeles, libros, calcetines, probablemente más veces al día de lo que creemos.
Al cuantificar el vicio (y la virtud) del desorden, también nos muestra los casos
donde en realidad no deberíamos hacer ningún pedido.
Es más, cuando comenzamos a buscar, vemos que ordenar no es solo
algo que hacemos con la información. Es algo que hacemos con la gente.
Quizás el lugar donde la informática para establecer el rango es más
inesperadamente útil es en el campo deportivo y en el ring de boxeo, que
Es por eso que saber un poco sobre clasificación podría ayudar a explicar cómo los seres humanos
son capaces de vivir juntos aunque sólo ocasionalmente llegan a los golpes. Eso es para
Por ejemplo, la clasificación ofrece algunas pistas sorprendentes sobre la naturaleza de la sociedad: que
otro tipo de pedido más grande e importante que hacemos.
La agonía de la clasificación
“Para reducir los costos por unidad de producción, las personas generalmente aumentan el tamaño de su
operaciones ”, escribió JC Hosken en 1955, en el primer artículo científico
publicado sobre clasificación. Esta es la economía de escala familiar para cualquier negocio.
estudiante. Pero con la clasificación, el tamaño es una receta para el desastre: perversamente, como una
crece, "el costo unitario de clasificación, en lugar de disminuir, aumenta". Clasificación
implica empinadas dis economías de escala, violando nuestras intuiciones acerca normales
las virtudes de hacer las cosas a granel. Cocinar para dos no suele ser más difícil
que cocinar para uno, y ciertamente es más fácil que cocinar para una persona
dos veces. Pero clasificar, digamos, un estante de cien libros le llevará más tiempo que
clasificar dos estanterías de cincuenta cada una: tienes el doble de cosas para
organizar, y hay el doble de lugares a los que cada uno de ellos podría ir. los
cuanto más tomas, peor se pone.
Página 83
Esta es la primera y más fundamental idea de la teoría de la clasificación. Escala
duele.
De esto podríamos inferir que minimizar nuestro dolor y sufrimiento cuando
viene a ordenar se trata de minimizar la cantidad de cosas que tenemos que
clasificar. Es cierto: uno de los mejores preventivos contra la computación
La dificultad de clasificar los calcetines es simplemente lavar la ropa con más frecuencia. Haciendo
lavar tres veces con más frecuencia, por ejemplo, podría reducir los gastos generales de clasificación
por un factor de nueve. De hecho, si el compañero de cuarto de Hillis se quedaba con su peculiar
procedimiento, pero pasaron trece días entre lavados en lugar de catorce, que
solo le ahorraría veintiocho tirones de la cesta. (Y yendo solo
un solo día más entre lavados le costaría treinta tirones más).
Incluso con un alcance quincenal tan modesto, podemos ver la escala de clasificación
comenzando a volverse insostenible. Las computadoras, sin embargo, deben clasificar rutinariamente
millones de artículos de una sola vez. Por eso, como dice la línea de Jaws , estamos
va a necesitar un barco más grande y un algoritmo mejor.
Pero para responder a la pregunta de cómo deberíamos estar clasificando, y
qué métodos se destacan, primero tenemos que averiguar algo más:
cómo vamos a llevar la cuenta.
Big-O: Un criterio para el peor de los casos
El Libro Guinness de los Récords Mundiales atribuye el récord de clasificación de una baraja
de cartas al mago checo Zdeněk Bradáč. El 15 de mayo de 2008, Bradáč
ordenó una baraja de 52 cartas en solo 36,16 segundos. * ¿Cómo lo hizo? Qué
¿La técnica de clasificación le entregó el título? Aunque la respuesta derramaría
interesante luz sobre la teoría de la clasificación, Bradáč se negó a comentar.
Si bien no tenemos más que respeto por la habilidad y destreza de Bradáč,
estamos 100% seguros de lo siguiente: podemos batir personalmente su récord. En
De hecho, estamos 100% seguros de que podemos lograr un récord inquebrantable . Todos nosotros
la necesidad se trata de
80,658,175,170,943,878,571,660,636,856,403,766,975,289,505,440,883,27
7,824,000,000,000,000 intentos por el título. Este número, un poco más de 80
unvigintillion, es 52 factorial, o "52!" en notación matemática, el
Página 84
varias formas en las que se puede pedir una baraja de 52 cartas. Tomando
aproximadamente tantos intentos, tarde o temprano estaremos obligados a comenzar con un
baraja barajada que de hecho está completamente ordenada por casualidad. En ese punto nosotros
puede inscribir con orgullo a Christian-Griffiths en The Guinness Book junto con un
tiempo de clase no muy lamentable de 0m00s.
Para ser justos, es casi seguro que lo intentaremos hasta la muerte por calor del
universo antes de que tuviéramos nuestro intento de récord perfecto. No obstante, esto
destaca la mayor
científicos diferencia fundamental
de la computación. entre
La gente finos en los poseedores
Guinness depreocupan
sólo se registros ymejor -case
rendimiento (y cerveza). Difícilmente son dignos de culpa, por supuesto: todos los registros
en los deportes reflejan el mejor desempeño individual. La informática, sin embargo,
casi nunca se preocupa por el mejor de los casos. En cambio, los informáticos podrían
quiere saber el tiempo medio de clasificación de alguien como Bradáč: haga que clasifique
todos los 80 pedidos de mazos de unvigintillion, o una muestra de tamaño razonable, y
puntúelo en su velocidad promedio en todos los intentos. (Puedes ver por qué
no dejes que los informáticos ejecuten estas cosas).
Además, un científico informático querría saber el peor momento.
El análisis del peor de los casos nos permite ofrecer garantías sólidas: que un proceso crítico
terminar a tiempo, los plazos no se perderán. Entonces, para el resto de este capítulo
—Y el resto de este libro, en realidad— solo discutiremos
rendimiento de los algoritmos en el peor de los casos, a menos que se indique lo contrario.
La informática ha desarrollado una abreviatura específica para medir
Escenarios algorítmicos del peor de los casos: se llama notación "Big-O". Big-O
la notación tiene una peculiaridad particular, que es que es inexacta por diseño. Es decir,
en lugar de expresar el rendimiento de un algoritmo en minutos y segundos,
La notación Big-O proporciona una forma de hablar sobre el tipo de relación que
se mantiene entre el tamaño del problema y el tiempo de ejecución del programa.
Debido a que la notación Big-O arroja deliberadamente detalles finos, lo que emerge es una
esquema para dividir problemas en diferentes clases amplias.
Imagina que estás organizando una cena con n invitados. El tiempo requerido
limpiar la casa para su llegada no depende del número de invitados
en absoluto. Esta es la clase de problemas más optimista que existe: llamada "O grande de uno",
escrito O (1), también se conoce como "tiempo constante". En particular, la notación Big-O
Página 85
no le importa un bledo el tiempo que lleve la limpieza, solo que es

siempre igual, totalmente invariante de la lista de invitados. Tu tienes lo mismo
trabajo que hacer si tiene un invitado como si tuviera diez, cien o cualquier otro
n.
Ahora, el tiempo necesario para pasar el asado por la mesa será "Big-O
de n ", escrito O ( n ), también conocido como" tiempo lineal ", con el doble de invitados,
esperará el doble de tiempo para que vuelva el plato. Y de nuevo, Big-O
notación no podría importarle menos la cantidad de cursos que se sirven, o
si van por una segunda ración. En cada caso, el tiempo aún
depende linealmente del tamaño de la lista de invitados, si dibujó un gráfico del número
de invitados frente al tiempo necesario, sería una línea recta. Además, el
La existencia de cualquier factor de tiempo lineal, en notación Big-O, inundará todos los
factores de tiempo constante. Es decir, pasando el asado una vez alrededor de la mesa,
o remodelar tu comedor durante tres meses y luego pasar el asado
una vez alrededor de la mesa, son ambos, para un informático, efectivamente
equivalente. Si eso parece una locura, recuerde que las computadoras se ocupan de los valores.
de n que fácilmente podrían ser miles, millones o miles de millones. En otra
En palabras, los informáticos están pensando en fiestas muy, muy grandes. Con un
lista de invitados por millones, pasar el asado una vez
la remodelación de la casa parece empequeñecida hasta el punto de la insignificancia.
¿Y si, al llegar los invitados, cada uno saludara a los demás con un abrazo?
Tu primer invitado te abraza; su segundo invitado tiene dos abrazos para dar; tu
tercer invitado, tres. ¿Cuántos abrazos habrá en total? Esto resulta
ser "O grande de n- cuadrado", escrito O ( n 2 ) y también conocido como "tiempo cuadrático".
Aquí nuevamente, solo nos preocupamos por los contornos básicos de la relación.
entre n y tiempo. No hay O (2 n 2 ) para dos abrazos cada uno, ni O ( n 2 + n ) para
abrazos más pasar la comida, u O ( n 2 + 1) para abrazos más el hogar
limpieza. Todo es tiempo cuadrático, por lo que O ( n 2 ) cubre todo.
Página 86
Tiempo constante, escrito O (1); tiempo lineal, escrito O (n); y tiempo cuadrático, escrito O (n 2 ).
Empeora a partir de ahí. Hay "tiempo exponencial", O (2 n ), donde cada

invitado adicional duplica su trabajo. Peor aún es el "tiempo factorial", ¡ O ( n !), Un
clase de problemas tan verdaderamente infernales que los informáticos solo hablan de ellos
cuando están bromeando, como imaginamos barajando un mazo hasta que esté
ordenados, o cuando realmente desearían estarlo.
Los cuadrados: clasificación de burbujas y clasificación de inserción
Cuando el entonces senador Obama visitó Google en 2007, el director ejecutivo Eric Schmidt
en broma comenzó la sesión de preguntas y respuestas como una entrevista de trabajo, preguntándole: "
forma de ordenar un millón de enteros de treinta y dos bits? " Sin perder el ritmo
Obama esbozó una sonrisa irónica y respondió: "Creo que el tipo de burbuja sería
el camino equivocado a seguir ". La multitud de ingenieros de Google estalló en vítores.
"Me tenía en Bubble Sort", recordó uno más tarde.
Obama tenía razón al evitar Bubble Sort, un algoritmo que ha
convertirse en una especie de saco de boxeo para los estudiantes de informática: es
simple, intuitivo y extremadamente ineficiente.
Imagina que quieres ordenar alfabéticamente tu colección de libros sin clasificar. A
enfoque natural sería simplemente escanear a través del estante en busca de
pares de órdenes (Wallace seguido de Pynchon, por ejemplo) y voltear
ellos alrededor. Ponga a Pynchon por delante de Wallace, luego continúe su escaneo,
dando vueltas hasta el principio del estante cada vez que llega al final.
Cuando haces un pase completo sin encontrar más fuera de servicio
pares en todo el estante, entonces sabrá que el trabajo está hecho.
Página 87
Esto es Bubble Sort, y nos aterriza en tiempo cuadrático. Hay n libros

fuera de servicio, y cada escaneo a través del estante puede mover cada uno como máximo uno
posición. (Detectamos un pequeño problema, hacemos una pequeña solución). Entonces, en el peor de los
donde el estante está perfectamente al revés, al menos un libro deberá estar
movido n posiciones. Así, un máximo de n pasa por n libros, que
nos da O ( n 2 ) en el peor de los casos. * No es terrible, por un lado, son mundos
mejor que nuestro O ( n !) barajar-hasta-que-está-ordenados idea de antes (en caso de que
necesitaba ciencias de la computación para confirmarlo). Pero de todos modos, eso cuadró
El término puede volverse abrumador rápidamente. Por ejemplo, significa que ordenar cinco
los estantes de libros no tomarán cinco veces más tiempo que ordenar un solo estante,
pero veinticinco veces más.
Puede tomar un rumbo diferente: sacar todos los libros del estante y
poniéndolos en su lugar uno por uno. Pondrías el primer libro en el
en medio del estante, luego tome el segundo y compárelo con el primero,
insertándolo a la derecha oa la izquierda. Tomando el tercer libro, tendrías
Revise los libros en el estante de izquierda a derecha hasta que encuentre el
lugar adecuado para colocarlo. Repitiendo este proceso, gradualmente todos los libros
terminaría ordenado en el estante y estarías listo.
Los científicos de la computación llaman a esto, apropiadamente, Tipo de inserción . los
La buena noticia es que podría decirse que es incluso más intuitivo que Bubble Sort y
no tiene mala reputación. La mala noticia es que en realidad no
mucho más rápido. Aún tiene que hacer una inserción para cada libro. Y cada
la inserción aún implica pasar aproximadamente la mitad de los libros en el estante, en
promedio, para encontrar el lugar correcto. Aunque en la práctica Insertion Sort no
corre un poco más rápido que Bubble Sort, de nuevo aterrizamos de lleno, por así decirlo, en
tiempo cuadrático. Ordenar algo más que una sola estantería sigue siendo una
perspectiva difícil de manejar.
Rompiendo la barrera cuadrática: divide y vencerás
En este punto, habiendo visto dos enfoques completamente razonables caer en

tiempo cuadrático insostenible, es natural preguntarse si una clasificación más rápida es
incluso posible.
Página 88
La pregunta parece que se trata de productividad. Pero habla con una computadora
científico y resulta estar más cerca de la metafísica, similar a pensar en
la velocidad de la luz, el viaje en el tiempo, los superconductores o la entropía termodinámica.
¿Cuáles son las reglas y límites fundamentales del universo? ¿Que es posible?
¿Qué está permitido? De esta manera, los científicos de la computación están vislumbrando
planos tanto como los físicos de partículas y los cosmólogos.
¿Cuál es el mínimo esfuerzo requerido para realizar el pedido?
¿Podríamos encontrar un tipo de tiempo constante, O (1), uno que (como limpiar el
casa antes de que llegue el grupo de invitados) puede ordenar una lista de cualquier tamaño en el mismo
¿cantidad de tiempo? Bueno, incluso confirmando que un estante de n libros está ordenado
no se puede hacer en tiempo constante, ya que requiere verificar todos los n . Entonces
en realidad, ordenar los libros en un tiempo constante parece imposible.
¿Qué pasa con una ordenación de tiempo lineal, O ( n ), tan eficiente como pasar un plato
una tabla, donde duplicar el número de elementos para ordenar simplemente duplica el
¿trabaja? Pensando en los ejemplos anteriores, es difícil imaginar cómo eso
podría funcionar bien. El n 2 en cada caso proviene del hecho de que necesita
mover n libros, y el trabajo requerido en cada movimiento también se escala con n .
¿Cómo pasaríamos de n movimientos de tamaño n a n solo? En
Bubble Sort, nuestro tiempo de ejecución O ( n 2 ) provino de manejar cada uno de los n
libros y moverlos hasta n lugares cada uno. En Orden de inserción,
El tiempo de ejecución cuadrático provino de manejar cada uno de los n libros y
comparándolos con otros n antes de insertarlos. Un tiempo lineal
ordenar significa manipular cada libro durante un tiempo constante, independientemente de cuántos
otros necesita encontrar su lugar entre. No parece probable.
Entonces sabemos que podemos hacerlo al menos tan bien como el tiempo cuadrático, pero
probablemente no tan bien como el tiempo lineal. Quizás nuestro límite esté en alguna parte
entre tiempo lineal y tiempo cuadrático. ¿Hay algún algoritmo entre
lineal y cuadrático, entre n y n × n ?
Los hay, y se escondían a plena vista.
Como mencionamos anteriormente, el procesamiento de información comenzó en los EE. UU.
censos del siglo XIX, con el desarrollo, por Herman
Hollerith y más tarde por IBM, de dispositivos físicos de clasificación de tarjetas perforadas. En 1936,
IBM comenzó a producir una línea de máquinas llamadas "alzadoras" que podían
Página 89
fusionar dos pilas de tarjetas ordenadas por separado en una. Mientras los dos
Las pilas se clasificaron ellas mismas, el procedimiento de fusionarlas en una sola
La pila ordenada fue increíblemente sencilla y tomó un tiempo lineal: simplemente
comparar las dos cartas superiores entre sí, mover la más pequeña a la
nueva pila que está creando y repita hasta que termine.
El programa que John von Neumann escribió en 1945 para demostrar la
El poder de la computadora de programa almacenado tomó la idea de cotejar a su
hermosa y última conclusión. Clasificar dos cartas es simple: simplemente coloque el
uno más pequeño en la parte superior. Y dado un par de pilas de dos cartas, ambas
ordenados, puede clasificarlos fácilmente en una pila ordenada de cuatro. Repitiendo
este truco unas cuantas veces, construirías pilas cada vez más grandes, cada una de las
ellos ya ordenados. Muy pronto, podría recopilar una perfecta
baraja completa ordenada, con una fusión climática final, como el orden de un riffle shuffle,
creando gemelo, produciendo el resultado deseado.
Este enfoque se conoce hoy como Mergesort , uno de los legendarios
algoritmos en informática. Como lo expresó un artículo de 1997, "Mergesort es tan
importante en la historia de la clasificación como clasificación en la historia de la informática ".
El poder de Mergesort proviene del hecho de que, de hecho, termina con
una complejidad entre el tiempo lineal y cuadrático, específicamente, O ( n log n ),
conocido como tiempo "linealítmico". Cada pasada a través de las cartas duplica el tamaño
de las pilas ordenadas, por lo que para ordenar completamente n cartas tendrá que hacer como
tantas pasadas como sea necesario para que el número 2, multiplicado por sí mismo, sea igual a n : el
logaritmo en base dos, en otras palabras. Puede clasificar hasta cuatro cartas en dos
pases de clasificación, hasta ocho tarjetas con un tercer pase y hasta dieciséis tarjetas
con un cuarto. El enfoque de dividir y conquistar de Mergesort inspiró una serie de
otros algoritmos de clasificación lineal que le siguieron rápidamente. Y
decir que la complejidad linealitmica es una mejora en la cuadratica
la complejidad es una subestimación titánica. En el caso de clasificar, digamos, un censo
nivel de elementos, es la diferencia entre hacer veintinueve
pasa a través de su conjunto de datos ... y trescientos millones. No es de extrañar que sea
el método de elección para problemas de clasificación industrial a gran escala.
Mergesort también tiene aplicaciones reales en la clasificación doméstica a pequeña escala
problemas. Parte de la razón por la que se usa tan ampliamente es que puede ser fácilmente
Página 90
paralelizado. Si todavía está elaborando una estrategia sobre esa estantería, el Mergesort
La solución sería pedir una pizza e invitar a algunos amigos. Dividir el
libros de manera uniforme, y haga que cada persona clasifique su propia pila. Entonces empareja person
y haga que fusionen sus pilas. Repita este proceso hasta que solo queden
Quedan dos pilas y fusionarlas una última vez en el estante. Solo intenta
evite dejar manchas de pizza en los libros.
Más allá de la comparación: superando el logaritmo
En un discreto parque industrial cerca de la ciudad de Preston, Washington,

escondido detrás de una entrada gris anodina de muchas, se encuentra el 2011 y
2013 Campeón Nacional de Clasificación de Bibliotecas. Una cinta transportadora larga y segmentada
mueve 167 libros por minuto, 85.000 al día, a través de un escáner de código de barras,
donde se desvían automáticamente a las puertas de la bahía de bombas que caen en
uno de 96 contenedores.
Página 92
91
Un Mergesort en acción. Dado un estante de ocho libros sin clasificar, comience colocando los libros adyacentes en
pares ordenados. Luego, coteje los pares en conjuntos ordenados de cuatro y, finalmente, coteje esos conjuntos para obtener un
estante completamente clasificado.
El Preston Sort Center es uno de los centros de reserva más grandes y eficientes.
instalaciones de clasificación en el mundo. Está administrado por el Sistema de Bibliotecas del Condado d
que ha comenzado una sana rivalidad con el Nueva York igualmente equipado
Biblioteca pública, con el título yendo y viniendo más de cuatro
años disputados. "¿La biblioteca del condado de King nos está ganando este año?" dijo el
El subdirector de BookOps de NYPL, Salvatore Magaddino, antes del 2014
confrontación. "Fuhgeddaboutit".
Hay algo particularmente impresionante en el Preston Sort Center
también desde el punto de vista de un teórico. Los libros que pasan por su sistema
se ordenan en O ( n ): tiempo lineal.
En un sentido importante, el tiempo linealitmico O ( n log n ) ofrecido por
Mergesort es realmente lo mejor que podemos esperar lograr. Se ha comprobado que si
queremos ordenar completamente n elementos a través de una serie de comparaciones directas,
simplemente no hay forma de compararlos menos de O ( n log n ) veces. Es un
ley fundamental del universo, y no hay dos formas de evitarlo.
Pero esto, estrictamente hablando, no cierra el libro sobre la clasificación. Porque
a veces no necesita un conjunto completamente ordenado y, a veces, la clasificación puede
hacerse sin ninguna comparación de artículo a artículo. Estos dos principios,
tomados en conjunto, permiten tipos prácticos aproximados en más rápido que linealithmic
Página 93
tiempo. Esto está bellamente demostrado por un algoritmo conocido como Bucket
Sort, del cual el Preston Sort Center es una ilustración perfecta.
En Bucket Sort, los elementos se agrupan en una serie de
categorías, sin tener en cuenta la clasificación intracategoría más fina; que puede venir
más tarde. (En ciencias de la computación, el término "cubo" simplemente se refiere a un
datos sin clasificar, pero algunos de los usos más poderosos del mundo real de Bucket
Ordene, como en KCLS, tome el nombre completamente literalmente.) Aquí está el truco: si
desea agrupar n elementos en m cubos, la agrupación se puede hacer en
O ( nm ) tiempo: es decir, el tiempo es simplemente proporcional al número de elementos
multiplicado por la cantidad de cubos. Y siempre que el número de cubos sea
relativamente pequeño en comparación con el número de elementos, la notación Big-O
redondea eso a O ( n ), o tiempo lineal.
La clave para romper realmente la barrera linealítmica es conocer el
distribución de la que se extraen los elementos que está ordenando. Mal elegido
los baldes te dejarán un poco mejor que cuando empezaste; si todos los libros
terminan en el mismo contenedor, por ejemplo, no ha progresado en absoluto.
Sin embargo, los cubos bien elegidos dividirán sus artículos en aproximadamente
grupos de tamaño, que, dada la naturaleza fundamental de "daño de escala" de la clasificación, es
un gran paso hacia una especie completa. En el Preston Sort Center, cuyo trabajo es
ordenar los libros por su rama de destino, en lugar de alfabéticamente, el
La elección de los cubos depende de las estadísticas de circulación. Algunas ramas tienen
mayor volumen de circulación que otros, por lo que pueden tener dos contenedores asignados
para ellos, o incluso tres.
Un conocimiento similar del material también es útil para los clasificadores humanos. Para
ver a los expertos en clasificación en acción, hicimos un viaje de campo a Doe de UC Berkeley y
Bibliotecas Moffitt, donde hay no menos de cincuenta y dos millas de
estanterías para mantener en orden, y todo se hace a mano. Libros devueltos a
la biblioteca se coloca primero en un área detrás de escena, asignada a estantes
designado por los números de llamada de la Biblioteca del Congreso. Por ejemplo, un conjunto de
los estantes contienen un revoltijo de todos los libros devueltos recientemente con la llamada
números PS3000 – PS9999. Luego, los estudiantes asistentes cargan esos libros en
carros, colocando hasta 150 libros en el orden correcto para que puedan ser devueltos a la
estantes de la biblioteca. Los estudiantes reciben una formación básica en clasificación, pero desarrollan
Página 94
sus propias estrategias a lo largo del tiempo. Después de un poco de experiencia, pueden ordenar un
carro de 150 libros en menos de 40 minutos. Y gran parte de esa experiencia
implica saber qué esperar.
Jordan Ho, estudiante de Berkeley, estudiante de química y clasificador de estrellas,
nos habló a través de su proceso mientras atravesaba una impresionante pila de
libros en los estantes de PS3000 – PS9999:
Sé por experiencia que hay muchos 3500, así que quiero buscar cualquier libro que sea
por debajo de 3500 y clasifíquelos de forma aproximada. Y una vez que hago eso, los clasifico más finamente. Después de que yo
ordenar los que están por debajo de 3500, sé que 3500 en sí es una sección grande (3500–3599), así que quiero hacer
que una sección en sí. Si hay muchos de esos, me gustaría afinarlo aún más: 3510s,
3520, 3530.
Jordan apunta a poner un grupo de 25 libros en su carrito antes de poner

ellos en el orden final, lo que hace mediante una ordenación por inserción. Y su cuidado
estrategia desarrollada es exactamente la forma correcta de llegar allí: una clasificación de cubo, con
su pronóstico bien informado de cuántos libros tendrá con varias llamadas
números que le dicen cuáles deberían ser sus cubos.
Ordenar es profilaxis para la búsqueda
Conocer todos estos algoritmos de clasificación debería ser útil la próxima vez que
decida ordenar alfabéticamente su estantería. Como el presidente Obama, lo sabrás
no utilizar Bubble Sort. En cambio, una buena estrategia, ratificada por humanos y
bibliotecarios de máquinas por igual: es ordenar por cubos hasta que se reduzca a
montones suficientes para que Insertion Sort sea razonable, o para tener una pizza Mergesort
partido.
Pero si realmente le pidiera a un científico informático que lo ayudara a implementar esto
proceso, la primera pregunta que harían es si debería ordenar
en absoluto.
La informática, como se enseña a los estudiantes universitarios, se trata de compensaciones.
Ya hemos visto esto en las tensiones entre mirar y saltar,
entre explorar y explotar. Y una de las compensaciones más importantes es
entre ordenar y buscar . El principio básico es este: el esfuerzo
Página 95
gastado en clasificar materiales es solo un ataque preventivo contra el esfuerzo

tardará en buscarlos más tarde. Cuál debería ser el equilibrio preciso
depende de los parámetros exactos de la situación, pero pensar en clasificar
tan valioso solo para respaldar la búsqueda futura nos dice algo sorprendente:
Errar por el lado del desorden.
Clasificar algo que nunca buscará es un desperdicio total;
buscar algo que nunca ordenó es simplemente ineficaz.
La pregunta, por supuesto, es cómo estimar de antemano qué
su uso futuro será.
El cartel de las ventajas de la clasificación sería Internet.
motor de búsqueda como Google. Parece asombroso pensar que Google puede tomar
la frase de búsqueda que ingresó y busque en Internet en menos
de medio segundo. Bueno, no puede, pero no es necesario. Si eres Google,
está casi seguro de que (a) sus datos serán buscados, (b) serán
buscado no solo una vez sino repetidamente, y (c) el tiempo necesario para ordenar es
de alguna manera "menos valioso" que el tiempo necesario para buscar. (Aquí, la clasificación es
hecho por máquinas con anticipación, antes de que se necesiten los resultados, y
la búsqueda la realizan usuarios para los que el tiempo es fundamental).
factores apuntan a favor de una tremenda clasificación por adelantado, que es de hecho lo que
Google y sus compañeros motores de búsqueda lo hacen.
Entonces, ¿debería ordenar alfabéticamente sus estanterías? Para la mayoría de los domésticos
estanterías, casi ninguna de las condiciones que hacen que valga la pena clasificar
son verdaderas. Es bastante raro que nos encontremos buscando un título en particular.
Los costos de una búsqueda sin clasificar son bastante bajos: para cada libro, si sabemos
aproximadamente donde está podemos poner nuestras manos sobre él rápidamente. Y la diferencia
entre los dos segundos que tomaría encontrar el libro en un estante ordenado
y los diez segundos que se necesitarían para buscarlo en uno sin clasificar son apenas
un factor decisivo. Rara vez necesitamos encontrar un título con tanta urgencia que valga la pena
pasar horas preparatorias por adelantado para afeitarse segundos después. Qué
más, buscamos con nuestros ojos rápidos y clasificamos con manos lentas.
El veredicto es claro: ordenar su estantería llevará más tiempo y
energía que la exploración a través de ella.
Página 96
Es posible que su estantería sin clasificar no sea una preocupación cotidiana, pero
es casi seguro que su bandeja de entrada de correo electrónico lo sea, y es otro dominio donde
buscar es mejor que clasificar cómodamente. Archivar mensajes electrónicos a mano en
carpetas toma aproximadamente la misma cantidad de tiempo que archivar documentos físicos en el
mundo real, pero los correos electrónicos se pueden buscar de manera mucho más eficiente que sus
contrapartes físicas. A medida que disminuye el costo de búsqueda, la clasificación se reduce
valioso.
Steve Whittaker es uno de los expertos mundiales en cómo las personas manejan sus
Email. Científico investigador en IBM y profesor en UC Santa Cruz,
Whittaker, durante casi dos décadas, ha estado estudiando cómo las personas manejan
informacion personal. (Escribió un artículo sobre la "sobrecarga de correo electrónico" en 1996,
antes de que muchas personas tuvieran correo electrónico.) En 2011, Whittaker dirigió un estudio de
los hábitos de búsqueda y clasificación de los usuarios de correo electrónico, lo que dio como resultado u
¿Perdiendo mi tiempo organizando el correo electrónico? Alerta de spoiler: la conclusión fue una
enfático Sí . "Es empírico, pero también experiencial", señala Whittaker.
fuera. "Cuando entrevisto a personas sobre este tipo de organización
problemas, eso es algo de lo que suelen hablar, es que
en cierto modo desperdiciaron una parte de su vida ".
La informática muestra que los peligros del desorden y los peligros de
orden son cuantificables y que sus costos se pueden medir en el mismo
moneda: tiempo. Dejar algo sin clasificar podría considerarse un acto
de procrastinación: pasar la pelota al yo futuro, que tendrá que pagar
con intereses lo que decidimos no pagar por adelantado. Pero toda la historia es
más sutil que eso. A veces, el desorden es más que una simple elección. Es el
elección óptima.
Clases y deportes
La compensación de ordenación por búsqueda sugiere que a menudo es más eficiente dejar un
desorden. Sin embargo, ahorrar tiempo no es la única razón por la que ordenamos las cosas: a veces
producir un pedido final es un fin en sí mismo. Y en ninguna parte es más claro que
en el campo deportivo.
Página 97
En 1883, Charles Lutwidge Dodgson se desarrolló increíblemente fuerte

sentimientos sobre el estado del tenis sobre hierba británico. Como él explica:
En un torneo de tenis sobre hierba, donde tuve la oportunidad, hace algún tiempo, de ser un espectador, el presente
El método de asignación de premios me fue informado por las lamentaciones de uno de los Jugadores,
que había sido derrotado (y por lo tanto había perdido toda posibilidad de un premio) al principio del concurso, y que había
tuvo la mortificación de ver el segundo premio arrebatado por un jugador que sabía que era bastante
inferior a él.
Los espectadores normales pueden atribuir tales "lamentaciones" a poco más

que el aguijón de la derrota, pero Dodgson no era un oído comprensivo ordinario. Él
era un profesor de matemáticas de Oxford, y las quejas del deportista enviaron
él en una investigación profunda de la naturaleza de los torneos deportivos.
Dodgson era más que un matemático de Oxford; de hecho, es
apenas recordado como haber sido uno. Hoy es mejor conocido por su pluma
nombre, Lewis Carroll, bajo el cual escribió Alice's Adventures en
Wonderland y muchas otras obras queridas de la literatura del siglo XIX.
Fusionando sus talentos matemáticos y literarios, Dodgson produjo uno de sus
obras menos conocidas: "Torneos de tenis sobre hierba: el verdadero método de
Asignación de premios con prueba de la falacia del método actual ”.
La queja de Dodgson estaba dirigida a la estructura del Single
Torneo de eliminación , donde los jugadores se emparejan entre sí y
eliminados de la competencia tan pronto como pierden un solo partido. Como
Dodgson argumentó enérgicamente, el verdadero segundo mejor jugador podría ser cualquiera de los
jugadores eliminados por el mejor, no solo por el último eliminado. Irónicamente,
en los Juegos Olímpicos celebramos partidos por la medalla de bronce, por lo que parece que
reconocer que el formato de eliminación única no nos da suficiente
información para determinar el tercer lugar. * Pero de hecho este formato no nos dice
suficiente para determinar el segundo lugar o, de hecho, cualquier cosa excepto el
ganador. Como dijo Dodgson, "El método actual de asignación de premios es,
excepto en el caso del primer premio, sin ningún sentido ”. Dicho claramente, el
La medalla de plata es mentira.
“Como un hecho matemático”, continuó, “la posibilidad de que el segundo mejor
El jugador obtendrá el premio que se merece en sólo 16/31; mientras que la posibilidad de que
Página 98
los 4 mejores obtendrán sus premios adecuados es tan pequeño, que las probabilidades son de 12 a 1
en contra de que suceda! "
A pesar de los poderes de su pluma, parece que Dodgson tuvo poco impacto
en el mundo del tenis sobre hierba. Su solución, una incómoda versión de triple
eliminación donde la derrota de alguien que te había derrotado también podría
eliminarte, nunca me di cuenta. Pero si la solución de Dodgson fuera
engorroso, su crítica del problema fue, sin embargo, acertada. (Pobre de mí,
Las medallas de plata todavía se están entregando en los torneos de eliminación individual.
para este día.)
Pero también hay una visión más profunda de la lógica de Dodgson. Nosotros los humanos clasificamo
más que nuestros datos, más que nuestras posesiones. Nos clasificamos nosotros mismos .
La Copa del Mundo, los Juegos Olímpicos, la NCAA, NFL, NHL, NBA y MLB
—Todos estos implementan implícitamente procedimientos de clasificación. Sus estaciones,
las escaleras y los playoffs son algoritmos para producir el orden de clasificación.
Uno de los algoritmos más familiares en los deportes es el Round-Robin.
formato, donde cada uno de n equipos finalmente juega contra todos los otros n - 1
equipos. Si bien podría decirse que es el más completo, también es uno de los más
laborioso. Tener a todos los equipos lidiando con todos los demás es como tener
Los invitados intercambian abrazos en nuestra cena: la temida O ( n 2 ), tiempo cuadrático.
Torneos de escaleras : populares en deportes como bádminton, squash y
Ráquetbol: coloque a los jugadores en una clasificación lineal, con cada jugador permitido
emitir un desafío directo al jugador inmediatamente encima de ellos, intercambiando
lugares si prevalecen. Las escaleras son las clases de burbujas del mundo atlético y
por lo tanto, también son cuadráticas, lo que requiere que los juegos O ( n 2 ) alcancen una clasificación e
Quizás el formato de torneo más común, sin embargo, es un paréntesis.
torneo, como en el famoso baloncesto de la NCAA "March Madness", entre
muchos otros. El torneo March Madness avanza desde la “Ronda
de 64 "y la" Ronda de 32 "hasta el" Sweet 16 "," Elite Eight "," Final
Cuatro ”y la final. Cada ronda divide el campo por la mitad: ¿suena eso?
familiarmente logarítmico? Estos torneos son efectivamente Mergesort,
comenzando con pares de equipos no clasificados y cotejando, cotejando, cotejando
ellos.
Página 99
Sabemos que Mergesort opera en tiempo linealítmico, O ( n log n ), y

así que, dado que hay 64 equipos, podemos esperar que solo necesitemos algo como
6 rondas (192 juegos), en lugar de la friolera de 63 rondas (2,016 juegos)
tardaría en hacer una escalera o Round-Robin. Esa es una gran mejora:
diseño de algoritmos en el trabajo.
Seis rondas de March Madness suenan bien, pero espera un segundo: 192
¿juegos? El torneo de la NCAA dura solo 63 juegos.
De hecho, March Madness no es un Mergesort completo, no produce
un pedido completo de los 64 equipos. Para clasificar realmente a los equipos, necesitaríamos un extra
conjunto de juegos para determinar el segundo lugar, otro para el tercero, etc.
tomando un número linealitmico de juegos en suma. Pero March Madness no
Haz eso. En cambio, al igual que el torneo de tenis sobre hierba que Dodgson
se quejó, utiliza un formato de eliminación única donde los eliminados
los equipos quedan sin clasificar. La ventaja es que se ejecuta en tiempo lineal: ya que
cada juego elimina exactamente un equipo, para que quede un equipo
de pie solo necesitas n - 1 juegos, un número lineal. La desventaja es
que, bueno, nunca entiendes realmente la clasificación aparte del primer lugar.
Irónicamente, en Eliminación Individual, ninguna estructura de torneo es en realidad
necesario en absoluto. Cualquier 63 juegos producirán un solo campeón invicto. Para
Por ejemplo, simplemente podría hacer que un solo equipo del "rey de la colina" se enfrente
retadores uno por uno hasta que es destronado, momento en el que quienquiera
derrotado, toma su lugar y continúa. Este formato tendría el
inconveniente de necesitar 63 rondas separadas, sin embargo, ya que los juegos no
suceder en paralelo; Además, un equipo podría tener que jugar tantos como
63 juegos seguidos, lo que podría no ser ideal desde el punto de vista de la fatiga.
Aunque nació mucho más de un siglo después de Dodgson, tal vez nadie lleve
adelante su visión matemática del deporte en el siglo XXI como
fuertemente como Michael Trick. Conocimos a Trick en nuestra discusión de óptimo
detenerse, pero en las décadas transcurridas desde su desafortunada aplicación de la Regla del 37%
a su vida amorosa se ha convertido no solo en esposo y profesor de
investigación de operaciones: ahora también es uno de los principales programadores de
Major League Baseball y para conferencias de la NCAA como Big Ten y la
ACC, utilizando la informática para decidir los enfrentamientos del año.
Página 100
Como señala Trick, las ligas deportivas no se preocupan por determinar

las clasificaciones de la forma más rápida y expedita posible. En cambio, los deportes
los calendarios están diseñados explícitamente para mantener la tensión durante toda la temporada,
algo que rara vez ha sido una preocupación de la teoría de la clasificación.
Por ejemplo, en las Grandes Ligas, a menudo tienes carreras para ver quién va a ganar la
división. Ahora, si ignoramos la configuración divisional, algunas de esas carreras podrían resolverse de manera justa.
temprano en la temporada. Pero, en cambio, lo que hacemos es asegurarnos de que en las últimas cinco semanas,
todos juegan con todos los demás dentro de su división. El propósito de eso es que no importa
que está en una carrera divisional: tendrán que enfrentarse a su próximo oponente más cercano al menos seis
juegos en las últimas cinco semanas de la temporada. Eso permite un mayor interés en el horario o
interés en la temporada porque en este caso, la incertidumbre se retrasa en su resolución.
Además, los deportes no siempre están diseñados estrictamente para

minimizar el número de juegos. Sin recordar esto, algunos aspectos de
De lo contrario, la programación deportiva le parecería misteriosa a un informático.
Como dice Trick sobre la temporada regular de béisbol de 2.430 juegos, "sabemos que n
log n es el número correcto de comparaciones para realizar una clasificación completa. Eso te puede atra
todo el mundo . ¿Por qué hacen n 2 para obtener, en cierto sentido, la parte superior , si
eso es todo lo que les importa? En otras palabras, ¿por qué un O ( n 2 ) Round-
Robin y algo más, si sabemos que podemos hacer una clasificación completa en tiempo lineal,
y puede coronar a un campeón invicto de eliminación individual en menos de n
¿juegos? Bueno, minimizar el número de juegos no está realmente en la liga
interesar. En informática, las comparaciones innecesarias siempre son malas, una
pérdida de tiempo y esfuerzo. Pero en los deportes eso está lejos de ser el caso. En muchos
Respetos, después de todo, los juegos en sí mismos son el punto.
Derechos de agarre: ruido y robustez
Otra forma, quizás incluso más importante, de entrenar una lente algorítmica
en el deporte es preguntar no qué confianza debemos tener en la medalla de plata,
pero qué confianza debemos tener en el oro .
Como explica Michael Trick, en algunos deportes, "por ejemplo, el béisbol, un equipo
va a perder el 30% de sus juegos y un equipo va a ganar el 30% de sus juegos
Página 101
juegos prácticamente sin importar quiénes sean ". Esto tiene implicaciones inquietantes
para el formato de Eliminación Única. Si los juegos de baloncesto de la NCAA, digamos, se ganan
por el equipo más fuerte el 70% del tiempo, y ganar el torneo implica
prevaleciendo en 6 juegos seguidos, entonces el mejor equipo tiene solo un 0,70 al 6
poder, menos del 12%, ¡posibilidades de ganar el torneo! Pon otro
De esta manera, el torneo coronaría al mejor equipo de la liga solo una vez al año.
década.
Puede ser que en algunos deportes, tener incluso un 70% de confianza en la
El resultado podría ser poner demasiado valor en la puntuación final. UCSD
El físico Tom Murphy aplicó técnicas de modelado numérico al fútbol.
y concluyó que los bajos puntajes del fútbol hacen que los resultados del juego estén mucho más cerca
al azar de lo que la mayoría de los fanáticos preferirían imaginar. "Una puntuación de 3: 2 da
equipo ganador solo una posibilidad de 5 en 8 de ser realmente un mejor equipo ...
Personalmente, esto no me parece muy impresionante. Incluso un reventón de 6: 1
deja un 7% de probabilidad de que haya sido una casualidad estadística ".
Los científicos informáticos llaman a este fenómeno ruido . Toda la clasificación
algoritmos que hemos considerado hasta ahora suponen perfecto, impecable,
comparaciones infalibles, que nunca estropean y juzgan erróneamente el
menor de dos cantidades es mayor. Una vez que permita una "ruidosa
comparador ", algunos de los algoritmos más consagrados de la informática se publican
la ventana, y algunos de los más difamados tienen su día de redención.
Dave Ackley, profesor de informática en la Universidad de New
México, trabaja en la intersección de la informática y la "vida artificial" -
él cree que las computadoras pueden soportar aprender algunas cosas de la biología. Para
principiantes, los organismos viven en un mundo donde pocos procesos tienen cerca
el nivel de confiabilidad del que dependen las computadoras, por lo que se construyen a partir del
molido para lo que los investigadores llaman robustez . Es hora, argumenta Ackley,
que también comenzamos a reconocer las virtudes de la robustez en los algoritmos.
Por lo tanto, mientras que el tomo de programación autorizada Ordenación y búsqueda
declara audazmente que "el tipo de burbuja no tiene características redimidoras aparentes", el
La investigación de Ackley y sus colaboradores sugiere que puede haber un lugar
para algoritmos como Bubble Sort después de todo. Su misma ineficiencia: moverse
elementos solo en una posición a la vez, lo hace bastante resistente contra el ruido, lejos
Página 102
más robusto que los algoritmos más rápidos como Mergesort, en el que cada
la comparación potencialmente mueve un elemento en gran medida. Mergesort es muy
la eficiencia lo hace quebradizo. Un error temprano en un Mergesort es como una pérdida fortuita
en la primera ronda de un torneo de Eliminación Única, que no solo puede
arruinar las esperanzas de campeonato de un equipo favorito, pero también relegar permanentemente
a la mitad inferior de los resultados. * En un torneo Ladder, por otro
mano, como en un Bubble Sort, una pérdida fortuita solo haría retroceder a un jugador una
lugar en la clasificación.
Pero, de hecho, no es Bubble Sort lo que surge como el mejor algoritmo
ante un comparador ruidoso. El ganador de ese honor en particular es un
algoritmo denominado Clasificación de recuento de comparación . En este algoritmo, cada elemento
se compara con todos los demás, generando un recuento de cuántos elementos es
más grande que. Este número se puede utilizar directamente como clasificación del artículo. Ya que
compara todos los pares, el ordenamiento de recuento de comparación es un tiempo cuadrático
algoritmo, como Bubble Sort. Por lo tanto, no es una opción popular en los
aplicaciones informáticas, pero es excepcionalmente tolerante a fallos.
El funcionamiento de este algoritmo debería sonar familiar. Recuento de comparación
Sort funciona exactamente como un torneo Round-Robin. En otras palabras,
se parece mucho a la temporada regular de un equipo deportivo, jugando todos los demás
equipo en la división y construyendo un récord de victorias y derrotas por el cual son
clasificado.
Esa clasificación de recuento de comparación es la clasificación más sólida
algoritmo conocido, cuadrático o mejor, debería ofrecer algo muy específico
para los fanáticos del deporte: si su equipo no llega a los playoffs, no se queje. los
La postemporada de Mergesort es arriesgada, pero el recuento de comparación regular
la temporada no lo es; Los anillos de campeonato no son robustos, pero la clasificación divisional es
literalmente tan robusto como sea posible. Dicho de otra manera, si su equipo es eliminado temprano
en la postemporada, es mala suerte. Pero si su equipo no logra llegar al
postemporada, es la dura verdad. Puede obtener simpatía del bar deportivo de su
otros fanáticos decepcionados, pero no obtendrás ninguno de un científico informático.
Tipo de sangre: jerarquías de dominancia y órdenes jerárquicas
Página 103
En todos los ejemplos que hemos considerado hasta ahora, el proceso de clasificación en cada
El caso se ha impuesto de arriba hacia abajo: un bibliotecario colocando libros, el
La NCAA les dice a los equipos contra quién jugar y cuándo. Pero, ¿y si cara a cara?
las comparaciones ocurrieron solo de manera voluntaria? ¿Cómo se ve la clasificación cuando
emerge orgánicamente, de abajo hacia arriba?
Puede parecerse al póquer en línea.
A diferencia de la mayoría de los deportes, que se rigen por un organismo rector de algún tipo,
El póquer sigue siendo algo anárquico a pesar de la explosión en popularidad durante el
decada pasada. Aunque algunos torneos de alto perfil clasifican explícitamente sus
concursantes (y remunerarlos en consecuencia), una parte sustancial de
El póquer todavía se juega en lo que se conoce como "juegos de dinero", donde dos o más
los jugadores aceptan espontáneamente jugar con dinero real en la línea con cada
mano.
Prácticamente nadie conoce este mundo más profundamente que Isaac Haxton, uno
de los mejores jugadores de póquer de cash-game del mundo. En la mayoría de los deportes es suficiente
Ser lo mejor posible, y el menos consciente de sí mismo es acerca de sus habilidades.
el mejor. Pero, explica Haxton, "en cierto modo, la habilidad más importante como
un jugador de póquer profesional debe poder evaluar lo bueno que eres. Si
eres cualquier cosa menos que el mejor jugador de póquer del mundo, puedes ser
bastante seguro de ir a la quiebra si estás infinitamente dispuesto a jugar
gente mejor que tú ".
Haxton es un especialista en heads-up, sin límites: "heads-up" significa uno contra
un póquer, y "sin límite" significa solo eso: las apuestas más altas, limitadas
sólo por lo que pueden financiar y soportar. En efectivo de póquer para múltiples manos
juegos, a menudo habrá un jugador débil: un aficionado adinerado, para
ejemplo: alimentar una mesa llena de profesionales, a quienes no les importa mucho
quién de ellos es mejor que quién. En el mundo del heads-up, es
diferente. "Tiene que haber un desacuerdo entre usted y ellos sobre
quién es mejor, o alguien tiene que perder voluntariamente ".
Entonces, ¿qué sucede cuando hay un consenso bastante establecido y no
¿Está dispuesto a interpretar a alguien mejor que ellos? Obtienes algo que
se parece mucho a los jugadores que simplemente compiten por asientos. La mayoría de los sitios de póq
tener solo un número finito de tablas disponibles. "Así que si quieres jugar a la cabeza-
Página 104
sin límite, con ciegas de cincuenta y cien dólares, solo hay diez
tablas disponibles para eso ", dice Haxton," por lo que sólo el consenso diez mejores
jugadores que están fuera en este momento ... sentarse y esperar a que aparezca alguien que
quiere jugar." Y si llega un jugador superior y se sienta en uno de los
estas tablas? Si la persona sentada no está dispuesta a apostar, se largará.
“Imagínense dos monos”, dice Christof Neumann. "Uno está sentado y
alimentándose en su lugar, muy pacíficamente, y otro se acerca [a] donde
el otro chico está sentado. Y ese tipo luego se levantaba y se iba ".
Neumann no está haciendo una metáfora del póquer. Es un biólogo conductual en
la Universidad de Neuchâtel que estudia la dominancia en macacos. Que es
recién descrito se conoce como desplazamiento .
El desplazamiento ocurre cuando un animal usa su conocimiento de la
jerarquía para determinar que una confrontación en particular simplemente no vale la pena.
En muchas sociedades animales, los recursos y las oportunidades: comida, parejas,
espacios preferidos, etc., son escasos, y de alguna manera debe decidirse
quién obtiene qué. Establecer un orden con anticipación es menos violento que
llegando a los golpes cada vez que una oportunidad de apareamiento o un lugar privilegiado de hierba
se vuelve disponible. Aunque podamos encogernos cuando veamos a las criaturas girando
sus garras y picos entre sí, los biólogos tienden a pensar en picotear
órdenes como la violencia que se adelanta a la violencia.
¿Suena familiar? Es el intercambio de búsqueda y ordenación.
La creación de un orden jerárquico es una solución pugilística a un
problema fundamentalmente computacional . Por eso, dicho sea de paso,
deshuesar pollos en granjas puede ser una buena intención, pero
enfoque contraproducente: elimina la autoridad de las luchas individuales para
resolver el orden y, por lo tanto, hace que sea mucho más difícil para el rebaño correr
cualquier procedimiento de clasificación. Entonces, la cantidad de antagonismo dentro del rebaño
en muchos casos realmente aumenta.
Observando el comportamiento animal desde la perspectiva de la informática
sugiere varias cosas. Por un lado, implica que el número de hostiles
Las confrontaciones encontradas por cada individuo crecerán sustancialmente, en
al menos logarítmicamente, y quizás cuadráticamente, a medida que el grupo crece.
De hecho, los estudios de "comportamiento agonista" en gallinas han encontrado que "agresivo
Página 105
actos por gallina aumentaron a medida que aumentaba el tamaño del grupo ". Clasificando la teoría así
sugiere que la crianza ética de ganado puede incluir la limitación del tamaño de
el rebaño o la manada. (En la naturaleza, los pollos salvajes deambulan en grupos de diez a
veinte, mucho más pequeño que el tamaño de las parvadas en las granjas comerciales).
mostrar que la agresión parece desaparecer después de un período de algunas semanas,
a menos que se agreguen nuevos miembros al rebaño, lo que corrobora la idea de que el
el grupo se está ordenando a sí mismo.
La clave para pensar en la ordenación descentralizada en la naturaleza, argumenta Jessica
Flack, codirector del Centro de Complejidad y Computación Colectiva
en UW-Madison, es que las jerarquías de dominio son, en última instancia, información
jerarquías. Hay una carga computacional significativa para estos
sistemas de clasificación descentralizados, señala Flack. El número de peleas en,
digamos, un grupo de macacos se minimiza solo en la medida en que cada mono
tiene una comprensión detallada, y similar, de la jerarquía. De lo contrario
sobrevendrá la violencia.
Si se trata de lo buenos que son los protagonistas para hacer un seguimiento de
el orden actual, podríamos esperar ver menos confrontaciones como animales
ser más capaz de razonar y recordar. Y tal vez los humanos vengan
lo más cercano a una clasificación óptimamente eficiente. Como dice Haxton sobre el mundo del póquer,
"Soy uno de los mejores jugadores de heads-up, no-limit hold 'em del mundo, y en
en mi cabeza tengo una clasificación bastante específica de quiénes creo que son los veinte mejores
los jugadores son, y creo que cada uno de ellos tiene una clasificación similar en su mente. I
creo que hay un alto grado de consenso sobre el aspecto de la lista
igual que." Solo cuando estas clasificaciones difieran, se producirán los juegos de efectivo.
Una carrera en lugar de una pelea
Ahora hemos visto dos inconvenientes separados del deseo de cualquier grupo de clasificar
sí mismo. Tienes, como mínimo, un número linealítmico de enfrentamientos,
haciendo que la vida de todos sea más combativa a medida que el grupo crece, y también
obligar a todos los competidores a realizar un seguimiento del estado en constante cambio de todos
de lo contrario, de lo contrario, se encontrarán librando batallas que no necesitaban. Eso
grava no sólo el cuerpo sino también la mente.
Página 106
Pero no tiene por qué ser así. Hay formas de ordenar

sin los costos.
Hay un concurso deportivo, por ejemplo, donde decenas de miles de
Los competidores están completamente clasificados en el tiempo que se necesita para mantener solo un
Evento único. (Un torneo Round-Robin con diez mil jugadores, en el
otro lado, requeriría cien millones de emparejamientos.) La única advertencia es
que el tiempo requerido para el evento lo determinan sus competidores más lentos.
Este concurso deportivo es el maratón, y sugiere algo crítico: una
la raza es fundamentalmente diferente a una pelea.
Considere la diferencia entre boxeadores y esquiadores, entre esgrimistas y
corredores. Un boxeador olímpico debe arriesgarse a sufrir una conmoción cerebral O (log n ) veces, gen
de 4 a 6, para llegar al podio; permitiendo un mayor número de deportistas
en los juegos pondría en peligro la salud de todos. Pero un corredor esqueleto o un esquí
El especialista en jumper o halfpipe necesita hacer solo un número constante de
juega con la gravedad, sin importar el tamaño del campo. Una esgrimista se pone en
la misericordia de su oponente O (log n ) veces, pero un maratonista debe
una carrera. Ser capaz de asignar una medida numérica simple de desempeño.
da como resultado un algoritmo de tiempo constante para el estado.
Este movimiento de números "ordinales" (que solo expresan rango ) a
Los "cardinales" (que asignan directamente una medida al calibre de algo)
naturalmente, ordena un conjunto sin requerir comparaciones por pares. Respectivamente,
Posibilita jerarquías de dominancia que no requieren un contacto directo
enfrentamientos de cabeza. La lista Fortune 500, en la medida en que crea una especie de
jerarquía corporativa, es uno de ellos. Para encontrar la empresa más valiosa en
Estados Unidos, los analistas no necesitan realizar la debida diligencia para comparar
Microsoft a General Motors, luego General Motors a Chevron, Chevron a
Walmart, etc. Estos concursos aparentemente de manzanas a naranjas (cómo
¿Cuántas instalaciones de software empresarial equivalen a cuántos futuros de petróleo?)
manzanas con manzanas en dólares. Tener un punto de referencia, cualquier
punto de referencia: resuelve el problema computacional de escalar un tipo.
En Silicon Valley, por ejemplo, hay un adagio sobre las reuniones: "Tú vas
al dinero, el dinero no te llega ". Los vendedores acuden a los fundadores,
los fundadores van a los capitalistas de riesgo, los capitalistas de riesgo van a su limitado
Página 107
socios. Es posible que los individuos resientan la base de esta jerarquía,

pero no realmente para impugnar su veredicto. Como resultado, el individuo por pares
las interacciones tienen lugar con un mínimo de maniobras por el estatus. Por y
grande, cualquier par de personas puede decir, sin necesidad de negociar, quién es
se supone que muestra qué nivel de respeto hacia quién. Todo el mundo sabe a donde ir
encontrarse.
Asimismo, si bien el derecho de paso marítimo se rige en teoría por un
extremadamente elaborado conjunto de convenciones, en la práctica una sencilla
principio determina qué barcos ceden el paso a qué: la "Ley de Gross
Tonelaje." Sencillamente, el barco más pequeño se aparta del camino del más grande.
uno. Algunos animales también tienen la suerte de tener un dominio tan claro
jerarquías. Como observa Neumann, "Mire los peces, por ejemplo: el más grande
uno es el dominante. Es muy simple." Y como es tan simple, es
pacífico . A diferencia de los pollos y primates, los peces hacen orden sin mudarse
sangre.
Cuando pensamos en los factores que hacen que las sociedades humanas a gran escala
posible, es fácil centrarse en tecnologías: agricultura, metales, maquinaria.
Pero la práctica cultural de medir el estado con métricas cuantificables podría
ser igual de
"Respeta importante.
a tus mayores",El dinero,
por portambién
ejemplo, supuesto, no tienelas
resuelve por qué ser elde
cuestiones criterio; una regla como
las personas
estado por referencia a una cantidad común. Y el mismo principio está en funcionamiento
entre naciones como dentro de ellas. A menudo se observa que un punto de referencia como
PIB nacional, que subyace en las listas de invitados a cumbres diplomáticas como
como el G20, es una medida tosca e imperfecta. Pero la existencia de cualquier
punto de referencia transforma la cuestión del estatus nacional de una
exigiendo al menos un número lineal de peleas y resoluciones en
algo con un único punto de referencia que los clasifica a todos. Dado que nación a
Las disputas sobre el estatus de una nación a menudo toman forma militar, esto no solo ahorra tiempo si
vidas.
Los números lineales de peleas pueden funcionar bien para grupos de pequeña escala;
lo hacen en la naturaleza. Pero en un mundo donde el estatus se establece a través de
comparaciones por pares, ya sea que impliquen el intercambio de retórica o
disparos: la cantidad de confrontación rápidamente se sale de control a medida que
Página 108
la sociedad crece. Operando a escala industrial, con muchos miles o

millones de personas compartiendo el mismo espacio, requiere un salto más allá. A
salto de ordinal a cardinal.
Por mucho que lamentamos la carrera de ratas diaria, el hecho de que sea una carrera en lugar de
una pelea es una parte clave de lo que nos diferencia de los monos, las gallinas:
y, para el caso, las ratas.
Página 109
*Esto está lejos del único registro de Bradáč: puede escapar de tres pares de esposas mientras
bajo el agua en aproximadamente la misma cantidad de tiempo.
Página 110
*En realidad, el tiempo promedio de ejecución de Bubble Sort no es mejor, ya que los libros, en promedio, serán
n / 2 posiciones lejos de donde se supone que deben terminar. Un científico informático todavía redondeará n / 2
pasa de n libros hasta O ( n 2 ).
Página 111
*En raras ocasiones, como en el boxeo, donde no es seguro desde el punto de vista médico que un boxeador vuelva a pelear después de haber sido
recientemente eliminado, en su lugar se otorgan dos bronces.
Página 112
*Es interesante notar que el torneo March Madness de la NCAA está diseñado conscientemente para mitigar
esta falla en su algoritmo. El mayor problema de la eliminación simple, como hemos dicho, parece
ser un escenario en el que el primer equipo que sea eliminado por el equipo ganador sea en realidad el segundo
mejor equipo en general, pero aterriza en la mitad inferior (sin clasificar). La NCAA soluciona esto sembrando
los equipos, de modo que los equipos mejor clasificados no puedan encontrarse en las primeras rondas. El proceso de siembra
parece ser confiable al menos en el caso más extremo, ya que un equipo decimosexto nunca ha derrotado
una primera semilla en la historia de March Madness.
Página 113
4 Almacenamiento en caché
Olvídalo
En el uso práctico de nuestro intelecto, el olvido es un

funciona como recordatorio.
—WILLIAM JAMES
Tienes un problema. Su armario se desborda, derramando zapatos, camisas y

ropa interior en el suelo. Piensas: "Es hora de organizarse". Ahora tu
tiene dos problemas.
Específicamente, primero debe decidir qué conservar y, segundo, cómo
Arréglalo. Afortunadamente, hay una pequeña industria de personas que piensan en
estos problemas gemelos para ganarse la vida, y están más que felices de ofrecer su
Consejo.
Sobre qué conservar, Martha Stewart dice que se haga algunas preguntas:
“¿Cuánto tiempo lo tengo? ¿Sigue funcionando? ¿Es un duplicado de
algo que ya tengo? ¿Cuándo fue la última vez que lo usé o lo usé? " Sobre
cómo organizar lo que guardas, recomienda "agrupar cosas como
juntos ”, y sus compañeros expertos coinciden. Francine Jay, en La alegría de menos ,
estipula: "Cuelga todas tus faldas juntas, pantalones juntos, vestidos juntos,
y abrigos juntos ". Andrew Mellen, quien se anuncia a sí mismo como "El más
Hombre organizado en América ", dicta," Los elementos se ordenarán por tipo: todos
pantalones juntos, camisas juntas, abrigos, etc. Dentro de cada tipo, están más
ordenados por color y estilo: manga larga o manga corta, escote, etc. "
Página 114
Aparte del problema de clasificación que esto podría implicar, parece un buen consejo; eso
ciertamente parece unánime.
Excepto que hay otra industria más grande de profesionales que también
piensan obsesivamente en el almacenamiento y tienen sus propias ideas.
Tu armario presenta el mismo desafío al que se enfrenta una computadora
a la hora de gestionar su memoria: el espacio es limitado y el objetivo es salvar tanto
dinero y tiempo. Desde que ha habido computadoras, la computadora
Los científicos han lidiado con el problema dual de qué conservar y cómo
Arréglalo. Los resultados de estas décadas de esfuerzo revelan que en sus cuatro
consejos de frases sobre qué lanzar, Martha Stewart en realidad hace varios
recomendaciones diferentes y no totalmente compatibles, una de las cuales es
mucho más crítico que los demás.
La informática de la gestión de la memoria también revela exactamente cómo
su armario (y su oficina) debe estar arreglado. A primera vista,
las computadoras parecen seguir la máxima de Martha Stewart de "agrupar como
cosas juntos." Los sistemas operativos nos animan a poner nuestros archivos en
carpetas, como con like, formando jerarquías que se ramifican a medida que su contenido
llegar a ser cada vez más específico. Pero al igual que la pulcritud del escritorio de un erudito puede
ocultar el desorden de su mente, también lo hace la aparente pulcritud de un
El sistema de archivos de la computadora oscurece el caos altamente diseñado de cómo se procesan los d
en realidad se almacena debajo del revestimiento de la carpeta anidada.
Lo que realmente está sucediendo se llama almacenamiento en caché .
El almacenamiento en caché juega un papel fundamental en la arquitectura de la memoria, y
subyace en todo, desde el diseño de los chips del procesador al milímetro
escala a la geografía de Internet global. Ofrece una nueva perspectiva sobre
todos los diversos sistemas de almacenamiento y bancos de memoria de la vida humana, no solo
nuestras máquinas, pero también nuestros armarios, nuestras oficinas, nuestras bibliotecas. Y nuestras c
La jerarquía de la memoria
Cierta mujer tenía una conciencia muy aguda, pero casi no

memoria ... Ella recordaba lo suficiente como para trabajar, y trabajó duro.
—LYDIA DAVIS
Página 115
Aproximadamente alrededor de 2008, cualquiera en el mercado de una computadora nueva ha

encontraron un acertijo particular al elegir su opción de almacenamiento.
Deben hacer un compromiso entre tamaño y velocidad . La industria informática
se encuentra actualmente en transición de unidades de disco duro a unidades de estado sólido; en el
mismo precio, un disco duro ofrecerá una capacidad mucho mayor, pero una
La unidad de estado sólido ofrecerá un rendimiento dramáticamente mejor, como la mayoría
los consumidores ahora saben, o pronto descubrirán, cuándo comienzan a comprar.
Lo que los consumidores ocasionales pueden no saber es que esta compensación exacta está siendo
hecho dentro de la propia máquina en una serie de escalas, hasta el punto en que
se considera uno de los principios fundamentales de la informática.
En 1946, Arthur Burks, Herman Goldstine y John von Neumann,
trabajando en el Instituto de Estudios Avanzados en Princeton, presentó un diseño
propuesta de lo que llamaron un "órgano de memoria" eléctrico. En un ideal
mundo, escribieron, la máquina tendría, por supuesto, cantidades ilimitadas de
almacenamiento ultrarrápido, pero en la práctica esto no fue posible. (Todavía no lo es)
En cambio, el trío propuso lo que creían que era la mejor opción: “una
jerarquía de memorias, cada una de las cuales tiene mayor capacidad que la
anterior pero que es menos accesible ". Al tener efectivamente una
pirámide de diferentes formas de memoria: una memoria pequeña y rápida y una gran
lento, tal vez de alguna manera podríamos sacar lo mejor de ambos.
La idea básica detrás de una jerarquía de memoria debe ser intuitiva para cualquiera.
quien alguna vez ha usado una biblioteca. Si está investigando un tema para un artículo,
Por ejemplo, hay algunos libros a los que quizás deba consultar en varias ocasiones.
En lugar de volver a la biblioteca cada vez, por supuesto, consulte el
libros relevantes y llévelos a casa en su escritorio, donde puede acceder
ellos más fácilmente.
En informática, esta idea de una "jerarquía de memoria" seguía siendo solo una teoría
hasta el desarrollo en 1962 de una supercomputadora en Manchester, Inglaterra,
llamado Atlas. Su memoria principal consistía en un gran tambor que podía ser
girado para leer y escribir información, similar a un fonógrafo de cera
cilindro. Pero Atlas también tenía una memoria de "trabajo" más pequeña y más rápida construida a par
imanes polarizados. Los datos se pueden leer desde el tambor a los imanes,
manipulado allí con facilidad, y los resultados luego se escriben en el tambor.
Página 116
Poco después del desarrollo de Atlas, matemático de Cambridge

Maurice Wilkes se dio cuenta de que esta memoria más pequeña y rápida no era solo una
lugar conveniente para trabajar con los datos antes de volver a guardarlos. También podría
Ser utilizado para retener deliberadamente piezas de información que probablemente sean necesarias.
más tarde, anticipando solicitudes futuras similares y acelerando drásticamente la
funcionamiento de la máquina. Si lo que necesitabas todavía estaba en funcionamiento
memoria, no tendría que cargarlo desde el tambor en absoluto. Como dijo Wilkes
ella, la memoria más pequeña "acumula automáticamente para sí las palabras que vienen
desde una memoria principal más lenta y los mantiene disponibles para su uso posterior
sin que sea necesario que la penalización del acceso a la memoria principal sea
incurrido de nuevo ".
La clave, por supuesto, sería administrar ese pequeño, rápido y precioso
memoria para que tuviera lo que estabas buscando con la mayor frecuencia posible. Para
Continúe con la analogía de la biblioteca, si puede hacer un solo viaje al
pilas para obtener todos los libros que necesita y luego pasar el resto de la semana
trabajar en casa, eso es casi tan bueno como si todos los libros de la biblioteca tuvieran
ya ha estado disponible en su escritorio. Cuantos más viajes a la biblioteca
hacer, cuanto más lentas van las cosas y menos está haciendo tu escritorio por ti.
La propuesta de Wilkes se implementó en la supercomputadora IBM 360/85
más tarde en la década de 1960, donde adquirió el nombre de "caché". Desde entonces,
los cachés han aparecido por todas partes en la informática. La idea de mantener
en torno a piezas de información a las que hace referencia con frecuencia es tan poderosa que
se utiliza en todos los aspectos de la computación. Los procesadores tienen cachés. Duro
las unidades tienen cachés. Los sistemas operativos tienen cachés. Los navegadores web tienen
cachés. Y los servidores que entregan contenido a esos navegadores también tienen
cachés, lo que permite mostrarte instantáneamente el mismo video de un gato
montando una aspiradora que millones de… Pero nos estamos adelantando
nosotros mismos un poco.
La historia de la computadora durante los últimos cincuenta años ha sido pintada
como uno de crecimiento exponencial año tras año, haciendo referencia, en parte, a la
predicción famosa y precisa de la "Ley de Moore", realizada por Gordon de Intel
Moore en 1975, que el número de transistores en las CPU se duplicaría cada
dos años. Lo que no ha mejorado a ese ritmo es el rendimiento de la memoria,
Página 117
lo que significa que, en relación con el tiempo de procesamiento, el costo de acceder a la memoria
también está aumentando exponencialmente. Cuanto más rápido pueda escribir sus artículos,
Por ejemplo, mayor es la pérdida de productividad de cada viaje a la biblioteca.
Del mismo modo, una fábrica que duplica su velocidad de fabricación cada año, pero tiene
el mismo número de piezas enviadas desde el extranjero con la misma lentitud
ritmo, significará poco más que una fábrica que está dos veces más inactiva. Por un tiempo
Parecía que la Ley de Moore estaba rindiendo poco, excepto procesadores que
jugueteaban con los pulgares cada vez más rápido y cada vez más. En la década de 1990
esto comenzó a conocerse como el "muro de la memoria".
La mejor defensa de la informática contra chocar contra ese muro ha sido una
jerarquía cada vez más elaborada: cachés para cachés para cachés, hasta el final
abajo. Las computadoras portátiles, tabletas y teléfonos inteligentes de consumo modernos tienen en el
orden de una jerarquía de memoria de seis capas, y la gestión de la memoria de manera inteligente ha
nunca ha sido tan importante para la informática como lo es hoy.
Así que comencemos con la primera pregunta que me viene a la mente sobre los cachés (o
armarios, para el caso). ¿Qué hacemos cuando se llenan?
Desalojo y clarividencia
Puede estar seguro de que llega un momento en que por cada adición de
conocimiento olvidas algo que sabías antes. Es del
Por tanto, es de suma importancia no dejar que los hechos inútiles se escapen
los útiles.
-SHERLOCK HOLMES
Cuando se llena un caché, obviamente necesitará hacer espacio si

quiere almacenar cualquier otra cosa, y en ciencias de la computación esta creación de espacio es
llamado "reemplazo de caché" o "desalojo de caché". Como escribió Wilkes, "Desde
el [caché] solo puede ser una fracción del tamaño de la memoria principal, palabras
no puede conservarse en él indefinidamente, y debe estar conectado a la
sistema un algoritmo mediante el cual se sobrescriben progresivamente ". Estas
Página 118
Los algoritmos se conocen como "políticas de reemplazo" o "políticas de desalojo", o

simplemente como algoritmos de almacenamiento en caché.
IBM, como hemos visto, jugó un papel temprano en la implementación del almacenamiento en caché
sistemas en la década de 1960. Como era de esperar, también fue el hogar de principios seminales
investigación sobre algoritmos de almacenamiento en caché, ninguno, quizás, tan importante como el de
László “Les” Bélády. Bélády nació en 1928 en Hungría, donde
Estudió como ingeniero mecánico antes de huir a Alemania durante el
Revolución húngara de 1956 con nada más que una cartera que contiene "una
cambio de ropa interior y mi trabajo de graduación ". De Alemania fue a
Francia, y en 1961 emigró a los Estados Unidos, trayendo a su esposa, "una
hijo pequeño y $ 1,000 en mi bolsillo, y eso es todo ". Parece que había adquirido
un sentido finamente afinado de qué conservar y qué dejar atrás para cuando llegue el momento
se encontró en IBM, trabajando en el desalojo de caché.
El artículo de 1966 de Bélády sobre algoritmos de almacenamiento en caché se convertiría en el más
citado pieza de investigación en ciencias de la computación durante quince años. Como explica,
el objetivo de la administración de caché es minimizar la cantidad de veces que no puede
encuentra lo que estás buscando en la caché y debes ir a la página principal más lenta
memoria para encontrarlo; estos se conocen como "errores de página" o "errores de caché". los
La política óptima de desalojo de caché, esencialmente por definición, escribió Bélády, es,
cuando el caché está lleno, para desalojar cualquier elemento que necesitemos de nuevo por más tiempo
a partir de ahora .
Por supuesto, saber exactamente cuándo volverá a necesitar algo es más fácil
dicho que hecho.
El hipotético algoritmo omnisciente y profético que miraría hacia el futuro
y ejecutar la política óptima se conoce hoy en homenaje como Bélády's
Algoritmo . El algoritmo de Bélády es un ejemplo de lo que los científicos informáticos
llamar un algoritmo "clarividente": uno informado por datos del futuro. Es
no necesariamente tan loco como suena; hay casos en los que un sistema
saber qué esperar, pero en general la clarividencia es difícil de conseguir, y
Los ingenieros de software bromean sobre encontrar "dificultades de implementación".
cuando intentan implementar el algoritmo de Bélády en la práctica. Entonces el desafío es
para encontrar un algoritmo que se acerque lo más posible a la clarividencia, por
Página 119
todas esas ocasiones en las que estamos atrapados firmemente en el presente y solo podemos adivinar
lo que nos espera.
Podríamos probar el desalojo aleatorio , agregando nuevos datos a la caché y
sobrescribir datos antiguos al azar. Uno de los primeros resultados sorprendentes en el almacenamiento
La teoría es que, aunque está lejos de ser perfecto, este enfoque no es tan malo. Como lo
sucede, el simple hecho de tener una caché hace que un sistema sea más eficiente,
independientemente de cómo lo mantenga. Los elementos que usas con frecuencia volverán a aparecer
el caché pronto de todos modos. Otra estrategia simple es Primero en entrar, primero en salir
( FIFO ), donde desaloja o sobrescribe lo que haya estado en el caché
el más largo (como en la pregunta de Martha Stewart “¿Cuánto tiempo lo tengo?”). A
El tercer enfoque es el menos usado recientemente ( LRU ): desalojar el artículo que se ha ido
el más largo sin tocar (Stewart's "¿Cuándo fue la última vez que lo usé o usé
¿eso?").
Resulta que estos dos mantras de Stewart no solo sugieren muy
políticas diferentes, una de sus sugerencias supera claramente a la otra.
Bélády comparó el desalojo aleatorio, FIFO y variantes de LRU en un
cantidad de escenarios y descubrió que LRU realizaba consistentemente el más cercano
a la clarividencia. El principio LRU es efectivo por algo
los informáticos llaman "localidad temporal": si un programa ha solicitado un
información en particular una vez, es probable que vuelva a hacerlo en los próximos
futuro. La localidad temporal resulta en parte de la forma en que las computadoras resuelven
problemas (por ejemplo, ejecutar un bucle que hace una serie rpida de
lee y escribe), pero también surge en la forma en que las personas resuelven problemas. Si
está trabajando en su computadora, es posible que esté cambiando entre sus
correo electrónico, un navegador web y un procesador de textos. El hecho de que accediste a uno
de estos recientemente es una pista de que es probable que lo vuelva a hacer, y todas las cosas
en igualdad de condiciones, el programa que no ha estado usando durante más tiempo es
también probablemente el que no se utilizará durante algún tiempo.
De hecho, este principio está incluso implícito en la interfaz que las computadoras
mostrar a sus usuarios. Las ventanas de la pantalla de tu computadora tienen lo que
llamado "orden Z", una profundidad simulada que determina qué programas se
superpuesto sobre el cual. Los que se han usado menos recientemente terminan en la parte inferior. Com
exlíder creativo de Firefox, Aza Raskin, dice: "Gran parte de tu tiempo
Página 120
el uso de un navegador moderno (computadora) se gasta en el equivalente digital de

barajar papeles ". Este "barajar" también se refleja exactamente en Windows
y las interfaces de cambio de tareas de Mac OS: cuando presiona Alt + Tab o
Comando + Tab, verá sus aplicaciones en orden de la mayoría
recientemente al menos usado recientemente.
La literatura sobre políticas de desalojo es tan profunda como uno puede imaginar
—Incluidos los algoritmos que tienen en cuenta la frecuencia y la actualidad del uso,
algoritmos que hacen un seguimiento del tiempo de la próxima acceso -to-último lugar de la última
uno, y así sucesivamente. Pero a pesar de la abundancia de esquemas innovadores de almacenamiento e
algunos de los cuales pueden vencer a LRU en las condiciones adecuadas, LRU en sí mismo, y
pequeños ajustes del mismo: es el favorito abrumador de los científicos de la computación,
y se utiliza en una amplia variedad de aplicaciones implementadas en una variedad de escalas.
LRU nos enseña que lo siguiente que podemos esperar es lo último que necesitemos.
necesario, mientras que lo que necesitaremos después de eso es probablemente el segundo más
reciente. Y lo último que podemos esperar es lo que tenemos
ya pasó más tiempo sin.
A menos que tengamos buenas razones para pensar lo contrario, parece que nuestro mejor
La guía hacia el futuro es una imagen especular del pasado. Lo más cercano a
La clarividencia es asumir que la historia se repite, al revés.
Dando la vuelta a la biblioteca
En lo profundo de las pilas subterráneas de Gardner en la Universidad de

California, Berkeley, detrás de una puerta cerrada y un destacado "Solo personal"
aviso, totalmente prohibido para los usuarios, es una de las joyas de la biblioteca de la UC
sistema. Cormac McCarthy, Thomas Pynchon, Elizabeth Bishop y JD
Salinger; Anaïs Nin, Susan Sontag, Junot Díaz y Michael Chabon; Annie
Proulx, Mark Strand y Philip K. Dick; William Carlos Williams, Chuck
Palahniuk y Toni Morrison; Denis Johnson, Juliana Spahr, Jorie Graham,
y David Sedaris; Sylvia Plath, David Mamet, David Foster Wallace y
Neil Gaiman… No es la colección de libros raros de la biblioteca; es su caché.
Como ya hemos comentado, las bibliotecas son un ejemplo natural de
jerarquía de memoria cuando se utiliza en conjunto con nuestro propio espacio de escritorio. De hecho,
Página 121
bibliotecas en sí mismas, con sus diversas secciones e instalaciones de almacenamiento, son

un gran ejemplo de una jerarquía de memoria con múltiples niveles. Como un
En consecuencia, se enfrentan a todo tipo de problemas de almacenamiento en caché. Ellos tienen que de
qué libros colocar en el espacio de exhibición limitado en la parte delantera de la biblioteca,
cuáles guardar en sus pilas y cuáles enviar al almacenamiento fuera del sitio. los
La política sobre qué libros enviar fuera del sitio varía de una biblioteca a otra, pero
casi todos usan una versión de LRU. "Para las pilas principales, por ejemplo", dice
Beth Dupuis, que supervisa el proceso en las bibliotecas de UC Berkeley, “si un
el artículo no se ha utilizado en doce años, ese es el límite ".
En el otro extremo del espectro de los libros intactos en una docena
años es el área de "clasificación aproximada" de la biblioteca, que visitamos en la anterior
capítulo. Aquí es donde van los libros justo después de que se devuelven, antes de que
completamente ordenados y almacenados una vez más en las pilas. La ironía es que el
ayudantes trabajadores que los vuelven a poner en sus estantes podrían, en algunos
sentido, haciéndolos menos ordenados.
He aquí por qué: si la localidad temporal se mantiene, entonces los estantes de clasificación aproxima
contienen los libros más importantes de todo el edificio. Estos son los
libros que se utilizaron más recientemente, por lo que son los que los usuarios
más probable que esté buscando. Parece un crimen que posiblemente sea el más jugoso y
el estante más digno de navegar de las millas de pilas de las bibliotecas está oculto
lejos y constantemente erosionada por el serio personal de la biblioteca que simplemente hace su trabajo
Mientras tanto, el vestíbulo de la biblioteca de pregrado de Moffit, el
ubicación de los estantes más destacados y accesibles: muestra la
los libros adquiridos más recientemente de la biblioteca. Esto es instanciar una especie de FIFO
caché, privilegiando los elementos que se agregaron por última vez a la biblioteca, no la última lectura.
El rendimiento dominante del algoritmo LRU en la mayoría de las pruebas que
los científicos de la computación han lanzado a esto conduce a una sugerencia simple: gire el
biblioteca de adentro hacia afuera . Poner adquisiciones en la parte de atrás, para aquellos que quieran en
ellos. Y coloque los artículos devueltos más recientemente en el vestíbulo, donde están
maduro para la navegación.
Los seres humanos son criaturas sociales, y presumiblemente el cuerpo de estudiantes
le resultaría interesante examinar sus propios hábitos de lectura. Empujaría
el campus hacia una versión más orgánica y libre de lo que las universidades
Página 122
luchar por cuando asignan "libros comunes": la facilitación de la

puntos de referencia comunes. Aquí, los libros que se leen en el campus,
lo que sea que fueran, se convertirían en los libros con más probabilidades de ser
encontrado por casualidad por otros estudiantes. Una especie de base
análogo ascendente del programa de libros comunes.
Pero un sistema como este no solo sería más positivo socialmente. Desde el
Los artículos devueltos más recientemente son los que tienen más probabilidades de ser revisados a cont
fuera, también sería más eficiente. Es cierto que los estudiantes pueden estar desconcertados
por el hecho de que a veces se encontrarán libros populares en las estanterías y
a veces en el vestíbulo. Sin embargo, los libros devueltos recientemente que esperan
faltan las estanterías en las pilas de cualquier manera. Es solo que actualmente
están fuera de los límites durante este breve limbo. Permitir que los libros devueltos
adornar el vestíbulo, en cambio, daría a los estudiantes la oportunidad de cortocircuitar el
proceso de estantería por completo. Ningún empleado tendría que aventurarse en el
pilas para depositar los volúmenes, y ningún estudiante tendría que aventurarse en
las pilas para sacarlas de nuevo. Así es exactamente como está destinado el almacenamiento en caché
trabaja.
La nube al final de la calle
“De hecho, hicimos un mapa del país, a una escala de una milla al
¡milla!"
"¿Lo has usado mucho?" Pregunté.
“Todavía no se ha extendido”, dijo Mein Herr: “los agricultores
objetó: dijeron que cubriría todo el país, y cerraría el
¡luz del sol! Así que ahora usamos el país en sí, como su propio mapa, y les aseguro
usted lo hace casi tan bien ".
-LEWIS CARROLL
A menudo pensamos en Internet como una plataforma plana, independiente y débilmente conectada.
la red. De hecho, no es ninguna de esas cosas. Una cuarta parte de todo el tráfico de Internet en
presente es manejado por una sola corporación, una que logra mantenerse casi
Página 123
completamente fuera de los titulares. Esta empresa con sede en Massachusetts se llama
Akamai, y están en el negocio del almacenamiento en caché.
También pensamos en Internet como abstracto, desmaterial, posgeográfico.
Nos dicen que nuestros datos están "en la nube", lo que sugiere una
lugar distante. Nuevamente, ninguno de estos es cierto. La realidad es que Internet está
todo sobre haces de cables físicos y estantes de metal. Y es mucho mas
estrechamente vinculado a la geografía de lo que cabría esperar.
Los ingenieros piensan en la geografía a pequeña escala cuando diseñan
hardware de la computadora: la memoria más rápida generalmente se coloca más cerca del procesador,
minimizando la longitud de los cables por los que tiene que viajar la información.
Los ciclos del procesador de hoy se miden en gigahercios, es decir, son
realizar operaciones en fracciones de nanosegundos. Como referencia, esa es la
el tiempo que tarda la luz en viajar unos centímetros , por lo que el diseño físico de un
Los componentes internos de la computadora son una gran preocupación. Y aplicando lo mismo
principio a una escala dramáticamente mayor, la geografía real resulta ser
crítico para el funcionamiento de la red, donde los cables no se extienden en pulgadas sino
potencialmente miles de millas.
Si puede crear una caché de contenido de la página web físicamente,
geográficamente más cerca de las personas que lo desean, puede publicar esas páginas
más rápido. Gran parte del tráfico en Internet ahora se gestiona mediante "contenido
redes de distribución ”(CDN), que tienen computadoras en todo el mundo
que mantienen copias de sitios web populares. Esto permite a los usuarios que soliciten
páginas para obtener sus datos de una computadora cercana, sin tener que
hacer el viaje largo a través de continentes hasta el servidor original.
Akamai gestiona el mayor de estos CDN: proveedores de contenido
pagar para que sus sitios web sean "Akamaized" para un mejor rendimiento. Un
Australiano que transmite videos de la BBC, por ejemplo, probablemente sea
llegar a los servidores locales de Akamai en Sydney; la solicitud nunca llega a
Londres en absoluto. No tiene por qué ser así. Dice el arquitecto jefe de Akamai, Stephen
Ludin, “Creemos, y construimos la empresa en torno al hecho, de que
la distancia importa ".
En nuestra discusión anterior, notamos que ciertos tipos de computadora
la memoria tiene un rendimiento más rápido pero cuesta más por unidad de almacenamiento, lo que
Página 124
a una "jerarquía de memoria" que intenta sacar lo mejor de ambos. Pero no lo es

realmente es necesario tener memoria hecha de diferentes materiales para almacenar en caché
tener sentido. El almacenamiento en caché es tan útil cuando se trata de proximidad, en lugar de
rendimiento, ese es el recurso escaso.
Esta información fundamental: que los archivos bajo demanda deben almacenarse cerca
la ubicación donde se utilizan, también se traduce en puramente físico
Ambientes. Por ejemplo, los enormes centros logísticos de Amazon
Por lo general, evite cualquier tipo de organización comprensible para los humanos, de la
tipo que encontrarías en una biblioteca o en una tienda departamental. En cambio, los empleados son
Se le dice que coloque los artículos entrantes donde puedan encontrar espacio en el almacén.
—Baterías codo con codo con sacapuntas, pañales, parrillas para barbacoa,
y DVD de aprendizaje del dobro, y etiquete la ubicación de cada elemento en un
base de datos mediante códigos de barras. Pero este almacenamiento de aspecto deliberadamente desorg
El sistema todavía tiene una excepción visible: los artículos de alta demanda se colocan en un
área diferente, más rápidamente accesible que el resto. Esa zona es de Amazon
cache.
Recientemente, Amazon obtuvo una patente por una innovación que impulsa
este principio un paso más allá. La patente habla de "paquete anticipatorio
envío ", que la prensa aprovechó como si Amazon pudiera de alguna manera
enviarle algo antes de comprarlo. Amazon, como cualquier tecnología
compañía, me encantaría tener ese tipo de clarividencia de Bélády, pero
para la siguiente mejor opción, se convierte en almacenamiento en caché. Su patente es en realidad para
enviar artículos que han sido populares recientemente en una región determinada a una etapa
almacén en esa región, como tener su propio CDN para bienes físicos.
Entonces, cuando alguien hace un pedido, el artículo está al final de la calle.
Anticipar las compras de los individuos es un desafío, pero cuando
prediciendo las compras de unos pocos miles de personas, la ley de los grandes números
entra en acción. Alguien en Berkeley va a pedir, digamos, papel higiénico reciclado
en un día determinado, y cuando lo hacen, ya es la mayor parte del camino.
Cuando las cosas populares en un área también son de esa área, aún más
emerge una interesante geografía de la nube. En 2011, el crítico de cine Micah
Mertes creó un mapa de los Estados Unidos utilizando el "Local
Favoritos ”de Netflix, destacando las películas poco populares en
Página 125
cada uno de esos estados. Resultó que, abrumadoramente, a la gente le encanta mirar
películas ambientadas donde viven. Los habitantes de Washington prefieren Singles , ambientada en Sea
Los habitantes de Louisiana ven The Big Easy , ambientado en Nueva Orleans; Angelinos
como era de esperar, disfrutar de LA Story ; Los habitantes de Alaska aman Braving Alaska ; y
Montañeses, Montana Sky . * Y porque nada beneficia tanto
del almacenamiento en caché local como los enormes archivos que componen HD de larga duración
video, es seguro que Netflix lo ha organizado para que los archivos de, digamos, LA Story
vive en Los Ángeles, al igual que sus personajes y, lo que es más importante, su
aficionados.
Almacenamiento en caché en el frente interno
Si bien el almacenamiento en caché comenzó como un esquema para organizar la información digital de
computadoras, está claro que es igualmente aplicable a la organización física
objetos en entornos humanos. Cuando hablamos con John Hennessy:
presidente de la Universidad de Stanford, y un arquitecto informático pionero que
ayudó a desarrollar sistemas de almacenamiento en caché modernos; inmediatamente vio el vínculo:
El almacenamiento en caché es algo tan obvio porque lo hacemos todo el tiempo. Quiero decir, la cantidad de
información que obtengo ... ciertas cosas de las que tengo que hacer un seguimiento en este momento, un montón de cosas que tengo
en mi escritorio, y luego otras cosas se archivan, y finalmente se archivan en el
sistema de archivos de la universidad donde se necesita un día entero para sacar cosas de él si quiero. Pero nosotros
utilizamos esa técnica todo el tiempo para tratar de organizar nuestras vidas.
El paralelo directo entre estos problemas significa que existe el potencial

aplicar conscientemente las soluciones de la informática al hogar.
Primero, cuando está decidiendo qué conservar y qué desechar, LRU
es potencialmente un buen principio para usar, mucho mejor que FIFO. usted
no necesariamente debería tirar esa camiseta de la universidad si todavía la usas cada
de vez en cuando. ¿Pero los pantalones a cuadros que no has usado en mucho tiempo? Esos pueden ser
la bonanza de la tienda de segunda mano de otra persona.
En segundo lugar, explote la geografía. Asegúrese de que las cosas estén en cualquier caché
más cercano al lugar donde se utilizan normalmente. Esto no es un concreto
recomendación en la mayoría de los libros de organización del hogar, pero siempre cambia
Página 126
en los esquemas que las personas reales describen como que funcionan bien para ellos. "I
seguir corriendo y hacer ejercicio en una caja en el piso de mi chaqueta
armario ", dice una persona citada en Organizing from the
Inside Out , por ejemplo. "Me gusta tenerlo cerca de la puerta de entrada".
Un ejemplo un poco más extremo aparece en el libro Keeping Found
Cosas encontradas , de William Jones:
Un médico me habló de su enfoque para guardar las cosas. "Mis hijos piensan que soy un chiflado, pero yo pongo
cosas en las que creo que las necesitaré de nuevo más tarde, incluso si no tiene mucho sentido ". Como un
ejemplo de su sistema, me dijo que guarda bolsas de aspiradora adicionales detrás del sofá
en la sala de estar. ¿Detrás del sofá de la sala de estar? ¿Eso tiene algún sentido? ... Se vuelve
Destaca que cuando se usa la aspiradora, generalmente se usa para la alfombra en la sala de estar.…
Cuando la bolsa de una aspiradora se llena y se necesita una nueva, generalmente está en la sala de estar.
Y ahí es donde están las bolsas de la aspiradora.
Una última visión, que aún no se ha convertido en guías sobre el armario.

organización, es la de la jerarquía de memoria multinivel. Tener un caché es
eficiente, pero con múltiples niveles de cachés, desde el más pequeño y más rápido hasta
más grande y más lento, puede ser incluso mejor. Donde estan tus pertenencias
preocupado, su armario es un nivel de caché, su sótano otro, y un
Casillero de self-storage un tercero. (Estos están en orden decreciente de velocidad de acceso,
por supuesto, por lo que debe utilizar el principio LRU como base para decidir
lo que se desaloja de cada nivel al siguiente).
acelerar las cosas agregando otro nivel de almacenamiento en caché: un
más rápido, más cerca que tu armario.
La esposa de Tom, por lo demás extremadamente tolerante, se opone a un montón de ropa a continua
a la cama, a pesar de su insistencia en que, de hecho, es un almacenamiento en caché muy eficiente
esquema. Afortunadamente, nuestras conversaciones con científicos informáticos revelaron una
solución a este problema también. Rik Belew de UC San Diego, quien estudia
motores de búsqueda desde una perspectiva cognitiva, recomendó el uso de un
puesto de valet. Aunque no ves muchos de ellos en estos días, un ayuda de cámara
soporte es esencialmente un armario de un solo traje, una percha compuesta para chaqueta, corbata,
y pantalones, la pieza de hardware perfecta para sus necesidades de almacenamiento en caché doméstic
Página 127
Lo que demuestra que los informáticos no solo le permitirán ahorrar tiempo;

también podrían salvar su matrimonio.
Archivar y apilar
Después de decidir qué guardar y dónde ir, el desafío final es

saber organizarlo. Hemos hablado de lo que va en el armario y
dónde debería estar el armario, pero ¿cómo deberían arreglarse las cosas por dentro?
Una de las constantes en todos los consejos de organización del hogar.
que hemos visto hasta ahora es la idea de agrupar "me gusta con me gusta", y tal vez no
uno contradice ese consejo tan directamente como Yukio Noguchi. "Tengo que
enfatizar ", dice Noguchi," que un principio muy fundamental en mi
El método es no agrupar archivos según el contenido ". Noguchi es economista
en la Universidad de Tokio, y autor de una serie de libros que ofrecen
“Súper” trucos para ordenar tu oficina y tu vida. Sus títulos se traducen
aproximadamente al método de súper persuasión , método de súper trabajo , súper estudio
Método y, lo que es más relevante para nosotros, Método Super Organizado .
Al principio de su carrera como economista, Noguchi se encontró constantemente
inundado de información (correspondencia, datos, manuscritos) y
perdiendo una parte significativa de cada día simplemente tratando de organizarlo todo. Entonces el
buscó una alternativa. Comenzó simplemente poniendo cada documento en un
archivo etiquetado con el título y la fecha del documento, y poner todos los archivos en
una caja grande. Eso le ahorró tiempo, no tuvo que pensar en el lugar correcto
poner cada documento, pero no resultó en ninguna forma de organización.
Luego, en algún momento a principios de la década de 1990, tuvo un gran avance: comenzó a
inserte los archivos exclusivamente en el lado izquierdo de la caja. Y así el
Nació el "super" sistema de archivo.
La regla de inserción del lado izquierdo, especifica Noguchi, debe seguirse para los
archivos y archivos nuevos: cada vez que extrae un archivo para usar su contenido,
debe volver a colocarlo como el archivo más a la izquierda cuando lo devuelva a la caja. Y
cuando busca un archivo, siempre comienza también desde el lado izquierdo.
Por tanto, los archivos a los que se ha accedido más recientemente son los más rápidos de encontrar.
Página 128
Esta práctica comenzó, explica Noguchi, porque devolver cada archivo a

el lado izquierdo fue más fácil que intentar reinsertarlo en el mismo lugar donde vino
de. Solo gradualmente se dio cuenta de que este procedimiento no solo era simple
pero también sorprendentemente eficiente.
El sistema de archivo Noguchi claramente ahorra tiempo cuando está reemplazando
algo después de que hayas terminado de usarlo. Sin embargo, todavía queda la cuestión de
si es una buena forma de encontrar los archivos que necesita en primer lugar. Después
todo, ciertamente va en contra de las recomendaciones de otros gurús de la eficiencia,
que nos dicen que debemos juntar cosas similares. De hecho, incluso el
etimología de la palabra "organizado" evoca un cuerpo compuesto de órganos -
que no son más que células agrupadas "como con igual", agrupadas
por forma y función similares.
Pero la informática nos da algo que la mayoría de los gurús de la eficiencia
no: garantías.
Aunque Noguchi no lo sabía en ese momento, su sistema de archivo representa
una extensión del principio LRU. LRU nos dice que cuando agregamos
algo en nuestro caché, deberíamos descartar el elemento más antiguo, pero no
díganos dónde debemos poner el nuevo artículo. La respuesta a esa pregunta
proviene de una línea de investigación llevada a cabo por informáticos en el
1970 y 1980. Su versión del problema se llama "autoorganización
listas ”, y su configuración imita casi exactamente el dilema de presentación de archivos de Noguchi.
Imagine que tiene un conjunto de elementos en una secuencia y debe
busque periódicamente a través de ellos para encontrar elementos específicos. La búsqueda en sí es
restringido a ser lineal: debe examinar los elementos uno por uno,
comenzando por el principio, pero una vez que encuentre el elemento que busca,
puede volver a colocarlo en cualquier lugar de la secuencia. Donde deberías reemplazar
los elementos para que la búsqueda sea lo más eficiente posible?
El artículo definitivo sobre listas autoorganizadas, publicado por Daniel Sleator
y Robert Tarjan en 1985, examinado (al estilo clásico de la informática)
el desempeño en el peor de los casos de varias formas de organizar la lista dados todos
posibles secuencias de solicitudes. Intuitivamente, dado que la búsqueda comienza en el
frontal, desea organizar la secuencia de modo que los elementos con mayor probabilidad
buscado aparecen allí. Pero, ¿qué artículos serán esos? Estamos de vuelta a
Página 129
deseando volver a la clarividencia. "Si conoce la secuencia de antemano",

dice Tarjan, que divide su tiempo entre Princeton y Silicon Valley, "usted
puede personalizar la estructura de datos para minimizar el tiempo total para todo el
secuencia. Ese es el algoritmo fuera de línea óptimo: el algoritmo de Dios si
will, o el algoritmo en el cielo. Por supuesto, nadie conoce el futuro, por lo que el
La pregunta es, si no conoces el futuro, ¿qué tan cerca puedes llegar a este
algoritmo óptimo en el cielo? " Los resultados de Sleator y Tarjan mostraron que
algunos "esquemas de autoajuste muy simples, sorprendentemente, vienen dentro de un
factor constante ”de la clarividencia. Es decir, si sigue el principio LRU
—Donde simplemente siempre vuelves a colocar un elemento al principio de la lista—
entonces la cantidad total de tiempo que pasa buscando nunca será mayor que
el doble de tiempo que si hubiera conocido el futuro. Eso no es garantía de ninguna otra
algoritmo puede hacer.
Reconociendo el Sistema de Archivo de Noguchi como una instancia de la LRU
principio en acción nos dice que no es meramente eficiente. En realidad es
óptimo.
Los resultados de Sleator y Tarjan también nos proporcionan un giro más, y
lo conseguimos poniendo el sistema de archivo Noguchi de lado. Simplemente, un
caja de archivos de un lado se convierte en una pila. Y es la naturaleza misma de las pilas lo que
los busca de arriba a abajo, y que cada vez que saca un
documentarlo no se remonta a donde lo encontró, sino a la parte superior.*
En resumen, las matemáticas de las listas autoorganizadas sugieren algo
radical: la gran pila de papeles en su escritorio, lejos de ser un sentimiento de culpa
fester of caos, es en realidad uno de los más bien diseñados y eficientes
estructuras disponibles. Lo que a los demás les puede parecer un lío desorganizado
es, de hecho, un lío autoorganizado. Tirando cosas de vuelta a la parte superior de la pila
es lo mejor que puede hacer, tímido de conocer el futuro. En el anterior
En el capítulo examinamos casos en los que dejar algo sin clasificar era más
eficiente que tomarse el tiempo para ordenar todo; aquí, sin embargo, hay un
una razón muy diferente por la que no es necesario organizarlo.
Tu ya lo tienes.
Página 130
La curva del olvido
Por supuesto, ninguna discusión sobre la memoria podría estar completa sin mencionar
el "órgano de la memoria" más cercano a casa: el cerebro humano. En los últimos pocos
décadas, la influencia de la informática ha provocado algo de
una revolución en la forma en que los psicólogos piensan sobre la memoria.
Se dice que la ciencia de la memoria humana comenzó en 1879, con una
joven psicólogo de la Universidad de Berlín llamado Hermann
Ebbinghaus. Ebbinghaus quería llegar al fondo de lo humano
memoria funcionaba, y para demostrar que era posible estudiar la mente con todos los
el rigor matemático de las ciencias físicas. Entonces comenzó a experimentar
sobre sí mismo.
Cada día, Ebbinghaus se sentaba y memorizaba una lista de tonterías
sílabas. Luego se pondría a prueba en listas de días anteriores. Perseguir
este hábito en el transcurso de un año, estableció muchos de los más básicos
resultados en la investigación de la memoria humana. Confirmó, por ejemplo, que
practicar una lista varias veces hace que persista más tiempo en la memoria, y eso
el número de elementos que uno puede recordar con precisión disminuye a medida que pasa el tiempo.
Sus resultados trazaron un gráfico de cómo la memoria se desvanece con el tiempo, conocido
hoy por los psicólogos como "la curva del olvido".
Los resultados de Ebbinghaus establecieron la credibilidad de una ciencia cuantitativa
de la memoria humana, pero dejaron abierto un misterio. Por qué esto
curva particular? ¿Sugiere que la memoria humana es buena o mala?
¿Cuál es la historia subyacente aquí? Estas preguntas han estimulado
la especulación e investigación de los psicólogos durante más de cien años.
En 1987, el psicólogo e informático de Carnegie Mellon John
Anderson se encontró leyendo sobre los sistemas de recuperación de información de
bibliotecas universitarias. El objetivo de Anderson, o eso creía él, era escribir sobre
cómo el diseño de esos sistemas podría ser informado por el estudio de la
memoria. En cambio, sucedió lo contrario: se dio cuenta de que la información
la ciencia podría proporcionar la pieza que faltaba en el estudio de la mente.
"Durante mucho tiempo", dice Anderson, "había sentido que había algo
falta en las teorías existentes de la memoria humana, incluida la mía.
Página 131
Básicamente, todas estas teorías caracterizan la memoria como algo arbitrario y no
configuración óptima ... Durante mucho tiempo había sentido que los procesos básicos de la memoria
fueron bastante adaptables y quizás incluso óptimas; sin embargo, nunca había estado
capaz de ver un marco en el que hacer este punto. En la computadora
trabajo científico sobre la recuperación de información, vi ese marco establecido antes
me."
Una forma natural de pensar en el olvido es que nuestras mentes simplemente se agotan.
del espacio. La idea clave detrás del nuevo relato de la memoria humana de Anderson
es que el problema puede que no sea de almacenamiento , sino de organización .
Según su teoría, la mente tiene una capacidad esencialmente infinita para
recuerdos, pero tenemos sólo una cantidad finita de tiempo para buscar
ellos. Anderson hizo la analogía con una biblioteca con una única, arbitrariamente larga
estante: el sistema de archivos Noguchi a escala de la Biblioteca del Congreso. Puedes encajar
tantos artículos como desee en ese estante, pero cuanto más cerca esté algo de la
frente más rápido será encontrar.
La clave para una buena memoria humana se convierte entonces en la misma que la clave para
una buena caché de computadora: predecir qué elementos es más probable que se busquen
en el futuro.
Salvo la clarividencia, el mejor enfoque para hacer tales predicciones en
el mundo humano requiere comprender el mundo mismo. Con su
colaborador Lael Schooler, Anderson se propuso interpretar al estilo de Ebbinghaus
estudios no sobre la mente humana, sino sobre la sociedad humana. La pregunta era
sencillo: qué patrones caracterizan la forma en que el mundo mismo
“Olvida”: ¿la forma en que los eventos y las referencias se desvanecen con el tiempo? Anderson
y Schooler analizó tres entornos humanos: titulares de la Nueva
York Times , grabaciones de padres hablando con sus hijos y Anderson
propia bandeja de entrada de correo electrónico. En todos los dominios, encontraron que es más probabl
aparecer de nuevo justo después de que acaba de ser utilizado, y que la probabilidad de
verlo de nuevo se cae a medida que pasa el tiempo.
En otras palabras, la realidad misma tiene una estructura estadística que imita la
Curva de Ebbinghaus.
Esto sugiere algo notable. Si el patrón por el cual las cosas se desvanecen
de nuestras mentes es el patrón por el cual las cosas se desvanecen a nuestro alrededor,
Página 132
entonces puede haber una muy buena explicación para la Ebbinghaus

curva de olvido, es decir, que es una perfecta sintonía del cerebro con el mundo,
poniendo a disposición precisamente las cosas que es más probable que se necesiten.
Memoria humana y entornos humanos. El panel de la izquierda muestra el porcentaje de sílabas sin sentido
Ebbinghaus recordó correctamente de una lista, en función del número de horas que esperó después de la primera
memorizando la lista. El panel de la derecha muestra la posibilidad de que aparezca una palabra en los titulares del
New York Times en un día determinado, en función del tiempo transcurrido desde su anterior aparición impresa.
Al poner el énfasis en el tiempo, el almacenamiento en caché nos muestra que la memoria implica
compensaciones inevitables y una cierta suma cero. No puedes tener cada
libro de la biblioteca en su escritorio, cada producto en exhibición en el frente de la tienda,
cada título por encima del doblez, cada papel en la parte superior de la pila. Y en el
De la misma manera, no puede tener todos los hechos, caras o nombres al frente de su
mente.
“Mucha gente tiene el sesgo de que la memoria humana es todo menos
óptimo ”, escribieron Anderson y Schooler. “Señalan las muchas
frustrantes fallos de memoria. Sin embargo, estas críticas no logran apreciar
la tarea ante la memoria humana, que es tratar de gestionar una enorme reserva
de recuerdos. En cualquier sistema responsable de gestionar una vasta base de datos existe
debe haber fallas de recuperación. Es demasiado caro mantener el acceso a un
número ilimitado de elementos ".
Este entendimiento, a su vez, ha llevado a una segunda revelación sobre los seres humanos.
memoria. Si estas compensaciones son realmente inevitables y el cerebro parece
Página 133
estar óptimamente sintonizado con el mundo que lo rodea, entonces lo que llamamos el
El inevitable "deterioro cognitivo" que viene con la edad puede de hecho ser algo
demás.
La tiranía de la experiencia
Un libro grande es una gran molestia.

—CALLIMACHUS (305–410 aC), BIBLIOTECARIO DE ALEJANDRÍA
¿Por qué no hacen todo el avión con esas cosas de caja negra?
—STEVEN WRIGHT
La necesidad de una jerarquía de memoria informática, en forma de cascada de

cachés, es en gran parte el resultado de nuestra incapacidad para permitirnos hacer todo el
memoria del tipo de hardware más caro. El caché más rápido en
Las computadoras actuales, por ejemplo, están hechas con lo que se llama SRAM, que
cuesta aproximadamente mil veces más por byte que la memoria flash en
discos de estado sólido. Pero la verdadera motivación para el almacenamiento en caché va más allá de es
De hecho, incluso si pudiéramos conseguir una máquina a medida que utilizara exclusivamente el
forma de memoria más rápida posible, todavía necesitaríamos cachés.
Como explica John Hennessy, el tamaño por sí solo es suficiente para reducir la velocidad:
Cuando haces algo más grande, es inherentemente más lento, ¿verdad? Si haces una ciudad más grande,
tarda más en llegar del punto A al punto B. Si agranda una biblioteca, tardará más en encontrar
un libro en la biblioteca. Si tiene una pila de papeles más grande en su escritorio, tardará más en
encuentra el papel que estás buscando, ¿verdad? Los cachés son en realidad una solución a ese problema.… Para
Por ejemplo, ahora mismo, si va a comprar un procesador, lo que obtendrá es un caché de nivel 1 y un nivel
2 caché en el chip. La razón por la que hay (¡incluso en el chip hay dos cachés!) Es
que para mantenerse al día con la tasa de ciclo del procesador, la caché de primer nivel está limitada en
Talla.
Inevitablemente, cuanto más grande es una memoria, más tiempo lleva buscar
y extraer un poco de información de él.
Página 134
Brian y Tom, en la treintena, ya se encuentran con más frecuencia

estancando una conversación como, por ejemplo, esperan el nombre de alguien
"En la punta de la lengua" para venir a la mente. Por otra parte, Brian a los diez años había
dos docenas de compañeros de escuela; veinte años después tiene cientos de contactos en
su teléfono y miles en Facebook, y ha vivido en cuatro ciudades, cada una
con su propia comunidad de amigos, conocidos y colegas. Tom, por
En este punto de su carrera académica, ha trabajado con cientos de colaboradores.
y enseñó a miles de estudiantes. (De hecho, este mismo libro implicaba conocer
con unas cien personas y citando a mil.) Tales efectos no son de ninguna manera
medios limitados a las conexiones sociales, por supuesto: un típico niño de dos años
sabe doscientas palabras; un adulto típico conoce treinta mil. Y
cuando se trata de memoria episódica, bueno, cada año agrega un tercio de un
millones de minutos de vigilia a la experiencia total vivida.
Considerado de esta manera, es una maravilla que nosotros dos, o cualquiera, podamos
mantenerse mentalmente al día en absoluto. Lo sorprendente no es la ralentización de la memoria, sino
el hecho de que la mente pueda posiblemente mantenerse a flote y responder tanto
los datos se acumulan.
Si el desafío fundamental de la memoria es realmente de organización
en lugar del almacenamiento, tal vez debería cambiar nuestra forma de pensar sobre el impacto
del envejecimiento en nuestras capacidades mentales. Trabajo reciente de un equipo de psicólogos
y lingüistas dirigidos por Michael Ramscar en la Universidad de Tübingen ha
sugirió que lo que llamamos "deterioro cognitivo" —retrasos y errores de recuperación—
Puede que no se trate de que el proceso de búsqueda se ralentice o se deteriore, pero (al menos
en parte) una consecuencia inevitable de la cantidad de información que tenemos
para navegar cada vez más grande. Independientemente de cualquier otro
desafíos que trae el envejecimiento, cerebros más viejos, que deben administrar una mayor reserva
de memorias, literalmente están resolviendo problemas computacionales más difíciles con
cada día todavía
¡porque que pasa.
noLos viejos
sabes pueden
nada! " burlarse de los jóvenes por su velocidad: "Es
El grupo de Ramscar demostró el impacto de la información adicional en
memoria humana centrándose en el caso del lenguaje. A través de una serie de
simulaciones, los investigadores demostraron que el simple hecho de saber más hace
las cosas son más difíciles cuando se trata de reconocer palabras, nombres e incluso letras.
Página 135
No importa qué tan bueno sea el esquema de su organización, tener que buscar
más cosas inevitablemente tomarán más tiempo. No es que nos estemos olvidando; es
que estamos recordando. Nos estamos convirtiendo en archivos.
Una comprensión de las inevitables demandas computacionales de
La memoria, dice Ramscar, debería ayudar a las personas a aceptar los efectos
del envejecimiento en la cognición. "Creo que lo más importante y tangible que las personas mayores pue
hacer es tratar de entender la idea de que sus mentes son naturales
dispositivos de procesamiento de información ”, escribe. "Algunas cosas que pueden parecer
frustrantes a medida que envejecemos (¡como recordar nombres!) son una función de
la cantidad de cosas que tenemos que examinar ... y no son necesariamente una señal
de una mente defectuosa ". Como él mismo dice, "Mucho de lo que actualmente se llama declive es
simplemente aprendiendo ".
El almacenamiento en caché nos da el lenguaje para comprender lo que está sucediendo. Decimos
"Pedo cerebral" cuando en realidad deberíamos decir "error de caché". El desproporcionado
los retrasos ocasionales en la recuperación de información son un recordatorio de cuánto
beneficiar el resto del tiempo al tener lo que necesitamos al frente de nuestra
mentes.
Entonces, a medida que envejece y comienza a experimentar estas latencias esporádicas, tome
corazón: la duración de un retraso es en parte un indicador de la extensión de su
experiencia. El esfuerzo de recuperación es un testimonio de cuánto sabe.
Y la rareza de esos retrasos es un testimonio de lo bien que lo ha organizado:
manteniendo las cosas más importantes al alcance de la mano.
Página 136
*Por razones desconocidas, My Own Private Idaho es más querido en Maine.
Página 137
*También puede obligar a su computadora a que muestre sus documentos electrónicos en una pila. Ordenadores'
La interfaz de exploración de archivos predeterminada le permite hacer clic en las carpetas en orden alfabético, pero el poder
de LRU sugiere que debe anular esto y mostrar sus archivos por "Último abierto" en lugar de
"Nombre." Lo que está buscando casi siempre estará en la cima o cerca de ella.
Página 138
5 Programación
Lo primero es lo primero
Cómo pasamos nuestros días es, por supuesto, cómo pasamos nuestras vidas.
—ANNIE DILLARD
"¿Por qué no escribimos un libro sobre teoría de la programación?" Pregunté ...

¡no debería tomar mucho tiempo! " La escritura de libros, como la guerra, a menudo
implica graves errores de cálculo. Quince años después, la programación sigue
inconcluso.
—EUGENE ABOGADO
Es lunes por la mañana y aún tiene un horario en blanco y una lista larga
de tareas para completar. Algunos pueden iniciarse solo después de que otros hayan terminado (usted
no se puede cargar el lavavajillas a menos que se descargue primero), y algunos pueden
comenzó solo después de cierto tiempo (los vecinos se quejarán si pones el
basura en la acera antes del martes por la noche). Algunos tienen plazos estrictos
otras se pueden hacer en cualquier momento, y muchas se encuentran entre medias. Algunos son
urgente, pero no importante. Algunos son importantes, pero no urgentes. "Somos lo que
repetidamente lo hacemos ", parece recordar que Aristóteles dijo, ya sea fregona
piso, pasar más tiempo con la familia, presentar impuestos a tiempo, aprender francés.
Entonces, ¿qué hacer, cuándo y en qué orden? Tu vida te espera.
Aunque siempre logramos encontrar alguna forma de ordenar las cosas que hacemos
en nuestros días, por regla general, no nos consideramos particularmente buenos en eso:
Página 139
de ahí el eterno éxito de ventas de las guías de gestión del tiempo.

Desafortunadamente, la orientación que encontramos en ellos es frecuentemente divergente y
inconsistente. Getting Things Done aboga por una política de hacer inmediatamente
cualquier tarea de dos minutos o menos tan pronto como se le ocurra. Bestseller rival
¡Come esa rana! aconseja comenzar con la tarea más difícil y avanzar
hacia cosas cada vez más fáciles. The Now Habit sugiere una primera programación
compromisos sociales y el tiempo libre y luego llenar los vacíos con
trabajar, en lugar de al revés, como solemos hacer. William James,
el "padre de la psicología estadounidense", afirma que "no hay nada tan
fatigante como el eterno aferrarse a una tarea incompleta ", pero Frank
Partnoy, en Wait , aboga por no hacer las cosas bien deliberadamente
lejos.
Cada gurú tiene un sistema diferente y es difícil saber a quién escuchar.
Pasar tiempo se convierte en ciencia
Aunque la administración del tiempo parece un problema tan antiguo como el tiempo mismo, la ciencia
La programación comenzó en los talleres mecánicos de la revolución industrial. En
1874, Frederick Taylor, hijo de un abogado adinerado, rechazó su
aceptación en Harvard para convertirse en aprendiz de maquinista en Enterprise
Obras hidráulicas en Filadelfia. Cuatro años después, completó su
aprendiz y comenz a trabajar en Midvale Steel Works, donde
ascendió en los rangos de operador de torno a capataz de taller de máquinas y
en última instancia, al ingeniero jefe. En el proceso, llegó a creer que el momento
de las máquinas (y personas) que supervisó no se estaba utilizando muy bien,
lo que lo llevó a desarrollar una disciplina que llamó "Gestión científica".
Taylor creó una oficina de planificación, en cuyo centro había un boletín
tablero que muestra el horario de la tienda para que todos lo vean. El tablero representado
cada máquina en el taller, mostrando la tarea que está llevando a cabo actualmente
esa máquina y todas las tareas que la esperan. Esta práctica se construiría
Henry Gantt, colega de Taylor, quien en la década de 1910 desarrolló el
Diagramas de Gantt que ayudarían a organizar muchos de los
ambiciosos proyectos de construcción, desde la presa Hoover hasta la interestatal
Página 140
Sistema de carreteras. Un siglo después, los diagramas de Gantt todavía adornan las paredes y
pantallas de directores de proyectos en empresas como Amazon, IKEA y SpaceX.
Taylor y Gantt hicieron de la programación un objeto de estudio y le dieron
forma visual y conceptual. Pero no resolvieron el problema fundamental
de determinar qué horarios eran los mejores. El primer indicio de que este problema
incluso podría resolverse no aparecería hasta varias décadas después, en 1954
artículo publicado por el matemático Selmer Johnson de RAND Corporation.
El escenario que examinó Johnson fue la encuadernación, donde cada libro
debe imprimirse en una máquina y luego encuadernarse en otra. Pero el
La instancia más común de esta configuración de dos máquinas está mucho más cerca de casa:
la lavandería. Cuando lavas tu ropa, tienen que pasar por el
lavadora y secadora en secuencia, y diferentes cargas necesitarán diferentes
cantidades de tiempo en cada uno. Una carga muy sucia puede tardar más en lavarse
pero el tiempo habitual para secar; una carga grande puede tardar más en secarse, pero lo habitual
hora de lavarse. Johnson preguntó, si tiene varias cargas de ropa que lavar
el mismo día, ¿cuál es la mejor manera de hacerlo?
Su respuesta fue que debes comenzar por encontrar el único paso que
toma la menor cantidad de tiempo: la carga que se lavará o secará más rápido.
Si ese paso más corto involucra a la lavadora, planee hacer esa carga primero . Si se
involucra la secadora, planee hacerlo al final . Repita este proceso para el resto
cargas, trabajando desde los dos extremos del programa hacia el medio.
Intuitivamente, el algoritmo de Johnson funciona porque independientemente de cómo
secuenciar las cargas, habrá algún tiempo al principio cuando el
La lavadora está funcionando pero no la secadora, y algún tiempo al final cuando la
la secadora está funcionando pero no la lavadora. Al tener los tiempos de lavado más cortos en
el inicio y los tiempos de secado más cortos al final, maximizas la cantidad
de superposición: cuando la lavadora y la secadora funcionan simultáneamente. Por lo tanto
puede mantener la cantidad total de tiempo dedicado a lavar la ropa al máximo
mínimo. El análisis de Johnson había producido el primer óptimo de programación
algoritmo: comience con el lavado más ligero, termine con la cesta más pequeña.
Más allá de sus aplicaciones inmediatas, el artículo de Johnson reveló dos
puntos: primero, que la programación podría expresarse algorítmicamente, y
en segundo lugar, que existían soluciones de programación óptimas. Esto dio inicio a lo que ha
Página 141
convertirse en una extensa literatura, explorando estrategias para una vasta colección de
fábricas hipotéticas con todos los números y tipos imaginables de
máquinas.
Nos centraremos en un pequeño subconjunto de esta literatura: la parte que,
a diferencia de la encuadernación o la lavandería, se ocupa de la programación de una sola máquina.
Porque el problema de programación que más importa involucra solo una
máquina: nosotros mismos.
Manejo de plazos
Con la programación de una sola máquina, nos encontramos con algo así como un problema
De buenas a primeras. El trabajo de Johnson sobre encuadernación se basó en minimizar la
tiempo total requerido para que las dos máquinas completen todos sus trabajos. En el
caso de programación de una sola máquina, sin embargo, si vamos a hacer todas las
tareas asignadas, todos los horarios tardarán el mismo tiempo en completarse; los
el orden es irrelevante.
Este es un punto suficientemente fundamental y contrario a la intuición que es
Vale la pena repetirlo. Si solo tiene una máquina, y va a hacer
todas sus tareas, entonces cualquier orden de las tareas le llevará lo mismo
cantidad de tiempo.
Así, nos encontramos con la primera lección sobre la programación de una sola máquina, literalmente
incluso antes de empezar: haz explícitos tus objetivos . No podemos declarar algunos
programe un ganador hasta que sepamos cómo llevamos la puntuación. Este es
algo así como un tema en ciencias de la computación: antes de que puedas tener un plan,
primero debe elegir una métrica. Y resulta que, ¿qué métrica elegimos aquí?
afectará directamente qué enfoques de programación obtienen mejores resultados.
Los primeros documentos sobre la programación de una sola máquina siguieron rápidamente en el
tacones del trabajo de encuadernación de Johnson y ofreció varias métricas plausibles
considerar. Para cada métrica, descubrieron una estrategia sencilla y óptima.
Por supuesto, es común, por ejemplo, que las tareas tengan una fecha de vencimiento, con
la tardanza de una tarea es cuánto se ha retrasado. Entonces podemos pensar en
el "retraso máximo" de un conjunto de tareas como el retraso de cualquier tarea
ha superado su fecha de vencimiento, el tipo de cosas que su empleador
Página 142
preocuparse en una revisión de desempeño. (O lo que les podría importar a tus clientes
en un entorno minorista o de servicios, donde la tarea "más tarde"
corresponde al cliente sometido al mayor tiempo de espera.)
Si le preocupa minimizar la tardanza máxima, entonces lo mejor
La estrategia es comenzar con la tarea que se debe realizar lo antes posible y avanzar hacia la
tarea que vence en último lugar. Esta estrategia, conocida como Fecha de vencimiento más temprana ,
(Por ejemplo, en un contexto de sector de servicios, donde cada cliente que llega "debido
cita "es efectivamente el instante en que entran por la puerta, solo significa servir
clientes en orden de llegada.) Pero algunas de sus implicaciones son sorprendentes.
Por ejemplo, el tiempo que tardará en completarse cada tarea es completamente irrelevante:
no cambia el plan, por lo que, de hecho, ni siquiera necesita saberlo. Todo lo que
lo que importa es cuándo vencen las tareas.
Es posible que ya esté utilizando la fecha de vencimiento más temprana para abordar su carga de trab
en cuyo caso probablemente no necesite la informática para decirle que es
una estrategia sensata. Sin embargo, lo que puede que no hayas sabido es que es el
estrategia óptima . Más precisamente, es óptimo asumir que solo estás
interesado en una métrica en particular: reducir su retraso máximo. Si
sin embargo, ese no es su objetivo, entonces otra estrategia podría ser más
aplicable.
Por ejemplo, considere el refrigerador. Si eres una de las muchas personas
que tienen una suscripción de agricultura apoyada por la comunidad (CSA),
cada semana o dos tienes una gran cantidad de productos frescos que llegan a tu
puerta todo a la vez. Cada producto está listo para estropearse en una fecha diferente.
—Por lo tanto, comerlos antes de la fecha de vencimiento más temprana, en orden de su programa de det
parece un punto de partida razonable. Sin embargo, no es el final del
historia. La fecha de vencimiento más temprana es óptima para reducir el retraso máximo, que
medios que minimizarán la podredumbre de la única cosa más podrida podrás
tener que comer; puede que esa no sea la métrica más apetitosa para comer.
Quizás, en cambio, queremos minimizar la cantidad de alimentos que se echan a perder.
Aquí una estrategia llamada algoritmo de Moore nos da nuestro mejor plan. De Moore
El algoritmo dice que comenzamos como con la Fecha de vencimiento más temprana: por
programar nuestros productos en orden de fecha de deterioro, el más temprano primero, un artículo
a la vez. Sin embargo, tan pronto como parezca que no podremos comer el próximo
Página 143
elemento a tiempo, hacemos una pausa, revisamos las comidas que ya hemos planeado,
y deseche el artículo más grande (es decir, el que más
días para consumir). Por ejemplo, eso podría significar renunciar a la sandía.
eso tomaría media docena de porciones para comer; ni siquiera intentarlo lo hará
significa llegar a todo lo que sigue mucho antes. Luego repetimos esto
patrón, colocando los alimentos por fecha de deterioro y tirando el más grande ya
artículo programado en cualquier momento que nos atrasemos. Una vez que todo lo que queda puede
ser comido en orden de fecha de deterioro sin que nada se eche a perder, tenemos nuestro
plan.
El algoritmo de Moore minimiza la cantidad de elementos que necesitará lanzar
lejos. Por supuesto, también puede convertir la comida en abono, donarla al
banco de alimentos local, o dáselo a tu vecino. En un industrial o burocrático
contexto en el que no se puede simplemente descartar un proyecto, sino en el que el número
—Más que la gravedad— de los proyectos tardíos sigue siendo su mayor preocupación,
El algoritmo de Moore es igualmente indiferente acerca de cómo esas tareas tardías son
manejado. Cualquier cosa que se inicie desde la parte principal de su horario puede obtener
hecho al final, en cualquier orden; no importa, como ya están todos
tarde.
Resolviendo las cosas
Haga las cosas difíciles mientras sean fáciles y haga las grandes
mientras son pequeños.
—LAO TZU
A veces, las fechas de vencimiento no son nuestra principal preocupación y solo queremos obtener
cosas hechas: tantas cosas, lo más rápido posible. Resulta que traduciendo
este deseo aparentemente simple en una métrica de programación explícita es más difícil
de lo que parece.
Un enfoque es adoptar la perspectiva de un extraño. Hemos notado que en
programación de una sola máquina, nada de lo que hagamos puede cambiar el tiempo que llevará
nosotros para terminar todas nuestras tareas, pero si cada tarea, por ejemplo, representa un
Página 144
esperando cliente, entonces hay una manera de ocupar tan poco de su tiempo colectivo
como sea posible. Imagínese comenzar el lunes por la mañana con un proyecto de cuatro días
y un proyecto de un día en su agenda. Si entrega el proyecto más grande en
Jueves por la tarde (transcurrieron 4 días) y luego el pequeño el viernes
tarde (transcurridos 5 días), los clientes habrán esperado un total de 4 + 5 = 9
dias. Sin embargo, si invierte el orden, puede terminar el pequeño proyecto en
El lunes y el grande el viernes, con los clientes esperando un total de solo 1
+ 5 = 6 días. Es una semana laboral completa para usted de cualquier manera, pero ahora ha ahorrado
sus clientes tres días de su tiempo combinado. Los teóricos de la programación llaman a esto
métrica la "suma de los tiempos de finalización".
Minimizar la suma de los tiempos de finalización conduce a un óptimo muy simple
algoritmo llamado Tiempo de procesamiento más corto : siempre haga la tarea más rápida
usted puede.
Incluso si no tiene clientes impacientes pendiente de cada trabajo, Shortest
Tiempo de procesamiento hace que las cosas hechas . (Quizás no sea de extrañar que sea
compatible con la recomendación de Getting Things Done to
realizar inmediatamente cualquier tarea que lleve menos de dos minutos).
no hay forma de cambiar la cantidad total de tiempo que le llevará su trabajo,
pero el tiempo de procesamiento más corto puede aliviar su mente al reducir el número
de las tareas pendientes lo antes posible. Su suma de tiempos de finalización
La métrica se puede expresar de otra manera: es como centrarse sobre todo en
reduciendo la longitud de su lista de tareas pendientes. Si cada asunto pendiente es
como una espina en el costado, luego correr a través de los elementos más fáciles puede traer
alguna medida deno
Por supuesto, alivio.
todos los asuntos pendientes son iguales. Apagando un
El fuego real en la cocina probablemente debería hacerse antes de "apagar un fuego".
con un correo electrónico rápido a un cliente, incluso si el primero tarda un poco más. En
programación, esta diferencia de importancia se captura en una variable conocida como
peso . Cuando revisa su lista de tareas pendientes, este peso puede sentirse
literal: la carga que se quita de los hombros al terminar cada tarea. A
El tiempo de finalización de la tarea muestra cuánto tiempo lleva esa carga, por lo que
minimizando la suma de los tiempos de finalización ponderados (es decir, cada tarea
Página 145
duración multiplicada por su peso) significa minimizar su opresión total

mientras trabaja en toda su agenda.
La estrategia óptima para ese objetivo es una simple modificación de Shortest
Tiempo de procesamiento: divida el peso de cada tarea por el tiempo que llevará
terminar, y luego trabajar en orden desde la mayor importancia resultante-por-
unidad de tiempo (llámelo "densidad" si lo desea, para continuar con la metáfora del peso)
el más bajo. Y si bien puede ser difícil asignar un grado de importancia a
cada una de sus tareas diarias, esta estrategia ofrece, no obstante, una buena regla de
pulgar: solo priorice una tarea que requiera el doble de tiempo si es el doble
importante.
En contextos comerciales, "peso" se puede traducir fácilmente a la cantidad
de dinero que aportará cada tarea. La noción de dividir la recompensa por la duración
se traduce, por tanto, en asignar a cada tarea una tarifa horaria. (Si eres un
consultor o autónomo, que de hecho ya está hecho por usted: simplemente
divida la tarifa de cada proyecto por su tamaño y trabaje desde la más alta
tarifa por hora a la más baja). Curiosamente, esta estrategia ponderada también muestra
en estudios de forrajeo animal, con nueces y bayas tomando el lugar de
dólares y centavos. Animales, buscando maximizar la velocidad a la que
acumular energía de los alimentos, debe buscar alimentos en el orden de la proporción de
su energía calórica al tiempo necesario para obtenerlos y comerlos, y de hecho
parecen hacerlo.
Cuando se aplica a las deudas en lugar de a los ingresos, el mismo principio produce una
estrategia para entrar en números negros que se conoce como la "deuda
avalancha." Esta estrategia de reducción de la deuda dice ignorar el número y el tamaño
de sus deudas por completo, y simplemente canalice su dinero hacia la deuda con
la tasa de interés única más alta. Esto corresponde bastante claramente a trabajar
a través de trabajos en orden de importancia por unidad de tiempo. Y es la estrategia que
reducirá la carga total de su deuda lo más rápido posible.
Si, por otro lado, le preocupa más reducir el número
de deudas que el monto de la deuda, si, por ejemplo, la molestia de numerosos
las facturas y las llamadas telefónicas de cobranza son más importantes que la diferencia en
tasas de interés, luego regresa a la no ponderada, "simplemente haga las cosas"
sabor del tiempo de procesamiento más corto, pagando las deudas más pequeñas primero
Página 146
simplemente para sacarlos del camino. En los círculos de reducción de la deuda, este enfoque es
conocida como la "bola de nieve de la deuda". Si la gente, en la práctica, debería
priorizar la reducción del monto en dólares de sus deudas o la cantidad de ellas
sigue siendo una controversia activa, tanto en la prensa popular como en
investigación económica.
Escogiendo nuestros problemas
Esto nos lleva de vuelta a la nota con la que comenzamos nuestra discusión de
programación de la máquina. Se dice que "un hombre con un reloj sabe a qué hora
está; un hombre con dos relojes nunca está seguro ". La informática nos puede ofrecer
algoritmos óptimos para varias métricas disponibles en una sola máquina
programación, pero la elección de la métrica que queremos seguir depende de nosotros. En muchos
casos, podemos decidir qué problema queremos resolver.
Esto ofrece una forma radical de repensar la procrastinación, la patología clásica.
de la gestión del tiempo. Normalmente lo consideramos un algoritmo defectuoso. Y si
es exactamente lo contrario? ¿Qué pasa si es una solución óptima para el mal?
problema ?
Hay un episodio de Expediente X donde el protagonista Mulder,
postrado en cama y a punto de ser consumido por un vampiro obsesivo-compulsivo,
derrama una bolsa de pipas de girasol en el suelo en defensa propia. El vampiro,
impotente contra su compulsión, se inclina para recogerlos uno por uno, y
finalmente, el sol sale antes de que pueda hacer una comida de Mulder. Computadora
los científicos llamarían a esto un "ataque de ping" o un ataque de "denegación de servicio": dar
un sistema una abrumadora cantidad de cosas triviales que hacer, y lo importante
las cosas se pierden en el caos.
Por lo general, asociamos la procrastinación con la pereza o la evasión.
comportamiento, pero puede surgir con la misma facilidad en personas (o computadoras, o
vampiros) que están tratando con seriedad y entusiasmo de hacer las cosas
lo más rápido posible. En un estudio de 2014 dirigido por David de Penn State
Rosenbaum, por ejemplo, se pidió a los participantes que trajeran uno de los dos
cubos pesados al extremo opuesto de un pasillo. Uno de los cubos fue
justo al lado del participante; el otro estaba en la mitad del pasillo. Al
Página 147
Para sorpresa de los experimentadores, la gente inmediatamente recogió el cubo cerca

ellos y lo arrastró todo el camino hacia abajo, pasando el otro cubo en el camino,
que podrían haber llevado una fracción de la distancia. Como los investigadores
escribir, “esta elección aparentemente irracional reflejaba una tendencia a
crastinate, un término que introducimos para referirnos a la aceleración de subobjetivo
finalización, incluso a expensas de un esfuerzo físico adicional ". Aplazando el trabajo
en un proyecto importante, atendiendo en su lugar a varios asuntos triviales puede
asimismo, ser visto como "la aceleración de la consecución del subobjetivo", que es
otra forma de decir que los procrastinadores están actuando (¡de manera óptima!) para reducir
tan pronto como sea posible el número de tareas pendientes en sus mentes. Es
no es que tengan una mala estrategia para hacer las cosas; ellos tienen un gran
estrategia para la métrica incorrecta.
Trabajar en una computadora conlleva un peligro adicional cuando
llega a ser consciente y deliberado sobre nuestras métricas de programación: el
La interfaz de usuario puede sutilmente (o no tan sutilmente) imponernos su propia métrica. A
el usuario moderno de teléfonos inteligentes, por ejemplo, está acostumbrado a ver "insignias"
flotando sobre los iconos de las aplicaciones, números siniestros en blanco sobre rojo
indicando exactamente cuántas tareas espera que realicemos cada aplicación en particular
completo. Si se trata de una bandeja de entrada de correo electrónico con la figura de mensajes no leídos
todos los mensajes reciben implícitamente el mismo peso. ¿Se nos puede culpar?
luego, para aplicar el algoritmo de tiempo de procesamiento más corto no ponderado a
el problema: lidiar con todos los correos electrónicos más fáciles primero y aplazar la
los más difíciles hasta el final, ¿para bajar este número lo más rápido posible?
Vive según la métrica, muere según la métrica. Si todas las tareas son realmente iguales
peso, entonces eso es exactamente lo que deberíamos estar haciendo. Pero si no queremos
convertirse en esclavos de las minucias, entonces tenemos que tomar medidas con ese fin.
Esto comienza asegurándose de que el problema de una sola máquina que estamos resolviendo
es el que queremos resolver. (En el caso de las insignias de aplicaciones, si no podemos obtener
ellos para reflejar nuestras prioridades reales, y no podemos superar el impulso de
reducir de manera óptima cualquier cifra numérica que se nos arroje a la cara, entonces tal vez la
La siguiente mejor opción es simplemente apagar las insignias).
Mantenerse enfocado no solo en hacer las cosas, sino en ganar peso
cosas hechas —haciendo el trabajo más importante que pueda en cada momento—
Página 148
suena como una cura infalible para la dilación. Pero resulta que incluso eso
no es suficiente. Y un grupo de expertos en programación informática
encontrar esta lección de la manera más dramática imaginable: en la superficie
de Marte, con el mundo entero mirando.
Restricciones de prioridad e inversión de prioridad
Era el verano de 1997 y la humanidad tenía mucho que celebrar. Por el primero
Siempre, un rover navegaba por la superficie de Marte. Los $ 150 millones
La nave espacial Mars Pathfinder se había acelerado a una velocidad de 16.000 millas por hora.
hora, viajó a través de 309 millones de millas de espacio vacío y aterrizó con
airbags de grado espacial sobre la rocosa superficie roja marciana.
Y ahora estaba procrastinando.
De vuelta en la Tierra, los ingenieros del Laboratorio de Propulsión a Chorro (JPL) estaban
preocupado y perplejo. La tarea de mayor prioridad de Pathfinder (mover datos a
y fuera de su "bus de información") estaba siendo misteriosamente descuidado como el
robot dedicó su tiempo a tareas de mediana importancia. Lo que era
pasando? ¿No sabía el robot algo mejor?
De repente, Pathfinder registró que el bus de información no había sido
tratado durante un tiempo inaceptablemente largo y, sin un recurso más sutil,
inició un reinicio completo, lo que le costó a la misión la mayor parte del día
trabaja. Más o menos un día después, volvió a ocurrir lo mismo.
Trabajando febrilmente, el equipo de JPL finalmente logró reproducir y luego
diagnosticar el comportamiento. El culpable fue un clásico peligro de programación llamado
inversión de prioridad . Lo que sucede en una inversión de prioridad es que una baja
La tarea prioritaria toma posesión de un recurso del sistema (acceso a una base de datos,
digamos) para hacer algo de trabajo, pero luego se interrumpe a la mitad de ese
funciona mediante un temporizador, que lo pausa e invoca el programador del sistema. los
El programador prepara una tarea de alta prioridad, pero no se puede ejecutar porque la base de datos
esta ocupado. Y entonces el programador se mueve hacia abajo en la lista de prioridades, ejecutando
en su lugar, varias tareas desbloqueadas de prioridad media, en lugar de las de alta
la prioridad uno (que está bloqueada), o la de baja prioridad que lo está bloqueando
(que está atascado detrás de todo el trabajo de prioridad media). En estos
Página 149
escenarios de pesadilla, la mayor prioridad del sistema a veces puede ser

descuidado durante períodos de tiempo arbitrariamente largos.*
Una vez que los ingenieros del JPL identificaron el problema de Pathfinder como un caso de
inversión de prioridad, escribieron una solución y transmitieron el nuevo código a través de
millones de millas hasta Pathfinder. ¿Cuál fue la solución que enviaron volando?
a través del sistema solar? Herencia prioritaria . Si se encuentra una tarea de baja prioridad
estar bloqueando un recurso de alta prioridad, bueno, entonces, de repente, esa baja
La tarea prioritaria debe convertirse momentáneamente en la de mayor prioridad en el
sistema, "heredando" la prioridad de la cosa que está bloqueando.
El comediante Mitch Hedberg relata una época en la que "estaba en un casino,
estaba ocupándome de mis propios asuntos, y este tipo se acercó y dijo:
Vas a tener que moverte, estás bloqueando la salida de incendios. Como si hubiera un
fuego, no iba a correr ". El argumento del portero fue la inversión de prioridades;
La refutación de Hedberg fue herencia prioritaria. Hedberg descansando casualmente en
frente a una multitud que huye pone su merodeo de baja prioridad por delante de sus
prioridad corriendo por sus vidas, pero no si hereda su prioridad. Y un
La mafia arremetida tiene una forma de hacer que uno herede su prioridad con bastante rapidez.
Como explica Hedberg, "si eres inflamable y tienes piernas, nunca
bloqueando una salida de emergencia ".
La moraleja aquí es que el amor por hacer las cosas no es suficiente para evitar
programar dificultades, y tampoco el amor por hacer las cosas importantes . A
compromiso de hacer meticulosamente lo más importante que pueda, si
perseguido de una manera miope y con la cabeza gacha, puede conducir a lo que busca todos los
mundo como la dilación. Al igual que con un coche haciendo girar sus neumáticos, el mismo deseo de
hacer un progreso inmediato es como uno se atasca. "Las cosas que más importan
nunca debe estar a merced de las cosas que menos importan ", supuestamente Goethe
proclamado pero si bien eso suena a sabiduría, a veces es
simplemente no es cierto. A veces, lo que más importa no se puede hacer hasta que
lo que menos importa está terminado, así que no hay más remedio que tratar eso
algo sin importancia por ser tan importante como lo que está bloqueando.
Cuando una determinada tarea no se puede iniciar hasta que se termine otra,
Los teóricos de la programación lo llaman una "restricción de precedencia". Para operaciones
la experta en investigación Laura Albert McLay, recordando explícitamente este principio
Página 150
ha marcado la diferencia en más de una ocasión en su propia casa.

“Puede ser realmente útil si puede ver estas cosas. Por supuesto, conseguir
a lo largo del día con tres hijos, hay mucha programación… No podemos conseguir
salir por la puerta a menos que los niños desayunen primero y no puedan desayunar
primero si no recuerdo darles una cuchara. A veces hay
algo muy simple que olvidas que solo retrasa todo. En términos
de algoritmos de programación, simplemente saber qué es [eso] y mantenerlo
en movimiento, es increíblemente útil. Así es como hago las cosas todos los días ".
En 1978, el investigador de programación Jan Karel Lenstra pudo utilizar el
mismo principio mientras ayudaba a su amigo Gene a mudarse a una nueva casa en
Berkeley. "Gene estaba posponiendo algo que tenía que terminar antes
podríamos comenzar algo más que era urgente ". Como recuerda Lenstra,
necesitaba devolver una camioneta, pero necesitaba que la camioneta devolviera una pieza de equipo,
pero necesitaba el equipo para arreglar algo en el apartamento. El apartamento
arreglar no se sentía urgente (de ahí su aplazamiento), pero el regreso de la furgoneta sí. Dice
Lenstra, "le expliqué que la primera tarea debe considerarse incluso
más urgente ". Si bien Lenstra es una figura central en la teoría de la programación, y
así estaba bien posicionado para darle este consejo a su amigo, vino con un
ironía particularmente deliciosa. Este fue un caso de libro de texto de inversión de prioridades
causado por restricciones de precedencia. Y posiblemente el siglo XX
El mayor experto en restricciones de precedencia no era otro que su
amigo, Eugene “Gene” Lawler.
El tope de velocidad
Teniendo en cuenta que pasó gran parte de su vida pensando en cómo

completar de manera eficiente una secuencia de tareas, Lawler tomó una intrigante
ruta tortuosa hacia su propia carrera. Estudió matemáticas en Florida State
Universidad antes de comenzar el trabajo de posgrado en Harvard en 1954, aunque
se fue antes de terminar un doctorado. Después de un tiempo en la escuela de derecho, el ejército y
(temáticamente) trabajando en un taller de máquinas, regresó a Harvard
en 1958, terminando su doctorado y tomando un puesto en la Universidad de
Michigan. Al visitar Berkeley en un año sabático en 1969, fue arrestado en un
Página 151
notoria protesta contra la guerra de Vietnam. Se convirtió en miembro de la facultad de

Berkeley al año siguiente, y adquirió una reputación allí por ser "el
conciencia social ”del departamento de informática. Después de su muerte en
1994, la Association for Computing Machinery estableció un premio en
El nombre de Lawler, en honor a las personas que demuestran el humanitarismo
potencial de la informática.
La primera investigación de Lawler sobre las restricciones de precedencia sugirió que
podrían manejarse con bastante facilidad. Por ejemplo, tome la fecha de vencimiento más temprana
algoritmo que minimiza el retraso máximo de un conjunto de tareas. Si tu
las tareas tienen restricciones de precedencia, lo que complica las cosas; no se puede simplemente
avanzar en el orden de la fecha de vencimiento si algunas tareas no se pueden iniciar hasta que otras
estan terminados. Pero en 1968, Lawler demostró que esto no es un problema siempre que
usted construye el programa de atrás hacia adelante: mire solo las tareas que ningún otro
las tareas dependen, y coloque la que tenga la última fecha de vencimiento al final de la
calendario. Luego, simplemente repita este proceso, considerando nuevamente en cada paso
sólo aquellas tareas de las que ninguna otra (aún no programada) depende como
requisito previo.
Pero a medida que Lawler analizó más profundamente las limitaciones de precedencia, encontró
algo curioso. El algoritmo de tiempo de procesamiento más corto, como vimos, es
la póliza óptima si desea tachar tantos elementos tan rápido como
posible de su lista de tareas pendientes. Pero si algunas de tus tareas tienen prioridad
restricciones, no hay un ajuste simple u obvio para el procesamiento más corto
Es hora de adaptarse a eso. Aunque parecía una programación elemental
problema, ni Lawler ni ningún otro investigador parecían ser capaces de encontrar
una forma eficaz de solucionarlo.
De hecho, fue mucho peor que esto. El propio Lawler pronto
descubrir que este problema pertenece a una clase que la mayoría de los científicos
cree que no tiene una solución eficiente, es lo que el campo llama "intratable".*
El primer golpe de velocidad de la teoría de la programación resultó ser una pared de ladrillos.
Como vimos con el escenario "triple o nada" para el que se
detener la teoría no tiene palabras sabias, no todos los problemas que pueden ser formalmente
articulado tiene una respuesta. En la programación, está claro por definición que cada
conjunto de tareas y restricciones tiene un horario que es el mejor, por lo que la programación
Página 152
los problemas no son incontestables, per se, pero puede ser simplemente el caso de que
No existe un algoritmo sencillo que pueda encontrarle el horario óptimo.
en un período de tiempo razonable.
Esto llevó a investigadores como Lawler y Lenstra a una pregunta irresistible.
De todos modos, ¿qué proporción de los problemas de programación eran intratables?
Veinte años después de que la teoría de la programación fuera impulsada por Selmer Johnson
papel de encuadernación, la búsqueda de soluciones individuales estaba a punto de convertirse
algo mucho más grandioso y ambicioso con diferencia: una búsqueda para mapear el
todo el panorama de la teoría de la programación.
Lo que encontraron los investigadores fue que incluso el cambio más sutil en un
El problema de programación a menudo lo inclina sobre la línea fina e irregular entre
tratable e intratable. Por ejemplo, el algoritmo de Moore minimiza la
número de tareas tardías (o frutas podridas) cuando todas tienen el mismo valor, pero
si algunos son más importantes que otros, el problema se vuelve intratable
y ningún algoritmo puede proporcionar fácilmente la programación óptima. Igualmente,
tener que esperar hasta cierto tiempo para comenzar algunas de sus tareas hace que casi
todos los problemas de programación para los que, de otro modo, tendríamos eficientes
soluciones en problemas intratables. No poder sacar la basura hasta
la noche anterior a la recolección puede ser una ordenanza municipal razonable, pero
enviará su calendario de cabeza a la intratabilidad.
El trazado de las fronteras de la teoría de la programación continúa hasta el día de hoy. A
Una encuesta reciente mostró que el estado de aproximadamente el 7% de todos los problemas sigue sien
desconocido, terra incognita de la programación. Del 93% de los problemas que
entiendo, sin embargo, las noticias no son buenas: solo el 9% se puede resolver
eficientemente, y el otro 84% ha demostrado ser intratable. * En otros
En palabras, la mayoría de los problemas de programación no admiten una solución inmediata. Si intent
administrar perfectamente su calendario se siente abrumador, tal vez sea porque
en realidad lo es. No obstante, los algoritmos que hemos discutido son a menudo los
punto de partida para abordar esos problemas difíciles, si no perfectamente, entonces en
menos tan bien como se puede esperar.
Dejar todo: preferencia e incertidumbre
Página 153
El mejor momento para plantar un árbol es hace veinte años. El segundo mejor momento
es ahora.
-PROVERBIO
Hasta ahora, hemos considerado solo los factores que dificultan la programación. Pero
hay un giro que puede hacerlo más fácil: poder detener una tarea
a la mitad y cambiar a otro. Esta propiedad, "preferencia", se convierte
para cambiar el juego dramáticamente.
Minimizar la máxima tardanza (para atender a los clientes en una cafetería)
o la suma de los tiempos de finalización (para acortar rápidamente su lista de tareas pendientes) tanto
cruzar la línea hacia la intratabilidad si algunas tareas no se pueden iniciar hasta que
una hora en particular. Pero vuelven a tener soluciones eficientes una vez
se permite la preferencia. En ambos casos, las estrategias clásicas: vencimiento más temprano
La fecha y el tiempo de procesamiento más corto, respectivamente, siguen siendo los mejores, con un
modificación bastante sencilla. Cuando llega la hora de inicio de una tarea,
compare esa tarea con la que se está realizando actualmente. Si estas trabajando por
La fecha de vencimiento más temprana y la nueva tarea vence incluso antes que la actual,
cambiar de marcha; de lo contrario, mantén el rumbo. Del mismo modo, si está trabajando con
El tiempo de procesamiento más corto, y la nueva tarea se puede terminar más rápido que el
actual, haga una pausa para ocuparse de él primero; de lo contrario, continúa con lo que
estaban haciendo.
Ahora, en una buena semana, un taller de máquinas puede saber todo lo que se espera.
de ellos en los próximos días, pero la mayoría de nosotros suele volar a ciegas, al menos
en parte. Puede que ni siquiera estemos seguros, por ejemplo, de cuándo podremos empezar
un proyecto en particular (¿cuándo tal y tal me dará una respuesta sólida sobre el
¿tal y tal?). Y en cualquier momento nuestro teléfono puede sonar o un correo electrónico puede
aparecerá con noticias de una tarea completamente nueva para agregar a nuestra agenda.
Sin embargo, resulta que incluso si no sabe cuándo comenzarán las tareas,
La fecha de vencimiento más temprana y el tiempo de procesamiento más corto siguen siendo estrategias
capaz de garantizarle (en promedio) el mejor rendimiento posible en la cara
de incertidumbre. Si las asignaciones se arrojan a su escritorio en impredecibles
momentos, la estrategia óptima para minimizar la tardanza máxima sigue siendo la
versión preventiva de la fecha de vencimiento más temprana: cambiar al trabajo que acaba
Página 154
surgió si vence antes que el que está haciendo actualmente, y

de lo contrario ignorándolo. Del mismo modo, la versión preventiva de Shortest
Tiempo de procesamiento: compare el tiempo restante para finalizar la tarea actual con el
el tiempo que tomaría completar el nuevo, sigue siendo óptimo para minimizar
la suma de los tiempos de finalización.
De hecho, la versión ponderada de Shortest Processing Time es bastante
buen candidato para la mejor estrategia de programación de propósito general frente a
incertidumbre. Ofrece una receta sencilla para la gestión del tiempo: cada vez
entra un nuevo trabajo, divida su importancia por la cantidad de tiempo
tardará en completarse. Si esa cifra es más alta que la de la tarea que está
haciendo actualmente, cambie al nuevo; de lo contrario, quédate con la corriente
tarea. Este algoritmo es lo más parecido que tiene la teoría de la programación a un
llave maestra o navaja suiza, la estrategia óptima no solo para uno
sabor del problema pero para muchos. Bajo ciertos supuestos minimiza no
solo la suma de los tiempos de finalización ponderados, como podríamos esperar, pero también el
suma de las ponderaciones de los trabajos tardíos y la suma de la demora ponderada de
esos trabajos.
Curiosamente, optimizar todas estas otras métricas es intratable si sabemos
las horas de inicio y la duración de los trabajos antes de tiempo. Así que considerando el
El impacto de la incertidumbre en la programación revela algo contradictorio:
hay casos en los que la clarividencia es una carga. Incluso con completo
conocimiento previo, encontrar el horario perfecto podría ser prácticamente
imposible. Por el contrario, pensar con rapidez y reaccionar a medida que llegan los trabajos
no le dará un horario tan perfecto como si hubiera visto el futuro, pero
lo mejor que puede hacer es mucho más fácil de calcular. Eso es un consuelo. Como
El escritor y codificador de negocios Jason Fried dice: "Siente que no puede continuar
hasta que tenga un plan a prueba de balas en su lugar? Reemplace 'plan' con 'adivinar' y
tómalo con calma." La teoría de la programación lo confirma.
Cuando el futuro es brumoso, resulta que no necesitas un calendario, solo un
lista de quehaceres.
La preferencia no es gratuita: el cambio de contexto
Página 155
El apresurador voy / el detras me pongo

—NEEDLEPOINT VISTO EN BOONVILLE, CA
Los programadores no hablan porque no deben ser interrumpidos.… Para

sincronizar con otras personas (o su representación en teléfonos,
timbres y timbres) solo puede significar interrumpir el tren del pensamiento.
Las interrupciones significan ciertos errores. No debe bajarse del tren.
—ELLEN ULLMAN
La teoría de la programación, por lo tanto, cuenta una historia razonablemente alentadora después de to
son algoritmos simples y óptimos para resolver muchos problemas de programación, y
esos problemas son tentadoramente cercanos a situaciones que encontramos a diario en
vidas humanas. Pero cuando se trata de realizar realmente una sola máquina
programar en el mundo real, las cosas se complican.
En primer lugar, tanto las personas como los sistemas operativos de las computadoras se enfrentan a
desafío: la máquina que está haciendo la programación y la máquina que está siendo
programados son uno y el mismo. Lo que hace que enderezar tus tareas pendientes
Incluya un elemento en su lista de tareas pendientes, que necesita, en sí mismo, ser priorizado y
programado.
En segundo lugar, la preferencia no es gratuita. Cada vez que cambia de tarea, paga una
precio, conocido en ciencias de la computación como cambio de contexto . Cuando una computadora
procesador desvía su atención de un programa dado, siempre hay un
cierta cantidad de gastos generales necesarios. Necesita marcar de manera efectiva su
colocar y dejar a un lado toda la información relacionada con ese programa. Entonces eso
necesita averiguar qué programa ejecutar a continuación. Finalmente debe sacar todo
la información relevante para ese programa, busque su lugar en el código y obtenga
engranado.
Ninguno de estos cambios de ida y vuelta es "trabajo real", es decir, nada de eso
En realidad, avanza el estado de cualquiera de los diversos programas en los que se encuentra la comput
cambiar entre. Es metatrabajo . Cada cambio de contexto es una pérdida de tiempo.
Los seres humanos también tienen costos de cambio de contexto. Los sentimos cuando
movemos papeles dentro y fuera de nuestro escritorio, cerramos y abrimos documentos en nuestro
Página 156
computadora, entrar en una habitación sin recordar lo que nos había enviado allí, o
simplemente di en voz alta: "Ahora, ¿dónde estaba?" o "¿Qué estaba diciendo?"
Los psicólogos han demostrado que, para nosotros, los efectos de cambiar de tarea pueden
incluir retrasos y errores, en una escala de minutos en lugar de
microsegundos. Para poner esa cifra en perspectiva, cualquiera que interrumpa más
de unas pocas veces por hora corre el riesgo de no hacer ningún trabajo.
Personalmente, hemos descubierto que tanto la programación como la escritura requieren
teniendo en cuenta el estado de todo el sistema, y por lo tanto llevar desmesuradamente
grandes costos de cambio de contexto. Un amigo nuestro que escribe software dice
que la semana laboral normal no se adapta bien a su flujo de trabajo, ya que para él
Los días de dieciséis horas son más del doble de productivos que los de ocho horas.
Brian, por su parte, piensa en la escritura como una especie de herrería, donde
toma un tiempo calentar el metal antes de que sea maleable. Lo encuentra
algo intil bloquear algo menos de noventa minutos para
escribiendo, ya que no pasa mucho en la primera media hora, excepto cargar un
bloque gigante de "Ahora, ¿dónde estaba?" en su cabeza. Experto en programación Kirk
Pruhs, de la Universidad de Pittsburgh, ha tenido la misma experiencia. "Si es
en menos de una hora haré recados, porque me tomará la primera
treinta y cinco minutos para averiguar realmente lo que quiero hacer y luego podría
no tengo tiempo para hacerlo ".
El célebre poema de Rudyard Kipling de 1910 "Si ..." termina con un exuberante
llame para la gestión del tiempo: "Si puede llenar el minuto implacable / Con
sesenta segundos de distancia recorrida ... "
Si solo. La verdad es que siempre hay gastos generales: tiempo perdido en metatrabajo, en
la logística de la contabilidad y la gestión de tareas. éste es uno de
compensaciones fundamentales de la programación. Y cuanto más tomas, más
arriba hay. En su extremo de pesadilla, esto se convierte en un fenómeno
llamado paliza .
Paliza
Gage: Sr. Zuckerberg, ¿tengo toda su atención? ...
Página 157
Zuckerberg: Tienes parte de mi atención, tienes el mínimo
Monto.
- LA RED SOCIAL
Las computadoras realizan múltiples tareas a través de un proceso llamado "subprocesamiento", que pue
Piense en como hacer malabarismos con un juego de pelotas. Así como un malabarista solo lanza uno
bola a la vez en el aire pero mantiene tres en alto, una CPU solo funciona en una
programa a la vez, pero intercambiando entre ellos lo suficientemente rápido (en el
escala de diez milésimas de segundo) parece estar reproduciendo una película,
navegar por la web y alertarle sobre el correo electrónico entrante a la vez.
En la década de 1960, los informáticos comenzaron a pensar en cómo automatizar
el proceso de compartir recursos informáticos entre diferentes tareas y
usuarios. Fue un momento emocionante, cuenta Peter Denning, ahora uno de los mejores
expertos en multitarea informática, que entonces estaba trabajando en su doctorado
en el MIT. Emocionante e incierto: "¿Cómo se particiona una memoria principal?
entre un montón de trabajos que están ahí cuando algunos de ellos quieren crecer
y algunos querrán encogerse e interactuarán con cada uno
otro, tratando de robar [la memoria] y todo este tipo de cosas? ... ¿Cómo
gestionar todo ese conjunto de interacciones? Nadie sabía nada de eso ".
No es sorprendente, dado que los investigadores aún no sabían realmente qué
que estaban haciendo, el esfuerzo tropezó con dificultades. Y había uno en
particular que les llamó la atención. Como explica Denning, bajo ciertas
condiciones un problema dramático "aparece a medida que agrega más trabajos a la
mezcla multiprogramación. En algún momento pasas un umbral crítico:
impredecible exactamente donde está, pero lo sabrás cuando llegues ...
y de repente el sistema parece morir ".
Piense de nuevo en nuestra imagen de malabarista. Con una pelota en el aire, hay
suficiente tiempo libre mientras esa pelota está en el aire para que el malabarista lance otras
hacia arriba también. Pero, ¿y si el malabarista toma una pelota más de la que puede?
¿resolver? No deja caer esa pelota; deja todo . Todo el sistema
literalmente, baja. Como dice Denning, "La presencia de una
programa adicional ha provocado un colapso total del servicio.… El agudo
diferencia entre los dos casos al principio desafía la intuición, lo que podría llevar
Página 158
esperar una degradación gradual del servicio a medida que se

introducido en la memoria principal abarrotada ". En cambio, catástrofe. Y mientras
podemos entender que un malabarista humano se sienta abrumado, ¿qué podría causar
algo así le suceda a una máquina ?
Aquí la teoría de la programación se cruza con la teoría del almacenamiento en caché. Toda la idea de
cachés es mantener el "conjunto de trabajo" de los elementos necesarios disponibles para una rápida
acceso. Una forma de hacerlo es manteniendo la información que la computadora
actualmente se utiliza en la memoria rápida en lugar de en el disco duro lento. Pero si un
La tarea requiere realizar un seguimiento de tantas cosas que no todas encajarán en
memoria, es posible que acabe pasando más tiempo intercambiando
información dentro y fuera de la memoria que haciendo el trabajo real. Y lo que es más,
cuando cambia de tarea, la nueva tarea activa puede dejar espacio para su
conjunto de trabajo desalojando porciones de otros conjuntos de trabajo de la memoria. los
La siguiente tarea, tras la reactivación, volvería a adquirir partes de su conjunto de trabajo.
del disco duro y devolverlos a la memoria, desplazándolos de nuevo
otros. Este problema, las tareas que se roban el espacio entre sí, puede desquitarse
peor en sistemas con jerarquías de cachés entre el procesador y el
memoria. Como Peter Zijlstra, uno de los desarrolladores principales de Linux
programador del sistema operativo, dice, "Los cachés están calientes para la corriente
carga de trabajo, y cuando cambia de contexto, prácticamente invalida todos los
cachés. Y eso duele ". En el otro extremo, un programa puede funcionar solo a largo
suficiente para intercambiar sus elementos necesarios en la memoria, antes de dar paso a otro
programa que se ejecuta el tiempo suficiente para sobrescribirlos a su vez.
Esto es trepidante: un sistema que se ejecuta a toda máquina y no logra nada en
todos. Denning diagnosticó por primera vez este fenómeno en un estudio de gestión de la memoria.
contexto, pero los científicos de la computación ahora usan el término "paliza" para referirse a
Prácticamente cualquier situación en la que el sistema se detenga porque es
completamente preocupado por el metatrabajo. El rendimiento de una computadora aplastante
no se empantana gradualmente. Se cae por un acantilado. El "trabajo real" se ha reducido a
efectivamente cero, lo que también significa que será casi imposible obtener
fuera.
La paliza es un estado humano muy reconocible. Si alguna vez has tenido un
momento en el que querías dejar de hacer todo solo para tener la oportunidad
Página 159
para escribir todo lo que se suponía que debías estar haciendo, pero no pudiste prescindir
el tiempo, lo has goleado. Y la causa es muy parecida para las personas que para
Computadoras: cada tarea se basa en nuestros limitados recursos cognitivos. Cuando
simplemente recordar todo lo que tenemos que hacer ocupa nuestro pleno
atención, o priorizar cada tarea consume todo el tiempo que teníamos que hacer
ellos, o nuestro hilo de pensamiento se interrumpe continuamente antes de que
los pensamientos pueden traducirse en acción; se siente como pánico, como parálisis por medio de
hiperactividad. Es trepidante y las computadoras lo saben bien.
Si alguna vez ha luchado con un sistema en un estado de paliza, y si
alguna vez has estado en tal estado, entonces es posible que sientas curiosidad por la
informática para salir. En su histórico artículo de la década de 1960 sobre la
sujeto, Denning señaló que una onza de prevención vale una libra de
cura. Lo más fácil de hacer es simplemente obtener más memoria: suficiente RAM,
por ejemplo, para ajustar los conjuntos de trabajo de todos los programas en ejecución en la memoria
de una vez y reduzca el tiempo que tarda un cambio de contexto. Pero preventivo
Los consejos para la paliza no te ayudan cuando te encuentras en medio de
eso. Además, en lo que respecta a la atención humana, estamos atrapados en lo que
tiene.
Otra forma de evitar una paliza antes de que comience es aprender el arte de
diciendo que no. Denning defendía, por ejemplo, que un sistema debería simplemente
negarse a agregar un programa a su carga de trabajo si no tiene suficiente
memoria para mantener su conjunto de trabajo. Esto evita la paliza en las máquinas y es
un consejo sensato para cualquiera que tenga un plato lleno. Pero esto también puede parecer
un lujo inalcanzable para aquellos de nosotros que nos encontramos ya sobrecargados
—O de otra manera incapaz de estrangular las demandas que se nos imponen.
En estos casos, es evidente que no hay forma de trabajar más duro, pero puede
trabajo ... más tonto . Junto con las consideraciones de memoria, uno de los mayores
fuentes del metatrabajo en contextos cambiantes es el acto mismo de elegir lo que
hacer a continuación. Esto también puede, en ocasiones, hundir la realización real del trabajo.
Frente a, digamos, una bandeja de entrada desbordada de n mensajes, sabemos por ordenar
teoría de que escanearlo repetidamente en busca de la más importante para responder a continuación
tomará O ( n 2 ) operaciones: n escaneos de n mensajes cada uno. Esto significa que
Despertar con una bandeja de entrada que está tres veces más llena de lo habitual podría llevarle nueve
Página 160
veces más tiempo para procesar. Además, escaneando esos correos electrónicos
significa intercambiar cada mensaje en tu mente, uno tras otro, antes de
respondes a cualquiera de ellos: una receta infalible para la memoria.
En un estado de paliza, esencialmente no estás progresando, así que incluso
hacer las tareas en el orden incorrecto es mejor que no hacer nada. En lugar de
responder primero a los correos electrónicos más importantes, lo que requiere una evaluación de
la imagen completa que puede llevar más tiempo que el trabajo en sí, tal vez
debería esquivar esas arenas movedizas de tiempo cuadrático simplemente respondiendo los correos ele
en orden aleatorio , o en cualquier orden en que aparezcan en la pantalla.
Pensando en la misma línea, el equipo central de Linux, hace varios años,
reemplazó su programador con uno que era menos "inteligente" a la hora de calcular
prioridades del proceso, pero lo compensó con creces al tomar menos tiempo para
calcularlos.
Sin embargo, si aún desea mantener sus prioridades, hay una
y una ganga aún más interesante que puede lograr para aumentar su productividad
espalda.
Interrumpir la fusión
Parte de lo que hace que la programación en tiempo real sea tan compleja e interesante es que
es fundamentalmente una negociación entre dos principios que no están completamente
compatible. Estos dos principios se denominan capacidad de respuesta y rendimiento :
qué tan rápido puede responder a las cosas y cuánto puede hacer
en general. Cualquiera que haya trabajado alguna vez en un entorno de oficina puede
apreciar la tensión entre estas dos métricas. Es parte de la razón
hay personas cuyo trabajo es contestar el teléfono: son receptivos, por lo que
que otros puedan tener rendimiento.
Una vez más, la vida es más difícil cuando, como una computadora, debes hacer
compensación de capacidad de respuesta / rendimiento usted mismo. Y la mejor estrategia para
Paradójicamente, hacer las cosas podría ser reducir la velocidad.
Los programadores del sistema operativo normalmente definen un "período" en el que cada
El programa está garantizado para ejecutarse al menos un poco, con el sistema dando un
"Porción" de ese período a cada programa. Cuantos más programas se estén ejecutando,
Página 161
más pequeñas se vuelven esas porciones, y más cambios de contexto están ocurriendo
cada período, manteniendo la capacidad de respuesta a costa del rendimiento. Izquierda
Sin embargo, esta política de garantizar cada proceso al menos algunos
atención cada período podría conducir a una catástrofe. Con suficientes programas
en ejecución, la porción de una tarea se reduciría hasta el punto en que el sistema
gastar toda la porción en el cambio de contexto, antes de contextualizar inmediatamente
cambiando de nuevo a la siguiente tarea.
El culpable es la dura garantía de capacidad de respuesta. Funcionamiento tan moderno
de hecho, los sistemas establecen una longitud mínima para sus cortes y se negarán a
subdividir el período más finamente. (En Linux, por ejemplo, este mínimo
rebanada útil resulta ser de aproximadamente tres cuartos de milisegundo, pero en
humanos, de manera realista, podría ser al menos varios minutos.) Si más procesos
se agregan más allá de ese punto, el período simplemente se hará más largo. Esto significa
que los procesos tendrán que esperar más para obtener su turno, pero los turnos que
get será al menos lo suficientemente largo para hacer algo.
Establecer una cantidad mínima de tiempo para dedicar a cualquier tarea ayuda
para evitar que el compromiso con la capacidad de respuesta anule el rendimiento
por completo: si el segmento mínimo es más largo que el tiempo que se tarda en contextualizar
cambiar, entonces el sistema nunca puede entrar en un estado en el que el cambio de contexto sea
lo único que está haciendo. También es un principio que es fácil de traducir en un
recomendación para vidas humanas. Métodos como "timeboxing" o
"Pomodoros", donde literalmente configuras un temporizador de cocina y te comprometes a hacer un
una sola tarea hasta que se agote, son una encarnación de esta idea.
Pero, ¿a qué tamaño de rebanada debes apuntar? Ante la pregunta de cómo
mucho tiempo para esperar entre intervalos para realizar una tarea recurrente, como comprobar
su correo electrónico, la respuesta desde la perspectiva del rendimiento es simple: siempre que
como sea posible. Pero ese no es el final de la historia; mayor rendimiento, después de todo,
también significa menor capacidad de respuesta.
Para su computadora, la molesta interrupción que tiene que controlar
normalmente no es el correo electrónico, eres tú. Es posible que no mueva el mouse durante minutos
u horas, pero cuando lo hace, espera que el puntero de la pantalla se mueva
inmediatamente, lo que significa que la máquina gasta mucho esfuerzo simplemente
comprobando cómo estás. Cuanto más frecuentemente revise el mouse y
Página 162
teclado, más rápido puede reaccionar cuando hay una entrada, pero más contexto
interruptores que tiene que hacer. Entonces, la regla que siguen los sistemas operativos de las computado
al decidir cuánto tiempo pueden permitirse dedicarse a algunos
La tarea es simple: el mayor tiempo posible sin que parezca nervioso o lento para el
usuario.
Cuando los humanos salimos de casa para hacer un recado rápido, podríamos decir
algo como, "Ni siquiera notarás que me he ido". Cuando nuestras maquinas
cambio de contexto en un cálculo, deben regresar literalmente a nosotros antes de que
note que se han ido. Para encontrar este punto de equilibrio, los sistemas operativos
Los programadores han recurrido a la psicología, minando artículos en psicofísica.
el número exacto de milisegundos de retraso que tarda un cerebro humano en
registrar retraso o parpadeo. Ya no tiene sentido atender al usuario
a menudo que eso.
Gracias a estos esfuerzos, cuando los sistemas operativos funcionan correctamente,
ni siquiera se dé cuenta de lo duro que se está esforzando su computadora. Tu continua
para poder mover el mouse por la pantalla con fluidez incluso cuando su
El procesador está transportando a máxima inclinación. La fluidez le está costando algo de rendimiento,
pero esa es una compensación de diseño que ha sido hecha explícitamente por el sistema
ingenieros: su sistema pasa todo el tiempo posible lejos de
interactuando con usted, luego vuelve a dibujar el mouse justo a tiempo.
Y nuevamente, este es un principio que se puede transferir a la vida humana. los
La moraleja es que debes tratar de concentrarte en una sola tarea el mayor tiempo posible.
sin disminuir su capacidad de respuesta por debajo del mínimo aceptable
límite. Decida qué tan receptivo debe ser y luego, si desea obtener
cosas hechas, no seas más receptivo que eso.
Si te das cuenta de que cambias mucho de contexto porque estás
abordar una colección heterogénea de tareas breves, también puede emplear
otra idea de la informática: "interrumpir la fusión". Si tienes cinco
las facturas de las tarjetas de crédito, por ejemplo, no las pague a medida que llegan; cuidar de
todos de una vez cuando llegue el quinto billete. Siempre y cuando tus facturas nunca sean
vencen menos de treinta y un días después de su llegada, puede designar, digamos, el
primero de cada mes como "día de pago de facturas" y siéntese en ese momento para
procese todas las facturas en su escritorio, sin importar si fueron tres semanas o
Página 163
hace tres horas. Del mismo modo, si ninguno de sus corresponsales de correo electrónico le solicita
para responder en menos de veinticuatro horas, puede limitarse a
revisando sus mensajes una vez al día. Las propias computadoras hacen algo
así: esperan hasta un intervalo fijo y comprueban todo, en su lugar
de cambio de contexto para manejar interrupciones separadas y descoordinadas de su
varios subcomponentes. *
En ocasiones, los informáticos notan la ausencia de interrupción
fusionándose en sus propias vidas. Peter, director de investigación de Google
Norvig: "Tuve que ir al centro tres veces hoy para hacer mandados, y dije:
'Oh, bueno, eso es solo un error de una línea en su algoritmo. Deberías tener solo
esperó o lo agregó a la cola de tareas pendientes, en lugar de ejecutarlas
secuencialmente a medida que se agregaron uno a la vez '”.
A escala humana, obtenemos interrupciones que se fusionan de forma gratuita desde el correo postal
sistema, como consecuencia de su ciclo de entrega. Porque el correo recibe
entregado solo una vez al día, algo enviado por correo solo unos minutos tarde podría
Tómese veinticuatro horas adicionales para comunicarse con usted. Considerando los costos de
cambio de contexto, el lado positivo de esto ya debería ser obvio: usted
sólo puede ser interrumpido por facturas y cartas como máximo una vez al día. Qué
más, el ritmo postal de veinticuatro horas exige una capacidad de respuesta mínima
de usted: no importa si envía su respuesta cinco
minutos o cinco horas después de recibir una carta.
En el ámbito académico, mantener el horario de oficina es una forma de fusionar las interrupciones
de los estudiantes. Y en el sector privado, la fusión de interrupciones ofrece una
visión redentora de uno de los rituales de oficina más difamados: el semanario
cita. Cualesquiera que sean sus inconvenientes, las reuniones programadas regularmente son una
de nuestras mejores defensas contra la interrupción espontánea y los imprevistos
cambio de contexto.
Quizás el santo patrón del estilo de vida de cambio de contexto mínimo es el
el legendario programador Donald Knuth. “Hago una cosa a la vez”, dice.
“Esto es lo que los científicos de la computación llaman procesamiento por lotes: la alternativa es
intercambiando dentro y fuera. No cambio de entrada y salida ". Knuth no está bromeando. Sobre
El 1 de enero de 2014, se embarcó en "The TeX Tuneup of 2014", en el que
corrigió todos los errores que se habían informado en su software de composición tipográfica TeX
Página 164
durante los seis años anteriores . Su informe termina con la alegre despedida "Quédese
sintonizados para The TeX Tuneup de 2021! " Asimismo, Knuth no ha recibido un correo electrónico.
dirección desde 1990. "El correo electrónico es algo maravilloso para las personas cuyo papel en
la vida es estar al tanto de las cosas. Pero no para mí; mi papel es estar abajo
de cosas. Lo que hago toma largas horas de estudio y es ininterrumpida.
concentración." Revisa todo su correo postal cada tres meses, y todos
sus faxes cada seis.
Pero uno no necesita llevar las cosas al extremo de Knuth para desear que
La mayor parte de nuestras vidas utiliza la fusión de interrupciones como principio de diseño. El cargo
la oficina nos lo da casi por accidente; en otro lugar, tenemos que construirlo, o
exigirlo, por nosotros mismos. Nuestros dispositivos que emiten pitidos y zumbidos tienen el mensaje "N
"Molestar", que podíamos activar y desactivar manualmente en todo el
día, pero ese es un instrumento demasiado contundente. En cambio, podríamos agitarnos por
configuraciones que proporcionarían una opción explícita para interrumpir la fusión: la
lo mismo en una escala de tiempo humana que los dispositivos están haciendo internamente. Alerta
yo sólo una vez cada diez minutos, digamos; entonces cuéntamelo todo.
Página 165
*Irónicamente, el líder del equipo de software Pathfinder, Glenn Reeves, culparía del error a la "fecha límite
presiones ”, y en el hecho de que solucionar este problema en particular durante el desarrollo se había considerado un
"Menor prioridad". Entonces, la causa raíz, en cierto sentido, reflejaba el problema en sí.
Página 166
*Discutiremos los problemas "intratables" con más detalle en el capítulo 8.

Página 167
*Sin embargo, las cosas no son tan malas como podría parecerles este número, ya que incluye
problemas de programación que involucran varias máquinas, que es más como administrar un grupo de
empleados que administrar su calendario.
Página 168
*Dado que muchas computadoras tienden a mostrar descaradamente mensajes de error y diálogos que roban el cursor
cajas cada vez que quieren algo de nosotros, su comportamiento es algo hipócrita. El usuario
La interfaz exige la atención del usuario de una manera que la propia CPU rara vez toleraría.
Página 169
6 Regla de Bayes
Prediciendo el futuro
Todo conocimiento humano es incierto, inexacto y parcial.

-BERTRAND RUSSELL
Mañana saldrá el sol. Puedes apostar tu último dólar allí

ser sol.
- ANNIE
En 1969, antes de embarcarse en un doctorado en astrofísica en Princeton, J.

Richard Gott III hizo un viaje a Europa. Allí vio el Muro de Berlín, que
había sido construido ocho años antes. De pie a la sombra de la pared, un
crudo símbolo de la Guerra Fría, comenzó a preguntarse cuánto tiempo más duraría
continuaría dividiendo Oriente y Occidente.
A primera vista, hay algo absurdo en tratar de hacer esto
tipo de predicción. Incluso dejando de lado la imposibilidad de prever
geopolítica, la pregunta parece matemáticamente ridícula: está tratando de
hacer una predicción a partir de un único punto de datos .
Pero por ridículo que parezca a primera vista, hacemos tales
predicciones todo el tiempo, por necesidad. Llegas a una parada de autobús en un extranjero
ciudad y aprender, tal vez, que el otro turista parado all ha estado esperando
siete minutos. ¿Cuándo es probable que llegue el próximo autobús? ¿Vale la pena
espere, y si es así, ¿cuánto tiempo debe hacerlo antes de darse por vencido?
Página 170
O tal vez un amigo tuyo ha estado saliendo con alguien durante un mes y
quiere su consejo: ¿es demasiado pronto para invitarlos a una próxima
¿Boda de la familia? La relación ha tenido un buen comienzo, pero qué tan lejos
¿Es seguro hacer planes?
Una famosa presentación realizada por Peter Norvig, director de Google
investigación, llevaba el título "La eficacia irrazonable de los datos" y
entusiasmado acerca de "cómo miles de millones de puntos de datos triviales pueden conducir a
comprensión." Los medios de comunicación nos dicen constantemente que vivimos en una "era de
big data ”, cuando las computadoras pueden examinar esos miles de millones de puntos de datos y
encontrar patrones invisibles a simple vista. Pero a menudo los problemas más
relacionados con la vida humana diaria están en el extremo opuesto. Nuestros dias estan llenos
de "datos pequeños". De hecho, como Gott frente al Muro de Berlín, a menudo tenemos
para hacer una inferencia a partir de la menor cantidad de datos que podamos
tener: una sola observación.
Entonces, ¿Cómo lo hacemos? ¿Y cómo deberíamos ?
La historia comienza en la Inglaterra del siglo XVIII, en un dominio de investigación.
irresistible para las grandes mentes matemáticas de la época, incluso las del
clero: juegos de azar.
Razonamiento al revés con el reverendo Bayes
Por lo tanto, si nos comprometemos con argumentos para confiar en el pasado

experiencia, y convertirlo en el estándar de nuestro juicio futuro, estos
los argumentos deben ser probables solamente.
—DAVID HUME
Hace más de 250 años, la cuestión de hacer predicciones desde pequeños

Los datos pesaban mucho en la mente del reverendo Thomas Bayes, un
Ministro presbiteriano en la encantadora ciudad balneario de Tunbridge Wells,
Inglaterra.
Si compramos diez boletos para un sorteo nuevo y desconocido, imaginó Bayes,
y cinco de ellos ganan premios, entonces parece relativamente fácil estimar el
Página 171
Posibilidades de ganar en la rifa: 5/10 o 50%. Pero, ¿y si compramos uno solo?

boleto y gana un premio? ¿Realmente imaginamos la probabilidad de ganar?
ser 1/1 o 100%? Eso parece demasiado optimista. ¿Lo es? Y si es así, por cómo
¿mucho? ¿Qué deberíamos adivinar realmente?
Para alguien que ha tenido tal impacto en la historia del razonamiento
bajo incertidumbre, la propia historia de Bayes sigue siendo irónicamente incierta. Él era
nacido en 1701, o tal vez en 1702, en el condado inglés de Hertfordshire, o
tal vez fue Londres. Y en 1746, '47, '48 o '49 escribiría
uno de los artículos más influyentes en todas las matemáticas, abandónalo
inédito, y pasar a otras cosas.
Entre esos dos eventos tenemos un poco más de certeza. El hijo de un
ministro, Bayes fue a la Universidad de Edimburgo para estudiar teología, y
fue ordenado como su padre. Tenía conocimientos matemáticos y teológicos.
intereses, y en 1736 escribió una apasionada defensa de la
“cálculo” novedoso en respuesta a un ataque del obispo George Berkeley.
Este trabajo resultó en su elección en 1742 como miembro de la Royal Society,
a quien se le recomendó como "un caballero ... muy hábil en
Geometría y todas las partes del aprendizaje matemático y filosófico ".
Después de la muerte de Bayes en 1761, se le pidió a su amigo Richard Price que revisara
sus artículos matemáticos para ver si contenían algún material publicable.
Price se encontró con un ensayo en particular que lo emocionó, uno que dijo "tiene
gran mérito, y merece ser preservado ". El ensayo se refería exactamente al
tipo de problema de rifa en discusión:
Imaginemos entonces a una persona presente en el sorteo de una lotería, que no sabe nada de su
esquema o de la proporción de espacios en blanco a premios en él. Supongamos además que él es
obligado a inferir esto a partir del número de espacios en blanco que oye dibujados en comparación con el número de
premios ; y que se pregunte qué conclusiones en estas circunstancias puede razonablemente
hacer.
La visión crítica de Bayes fue que tratar de usar los boletos ganadores y perdedores
que vemos para averiguar el grupo de tickets general del que provienen es
esencialmente razonando al revés. Y para hacer eso, argumentó, primero debemos
razón por delante de las hipotéticas. En otras palabras, primero necesitamos
Página 172
determinar qué tan probable es que hubiéramos extraído los boletos que hicimos si
varios escenarios eran ciertos. Esta probabilidad, conocida por los modernos
estadísticos como la "probabilidad": nos da la información que necesitamos para resolver
el problema.
Por ejemplo, imagina que compramos tres boletos y los tres fueron
ganadores. Ahora bien, si el sorteo fue del tipo particularmente generoso en el que todos
los boletos son ganadores, entonces nuestra experiencia de tres por tres, por supuesto,
suceden todo el tiempo; tiene un 100% de posibilidades en ese escenario. Si, en cambio,
solo la mitad de los boletos de la rifa fueron ganadores, nuestra experiencia de tres por tres
sucedería 1 ⁄ 2 × 1 ⁄ 2 × 1 ⁄ 2 del tiempo, o en otras palabras 1 ⁄ 8 del tiempo.
Y si la rifa recompensara solo un boleto entre mil, nuestro resultado sería
han sido increíblemente improbables: 1 ⁄ 1,000 × 1 ⁄ 1,000 × 1 ⁄ 1,000 , o uno en mil millones.
Bayes argumentó que, en consecuencia, deberíamos juzgarlo como más probable
que todos los boletos de la rifa son ganadores que la mitad de ellos, y a su vez
Es más probable que la mitad de ellos lo sea que que solo uno de cada mil lo sea.
Quizás ya lo habíamos intuido, pero la lógica de Bayes nos ofrece la
capacidad para cuantificar esa intuición. En igualdad de condiciones, deberíamos imaginar
es exactamente ocho veces más probable que todos los boletos sean ganadores que eso
la mitad lo son, porque los boletos que sacamos son exactamente ocho veces
más probable (100% frente a uno de cada ocho) en ese escenario. Asimismo, es exactamente
125 millones de veces más probable que la mitad de los boletos de la rifa sean ganadores.
solo hay un boleto ganador por cada mil, que sabemos al comparar
de uno en ocho a uno en mil millones.
Este es el meollo del argumento de Bayes. Razonamiento hacia adelante desde
pasados hipotéticos sientan las bases para que luego trabajemos hacia atrás
el más probable.
Fue un enfoque ingenioso e innovador, pero no logró
dar una respuesta completa al problema de la rifa. Al presentar los resultados de Bayes a
la Royal Society, Price pudo establecer que si compra una sola rifa
boleto y es un ganador, entonces hay un 75% de probabilidad de que al menos la mitad del
los boletos son ganadores. Pero pensar en las probabilidades de las probabilidades puede
dar vueltas un poco la cabeza. Es más, si alguien nos presiona: "Bueno, está bien,
Página 173
pero ¿cuáles crees que son realmente las probabilidades de la rifa ? " todavía no lo sabríamos
quéLa
decir.
respuesta a esta pregunta: cómo destilar todos los posibles
hipótesis en una única expectativa específica, sólo se descubriría una
unos años más tarde, por el matemático francés Pierre-Simon Laplace.
Ley de Laplace
Laplace nació en Normandía en 1749, y su padre lo envió a un

Escuela católica con la intención de que se uniera al clero. Laplace pasó a
estudió teología en la Universidad de Caen, pero a diferencia de Bayes, quien equilibró
devociones espirituales y científicas durante toda su vida; finalmente abandonó
la tela enteramente para matemáticas.
En 1774, completamente inconsciente del trabajo anterior de Bayes, Laplace
publicó un artículo ambicioso llamado "Tratado sobre la probabilidad de la
Causas de los eventos ". En él, Laplace finalmente resolvió el problema de cómo hacer
inferencias hacia atrás desde los efectos observados hasta sus causas probables.
Bayes, como vimos, había encontrado una manera de comparar la probabilidad relativa
de una hipótesis a otra. Pero en el caso de una rifa, hay literalmente una
número infinito de hipótesis: una por cada proporción concebible de
boletos ganadores. Usando el cálculo, las matemáticas una vez controvertidas de
Bayes había sido un importante defensor, Laplace pudo demostrar
que este amplio espectro de posibilidades se podría resumir en un solo
estimación, y una asombrosamente concisa en eso. Si realmente no sabemos nada
sobre nuestro sorteo antes de tiempo, mostró, luego, después de sacar un ganador
boleto en nuestro primer intento, deberíamos esperar que la proporción de ganancias
entradas en toda la piscina es exactamente 2/3. Si compramos tres boletos y todos
si son ganadores, la proporción esperada de boletos ganadores es exactamente 4/5.
De hecho, para cualquier posible sorteo de w boletos ganadores en n intentos, el
La expectativa es simplemente el número de victorias más uno, dividido por el número
de intentos más dos: ( w +1) ⁄ ( n +2) .
Este esquema increíblemente simple para estimar probabilidades se conoce como
Ley de Laplace , y es fácil de aplicar en cualquier situación en la que necesite
Página 174
evaluar las posibilidades de un evento basado en su historia. Si haces diez intentos

en algo y cinco de ellos tienen éxito, la ley de Laplace estima su
las posibilidades generales de ser del 6/12 o del 50%, de acuerdo con nuestras intuiciones. Si intentas
sólo una vez y funciona, la estimación de Laplace de 2/3 es más
razonable que asumir que siempre ganarás, y más procesable que
La guía de Price (que nos diría que hay una metaprobabilidad del 75% de
un 50% o más de posibilidades de éxito).
Laplace pasó a aplicar su enfoque estadístico a una amplia gama de
problemas de su tiempo, incluida la evaluación de si los bebés son realmente igualmente
probablemente nazca hombre o mujer. (Estableció, con una certeza virtual, que
de hecho, los bebés varones son un poco más propensos que las mujeres).
escribió el Ensayo filosófico sobre probabilidades , posiblemente el primer libro
acerca de la probabilidad para una audiencia general y sigue siendo uno de los mejores, presentando
su teoría y considerando sus aplicaciones al derecho, las ciencias y
la vida cotidiana.
La ley de Laplace nos ofrece la primera regla empírica simple para confrontar
pequeños datos en el mundo real. Incluso cuando hemos hecho solo unos pocos
observaciones, o sólo una, nos ofrece una guía práctica. Querer
calcular la probabilidad de que su autobús llegue tarde? La posibilidad de que su equipo de softbol
¿ganar? Cuente el número de veces que ha sucedido en el pasado más uno, luego
dividir por el número de oportunidades más dos. Y la belleza de
La ley de Laplace es que funciona igualmente bien si tenemos un solo dato
punto o millones de ellos. La fe de la pequeña Annie en que el sol saldrá
El mañana está justificado, nos dice: con una Tierra que ha visto salir el sol durante
alrededor de 1,6 billones de días seguidos, la posibilidad de otro amanecer en el próximo
"Intento" es prácticamente indistinguible del 100%.
Regla de Bayes y creencias previas
Todas estas suposiciones son consistentes y concebibles. Por qué deberíamos

dar preferencia a uno, que no es más consistente o concebible
que el resto?
Página 175
—DAVID HUME
Laplace también consideró otra modificación al argumento de Bayes de que

resultaría crucial: cómo manejar hipótesis que son simplemente más
probable que otros. Por ejemplo, si bien es posible que una lotería
regalar premios al 99% de las personas que compran boletos, es más probable:
supondríamos que regalarían premios a sólo el 1%. Ese
La suposición debe reflejarse en nuestras estimaciones.
Para concretar las cosas, digamos que un amigo te muestra dos
monedas Una es una moneda normal, "justa" con una probabilidad de 50 a 50 de cara y cruz;
la otra es una moneda de dos cabezas. Los deja caer en una bolsa y luego saca uno
fuera al azar. Lo voltea una vez: cabezas. ¿Qué moneda crees que es tu amigo?
volteado?
El esquema de Bayes de trabajar hacia atrás simplifica esta cuestión.
Un lanzamiento de cara ocurre el 50% de las veces con una moneda justa y el 100%
del tiempo con una moneda de dos cabezas. Por lo tanto, podemos afirmar con confianza que es
100% ⁄ 50% , o exactamente el doble de probable, que el amigo había sacado el
moneda de dos cabezas.

Ahora considere el siguiente giro. Esta vez, el amigo te muestra nueve
monedas justas y una moneda de dos cabezas, pone las diez en una bolsa, saca una
aleatorio, y lo voltea: cabezas. ¿Ahora qué supones? ¿Es una moneda justa o
el de dos cabezas?
El trabajo de Laplace anticipó esta arruga, y aquí nuevamente la respuesta es
impresionantemente simple. Como antes, una moneda justa tiene exactamente la mitad de probabilidade
cara arriba como una moneda de dos cabezas. Pero ahora, una moneda justa también es nueve veces má
probablemente haya sido dibujado en primer lugar. Resulta que solo podemos tomar
estas dos consideraciones diferentes y multiplíquelas juntas: es exactamente
cuatro veces y media más probable que su amigo tenga una moneda justa que
el de dos cabezas.
La fórmula matemática que describe esta relación, uniendo
nuestras ideas previamente sostenidas y la evidencia ante nuestros ojos, ha llegado a ser
conocido, irónicamente, ya que Laplace hizo el verdadero trabajo pesado, como
Regla de Bayes . Y ofrece una solución notablemente sencilla a la
Página 176
problema de cómo combinar creencias preexistentes con evidencia observada:

multiplique sus probabilidades juntos.
En particular, tener algunas creencias preexistentes es crucial para que esta fórmula
trabaja. Si tu amigo simplemente se te acerca y te dice: "Lancé una moneda al aire
de esta bolsa y salió cara. ¿Qué tan probable crees que es que esto sea
¿una moneda justa? ”, sería totalmente incapaz de responder esa pregunta a menos que
para empezar, tenías al menos alguna idea de las monedas que había en la bolsa.
(No puedes multiplicar las dos probabilidades juntas cuando no tienes una
de ellos.) Este sentido de lo que estaba "en la bolsa" antes del lanzamiento de la moneda: el
posibilidades de que cada hipótesis haya sido cierta antes de ver los datos, es
conocido como las probabilidades previas, o "antes" para abreviar. Y la regla de Bayes
siempre necesita algo de usted, incluso si es solo una suposición. Cuantos
existen monedas de dos cabezas? ¿Qué tan fáciles son de conseguir? Que tan tramposo
es tu amigo, de todos modos?
El hecho de que la regla de Bayes dependa del uso de priores tiene en
ciertos puntos de la historia han sido considerados controvertidos, sesgados, incluso
no científico. Pero en realidad, es bastante raro entrar en una situación tan totalmente
desconocemos que nuestra mente es efectivamente una pizarra en blanco, un punto al que volveremos
momentáneamente.
Cuando tenga alguna estimación de probabilidades previas, mientras tanto,
La regla de Bayes se aplica a una amplia gama de problemas de predicción, ya sean de
variedad de datos grandes o el tipo más común de datos pequeños. Computando el
La probabilidad de ganar un sorteo o de lanzar caras es solo el comienzo. los
Los métodos desarrollados por Bayes y Laplace pueden ofrecer ayuda en cualquier momento
incertidumbre y algunos datos con los que trabajar. Y esa es exactamente la situación
que enfrentamos cuando intentamos predecir el futuro.
El principio copernicano
Es difícil hacer predicciones, especialmente sobre el futuro.

—Proverbio danés
Página 177
Cuando J. Richard Gott llegó al Muro de Berlín, se preguntó a sí mismo un

pregunta simple: ¿Dónde estoy? Es decir, donde en la vida total de
este artefacto se me ha ocurrido llegar? En cierto modo, le estaba pidiendo al temporal
versión de la cuestión espacial que había obsesionado al astrónomo Nicolás
Copérnico cuatrocientos años antes: ¿Dónde estamos? Donde en el
el universo es la tierra? Copérnico haría el cambio radical de paradigma de
imaginar que la Tierra no era el centro del centro del universo, que
de hecho, no era un lugar especial en particular. Gott decidió tomar lo mismo
paso con respecto al tiempo.
Hizo la suposición de que el momento en que se encontró con el
El Muro de Berlín no era especial, era igualmente probable que ocurriera en cualquier momento de
la vida útil total del muro. Y si cualquier momento era igualmente probable, entonces el
promedio, su llegada debería haber sido precisamente en el punto medio (ya que
tenía un 50% de probabilidades de caer antes de la mitad y un 50% de probabilidades de caer después). M
en general, a menos que sepamos mejor, podemos esperar haber aparecido con precisión
a la mitad de la duración de cualquier fenómeno dado. * Y si asumimos
que estamos llegando precisamente a la mitad de la duración de algo, el mejor
Supongo que podemos calcular cuánto tiempo durará en el futuro.
obvio: exactamente el tiempo que ya ha durado . Gott vio el muro de Berlín
ocho años después de su construcción, por lo que su mejor suposición fue que representaría
ocho años más. (Terminó siendo veinte).
Este razonamiento sencillo, que Gott denominó el copernicano
Principio , da como resultado un algoritmo simple que se puede utilizar para hacer
predicciones sobre todo tipo de temas. Sin expectativas preconcebidas,
podríamos usarlo para obtener predicciones para el final no solo del Muro de Berlín
pero muchos otros fenómenos de corta y larga duración. El copernicano
El principio predice que los Estados Unidos de América perdurarán como nación
hasta aproximadamente el año 2255, que Google durará hasta aproximadamente el 2032,
y que la relación que tu amigo comenzó hace un mes probablemente durará
alrededor de otro mes (tal vez dígale que no confirme su asistencia a esa boda
invitación todavía). Asimismo, nos dice que seamos escépticos cuando, por ejemplo, un
La portada reciente del New Yorker muestra a un hombre sosteniendo un teléfono inteligente de seis pulg
una cuadrícula familiar de íconos de aplicaciones cuadrados, y el título dice "2525". Dudoso.
Página 178
El smartphone tal como lo conocemos apenas tiene una década, y el copernicano
El principio nos dice que no es probable que exista en 2025, y mucho menos cinco
siglos después. Para el 2525 sería un poco sorprendente si hubiera incluso un Nuevo
Ciudad de York.
De manera más práctica, si estamos considerando un empleo en un sitio de construcción
cuya señalización indica que han pasado “7 días desde la última
accidente ", es posible que queramos mantenernos alejados, a menos que sea un trabajo particularmente
planeamos hacer. Y si un sistema de transporte municipal no puede pagar el
Señales en tiempo real increíblemente útiles pero costosas que les indican a los pasajeros cuándo
va a llegar el autobús, el principio copernicano sugiere que podría haber
una alternativa dramáticamente más simple y más barata. Simplemente mostrando cuánto tiempo
Ha pasado desde que el autobús anterior llegó a esa parada ofrece una pista sustancial
acerca de cuándo lo hará el próximo.
Pero, ¿es correcto el principio de Copérnico? Después de que Gott publicó su
conjetura en Nature , la revista recibió una oleada de críticas
correspondencia. Y es fácil ver por qué cuando intentamos aplicar la regla a
algunos ejemplos más familiares. Si conoce a un hombre de 90 años, el
El principio copernicano predice que vivirá hasta los 180 años. Cada niño de 6 años,
mientras tanto, se predice que enfrentará una muerte prematura a la tierna edad de 12 años.
Para comprender por qué funciona el principio copernicano y por qué
a veces no, tenemos que volver a Bayes. Porque a pesar de su aparente
simplicidad, el principio copernicano es realmente un ejemplo de la regla de Bayes.
Bayes se encuentra con Copérnico
Al predecir el futuro, como la longevidad del Muro de Berlín, el

hipótesis que necesitamos evaluar son todas las posibles duraciones de la
fenómeno en cuestión: ¿durará una semana, un mes, un año, una década? Para
aplicar la regla de Bayes, como hemos visto, primero necesitamos asignar una
probabilidad a cada una de estas duraciones. Y resulta que el copernicano
El principio es exactamente lo que resulta de aplicar la regla de Bayes usando lo que es
conocido como un previo no informativo .
Página 179
Al principio, esto puede parecer una contradicción de términos. Si la regla de Bayes

siempre requiere que especifiquemos nuestras expectativas y creencias previas, ¿cómo podría
le decimos que no tenemos ninguno? En el caso de una rifa, una forma de alegar
ignorancia sería asumir lo que se llama el "uniforme previo", que
considera que todas las proporciones de boletos ganadores son igualmente probables. * En el
caso del Muro de Berlín, un antecedente poco informativo significa decir que no
saber algo sobre el lapso de tiempo que estamos tratando de predecir: el muro podría
igualmente bien bajará en los próximos cinco minutos o durará cinco milenios.
Aparte de ese anterior poco informativo, el único dato que proporcionamos a
La regla de Bayes, como hemos visto, es el hecho de que nos hemos encontrado con el Berlín
Muro cuando tiene ocho años. Cualquier hipótesis que hubiera predicho un
De este modo, se descarta inmediatamente una vida útil inferior a ocho años para la pared,
ya que esas hipótesis no pueden explicar nuestra situación en absoluto. (Del mismo modo, un
La moneda de dos cabezas se descarta por la primera aparición de cruz).
más de ocho años está dentro del ámbito de la posibilidad, pero si el muro
iban a existir durante un millón de años, sería una gran coincidencia
que nos topamos con él tan cerca del comienzo de su existencia.
Por lo tanto, aunque no se pueden descartar períodos de vida enormemente largos,
tampoco son muy probables.
Cuando la regla de Bayes combina todas estas probabilidades, la más probable
breves períodos de tiempo empujando hacia abajo el pronóstico promedio, el menos probable aún
todavía posibles largos empujándolo hacia arriba, el Principio Copernicano emerge: si
queremos predecir cuánto durará algo, y no tenemos otro
conocimiento al respecto, la mejor suposición que podemos hacer es que
continúe mientras haya continuado hasta ahora.
De hecho, Gott ni siquiera fue el primero en proponer algo como el
Principio copernicano. A mediados del siglo XX, el estadístico bayesiano
Harold Jeffreys había estudiado la posibilidad de determinar el número de tranvías en un
ciudad dada el número de serie en un solo tranvía, y se le ocurrió el mismo
respuesta: doble el número de serie. Y había surgido un problema similar incluso
antes, durante la Segunda Guerra Mundial, cuando los Aliados intentaron estimar el número
de tanques producidos por Alemania. Estimaciones puramente matemáticas basadas
en los números de serie de los tanques capturados predijo que los alemanes estaban
Página 180
produciendo 246 tanques cada mes, mientras que las estimaciones obtenidas por extensos
(y altamente arriesgado) reconocimiento aéreo sugirió que la figura era más como
1.400. Después de la guerra, los registros alemanes revelaron la cifra real: 245.
Reconociendo que el principio copernicano es solo la regla de Bayes con un
El previo no informativo responde a muchas preguntas sobre su validez. los
El principio copernicano parece razonable exactamente en aquellas situaciones en las que
no saben nada en absoluto, como mirar el Muro de Berlín en 1969, cuando
ni siquiera estamos seguros de cuál es la escala de tiempo adecuada. Y se siente completamente
mal en aquellos casos en los que no sabe algo sobre el tema
importar. Predecir que un hombre de 90 años vivirá hasta 180 años parece
irrazonable precisamente porque nos adentramos en el problema sabiendo ya un
mucho sobre la duración de la vida humana, por lo que podemos hacerlo mejor. Cuanto más rico es el an
información que aportamos a la regla de Bayes, más útiles serán las predicciones
puede salir de ella.
Priores del mundo real ...
En el sentido más amplio, hay dos tipos de cosas en el mundo: cosas que
tienden a (o se agrupan en torno a) algún tipo de valor "natural", y las cosas
que no.
La esperanza de vida humana está claramente en la primera categoría. Ellos aproximadamente
seguir lo que se denomina una distribución "normal", también conocida como la
Distribución "gaussiana", según el matemático alemán Carl Friedrich
Gauss, e informalmente llamada "curva de campana" por su forma característica.
Esta forma hace un buen trabajo al caracterizar la duración de la vida humana; la media
La esperanza de vida de los hombres en los Estados Unidos, por ejemplo, se centra en aproximadamente
años, y las probabilidades caen bastante bruscamente a ambos lados. Normal
Las distribuciones tienden a tener una sola escala apropiada: una vida útil de un dígito es
considerado trágico, uno de tres dígitos extraordinario. Muchas otras cosas en el
mundo natural se distribuyen normalmente también, desde la altura humana, el peso,
y la presión arterial a la temperatura del mediodía en una ciudad y el diámetro
de frutos en un huerto.
Página 181
Hay una serie de cosas en el mundo que no se ven normalmente.

distribuido, sin embargo, no por mucho. La población media de una ciudad
en los Estados Unidos, por ejemplo, es de 8.226. Pero si tuvieras que hacer un gráfico
del número de ciudades por población, no verías nada ni remotamente
como una curva de campana. Habría muchas más ciudades más pequeñas que 8.226 que
más grande. Al mismo tiempo, los más grandes serían mucho más grandes que los
promedio. Este tipo de patrón tipifica lo que se llama "ley de potencias
distribuciones ". También se conocen como "distribuciones sin escala" porque
caracterizan cantidades que pueden oscilar plausiblemente en muchas escalas: una
ciudad puede tener decenas, cientos, miles, decenas de miles, cientos de
miles o millones de residentes, por lo que no podemos precisar un solo valor para
qué tan grande debería ser una ciudad "normal".
La distribución de la ley de potencias caracteriza una serie de fenómenos en
vida cotidiana que tienen la misma calidad básica que las poblaciones de la ciudad: la mayoría
cosas por debajo de la media, y algunas enormes por encima de ella. Caja de película
los ingresos brutos de la oficina, que pueden oscilar entre cuatro y diez cifras, son otra
ejemplo. La mayoría de las películas no generan mucho dinero, pero ocasionalmente
Titanic produce ... bueno, cantidades titánicas.
De hecho, el dinero en general es un dominio lleno de leyes de poder. Ley de potencia
las distribuciones caracterizan tanto la riqueza como los ingresos de las personas. los
el ingreso medio en Estados Unidos, por ejemplo, es de $ 55,688, pero debido a que el ingreso es
aproximadamente distribuida por ley de potencia, sabemos, de nuevo, que muchas más personas
estar por debajo de esta media que por encima de ella, mientras que los que están arriba podrían ser
prácticamente fuera de serie. Así es: dos tercios de la población de EE. UU. Ganan menos
que la renta media, pero el 1% superior gana casi diez veces la media. Y
el 1% superior de la 1% hace diez veces más que eso.
A menudo se lamenta que "los ricos se hacen más ricos" y, de hecho, el proceso de
El "apego preferencial" es una de las formas más seguras de producir una ley de poder
distribución. Los sitios web más populares son los que tienen más probabilidades de recibir información
Enlaces; las celebridades en línea más seguidas son las que tienen más probabilidades de ganar
nuevos fans; las firmas más prestigiosas son las que tienen más probabilidades de atraer nuevos
clientela; las ciudades más grandes son las que tienen más probabilidades de atraer nuevos residentes. E
en todos los casos, resultará una distribución de la ley de potencias.
Página 182
La regla de Bayes nos dice que cuando se trata de hacer predicciones basadas en
evidencia limitada, pocas cosas son tan importantes como tener buenos antecedentes, que
es decir, un sentido de la distribución a partir de la cual esperamos que la evidencia tenga
venir. Por tanto, las buenas predicciones comienzan con tener buenos instintos sobre cuándo
estamos tratando con una distribución normal y cuando con una ley de potencias
distribución. Resulta que la regla de Bayes nos ofrece un método simple pero
regla empírica predictiva dramáticamente diferente para cada uno.
... y sus reglas de predicción
¿Quiso decir "esto podría continuar para siempre" en el buen sentido?

—BEN LERNER
Examinando el principio copernicano, vimos que cuando la regla de Bayes es

dado un antecedente no informativo, siempre predice que la vida útil total de un
El objeto tendrá exactamente el doble de su edad actual. De hecho, lo poco informativo
anterior, con sus posibles escalas tremendamente variables, el muro que podría durar
meses o milenios— es una distribución de ley de potencia. Y para cualquier poder
distribución de la ley, la regla de Bayes indica que la predicción adecuada
La estrategia es una regla multiplicativa: multiplique la cantidad observada hasta ahora por
algún factor constante. Para un previo no informativo, ese factor constante
pasa a ser 2, de ahí la predicción copernicana; en otros casos de leyes de poder,
el multiplicador dependerá de la distribución exacta con la que esté trabajando.
Para los ingresos brutos de las películas, por ejemplo, resulta ser alrededor de 1.4. Así que si usted
escuche que una película ha ganado $ 6 millones hasta ahora, puede adivinar que hará aproximadament
$ 8.4 millones en total; si ha ganado $ 90 millones, supongo que alcanzará un máximo de $ 126
millón.
Esta regla multiplicativa es una consecuencia directa del hecho de que el poder
Las distribuciones de la ley no especifican una escala natural para el fenómeno que están
describiendo. Lo único que nos da un sentido de escala para nuestra predicción,
por lo tanto, es el único punto de datos que tenemos, como el hecho de que Berlín
Wall se ha mantenido en pie durante ocho años. Cuanto mayor sea el valor de ese único punto de datos,
cuanto mayor sea la escala con la que probablemente estemos tratando, y viceversa. Es
Página 183
posible que una película que ha recaudado $ 6 millones sea en realidad un éxito de taquilla en
su primera hora de lanzamiento, pero es mucho más probable que sea de un solo dígito
millones de películas.
Cuando aplicamos la regla de Bayes con una distribución normal a priori, en
por otro lado, obtenemos un tipo de orientación muy diferente. En lugar de un
regla multiplicativa, obtenemos una regla promedio : use la distribución "natural"
promedio, su escala única y específica, como guía. Por ejemplo, si
alguien es más joven que el promedio de vida, entonces simplemente prediga el
promedio; a medida que su edad se acerca y luego excede el promedio, predice que
vivirán unos años más. Seguir esta regla da una
predicciones para el niño de 90 años y el de 6 años: 94 y 77, respectivamente.
(El niño de 6 años obtiene una pequeña ventaja sobre el promedio de la población de 76 en virtud de
de haber sobrevivido a la infancia: sabemos que no está en la distribución
cola izquierda.)
Los tiempos de ejecución de películas, como las vidas humanas, también siguen un ritmo normal.
distribución: la mayoría de las películas se agrupan alrededor de unos cien minutos, con
un número cada vez menor de excepciones disminuyendo a ambos lados. Pero no todos
las actividades humanas se comportan muy bien. El poeta Dean Young una vez comentó
que cada vez que escucha un poema en secciones numeradas, su corazón se hunde
si el lector anuncia el inicio de la sección cuatro: si hay más de tres
partes, todas las apuestas están canceladas, y Young necesita agacharse para escuchar. Eso
resulta que la consternación de Young es, de hecho, perfectamente bayesiana. Un análisis de
poemas muestra que, a diferencia de los tiempos de proyección de películas, los poemas siguen algo
más cerca de una ley de potencia que una distribución normal: la mayoría de los poemas son cortos, pero
algunos son épicos. Entonces, cuando se trata de poesía, asegúrate de tener un
asiento cómodo. Algo distribuido normalmente que aparentemente ha sucedido
demasiado tiempo terminará pronto; pero cuanto más largo es algo en una ley de potencias
la distribución ha continuado, más tiempo puede esperar que continúe.
Entre esos dos extremos, en realidad hay una tercera categoría de cosas
en la vida: aquellos que no tienen ni más ni menos probabilidades de terminar solo porque
han continuado por un tiempo. A veces las cosas son simplemente ... invariables. los
El matemático danés Agner Krarup Erlang, que estudió tales fenómenos,
formalizó la extensión de los intervalos entre eventos independientes en el
Página 184
función que ahora lleva su nombre: la distribución Erlang. La forma de

esta curva difiere tanto de la normal como de la ley de potencia: tiene una forma de ala
contorno, elevándose a una suave joroba, con una cola que se cae más rápido que un
ley de potencias, pero más lentamente que una distribución normal. El mismo Erlang,
trabajando para la Compañía Telefónica de Copenhague a principios del siglo XX
siglo, lo usó para modelar cuánto tiempo se podía esperar que pasara entre
sucesivas llamadas en una red telefónica. Desde entonces, la distribución de Erlang ha
También ha sido utilizado por urbanistas y arquitectos para modelar coches y peatones.
tráfico, y por ingenieros de redes que diseñan la infraestructura para el
Internet. También hay varios dominios en el mundo natural, donde
Los eventos son completamente independientes entre sí y los intervalos
entre ellos caen así en una curva de Erlang. La desintegración radiactiva es una
ejemplo, lo que significa que la distribución de Erlang modela perfectamente cuándo
espere los próximos tics de un contador Geiger. También resulta hacer un bonito
buen trabajo al describir ciertos esfuerzos humanos, como la cantidad de
tiempo que los políticos permanecen en la Cámara de Representantes.
La distribución de Erlang nos da un tercer tipo de regla de predicción, la
Regla aditiva : predice siempre que las cosas seguirán en una cantidad constante
más extenso. El estribillo familiar de "¡Solo cinco minutos más! ... [ cinco minutos
más tarde ] ¡Cinco minutos más! " que tan a menudo caracteriza los reclamos humanos
con respecto a, digamos, la disposición de uno para salir de la casa u oficina, o el tiempo hasta
la finalización de alguna tarea, puede parecer indicativo de algún fallo crónico
para hacer estimaciones realistas. Bueno, en los casos en los que uno se enfrenta a un
Distribución de Erlang, de todos modos, ese estribillo resulta ser correcto.
Si un entusiasta de los juegos de cartas del casino le dice a su cónyuge impaciente, por
ejemplo, que dejará el día después de jugar un blackjack más (el
probabilidades de que sean de 20 a 1), podría predecir alegremente: "Terminaré en
¡unas veinte manos más! " Si, después de veinte manos desafortunadas, regresa,
preguntando cuánto tiempo la hará esperar ahora , su respuesta será
sin cambios: "¡Terminaré en unas veinte manos más!" Suena como nuestro
El infatigable tiburón de las cartas ha sufrido una pérdida de memoria a corto plazo, pero en
de hecho, su predicción es completamente correcta. De hecho, las distribuciones que producen el
Página 185
misma predicción, sin importar su historia o estado actual, se sabe que

estadísticos como "sin memoria".
Página 187
186
Diferentes distribuciones previas y sus reglas de predicción.
Estos tres patrones muy diferentes de predicción óptima: el

Reglas de multiplicación, promedios y aditivos: todas resultan directamente de
aplicar la regla de Bayes a las distribuciones de ley de potencia, normal y Erlang,
respectivamente. Y dada la forma en que salen esas predicciones, las tres
Las distribuciones también nos ofrecen una guía diferente sobre cuán sorprendidos deberíamos
ser por ciertos eventos.
En una distribucin de ley de potencia, cuanto ms tiempo ha pasado algo, el
más tiempo esperamos que continúe . Entonces, un evento de ley de potencia es más
sorprendente cuanto más lo hemos estado esperando, y sorprende al máximo
justo antes de que suceda. Una nación, corporación o institución solo crece
más venerable con cada año que pasa, por lo que siempre es sorprendente cuando
colapsa.
En una distribución normal, los eventos son sorprendentes cuando son tempranos, ya que
esperábamos que alcanzaran el promedio, pero no cuando llegan tarde. En efecto,
en ese momento parece que están atrasados, por lo que cuanto más esperemos, más
los esperamos.
Y en una distribución de Erlang, los eventos por definición nunca son más o
menos sorprendente sin importar cuándo ocurran. Cualquier estado de cosas es siempre
igualmente probable que termine independientemente de cuánto tiempo haya durado. No es de extrañar
los políticos siempre están pensando en sus próximas elecciones.
El juego se caracteriza por un tipo similar de expectativa de estado estable.
Si espera, digamos, una victoria en la rueda de la ruleta se caracteriza por una
distribución normal, entonces se aplicaría la regla del promedio: después de una racha de
suerte, te diría que tu número debería aparecer en cualquier segundo, probablemente
seguido de más giros perdedores. (En ese caso, tendría sentido seguir adelante
siguiente victoria y luego renunciar) .Si, en cambio, la espera de una victoria obedeciera a una
distribución de la ley, entonces la regla multiplicativa le diría que ganar
los giros se suceden rápidamente, pero cuanto más se prolonga una sequía
más probablemente continuaría. (En ese escenario, tendrías razón en
sigue jugando por un tiempo después de cualquier victoria, pero ríndete después de una racha perdedora
Página 188
contra una distribución sin memoria, sin embargo, está atascado. El aditivo
La regla te dice que la posibilidad de ganar ahora es la misma que hace una hora,
y lo mismo que será dentro de una hora. Nada cambia. Estás
no recompensado por sobresalir y terminar con una nota alta; tampoco hay un
punto de inflexión en el que debería reducir sus pérdidas. En "El jugador",
Kenny Rogers advirtió que hay que "saber cuándo caminar
distancia / saber cuándo ejecutar”, pero para una distribución sin memoria, no es ningún
momento adecuado para dejar de fumar. Esto puede explicar en parte la adicción de estos juegos.
Saber a qué distribución se enfrenta puede hacer que todas las
diferencia. Cuando el biólogo de Harvard y prolífico divulgador de la ciencia
Stephen Jay Gould descubrió que tenía cáncer, su impulso inmediato
fue leer la literatura médica relevante. Entonces descubrió por qué su
los médicos lo habían disuadido de hacerlo: la mitad de todos los pacientes con su
forma de cáncer murió dentro de los ocho meses posteriores al descubrimiento.
Pero esa estadística, ocho meses, no le dijo nada sobre el
distribución de supervivientes. Si fuera una distribución normal, entonces el promedio
Rule daría un pronóstico bastante claro de cuánto tiempo podría esperar vivir:
unos ocho meses. Pero si fuera una ley de potencia, con una cola que se extiende mucho
hacia la derecha, entonces la situación sería muy diferente: el
La regla multiplicativa le diría que cuanto más vivía, más
evidencia que proporcionaría que viviría más tiempo. Leyendo más, Gould
descubrió que "la distribución era de hecho, fuertemente sesgada a la derecha, con un
cola larga (aunque pequeña) que se extendía durante varios años por encima de los ocho
mediana del mes. No vi ninguna razón por la que no debería estar en esa pequeña cola, y
dio un largo suspiro de alivio ". Gould seguiría viviendo durante veinte
más años después de su diagnóstico.
Pequeños datos y la mente
Las tres reglas de predicción — Multiplicativa, Promedio y Aditiva — son

aplicable en una amplia gama de situaciones cotidianas. Y en esas situaciones
la gente en general resulta ser muy buena en el uso de los
regla de predicción. Cuando estaba en la escuela de posgrado, Tom, junto con el MIT
Página 189
Josh Tenenbaum, realizó un experimento pidiendo a las personas que hicieran predicciones para un
variedad de cantidades cotidianas, como la duración de la vida humana, el
películas y el tiempo que los representantes de EE. UU. pasarían en el cargo
en un solo dato en cada caso: edad actual, dinero ganado
lejos, y años cumplidos hasta la fecha. Luego compararon las predicciones que la gente
hecho a las predicciones dadas aplicando la regla de Bayes a la realidad real
datos mundiales en cada uno de esos dominios.
Al final resultó que, las predicciones que la gente había hecho eran extremadamente
cercanos a los producidos por la Regla de Bayes. Intuitivamente, las personas hicieron diferentes
tipos de predicciones para cantidades que siguieron diferentes distribuciones—
power-law, normal y Erlang, en el mundo real. En otras palabras, mientras
es posible que no sepa o recuerde conscientemente qué situación requiere la
Regla multiplicativa, promedio o aditiva, las predicciones que hace cada
día tienden a reflejar implícitamente los diferentes casos en los que estas distribuciones
aparecen en la vida cotidiana, y las diferentes formas en que se comportan.
A la luz de lo que sabemos acerca de la regla de Bayes, este notable
El desempeño humano sugiere algo crítico que ayuda a comprender
cómo la gente hace predicciones. Los pequeños datos son grandes datos disfrazados. La razón
a menudo podemos hacer buenas predicciones a partir de una pequeña cantidad de observaciones:
o solo uno, es que nuestros antecedentes son tan ricos. Ya sea que lo sepamos o
no, parece que llevamos en la cabeza antecedentes sorprendentemente precisos
sobre los ingresos brutos de las películas y los tiempos de ejecución, la longitud de los poemas y los térmi
oficina, sin mencionar la duración de la vida humana. No necesitamos reunirlos
explícitamente; los absorbemos del mundo.
El hecho de que, en general, las corazonadas de las personas parecen coincidir
predicciones de la regla de Bayes también hace posible la ingeniería inversa de todos
tipos de distribuciones anteriores, incluso aquellas sobre las que es más difícil obtener
datos autorizados del mundo real. Por ejemplo, el cliente lo mantiene en espera
El servicio es una faceta lamentablemente común de la experiencia humana, pero no hay
Conjuntos de datos disponibles públicamente en tiempos de espera como en Hollywood.
Ingresos brutos de taquilla. Pero si las predicciones de las personas se basan en sus
experiencias, podemos utilizar la regla de Bayes para realizar un reconocimiento indirecto
sobre el mundo minando las expectativas de la gente. Cuando Tom y Josh
Página 190
pidió a la gente que prediga los tiempos de espera a partir de un solo punto de datos, los resultados
sugirió que sus sujetos estaban usando la regla multiplicativa: el total
la espera que la gente espera es una y una tercera vez del tiempo que han esperado hasta ahora.
Esto es consistente con tener una distribución de ley de potencias a priori, donde un
Es posible una amplia gama de escalas. Solo espero que no termines en el Titanic
de tiempos de espera. Durante la última década, enfoques como estos han permitido
científicos cognitivos para identificar las distribuciones previas de las personas en una amplia
franja de dominios, desde la visión hasta el lenguaje.
Sin embargo, aquí hay una advertencia crucial. En los casos en los que no tenemos
buenos antecedentes, nuestras predicciones no son buenas. En el estudio de Tom y Josh, por
Por ejemplo, hubo un tema en el que las predicciones de las personas sistemáticamente
divergía de la regla de Bayes: predecir la duración del reinado de Egipto
faraones. (Da la casualidad de que los reinados de los faraones siguen una distribución de Erlang).
La gente simplemente no tenía suficiente exposición diaria para tener una intuición
sentir el rango de esos valores, por lo que sus predicciones, por supuesto, vacilaron.
Las buenas predicciones requieren buenos antecedentes.
Esto tiene varias implicaciones importantes. Nuestros juicios traicionan nuestro
expectativas, y nuestras expectativas traicionan nuestra experiencia. Lo que proyectamos
sobre el futuro revela mucho: sobre el mundo en el que vivimos y sobre nuestro
propio pasado.
Lo que nos dicen nuestras predicciones sobre nosotros mismos
Cuando Walter Mischel ejecutó su famosa "prueba de malvavisco" a principios de

1970, estaba tratando de comprender cómo la capacidad de retrasar la gratificación
se desarrolla con la edad. En una escuela de párvulos en el campus de Stanford, una serie de
Se puso a prueba la fuerza de voluntad de los niños de tres, cuatro y cinco años. Cada niño
se le mostraba una golosina deliciosa, como un malvavisco, y se le decía que el
El adulto que estaba ejecutando el experimento estuvo a punto de salir de la habitación por un tiempo. Si
querían, podían comerse la golosina de inmediato. Pero si esperaban hasta
el experimentador regresó, obtendrían dos golosinas.
Incapaces de resistirse, algunos de los niños se comieron la golosina inmediatamente. Y
algunos de ellos lo aguantaron durante los quince minutos completos más o menos hasta que
Página 191
El experimentador regresó y recibió dos golosinas como prometió. Pero quizás el más
grupo interesante comprendía los que estaban en el medio, los que manejaban
esperar un poco, pero luego se rindió y se comió la golosina.
Estos casos, en los que los niños lucharon poderosamente y sufrieron valientemente,
solo para ceder y perder el malvavisco extra de todos modos, han sido
interpretado como sugerente de una especie de irracionalidad. Si te vas a derrumbar
¿Por qué no ceder inmediatamente y evitar la tortura? Pero todo depende de
en qué tipo de situación los niños creen que se encuentran. Como la Universidad de
Joe McGuire y Joe Kable de Pensilvania han señalado, si la cantidad
El tiempo que tardan los adultos en regresar se rige por una ley de poder
distribución, con largas ausencias que sugieren esperas aún más largas por delante,
entonces, recortar las pérdidas en algún momento puede tener mucho sentido.
En otras palabras, la capacidad de resistir la tentación puede ser, al menos en parte, una
cuestión de expectativas más que de fuerza de voluntad. Si predice que los adultos tienden
para volver después de breves retrasos, algo así como una distribución normal,
debería poder aguantar. La regla promedio sugiere que después de un doloroso
espera, lo que hay que hacer es aguantar: el experimentador debería estar regresando
En cualquier momento. Pero si no tiene idea de la escala de tiempo del
desaparición, consistente con una distribución de ley de potencias, entonces es una
batalla cuesta arriba. La regla multiplicativa sugiere entonces que una espera prolongada es
solo una pequeña fracción de lo que está por venir.
Décadas después de los experimentos originales con malvaviscos, Walter Mischel
y sus colegas regresaron y observaron cómo les estaba yendo a los participantes
en la vida. Sorprendentemente, encontraron que los niños que habían esperado dos
las golosinas se convirtieron en adultos jóvenes que tuvieron más éxito que los demás,
incluso medidos por métricas cuantitativas como sus puntajes SAT. Si el
La prueba de malvavisco trata sobre la fuerza de voluntad, este es un poderoso testimonio de la
impacto que el aprendizaje del autocontrol puede tener en la vida. Pero si la prueba es menor
acerca de la voluntad que de las expectativas, entonces esto dice algo diferente, tal vez más
historia conmovedora.
Un equipo de investigadores de la Universidad de Rochester exploró recientemente
cómo las experiencias anteriores pueden afectar el comportamiento en la prueba del malvavisco.
Antes de que se mencionaran los malvaviscos, los niños del experimento
Página 192
se embarcó en un proyecto de arte. El experimentador les dio algunos mediocres

suministros y prometió volver pronto con mejores opciones. Pero,
sin que ellos lo supieran, los niños fueron divididos en dos grupos. En uno
grupo, el experimentador era confiable y regresó con el mejor arte
suministros según lo prometido. En el otro, ella no era confiable, volviendo con
nada más que disculpas.
El proyecto de arte se completó, los niños pasaron al estándar
prueba de malvavisco. Y aquí, los niños que habían aprendido que el
experimentador no era confiable eran más propensos a comer el malvavisco
antes de que regresara, perdiendo la oportunidad de ganar un segundo premio.
Reprobar la prueba del malvavisco y tener menos éxito en la vida posterior
puede que no se trate de falta de fuerza de voluntad. Podría ser el resultado de creer que
los adultos no son confiables: que no se puede confiar en ellos para cumplir su palabra, que
desaparecen por intervalos de longitud arbitraria. Aprender el autocontrol es
importante, pero es igualmente importante crecer en un entorno donde
los adultos están constantemente presentes y son dignos de confianza.
Priores en la era de la reproducción mecánica
Como si alguien fuera a comprar varios ejemplares del periódico matutino para
asegurarse de que lo que decía era verdad.
—LUDWIG WITTGENSTEIN
Tiene cuidado con lo que lee, porque eso es lo que escribirá. Él es

cuidado con lo que aprende, porque eso es lo que sabrá.
—ANNIE DILLARD
La mejor manera de hacer buenas predicciones, como nos muestra la regla de Bayes, es ser
informado con precisión sobre las cosas que está prediciendo. Es por eso que podemos
hacer un buen trabajo al proyectar la duración de la vida humana, pero se desempeñan mal cuando
pidió estimar los reinados de los faraones.
Página 193
Ser un buen bayesiano significa representar al mundo de la manera correcta.

proporciones: tener buenos antecedentes, debidamente calibrados. En general, para
humanos y otros animales esto sucede naturalmente; como regla, cuando algo
nos sorprende, debería sorprendernos, y cuando no lo hace, no debería sorprendernos.
Incluso cuando acumulamos sesgos que no son objetivamente correctos, todavía
Por lo general, hacemos un trabajo razonable al reflejar la parte específica del mundo que
vivir. Por ejemplo, alguien que viva en un clima desértico podría sobrestimar
la cantidad de arena en el mundo, y alguien que viva en los polos podría
sobrestimar la cantidad de nieve. Ambos están bien sintonizados con los suyos.
nicho ecológico.
Todo comienza a descomponerse, sin embargo, cuando una especie gana
idioma. De lo que hablamos no es de lo que experimentamos, hablamos principalmente
de cosas interesantes, y esas tienden a ser cosas poco comunes. Más
o menos por definición, los eventos siempre se experimentan en su debida
frecuencias, pero esto no es del todo cierto en el lenguaje. Cualquiera que tenga
experimentado una mordedura de serpiente o un rayo tenderá a volver a contar esos
historias singulares para el resto de sus vidas. Y esas historias serán tan destacadas
que serán recogidos y contados por otros.
Hay una tensión curiosa, entonces, entre comunicarse con los demás y
manteniendo antecedentes precisos sobre el mundo. Cuando la gente habla de lo que
les interesa y ofrecen historias que creen que sus oyentes encontrarán
interesante: distorsiona las estadísticas de nuestra experiencia. Eso hace que sea difícil
Mantener distribuciones previas apropiadas. Y el desafío solo tiene
aumentó con el desarrollo de la imprenta, las noticias nocturnas y
Redes sociales: innovaciones que permiten a nuestra especie difundir el lenguaje.
mecánicamente .
Considere cuántas veces ha visto un avión estrellado o un
coche accidentado. Es muy posible que haya visto aproximadamente la misma cantidad de cada uno, per
muchos de esos coches estaban en la carretera junto a ti, mientras que los aviones estaban
probablemente en otro continente, transmitido a usted a través de Internet o
televisión. En los Estados Unidos, por ejemplo, el número total de personas que
han perdido la vida en accidentes de aviones comerciales ya que el año 2000
no sería suficiente para llenar el Carnegie Hall ni siquiera a la mitad. Por el contrario, el número de
Página 194
personas en los Estados Unidos que murieron en accidentes automovilísticos durante ese mismo tiempo
mayor que toda la población de Wyoming.
En pocas palabras, la representación de eventos en los medios no rastrea su
frecuencia en el mundo. Como señala el sociólogo Barry Glassner, la tasa de homicidios
en los Estados Unidos disminuyó en un 20% en el transcurso de la década de 1990, sin embargo
durante ese período de tiempo la presencia de violencia armada en las noticias estadounidenses
aumentado en un 600%.
Si quiere ser un buen bayesiano intuitivo, si quiere naturalmente
hacer buenas predicciones, sin tener que pensar en qué tipo de
La regla de predicción es apropiada: necesita proteger sus antecedentes.
Contrariamente a la intuición, eso podría significar apagar las noticias.
Página 195
*Hay una cierta ironía aquí: cuando se trata de tiempo, asumiendo que no hay nada especial en nuestro
La llegada da lugar a que, después de todo, nos imaginemos a nosotros mismos en el mismo centro.
Página 196
*Esto es precisamente lo que hace la Ley de Laplace en su forma más simple: asume que tener 1% o 10% de
la probabilidad de que los boletos sean ganadores es del 50% o del 100%. La fórmula ( w +1) ⁄ ( n +2) puede parecer ingenua en
Su sugerencia de que después de comprar un solo boleto de Powerball perdedor, tiene una probabilidad de 1/3 de ganar en
el próximo, pero ese resultado refleja fielmente las probabilidades en una rifa en la que entras sabiendo
nada en absoluto.
Página 197
7 Sobreajuste
Cuando Charles Darwin estaba tratando de decidir si debía proponerse

su prima Emma Wedgwood, sacó lápiz y papel y pesó
todas las consecuencias posibles. A favor del matrimonio enumeró a los hijos,
compañerismo y los "encantos de la música y la charla femenina". Contra
matrimonio, enumeró la "terrible pérdida de tiempo", la falta de libertad para ir a donde
deseaba, la carga de visitar a los parientes, el gasto y la ansiedad
provocada por los niños, la preocupación de que “quizás a mi esposa no le gustará
Londres ”, y tener menos dinero para gastar en libros. Pesando una columna
contra el otro produjo un estrecho margen de victoria, y en la parte inferior
Darwin escribió: "Casarse, casarse, casarse QED" Quod erat
demostrando , la firma matemática que el propio Darwin entonces
Reiterado en inglés: "Se ha demostrado necesario casarse".
La lista de pros y contras ya era un algoritmo consagrado por Darwin
tiempo, siendo respaldado por Benjamin Franklin un siglo antes. Para superar
"La incertidumbre que nos deja perplejos", escribió Franklin,
mi manera es dividir la mitad de una hoja de papel por una línea en dos columnas, escribiendo sobre una Pro,
y sobre la otra Con. Luego, durante tres o cuatro días de consideración, puse debajo del
Cabezas diferentes Sugerencias breves de los diferentes Motivos que en diferentes Tiempos se me ocurren para o
contra la Medida. Cuando los he reunido todos en una sola vista, me esfuerzo por
estimar sus respectivos pesos; y donde encuentro dos, uno a cada lado, que parecen iguales, yo
tacharlos a ambos: si encuentro un profesional de la Razón igual a algunas estafas de dos Razones, tacho la
Página 198
Tres. Si considero que unas dos Razones son iguales a unas tres Razones a favor, tacho las cinco;
y procediendo así, encuentro por fin dónde se encuentra el Equilibrio; y si después de uno o dos días más
Considerando que nada nuevo que sea de importancia ocurre en ninguno de los lados, llego a un
Determinación en consecuencia.
Franklin incluso pensó en esto como algo así como un cálculo, diciendo:
“He encontrado una gran ventaja de este tipo de ecuación, en lo que puede ser
llamado Álgebra Moral o Prudencial ".
Página 200
199
Diario de Darwin, julio de 1838. Reimpreso con permiso de la Biblioteca de la Universidad de Cambridge.
Cuando pensamos en pensar, es fácil asumir que más es mejor:

que tomará una mejor decisión cuantos más pros y contras enumere, haga una
mejor predicción sobre el precio de una acción, cuanto más relevantes sean los factores
identificar y redactar un mejor informe cuanto más tiempo dedique a trabajar en él.
Esta es sin duda la premisa detrás del sistema de Franklin. En este sentido,
El enfoque "algebraico" de Darwin del matrimonio, a pesar de su obvio
excentricidad, parece notable y tal vez incluso loablemente racional.
Sin embargo, si Franklin o Darwin hubieran vivido en la era de las máquinas
aprendizaje de la investigación: la ciencia de enseñar a las computadoras para hacer bien
juicios de la experiencia, habrían visto el álgebra moral sacudida a su
cimientos. La cuestión de qué tan difícil es pensar y cuántos factores
considerar, está en el corazón de un problema complicado que los estadísticos y
los investigadores del aprendizaje llaman "sobreajuste". Y lidiar con ese problema
revela que hay una sabiduría para pensar menos deliberadamente . Estar al tanto de
el sobreajuste cambia la forma en que debemos abordar el mercado, la mesa del comedor,
el gimnasio ... y el altar.
El caso contra la complejidad
Todo lo que puedas hacer, lo puedo hacer mejor; Puedo hacer cualquier cosa mejor que tú.
- ANNIE CONSIGUE TU ARMA
Cada decisión es una especie de predicción: sobre cuánto te gustará

algo que aún no has probado, sobre el rumbo de una determinada tendencia,
sobre cómo es probable que se desarrolle el camino menos transitado (o más). Y cada
La predicción, de manera crucial, implica pensar en dos cosas distintas: lo que
sabe y lo que no. Es decir, es un intento de formular una teoría que
Página 201
dará cuenta de las experiencias que ha tenido hasta la fecha y dirá algo
sobre los futuros que estás adivinando. Una buena teoría, por supuesto, servirá
ambos. Pero el hecho de que toda predicción deba, en efecto, ejercer una doble función
crea una cierta tensión inevitable.
Satisfacción con la vida en función del tiempo transcurrido desde el matrimonio.
Como ilustración de esta tensión, veamos un conjunto de datos que podría tener
ha sido relevante para Darwin: la satisfacción con la vida de las personas durante sus primeros diez años
del matrimonio, de un estudio reciente realizado en Alemania. Cada punto en eso
el gráfico se toma del propio estudio; nuestro trabajo es encontrar la fórmula para un
línea que encajaría en esos puntos y se extendería en el futuro, lo que nos permite
hacer predicciones más allá de la marca de los diez años.
Una posible fórmula usaría un solo factor para predecir la vida.
satisfacción: el tiempo transcurrido desde el matrimonio. Esto crearía una línea recta en el
gráfico. Otra posibilidad es utilizar dos factores, tiempo y tiempo al cuadrado ; los
Página 202
La línea resultante tendría una forma de U parabólica, lo que le permitiría capturar una
relación potencialmente más compleja entre tiempo y felicidad. Y si
ampliamos la fórmula para incluir aún más factores (tiempo al cubo, etc.),
la línea adquirirá cada vez más puntos de inflexión, obteniendo cada vez más
"Flexible" y flexible. Para cuando lleguemos a una fórmula de nueve factores, podremos
capturar relaciones muy complejas de hecho.
Matemáticamente hablando, nuestro modelo de dos factores incorpora todos los
información que entra en el modelo de un factor, y tiene otro término
podría usar también. Asimismo, el modelo de nueve factores aprovecha todos los
información a disposición del modelo de dos factores, más potencialmente lotes
más.
danosSegún esta lógica,
las mejores parece que el modelo de nueve factores siempre debería
predicciones.
Resulta que las cosas no son tan sencillas.
Predicciones de satisfacción con la vida utilizando modelos con diferente número de factores.
El resultado de aplicar estos modelos a los datos se muestra arriba. El único-

El modelo de factores, como era de esperar, pierde muchos de los puntos de datos exactos, aunque
captura la tendencia básica: un bajón después de la felicidad de la luna de miel. Sin embargo,
su predicción en línea recta prevé que esta disminución continuará para siempre,
resultando en última instancia en una miseria infinita. Algo sobre esa trayectoria
no suena del todo bien. El modelo de dos factores se acerca más a ajustarse al
Página 203
datos de la encuesta, y su forma curva hace una predicción diferente a largo plazo,
sugiriendo que después del declive inicial la satisfacción con la vida más o menos niveles
con el tiempo. Finalmente, el modelo de nueve factores pasa por todos y cada uno
apuntar en el gráfico; Es esencialmente un ajuste perfecto para todos los datos del
estudio.
En ese sentido, parece que la fórmula de nueve factores es de hecho nuestra mejor
modelo. Pero si miras las predicciones que hace para los años no incluidos
en el estudio, es posible que se pregunte qué tan útil es realmente: predice
miseria en el altar, un aumento vertiginoso y abrupto de satisfacción después de varios meses
del matrimonio, una montaña rusa llena de baches a partir de entonces, y una gran caída después de
año diez. Por el contrario, la nivelación predicha por el modelo de dos factores es
el pronóstico más consistente con lo que dicen los psicólogos y economistas
sobre el matrimonio y la felicidad. (Creen, dicho sea de paso, que simplemente
refleja un retorno a la normalidad, al nivel básico de satisfacción de las personas con
sus vidas, en lugar de cualquier disgusto con el matrimonio en sí).
La lección es la siguiente: de hecho, es cierto que incluir más factores en un modelo
siempre, por definición, lo hará más adecuado para los datos que ya tenemos.
Pero un mejor ajuste para los datos disponibles no significa necesariamente un mejor
predicción.
Página 204
Agregar pequeñas cantidades de "ruido" aleatorio a los datos (simulando los efectos de repetir la encuesta
con un grupo diferente de participantes) produce ondulaciones salvajes en el modelo de nueve factores, mientras que el
En comparación, los modelos de uno y dos factores son mucho más estables y consistentes en sus predicciones.
Por supuesto, un modelo que es demasiado simple, por ejemplo, la línea recta del
Fórmula de un factor: puede fallar al capturar el patrón esencial en los datos. Si
la verdad parece una curva, ninguna línea recta puede hacerlo bien. Sobre el
Por otro lado, un modelo que es demasiado complicado, como nuestro modelo de nueve factores
Página 205
aquí, se vuelve hipersensible a los puntos de datos particulares que pasamos

para observar. Como consecuencia, precisamente porque está sintonizado tan finamente con ese
conjunto de datos específicos, las soluciones que produce son muy variables. Si el estudio
se repitieron con diferentes personas, produciendo ligeras variaciones en el mismo
patrón esencial, los modelos de uno y dos factores permanecerían más o menos
constante, pero el modelo de nueve factores giraría salvajemente a partir de una instancia de
el estudio al siguiente. Esto es lo que los estadísticos llaman sobreajuste .
Entonces, una de las verdades más profundas del aprendizaje automático es que, de hecho, no
siempre es mejor usar un modelo más complejo, uno que requiera un mayor número
de factores en cuenta. Y el problema no es solo que los factores adicionales
ofrecen rendimientos decrecientes: funcionan mejor que un modelo más simple, pero no
suficiente para justificar la complejidad añadida. Más bien, podrían hacer nuestro
predicciones dramáticamente peores.
La idolatría de los datos
Si tuviéramos muchos datos, extraídos de una muestra perfectamente representativa,

completamente libre de errores y representa exactamente lo que estamos tratando de
evaluar, entonces usar el modelo más complejo disponible sería de hecho el
mejor enfoque. Pero si tratamos de ajustar perfectamente nuestro modelo a los datos cuando cualquier
Si estos factores no se cumplen, corremos el riesgo de sobreajustar.
En otras palabras, el sobreajuste representa un peligro en cualquier momento con el que nos enfrenta
ruido o mala medición, y casi siempre lo somos. Puede haber errores
en cómo se recopilaron los datos o en cómo se informaron. Algunas veces
Los fenómenos que se están investigando, como la felicidad humana, son difíciles de
incluso definir, y mucho menos medir. Gracias a su flexibilidad, los más complejos
Los modelos disponibles para nosotros pueden ajustarse a cualquier patrón que aparezca en los datos, pe
significa que también lo harán incluso cuando esos patrones sean meros fantasmas
y espejismos en el ruido.
A lo largo de la historia, los textos religiosos han advertido a sus seguidores contra
idolatría: la adoración de estatuas, pinturas, reliquias y otros elementos tangibles
artefactos en lugar de las deidades intangibles que esos artefactos representan. El primero
El mandamiento, por ejemplo, advierte contra inclinarse ante "cualquier escultura
Página 206
imagen o semejanza de cualquier cosa que esté en el cielo ". Y en el Libro de
Reyes, una serpiente de bronce hecha por orden de Dios se convierte en objeto de adoración
e incienso, en lugar de Dios mismo. (Dios no se divierte).
Básicamente, el sobreajuste es una especie de idolatría de los datos, consecuencia de
centrándonos en lo que hemos podido medir en lugar de en lo que importa.
Esta brecha entre los datos que tenemos y las predicciones que queremos es
prácticamente en todas partes. Al tomar una gran decisión, solo podemos adivinar
¿Qué nos complacerá más adelante al pensar en los factores importantes para nosotros?
ahora. (Como dice Daniel Gilbert de Harvard, nuestro yo futuro a menudo “paga bien
dinero para quitar los tatuajes por los que pagamos un buen dinero ”).
hacer un pronóstico financiero, solo podemos ver lo que se correlaciona con el
precio de una acción en el pasado, no lo que podría ser en el futuro. Incluso en nuestro pequeño
Actos diarios que mantiene este patrón: escribiendo un correo electrónico, usamos nuestra propia lectura
del texto para predecir el del destinatario. No menos que en las encuestas públicas, el
Por lo tanto, los datos en nuestras propias vidas también son siempre ruidosos, en el mejor de los casos u
las cosas que realmente nos importan.
Como consecuencia, considerar cada vez más factores y gastar
Un mayor esfuerzo para modelarlos puede llevarnos al error de optimizar para el
algo equivocado: ofrecer oraciones a la serpiente de bronce de datos en lugar de al
mayor fuerza detrás de él.
Sobreajuste en todas partes
Una vez que sepa sobre el sobreajuste, lo verá en todas partes.

El sobreajuste, por ejemplo, explica la ironía de nuestro paladar. Cómo puede ser
que los alimentos que nos saben mejor se consideran en general malos para nuestro
salud, cuando la función completa de las papilas gustativas, evolutivamente hablando, es
¿Nos impide comer cosas malas?
La respuesta es que el sabor es la métrica proxy de nuestro cuerpo para la salud. Grasa, azúcar
y la sal son nutrientes importantes, y durante un par de cientos de miles de años,
ser atraído por alimentos que los contienen era una medida razonable para una
dieta de mantenimiento.
Página 207
Pero ser capaz de modificar los alimentos disponibles rompió ese

relación. Ahora podemos agregar grasa y azúcar a los alimentos más allá de las cantidades que
son buenos para nosotros, y luego comer esos alimentos exclusivamente en lugar de la mezcla de
plantas, cereales y carnes que históricamente formaron la dieta humana. En otra
palabras, podemos sobreajustarnos al gusto. Y cuanto más hábilmente podamos manipular la comida
(y cuanto más divergen nuestros estilos de vida de los de nuestros antepasados), más
imperfecto se vuelve un gusto métrico. Nuestra agencia humana se convierte así en un
maldición, haciéndonos peligrosamente capaces de tener exactamente lo que queremos incluso cuando
no queremos exactamente
Cuidado: cuando lo gimnasio
vayas al correcto. para deshacerte del peso extra de todos
ese azúcar, también puede correr el riesgo de sobreajuste. Ciertos signos visibles de
fitness (por ejemplo, poca grasa corporal y alta masa muscular) son fáciles de
medir, y están relacionados con, digamos, minimizar el riesgo de enfermedad cardíaca
y otras dolencias. Pero también son una medida indirecta imperfecta.
Sobreajustar las señales: adoptar una dieta extrema para reducir la grasa corporal y
tomar esteroides para desarrollar músculo, tal vez, puede darle la imagen de una buena
salud, pero solo la imagen.
El sobreajuste también aparece en los deportes. Por ejemplo, Tom ha sido esgrimista,
de vez en cuando, desde que era un adolescente. El objetivo original de la esgrima era
enseñar a la gente a defenderse en un duelo, de ahí el nombre:
"Defendiendo". Y las armas utilizadas en la esgrima moderna son similares a las
que se utilizaron para entrenar para tales encuentros. (Esto es particularmente cierto en el caso de
espada, que todavía se utilizaba en duelos formales hace menos de cincuenta años).
Introducción de equipos de puntuación electrónicos: un botón en la punta del
hoja que registra un golpe, ha cambiado la naturaleza del deporte, y
técnicas que te servirían mal en un duelo serio se han convertido en
habilidades críticas en la competencia. Los esgrimistas modernos utilizan hojas flexibles que permiten
ellos para "presionar" el botón a su oponente, rozando lo suficientemente fuerte como para
registrarse y puntuar. Como resultado, pueden parecer más como si se estuvieran agrietando
látigos de metal entre sí que cortar o empujar. Es un deporte tan emocionante como
nunca, pero a medida que los atletas sobreajustan sus tácticas a las peculiaridades del
se vuelve menos útil para inculcar las habilidades del manejo de la espada en el mundo real.
Página 208
Quizás en ninguna parte, sin embargo, el sobreajuste sea tan poderoso y problemático
como en el mundo empresarial. "Las estructuras de incentivos funcionan", como dijo Steve Jobs
eso. "Por lo tanto, debe tener mucho cuidado con lo que incentiva a la gente a hacer, porque
Varias estructuras de incentivos crean todo tipo de consecuencias que no puedes
prever." Sam Altman, presidente de la incubadora de startups Y Combinator,
se hace eco de las palabras de advertencia de Jobs: “Realmente es cierto que la empresa construirá
lo que el CEO decida medir ".
De hecho, es increíblemente difícil inventar incentivos o
Medidas que no tienen ningún tipo de efecto perverso. En la década de 1950,
El profesor de administración de Cornell, VF Ridgway, catalogó una serie de
"Consecuencias disfuncionales de las mediciones del desempeño". En un trabajo
empresa de colocación, los empleados fueron evaluados en función del número de entrevistas que
llevado a cabo, lo que los motivó a ejecutar las reuniones tan rápido como
posible, sin dedicar mucho tiempo a ayudar a sus clientes a encontrar
trabajos. En una agencia federal de aplicación de la ley, los investigadores reciben mensualmente
Se encontró que las cuotas de desempeño seleccionan casos fáciles al final del mes.
en lugar de los más urgentes. Y en una fábrica, centrándonos en la producción
métricas llevaron a los supervisores a descuidar el mantenimiento y las reparaciones, estableciendo el fu
catástrofe. Tales problemas no pueden simplemente descartarse como una falla en
lograr los objetivos de gestión. Más bien, son lo contrario: los despiadados y
optimización inteligente de lo incorrecto.
El cambio del siglo XXI hacia la analítica en tiempo real solo ha hecho que
peligro de métricas más intensas. Avinash Kaushik, marketing digital
evangelista de Google, advierte que intentar que los usuarios del sitio web vean tantas
anuncios como sea posible, naturalmente, se convierte en tratar de abarrotar los sitios con anuncios: "Cu
se le paga sobre la base del [costo por cada mil impresiones] el incentivo es
descubra cómo mostrar la mayor cantidad de anuncios posibles en cada página [y] asegúrese de
el visitante ve la mayor cantidad de páginas posibles en el sitio ... Ese incentivo
quita un enfoque de la entidad importante, su cliente, y lo coloca en
la entidad secundaria, su anunciante ". El sitio web podría ganar un poco más
dinero a corto plazo, pero artículos repletos de anuncios, carga lenta de varias páginas
presentaciones de diapositivas y titulares sensacionalistas de clickbait alejarán a los lectores
Página 209
a la larga. Conclusión de Kaushik: "Los amigos no dejan que los amigos midan
Vistas de página. Siempre."
En algunos casos, la diferencia entre un modelo y el mundo real es
literalmente una cuestión de vida o muerte. En el ejército y en la aplicación de la ley,
Por ejemplo, el entrenamiento repetitivo y de memoria se considera un medio clave para inculcar
habilidades de línea de fuego. El objetivo es practicar ciertos movimientos y tácticas hasta el punto.
que se vuelven totalmente automáticos. Pero cuando el sobreajuste se arrastra, puede
resultar desastroso. Hay historias de policías que se encuentran
por ejemplo, tomarse un tiempo durante un tiroteo para poner sus casquillos gastados en
sus bolsillos: buena etiqueta en un campo de tiro. Como ex guardabosques del ejército
y el profesor de psicología de West Point, Dave Grossman, escribe: "Después de la
El humo se había asentado en muchos tiroteos reales, los oficiales se sorprendieron al descubrir
latón vacío en sus bolsillos sin ningún recuerdo de cómo llegó allí. En varios
ocasiones, policías muertos fueron encontrados con bronce en sus manos, muriendo en el
en medio de un procedimiento administrativo que se les había perforado ”.
De manera similar, el FBI se vio obligado a cambiar su entrenamiento después de que se encontraron age
disparando reflexivamente dos tiros y luego enfundando su arma, un estándar
cadencia en el entrenamiento, independientemente de si sus disparos habían dado en el blanco y
si todavía existía una amenaza. Errores como estos son conocidos por la ley.
la aplicación de la ley y el ejército como "cicatrices de entrenamiento", y reflejan el hecho
que es posible sobreajustar la propia preparación. En uno particularmente
caso dramático, un oficial instintivamente arrebató el arma de las manos de
un asaltante y luego instintivamente se lo devolvió, tal como lo había hecho
una y otra vez con sus entrenadores en la práctica.
Detección de sobreajuste: validación cruzada
Porque el sobreajuste se presenta inicialmente como una teoría que encaja perfectamente
datos disponibles, puede parecer insidiosamente difícil de detectar. Como podemos esperar
para distinguir entre un modelo realmente bueno y uno que es
sobreajuste? En un entorno educativo, ¿cómo podemos distinguir entre un
clase de estudiantes sobresaliendo en la materia y una clase simplemente siendo
"Enseñado para la prueba"? En el mundo empresarial, ¿cómo podemos distinguir a una estrella genuina
Página 210
intérprete de un empleado que ha sobreajustado astutamente su trabajo al

indicadores clave de desempeño de la empresa, o ¿a la percepción del jefe?
Desintegrar esos escenarios es realmente un desafío, pero no lo es.
imposible. La investigación en aprendizaje automático ha arrojado varias
estrategias para detectar el sobreajuste, y una de las más importantes es lo que
conocido como validación cruzada .
En pocas palabras, la validación cruzada significa evaluar no solo qué tan bien
el modelo se ajusta a los datos que se proporcionan, pero qué tan bien se generaliza a los datos que no
visto. Paradójicamente, esto puede implicar el uso de menos datos. En el matrimonio
Por ejemplo, podríamos "retener", digamos, dos puntos al azar, y ajustar nuestro
modelos solo a los otros ocho. Luego tomaríamos esos dos puntos de prueba y usaríamos
ellos para medir qué tan bien nuestras diversas funciones se generalizan más allá de los ocho
Puntos de "formación" que se les ha dado. Los dos puntos retenidos funcionan como
canarios en la mina de carbón: si un modelo complejo clava los ocho puntos de entrenamiento
pero pierde enormemente los dos puntos de prueba, es una buena apuesta que el sobreajuste está en
trabaja.
Aparte de retener algunos de los puntos de datos disponibles, también es
Es útil considerar probar el modelo con datos derivados de alguna otra forma.
de evaluación en su totalidad. Como hemos visto, el uso de métricas proxy, el gusto como
proxy de nutrición, número de casos resueltos como proxy del investigador
diligencia — también puede llevar a un ajuste excesivo. En estos casos, necesitaremos cruzar
validar la principal medida de rendimiento que estamos usando frente a otras
posibles medidas.
En las escuelas, por ejemplo, las pruebas estandarizadas ofrecen una serie de beneficios,
incluyendo una economía de escala distinta: se pueden clasificar de forma económica y
rápidamente por miles. Sin embargo, junto con estas pruebas, las escuelas
evaluar al azar una pequeña fracción de los estudiantes, uno por clase, digamos, o
uno en cien, utilizando un método de evaluación diferente, tal vez algo
como un ensayo o un examen oral. (Dado que solo unos pocos estudiantes serían evaluados
de esta manera, tener este método secundario escalar bien no es una gran preocupación).
las pruebas estandarizadas proporcionarían retroalimentación inmediata; podría haber
los estudiantes toman un breve examen computarizado cada semana y registran los resultados de la clas
el progreso casi en tiempo real, por ejemplo, mientras que los puntos de datos secundarios
Página 211
serviría para realizar una validación cruzada: asegurarse de que los estudiantes
Adquirir el conocimiento que la prueba estandarizada debe medir, y
no simplemente mejorando en la realización de exámenes. Si los puntajes estandarizados de una escuela
aumentó mientras que su desempeño "no estandarizado" se movió en el sentido contrario
dirección, los administradores tendrían una clara señal de advertencia de que "enseñar a
la prueba "había comenzado, y las habilidades de los alumnos estaban comenzando a
mecánica de la prueba en sí.
La validación cruzada también ofrece una sugerencia para la aplicación de la ley y
personal militar que busca inculcar buenos reflejos sin martillar
hábitos del propio proceso de formación. Así como los ensayos y los exámenes orales pueden
Validar pruebas estandarizadas de forma cruzada, por lo que es un "entrenamiento cruzado" poco famili
Las evaluaciones pueden usarse para medir si el tiempo de reacción y el disparo
la precisión se generaliza a tareas desconocidas. Si no lo son, entonces es un
señal fuerte para cambiar el régimen de entrenamiento. Si bien nada puede realmente
preparar uno para el combate real, ejercicios como este pueden al menos advertir en
avanzar donde es probable que se hayan formado "cicatrices de entrenamiento".
Cómo combatir el sobreajuste: penalización de la complejidad
Si no puede explicarlo simplemente, no lo comprende lo suficientemente bien.

-ANÓNIMO
Hemos visto algunas de las formas en que el sobreajuste puede levantar la cabeza, y hemos
examinó algunos de los métodos para detectarlo y medirlo. Pero que podemos
realmente hacer para aliviarlo?
Desde el punto de vista estadístico, el sobreajuste es un síntoma de estar demasiado
sensible a los datos reales que hemos visto. La solución, entonces, es
sencillo: debemos equilibrar nuestro deseo de encontrar un buen ajuste con el
complejidad de los modelos que utilizamos para hacerlo.
Una forma de elegir entre varios modelos de la competencia es el de Occam
principio de navaja, lo que sugiere que, en igualdad de condiciones, el más simple
La hipótesis posible es probablemente la correcta. Por supuesto, las cosas rara vez son
completamente iguales, por lo que no es inmediatamente obvio cómo aplicar algo
Página 212
como la navaja de Occam en un contexto matemático. Lidiando con este desafío

En la década de 1960, el matemático ruso Andrey Tikhonov propuso una
respuesta: introduzca un término adicional a sus cálculos que penalice
soluciones más complejas. Si introducimos una penalización por complejidad, entonces más
modelos complejos tienen que hacer no sólo un mejor trabajo, sino una significativamente mejor
trabajo de explicar los datos para justificar su mayor complejidad. Computadora
Los científicos se
su complejidad —refieren a este principio,. utilizando restricciones que penalizan a los modelos para
como Regularización
Entonces, ¿cómo se ven estas penalizaciones por complejidad? Un algoritmo
descubierto en 1996 por el bioestadístico Robert Tibshirani, se llama Lasso
y utiliza como penalización el peso total de los diferentes factores en la
modelo. * Al ejercer esta presión a la baja sobre los pesos de los factores,
el Lasso lleva a la mayor cantidad posible de ellos completamente a cero. Solo el
los factores que tienen un gran impacto en los resultados permanecen en la ecuación, por lo que
potencialmente transformando, digamos, un modelo de nueve factores sobreajustado en uno más simple
fórmula más robusta con solo un par de los factores más críticos.
Técnicas como el Lasso ahora son omnipresentes en el aprendizaje automático, pero
el mismo tipo de principio, un castigo por la complejidad, también aparece en
naturaleza. Los organismos vivos obtienen un cierto impulso hacia la simplicidad casi
automáticamente, gracias a las limitaciones de tiempo, memoria, energía y
atención. La carga del metabolismo, por ejemplo, actúa como un freno en el
complejidad de los organismos, introduciendo una penalización calórica por demasiado elaborado
maquinaria. El hecho de que el cerebro humano quema alrededor de una quinta parte de los humanos
La ingesta calórica diaria total es un testimonio de las ventajas evolutivas que
nuestras capacidades intelectuales nos proporcionan: las contribuciones del cerebro deben
de alguna manera más que pagar esa considerable factura de combustible. Por otro lado, podemos
También inferir que un cerebro sustancialmente más complejo probablemente no proporcionó
dividendos suficientes, evolutivamente hablando. Somos tan inteligentes como lo hemos hecho
necesitaba serlo, pero no de manera extravagante más.
También se cree que el mismo tipo de proceso desempeña un papel a nivel neural.
nivel. En informática, los modelos de software basados en el cerebro, conocidos como
"Redes neuronales artificiales", pueden aprender funciones arbitrariamente complejas:
son incluso más flexibles que nuestro modelo de nueve factores anterior, pero precisamente
Página 213
Debido a esta misma flexibilidad, son notoriamente vulnerables a

sobreajuste. Las redes neuronales biológicas reales eluden algo de esto.
problema porque necesitan compensar su desempeño con los costos
de mantenerlo. Los neurocientíficos han sugerido, por ejemplo, que los cerebros
tratar de minimizar la cantidad de neuronas que se activan en un momento dado
—Implementando el mismo tipo de presión a la baja sobre la complejidad que el
Lazo.
El lenguaje forma otro lazo natural: la complejidad es castigada por
el trabajo de hablar más extensamente y el agotamiento de la voz de nuestro oyente
capacidad de atención. Los planes de negocios se reducen a un discurso de ascensor; vida
consejo se convierte en sabiduría proverbial sólo si es lo suficientemente conciso y
pegadizo. Y todo lo que necesita ser recordado tiene que pasar por el
Lazo inherente de la memoria.
La ventaja de la heurística
El economista Harry Markowitz ganó el Premio Nobel de Economía en 1990
para el desarrollo de la teoría moderna de la cartera: su innovador "significado
optimización de la cartera de varianza ”mostró cómo un inversor puede hacer una
Asignación óptima entre varios fondos y activos para maximizar los rendimientos a un
determinado nivel de riesgo. Entonces, cuando llegó el momento de invertir su propia jubilación
ahorros, parece que Markowitz debería haber sido la única persona perfectamente
equipado para el trabajo. ¿Qué decidió hacer?
Debería haber calculado las covarianzas históricas de las clases de activos y dibujado una
frontera. En cambio, visualicé mi dolor si el mercado de valores subiera mucho y yo no estuviera en él, o si
bajó mucho y yo estaba completamente en él. Mi intención era minimizar mi futuro arrepentimiento.
Así que dividí mis contribuciones al cincuenta por ciento entre bonos y acciones.
¿Por qué demonios haría eso? La historia del premio Nobel

y su estrategia de inversión podría presentarse como un ejemplo de
irracionalidad: ante la complejidad de la vida real, abandonó la
modelo racional y siguió una simple heurística. Pero es precisamente por
Página 214
la complejidad de la vida real que una simple heurística podría de hecho ser la
solución racional.
En lo que respecta a la gestión de carteras, resulta que, a menos que esté
altamente confiado en la información que tiene sobre los mercados, puede
en realidad sería mejor ignorar esa información por completo. Aplicando
El esquema óptimo de asignación de carteras de Markowitz requiere tener buenos
estimaciones de las propiedades estadísticas de diferentes inversiones. Un error en
esas estimaciones pueden resultar en asignaciones de activos muy diferentes, potencialmente
riesgo creciente. Por el contrario, dividir su dinero de manera uniforme entre acciones y
Los bonos no se ven afectados en absoluto por los datos que ha observado. Esta estrategia
ni siquiera intenta adaptarse a la actuación histórica de aquellos
tipos de inversión, por lo que no hay forma de que se ajuste demasiado .
Por supuesto, usar una división al cincuenta por ciento no es necesariamente la complejidad
punto óptimo, pero hay algo que decir al respecto. Si por casualidad conoces
la media esperada y la varianza esperada de un conjunto de inversiones, luego use
Optimización de la cartera de varianza media: el algoritmo óptimo es óptimo para
una razón. Pero cuando las probabilidades de estimarlas todas correctamente son bajas y
el peso que el modelo pone en esas cantidades no confiables es alto,
entonces debería sonar una alarma en el proceso de toma de decisiones: es hora
regularizar.
Inspirándose en ejemplos como los ahorros para la jubilación de Markowitz, los psicólogos
Gerd Gigerenzer y Henry Brighton han argumentado que la toma de decisiones
Los atajos que la gente usa en el mundo real son, en muchos casos, exactamente el tipo de
pensar que contribuye a tomar buenas decisiones. "En contraste con la opinión generalizada
que menos procesamiento reduce la precisión ", escriben," el estudio de la heurística
muestra que menos información, cálculo y tiempo pueden, de hecho, mejorar
precisión." Una heurística que favorece respuestas más simples, con menos factores, o
Menos cálculo: ofrece precisamente estos efectos de “menos es más”.
La imposición de sanciones a la complejidad última de un modelo no es la única
forma de aliviar el sobreajuste, sin embargo. También puede empujar un modelo hacia
simplicidad controlando la velocidad con la que le permite adaptarse a
datos entrantes. Esto hace que el estudio del sobreajuste sea una guía esclarecedora para
nuestra historia, tanto como sociedad como como especie.
Página 215
El peso de la historia
Todos los alimentos que ha ingerido una rata viva, necesariamente, no la han matado.
—SAMUEL REVUSKY Y ERWIN BEDARF, “ASOCIACIÓN DE ENFERMEDADES CON INGESTIÓN PREVIA
DE ALIMENTOS NOVEDOSOS ”
El mercado de la leche de soja en los Estados Unidos se multiplicó por más de cuatro
desde mediados de la década de 1990 hasta 2013. Pero a finales de 2013, según los titulares de las noticias
ya parecía ser una cosa del pasado, un lejano segundo lugar a la almendra
Leche. Como le dijo a Bloomberg el investigador de alimentos y bebidas Larry Finkel
Businessweek : “Las nueces están de moda ahora. La soya suena más a anticuada
Comida saludable." La empresa Silk, famosa por popularizar la leche de soja (como
nombre implica), informó a finales de 2013 que sus productos de leche de almendras habían
crecido en más del 50% solo en el trimestre anterior. Mientras tanto, en otro
noticias de bebidas, la marca líder de agua de coco, Vita Coco, informó en
2014 que sus ventas se habían duplicado desde 2011 y habían aumentado un
asombroso trescientas veces desde 2004. Como dijo el New York Times ,
"El agua de coco parece haber pasado de invisible a inevitable
sin una pausa en el ámbito de lo vagamente familiar ". Mientras tanto, la col rizada
El mercado creció un 40% solo en 2013. El mayor comprador de col rizada del año
antes había sido Pizza Hut, que lo puso en sus barras de ensaladas, como decoración.
Algunos de los dominios ms fundamentales de la vida humana, como el
cuestión de lo que deberíamos poner en nuestro cuerpo, curiosamente parecen ser los
la mayoría dominada por modas pasajeras. Parte de lo que permite que estas modas tomen
el mundo por asalto es lo rápido que nuestra cultura puede cambiar. Informacion ahora
fluye a través de la sociedad más rápido que nunca, mientras que las cadenas de suministro globales
permitir a los consumidores cambiar rápidamente sus hábitos de compra en masa (y
el marketing les anima a hacerlo). Si ocurre algún estudio en particular
sugerir un beneficio para la salud de, digamos, anís estrellado, puede estar en todo el
blogosfera dentro de la semana, en la televisión la semana siguiente, y en
aparentemente todos los supermercados en seis meses, con anís estrellado dedicado
libros de cocina pronto saldrán de las prensas. Esta impresionante velocidad es a la vez un
bendición y maldición.
Página 216
Por el contrario, si observamos la forma en que los organismos, incluidos los humanos,
evolucionar, notamos algo intrigante: el cambio ocurre lentamente. Esto significa
que las propiedades de los organismos de hoy en día están determinadas no sólo por su
entornos actuales, sino también por su historia. Por ejemplo, el curiosamente
Disposición cruzada de nuestro sistema nervioso (el lado izquierdo de nuestro cuerpo
controlado por el lado derecho de nuestro cerebro y viceversa) refleja el
Historia evolutiva de los vertebrados. Este fenómeno, llamado "decusación",
Se teoriza que surgió en un punto de la evolución cuando los primeros vertebrados
cuerpos torcidos 180 grados con respecto a sus cabezas; mientras que el nervio
cordones de invertebrados como langostas y lombrices de tierra corren sobre el "vientre"
lado del animal, los vertebrados tienen sus cordones nerviosos a lo largo de la columna
en lugar de.
El oído humano ofrece otro ejemplo. Visto desde un funcional
perspectiva, es un sistema para traducir ondas de sonido en señales eléctricas
mediante amplificación a través de tres huesos: el martillo, el yunque y el estribo. Esta
El sistema de amplificación es impresionante, pero los detalles de cómo funciona
mucho que ver con las limitaciones históricas. Resulta que los reptiles solo tienen un
un solo hueso en la oreja, pero huesos adicionales en la mandíbula de los que carecen los mamíferos.
Aparentemente, esos huesos de la mandíbula se reutilizaron en la oreja de los mamíferos. Entonces el
La forma exacta y la configuración de la anatomía de nuestra oreja reflejan nuestra evolución
historia al menos tanto como el problema auditivo que se resuelve.
El concepto de sobreajuste nos da una forma de ver la virtud en tales
bagaje evolutivo. Aunque fibras nerviosas cruzadas y reutilizadas
las mandíbulas pueden parecer arreglos subóptimos, no necesariamente
quieren que la evolución optimice completamente un organismo para cada cambio en su
nicho ambiental, o, al menos, deberíamos reconocer que hacerlo
hacerlo extremadamente sensible a futuros cambios ambientales. Tener que
hacer uso de materiales existentes, por otro lado, impone una especie de utilidad
restricción. Hace que sea más difícil inducir cambios drásticos en la estructura de
organismos, más difíciles de sobreajustar. Como especie, constreñida por el pasado
nos hace menos perfectamente adaptados al presente que conocemos, pero nos ayuda a mantenernos
robusto para el futuro no lo hacemos.
Página 217
Una idea similar podría ayudarnos a resistir las rápidas modas de los humanos.
sociedad. Cuando se trata de cultura, la tradición juega el papel de
limitaciones evolutivas. Un poco de conservadurismo, un cierto sesgo a favor de
historia, puede protegernos contra el ciclo de auge y caída de las modas. Eso no
significa que debemos ignorar los datos más recientes, por supuesto. Salta hacia el
al carro, por supuesto, pero no necesariamente en él.
En el aprendizaje automático, las ventajas de moverse lentamente emergen más
concretamente en una técnica de regularización conocida como parada anticipada . Cuando
miramos los datos de la encuesta de matrimonio alemana al comienzo de la
capítulo, pasamos directamente a examinar el mejor ajuste de uno, dos y nueve
modelos factoriales. En muchas situaciones, sin embargo, ajustar los parámetros para encontrar
el mejor ajuste posible para los datos dados es un proceso en sí mismo. Qué
sucede si detenemos ese proceso antes de tiempo y simplemente no permitimos que un modelo
¿Es hora de volverse demasiado complejo? Una vez más, lo que podría parecer a primera vista
ser poco entusiasta o descuidado surge, en cambio, como una estrategia importante
en su propio derecho.
Muchos algoritmos de predicción, por ejemplo, comienzan buscando el
factor único más importante en lugar de saltar a un modelo de múltiples factores.
Solo después de encontrar ese primer factor, buscan el siguiente factor más importante.
factor para agregar al modelo, luego el siguiente, y así sucesivamente. Sus modelos pueden
Por lo tanto, evitar que se vuelva demasiado complejo simplemente deteniendo el
proceso corto, antes de que el sobreajuste haya tenido la oportunidad de introducirse.
El enfoque para calcular las predicciones considera un punto de datos a la vez, con
el modelo ajustado para tener en cuenta cada nuevo punto antes de que se acumulen más puntos
adicional; allí, también, la complejidad del modelo aumenta gradualmente, por lo que
detener el proceso brevemente puede ayudar a evitar que se sobreajuste.
Este tipo de configuración, donde más tiempo significa más complejidad,
caracteriza muchos esfuerzos humanos. Dándose más tiempo para
decidir sobre algo no significa necesariamente que harás una mejor
decisión. Pero sí garantiza que terminará considerando más factores,
más hipotéticos, más pros y contras y, por lo tanto, corre el riesgo de sobreajuste.
Tom tuvo exactamente esta experiencia cuando se convirtió en profesor. Su primera
semestre, enseñando su primera clase, pasó una gran cantidad de tiempo
Página 218
perfeccionando sus conferencias: más de diez horas de preparación por cada hora
de clase. Su segundo semestre, enseñando una clase diferente, no pudo
invirtió tanto tiempo y le preocupaba que fuera un desastre. Pero un extraño
Sucedió algo: a los estudiantes les gustó la segunda clase. De hecho les gustó
más que el primero. Resultó que esas horas extra se habían gastado
clavando los detalles esenciales que solo confundieron a los estudiantes y hirieron
hasta ser cortado de las conferencias la próxima vez que Tom enseñó la clase. los
Tom finalmente se dio cuenta de que el problema subyacente era que había estado usando su propio
el gusto y el juicio como una especie de métrica indirecta para sus estudiantes '. Este proxy
métrica funcionó razonablemente bien como una aproximación, pero no valió la pena
sobreajuste, lo que explica por qué dedicar horas extra
"Perfeccionar" todas las diapositivas había sido contraproducente.
La efectividad de la regularización en todo tipo de tareas de aprendizaje automático
sugiere que podemos tomar mejores decisiones si pensamos deliberadamente y
haciendo menos. Si es probable que los factores que se nos ocurran primero sean los más
importantes, luego, más allá de cierto punto, pensar más en un problema
no solo será una pérdida de tiempo y esfuerzo, sino que nos llevará a cosas peores
soluciones. La detención anticipada proporciona la base para un argumento razonado
contra el razonamiento, el caso de la persona pensante contra el pensamiento. Pero girando
esto en un consejo práctico requiere responder una pregunta más: cuándo
¿Deberíamos dejar de pensar?
Como ocurre con todos los problemas relacionados con el sobreajuste, qué tan pronto detenerse depende
brecha entre lo que se puede medir y lo que realmente importa. Si tienes todo
los hechos, están libres de todo error e incertidumbre, y puede directamente
evalúe lo que sea importante para usted, luego no se detenga antes. Piensa mucho y
difícil: la complejidad y el esfuerzo son los adecuados.
Pero ese casi nunca es el caso. Si tiene mucha incertidumbre y
datos limitados, entonces deténgase temprano por todos los medios. Si no tienes una lectura clara
sobre cómo será evaluado su trabajo y por quién, entonces no vale la pena
tiempo extra para hacerlo perfecto con respecto al suyo (o al de cualquier otra persona)
Página 219
conjetura idiosincrásica de lo que podría ser la perfección. Cuanto mayor sea la incertidumbre,
Cuanto mayor sea la brecha entre lo que puede medir y lo que importa, la
más debe tener cuidado con el sobreajuste, es decir, más debe
prefiera la simplicidad, y cuanto antes debe detenerse.
Cuando esté realmente en la oscuridad, los planes mejor diseñados serán los más simples.
Cuando nuestras expectativas son inciertas y los datos son ruidosos, la mejor opción es
pintar con un pincel grueso, pensar a grandes rasgos. A veces literalmente.
Como explican los empresarios Jason Fried y David Heinemeier Hansson, el
más adelante necesitan hacer una lluvia de ideas, cuanto más grueso es el bolígrafo que usan, un
forma inteligente de simplificación por tamaño de trazo:
Cuando comenzamos a diseñar algo, esbozamos ideas con un marcador Sharpie grande y grueso,
en lugar de un bolígrafo. ¿Por qué? Los puntos de la pluma son demasiado finos. Tienen una resolución demasiado alta. Ellos
animarte a preocuparte por cosas de las que no deberías preocuparte todavía, como perfeccionar el
sombreado o si utilizar una línea punteada o discontinua. Terminas enfocándote en cosas que deberían
todavía estar fuera de foco.
Un Sharpie hace que sea imposible perforar tan profundo. Solo puede dibujar formas, líneas y
cajas. Eso es bueno. El panorama general es lo único de lo que debería preocuparse al principio.
Como dice Henry Mintzberg de McGill, "¿Qué pasaría si empezáramos

desde la premisa de que no podemos medir lo que importa y partir de ahí?
Entonces, en lugar de medir, tendríamos que usar algo muy aterrador: es
llamado juicio ".
El resultado de la parada anticipada es que a veces no se trata de
elegir entre ser racionales y seguir nuestro primer instinto. Yendo
con nuestro primer instinto puede ser la solución racional. Cuanto más complejo,
inestable e incierta es la decisión, cuanto más racional es el enfoque.
Volviendo a Darwin, su problema de decidir si proponer podría
probablemente se hayan resuelto basándose sólo en los primeros pros y contras que
identificado, y los posteriores se suman al tiempo y la ansiedad
gastado en la decisión sin necesariamente ayudar a su resolución (y en
toda probabilidad lo impide). Lo que pareció tomar una decisión fue el
pensó que “es intolerable pensar en pasar la vida entera como un
abeja neutra, trabajando, trabajando y nada después de todo ". Niños y
Página 220
compañerismo, los primeros puntos que mencionó, fueron precisamente los

que finalmente lo inclinó a favor del matrimonio. El presupuesto de su libro era un
distracción.
Antes de ser demasiado críticos con Darwin, sin embargo, lo pintamos como un
Pensador empedernido, vale la pena echar un segundo vistazo a esta página de su
diario. Verlo en facsímil muestra algo fascinante. Darwin no era
Franklin, agregando diversas consideraciones durante días. A pesar de la seriedad
con el que abordó esta elección que cambió su vida, Darwin inventó su
Me importa exactamente cuándo sus notas llegaron al final de la hoja del diario. Él era
regularizando a la página. Esto recuerda tanto a la parada anticipada como a la
Lazo: todo lo que no entra en la página no toma la decisión.
Decidido a casarse, Darwin inmediatamente pasó a pensar demasiado
la temporización. "¿Cuando? "Pronto o tarde", escribió sobre otra lista de pros y
contras, considerando todo, desde la felicidad hasta los gastos y la "incomodidad"
a su antiguo deseo de viajar en globo aerostático y / o a Gales. Pero
al final de la página, decidió "No importa, confíe en el azar", y
el resultado, dentro de varios meses, fue una propuesta a Emma
Wedgwood, el comienzo de una asociación satisfactoria y una vida familiar feliz.
Página 221
*Para los matemáticos, esa es la suma de los valores absolutos de los coeficientes de las variables.
Página 222
8 Relajación
Dejalo deslizar
En 2010, Meghan Bellows estaba trabajando en su doctorado en ingeniería química.

en Princeton durante el día y planeando su boda por la noche. Su investigacion
giraba en torno a encontrar los lugares correctos para poner aminoácidos en una proteína
cadena para producir una molécula con características particulares. ("Si maximizas
la energía de enlace de dos proteínas, entonces puede diseñar con éxito un
inhibidor peptídico de alguna función biológica, por lo que en realidad puede inhibir una
progreso de la enfermedad. ”) En el frente nupcial, ella estaba atrapada en el problema de
asientos.
Había un grupo de nueve amigos de la universidad, y Bellows agonizaba por
¿A quién más arrojar en medio de una mini reunión como esta para hacer una mesa de
diez. Peor aún, había contado hasta once parientes cercanos. Quien lo conseguiría
la bota de la mesa de los padres de honor, y cómo podría explicárselo a
¿ellos? ¿Y qué hay de gente como sus vecinos de la infancia y su niñera, o
compañeros de trabajo de sus padres, que realmente no conocían a nadie en el
boda en absoluto?
El problema parecía tan difícil como el problema de las proteínas que estaba
trabajando en el laboratorio. Entonces la golpeó. Que era el problema que estaba trabajando
en el laboratorio. Una noche, mientras miraba sus gráficos de asientos, "me di cuenta
que había literalmente una correlación uno a uno entre los aminoácidos
y proteínas en mi tesis doctoral y personas sentadas en las mesas en mi boda ".
Bellows llamó a su prometido por un trozo de papel y comenzó a garabatear.
Página 223
ecuaciones. Los aminoácidos se convirtieron en invitados, las energías de unión se volvieron

relaciones, y las llamadas interacciones de vecino más cercano de las moléculas
se convirtieron, bueno, en interacciones con el vecino más cercano. Ella podría usar los algoritmos
de su investigación para resolver su propia boda.
Bellows ideó una manera de definir numéricamente la fuerza de la
relaciones entre todos los invitados. Si un par de personas en particular no supiera
entre ellos sacaban un 0, si tenían un 1, y si eran pareja
obtuvieron un 50. (La hermana de la novia llegó a dar un puntaje de 10 a todos los
personas con las que quería sentarse, como una prerrogativa especial).
especificó algunas restricciones: la capacidad máxima de la mesa y un mínimo
puntuación necesaria para cada mesa, de modo que ninguna mesa se convierta en el incómodo
Grupo “misceláneo” lleno de desconocidos. Ella también codificó el programa
objetivo: maximizar la puntuación de la relación entre los invitados y sus
compañeros de mesa.
Había 107 personas en la boda y 11 mesas, que podrían
acomodar a diez personas cada uno. Esto significa que había alrededor de 11107 posibles
planes de asientos: es un número de 112 dígitos, más de 200 mil millones de googols, un
cifra que eclipsa el número (de apenas 80 dígitos) de átomos en el observable
universo. Bellows envió el trabajo a la computadora de su laboratorio el sábado
tarde y déjelo batir. Cuando llegó el lunes por la mañana, todavía estaba
corriendo; ella hizo que escupiera la mejor tarea que había encontrado hasta ahora y la puso
de nuevo al diseño de proteínas.
Incluso con un grupo de computadoras de laboratorio de alta potencia y treinta y seis
horas de tiempo de procesamiento, no había forma de que el programa evaluara
más de una pequeña fracción de los posibles arreglos de asientos. Las probabilidades
son esa la solución verdaderamente óptima, la que se habría ganado la mismísima
puntaje más alto, nunca apareció en sus permutaciones. Aun así, Bellows estaba complacido
con los resultados de la computadora. “Identificó las relaciones que éramos
olvidarse ", dice, ofreciendo posibilidades encantadoras y poco convencionales
que los planificadores humanos ni siquiera habían considerado. Por ejemplo, propuso
quitando a sus padres de la mesa familiar, poniéndolos en su lugar con viejos
amigos que no habían visto en años. Su recomendación final fue una
Página 224
acuerdo que todas las partes acordaron fue un éxito, aunque la madre del
la novia no pudo resistirse a hacer unos pocos ajustes manuales.
El hecho de que toda la potencia informática de un laboratorio en Princeton no pudiera encontrar
el plan de asientos perfecto puede parecer sorprendente. En la mayoría de los dominios
que hemos discutido hasta ahora, los algoritmos sencillos podrían garantizar un óptimo
soluciones. Pero como los científicos de la computación han descubierto en los últimos
décadas, hay clases enteras de problemas donde una solución perfecta es
esencialmente inalcanzable, no importa qué tan rápido hagamos nuestras computadoras o cuán
los programamos inteligentemente. De hecho, nadie entiende tan bien como un
informático que ante un desafío aparentemente inmanejable,
no deberías esforzarte eternamente ni rendirte, pero, como veremos, prueba una tercera
cosa por completo.
La dificultad de la optimización
Antes de dirigir al país a través de la Guerra Civil Estadounidense, antes de redactar

la Proclamación de Emancipación o el discurso de Gettysburg,
Abraham Lincoln trabajó como "abogado de la pradera" en Springfield, Illinois,
viajando por el Octavo Circuito Judicial dos veces al año durante dieciséis años. Ser un
abogado de circuito significaba literalmente hacer un circuito: moverse por ciudades en
catorce condados diferentes para juzgar casos, recorriendo cientos de millas a lo largo de muchos
semanas. La planificación
ciudades necesarias de estos
cubriendo circuitos
el menor planteaba
número unde
posible desafío natural:
kilómetros cómo
y sin ir visitar todos los
a cualquier ciudad dos veces.
Este es un ejemplo de lo que conocen los matemáticos y las computadoras.
científicos como un problema de "optimización restringida": cómo encontrar el único
mejor disposición de un conjunto de variables, dadas reglas particulares y un
medida de contabilidad. De hecho, es el problema de optimización más famoso de
el centro comercial. Si se hubiera estudiado en el siglo XIX, podría haber
ser conocido para siempre como "el problema de los abogados de la pradera", y si hubiera
surgió en el siglo XXI podría haber sido apodado "el
problema del dron de entrega ". Pero al igual que el problema de la secretaria, surgió en el
Página 225
mediados del siglo XX, un período inequívocamente evocado por su canónica

nombre: "el problema del viajante".
El problema de la planificación de rutas no llamó la atención de los
comunidad matemática hasta la década de 1930, pero luego lo hizo con un
venganza. El matemático Karl Menger habló de “el mensajero postal
problema ”en 1930, señalando que no se conocía una solución más fácil que simplemente
probando todas las posibilidades por turno. Hassler Whitney planteó el problema en un
1934 charla en Princeton, donde se alojó firmemente en el cerebro de sus compañeros
matemático Merrill Flood (quien, como recordará del capítulo 1, también es
se le atribuye haber circulado la primera solución al problema de la secretaria). Cuando
Flood se mudó a California en la década de 1940 y lo difundió a su vez entre sus colegas.
en el Instituto RAND, y el nombre icónico del problema apareció por primera vez impreso
en un artículo de 1949 de la matemática Julia Robinson. Mientras el problema barría
a través de círculos matemáticos, ganó notoriedad. Muchos de los mas grandes
mentes de la época obsesionadas con él, y nadie parecía capaz de hacer realidad
progreso.
En el problema del viajante de comercio, la cuestión no es si una computadora
(o un matemático) podría encontrar la ruta más corta: teóricamente, uno puede
simplemente haga una lista de todas las posibilidades y mida cada una. Bastante,
El problema es que a medida que crece el número de pueblos, la lista de posibles rutas
conectarlos explota. Una ruta es solo un ordenamiento de las ciudades, por lo que
probarlos todos por la fuerza bruta es el temido O ( n !) "tiempo factorial": el
equivalente computacional de clasificar una baraja de cartas arrojándolas en el
aire hasta que aterrizan en orden.
La pregunta es: ¿hay alguna esperanza de hacerlo mejor?
Décadas de trabajo hicieron poco para dominar el problema de los viajantes.
Flood, por ejemplo, escribió en 1956, más de veinte años después de la primera
encontrarlo: "Parece muy probable que un enfoque bastante diferente de
cualquiera que se haya utilizado hasta ahora puede ser necesario para el tratamiento satisfactorio del pr
De hecho, es posible que no exista un método general para tratar el problema y
los resultados de imposibilidad también serían valiosos ". Otra década después, el
el estado de ánimo era sólo más sombrío. "Supongo", escribió Jack Edmonds, "que hay
no es un buen algoritmo para el problema del viajante ".
Página 226
Estas palabras resultarían proféticas.
Definición de dificultad
A mediados de la década de 1960, Edmonds, en el Instituto Nacional de Estándares y

Technology, junto con Alan Cobham de IBM, desarrolló un trabajo
definición de lo que hace que un problema sea factible de resolver o no. Ellos afirmaron
lo que ahora se conoce como la tesis de Cobham-Edmonds: un algoritmo debería ser
se considera "eficiente" si se ejecuta en lo que se denomina "tiempo polinomial", es decir,
O ( n 2 ), O ( n 3 ), o de hecho n elevado a cualquier número. Un problema, en
a su vez, se considera "manejable" si sabemos cómo resolverlo utilizando un eficiente
algoritmo. Un problema que no sabemos cómo resolver en tiempo polinomial, en
por otro lado, se considera "intratable". Y en cualquier cosa menos en lo más pequeño
escalas, los problemas intratables están fuera del alcance de la solución por las computadoras,
no importa lo poderoso que sea. *
Esto equivale a lo que podría decirse que es la idea central de la informática.
Ciencias. Es posible cuantificar la dificultad de un problema. Y algo
los problemas son ... difíciles .
¿Dónde deja esto el problema del viajante de comercio? Curiosamente
suficiente, todavía no estamos muy seguros. En 1972, Richard Karp de Berkeley
demostró que el problema del viajante está vinculado a un
controvertidamente limítrofe de problemas que aún no han sido
Definitivamente probado para ser eficientemente solucionable o no. Pero tan lejos
no se han encontrado soluciones eficientes para ninguno de esos problemas, haciendo
son efectivamente intratables, y la mayoría de los científicos informáticos creen que
no hay ninguno que se pueda encontrar. Entonces, el "resultado de imposibilidad" para el viaje
El problema del vendedor que Flood imaginó en la década de 1950 probablemente sea su
destino final. Además, muchos otros problemas de optimización, con
implicaciones para todo, desde la estrategia política hasta la salud pública y los incendios
seguridad — son igualmente intratables.
Pero para los científicos de la computación que luchan con tales problemas, este
veredicto no es el final de la historia. En cambio, es más como un llamado a las armas.
Habiendo determinado que un problema es intratable, no puede simplemente vomitar
Página 227
manos. Como nos dijo el experto en programación Jan Karel Lenstra: “Cuando el problema
es difícil, no significa que puedas olvidarlo, significa que está en
un estado diferente. Es un enemigo serio, pero aún tienes que luchar contra él ". Y
aquí es donde el campo descubrió algo invaluable, algo que podemos
todos aprenden de: cómo abordar mejor los problemas cuyas respuestas óptimas son
fuera de alcance. Cómo relajarse.
Relájate
Lo perfecto es el enemigo de lo bueno.

—VOLTAIRE
Cuando alguien te dice que te relajes, probablemente sea porque estás tenso ...
haciendo cosas más grandes de las que debería. Cuando los informáticos
se enfrentan a un desafío formidable, sus mentes también se vuelven hacia la relajación, ya que
pasan libros como Introducción a los métodos de relajación o
Técnicas de relajación discretas . Pero no se relajan; ellos se relajan
el problema.
Una de las formas más simples de relajación en informática se conoce como
Restricción Relajación . En esta técnica, los investigadores eliminan algunos de los
limitaciones del problema y se dispusieron a resolver el problema que desearían tener.
Luego, después de haber logrado cierto progreso, intentan agregar el
restricciones. Es decir, hacen que el problema sea más fácil de resolver temporalmente.
manejar antes de devolverlo a la realidad.
Por ejemplo, puede relajar el problema del vendedor ambulante dejando que el
vendedor visita la misma ciudad más de una vez, y le permite volver sobre su
pasos gratis. Encontrar la ruta más corta bajo estas reglas más flexibles produce
lo que se llama el "árbol de expansión mínimo". (Si lo prefiere, también puede
Piense en el árbol de expansión mínimo como la menor cantidad de millas de carretera necesarias para
conectar cada ciudad con al menos otra ciudad. El viaje más corto
la ruta del vendedor y el árbol de expansión mínimo para el circuito judicial de Lincoln
se muestran a continuación). Como resultado, resolver este problema más flexible requiere un
computadora esencialmente no hay tiempo en absoluto. Y mientras que el árbol de expansión mínimo
Página 228
no necesariamente conduce directamente a la solución del problema real, es

bastante útil de todos modos. Por un lado, el árbol de expansión, con su libre
retroceder, nunca será más largo que la solución real, que tiene que
sigue todas las reglas. Por lo tanto, podemos utilizar el problema relajado: la fantasía
—Como límite inferior de la realidad. Si calculamos que el árbol de expansión
distancia para un conjunto particular de ciudades es de 100 millas, podemos estar seguros de que
La distancia del viajante de comercio no será menor que eso. Y si encontramos, digamos, un
Ruta de 110 millas, podemos estar seguros de que es como mucho un 10% más larga que la mejor
solución. Por lo tanto, podemos comprender qué tan cerca estamos de la respuesta real.
incluso sin saber qué es.
Página 229
Figura 8.1 La ruta más corta del vendedor ambulante (arriba) y el árbol de expansión mínimo (abajo) para
Circuito judicial de Lincoln de 1855.
Aún mejor, en el problema del viajante resulta que el

El árbol de expansión mínimo es en realidad uno de los mejores puntos de partida desde
que para comenzar una búsqueda de la solución real. Enfoques como estos tienen
permitió incluso uno de los mayores problemas imaginables de viajantes de comercio:
encontrar la ruta más corta que visita todos los pueblos de la Tierra: ser
resuelto dentro de menos del 0.05% de la solución óptima (desconocida).
Página 230
Aunque la mayoría de nosotros no hemos encontrado la versión algorítmica formal

de la relajación de restricciones, su mensaje básico es familiar para casi todo el mundo
que ha soñado en grande con las preguntas de la vida. ¿Qué harías si no fueras?
¿temeroso? lee un mantra que podría haber visto en la oficina de un consejero vocacional
o escuchado en un seminario motivacional. ¿Qué harías si no pudieras fallar?
Del mismo modo, al considerar cuestiones de profesión o carrera, preguntamos
preguntas como ¿Qué harías si ganaras la lotería? o, tomando un
rumbo diferente, ¿qué harías si todos los trabajos pagaran lo mismo? La idea
Detrás de tales ejercicios de pensamiento está exactamente el de la relajación de restricción: para
hacer lo intratable manejable, para progresar en un mundo idealizado que
se puede portar de nuevo al real. Si no puede resolver el problema frente a
usted, resuelva una versión más sencilla y luego vea si esa solución le ofrece una
punto de partida, o una baliza, en el problema en toda regla. Quizás sí.
Lo que la relajación no puede hacer es ofrecerle un atajo garantizado al
Respuesta perfecta. Pero la informática también puede cuantificar la compensación que
la relajación ofrece entre el tiempo y la calidad de la solución. En muchos casos, la relación
es dramático, una obviedad, por ejemplo, una respuesta al menos la mitad de buena que
la solución perfecta en una billonésima parte del tiempo. El mensaje es simple pero
profundo: si estamos dispuestos a aceptar soluciones que sean lo suficientemente cercanas, entonces
incluso algunos de los problemas más complicados que existen se pueden domesticar con la
técnicas.
Eliminación temporal de restricciones, como en el árbol de expansión mínimo y
el "¿y si ganaras la lotería?" ejemplos, es el más sencillo
forma de relajación algorítmica. Pero también hay otros dos tipos más sutiles de
relajación que aparece repetidamente en la investigación de optimización. Ellos tienen
ha demostrado ser fundamental para resolver algunos de los problemas más importantes del campo.
problemas intratables, con implicaciones directas del mundo real para todo
desde la planificación urbana y el control de enfermedades hasta el cultivo de rivalidades atléticas.
Innumerables tonos de gris: relajación continua
El problema del viajante, como la búsqueda de lo mejor de Meghan Bellows

disposición de los asientos, es un tipo particular de problema de optimización conocido como
Página 231
"Optimización discreta", es decir, no hay una continuidad uniforme entre sus

soluciones. El vendedor va a este pueblo o al otro; tu eres cualquiera
en la mesa cinco o en la mesa seis. No hay tonos de gris en el medio.
Estos problemas de optimización discretos nos rodean. En las ciudades, para
Por ejemplo, los planificadores intentan colocar camiones de bomberos para que se pueda llegar a todas
dentro de un período de tiempo fijo, digamos, cinco minutos. Matemáticamente, cada fuego
camión "cubre" cualquier casa a la que se pueda llegar en cinco minutos desde su
localización. El desafío es encontrar el conjunto mínimo de ubicaciones de modo que todos
las casas están cubiertas. “Toda la profesión [de bomberos y emergencias] acaba
adoptó este modelo de cobertura, y es genial ", dice la Universidad de Wisconsin.
Laura Albert McLay de Madison. "Es algo agradable y claro que podemos modelar". Pero
ya que un camión de bomberos existe en una ubicación o no, calculando que
el conjunto mínimo implica una optimización discreta. Y como señala McLay, "eso es
donde muchos problemas se vuelven computacionalmente difíciles, cuando no puedes hacer
la mitad de esto y la mitad de aquello ".
El desafío de la optimización discreta también se muestra en entornos sociales.
Imagina que quisieras organizar una fiesta para todos tus amigos y conocidos,
pero no quería pagar todos los sobres y sellos que tantos
las invitaciones conllevarían. En su lugar, podría decidir enviar invitaciones a un
pocos amigos bien conectados, y dígales que "traigan a todos los que conocemos".
Lo que idealmente querría encontrar, entonces, es el subgrupo más pequeño de su
amigos que conocen al resto de su círculo social, lo que le permitiría
lamer la menor cantidad de sobres y lograr que todos asistan. Concedido, esto
puede parecer mucho trabajo solo para ahorrar unos dólares en sellos, pero es
exactamente el tipo de problema que los gerentes de campañas políticas y las empresas
los especialistas en marketing quieren resolver para difundir su mensaje de la manera más eficaz. Y es
También el problema que los epidemiólogos estudian al pensar, digamos,
número mínimo de personas en una población (y qué personas)
vacunar para proteger a la sociedad de las enfermedades transmisibles.
Como señalamos, el compromiso de la optimización discreta con los números enteros, un
El departamento de bomberos puede tener un motor en el garaje, o dos, o tres, pero no
dos camiones y medio de bomberos, o π de ellos, es lo que hace discretos
problemas de optimización tan difíciles de resolver. De hecho, tanto el problema del camión de bombero
Página 232
y el problema de la invitación a la fiesta son insolubles: no hay
existe una solución para ellos. Pero, resulta que existen varios
estrategias eficientes para resolver las versiones continuas de estos problemas,
donde cualquier fracción o decimal es una posible solución. Investigadores confrontados
con un problema de optimización discreto podría mirar esas estrategias
con envidia, pero también pueden hacer más que eso. Pueden intentar relajar sus
problema discreto en uno continuo y ver qué pasa.
En el caso del problema de la invitación, relajarlo de discreto a
optimización continua significa que una solución puede indicarnos que enviemos a alguien
una cuarta parte de una invitación y otra persona dos tercios de una. Que hace
eso incluso significa? Obviamente, no puede ser la respuesta a la pregunta original,
pero, como el árbol de expansión mínimo, nos da un lugar para comenzar. Con
la solución relajada en la mano, podemos decidir cómo traducir esas fracciones
de vuelta a la realidad. Podríamos, por ejemplo, elegir simplemente redondearlos como
necesario, enviando invitaciones a todos los que recibieron "media invitación" o
más en el escenario relajado. También podríamos interpretar estas fracciones como
probabilidades, por ejemplo, lanzar una moneda por cada lugar donde el
La solución relajada nos dice que coloquemos medio camión de bomberos y, de hecho, coloquemos un ca
allí solo si aterriza cabezas. En cualquier caso, con estas fracciones invertidas
a números enteros, tendremos una solución que tenga sentido en el contexto de
nuestro problema original y discreto.
El paso final, como con cualquier relajación, es preguntarse qué tan buena es esta solución.
en comparación con la mejor solución real que podríamos haber encontrado por
Comprobando exhaustivamente todas y cada una de las posibles respuestas al problema original.
Resulta que para el problema de las invitaciones, Relajación Continua con
el redondeo nos dará una solución fácilmente calculada que no es tan mala: es
matemáticamente garantizado para llevar a todos los que quieras a la fiesta mientras
enviar como máximo el doble de invitaciones que la mejor solución
obtenible por fuerza bruta. De manera similar, en el problema del camión de bomberos, Continuous
La relajación con probabilidades puede llevarnos rápidamente dentro de un límite cómodo
de la respuesta óptima.
La relajación continua no es una fórmula mágica: todavía no nos da un
manera eficiente de llegar a las respuestas verdaderamente óptimas, solo a sus
Página 233
aproximaciones. Pero entregar el doble de correos o vacunas que

óptimo sigue siendo mucho mejor que las alternativas no optimizadas.
Solo una multa por exceso de velocidad: relajación lagrangiana
Vizzini: ¡Inconcebible!
Iñigo Montoya: Sigues usando esa palabra. No creo que signifique lo que
crees que significa.
- LA PRINCESA NOVIA
Un día, cuando era niño, Brian se quejaba con su madre por todos los
cosas que tenía que hacer: sus deberes, sus quehaceres… “Técnicamente, no
tengo que hacer cualquier cosa ”, respondió su madre. "No tienes que hacer lo que tu
los maestros te lo dicen. No tienes que hacer lo que te digo. Ni siquiera tienes
obedecer la ley. Hay consecuencias para todo, y llegas a
decide si quieres afrontar esas consecuencias ".
La mente de niño de Brian estaba alucinada. Fue un mensaje poderoso, un despertar
de un sentido de agencia, responsabilidad, juicio moral. Era algo más,
también: una poderosa técnica computacional llamada Relajación Lagrangiana .
La idea detrás de Lagrangian Relaxation es simple. Un problema de optimización
tiene dos partes: las reglas y el registro de resultados. En Relajación Lagrangiana,
tomar algunas de las limitaciones del problema y convertirlas en la puntuación
sistema en su lugar. Es decir, tomamos lo imposible y lo rebajamos a costoso.
(En la optimización de los asientos de una boda, por ejemplo, podríamos relajar la
restricción de que cada mesa tiene capacidad para diez personas como máximo, lo que permite que las m
con algún tipo de penalización.) Cuando se produce un problema de optimización
restricciones dicen "¡Hazlo, o de lo contrario!", La relajación lagrangiana responde, "O si no
¿qué?" Una vez que podamos colorear fuera de las líneas, aunque sea un poco, e incluso
a un costo elevado, los problemas se vuelven manejables que antes no eran manejables.
Las relajaciones lagrangianas son una gran parte de la literatura teórica sobre
El problema del viajante y otros problemas difíciles en la computadora.
Ciencias. También son una herramienta fundamental para una serie de aplicaciones prácticas.
Página 234
Por ejemplo, recuerde a Michael Trick de Carnegie Mellon, quien, como

mencionado en el capítulo 3, está a cargo de la programación de las Grandes Ligas
Béisbol y varias conferencias de la NCAA. Lo que no habíamos mencionado
así es como lo hace. La composición del programa de cada año es un gigante
Problema de optimización discreto, demasiado complejo para que lo resuelva cualquier computadora
por fuerza bruta. Así que cada año, Trick y sus colegas de Sports
El grupo de programación recurre a la relajación lagrangiana para hacer el trabajo. Cada
vez que encienda la televisión o tome asiento en un estadio, sepa que el
reunión de esos equipos en esa cancha en esa noche en particular ... bueno, no es
necesariamente el emparejamiento óptimo. Pero está cerca. Y para eso no tenemos
sólo Michael Trick, pero el matemático francés del siglo XVIII Joseph-
Louis Lagrange para agradecer.
Al programar una temporada deportiva, Trick descubre que la relajación continua
que describimos anteriormente no necesariamente le hace la vida más fácil. "Si terminas
con juegos fraccionarios, simplemente no obtienes nada útil ". Es una cosa
para terminar con asignaciones fraccionarias de invitaciones a fiestas o camiones de bomberos,
donde los números siempre se pueden redondear hacia arriba si es necesario. Pero en los deportes, el
restricciones de números
jugado en suma, y cuántasenteros: sobre
veces cada cuántos
equipo equipos
juega contrajuegan un juego,
los demás cuántos
equipos, son juegos son
demasiado fuerte. “Por eso no podemos relajarnos en esa dirección. Realmente tenemos
tengo que mantener la parte fundamental [discreta] del modelo ".
No obstante, hay que hacer algo para tener en cuenta la pura
complejidad del problema. Así que “tenemos que trabajar con las ligas para relajarnos
algunas de las limitaciones que les gustaría tener ”, explica Trick. los
El número de estas limitaciones que intervienen en la programación de una temporada deportiva es
inmensa, e incluye no sólo los requisitos derivados de la
estructura básica de la liga, sino también todo tipo de solicitudes idiosincrásicas y
escrúpulos. Algunas ligas están bien con la segunda mitad de la temporada reflejada
el primero, solo con los partidos en casa y fuera de casa invertidos; otras ligas no quieren
esa estructura, pero no obstante exigen que ningún equipo se reúnan por segunda vez
hasta que ya hayan conocido a todos los demás equipos una vez. Algunas ligas insisten en
haciendo que las rivalidades más famosas ocurran en el último partido de la temporada.
Algunos equipos no pueden jugar partidos en casa en determinadas fechas debido a conflictos
Página 235
eventos en sus arenas. En el caso del baloncesto de la NCAA, Trick también tiene que
considerar otras limitaciones provenientes de las cadenas de televisión que
retransmitir los juegos. Los canales de televisión definen con un año de antelación lo que
anticipan que los "juegos A" y los "juegos B" serán los juegos que atraerán
la mayor audiencia. (Duke vs. UNC es un juego A perenne, por ejemplo).
Luego, los canales esperan un juego A y un juego B cada semana, pero
nunca dos juegos A al mismo tiempo, no sea que se divida la audiencia.
Como era de esperar, dadas todas estas demandas, Trick ha descubierto que la informática
un horario deportivo a menudo se vuelve posible solo suavizando algunos de estos
restricciones duras.
Por lo general, cuando las personas acuden a nosotros por primera vez con un calendario deportivo, dirán ... "Nunca
hacemos x y nosotros nunca hacemos y ". Luego miramos sus horarios y decimos: "Bueno, dos veces lo hiciste x
y tres veces más que lo hicieron y el año pasado “. Luego “Oh, sí, bueno, está bien. Entonces, aparte de eso, nunca
hazlo." Y luego volvemos al año anterior ... En general, nos damos cuenta de que hay algunas cosas
piensan que nunca hacen que las personas no lo hacen. La gente en el béisbol cree que los Yankees y los
Los Mets nunca están en casa al mismo tiempo. Y no es verdad. Nunca ha sido verdad. Están en
en casa quizás tres juegos, quizás seis juegos en un año el mismo día. Pero en el amplio
temporada, ochenta y un partidos en casa para cada uno de los equipos, es relativamente raro, la gente se olvida
ellos.
De vez en cuando se necesita un poco de delicadeza diplomática, pero un lagrangiano

Relajación: donde algunas imposibilidades se reducen a penas, la
inconcebible para lo indeseable, permite avanzar. Como truco
dice, en lugar de pasar eones buscando un perfecto inalcanzable
respuesta, el uso de la relajación lagrangiana le permite hacer preguntas como,
"¿Qué tan cerca puedes acercarte?" Resulta que lo suficientemente cerca para hacer que todos
feliz —la liga, las escuelas, las redes— y avivar las llamas de
March Madness, año tras año.
Aprendiendo a relajarse
De las diversas formas en que se nos presentan las preguntas computacionales,

Los problemas de optimización (objetivos de una parte, reglas de una parte) son posiblemente los
más común. Y problemas de optimización discretos , donde nuestras opciones están
Página 236
las opciones marcadas de uno u otro, sin un término medio, son las más típicas de ellas.
Aquí, la informática da un veredicto desalentador. Muchos discretos
Los problemas de optimización son realmente difíciles. Las mentes más brillantes del campo han llegado
vacío en cada intento de encontrar un camino fácil hacia respuestas perfectas, y en
De hecho, están cada vez más dedicados a demostrar que tales caminos no existen.
que buscarlos.
Al menos, esto debería ofrecernos algún consuelo. Si estamos en contra
un problema que parece retorcido, espinoso, intransitable, bueno, podríamos tener razón.
Y tener una computadora no necesariamente ayudará.
Al menos, no a menos que podamos aprender a relajarnos.
Hay muchas formas de relajar un problema, y hemos visto tres de las
lo más importante. El primero, la relajación de restricciones, simplemente elimina algunos
restricciones por completo y avanza en una forma más flexible del problema
antes de volver a la realidad. El segundo, Relajación Continua, gira
opciones discretas o binarias en continuos: al decidir entre té helado
y limonada, primero imagina una mezcla 50-50 "Arnold Palmer" y luego redondea
hacia arriba o hacia abajo. El tercero, la relajación lagrangiana, convierte las imposibilidades en
meras penas, enseñando el arte de doblar las reglas (o romperlas y
aceptando las consecuencias). Una banda de rock decidiendo qué canciones meter
en un conjunto limitado, por ejemplo, se enfrenta a lo que los informáticos llaman
el "problema de la mochila", un acertijo que pide a uno que decida cuál de un conjunto de
artículos de diferente volumen e importancia para envasar en un volumen reducido. En
En su formulación estricta, el problema de la mochila es famoso por su intratable, pero que
No es necesario que desanime a nuestras relajadas estrellas de rock. Como se demostró en varios
ejemplos célebres, a veces es mejor simplemente jugar un poco más allá de la ciudad
toque de queda e incurrir en las multas correspondientes que limitar el espectáculo a los disponibles
espacio. De hecho, incluso cuando no cometas la infracción, simplemente imaginando
puede ser esclarecedor.
El columnista británico conservador Christopher Booker dice que "cuando
nos embarcamos en un curso de acción que es impulsado inconscientemente por deseos
pensando, todo puede parecer ir bien por un tiempo ”, pero eso debido a que“ esto hace que
creer que nunca se puede reconciliar con la realidad ”, conducirá inevitablemente a lo que
describe como un desglose de varias etapas: "sueño", "frustración",
Página 237
"Pesadilla", "explosión". La informática pinta un panorama dramáticamente más optimista

vista. Por otra parte, como técnica de optimización, la relajación se trata de estar
impulsado conscientemente por ilusiones. Quizás eso es en parte lo que hace
la diferencia.
Las relajaciones nos ofrecen una serie de ventajas. Por un lado, ofrecen un
vinculado a la calidad de la verdadera solución. Si estamos tratando de empacar nuestro
calendario, imaginar que podemos teletransportarnos mágicamente a través de la ciudad
instantáneamente dejar en claro que ocho reuniones de una hora es lo máximo que
posiblemente podría esperar encajar en un día; tal límite podría ser útil en
establecer expectativas antes de enfrentar el problema completo. Segundo, relajaciones
están diseñados para que puedan reconciliarse con la realidad, y esto
nos da límites a la solución desde la otra dirección. Cuando es continuo
La relajación nos dice que demos vacunas fraccionadas, simplemente podemos inmunizarnos
todas las personas asignadas para recibir la mitad de una vacuna o más, y terminan con una
Solución fácilmente calculada que requiere, en el peor de los casos, el doble de inoculaciones.
como en un mundo perfecto. Quizás podamos vivir con eso.
A menos que estemos dispuestos a pasar eones luchando por la perfección cada vez que
encontrar un enganche, los problemas difíciles exigen que en lugar de hacer girar nuestros neumáticos
imaginamos versiones más fáciles y las abordamos primero. Cuando se aplica correctamente,
esto no es solo una ilusión, no es una fantasía o un soñar despierto. Es uno de
nuestras mejores formas de progresar.
Página 238
*Puede parecer extraño, dado que O ( n 2 ) parecía tan odioso en el contexto de clasificación, llamarlo "eficiente"
aquí. Pero la verdad es que incluso el tiempo exponencial con un número base modestamente pequeño, como O (2 n ),
rápidamente se vuelve infernal incluso cuando se compara con un polinomio con una base grande, como n 10 . El exponente
siempre superará al polinomio en algún tamaño de problema; en este caso, si está ordenando más de
varias docenas de elementos, n 10 comienza a parecerse a un paseo por el parque en comparación con 2 n . Desde que Cobham y
El trabajo de Edmonds, este abismo entre "polinomios" ( n -to-the-something) y "exponenciales"
(algo-a-la- n ) ha servido como el marcador de fuera de límites de facto del campo.
Página 239
9 Aleatoriedad
Cuándo dejarlo al azar
Debo admitir que después de muchos años de trabajo en esta área, la eficacia de
La aleatoriedad para tantos problemas algorítmicos es absolutamente misteriosa.
a mi. Es eficiente, funciona; pero por qué y cómo es absolutamente
misterioso.
—MICHAEL RABIN
La aleatoriedad parece lo opuesto a la razón: una forma de renunciar a un

problema, un último recurso. Lejos de ahi. Lo sorprendente y cada vez más
El importante papel de la aleatoriedad en la informática nos muestra que hacer uso
del azar puede ser una parte deliberada y efectiva de abordar las situaciones más difíciles
conjuntos de problemas. De hecho, hay momentos en los que nada más servirá.
En contraste con los algoritmos "deterministas" estándar, normalmente
Imagine que las computadoras usan, donde un paso sigue a otro en exactamente
de la misma manera cada vez, un algoritmo aleatorio utiliza generados aleatoriamente
números para resolver un problema. El trabajo reciente en ciencias de la computación ha demostrado
que hay casos en los que los algoritmos aleatorios pueden producir buenos
respuestas aproximadas a preguntas difíciles más rápido que todos los conocidos
algoritmos deterministas. Y aunque no siempre garantizan la
soluciones óptimas, los algoritmos aleatorios pueden acercarse sorprendentemente a ellos
en una fracción del tiempo, simplemente lanzando estratégicamente algunas monedas mientras su
los primos deterministas lo sudan.
Página 240
Hay un mensaje profundo en el hecho de que, en ciertos problemas, los

Los enfoques pueden superar incluso a los mejores deterministas. A veces el
La mejor solución a un problema es recurrir al azar en lugar de tratar de
razonar una respuesta.
Pero el simple hecho de saber que la aleatoriedad puede ser útil no es suficiente.
Necesita saber cuándo confiar en el azar, de qué manera y en qué medida.
La historia reciente de la informática ofrece algunas respuestas, aunque el
La historia comienza un par de siglos antes.
Muestreo
En 1777, George-Louis Leclerc, conde de Buffon, publicó los resultados de

un interesante análisis probabilístico. Si dejamos caer una aguja en una pieza forrada
de papel, preguntó, ¿qué probabilidad hay de cruzar una de las líneas? El trabajo de Buffon
demostró que si la aguja es más corta que el espacio entre los blines, el
La respuesta es 2 ⁄ π veces la longitud de la aguja dividida por la longitud del espacio. Para
Buffon, derivar esta fórmula fue suficiente. Pero en 1812, Pierre-Simon
Laplace, uno de los héroes del capítulo 6, señaló que este resultado ha
otra implicación: se podría estimar el valor de π simplemente eliminando
agujas sobre papel.
La propuesta de Laplace apuntaba a una profunda verdad general: cuando queremos
saber algo acerca de una cantidad compleja, podemos estimar su valor por
muestreo de ella. Este es exactamente el tipo de cálculo en el que su trabajo
La regla de Bayes nos ayuda a desempeñarnos. De hecho, siguiendo la sugerencia de Laplace,
Varias personas han llevado a cabo exactamente el experimento que sugirió,
confirmando que es posible, aunque no particularmente eficiente,
Estime el valor de π de esta manera práctica.*
Lanzar miles de agujas sobre papel rayado lo convierte en un interesante
pasatiempo (para algunos), pero se necesitó el desarrollo de la computadora para hacer
muestreo en un método práctico. Antes, cuando matemáticos y
Los físicos intentaron usar la aleatoriedad para resolver problemas, sus cálculos habían
trabajar laboriosamente a mano, por lo que era difícil generar suficiente
Página 241
muestras para producir resultados precisos. Computadoras, en particular, la computadora

desarrollado en Los Alamos durante la Segunda Guerra Mundial — marcó la diferencia.
Stanislaw "Stan" Ulam fue uno de los matemáticos que ayudó
desarrollar la bomba atómica. Habiendo crecido en Polonia, se mudó a la
Estados Unidos en 1939 y se unió al Proyecto Manhattan en 1943. Después de un
breve regreso a la academia estaba de regreso en Los Alamos en 1946, trabajando en
el diseño de armas termonucleares. Pero también estaba enfermo, tenía
contrajo encefalitis y se sometió a una cirugía cerebral de emergencia. Y como el
se recuperó de su enfermedad, le preocupaba si recuperaría su
habilidades matemáticas.
Mientras estaba convaleciente, Ulam jugó muchas cartas, particularmente al solitario
(también conocido como Klondike). Como sabe cualquier jugador de solitario, algunas barajas del mazo
producir juegos que simplemente no se pueden ganar. Así que mientras jugaba Ulam, se preguntó a sí mi
una pregunta natural: ¿cuál es la probabilidad de que un mazo barajado produzca un
juego que se puede ganar?
En un juego como el solitario, razonando a través del espacio de
las posibilidades se vuelven casi instantáneamente abrumadoras. Da la vuelta a la primera carta,
y hay cincuenta y dos juegos posibles de los que realizar un seguimiento; voltea el segundo,
y hay cincuenta y una posibilidades para cada primera carta. Eso significa que estamos
ya en miles de juegos posibles antes de que incluso hayamos comenzado a
juego. F. Scott Fitzgerald escribió una vez que "la prueba de una inteligencia de primera
es la capacidad de tener dos ideas opuestas en mente al mismo tiempo y aún
conservar la capacidad de funcionar ". Eso puede ser cierto, pero no de primera
inteligencia, humana o de otro tipo, posiblemente pueda contener los ochenta unvigintillion
posibles órdenes de barajado barajado en mente y tener alguna esperanza de funcionamiento.
Después de probar algunos cálculos combinatorios elaborados de este tipo y
Rindiéndose, Ulam aterrizó en un enfoque diferente, hermoso en su simplicidad:
solo juega el juego .
Me di cuenta de que puede ser mucho más práctico [intentar] ... tirar las cartas o
experimentando con el proceso y simplemente observando qué proporción sale con éxito,
en lugar de tratar de calcular todas las posibilidades combinatorias que son exponencialmente
número creciente tan grande que, excepto en casos muy elementales, no hay forma de estimarlo.
Esto es intelectualmente sorprendente y, si no es exactamente humillante, le da a uno una sensación de
Página 242
modestia sobre los límites del pensamiento racional o tradicional. En un lo suficientemente complicado
problema, el muestreo real es mejor que un examen de todas las cadenas de posibilidades.
Cuando dice "mejor", tenga en cuenta que no necesariamente se refiere a que el muestreo
le ofrecerá respuestas más precisas que un análisis exhaustivo: habrá
siempre habrá algún error asociado con un proceso de muestreo, aunque puede
reducirlo asegurándose de que sus muestras sean realmente aleatorias y tomando más
y más de ellos. Lo que quiere decir es que el muestreo es mejor porque da
usted una respuesta en absoluto, en los casos en que nada más lo hará.
La idea de Ulam, que el muestreo puede tener éxito donde falla el análisis, fue
También es crucial para resolver algunos de los difíciles problemas de física nuclear que
surgió en Los Alamos. Una reacción nuclear es un proceso de ramificación, donde
Las posibilidades se multiplican tan salvajemente como en las cartas: una partícula se divide en
dos, cada uno de los cuales puede llegar a golpear a otros, haciendo que se dividan a su vez,
etcétera. Calcular exactamente las posibilidades de algún resultado particular de
Ese proceso, con muchas, muchas partículas interactuando, es difícil hasta el punto de
imposibilidad. Pero simulándolo, con cada interacción como girar
sobre una nueva tarjeta, proporciona una alternativa.
Ulam desarrolló aún más la idea con John von Neumann, y trabajó
con Nicholas Metropolis, otro de los físicos de Manhattan
Proyecto, sobre implementación del método en la computadora de Los Alamos.
Metropolis nombró este enfoque, reemplazando la probabilidad exhaustiva
cálculos con simulaciones de muestra: el método de Monte Carlo , después de la
Casino de Montecarlo en Mónaco, un lugar igualmente dependiente de los caprichos
de casualidad. El equipo de Los Alamos pudo usarlo para resolver problemas clave en
física nuclear. Hoy en día, el Método Monte Carlo es uno de los pilares
de la informática científica.
Muchos de estos problemas, como el cálculo de las interacciones de subatómicas
partículas o las posibilidades de ganar en solitario, son intrínsecamente
probabilístico, por lo que resolverlos a través de un enfoque aleatorio como Monte
Carlo tiene bastante sentido. Pero quizás la realización más sorprendente
sobre el poder de la aleatoriedad es que se puede utilizar en situaciones en las que
el azar aparentemente no juega ningún papel en absoluto. Incluso si quieres la respuesta a un
Página 243
pregunta que es estrictamente sí o no, verdadera o falsa, sin probabilidades al respecto

lanzar algunos dados puede ser todavía parte de la solución.
Algoritmos aleatorios
La primera persona en demostrar las aplicaciones sorprendentemente amplias de
la aleatoriedad en ciencias de la computación fue Michael Rabin. Nacido en 1931 en
Breslau, Alemania (que se convirtió en Wrocław, Polonia, al final del Mundial
Segunda Guerra Mundial), Rabin era descendiente de una larga línea de rabinos. Su familia se fue
Alemania por Palestina en 1935, y allí fue desviado de la
camino rabínico que su padre le había trazado por la belleza de
matemáticas: descubriendo el trabajo de Alan Turing temprano en su licenciatura
carrera en la Universidad Hebrea y emigrar a los Estados Unidos para
comenzar un doctorado en Princeton. Rabin ganaría el premio Turing, el
equivalente en ciencias de la computación a un Nobel, para ampliar la teoría
informática para acomodar casos "no deterministas", donde un
La máquina no está obligada a seguir una sola opción, sino que tiene varias rutas.
podría seguir. En un año sabático en 1975, Rabin llegó al MIT en busca de un
nueva dirección de investigación a seguir.
Lo encontró en uno de los problemas más antiguos de todos: cómo identificar
números primos.
Los algoritmos para encontrar números primos se remontan al menos a la antigüedad.
Grecia, donde los matemáticos utilizaron un enfoque sencillo conocido como
el Tamiz de Erasotenos. El Tamiz de Erastothenes funciona de la siguiente manera: Para
encuentre todos los números primos menores que n , comience escribiendo todos los números de
1 an en secuencia. Luego tacha todos los números que sean múltiplos de 2,
además de sí mismo (4, 6, 8, 10, 12, etc.). Tome el siguiente número más pequeño que
no ha sido tachado (en este caso, 3) y tacha todos los múltiplos de ese
número (6, 9, 12, 15). Sigue así, y los números que quedan en
el final son los números primos.
Durante milenios, se creyó que el estudio de los números primos era, como GH
Hardy lo dijo, "una de las ramas más obviamente inútiles" de las matemáticas.
Pero dio un vuelco hacia la practicidad en el siglo XX, volviéndose fundamental en
Página 244
criptografía y seguridad online. Da la casualidad de que es mucho más fácil

multiplicar primos juntos que factorizarlos de nuevo. Con lo suficientemente grande
primos, digamos, mil dígitos, la multiplicación se puede hacer en una fracción
de un segundo, mientras que la factorización podría llevar literalmente millones de años; esta
hace lo que se conoce como una "función unidireccional". En el cifrado moderno,
por ejemplo, los números primos secretos conocidos solo por el remitente y el destinatario obtienen
multiplicados juntos para crear enormes números compuestos que se pueden
transmitido públicamente sin miedo, ya que factorizar el producto requeriría
cualquier espía demasiado tiempo para que valga la pena intentarlo. Por lo tanto, virtualmente todos
comienza la comunicación segura en línea, ya sea comercial, bancaria o por correo electrónico
con una búsqueda de números primos.
Esta aplicación criptográfica creó repentinamente algoritmos para encontrar
y comprobar los números primos es increíblemente importante. Y mientras el tamiz de
Erastotenos es eficaz, no es eficaz. Si desea comprobar si un
un número particular es primo, conocido como prueba de su "primordialidad", luego
Seguir la estrategia del tamiz requiere intentar dividirlo por todos los números primos.
a su raíz cuadrada. * Verificar si un número de seis dígitos es primo
requieren dividir por todos los 168 números primos menos de 1,000, no tan mal. Pero
Verificar un número de doce dígitos implica dividir entre 78,498 primos menos
más de 1 millón, y toda esa división rápidamente comienza a descontrolarse. los
los números primos utilizados en la criptografía moderna tienen cientos de dígitos; olvidar
sobre eso.
En el MIT, Rabin se encontró con Gary Miller, un recién graduado de la informática.
Departamento de Ciencias de Berkeley. En su tesis doctoral, Miller había desarrollado una
algoritmo intrigantemente prometedor y mucho más rápido para probar la primalidad, pero
había un pequeño problema: no siempre funcionaba.
Miller había encontrado un conjunto de ecuaciones (expresadas en términos de dos números,
n y x ) que siempre son verdaderas si n es primo, independientemente de los valores que
enchufar para x . Si resultan falsas incluso para un solo valor de x , entonces hay
de ninguna manera n puede ser primo; en estos casos, x se llama un "testigo" contra
primalidad. El problema, sin embargo, son los falsos positivos: incluso cuando n no es primo,
las ecuaciones se seguirán cumpliendo algunas veces. Esto pareció irse
El enfoque de Miller está colgando.
Página 245
Rabin se dio cuenta de que este era un lugar donde un paso fuera del
El mundo determinista de la informática podría ser valioso. Si el número n
es en realidad nonprime, ¿cuántos valores posibles de x darían un falso
positivo y declararlo un número primo? La respuesta, mostró Rabin, es no.
más de una cuarta parte. Entonces, para un valor aleatorio de x , si las ecuaciones de Miller
Si se hace realidad, solo existe una probabilidad de uno en cuatro de que n no sea realmente primo.
Y lo que es más importante, cada vez que muestreamos una nueva x aleatoria y las ecuaciones de Miller
mira, la probabilidad de que n solo parezca primo, pero en realidad no lo es, cae por
otro múltiplo de cuatro. Repita el procedimiento diez veces y la probabilidad
de un falso positivo es uno en cuatro elevado a la décima potencia, menos de uno en un
millón. ¿Aún no tienes suficiente certeza? Comprueba otras cinco veces y estás
hasta uno en mil millones.
Vaughan Pratt, otro informático del MIT, implementó el método de Rabin
algoritmo y comenzó a obtener resultados a última hora de una noche de invierno, mientras Rabin estab
en casa invitando a amigos a una fiesta de Hanukkah. Rabin recuerda
recibir una llamada alrededor de la medianoche:
Michael, soy Vaughan. Obtengo el resultado de estos experimentos. Toma un lápiz y

papel y anote esto ". Y entonces tenía que 2 400 −593 es primo. Denota el producto de todos
primos p menores que 300 por k . Los números k × 338 + 821 y k × 338 + 823 son gemelos
primos. * Estos constituyeron los primos gemelos más grandes conocidos en ese momento. Mi cabello se puso de punta. Eso
fue increíble. Fue simplemente increíble.
La prueba de primalidad de Miller-Rabin, como se la conoce ahora, proporciona una forma de

Identificar rápidamente incluso números primos gigantes con un grado arbitrario de
certeza.
Aquí podríamos hacer una pregunta filosófica: sobre cuál es el significado de
"Es" es. Estamos tan acostumbrados a que las matemáticas sean un reino de certeza que es
chocante pensar que un número podría ser "probablemente primo" o "casi
definitivamente excelente ". ¿Qué tan cierto es lo suficientemente cierto? En la práctica, moderno
sistemas criptográficos, los que cifran las conexiones a Internet y
transacciones digitales, están sintonizados para una tasa de falsos positivos de menos de uno en un
millones de billones de billones. En otras palabras, es un decimal que comienza con
veinticuatro ceros: menos de un primo falso para el número de granos de
Página 246
arena en la tierra. Este estándar viene después de apenas cuarenta aplicaciones del
Prueba de Miller-Rabin. Es cierto que nunca está completamente seguro, pero puede obtener
terriblemente cerca, terriblemente rápido.
Aunque es posible que nunca haya oído hablar de la prueba Miller-Rabin, su computadora portátil,
tableta y teléfono lo saben bien. Varias décadas después de su descubrimiento, todavía es
el método estándar utilizado para buscar y verificar números primos en muchos dominios. Es
trabajar detrás de escena cada vez que usa su tarjeta de crédito en línea, y
casi en cualquier momento las comunicaciones seguras se envían por aire o por
alambres.
Durante décadas después del trabajo de Miller y Rabin, no se sabía si
alguna vez habrá un algoritmo eficiente que permita probar la primalidad en
moda determinista, con absoluta certeza. En 2002, uno de esos métodos
ser descubierto por Manindra Agrawal, Neeraj Kayal y Nitin Saxena en el
Instituto Indio de Tecnología, pero algoritmos aleatorios como Miller-
Los Rabin son mucho más rápidos y, por lo tanto, siguen siendo los que se utilizan en la práctica hoy en d
Y para algunos otros problemas, la aleatoriedad todavía proporciona el único conocido
ruta hacia soluciones eficientes. Un ejemplo curioso de las matemáticas es
conocido como "prueba de identidad polinomial". Si tienes dos polinomios
expresiones, como 2 x 3 + 13 x 2 + 22 x + 8 y (2 x + 1) × ( x + 2) × ( x + 4),
averiguar si esas expresiones son de hecho la misma función, mediante
hacer todas las multiplicaciones y luego comparar los resultados, puede ser increíblemente
requiere mucho tiempo, especialmente a medida que aumenta el número de variables.
Aquí nuevamente, la aleatoriedad ofrece un camino a seguir: solo genere algunos
x s aleatorios y conéctelos. Si las dos expresiones no son iguales,
Sería una gran coincidencia si dieran la misma respuesta para algunos
entrada generada aleatoriamente. Y una coincidencia aún mayor si también dieran
respuestas idénticas para una segunda entrada aleatoria. Y una coincidencia aún mayor
si lo hicieron por tres entradas aleatorias seguidas. Dado que no se conoce
algoritmo determinista para probar eficientemente la identidad polinomial, este
método aleatorio, con múltiples observaciones que rápidamente dan lugar a
casi certeza — es la única práctica que tenemos.
Página 247
En alabanza del muestreo
La prueba de identidad polinomial muestra que a veces nuestro esfuerzo se gasta mejor
Comprobación de valores aleatorios: muestreo de las dos expresiones que queremos
conocer — que tratar de desenredar su funcionamiento interno. Hasta cierto punto
esto parece razonablemente intuitivo. Dado un par de artilugios indescriptibles y
preguntó si son dos dispositivos diferentes o dos copias del mismo,
la mayoría de nosotros comenzaríamos a presionar botones aleatorios en lugar de abrir el
casos para examinar el cableado. Y no nos sorprende especialmente cuando, digamos,
un capo de la droga de la televisin abre algunos paquetes al azar para ser razonablemente
seguro de la calidad de todo el envío.
Sin embargo, hay casos en los que no recurrimos a la aleatoriedad y
Tal vez deberíamos.
Posiblemente el filósofo político más importante del siglo XX.
siglo fue John Rawls de Harvard, quien se propuso la ambiciosa tarea
de reconciliar dos ideas clave aparentemente opuestas en su campo: libertad y
igualdad . ¿Es una sociedad más "justa" cuando es más libre o más igualitaria? Y
¿Realmente los dos tienen que ser mutuamente excluyentes? Rawls ofreció una forma de
abordar este conjunto de preguntas que él llamó el "velo de la ignorancia".
Imagina, dijo, que estás a punto de nacer, pero no sabes quién:
hombre o mujer, rico o pobre, urbano o rural, enfermo o sano. Y antes
Al conocer su estado, tenía que elegir en qué tipo de sociedad viviría.
¿Qué te gustaría? Evaluando varios arreglos sociales desde
Tras el velo de la ignorancia, argumentó Rawls, llegaríamos más fácilmente a una
consenso sobre cómo se vería uno ideal.
Sin embargo, lo que el experimento mental de Rawls no tiene en cuenta,
es el costo computacional de dar sentido a una sociedad desde detrás de tal
velo. ¿Cómo podríamos, en este escenario hipotético, posiblemente esperar mantener todos
de la información relevante en nuestras cabezas? Deje a un lado las grandes preguntas de
justicia y equidad por un momento y tratar de aplicar el enfoque de Rawls simplemente
a, digamos, un cambio propuesto en las regulaciones del seguro médico. Toma el
probabilidad de nacer, tal vez, como alguien que crece para convertirse en un
secretario municipal en el Medio Oeste; multiplique eso por la distribución de los diferentes
Página 248
planes de atención médica disponibles para los empleados del gobierno en varios
municipios del medio oeste; multiplique eso por datos actuariales que ofrecen la
probabilidad de, por ejemplo, una fractura de tibia; multiplica eso por el promedio
factura médica por el procedimiento promedio para una tibia fracturada en un medio oeste
hospital dada la distribución de posibles planes de seguro. ... Está bien, entonces
¿La revisión propuesta del seguro sería "buena" o "mala" para la nación?
Apenas podemos esperar evaluar una sola espinilla lesionada de esta manera, y mucho menos la
vidas de cientos de millones.
Los críticos filosóficos de Rawls han discutido extensamente acerca de cómo
Se supone que debemos aprovechar la información obtenida del velo de
ignorancia. ¿Deberíamos intentar, por ejemplo, maximizar la felicidad mezquina,
¿mediana de felicidad, felicidad total o algo más? Cada uno de estos
enfoques, famoso, se abre a distopías perniciosas, como
la civilización de Omelas imaginada por la escritora Ursula K. Le Guin, en la que
abundan la prosperidad y la armonía, pero un solo niño se ve obligado a vivir en abyecta
miseria. Estas son críticas dignas, y Rawls las elude deliberadamente.
dejando abierta la cuestión de qué hacer con la información que obtenemos
desde detrás del velo. Quizás la pregunta más importante, sin embargo, es cómo reunir
esa información en primer lugar.
La respuesta bien puede provenir de la informática. Scott del MIT
Aaronson dice que está sorprendido de que los científicos informáticos aún no hayan tenido más
influencia en la filosofía. Parte de la razón, sospecha, es simplemente su " fracaso
para comunicar lo que pueden aportar al arsenal conceptual de la filosofía ”. Él
elabora:
Uno podría pensar que, una vez que sabemos que algo es computable , ya sea que tome 10 segundos o
20 segundos para calcular es obviamente una preocupación de los ingenieros más que de los filósofos. Pero eso
La conclusión no sería tan obvia, si la pregunta fuera una de 10 segundos versus 10 1010
¡segundos! Y de hecho, en la teoría de la complejidad, las brechas cuantitativas que nos preocupan suelen ser tan
enorme que hay que considerarlas también como brechas cualitativas. Piense, por ejemplo, en el
diferencia entre leer un libro de 400 páginas y leer todos los libros posibles , o entre
anotando un número de mil dígitos y contando hasta ese número.
Página 249
La informática nos brinda una forma de articular la complejidad de

evaluando todas las posibles provisiones sociales para algo como una espinilla lesionada.
Pero, afortunadamente, también proporciona herramientas para lidiar con esa complejidad. Y
los algoritmos de Monte Carlo basados en muestreo son algunos de los más útiles
enfoques en esa caja de herramientas.
Cuando necesitamos dar sentido a, digamos, la reforma nacional del cuidado de la salud, una
vasto aparato demasiado complejo para ser fácilmente entendido: nuestros líderes políticos
por lo general nos ofrecen dos cosas: anécdotas personales seleccionadas y
estadísticas de resumen agregadas. Las anécdotas, por supuesto, son ricas y vívidas,
pero no son representativos. Casi cualquier legislación, no importa cómo
iluminado o equivocado, dejará a alguien mejor y a alguien peor
desactivado, por lo que las historias cuidadosamente seleccionadas no ofrecen ninguna perspectiva sobre
patrones. Las estadísticas agregadas, por otro lado, son lo contrario:
completo pero delgado. Podríamos aprender, por ejemplo, si el promedio
las primas cayeron en todo el país, pero no cómo se concreta ese cambio en una
nivel granular: pueden bajar para la mayoría, pero, al estilo Omelas, dejan algunos
grupo específico (estudiantes universitarios, habitantes de Alaska o mujeres embarazadas) en
estrecheces. Una estadística solo puede contarnos una parte de la historia, oscureciendo cualquier
heterogeneidad. Y a menudo ni siquiera sabemos qué estadística necesitamos.
Dado que ni las estadísticas radicales ni las historias favoritas de los políticos pueden
guiarnos verdaderamente a través de miles de páginas de legislación propuesta, un Monte
Un científico informático informado por Carlo propondría un enfoque diferente:
muestreo. Un examen minucioso de muestras aleatorias puede ser uno de los más
medios efectivos de dar sentido a algo demasiado complejo para ser
comprendido directamente. Cuando se trata de manejar cualitativamente
problema inmanejable, algo tan espinoso y complicado que no puede
ser digerido completo: solitario o fisión atómica, prueba de primalidad o público
política: el muestreo ofrece una de las formas más simples, y también mejores, de
atravesando las dificultades.
Podemos ver este enfoque en funcionamiento con la organización benéfica GiveDirectly, que
distribuye transferencias monetarias incondicionales a personas que viven en la pobreza extrema
en Kenia y Uganda. Ha atraído la atención por repensar lo convencional
prácticas de caridad en varios niveles: no solo en su misión inusual, sino
Página 250
en el nivel de transparencia y responsabilidad que aporta a su propio proceso.

Y el último elemento del status quo que desafía es el éxito.
cuentos.
"Si visita regularmente nuestro sitio web, blog o página de Facebook", escribe
Rebecca Lange, asistente del programa, “es posible que hayas notado algo que
no veo a menudo: historias y fotos de nuestros destinatarios ". El problema no es ese
las brillantes historias ofrecidas por otras organizaciones benéficas no son ciertas. Más bien, el mismo
El hecho de que hayan sido elegidos deliberadamente para mostrar los éxitos hace que
No está claro cuánta información se puede obtener de ellos. Así que da directamente
decidió darle un giro a esta práctica convencional también.
Todos los miércoles, el equipo de GiveDirectly selecciona un destinatario de efectivo en
al azar, envía un oficial de campo para entrevistarlos y publica el campo
notas del oficial palabra por palabra, pase lo que pase. Por ejemplo, aquí está su primer
entrevista, con una mujer llamada Mary, que usó el dinero para un techo de hojalata: *
Pudo hacer una casa mejor y era una casa de hojalata. También pudo comprar un
conjunto de sofás para su propia casa. Su vida ha cambiado porque solía tener un techo con goteras
empapando todo en la casa cada vez que llovía. Pero debido a la transferencia ella pudo
para hacer una mejor casa de conservas.
“Esperamos que esto le dé confianza en todo tipo de información que

compartir contigo ", escribe Lange," y tal vez incluso te inspire a sostener otras
organizaciones a un nivel más alto ".
La compensación de tres partes
De inmediato me di cuenta de la cualidad necesaria para formar un hombre de logros,

especialmente en la literatura, y que Shakespeare posea
enormemente, me refiero a la capacidad negativa, es decir, cuando un hombre
capaz de estar en incertidumbres, misterios, dudas, sin ninguna
Irritable buscando el hecho y la razón.
—JUAN KEATS
Página 251
No existe la certeza absoluta, pero existe la seguridad

suficiente para los propósitos de la vida humana.
—JOHN STUART MILL
La informática es a menudo una cuestión de negociación de compensaciones. En nuestro

discusión de la clasificación en el capítulo 3, por ejemplo, notamos la compensación
entre el tiempo invertido al principio en la clasificación y el tiempo invertido más tarde
buscando. Y en la discusión sobre el almacenamiento en caché en el capítulo 4, exploramos la
compensación de ocupar espacio adicional (cachés por cachés por cachés) para ahorrar
tiempo.
El tiempo y el espacio son la raíz de las compensaciones más familiares en la informática.
ciencia, pero un trabajo reciente sobre algoritmos aleatorios muestra que también hay
otra variable a considerar: certeza. Como Michael Mitzenmacher de Harvard
dice: "Lo que vamos a hacer es encontrar una respuesta que ahorre
usted en el tiempo y el espacio y negocia esta tercera dimensión: la probabilidad de error ".
Cuando se le preguntó cuál era su ejemplo favorito de esta compensación por la incertidumbre, no
dudar. "Un colega acaba de decir que debería haber un juego de beber que
cada vez que aparece este término en una de mis diapositivas, tienes que tomarte un trago.
¿Alguna vez has oído hablar de los filtros Bloom? "
Para entender la idea detrás de un filtro Bloom, dice Mitzenmacher,
considere un motor de búsqueda como Google, que intenta rastrear toda la Web y
indexar todas las URL posibles. La Web se compone de más de un billón
URL distintas, y la URL promedio pesa alrededor de setenta y siete
caracteres de largo. Cuando el motor de búsqueda mira alguna URL, ¿cómo puede
comprobar si esa página ya ha sido procesada? Solo almacenando una lista de
todas las URL que se han visitado ocuparían una gran cantidad de espacio, y
buscar repetidamente esa lista (incluso si estuviera completamente ordenada) podría resultar una
pesadilla. De hecho, bien podría ser que la cura sea peor que la enfermedad: en
en otras palabras, verificando cada vez para asegurarse de que no estamos reindexando un
la página puede llevar más tiempo que simplemente indexar la página ocasional
dos¿Pero
veces.qué si solamente teníamos que estar sobre todo seguro de que esta URL era nuevo para nosotros
Ahí es donde entra en juego el filtro Bloom. El nombre de su inventor, Burton H.
Página 252
Bloom, un filtro de Bloom funciona de manera muy similar a la prueba de primalidad de Rabin-Miller:
La URL se ingresa en un conjunto de ecuaciones que esencialmente verifican
“Testigos” de su novedad. (En lugar de proclamar " n no es primo", estos
ecuaciones dicen "No he visto n antes"). Si está dispuesto a tolerar una
tasa de error de solo 1% o 2%, almacenando sus hallazgos en datos probabilísticos
estructura como un filtro Bloom le ahorrará una cantidad significativa de tiempo
y espacio. Y la utilidad de tales filtros no se limita a buscar
motores: los filtros Bloom se han incluido con varios navegadores web recientes
para comparar las URL con una lista de sitios web maliciosos conocidos, y también
una parte importante de las criptomonedas como Bitcoin.
Mitzenmacher dice: "La idea del espacio de compensación de errores, creo que
El problema es que la gente no asocia eso con la informática. Ellos piensan
se supone que las computadoras te darán la respuesta. Entonces cuando escuches en tu
clase de algoritmos, 'Se supone que te da una respuesta; puede que no sea el
respuesta correcta ', me gusta pensar que cuando [los estudiantes] escuchan eso, se enfoca
ellos. Creo que la gente no se da cuenta en su propia vida de cuánto hacen eso.
y acepta eso ".
Colinas, valles y trampas
El río serpentea porque no puede pensar.

—RICHARD KENNEY
La aleatoriedad también ha demostrado ser un arma poderosa para resolver

problemas de optimización discretos, como armar el calendario para la NCAA
baloncesto o encontrar la ruta más corta para un vendedor ambulante. En el
En el capítulo anterior vimos cómo la relajación puede desempeñar un papel importante en la reducción
problemas de tamaño, pero el uso táctico de la aleatoriedad ha surgido como
una técnica posiblemente aún más importante.
Imagina que estás organizando unas vacaciones trotamundos en diez ciudades, tu
propia versión del problema del viajante: empezarás y terminarás en
San Francisco y visitar Seattle, Los Ángeles, Nueva York, Buenos Aires,
Londres, Amsterdam, Copenhague, Estambul, Delhi y Kioto. Podrías
Página 253
No se preocupe demasiado por la longitud total de la ruta, pero probablemente sí
desea minimizar el costo monetario del viaje. Lo primero a tener en cuenta aquí
es que a pesar de que diez ciudades no parece mucho, el número de
Los itinerarios posibles es diez factorial: más de tres millones y medio. En
En otras palabras, no hay una forma práctica de que puedas simplemente comprobar cada
permutación y elija el precio más bajo. Tienes que trabajar de forma más inteligente que eso.
Para su primer intento en un itinerario, puede considerar tomar el
vuelo más barato desde San Francisco (digamos que es Seattle), luego tomar el
vuelo más barato desde allí a cualquiera de las otras ciudades restantes (llámelo Los
Ángeles), luego el más barato desde allí (digamos, Nueva York), y así sucesivamente, hasta
estás en tu décima ciudad y desde allí vuelas de regreso a San Francisco. Esta
es un ejemplo del llamado algoritmo codicioso, en el que también puedes pensar
como un "algoritmo miope": uno que toma con miopía lo mejor
disponible en cada paso del camino. En la teoría de la programación, como vimos en el capítulo
5, un algoritmo codicioso, por ejemplo, siempre haciendo el trabajo más corto disponible,
sin mirar o planificar más allá, a veces puede ser un problema
requiere. En este caso, para el problema del viajante, la solución dada
por el algoritmo codicioso probablemente no sea terrible, pero es probable que esté lejos de
lo mejor que puedes hacer.
Una vez que haya elaborado un itinerario de referencia, puede probar algunos
alternativas haciendo leves perturbaciones a la secuencia de la ciudad y viendo
si eso hace una mejora. Por ejemplo, si vamos primero a Seattle,
luego a Los Ángeles, podemos intentar hacer esas ciudades en orden inverso: LA
primero, luego Seattle. Para cualquier itinerario dado, podemos hacer once de estos dos-
chanclas de la ciudad; digamos que los probamos todos y luego vamos con el que da
nosotros los mejores ahorros. A partir de aquí tenemos un nuevo itinerario con el que trabajar y
podemos empezar a permutar ese , de nuevo buscando el mejor local
mejora. Este es un algoritmo conocido como Hill Climbing, ya que
buscar en un espacio de soluciones, algunas mejores y otras peores, es
comúnmente pensado en términos de un paisaje con colinas y valles, donde
tu objetivo es alcanzar el pico más alto.
Eventualmente, terminará con una solución que es mejor que todas sus
permutaciones; no importa qué paradas adyacentes mueva, nada lo supera. Es
Página 254
aquí donde se detiene la escalada. ¿Significa esto que definitivamente has encontrado el
¿Sin embargo, el mejor itinerario posible? Tristemente no. Puede que hayas encontrado solo
un llamado "máximo local", no el máximo global de todos los
posibilidades. El paisaje montañoso es brumoso. Tu puedes saber eso
estás parado en la cima de una montaña porque el suelo se cae en todo
direcciones, pero puede haber una montaña más alta al otro lado de la siguiente
valle, escondido detrás de las nubes.
Un "panorama de errores", que describe cómo la calidad de la solución puede variar según las diferentes posibilidades.
Considere la langosta atrapada en la trampa para langostas: pobre bestia, él no

darse cuenta de que salir de la jaula significa retroceder hacia el centro de la jaula, que él
necesita profundizar en la jaula para salir. Una trampa para langostas no es nada
que no sea un máximo local hecho de alambre, un máximo local que mata.
En el caso de la planificación de vacaciones, los máximos locales son, afortunadamente, menos fatales
pero tienen el mismo carácter. Incluso una vez que hayamos encontrado una solución que
no se puede mejorar con pequeños ajustes, es posible que todavía estemos
falta el máximo global. El verdadero mejor itinerario puede requerir un cambio radical.
revisión del viaje: recorriendo continentes enteros en un orden diferente, para
Página 255
ejemplo, o avanzando hacia el oeste en lugar de hacia el este. Puede que necesitemos
empeorar temporalmente nuestra solución si queremos seguir buscando
Mejoras. Y la aleatoriedad proporciona una estrategia; de hecho, varias
estrategias — para hacer precisamente eso.
Fuera del máximo local
Un enfoque es aumentar la escalada con lo que se conoce como "jitter": si

parece que estás atascado, mezcla un poco las cosas. Haga algunos pequeños al azar
cambios (incluso si son para peor), luego regrese a Hill Climbing; ver
si terminas en un pico más alto.
Otro enfoque es mezclar completamente nuestra solución cuando llegamos
un máximo local, y comience a escalar de nuevo desde este nuevo al azar
punto de partida. Este algoritmo se conoce, apropiadamente, como "Random-
Reiniciar Hill Climbing ”, o, de manera más colorida, como“ Shotgun Hill Climbing ”.
Es una estrategia que resulta muy eficaz cuando hay muchos máximos locales.
en un problema. Por ejemplo, los científicos informáticos utilizan este enfoque cuando
tratando de descifrar códigos, ya que hay muchas formas de comenzar a descifrar un
mensaje que parece prometedor al principio pero que terminan siendo callejones sin salida. En
descifrado, tener un texto que se parece un poco al inglés sensato
no significa necesariamente que esté en el camino correcto. Asi que a veces
es mejor no apegarse demasiado a una dirección inicial que promete,
y simplemente empezar de cero.
Pero también hay un tercer enfoque: en lugar de pasar a la máxima potencia
aleatoriedad cuando esté atascado, use un poco de aleatoriedad cada vez
tu tomas una decisión. Esta técnica, desarrollada por el mismo Los Alamos
equipo que ideó el Método Monte Carlo, se llama Metropolis
Algoritmo . El algoritmo de Metropolis es como escalar una colina, probar
diferentes ajustes a pequeña escala en una solución, pero con un importante
diferencia: en cualquier punto dado, también aceptará ajustes incorrectos
como buenos.
Podemos imaginarnos aplicando esto a nuestro problema de planificación de vacaciones. De nuevo,
Intentamos modificar nuestra solución propuesta moviendo las posiciones de
Página 256
diferentes ciudades. Si un ajuste generado aleatoriamente en nuestra ruta de viaje da como resultado
una mejora, entonces siempre la aceptamos y seguimos ajustando desde
allí. Pero si la alteración empeorara las cosas, todavía hay una
posibilidad de que vayamos con él de todos modos (aunque cuanto peor es la alteración, la
menor la posibilidad). De esa manera, no nos quedaremos atascados en ningún máximo local.
durante mucho tiempo: eventualmente probaremos otra solución cercana, aunque sea
más caro, y potencialmente estar en camino de crear un nuevo
y mejor plan.
Ya sea por inestabilidad, reinicios aleatorios o estar abierto a ocasionales
empeorando, la aleatoriedad es increíblemente útil para evitar los máximos locales.
El azar no es solo una forma viable de lidiar con la optimización difícil
problemas; en muchos casos, es fundamental. Sin embargo, quedan algunas preguntas.
¿Cuánta aleatoriedad debería utilizar? ¿Y cuando? Y dado que
estrategias como el algoritmo Metropolis pueden permutar nuestro itinerario bastante
mucho ad infinitum, ¿cómo sabes que has terminado? Para
investigadores que trabajan en la optimización, una respuesta sorprendentemente definitiva a
estas preguntas vendrían de otro campo completamente.
Recocido simulado
A finales de los setenta y principios de los ochenta, Scott Kirkpatrick se consideraba un

físico, no informático. En particular, Kirkpatrick estaba interesado
en física estadística, que utiliza la aleatoriedad como una forma de explicar ciertos
fenómenos naturales, por ejemplo, la física del recocido, la forma en que
los materiales cambian de estado a medida que se calientan y enfrían. Quizás el más
Una característica interesante del recocido es que la rapidez o la lentitud de un
el material se enfría tiende a tener un impacto tremendo en su estructura final. Como
Kirkpatrick explica:
El crecimiento de un solo cristal a partir de una fusión [se] realiza mediante un recocido cuidadoso, primero derritiendo la sustancia,
luego bajando la temperatura lentamente, y pasando mucho tiempo a temperaturas cercanas
del punto de congelación. Si esto no se hace, y se permite que la sustancia se salga del equilibrio,
el cristal resultante tendrá muchos defectos, o la sustancia puede formar un vidrio, sin
orden cristalino.
Página 257
Kirkpatrick trabajaba entonces en IBM, donde uno de los más grandes,

El problema ms complicado y sagrado era cmo trazar los circuitos en el
chips que IBM estaba fabricando. El problema era desgarbado y
intratable: había una enorme gama de posibles soluciones a considerar,
y algunas limitaciones complicadas. En general, era mejor que los componentes
estar juntos, por ejemplo, pero no demasiado cerca, o no habría
espacio para los cables. Y cada vez que moviste algo, tendrías que hacerlo
Vuelva a calcular cómo se ejecutarían todos los cables en el nuevo diseño hipotético.
En ese momento, este proceso fue dirigido por una especie de gurú críptico.
figura dentro de IBM. Como recuerda Kirkpatrick, "El tipo que era el mejor en
IBM en exprimir más circuitos en un chip ... tenía el más misterioso
forma de explicar lo que estaba haciendo. Realmente no le gustaba decírtelo ".
El amigo de Kirkpatrick y colega de IBM, Dan Gelatt, estaba fascinado por
el problema, y rápidamente enganchó a Kirkpatrick, quien tuvo un destello de intuición.
“La forma de estudiar [los sistemas físicos] era calentarlos y luego enfriarlos
abajo y dejar que el sistema se organice. Desde ese trasfondo, parecía
como algo perfectamente natural para tratar todo tipo de problemas de optimización como si
los grados de libertad que intentabas organizar eran pequeños átomos, o
gira, o lo que sea. "
En física, lo que llamamos "temperatura" es en realidad velocidad, aleatoria
movimiento a escala molecular. Esto era directamente análogo, Kirkpatrick
razonado, a la fluctuación aleatoria que se puede agregar a un algoritmo de escalada
para que a veces retroceda de mejores soluciones a peores soluciones. De hecho,
el algoritmo de Metropolis en sí había sido inicialmente diseñado para modelar
comportamiento aleatorio en sistemas físicos (en ese caso, explosiones nucleares). Entonces
Kirkpatrick se preguntó qué pasaría si trataras una optimización
problema como un problema de recocido, si lo "calentó" y luego lentamente
"Enfriarlo"?
Tomando el problema de las vacaciones de diez ciudades desde arriba, podríamos comenzar en un
"Alta temperatura" seleccionando nuestro itinerario de inicio completamente al azar,
sacando una de todo el espacio de posibles soluciones independientemente de
precio. Entonces podemos empezar a "enfriar" lentamente nuestra búsqueda tirando un dado
siempre que estemos considerando modificar la secuencia de la ciudad. Tomar una
Página 258
la variación superior siempre tiene sentido, pero solo tomaríamos inferior
unos cuando el dado muestra, digamos, un 2 o más. Después de un tiempo, lo enfriaríamos
más allá al tomar solo un cambio de precio más alto si el dado muestra un 3 o más
- luego 4, luego 5. Con el tiempo, estaríamos principalmente escalando colinas, haciendo que el
movimiento inferior solo ocasionalmente cuando el dado muestra un 6. Finalmente comenzamos
yendo solo cuesta arriba, y nos detenemos cuando alcanzamos el próximo máximo local.
Este enfoque, llamado recocido simulado , parecía un intrigante
forma de mapear la física en la resolución de problemas. Pero, ¿funcionaría? La inicial
La reacción entre los investigadores de optimización más tradicionales fue que este
Todo el enfoque parecía un poco demasiado ... metafórico. "No pude
convencer a la gente de matemáticas de que todo este lío con las temperaturas, todo esto
cosas basadas en analogías, era real ", dice Kirkpatrick," porque los matemáticos
están entrenados para desconfiar realmente de la intuición ".
Pero cualquier desconfianza con respecto al enfoque basado en la analogía pronto
desaparecer: en IBM, los algoritmos de recocido simulado de Kirkpatrick y Gelatt
comenzó a hacer mejores diseños de chips que el gurú. En lugar de guardar silencio
acerca de su arma secreta y convertirse en figuras crípticas de gurú, ellos
publicó su método en un artículo en Science , abriéndolo a otros. Sobre
las próximas décadas, ese artículo se citaría la friolera de treinta y dos
Mil veces. Hasta el día de hoy, el recocido simulado sigue siendo uno de los más
enfoques prometedores para los problemas de optimización conocidos en el campo.
Aleatoriedad, evolución y creatividad
En 1943, Salvador Luria no sabía que estaba a punto de hacer un descubrimiento que
conduciría a un premio Nobel; pensó que iba a un baile. Un reciente
inmigrante a los Estados Unidos desde la Italia de Mussolini, donde su sefardí
Una familia judía había vivido, Luria era una investigadora que estudiaba cómo las bacterias
desarrolló inmunidad contra virus. Pero en este momento su investigación estaba lejos
de su mente, mientras asistía a una reunión de profesores en un club de campo cerca
Universidad de Indiana.
Luria estaba viendo a uno de sus colegas jugar en una máquina tragamonedas:
Página 259
Yo no soy un jugador, me estaba burlando de él por sus pérdidas inevitables, cuando de repente golpeó el
premio mayor, unos tres dólares en monedas de diez centavos, me miró con mala cara y se alejó. Justo entonces yo
comenzó a pensar en la numerología real de las máquinas tragamonedas; al hacerlo, amaneció
En mí, las máquinas tragamonedas y las mutaciones bacterianas tienen algo que enseñarse mutuamente.
En la década de 1940, no se sabía exactamente por qué o cómo la resistencia bacteriana a

Surgieron los virus (y, en realidad, los antibióticos). Fueron reacciones
dentro de la bacteria al virus, o simplemente hubo mutaciones en curso que
ocasionalmente produjo resistencia por accidente? No parecía haber manera de
idear un experimento que ofreciera una respuesta decisiva de una manera o de la
otros, es decir, hasta que Luria vio esa máquina tragamonedas y algo hizo clic.
Luria se dio cuenta de que si criaba varias generaciones de diferentes linajes de
bacterias, luego expuso la última generación a un virus, uno de dos radicalmente
sucederían cosas diferentes. Si la resistencia fue una respuesta al virus,
esperaría que apareciera aproximadamente la misma cantidad de bacterias resistentes en
cada uno de sus cultivos bacterianos, independientemente de su linaje. En el otro
Por otro lado, si la resistencia surgiera de mutaciones fortuitas, esperaría ver
algo mucho más desigual, como los pagos de una máquina tragamonedas. Es decir,
las bacterias de la mayoría de los linajes no mostrarían resistencia alguna; algunos linajes
tendría una única cultura de "nietos" que había mutado para convertirse
resistente; y en raras ocasiones, si hubiera ocurrido la mutación adecuada
varias generaciones en el "árbol genealógico", habría un premio mayor: todos los
Los “nietos” del linaje se resistirían. Luria dejó el baile como
tan pronto como pudo y puso en marcha el experimento.
Después de varios días de espera tensa e inquieta, Luria regresó al laboratorio para
controlar sus colonias. Bote.
El descubrimiento de Luria fue sobre el poder del azar: sobre cuán aleatorio,
las mutaciones fortuitas pueden producir resistencia viral. Pero también fue, al menos en
parte, debido al poder del azar. Estaba en el lugar correcto en el momento correcto,
donde ver la máquina tragamonedas desencadenó una nueva idea. Cuentos de descubrimiento
a menudo presentan un momento similar: la manzana de Newton (posiblemente apócrifa),
La bañera de Arquímedes "¡Eureka!", La placa de Petri descuidada que creció
Moho de penicillium . De hecho, es un fenómeno bastante común que una palabra
fue inventado para capturarlo: en 1754, Horace Walpole acuñó el término
Página 260
"Serendipity", basada en las aventuras de cuento de hadas de Los tres príncipes de

Serendip (Serendip es el nombre arcaico de Sri Lanka), quienes “fueron
siempre haciendo descubrimientos, por accidentes y sagacidad, de cosas que eran
no en busca de ".
Este doble papel de la aleatoriedad, una parte clave de la biología, una parte clave de
descubrimiento, ha llamado repetidamente la atención de los psicólogos que quieren
explicar la creatividad humana. Un ejemplo temprano de esta idea fue ofrecido por
William James. En 1880, recientemente nombrado profesor asistente
de psicología en Harvard, y a diez años de la publicación de su definitiva
Principios de psicología , James escribió un artículo en Atlantic Monthly
llamado "Grandes hombres, grandes pensamientos y el medio ambiente". El artículo
abre con su tesis:
Un paralelo notable, que hasta donde yo sé nunca se ha observado, se da entre los

hechos de la evolución social y el crecimiento mental de la raza, por un lado, y de la zoología
evolución, según lo expuesto por el Sr. Darwin, por el otro.
En el momento en que James estaba escribiendo, la idea de "evolución zoológica" todavía estaba
fresco— Sobre el origen de las especies se publicó en 1859 y el Sr.
El propio Darwin sigue vivo. James discutió cómo las ideas evolutivas podrían
ser aplicado a diferentes aspectos de la sociedad humana, y hacia el final de la
artículo se centró en la evolución de las ideas:
Las nuevas concepciones, emociones y tendencias activas que evolucionan se producen originalmente en el
forma de imágenes aleatorias, fantasías, nacimientos accidentales de variación espontánea en el
actividad funcional del cerebro humano excesivamente inestable, que el entorno exterior
simplemente confirma o refuta, adopta o rechaza, conserva o destruye; selecciona , en resumen, tal como
selecciona variaciones morfológicas y sociales debidas a accidentes moleculares de tipo análogo.
Por tanto, James veía la aleatoriedad como el corazón de la creatividad. Y lo creyó

se magnificó en las personas más creativas. En su presencia, escribió, "nosotros
parecen introducidos de repente en un caldero hirviente de ideas, donde
todo está chisporroteando y balanceándose en un estado de actividad desconcertante,
donde las asociaciones se pueden unir o aflojar en una rutina instantánea de cinta de correr
es desconocido, y lo inesperado parece ser la única ley ". (Note aquí lo mismo
Página 261
Intuición "recocida", arraigada en metáforas de la temperatura, donde salvaje

permutación es igual a calor.)
La ejemplificación moderna de la teoría de James aparece en el trabajo de
Donald Campbell, un psicólogo que vivió cien años después. En 1960,
Campbell publicó un artículo titulado "Variación ciega y retención selectiva
en el pensamiento creativo como en otros procesos de conocimiento ”. Como James, él
abrió con su tesis central: "Una variación-ciega-y-retención-selectiva
El proceso es fundamental para todos los logros inductivos, para todos los
aumentos en el conocimiento, a todos los aumentos en la adaptación del sistema al entorno ".
Y al igual que James, se inspiró en la evolución, pensando en la creatividad.
innovación como el resultado de nuevas ideas que se generan aleatoriamente y
astutas mentes humanas que retienen lo mejor de esas ideas. Campbell apoyado
su argumento generosamente con citas de otros científicos y matemáticos
sobre los procesos detrás de sus propios descubrimientos. El siglo diecinueve
físicos y filósofos Ernst Mach y Henri Poincaré parecían
ofrecer una cuenta similar a la de Campbell, con Mach llegando a declarar
que “así deben explicarse las afirmaciones de Newton, Mozart, Richard
Wagner y otros, cuando dicen que el pensamiento, las melodías y las armonías
se había derramado sobre ellos, y que simplemente habían retenido los correctos ".
Cuando se trata de estimular la creatividad, una técnica común es
introducir un elemento aleatorio, como una palabra que las personas tienen que formar
asociaciones con. Por ejemplo, el músico Brian Eno y el artista Peter
Schmidt creó una baraja de cartas conocida como Estrategias oblicuas para resolver
problemas creativos. Elija una carta, cualquier carta, y obtendrá una nueva al azar
perspectiva de su proyecto. (Y si eso suena a demasiado trabajo,
ahora puede descargar una aplicación que seleccionará una tarjeta para usted).
por qué desarrollaron
máximos locales: las tarjetas tiene un claro paralelismo con la idea de escapar
Cuando estás en medio de algo, olvidas las cosas más obvias. Tu vienes
fuera del estudio y piensas "¿por qué no nos acordamos de hacer esto o aquello?" Estas [tarjetas]
realmente son solo formas de sacarte del marco, de romper un poco el contexto, para que
no eres una banda en un estudio centrada en una canción, pero eres gente que está viva y en el
mundo y consciente de muchas otras cosas también.
Página 262
Estar nervioso al azar, arrojado fuera del encuadre y enfocado en un

escala, proporciona una manera de dejar lo que podría ser bueno localmente y volver a
la búsqueda de lo que podría ser globalmente óptimo.
Y no necesitas ser Brian Eno para agregar un poco de estimulación aleatoria a
su vida. Wikipedia, por ejemplo, ofrece un enlace "Artículo aleatorio", y Tom
lo ha estado usando como la página de inicio predeterminada de su navegador durante varios años,
ver una entrada de Wikipedia seleccionada al azar cada vez que abre una nueva
ventana. Si bien esto aún no ha resultado en ningún descubrimiento sorprendente, ahora
sabe mucho sobre algunos temas oscuros (como el tipo de cuchillo que usa
fuerzas armadas chilenas) y siente que algunas de ellas han enriquecido su
vida. (Por ejemplo, ha aprendido que hay una palabra en portugués para un
“Deseo vago y constante de algo que no es y probablemente no puede
existen ", un problema que todavía no podemos resolver con un motor de búsqueda).
El efecto secundario es que ahora también tiene un mejor sentido, no solo de qué tipo de
Los temas están cubiertos en Wikipedia, pero también sobre cómo se ve realmente la aleatoriedad
igual que. Por ejemplo, páginas que sienten que tienen alguna conexión con él:
artículos sobre personas o lugares que conoce; aparezcan con lo que parezca
frecuencia sorprendente. (En una prueba, obtuvo "Miembros del Western Australian
Legislative Council, 1962-1965 ”después de solo dos recargas, y creció en
Australia Occidental.) Sabiendo que estos se generan al azar
permite estar mejor calibrado para evaluar otros
"Coincidencias" en el resto de su vida.
En el mundo físico, puede aleatorizar sus verduras uniéndose a un
Granja agrícola apoyada por la comunidad, que entregará una caja de
producirle todas las semanas. Como vimos anteriormente, una suscripción a CSA no
potencialmente plantean un problema de programación, pero se le envían frutas y verduras
que normalmente no compraría es una excelente manera de quedar fuera de un local
máximo en la rotación de su receta. Asimismo, el libro, el vino y el chocolate de
Los clubes del mes son una forma de exponerse a los intereses intelectuales, enófilos y
posibilidades gustativas que de otro modo nunca habrías encontrado.
Es posible que le preocupe que tomar todas las decisiones lanzando una moneda
causar problemas, sobre todo con su jefe, amigos y familiares. Y es verdad
que incorporar la aleatoriedad en tu vida no es necesariamente una receta para
Página 263
éxito. La novela clásica de culto de 1971 El hombre de los dados de Luke Rhinehart (real
nombre: George Cockcroft) proporciona una advertencia. Su narrador, un hombre que
reemplaza la toma de decisiones con tirar dados, rápidamente termina en situaciones
que a la mayoría de nosotros probablemente le gustaría evitar.
Pero tal vez sea solo un caso en el que un poco de conocimiento es algo peligroso.
Si el Hombre de los Dados hubiera tenido una comprensión más profunda de la informática, habría
tenía alguna orientación. Primero, de Hill Climbing: incluso si tienes el hábito de
a veces actuando sobre las malas ideas, siempre debe actuar sobre las buenas.
En segundo lugar, del algoritmo de Metropolis: su probabilidad de seguir un mal
La idea debe ser inversamente proporcional a su mala idea. En tercer lugar, de
Recocido simulado: debe cargar al azar la aleatoriedad, enfriar rápidamente
de un estado totalmente aleatorio, utilizando cada vez menos aleatoriedad como tiempo
continúa, demorando más a medida que se acerca al punto de congelación. Cuídese usted mismo—
literalmente.
Este último punto no pasó desapercibido para el autor de la novela. El propio Cockcroft
aparentemente se volvió, no muy diferente a su protagonista, a "cortar en cubitos" durante un tiempo en
vida, viviendo nómada con su familia en un velero mediterráneo, en un
una especie de cámara lenta browniana. En algún momento, sin embargo, su recocido
el horario se enfrió: se instaló cómodamente en un máximo local, en
un lago en el norte del estado de Nueva York. Ahora, en sus ochenta, todavía está contento allí.
"Una vez que llegabas a algún lugar, eras feliz", le dijo a The Guardian ,
Sería estúpido sacudirlo más ".
Página 264
*Curiosamente, algunos de estos experimentos parecen haber producido una estimación mucho mejor de π que
se esperaría por casualidad, lo que sugiere que pueden haber sido deliberadamente interrumpidos en un
buen punto de parada, o falsificado por completo. Por ejemplo, en 1901 el matemático italiano Mario
Lazzarini supuestamente hizo 3.408 lanzamientos y obtuvo una estimación ⁄ 113
355de π ≈= 3,1415929 (el valor real
valor de π con siete posiciones decimales es 3,1415927). Pero si la cantidad de veces que la aguja cruzó el
Si
—Lola línea se hubiera
que hace desviadode
que el informe por un solo lanzamiento,
Lazzarini la estimación
parezca sospechoso. habría
Laplace sido
podría mucho
haber menos bonita:
encontrado 3,1398
apropiado queo podamos
3,1433
utilice la regla de Bayes para confirmar que es poco probable que este resultado haya surgido de un experimento válido.
Página 265
*No es necesario verificar más allá de la raíz cuadrada, porque si un número tiene un factor mayor que su
raíz cuadrada, entonces, por definición, también debe tener un factor correspondiente más pequeño que la raíz cuadrada—
así que ya lo habrías cogido. Si busca factores de 100, por ejemplo, cada factor
que sea mayor que 10 se emparejará con un factor menor que 10:20 se emparejará con 5, 25 con 4,
etcétera.
Página 266
*Los primos gemelos son números impares consecutivos que son primos, como 5 y 7.
Página 267
*Tenga en cuenta que tomamos deliberadamente la primera historia del sitio, es decir, no leímos todos
de ellos para elegir uno para compartir, lo que habría frustrado el propósito.
Página 268
10 Redes
Cómo nos conectamos
El término conexión tiene una amplia variedad de significados. Puede referirse a un

ruta física o lógica entre dos entidades, puede referirse al flujo
sobre la ruta, puede inferencialmente referirse a una acción asociada con el
establecimiento de una ruta, o puede referirse a una asociación entre dos o
más entidades, con o sin consideración de cualquier camino entre ellas.
—VINT CERF Y BOB KAHN
Solo conéctate.
—EM FORSTER
El telégrafo de larga distancia comenzó con un presagio: Samuel FB Morse,

de pie en las salas de la Corte Suprema de los Estados Unidos el 24 de mayo de 1844,
cableando a su asistente Alfred Vail en Baltimore un verso del Antiguo
Testamento: "LO QUE DIOS HIZO". Lo primero que le pedimos
cualquier nueva conexión es como comenzó, y desde ese origen no puedo evitar intentar
para augurar su futuro.
La primera llamada telefónica de la historia, realizada por Alexander Graham Bell a
su asistente el 10 de marzo de 1876, comenzó con una paradoja. "Señor.
Watson, ven aquí; Quiero verte ”, un testimonio simultáneo de su
capacidad e incapacidad para superar la distancia física.
Página 269
El teléfono móvil comenzó con un alarde: el Martin Cooper de Motorola caminando

por la Sexta Avenida el 3 de abril de 1973, mientras los peatones de Manhattan miraban boquiabiertos,
llamando a su rival Joel Engel en AT&T: "Joel, te estoy llamando desde un celular
teléfono. Un teléfono celular real: un teléfono celular de mano, portátil y real ". ("I
"No recuerdo exactamente lo que dijo", recuerda Cooper, "pero fue realmente
en silencio por un rato. Supuse que estaba rechinando los dientes ").
Y el mensaje de texto comenzaba, el 3 de diciembre de 1992, con alegría: Neil
Papworth de Sema Group Telecoms deseando a Richard Jarvis de Vodafone un
temprano "Feliz Navidad".
Los inicios de Internet fueron, de alguna manera, mucho más humildes.
y más desfavorable que todo eso. Era el 29 de octubre de 1969 y
Charley Kline en UCLA enviado a Bill Duvall en Stanford Research
Instituya el primer mensaje transmitido de una computadora a otra
a través de ARPANET. El mensaje era "iniciar sesión", o lo habría sido, si el
la máquina receptora no se bloqueó después de "lo."
Lo ... de verdad, Kline se las arregló para sonar portentoso y del Antiguo Testamento
a su pesar.
La base de la conexión humana es el protocolo, una convención compartida
de procedimientos y expectativas, desde apretones de manos y saludos hasta la etiqueta,
cortesía y toda la gama de normas sociales. La conexión de la máquina no es
diferente. El protocolo es cómo nos ponemos en la misma página; de hecho, la palabra es
arraigado en el griego protokollon , "primer pegamento", que se refería al exterior
página adjunta a un libro o manuscrito.
En asuntos interpersonales, estos protocolos resultan ser un sutil pero perenne
fuente de ansiedad. Le envié un mensaje a fulano de tal hace muchos días; a
¿En qué momento empiezo a sospechar que nunca lo recibieron? Ahora son las 12:05 pm
y nuestra llamada se fijó para el mediodía; ¿Ambos estamos esperando que el otro sea el
uno llamando? Tu respuesta parece extraña; te escuché mal o escuchaste mal
¿me? ¿Llegar de nuevo?
La mayor parte de nuestra tecnología de comunicación, desde el telégrafo hasta el texto
- simplemente nos ha proporcionado nuevos conductos para experimentar estos familiares
desafíos de persona a persona. Pero con Internet, las computadoras dejaron de
sólo el conducto, pero también los puntos finales: los que hablan. Como tal,
Página 270
han necesitado ser responsables de resolver su propia comunicación

cuestiones. Estos problemas de máquina a máquina, y sus soluciones, a la vez
imitar e iluminar el nuestro.
Conmutación de paquetes
Lo que ahora consideramos "Internet" es en realidad una colección de muchos

protocolos, pero el principal de ellos (tanto es así que a menudo se hace referencia a
más o menos sinónimo de Internet) es lo que se conoce como
Protocolo de control de transmisión o TCP. Nació de una charla de 1973 y una
1974 artículo de Vinton "Vint" Cerf y Robert "Bob" Kahn, quien presentó un
propuesta para el lenguaje de —como imaginaban llamarlo— un
"Internetwork".
TCP usó inicialmente líneas telefónicas, pero se considera más apropiadamente
como la evolución del correo más que del teléfono. Las llamadas telefónicas usan lo que
llamado "conmutación de circuito": el sistema abre un canal entre el remitente
y el receptor, que proporciona un ancho de banda constante entre las partes en
en ambas direcciones mientras dure la llamada. La conmutación de circuitos hace un montón de
sentido de la interacción humana, pero ya en la década de 1960 estaba claro que este
El paradigma no iba a funcionar para las comunicaciones de las máquinas.
Como recuerda Leonard Kleinrock de UCLA,
Sabía que las computadoras, cuando hablan, no hablan como yo ahora, continuamente. Ellos
vaya explosión! y están callados por un rato. Un poco más tarde, de repente se acercan y explotan.
de nuevo. Y no puede permitirse dedicar una conexión de comunicaciones a algo que es
casi nunca habla, pero cuando quiere hablar quiere acceso inmediato. Entonces tuvimos que no usar
la red telefónica, que fue diseñada para una conversación continua: el circuito de conmutación
red, pero algo más.
Las compañías telefónicas, por su parte, no parecían especialmente

dispuesto a hablar de un cambio fundamental en sus protocolos. Alejándose
de la conmutación de circuitos se consideró lunático - "herejía absoluta", en las palabras
del investigador de redes Van Jacobson. Kleinrock recuerda su
propios encuentros con la industria de las telecomunicaciones:
Página 271
Fui a AT&T, la red más grande de la época, y les expliqué que debían
Danos buenas comunicaciones de datos. Y su respuesta fue, ¿de qué estás hablando? los
Estados Unidos es una mina de cobre, está lleno de cables telefónicos, úsalo. Dije que no, no, no lo haces
comprender. Se necesitan 35 segundos para configurar una llamada, me cobra un mínimo de 3 minutos y yo
quiere enviar 100 milisegundos de datos! Y su respuesta fue: "Niño, vete". Tan pequeño
niño se fue y, con otros, desarrolló esta tecnología que se comió su almuerzo.
La tecnología que se comió el almuerzo de la conmutación de circuitos se haría conocida

como conmutación de paquetes . En una red de conmutación de paquetes, en lugar de utilizar un
canal dedicado para cada conexión, emisores y receptores atomizan sus
mensajes en fragmentos diminutos conocidos como "paquetes" y fusionarlos en el
flujo común de datos, un poco como postales moviéndose a la velocidad de la luz.
En una red de este tipo, "lo que podría llamarse una conexión es un consenso
ilusión entre los dos puntos finales ", explica el experto en redes de Apple
Stuart Cheshire. “No hay conexiones en Internet. Hablando de un
La conexión a Internet es como hablar de una conexión en el correo de EE. UU.
sistema. Escribes cartas a las personas y cada letra va de forma independiente, y
puede tener una correspondencia que va y viene y tiene algunos
continuidad, pero el correo de EE. UU. no necesita saberlo.
sólo entrega las cartas ".
El uso eficiente del ancho de banda no fue la única consideración que impulsó
investigación sobre conmutación de paquetes en la década de 1960; el otro fue la guerra nuclear. Pablo
Baran en la Corporación RAND estaba tratando de resolver el problema de la red.
robustez, de modo que las comunicaciones militares pudieran sobrevivir a un ataque nuclear
que eliminó una fracción considerable de la red. Inspirado por algoritmos
desarrollado en la década de 1950 para navegar por laberintos, Baran imaginó un diseño en
que cada pieza de información podría hacer independientemente su propio camino para
su destino, incluso cuando la red cambiaba dinámicamente, o se
destrozado.
Este fue el segundo demérito contra la conmutación de circuitos y su dedicado,
conexiones estables: esa misma estabilidad significaba que una llamada interrumpida permanecía
abandonó. La conmutación de circuitos simplemente no era lo suficientemente flexible o adaptable para
robusto. Y aquí, también, la conmutación de paquetes podría ofrecer exactamente lo que eran los tiempo
llamando por. En redes de conmutación de circuitos, una llamada falla si alguno de sus enlaces
Página 272
se interrumpe, lo que significa que la confiabilidad disminuye exponencialmente

la red se hace más grande. En la conmutación de paquetes, por otro lado, el
la proliferación de caminos en una red en crecimiento se convierte en una virtud: ahora hay
muchas más formas para que los datos fluyan, por lo que la confiabilidad de la red
aumenta exponencialmente con su tamaño.
Aún así, como lo dice Van Jacobson, incluso después de que se ideó la conmutación de paquetes,
las compañías telefónicas no estaban impresionadas. "Toda la gente de telecomunicaciones dijo, con
voces muy fuertes, eso no es una red! Esa es solo una forma horrible de usar nuestro
¡la red! Estás tomando nuestros cables, estás enviando los caminos que nosotros
¡crear! Y le estás poniendo mucha suciedad adicional para que lo uses realmente
ineficientemente ". Pero desde el punto de vista de la conmutación de paquetes, los cables telefónicos
son solo un medio para un fin; al remitente y al destinatario en realidad no les importa cómo
los paquetes se entregan. La capacidad de operar de forma agnóstica sobre cualquier
La gran cantidad de medios diversos sería la gran virtud de la conmutación de paquetes. Después
primeras redes a finales de los 60 y principios de los 70, como ARPANET,
demostró la viabilidad del concepto, las redes de todo tipo comenzaron a brotar
en todo el país, haciendo conmutación de paquetes no solo a través de teléfonos de cobre
cables, sino por satélites y por radio. En 2001, un grupo de computadoras
científicos de la ciudad noruega de Bergen incluso implementaron brevemente un
red de conmutación de paquetes a través de "Avian Carriers", es decir, paquetes escritos
sobre papel y atado a patas de paloma.
Por supuesto, la conmutación de paquetes no estaría exenta de problemas. Para
principiantes, una de las primeras preguntas para cualquier protocolo, humano o máquina, es,
sencillamente: ¿cómo sabe que se están transmitiendo sus mensajes?
Reconocimiento
Ninguna transmisión puede ser 100% confiable.

—VINT CERF Y BOB KAHN
“LO QUE DIOS HIZO” no fue solo el primer viaje de larga distancia
mensaje telegráfico enviado en los Estados Unidos. También fue el segundo: Alfred
Página 273
Vail envió la cita a Morse en las salas de la Corte Suprema como un

forma de confirmar el recibo.
Ahora, la respuesta de Vail podría hacer que Morse, y los legisladores estadounidenses se reunieran
a su alrededor, confiado en que el mensaje de Morse había sido recibido:
suponiendo, por supuesto, que Vail no hubiera sabido la elección del mensaje en
avance. Pero, ¿qué haría que Vail estuviera seguro de que su confirmación había
¿sido recibido?
Los informáticos conocen este concepto como los "generales bizantinos
problema." Imagine dos generales, en lados opuestos de un valle que contiene
su enemigo común, intentando coordinar un ataque. Solo por perfecto
sincronización tendrán éxito; que cualquiera de los dos ataque solo es suicidio.
Lo que es peor, cualquier mensaje de un general al otro debe ser
entregado a mano a través del mismo terreno que contiene al enemigo, lo que significa
existe la posibilidad de que un mensaje determinado nunca llegue.
El primer general, digamos, sugiere un momento para el ataque, pero no se atreve a ir.
para ello a menos que sepa con certeza que su camarada también se está moviendo. El segundo
el general recibe las órdenes y envía una confirmación, pero no se atreve
ataque a menos que sepa que el primer general recibió esa confirmación
(ya que de lo contrario el primer general no irá). El primer general recibe
la confirmación, pero no atacará hasta que esté seguro de que el segundo general
sabe que lo hizo. Seguir esta cadena de lógica requiere una serie infinita de
mensajes, y obviamente eso no servirá. La comunicación es uno de esos
cosas deliciosas que funcionan solo en la práctica; en teoría es imposible.
En la mayoría de los escenarios, las consecuencias de los lapsos de comunicación rara vez son
tan terrible, y la necesidad de certeza rara vez tan absoluta. En TCP, un fracaso
generalmente conduce a la retransmisión en lugar de a la muerte, por lo que se considera
suficiente para que una sesión comience con lo que se llama un "triple apretón de manos". los
el visitante dice hola, el servidor reconoce el saludo y dice hola de nuevo,
el visitante reconoce que, y si el servidor recibe este tercer mensaje,
entonces no se necesita más confirmación y se van a las carreras. Incluso
Sin embargo, una vez realizada esta conexión inicial, todavía existe el riesgo de que algunos
los paquetes posteriores pueden dañarse o perderse en tránsito, o llegar fuera de servicio. En el
correo postal, la entrega del paquete se puede confirmar mediante acuse de recibo; en línea,
Página 274
la entrega de paquetes se confirma mediante lo que se denominan paquetes de acuse de recibo,

o ACK. Estos son fundamentales para el funcionamiento de la red.
La forma en que funcionan los ACK es simple e inteligente. Entre bastidores
del triple apretón de manos, cada máquina proporciona a la otra una especie de
número de serie, y se entiende que todos los paquetes enviados después de ese
Incrementar esos números de serie en uno cada vez, como cheques en un
talonario de cheques. Por ejemplo, si su computadora inicia el contacto con una web
servidor, podría enviar ese servidor, digamos, el número 100. El ACK enviado por el
servidor, a su vez, especificará el número de serie en el que el propio servidor
Los paquetes comenzarán (llámelo 5,000), y también dirán "Listo para 101". Tu
El ACK de la máquina llevará el número 101 y, a su vez, transmitirá "Listo
por 5,001 ". (Tenga en cuenta que estos dos esquemas de numeración son totalmente
independiente, y el número que comienza cada secuencia se elige típicamente
al azar.)
Este mecanismo ofrece una forma fácil de identificar cuándo se han ido los paquetes.
por mal camino. Si el servidor espera 101 pero en su lugar obtiene 102, enviará un
ACK al paquete 102 que todavía dice "Listo para 101". Si a continuación recibe un paquete
103, dirá, nuevamente, "Listo para 101". Tres de estos ACK redundantes en un
fila le indicaría a su máquina que 101 no solo está retrasado sino desesperadamente
desaparecido, por lo que volverá a enviar ese paquete. En ese momento, el servidor (que ha mantenido
paquetes 102 y 103) enviará un ACK diciendo "Listo para 104" para señalar
que la secuencia ha sido restaurada.
Todos esos reconocimientos en realidad pueden sumar una considerable
cantidad de tráfico. Pensamos, por ejemplo, en una transferencia de archivos de gran tamaño como una
operación, pero de hecho el destinatario está enviando cientos de "control
mensajes ”al remitente. Un informe del segundo semestre de 2014
mostró que casi el 10% del tráfico de Internet ascendente durante las horas pico se
debido a Netflix, que solemos considerar como el envío de datos casi
exclusivamente aguas abajo , a los usuarios. Pero todo ese video genera muchísimo
de ACK.
En la esfera humana, la ansiedad de que el mensaje esté siendo
recibido igualmente impregna la conversación. Un hablante podría inconscientemente
añadir "¿Sabes?" hasta el final de cada frase, y un oyente, para su
Página 275
parte, no puedo evitar hacer un flujo constante de asentimientos, sí, sí-sí, Roger-
eso es, diez y cuatro, uh-huhs. Hacemos esto incluso cara a cara, pero en una llamada telefónica.
a veces es la única forma de saber que la llamada aún está en curso. No
me pregunto si la campaña de marketing más exitosa del siglo XXI
para un proveedor de servicios inalámbricos con control de calidad de un ingeniero de red
eslogan, repetido una y otra vez: "¿Puedes oírme ahora?"
Cuando algo sale mal en ese ida y vuelta, a menudo nos quedamos
con un signo de interrogación. Como dice el bloguero de software Tyler Treat,
En un sistema distribuido, intentamos garantizar la entrega de un mensaje esperando una

reconocimiento de que se recibió, pero todo tipo de cosas pueden salir mal. Hizo el mensaje
caer? ¿Se cayó el ack? ¿Se bloqueó el receptor? ¿Son lentos? Es el
red lenta? ¿ Soy lento?
Los problemas a los que se enfrentaron los generales bizantinos, como nos recuerda, “no son
complejidades de diseño, son resultados imposibles ".
Investigaciones anteriores sobre redes, señala Vint Cerf, se habían fundado “en el
suposición de que podría construir una red subyacente confiable ". En el otro
Por otro lado, "Internet se basaba en el supuesto de que ninguna red estaba
necesariamente confiable, y tuvo que hacer retransmisiones de extremo a extremo para
recuperar."
Irónicamente, una de las pocas excepciones a esto es la transmisión de la
voz. Las comunicaciones de voz en tiempo real, como Skype, normalmente no utilizan
TCP, que es la base de la mayor parte del resto de Internet. Como investigadores
descubierto en los primeros días de la creación de redes, utilizando protocolos fiables y robustos
—Con todos sus ACK y retransmisión de paquetes perdidos — para transmitir el
la voz humana es exagerada. Los humanos proporcionan la robustez ellos mismos. Como
Cerf explica: “En el caso de la voz, si pierde un paquete, simplemente diga: 'Diga
que de nuevo, me perdí algo '”.
Por este motivo, los servicios telefónicos que reducen automáticamente el fondo
ruido al silencio están haciendo un flaco favor a sus usuarios. Estática de fondo
es una garantía continua de que la llamada todavía está conectada y que cualquier silencio
es una elección deliberada de la otra parte. Sin ella, uno debe constantemente
afrontar la posibilidad de que la llamada se haya interrumpido y ofrecer constantemente
Página 276
garantías de que no lo ha hecho. Esto también es la ansiedad de todo cambio de paquetes.

protocolos, de hecho de cualquier medio arraigado en la toma de turnos asincrónica, ya sea
escribir cartas, enviar mensajes de texto o las tentativas ida y vuelta de las citas en línea.
Cada mensaje puede ser el último y, a menudo, no se nota la diferencia.
entre alguien que se toma su tiempo para responder y alguien que ha
desde que terminó la conversación.
Entonces, ¿cómo debemos manejar exactamente a una persona o una computadora?
poco confiable ?
La primera pregunta es cuánto tiempo debe transcurrir sin respuesta.
tomar para constituir una avería. En parte, esto depende de la naturaleza del
red: empezamos a preocuparnos en cuestión de segundos por teléfono, días después
correo electrónico y semanas por correo postal. Cuanto mayor sea el tiempo de ida y vuelta entre
emisor y receptor, más tiempo tarda un silencio en ser significativo, y el
más información puede estar potencialmente "en vuelo" antes de que el remitente se dé cuenta
hay un problema. En la creación de redes, hacer que las partes sintonicen adecuadamente sus
Las expectativas sobre la puntualidad de los reconocimientos son cruciales para el sistema.
funcionando correctamente.
La segunda pregunta, por supuesto, una vez que reconocemos una avería, es
qué debemos hacer exactamente al respecto.
Retroceso exponencial: el algoritmo del perdón
La palabra más difícil de traducir del mundo ha sido identificada como
"Ilunga", del idioma tshiluba que se habla en el sureste de República Dominicana
Congo.… Ilunga significa “una persona que está dispuesta a perdonar cualquier abuso
por primera vez, para tolerarlo una segunda vez, pero nunca una tercera vez ".
- NOTICIAS DE LA BBC
Si al principio no tiene éxito, / Inténtelo, inténtelo de nuevo.

—TH PALMER
Página 277
Hoy esperamos que nuestros dispositivos se comuniquen de forma inalámbrica incluso cuando los cables
sería fácil: nuestro teclado y mouse, por ejemplo, hablar de forma inalámbrica
con una computadora sentada a centímetros de distancia. Pero las redes inalámbricas comenzaron como
cuestión de necesidad, en un lugar donde ningún cable podría hacer el trabajo: Hawaii. En
finales de los 60 y principios de los 70, Norman Abramson de la Universidad de Hawái
en Honolulu estaba tratando de vincular los siete campus de la universidad y
muchos institutos de investigación, repartidos en cuatro islas y cientos de millas.
Se le ocurrió la idea de implementar la conmutación de paquetes por radio en lugar de
el sistema telefónico, conectando las islas con una cadena suelta de transmisores
y receptores. Este sistema se conocería como ALOHAnet.
El mayor obstáculo que tuvo que superar ALOHAnet fue
interferencia. A veces, dos estaciones transmitían al mismo tiempo,
inadvertidamente interfiriendo las señales de los demás. (Esto es, por supuesto, un familiar
también en la conversación humana) .Si ambas estaciones simplemente retransmitieran
de inmediato para tratar de transmitir su mensaje, correrían el riesgo de obtener
atrapado en interferencia perpetua para siempre. Claramente, el protocolo ALOHAnet fue
van a necesitar decirle a las señales en competencia cómo darse espacio entre sí, cómo
para ceder y dar paso el uno al otro.
Lo primero que deben hacer los remitentes aquí es lo que se llama "romper
simetría." Como cualquier peatón en la acera sabe, esquivar a la derecha como un
El caminante que se aproxima esquiva a la izquierda, y luego los dos simultáneamente
esquivar hacia el otro lado, no resuelve nada. Es la misma historia cuando
dos oradores hacen una pausa, hacen gestos de deferencia hacia el otro, y luego
empezar a hablar de nuevo al mismo tiempo; o cuando dos autos en una intersección,
cada uno se detuvo para ceder al otro, intente acelerar en sincronía. Este es
un área donde el uso de la aleatoriedad se vuelve esencial; de hecho,
la creación de redes no sería posible sin él.
Una solución sencilla es que cada estación lance una moneda. Jefes, es
retransmite; colas, espera un turno y luego retransmite. Seguramente uno de ellos lo hará
pasar sin oposición en poco tiempo. Esto funciona bastante bien cuando hay
son solo dos remitentes. Pero, ¿y si hay tres señales simultáneas? O
cuatro Se necesitaría una probabilidad de uno en cuatro para que la red obtenga incluso una
un solo paquete en ese punto (después de lo cual todavía tendrías tres
Página 278
estaciones en conflicto se fueron, y tal vez incluso más señales en competencia que lleguen
mientras tanto). A medida que aumenta aún más el número de conflictos, la red
el rendimiento podría simplemente caerse por un precipicio. Un informe de 1970 sobre ALOHAnet
dijo que por encima de un mero 18,6% de utilización promedio de las ondas de radio, "el
el canal se vuelve inestable ... y el número medio de retransmisiones
se vuelve ilimitado ". No es bueno.
¿Entonces lo que hay que hacer? ¿Hay alguna manera de hacer un sistema que pueda evitar esto?
¿destino?
El avance resultó ser el aumento de la demora promedio después de
cada falla sucesiva, específicamente, duplicando el retraso potencial antes
tratando de transmitir de nuevo. Entonces, después de una falla inicial, un remitente aleatoriamente
retransmitir uno o dos turnos más tarde; después de un segundo fracaso, intentaría
de nuevo en cualquier lugar de una a cuatro vueltas más tarde; un tercer fracaso consecutivo
significa esperar entre una y ocho vueltas, y así sucesivamente. Esta
El enfoque elegante permite que la red se adapte potencialmente a cualquier
número de señales en competencia. Dado que la duración máxima del retardo (2, 4, 8,
16…) forma una progresión exponencial, se conoce como exponencial
Retroceso .
El retroceso exponencial fue una gran parte del funcionamiento exitoso del
ALOHAnet a partir de 1971, y en la década de 1980 se convirtió en TCP,
convirtiéndose en una parte fundamental de Internet. Todas estas décadas después, todavía lo es. Como
un artículo influyente lo expresa, "Para un punto final de transporte integrado en un
red de topología desconocida y con un desconocido, incognoscible y
población en constante cambio de conversaciones en competencia, sólo una
El esquema tiene alguna esperanza de funcionar: retroceso exponencial ".
Pero son los otros usos del algoritmo los que sugieren algo más
prescriptivo y más profundo. Más allá de la simple prevención de colisiones,
El retroceso exponencial se ha convertido en la forma predeterminada de manejar casi todos
casos de falla o falta de confiabilidad de la red. Por ejemplo, cuando tu
la computadora está intentando acceder a un sitio web que parece no funcionar, utiliza
Retroceso exponencial: volver a intentarlo un segundo más tarde, de nuevo unos segundos
después de eso, y así sucesivamente. Esto es bueno para todos: evita que un servidor host
que es inferior a recibir solicitudes tan pronto como regresa
Página 279
en línea, y evita que su propia máquina desperdicie demasiado esfuerzo
tratando de sacar sangre de una piedra. Pero curiosamente, tampoco fuerza (o
permitir) que su máquina se rinda por completo.
El Backoff exponencial también es una parte crítica de la seguridad de la red, cuando
sucesivas fallas de contraseña al iniciar sesión en una cuenta son castigadas por un
período de bloqueo exponencialmente creciente. Esto evita que un hacker utilice
un "ataque de diccionario" contra una cuenta, pasando por una contraseña potencial
después de la contraseña hasta que finalmente tengan suerte. Al mismo tiempo también
resuelve otro problema: el verdadero propietario de la cuenta, por olvidadizo que sea,
nunca se bloquea permanentemente después de un corte arbitrario.
En la sociedad humana, tendemos a adoptar una política de dar a las personas algunos
número de oportunidades seguidas, y luego se rindió por completo. Tres strikes, eres
fuera. Este patrón prevalece por defecto en casi cualquier situación que requiera
perdón, indulgencia o perseverancia. En pocas palabras, tal vez lo estemos haciendo
incorrecto.
Un amigo nuestro reflexionó recientemente sobre un compañero de infancia que tuvo un
desconcertante costumbre de escatimar en los planes sociales. ¿Qué hacer? Decidir una vez
y por todo lo que finalmente había tenido suficiente y renunciando por completo a la
La relación parecía arbitraria y severa, pero continuaba persistiendo en
la reprogramación perpetua parecía ingenua, propensa a conducir a una cantidad interminable de
decepción y pérdida de tiempo. Solución: Retroceso exponencial en el
tasa de invitación. Intente reprogramar en una semana, luego dos, luego cuatro, luego ocho.
La tasa de "retransmisión" se acerca a cero, pero nunca es necesario
rendirse por completo.
Otro amigo nuestro agonizaba sobre si ofrecer refugio y
asistencia financiera a un miembro de la familia con antecedentes de adicción a las drogas.
No podía soportar perder la esperanza de que él cambiara las cosas, y
No podía soportar la idea de darle la espalda para siempre. Pero ella tambien
no se atrevía a hacer todo lo que se requería para tenerlo en su casa ...
comprarle ropa y cocinarle, reabrirle cuentas bancarias,
y llevarlo al trabajo todas las mañanas, cuando en algún momento misterioso y
En un momento abrupto, tomaría todo el dinero y desaparecería, solo para llamar
Página 280
de nuevo varias semanas después y piden ser perdonados y devueltos.

Parecía una paradoja, una elección cruel e imposible.
El retroceso exponencial no es una panacea mágica en casos como este, pero lo hace
ofrecer un posible camino a seguir. Requerir un período que aumenta exponencialmente
de sobriedad, por ejemplo, ofrecería un desincentivo para violar la casa
reglas de nuevo. Haría que el miembro de la familia probara cada vez más asiduamente
que se tomaba en serio su regreso y que protegería al anfitrión de la
de lo contrario tensión continua del ciclo. Quizás lo más importante, el anfitrión
nunca tendría que decirle a su pariente que se había rendido con él para siempre o
que estaba más allá de la redención. Ofrece una forma de tener paciencia finita y
misericordia infinita. Quizás no tengamos que elegir.
De hecho, la última década ha visto el comienzo de una revolución silenciosa en
la forma en que el propio sistema judicial maneja la supervisión comunitaria de las drogas
delincuentes. Esa revolución está encabezada por un programa piloto llamado
HOPE, que utiliza los principios de retroceso exponencial de ALOHAnet—
y que, en una sorprendente coincidencia, comenzó en el lugar de nacimiento de la
ALOHAnet en sí: Honolulu.
Poco después de prestar juramento en el Tribunal del Primer Circuito de Hawái, el juez
Steven Alm notó un patrón notable. Los en libertad condicional repetidamente
violar sus términos de libertad condicional, y los jueces de circuito usarían rutinariamente sus
discreción para dejarlos salir con una advertencia. Pero en algún momento, tal vez después de un
una docena o más de violaciones, el juez decidiría ser estricto y asignaría
infractor una pena de prisión medida en años. Alm dice: "Pensé, qué
una forma loca de intentar cambiar el comportamiento de alguien ". Así que Alm propuso casi
exactamente lo contrario. En lugar de audiencias de violación programadas durante mucho tiempo
hacia el futuro, requiriendo juicios inciertos, y ocasionalmente
produciendo enormes sanciones, ESPERANZA se basa en acciones inmediatas y predefinidas
castigos que comienzan con un solo día en la cárcel y aumentan después de cada
incidente. Un estudio de cinco años del Departamento de Justicia informó que
Las personas en libertad condicional HOPE tenían la mitad de probabilidades de ser arrestadas que las p
por un nuevo delito o revocar su libertad condicional. Y fueron 72% menos
propenso a consumir drogas. Diecisiete estados han seguido el ejemplo de Hawái y
lanzaron sus propias versiones de HOPE.
Página 281
Control de flujo y prevención de congestión
Los primeros esfuerzos en la creación de redes informáticas se centraron en establecer

transmisiones a través de enlaces no fiables. Estos esfuerzos demostraron ser tan exitosos
que surgió inmediatamente una segunda preocupación: asegurarse de que una sobrecarga
red podría evitar un colapso catastrófico. Tan pronto como TCP resolvió el
problema de obtener datos del punto A al punto B de lo que se enfrentó
el problema del estancamiento.
La alerta temprana más importante se produjo en 1986, en una línea que conecta
el Laboratorio Lawrence Berkeley y el campus de UC Berkeley, que son
separados por aproximadamente la longitud de un campo de fútbol. (En Berkeley, el espacio
se llena con un campo de fútbol real). Un día, el ancho de banda
de esa línea cayó abruptamente de sus típicos 32,000 bits por segundo a solo
40 bits por segundo. Las víctimas, Van Jacobson de LBL y Michael Karels
en UCB, “quedaron fascinados por esta repentina caída del factor de mil
ancho de banda y se embarcó en una investigación de por qué las cosas se habían puesto tan
malo."
Mientras tanto, escucharon murmullos de otros grupos de redes.
en todo el en
buscando país
elque se encontraban
código con lo algún
subyacente. "¿Hay mismo. Jacobson
error comenzó
en el protocolo?"
el se preguntó. "Esta cosa estaba trabajando en pruebas a menor escala, y luego
de repente se vino abajo ".
Una de las mayores diferencias entre la conmutación de circuitos y los paquetes.
el cambio surge en la forma en que manejan la congestión. En la conmutación de circuitos,
el sistema aprueba una solicitud de canal o la niega rotundamente si el
solicitud no puede ser atendida. Por eso, si alguna vez ha intentado utilizar un
sistema telefónico durante algún tiempo pico, es posible que haya encontrado el
"Tono de información especial" y mensaje que proclama que "todos los circuitos están
ocupado."
La conmutación de paquetes es radicalmente diferente. El sistema telefónico se llena ; los
el sistema de correo se vuelve lento . No hay nada en la red que le diga explícitamente a un
remitente cuántos otros remitentes hay, o qué tan congestionada está la red
en cualquier momento dado, y la cantidad de congestión cambia constantemente.
Página 282
Por lo tanto, el remitente y el receptor no solo deben comunicarse sino

metacomunicarse: necesitan averiguar qué tan rápido deben enviarse los datos.
De alguna manera, una variedad de flujos de paquetes, sin administración explícita o
coordinación: ambos deben apartarse del camino del otro y tomar rápidamente
ventaja de cualquier nuevo espacio disponible.
El resultado del trabajo de detective de Jacobson y Karels fue un conjunto revisado de
algoritmos de control de flujo y para evitar la congestión, uno de los más grandes
modificaciones al TCP en cuarenta años.
En el corazón del control de la congestión de TCP se encuentra un algoritmo llamado Additive
Aumento, disminución multiplicativa o AIMD. Antes de que AIMD entre en funcionamiento,
nueva conexión aumentará agresivamente su velocidad de transmisión: si la primera
el paquete se recibe con éxito, envía dos más, si ambos obtienen
a través de él envía un lote de cuatro, y así sucesivamente. Pero tan pronto como cualquier paquete
ACK no vuelve al remitente, el algoritmo AIMD se hace cargo.
Bajo AIMD, cualquier lote de paquetes completamente recibido provoca el número de
paquetes en vuelo no para duplicar sino simplemente para aumentar en 1, y cayeron
Los paquetes hacen que la velocidad de transmisión se reduzca a la mitad (de ahí el nombre
Aumento aditivo, disminución multiplicativa). Esencialmente, AIMD toma la
forma de alguien que dice: "Un poco más, un poco más, un poco más, whoa,
demasiado, corte hacia atrás, está bien un poco más, un poco más ... ”Por lo tanto, conduce a
una forma de ancho de banda característica conocida como el "diente de sierra TCP" - estable
subidas ascendentes salpicadas de fuertes desniveles.
¿Por qué una disminución tan marcada y asimétrica? Como Jacobson y Karels
explicar, la primera vez que AIMD se activa es cuando se ha experimentado una conexión
el primer paquete descartado en su fase inicial de aceleración agresiva. Porque
Esa fase inicial implicó duplicar la tasa de transmisión con cada
volea exitosa, reduciendo la velocidad a la mitad tan pronto como ha habido un
El problema es completamente apropiado. Y una vez que una transmisión está en curso, si
empieza a fallar de nuevo, probablemente se deba a que hay una nueva conexión
compitiendo por la red. La valoración más conservadora de eso
situación, es decir, asumiendo que eres la única persona que usa la red
y ahora hay una segunda persona que toma la mitad de los recursos; también conduce a
recortando a la mitad. El conservadurismo aquí es esencial: una red puede estabilizarse
Página 283
solo si sus usuarios retroceden al menos tan rápido como la velocidad a la que se está
sobrecargado. Por la misma razón, un aumento meramente aditivo ayuda a estabilizar
cosas para todos, evitando ciclos rápidos de sobrecarga y recuperación.
Aunque una distinción tan estricta entre suma y multiplicación es
el tipo de cosa que es poco probable que se encuentre en la naturaleza, el diente de sierra TCP sí encuent
resonancia en varios dominios donde la idea es tomar tanto como uno pueda
salirse con la suya con seguridad.
En una colaboración fortuita de 2012, por ejemplo, el ecologista de Stanford
Deborah Gordon y el científico informático Balaji Prabhakar descubrieron que
Las hormigas parecen haber desarrollado algoritmos de control de flujo millones de años.
antes que los humanos. Como una red de computadoras, una colonia de hormigas se enfrenta a un
problema de asignación al tratar de gestionar su "flujo", en este caso, el flujo de
hormigas que salen a buscar comida, en condiciones variables que pueden
afectan drásticamente la velocidad a la que las hormigas realizan viajes de ida y vuelta con éxito. Y
como las computadoras en Internet, las hormigas deben resolver este problema compartido sin
el beneficio de un tomador de decisiones central, en lugar de desarrollar lo que Gordon
llama "control sin jerarquía". Resulta que la solución de las hormigas es similar,
también: un ciclo de retroalimentación donde los recolectores exitosos incitan a más personas a dejar el
nido, mientras que los retornados sin éxito resultan en una disminución de la búsqueda de alimento
actividad.
Otro comportamiento animal también evoca el control de flujo de TCP, con su
característico diente de sierra. Ardillas y palomas que van tras la comida humana.
los restos se arrastrarán hacia adelante un paso a la vez, de vez en cuando saltan hacia atrás, luego
Avanzar lentamente hacia adelante de nuevo. Y puede ser que las comunicaciones humanas
ellos mismos reflejan los protocolos que los transmiten: cada mensaje de texto
o la respuesta por correo electrónico anima a otro, mientras que cada mensaje no devuelto
detiene el flujo.
En términos más generales, AIMD sugiere un enfoque de los muchos lugares de la vida
donde luchamos por asignar recursos limitados en situaciones inciertas y fluctuantes
condiciones.
El satírico "Principio de Peter", articulado en la década de 1960 por la educación
el profesor Laurence J. Peter, afirma que “todo empleado tiende a estar a la altura
nivel de incompetencia ". La idea es que en una organización jerárquica,
Página 284
Cualquiera que haga un trabajo de manera competente será recompensado con un ascenso a un
nuevo trabajo que puede implicar desafíos más complejos y / o diferentes. Cuando
el empleado finalmente alcanza un rol en el que no se desempeña bien, su
marchar hacia arriba las filas se estancarn, y permanecern en ese papel por el resto de
su carrera. Así es lógico, dice la ominosa lógica del libro de Peter.
Principio, que eventualmente todos los puntos de una organización llegarán a ser
llenado por alguien que hace mal ese trabajo. Unos cincuenta años antes de Peter
formulación, el filósofo español José Ortega y Gasset en 1910 expresó la
mismo sentimiento. “Todo servidor público debería ser degradado a
rango inmediatamente inferior ", escribió," porque fueron avanzados hasta que
se volvió incompetente ".
Algunas organizaciones han intentado remediar el Principio de Peter mediante
simplemente despedir a los empleados que no avanzan. El llamado Sistema Cravath,
ideado por el bufete de abogados líder Cravath, Swaine & Moore, implica la contratación
casi exclusivamente graduados recientes, colocándolos en los rangos inferiores,
y luego, de manera rutinaria, promoverlos o despedirlos durante los años siguientes.
En 1980, las Fuerzas Armadas de EE. UU. Adoptaron una política similar de "subir o bajar" con el
Ley de Gestión del Personal de los Oficiales de Defensa. El Reino Unido tiene
igualmente persiguió lo que ellos llaman "control de dotación", hasta gran controversia.
¿Existe alguna alternativa, algún camino intermedio entre la institucionalidad
estancamiento del Principio de Peter y la severidad draconiana de la
fuera del sistema? El algoritmo AIMD puede ofrecer tal enfoque, ya que
está diseñado explícitamente para manejar las demandas de un entorno volátil. A
la red informática debe gestionar su propia capacidad máxima de transmisión,
más las tasas de transmisión de sus clientes, todas las cuales pueden estar fluctuando
impredeciblemente. Del mismo modo, en un entorno empresarial, una empresa tiene un grupo limitado
de fondos para pagar sus operaciones, y cada trabajador o proveedor tiene un
capacidad para la cantidad de trabajo que pueden hacer y la cantidad de
responsabilidad que pueden manejar. Las necesidades, capacidades y
las asociaciones siempre están en constante cambio.
La lección del diente de sierra de TCP es que, en una situación impredecible y cambiante
medio ambiente, empujar las cosas hasta el punto de fallar es a veces el
la mejor (o la única) forma de utilizar todos los recursos al máximo. Lo que importa
Página 285
es asegurarse de que la respuesta al fracaso sea a la vez aguda y resistente. Debajo

AIMD, cada conexión que no deja caer la pelota se acelera hasta que se
—Y luego se corta a la mitad e inmediatamente comienza a acelerar de nuevo. Y
aunque violaría casi todas las normas de la cultura corporativa actual, uno
puedo imaginar una corporación en la que, anualmente, cada empleado está siempre
promovió un solo paso en el organigrama o envió parte del camino de regreso
abajo.
Como lo vio Laurence J. Peter, el insidioso Principio de Peter surge en
corporaciones debido a “el primer mandamiento de la vida jerárquica: la
se debe preservar la jerarquía ". TCP, por el contrario, enseña las virtudes de
flexibilidad. Las empresas hablan de jerarquías "planas" y jerarquías "altas", pero
podrían considerar hablar de dinámicos . Bajo un sistema AIMD, no
uno está ansioso durante mucho tiempo por estar sobrecargado, ni resentido por una
promoción perdida; Ambos son correctivos temporales y frecuentes, y el
el sistema se cierne cerca de su equilibrio a pesar de que todo cambia todo el tiempo.
Quizás algún día no hablemos del arco de la carrera de uno, sino más bien de su
diente de sierra.
Backchannels: Control de flujo en lingüística
Examinar el control de flujo de la red deja en claro que ACK ascendente

Los paquetes no sólo reconocen y confirman las transmisiones, sino que dan forma al
contornos de toda la interacción, su ritmo y cadencia. Esto nos ofrece a ambos un
recordatorio y una idea de lo importante que es la retroalimentación para la comunicación.
En TCP, como hemos visto, no existe una transmisión unidireccional:
sin una retroalimentación constante, el remitente se ralentizará casi de inmediato.
Curiosamente, la creciente conciencia del papel fundamental de la retroalimentación en la
El campo de la creación de redes reflejó un conjunto casi idéntico de desarrollos que
aproximadamente al mismo tiempo en la comunidad lingüística. En medio de la
siglo XX, la lingüística estuvo dominada por las teorías de Noam
Chomsky, que consideraba el lenguaje en su estado más perfecto e ideal:
oraciones perfectamente fluidas, gramaticales e ininterrumpidas, como si todo
la comunicación eran textos escritos. Pero a partir de las décadas de 1960 y 1970, un
Página 286
El aumento de interés en los aspectos prácticos del lenguaje hablado reveló apenas
cuán elaborados y sutiles son los procesos que gobiernan la toma de turnos,
interrupción, y redactar una oración o historia sobre la marcha mientras se
en sintonía con las reacciones del oyente en cada paso del camino. Lo que surgió fue un
visión de la comunicación, incluso ostensiblemente unidireccional, como un acto colaborativo. Como
El lingüista Victor Yngve escribiría en 1970: “De hecho, tanto la persona que
tiene el turno y su compañero están simultáneamente involucrados en ambos
y escuchando. Esto se debe a la existencia de lo que llamo la espalda.
canal, a través del cual la persona que tiene el turno recibe mensajes cortos
como 'sí' y 'ajá' sin renunciar al turno ".
Un examen de los "canales secundarios" humanos abrió un horizonte completamente nuevo
para el campo de la lingüística, lo que provocó una reevaluación completa de la
dinámica de la comunicación, específicamente, el papel del oyente. En uno
estudio ilustrativo, un equipo dirigido por Janet Bavelas en la Universidad de Victoria
investigó qué pasaría cuando alguien escucha una historia personal
se distrajo: no lo que sucedería con la comprensión del oyente, sino
qué pasaría con la historia . Con una mala retroalimentación, descubrieron que
la historia se desmorona.
Los narradores que contaron historias cercanas a oyentes distraídos ... les dijeron menos bien en general y
particularmente mal en lo que debería haber sido la conclusión dramática. Los finales de sus historias fueron
abruptos o entrecortados, o dieron vueltas y volvieron a contar el final más de una vez, y a menudo
justificó su historia explicando el cierre obvio.
Todos hemos tenido la experiencia de hablar con alguien cuyos ojos se desviaron
a su teléfono, tal vez, haciéndonos preguntarnos si nuestro mediocre
la narración tenía la culpa. De hecho, ahora está claro que la causa y el efecto son
a menudo al revés: un mal oyente destruye la historia.
Comprender la función exacta y el significado de los canales de retorno humanos.
sigue siendo un área de investigación activa. En 2014, por ejemplo, UC Santa
Jackson Tolins y Jean Fox Tree de Cruz demostraron que esos
discretos "uh-huhs" y "sí" y "hmms" y "ohs" esa pimienta
Nuestro habla desempeña papeles distintos y precisos en la regulación del flujo de
información de un hablante a otro, tanto su velocidad como su nivel de detalle.
Página 287
De hecho, son tan críticos como los ACK en TCP. Dice Tolins,
"Realmente, aunque algunas personas pueden ser peores que otras, los 'malos narradores' pueden
culpa al menos en parte a su audiencia ". Esta comprensión ha tenido la
efecto secundario inesperado de quitar algo de la presión cuando da
conferencias, incluidas, por supuesto, conferencias sobre ese mismo resultado. "Cada vez que yo
dar estas charlas de canal secundario, siempre le digo a la audiencia que la forma en que
están retrocediendo a mi charla en este momento está cambiando lo que digo ”, bromea.
"Por lo que son responsables de lo bien que me vaya".
Bufferbloat: es la latencia, estúpido
El desarrollo de una gestión de colas activa eficaz se ha visto obstaculizado por

conceptos erróneos sobre la causa y el significado de las colas.
—KATHLEEN NICHOLS Y VAN JACOBSON
Era el verano de 2010 y, como muchos padres, Jim Gettys estaba preparando
frecuentes quejas de sus hijos de que la red wi-fi familiar estaba
corriendo lentamente. Sin embargo, a diferencia de la mayoría de los padres, Gettys ha trabajado en HP,
Alcatel-Lucent, el Consorcio World Wide Web e Internet
Grupo de trabajo de ingeniería. Literalmente fue el editor, en 1999, de HTTP
especificación todavía en uso hoy. Entonces, ¿dónde buscarían la mayoría de los papás geek?
el problema, Gettys investigó el problema .
Como Gettys explicaría a una sala llena de ingenieros de Google, con
La jerga del networking dando paso a una convicción urgente e inconfundible:
Sucedió que estaba copiando, o sincronizando, los viejos archivos del Consorcio X de mi casa al MIT.
en esta ruta de diez milisegundos de duración ... SmokePing [estaba] informando latencias con un buen promedio
más de un segundo, junto con una mala pérdida de paquetes, solo mientras copiaba un archivo ... Tomé Wireshark y
había estas explosiones de comportamiento realmente extraño ... Esto parecía no TCP [diente de sierra] I
esperado en absoluto. Nunca debería ocurrir de esa manera.
En un lenguaje sencillo, vio algo ... muy extraño. Como dice el refrán, "el
frase más emocionante para escuchar en la ciencia, la que presagia nuevas
descubrimientos, no es 'Eureka!' pero 'Eso es gracioso' ".
Página 288
Al principio, Gettys pensó que algo andaba mal con su módem de cable.
Lo que su familia había estado llamando un problema en Internet parecía un
atasco de tráfico en su propio enchufe de pared. Los paquetes destinados a Boston no lo eran
atascado a mitad de camino allí; se estaban quedando atrapados en la casa.
Pero cuanto más lo investigaba Gettys, más se preocupaba. los
El problema no afectó solo al enrutador y al módem de su hogar, sino a todos los
enrutador y módem. Y el problema no solo estaban en los dispositivos de red, sino que
estaba en las propias computadoras, en computadoras de escritorio, computadoras portátiles, tabletas y
teléfonos inteligentes, entretejidos en Linux, Windows y OS X. Y no fue solo en
hardware del usuario final, ya sea: tocó la infraestructura misma de Internet
sí mismo. Gettys se sentó a almorzar con jugadores clave en Comcast, Verizon,
Cisco y Google, incluidos Van Jacobson y Vint Cerf, y poco a poco
comenzó a armar el rompecabezas.
El problema estaba en todas partes. Y el problema era el bufferbloat.
Un búfer es esencialmente una cola cuya función es suavizar las ráfagas. Si
entraste en una tienda de donas aproximadamente al mismo tiempo que otra
cliente, no sería conveniente que el cajero abrumado momentáneamente
hacer que uno de ustedes salga de la tienda y vuelva en otro momento. Clientes
no lo aceptaría, por supuesto, pero tampoco la administración: tal política es
virtualmente garantizado para subutilizar al cajero. Poniendo a los clientes en un
en cambio, la cola asegura que el rendimiento promedio de la tienda se acerque
su rendimiento máximo . Eso es bueno.
Sin embargo, esta utilización superior de recursos tiene un costo muy real:
demora. Cuando Tom llevó a su hija a un festival del Cinco de Mayo en
Berkeley, puso su corazón en una crepe de plátano y chocolate, así que se pusieron en fila
y esperó. Finalmente, después de veinte minutos, Tom llegó al frente de la
línea y realizó su pedido. Pero después de pagar, tuvieron que esperar cuarenta más
minutos para obtener la crepe. (Como Jim Gettys, Tom rápidamente encontró
él mismo presentando un volumen sustancial de quejas familiares).
resultó tomar menos tiempo que hacer crepes, por lo que la cola para ordenar fue
solo la primera parte del problema. Sin embargo, al menos era visible; clientes
Sabía lo que les esperaba. La segunda cola, más larga, era invisible. Entonces en
este caso habría sido un resultado mucho más feliz para todos si la crepe
Página 289
stand acababa de cortar la línea en algún momento y puso un cartel de que

no recibimos órdenes por un tiempo. Rechazar a los clientes habría hecho
todo el mundo está mejor, ya sea que terminen en una línea de crepé más corta o
en otra parte. Y no le habría costado ni un centavo al puesto de crepes en ventas perdidas,
porque de cualquier manera solo pueden vender tantas crepes como puedan hacer en un
día, independientemente de cuánto tiempo estén esperando sus clientes.
Este es precisamente el fenómeno que Jim Gettys estaba observando en su
módem de cable doméstico. Debido a que estaba cargando un archivo, su computadora estaba
enviando al módem tantos paquetes ascendentes como pudiera manejar. Y el
módem pretendía manejar mucho más de lo que realmente podía, girando
ninguno de distancia mientras se crea una cola masiva. Entonces, cuando Gettys intentó
descargar algo al mismo tiempo (para visitar una página web o consultar el correo electrónico)
sus paquetes ACK se atascarían detrás de la carga, teniendo que esperar en la fila
en el módem para salir de casa. Porque sus ACKs tardaron una eternidad en
volver a la web y a los servidores de correo electrónico, los servidores a su vez acelerarían su
propias velocidades de conexión aguas abajo a un rastreo correspondiente.
Fue como intentar tener una conversación en la que cada vez que dices "uh-
eh ”se retrasa diez o veinte segundos. El hablante se va a ralentizar
hacia abajo, asumiendo que no los está comprendiendo, y no hay nada
puedes hacer al respecto.
Cuando se llena un búfer de red, lo que suele ocurrir se denomina Tail
Drop : una forma poco ceremoniosa de decir que cada paquete que llega después de eso
el punto simplemente se rechaza y efectivamente se elimina. (Convirtiendo a nuevos clientes
lejos del puesto de crepes una vez que la fila se hace demasiado larga sería una versión de
Tail Drop en un contexto humano.) Dada la metáfora postal del paquete
cambiar, puede parecer un poco extraño imaginar a un cartero que simplemente
vaporiza cada paquete que no cabe en el camión esa mañana. Sin embargo, es
precisamente esos "paquetes caídos" que llevan a una computadora a notar que uno de sus
paquetes no han sido reconocidos, lo que provoca que AIMD comience a reducir a la mitad el
banda ancha. Los paquetes descartados son la respuesta principal de Internet
mecanismo. Un búfer que es demasiado grande: un restaurante que acepta todos los pedidos sin
importa lo poco personal que haya en la cocina, un módem que toma cada paquete que
Página 290
entra independientemente del tiempo que lleve enviarlos; evita que

moderación para que no suceda como debería.
Básicamente, los búferes utilizan retrasos, conocidos en redes como "latencia".
para maximizar el rendimiento. Es decir, provocan paquetes (o clientes)
esperar, aprovechar períodos posteriores en los que las cosas van lentas. Pero un amortiguador
que está funcionando permanentemente lleno le ofrece lo peor de ambos mundos: todos los
latencia y nada de ceder. Suavizar las ráfagas es genial si estás en
promedio , despejar las cosas al menos tan rápido como llegan, pero si su
la carga de trabajo promedio excede su tasa de trabajo promedio, ningún búfer puede funcionar
milagros. Y cuanto más grande sea el búfer, más atrasado estará antes
empiezas a pedir ayuda. Uno de los principios fundamentales de las soluciones amortiguadoras, sea
ellos para paquetes o clientes, es que solo funcionan correctamente cuando están
rutinariamente puesta a cero.
Durante décadas, la memoria de la computadora fue lo suficientemente cara como para
simplemente no era motivo para construir módems con montones de memoria innecesaria
capacidad. Por lo tanto, simplemente no había forma de que un módem construyera un
cola más grande de lo que podría manejar. Pero en algún momento, a medida que las economías de escal
en la industria de la computación redujo radicalmente el costo de la memoria, el módem
Los fabricantes comenzaron a dar a sus máquinas gigabytes de RAM porque eso
fue efectivamente la menor cantidad de RAM que pudieron obtener. Como resultado, el
búferes de dispositivos ubicuos: en módems, enrutadores, computadoras portátiles, teléfonos inteligentes
en la columna vertebral de la propia Internet: se volvió miles de veces demasiado grande,
antes de que personas como Jim Gettys hicieran sonar la alarma para hacer algo al respecto.
Mejor nunca que tarde
Considere su problema más básico como una persona soltera ... le gustas a alguien,
no te gustan de vuelta. En un momento, eso solía ser una especie de
situación incómoda. Tenías que tener una conversación, fue extraño. Ahora
¿A qué te dedicas? Le gustas a alguien, ¿no te gusta? Tu solo
finge estar ocupado ... para siempre.
—AZIZ ANSARI
Página 291
Ahora es mejor que nunca.

Aunque nunca suele ser mejor que ahora.
- EL ZEN DE PYTHON
La cantante Katy Perry tiene un 107% más de seguidores en Twitter que su estado natal de
California tiene gente. La persona más seguida en Twitter, al principio
2016 cuenta con 81,2 millones de cuentas entre sus fans. Esto significa
que incluso si el 99% de sus fans nunca le envían mensajes, e incluso si la mayoría
dedicó un 1% que le enviaba mensajes que lo hicieran solo una vez al año.
2.225 mensajes al día. Todos los días.
Imagínese si Perry se comprometiera a responder a cada mensaje de los fanáticos en el
orden recibida. Si pudiera responder 100 por día, entonces la espera esperada de los fanáticos
el tiempo de respuesta pronto se medirá en décadas . Es justo imaginar
que la mayoría de los fanáticos preferirían una pequeña posibilidad de obtener una respuesta de inmedi
respuesta garantizada dentro de diez o veinte años.
Tenga en cuenta que Perry no tiene este problema cuando sale de un lugar y
Debe correr un guante de fanáticos esperando un autógrafo o unas pocas palabras. Sidra de pera
hace lo que puede, sigue adelante y las oportunidades perdidas se disipan. El cuerpo
es su propio control de flujo. No podemos estar en más de un lugar a la vez. En un
fiesta abarrotada inevitablemente participamos en menos del 5% de la conversación,
y no puede leer o ponerse al día con el resto. Fotones que pierden el
retina no están en cola para verlas más tarde. En la vida real, la pérdida de paquetes es casi
total.
Usamos el modismo de "bolas caídas" casi exclusivamente en un despectivo
sentido, lo que implica que la persona en cuestión era perezosa, complaciente o
olvidadizo. Pero el lanzamiento táctico de bolas es una parte fundamental para conseguir que las cosas
hecho bajo sobrecarga.
La crítica más frecuente de las comunicaciones modernas es que estamos
"siempre conectado." Pero el problema no es que siempre estemos conectados;
no eran. El problema es que siempre estamos protegidos . La diferencia es
enorme.
La sensación de que hay que mirar todo en Internet o leer
todos los libros posibles, o ver todos los programas posibles, es bufferbloat. Extrañas un
Página 292
episodio de tu serie favorita y míralo una hora, un día, una década después.
Te vas de vacaciones y vuelves a casa y te encuentras con una montaña de correspondencia. Eso
solía ser que la gente llamaba a tu puerta, no obtenían respuesta y se iban
lejos. Ahora están esperando en la fila cuando llegas a casa.
Diablos, el correo electrónico fue diseñado deliberadamente para superar Tail Drop. Como su
El inventor, Ray Tomlinson, lo expresa:
En ese momento, no había una forma realmente buena de dejar mensajes a las personas. El telefono funciono
hasta cierto punto, pero alguien tenía que estar allí para recibir la llamada. Y si no fuera la persona que
quería conseguir, era un asistente administrativo o un servicio de contestador o algo por el estilo
clasificar. Ese era el mecanismo por el que tenía que pasar para dejar un mensaje, por lo que todos se cerraron
sobre la idea de que podría dejar mensajes en la computadora.
En otras palabras, pedimos un sistema que nunca convertiría a un remitente

lejos, y para bien o para mal obtuvimos uno. De hecho, durante los ltimos quince
años, el paso de la conmutación de circuitos a la conmutación de paquetes se ha jugado
en toda la sociedad. Solíamos solicitar circuitos dedicados con otros; ahora
les enviamos paquetes y esperamos expectantes los ACK. Solíamos rechazar ;
ahora aplazamos .
La tan lamentada "falta de ociosidad" de la que se lee es, perversamente, la
característica principal de los búferes: llevar el rendimiento medio al máximo
rendimiento. Prevenir la inactividad es lo que hacen. Verifica el correo electrónico del
carretera, de vacaciones, en el baño, en medio de la noche. Tu nunca eres
siempre aburrido. Esta es la bendición mixta de los amortiguadores, que funcionan como se anuncia.
Los autorespondedores de correos electrónicos de vacaciones les dicen explícitamente a los remitente
mejor podría decirles a los remitentes que esperen Tail Drop. En vez de
advirtiendo a los remitentes de tiempos de cola superiores a la media, podría advertirles que
simplemente rechazaba todos los mensajes entrantes. Y esto no tiene por qué ser
limitado a vacaciones: uno puede imaginar un programa de correo electrónico configurado para rechaza
mensajes entrantes una vez que la bandeja de entrada alcanzó, digamos, cien elementos. Este es
desaconsejado para facturas y similares, pero no un enfoque irrazonable para, digamos,
invitaciones sociales.
La idea de encontrar una bandeja de entrada "llena" o un correo de voz "lleno" es una
anacronismo ahora, un retroceso evidente a finales del siglo XX y la
Página 293
principios de la década de 2000. Pero si las redes que conectan nuestros nuevos teléfonos y
computadoras, con su almacenamiento efectivamente infinito, todavía son deliberadamente
soltar paquetes cuando las cosas se ponen rápidas y furiosas, entonces tal vez haya
Razones para pensar en Tail Drop no como la lamentable consecuencia de una limitación
espacio de memoria, sino como una estrategia intencionada por derecho propio.
En cuanto al bloqueador de búfer de red, la historia en curso es complicada pero feliz.
uno, que implica esfuerzos a gran escala por hardware y sistema operativo
fabricantes para realizar cambios fundamentales en las colas de red. Hay
también una propuesta para un nuevo backchannel para TCP, la primera modificación de este tipo
en muchos años: Notificación de congestión explícita, o ECN. Completamente excitante
Internet de bufferbloat se basará en todos estos cambios y requerirá
la paciencia de muchos años. “Este es un pantano a largo plazo”, dice Gettys.
Pero hay mucho que esperar sobre un futuro post-bufferbloat. Con
su latencia inherente, los búferes son malos para la mayoría de los procesos interactivos. Cuando
hablamos a través de Skype, por ejemplo, generalmente preferimos un ocasional
señal estática ahora para una grabación clara de lo que dijo nuestro interlocutor tres
hace segundos. Para los jugadores, incluso un retraso de 50 milisegundos podría ser la diferencia
entre fragmentarse y ser fragmentado; de hecho, los juegos son tan sensibles a
latencia que todos los premios importantes del juego todavía se disputan en persona, con
jugadores que abordan aviones para reunirse y competir en una red que sirve
solo una habitación individual. Y lo mismo es cierto para cualquier otra cosa en la que ser
en sincronía importa. "Si quieres tocar música con tus amigos, incluso en
[tu] área metropolitana, te preocupas por decenas de milisegundos ", Gettys
notas, imaginando una gran cantidad de nuevas aplicaciones y negocios que
podría surgir para aprovechar el potencial interactivo de baja
latencias. “Una generalización que saco de toda esta experiencia es que
los ingenieros deberían pensar en el tiempo como en un ciudadano de primera clase ".
Stuart Cheshire de Apple está de acuerdo en que ya es hora de que la latencia se convierta en
una de las principales prioridades para los ingenieros de redes. Le horroriza que las empresas que
anunciar conexiones de Internet "rápidas" se refieren solo a un ancho de banda alto, no a
retraso bajo. Por analogía, señala que un Boeing 737 y un Boeing 747 ambos
volar a unas quinientas millas por hora; el primero puede contener 120
pasajeros, mientras que este último transporta tres veces más. Entonces "dirías
Página 294
que un Boeing 747 es tres veces "más rápido" que un Boeing 737? Por supuesto no,"
Cheshire exclama. La capacidad importa a veces: para transferir grandes
archivos, el ancho de banda es clave. (Si tiene una gran cantidad de carga para mover, un
un buque portacontenedores bien puede superar miles de viajes en un 747).
aplicaciones, sin embargo, un tiempo de respuesta rápido es a menudo mucho más importante,
y lo que realmente necesitamos son más Concordes. Y de hecho, trayendo
latencias hacia abajo es una de las fronteras actuales de la investigación de redes, y
Será interesante ver lo que trae.
Mientras tanto, hay otras batallas que librar. Gettys chasquea su
apartar la atención por un segundo, mirando fuera del encuadre. "No está funcionando para
¿usted? Estoy hablando con alguien en este momento, y me ocuparé de eso cuando esté
finalizado. Estamos terminando aquí, uh, no, el 5 GHz está funcionando en el
En este momento, el canal de 2,4 GHz se ha colgado. Es el infame error. Yo reiniciaré
el enrutador ". Que parece un momento oportuno para despedirnos y
liberar nuestro ancho de banda a los comunes, a la miríada de flujos que hacen su
aumento aditivo.
Página 295
11 Teoría de juegos
Las mentes de los demás
Soy optimista en el sentido de que creo que los humanos son nobles y
honorables, y algunos de ellos son realmente inteligentes ... Tengo un poco
visión más pesimista de las personas en grupos.
—STEVE JOBS
Un inversor vende una acción a otro, uno está convencido de que se dirige hacia abajo y el
otros convencidos de que está subiendo; Creo que sé lo que piensas pero no tengo
idea de lo que piensas yo pienso; estalla una burbuja económica; un futuro amante
ofrece un regalo que no dice "Quiero ser más que amigos" ni "No quiero
quieren ser más que amigos ”; una mesa de comensales discute sobre quién debería
tratar a quién y por qué; alguien que intenta ser útil ofende involuntariamente;
alguien que se esfuerza por ser genial dibuja risas; alguien tratando de romper
de la manada encuentra, consternado, la manada siguiendo su ejemplo. "Te quiero,"
dice un amante a otro; “Yo también te amo”, responde el otro; y ambos
Me pregunto qué quiere decir exactamente el otro con eso.
¿Qué tiene que decir la informática sobre todo esto?
A los escolares se les enseña a concebir las tramas literarias como pertenecientes a
una de varias categorías: hombre contra naturaleza, hombre contra sí mismo, hombre contra hombre, ho
contra la sociedad. Hasta ahora en este libro hemos considerado principalmente casos en el
las dos primeras categorías, es decir, la informática ha sido hasta ahora nuestro
guía a los problemas creados por la estructura fundamental del mundo, y por
Página 296
nuestras limitadas capacidades para procesar información. Parada óptima

los problemas surgen de la irreversibilidad e irrevocabilidad del tiempo; los
explorar / explotar el dilema, debido al suministro limitado de tiempo. Relajación y
La aleatorización emerge como estrategias vitales y necesarias para hacer frente a la
complejidad ineludible de desafíos como la planificación de viajes y las vacunas.
En este capítulo cambiamos el enfoque y consideramos los dos géneros restantes
—Es decir, hombre contra hombre y hombre contra sociedad: en efecto, los problemas que
plantean y causan el uno al otro. Nuestra mejor guía de este terreno proviene de un
rama de las matemáticas conocida como teoría de juegos, un campo que en su
La encarnación tuvo un impacto enorme en el siglo XX. En el pasado
un par de décadas, la polinización cruzada entre la teoría de juegos y la computadora
la ciencia ha producido el campo de la teoría algorítmica de juegos, que ha
Ya ha comenzado a tener impacto en el vigésimo primero.
Recursividad
Ahora, un hombre inteligente pondría el veneno en su propia copa porque

sabría que solo un gran tonto alcanzaría lo que estaba
dado. No soy un gran tonto, por lo que claramente no puedo elegir el vino en
frente de ti. Pero debes haber sabido que no era un gran tonto.
hubiera contado con eso, así que claramente no puedo elegir el vino en frente
de mí.
- LA PRINCESA NOVIA
Posiblemente el economista más influyente del siglo XX, John

Maynard Keynes, dijo una vez que "la inversión exitosa es anticipar la
anticipaciones de los demás ". Para que una acción se venda a, digamos, $ 60, el
El comprador debe creer que puede venderlo más tarde por $ 70, a alguien que crea que
puede venderlo por $ 80 a alguien que crea que puede venderlo por $ 90 a
alguien que crea que puede venderlo por $ 100 a otra persona. De este modo,
el valor de una acción no es lo que la gente cree que vale, sino lo que la gente piensa
Página 297
la gente piensa que vale la pena. De hecho, incluso eso no va lo suficientemente lejos. Como Keynes
dicho, haciendo una distinción crucial entre belleza y popularidad:
La inversión profesional puede compararse con los concursos de periódicos en los que el
Los competidores tienen que elegir las seis caras más bonitas de un centenar de fotografías, siendo el premio
otorgado al competidor cuya elección corresponde más cerca a las preferencias promedio de
los competidores en su conjunto; de modo que cada competidor tiene que elegir, no las caras que
él mismo encuentra las más bonitas, pero aquellas que él cree que son más probables para captar la imaginación del otro
competidores, todos los cuales ven el problema desde el mismo punto de vista. No es un
caso de elegir aquellas que, según nuestro mejor juicio, son realmente las más bonitas, ni siquiera
aquellos en los que la opinión media realmente piensa que los más bonitos. Hemos llegado al tercer grado
donde dedicamos nuestras inteligencias a anticipar lo que la opinión promedio espera el promedio
opinión a ser. Y creo que hay algunos que practican el cuarto, quinto y grados superiores.
La informática ilustra las limitaciones fundamentales de este tipo de

razonando con lo que se llama el "problema de la detención". Como demostró Alan Turing
en 1936, un programa de computadora nunca puede decirle con certeza si otro
El programa podría terminar calculando para siempre sin fin, excepto por
simulando el funcionamiento de ese programa y, por lo tanto, potencialmente saliendo del
extremo profundo en sí mismo. (En consecuencia, los programadores nunca tendrán herramientas autom
que puede decirles si su software se congelará.) Este es uno de los
resultados fundamentales en toda la informática, sobre los cuales muchas otras pruebas
colgar. * En pocas palabras, en cualquier momento un sistema, ya sea una máquina o una mente
simula el funcionamiento de algo tan complejo como él mismo, encuentra su
recursos totalmente agotados, más o menos por definición. Científicos de la computación
tener un término para este viaje potencialmente interminable hacia la sala de los espejos,
mentes que simulan mentes que simulan mentes: "recursividad".
"En el póquer, nunca juegas tu mano", dice James Bond en Casino
Royale ; "Juegas al hombre frente a ti". De hecho, lo que realmente juegas es
una recursividad teóricamente infinita. Ahí está tu propia mano y la mano que tú
cree que su oponente tiene; luego la mano que le crees a tu oponente
cree que tienes, y la mano que crees que tu oponente cree que
creo que lo ha hecho ... y así sigue. "No sé si este es un juego real-
término teórico ", dice el jugador de póquer mejor calificado del mundo, Dan Smith," pero
los jugadores de póquer lo llaman "nivelación". El nivel uno es 'Lo sé'. Dos es 'tu sabes
Página 298
eso lo sé.' Tres, 'sé que tú sabes que yo sé'. Existen

situaciones en las que simplemente surge como, 'Wow, esto es realmente un
lugar tonto para fanfarronear, pero si sabe que es un lugar tonto para fanfarronear, entonces no lo hará.
llámame y ahí es donde es el lugar inteligente para fanfarronear. Esas cosas pasan ".
Uno de los faroles más memorables en el póquer de alto nivel ocurrió cuando
Tom Dwan apostó $ 479,500 en el peor absoluto posible de Texas Hold 'Em
mano, el 2-7, mientras literalmente le dice a su oponente, Sammy George, que él
lo estaba sosteniendo. "No tienes dos siete", respondió George. "Tu no
tener deuce-siete ". George se dobló y Dwan (con, sí, deuce-siete)
tomó la olla.
En el póquer, la recursividad es un juego peligroso. No quieres que te atrapen
un paso detrás de tu oponente, por supuesto, pero también hay un imperativo
para no adelantarse demasiado a ellos tampoco. "Hay una regla de que realmente solo
quiere jugar un nivel por encima de su oponente ", explica el profesional del póquer
Vanessa Rousso. "Si juegas muy por encima de tu oponente, vas a
piensan que tienen información que en realidad no tienen, [y] no
ser capaz de recopilar la información que desea que recopilen de su
comportamiento." A veces, los profesionales del póquer engañarán deliberadamente a su oponente para
recursividad enrevesada, mientras tanto, jugando completamente según el libro,
póquer no psicológico. Esto se conoce como atraerlos a "un
nivelando la guerra contra ellos mismos ".
(Atraer a un oponente a una recursividad infructuosa puede ser una estrategia eficaz
también en otros juegos. Uno de los más coloridos, extraños y fascinantes.
episodios en la historia del ajedrez hombre-máquina se produjeron en un bombardeo de 2008
enfrentamiento entre el gran maestro estadounidense Hikaru Nakamura y el líder
programa informático de ajedrez Rybka. En un juego donde cada lado tiene solo tres
minutos en el reloj para jugar todos sus movimientos o perder automáticamente, el
La ventaja seguramente parecía estar en el lado de la computadora, capaz de
evaluar millones de posiciones cada segundo, y hacer su movimiento
sin contraer un músculo. Pero Nakamura inmediatamente atascó el
tablero, y procedió a hacer movimientos repetitivos y sin sentido tan rápido como
podría hacer
buscando clic. Mientras
variaciones tanto, que
ganadoras la computadora
no existían ydesperdició momentos preciosos
tratando obstinadamente de infructuosamente
Página 299
anticipar todos los posibles movimientos futuros de Nakamura, quien era él mismo
simplemente haciendo el equivalente de ajedrez a juguetear con los pulgares. Cuando el
La computadora casi había agotado su tiempo y comenzó a agitarse para no perder
por el reloj, Nakamura finalmente abrió la posición y se estrelló.)
Dados los peligros de la recursividad, ¿cómo salen los profesionales del póquer?
Usan la teoría de juegos. "A veces puedes pensar en razones para hacer
jugadas [de nivelación] de explotación, pero la mayoría de las veces solo estás haciendo inferiores
juega por razones que en realidad son solo ruido ”, explica Dan Smith. "Lo intento
Es realmente difícil tener un nivel básico de comprensión de la teoría en la mayoría de las situaciones.
... Siempre empiezo por saber o tratar de saber qué es Nash ".
Entonces, ¿qué es Nash?
Alcanzando el equilibrio
Tú conoces las reglas y yo también ...

Conocemos el juego y lo vamos a jugar.
-RICK ASTLEY
La teoría de juegos cubre un espectro increíblemente amplio de escenarios de

cooperación y competencia, pero el campo comenzó con los que se parecían
Póquer mano a mano: concursos de dos personas en los que la ganancia de un jugador es otra
pérdida del jugador. Los matemáticos que analizan estos juegos buscan identificar un
llamado equilibrio : es decir, un conjunto de estrategias que ambos jugadores pueden seguir
tal que ninguno de los jugadores querría cambiar su propio juego, dado el
juego de su oponente. Se llama equilibrio porque es estable, no
La cantidad de reflexión adicional de cualquiera de los jugadores los llevará a diferentes
opciones. Estoy contento con mi estrategia, dada la tuya, y tú estás contento con
tu estrategia, dada la mía.
En piedra-papel-tijera, por ejemplo, el equilibrio nos dice, tal vez
poco emocionante, elegir uno de los gestos con las manos del mismo nombre completamente en
aleatorio, cada uno aproximadamente un tercio del tiempo. ¿Qué hace que este equilibrio
estable es que, una vez que ambos jugadores adoptan esta estrategia 1 ⁄ 3 - 1 ⁄ 3 - 1 ⁄ 3 , hay
Página 300
nada mejor que
más piedra, hacer
nuestro que seguir
oponente adelante.
se daría (Si rápidamente
cuenta intentamos jugar, di,
y comenzaría a jugar más papel,
lo que nos haría jugar más tijeras, y así sucesivamente hasta que ambos nos acomodáramos
en el equilibrio 1 ⁄ 3 - 1 ⁄ 3 - 1 ⁄ 3 nuevamente.)
En uno de los resultados fundamentales de la teoría de juegos, el matemático John
Nash demostró en 1951 que cada juego de dos jugadores tiene al menos una
equilibrio. Este importante descubrimiento le valdría a Nash el Premio Nobel en
Economía en 1994 (y condujo al libro y la película A Beautiful Mind , sobre
La vida de Nash). En la actualidad, este equilibrio se conoce con el nombre de "Nash
equilibrio ”, el“ Nash ”que Dan Smith siempre trata de seguir.
A primera vista, el hecho de que un equilibrio de Nash siempre exista en dos
los juegos de jugadores parecen traernos algo de alivio del salón de los espejos
recursiones que caracterizan al póquer y muchos otros concursos familiares. Cuando
nos sentimos caer por la madriguera recursiva del conejo, siempre tenemos una
opción de salir de la cabeza de nuestro oponente y buscar el equilibrio,
ir directamente a la mejor estrategia, asumiendo un juego racional. En piedra-papel-
tijeras, escudriñando la cara de tu oponente en busca de signos de lo que podrían
lanzar a continuación puede no valer la pena, si sabe que simplemente lanzar a
random es una estrategia imbatible a largo plazo.
De manera más general, el equilibrio de Nash ofrece una predicción de la estabilidad
resultado a largo plazo de cualquier conjunto de reglas o incentivos. Como tal, proporciona una
herramienta invaluable para predecir y dar forma a la política económica, así como para
política social en general. Como dice el economista premio Nobel Roger Myerson
En él, el equilibrio de Nash “ha tenido un impacto fundamental y generalizado en
economía y las ciencias sociales que es comparable a la de la
descubrimiento de la doble hélice del ADN en las ciencias biológicas ".
La informática, sin embargo, ha complicado esta historia. En términos generales, el
el objeto de estudio en matemáticas es la verdad ; el objeto de estudio en computadora
la ciencia es complejidad . Como hemos visto, no basta con que un problema tenga
una solución si ese problema es intratable.
En un contexto de teoría de juegos, saber que existe un equilibrio no
en realidad, díganos qué es o cómo llegar allí. Como computadora de UC Berkeley
El científico Christos Papadimitriou escribe, la teoría de juegos "predice a los agentes"
Página 301
comportamiento de equilibrio típicamente sin tener en cuenta las formas en que tal
se alcanzará el estado, una consideración que sería la de un científico de la computación
principal preocupación ". Tim Roughgarden de Stanford se hace eco del sentimiento de
estar insatisfecho con la prueba de Nash de que los equilibrios siempre existen. "Está bien",
dice, “pero somos científicos de la computación, ¿verdad? Danos algo que podamos usar.
No me digas simplemente que está ahí; dime cómo encontrarlo ". Y entonces, el original
campo de la teoría de juegos engendró la teoría algorítmica de juegos, es decir, el estudio de
las estrategias teóricamente ideales para los juegos se convirtieron en el estudio de cómo las máquinas
(y la gente) idean estrategias para los juegos.
Resulta que hacer demasiadas preguntas sobre los equilibrios de Nash
se mete de prisa en problemas de cálculo. A finales del vigésimo
siglo, determinando si un juego tiene más de un equilibrio, o un
equilibrio que le da a un jugador una cierta recompensa, o un equilibrio que
implica tomar una acción en particular, se ha demostrado que todos son intratables
problemas. Luego, de 2005 a 2008, Papadimitriou y sus colegas
demostró que simplemente encontrar los equilibrios de Nash también es intratable.
Los juegos simples como piedra-papel-tijera pueden tener equilibrios visibles en un
mirada, pero en juegos de complejidad del mundo real ahora está claro que no podemos tomar
por supuesto que los participantes podrán descubrir o alcanzar el juego
equilibrio. Esto, a su vez, significa que los diseñadores del juego no necesariamente
utilice el equilibrio para predecir cómo se comportarán los jugadores. los
Las ramificaciones de este aleccionador resultado son profundas: los equilibrios de Nash se han manteni
un lugar sagrado dentro de la teoría económica como una forma de modelar y predecir
comportamiento del mercado, pero ese lugar podría no ser merecido. Como Papadimitriou
explica: "Si un concepto de equilibrio no se puede calcular de manera eficiente, gran parte de
se pierde su credibilidad como predicción del comportamiento de agentes racionales ”.
Scott Aaronson del MIT está de acuerdo. "En mi opinión", dice, "si el teorema de que
La existencia de equilibrios de Nash se considera relevante para los debates sobre (digamos) libre
mercados versus la intervención del gobierno, entonces el teorema de que encontrar
esos equilibrios son [intratables] también deben considerarse relevantes ". los
Las capacidades predictivas de los equilibrios de Nash solo importan si esos equilibrios pueden
ser encontrado por los jugadores. Para citar al ex director de eBay
investigación, Kamal Jain, "Si su computadora portátil no puede encontrarlo, tampoco el mercado".
Página 302
Estrategias dominantes, para bien o para mal
Incluso cuando podemos alcanzar un equilibrio, el hecho de que sea estable no

hazlo bien . Puede parecer paradójico, pero la estrategia de equilibrio ...
donde ningún jugador está dispuesto a cambiar de táctica, de ninguna manera es necesariamente
la estrategia que conduce a los mejores resultados para los jugadores. En ninguna parte es eso
mejor ilustrado que en la teoría de juegos más famosa, provocativa y
controvertido juego de dos jugadores: "el dilema del prisionero".
El dilema del prisionero funciona de la siguiente manera. Imagina que tú y un compañero
El conspirador ha sido arrestado después de robar un banco y está detenido en
celdas de la cárcel separadas. Ahora debe decidir si "cooperar" con cada
otros, permaneciendo en silencio y sin admitir nada, o "desertar" de
su asociación delatando al otro a la policía. Tu sabes que si tu
ambos cooperan entre sí y guardan silencio, el estado no tiene
suficiente evidencia para condenar a cualquiera de los dos, para que ambos salgan libres,
dividir el botín: medio millón de dólares cada uno, digamos. Si uno de ustedes falla
e informa por el otro, y el otro no dice nada, el delator queda libre
y obtiene todo el millón de dólares, mientras que el silencioso es condenado como el
único autor del crimen y recibe una sentencia de diez años. Si ambos
informarse el uno al otro, luego compartirán la culpa y dividirán la oración:
cinco años cada uno.
Aquí está el problema. No importa lo que haga tu cómplice, siempre es
mejor para ti desertar.
Si su cómplice lo ha delatado, delatarlo a su vez le dará
usted cinco años de su vida atrás: obtendrá la sentencia compartida (cinco años)
en lugar de servirlo todo usted mismo (diez años). Y si tu
cómplice se ha quedado callado, entregarlos te dará el millón completo
dólares, no tendrá que dividirlos. No importa qué, siempre estás mejor
desertar que cooperar, independientemente de lo que decida su cómplice. Para
hacer lo contrario siempre te hará peor, pase lo que pase.
De hecho, esto hace que la deserción no sea simplemente la estrategia de equilibrio, sino
lo que se conoce como estrategia dominante . Una estrategia dominante evita la recursividad
en conjunto, siendo la mejor respuesta a todos los posibles
Página 303
estrategias, por lo que ni siquiera tiene que preocuparse por entrar en sus
cabeza en absoluto. Una estrategia dominante es algo poderoso.
Pero ahora hemos llegado a la paradoja. Si todos hacen lo racional
cosa y sigue la estrategia dominante, la historia termina con los dos
sirviendo cinco años de tiempos difíciles, que, en comparación con la libertad y un buen
medio millón cada uno, es dramáticamente peor para todos los involucrados. Cómo podría
que ha pasado?
Esto ha surgido como una de las principales ideas del juego tradicional.
teoría: el equilibrio para un conjunto de jugadores, todos actuando racionalmente en su propio
interés, puede que no sea el mejor resultado para esos jugadores.
Teoría algorítmica de juegos, de acuerdo con los principios de la informática.
ciencia, ha tomado esta idea y la ha cuantificado, creando una medida llamada
"El precio de la anarquía". El precio de la anarquía mide la brecha entre
cooperación (una solución diseñada o coordinada centralmente) y competencia
(donde cada participante intenta de forma independiente maximizar el resultado
para ellos mismos). En un juego como el dilema del prisionero, este precio es
efectivamente infinito: aumentar la cantidad de efectivo en juego y alargar
las sentencias de cárcel pueden hacer que la brecha entre los posibles resultados de manera arbitraria
de ancho, incluso cuando la estrategia dominante sigue siendo la misma. No hay limite de como
Las cosas pueden resultar dolorosas para los jugadores si no se coordinan. Pero en otro
juegos, como descubrirían los teóricos de los juegos algorítmicos, el precio de la anarquía es
no tan mal.
Por ejemplo, considere el tráfico. Ya sea que se trate de viajeros individuales que intentan
para abrirse camino a través del diario de parachoques a parachoques, o los enrutadores barajando
Paquetes TCP a través de Internet, todos en el sistema simplemente quieren
lo que es más fácil para ellos personalmente. Los conductores solo quieren tomar lo más rápido
ruta, sea lo que sea, y los enrutadores solo quieren barajar sus paquetes
con un mínimo esfuerzo, pero en ambos casos esto puede resultar en hacinamiento
a lo largo de vías críticas, creando una congestión que perjudica a todos. Cómo
mucho daño, sin embargo? Sorprendentemente, Tim Roughgarden y Éva de Cornell
Tardos demostró en 2002 que el enfoque de "enrutamiento egoísta" tiene un precio de
anarquía que es solo 4/3. Es decir, una lucha libre es solo un 33% peor que
perfecta coordinación de arriba hacia abajo.
Página 304
El trabajo de Roughgarden y Tardos tiene profundas implicaciones tanto para las áreas urbanas
planificación del tráfico físico y de la infraestructura de red. Enrutamiento egoísta
El bajo precio de la anarquía puede explicar, por ejemplo, por qué Internet funciona como
así como lo hace sin ninguna autoridad central que gestione el enrutamiento de
paquetes individuales. Incluso si tal coordinación fuera posible, no agregaría
mucho.
Cuando se trata de tráfico de seres humanos, el bajo precio de la anarquía
corta en ambos sentidos. La buena noticia es que la falta de coordinación centralizada
está empeorando su viaje como máximo solo un 33%. Por otro lado, si
espera que los coches autónomos conectados en red nos traigan un
futuro de la utopía del tráfico, puede ser descorazonador saber que el egoísta de hoy,
Los controladores descoordinados ya están bastante cerca de ser óptimos. Es cierto que
conducir automóviles debe reducir el número de accidentes de tráfico y puede ser capaz de
Conducir más cerca, ambos acelerarían el tráfico. Pero de donde
Desde el punto de vista de la congestión, el hecho de que la anarquía es sólo 4/3 de la congestión
perfecta coordinación significa que los desplazamientos perfectamente coordinados solo
estar 3/4 tan congestionados como lo están ahora. Es un poco como la famosa frase de James
Branch Cabell: “El optimista proclama que vivimos en el mejor de todos
mundos posibles; y el pesimista teme que esto sea cierto ". La congestión
ser siempre un problema solucionable más por los planificadores y por la demanda general que
por las decisiones de conductores individuales, humanos o informáticos, egoístas o
cooperativa.
Cuantificar el precio de la anarquía le ha dado al campo un aspecto concreto y
forma rigurosa de evaluar los pros y los contras de los sistemas descentralizados, que
tiene amplias implicaciones en cualquier número de dominios donde las personas encuentran
ellos mismos involucrados en el juego (lo sepan o no). Un bajo
precio de la anarquía significa que el sistema es, para bien o para mal, tan bueno en
propia como sería si se gestionara con cuidado. Un alto precio de la anarquía
por otro lado, significa que las cosas tienen el potencial de salir bien si
están cuidadosamente coordinados, pero que sin algún tipo de intervención,
estamos cortejando el desastre. El dilema del prisionero es claramente de este último
escribe. Desafortunadamente, también lo son muchos de los juegos más críticos que el mundo debe
juego.
Página 305
La tragedia de los comunes
En 1968, el ecologista Garrett Hardin tomó el prisionero de dos jugadores

dilema e imaginé ampliarlo para involucrar a todos los miembros de una agricultura
pueblo. Hardin invitó a sus lectores a imaginar un "bien común" de césped público:
disponible para ser pastoreada por el ganado de todos, pero con capacidad finita. En
teoría, todos los aldeanos deberían pastar sólo tantos animales como dejarían
algo de pasto para todos. En la práctica, sin embargo, los beneficios de pastorear un poco
poco más que eso se acumula directamente para usted, mientras que los daños parecen demasiado peque
ser de consecuencia. Sin embargo, si todos siguen esta lógica de usar solo un poco
más común de lo que deberían, se produce un terrible equilibrio: un
césped completamente devastado, y no hay césped para el ganado de nadie a partir de entonces.
Hardin llamó a esto la "tragedia de los comunes", y se ha convertido en una
de los lentes primarios a través de los cuales los economistas, los politólogos y los
El movimiento ambiental ve crisis ecológicas a gran escala como la contaminación.
y cambio climático. "Cuando era niño, existía una cosa llamada plomo
gasolina ", dice Avrim Blum, científico informático de Carnegie Mellon y
teórico. "El plomo era diez centavos más barato o algo así, pero contamina el
medio ambiente ... Dado lo que hacen los demás, cuánto peor es
¿Es usted personalmente [en términos de salud] si pone gasolina con plomo en su propio automóvil?
No mucho peor. Es el dilema del prisionero ". Lo mismo es cierto en el
nivel corporativo y nacional. Un titular reciente de un periódico puso el problema
sucintamente: "Un clima estable exige que la mayoría de los combustibles fósiles permanezcan en el suel
pero ¿de quién? Cada corporación (y, hasta cierto punto, cada nación) es mejor
ser un poco más imprudente que sus compañeros por el bien de la competencia
ventaja. Sin embargo, si todos actúan de manera más imprudente, conducirá a una Tierra devastada,
y todo por nada: no hay ninguna ventaja económica para nadie en relación con
donde empezaron.
La lógica de este tipo de juego es tan generalizada que ni siquiera tenemos que
mire las fechorías para verlo enloquecer. Con la misma facilidad podemos terminar en un
terrible equilibrio con la conciencia limpia. ¿Cómo? No busques mas que
la política de vacaciones de su empresa. En Estados Unidos, la gente trabaja algunos de los
las horas más largas del mundo; como dijo The Economist , “en ninguna parte es el valor de
Página 306
trabajar más y el valor del ocio más bajo ". Hay pocas leyes que obliguen
que los empleadores brinden tiempo libre, e incluso cuando los empleados estadounidenses lo hacen
consiguen tiempo de vacaciones, no lo usan. Un estudio reciente mostró que el promedio
el trabajador toma sólo la mitad de los días de vacaciones que se les conceden, y una impresionante
El 15% no toma vacaciones en absoluto.
En este momento, el Área de la Bahía (donde vivimos los dos) está
tratando de remediar este lamentable estado de cosas pasando por una
cambio de paradigma en lo que respecta a la política de vacaciones, un cambio que está muy bien
significado y completamente, apocalípticamente condenado. Suena la premisa
suficientemente inocente: en lugar de medir un número arbitrario fijo de
días para cada empleado, luego desperdiciando horas-hombre de recursos humanos asegurándose de qu
supera su límite, ¿por qué no dejar libres a sus empleados? ¿Por qué no simplemente
permitirles vacaciones ilimitadas? Los informes anecdóticos hasta ahora son mixtos, pero
desde una perspectiva de teoría de juegos, este enfoque es una pesadilla. Todos
los empleados quieren, en teoría, tomarse la mayor cantidad de vacaciones posible. Pero ellos
También todos quieren tomarse un poco menos de vacaciones que los demás, para ser
percibido como más leal, más comprometido y más dedicado (por lo tanto, más
digno de promoción). Todos miran a los demás en busca de una línea de base, y
tomar solo un poco menos que eso. El equilibrio de Nash de este juego es cero .
Como escribe el director ejecutivo de la empresa de software Travis CI, Mathias Meyer,
“La gente dudará en tomarse unas vacaciones porque no quiere parecer así
persona que se toma la mayor cantidad de días de vacaciones. Es una carrera hacia el fondo ".
Ésta es la tragedia de los comunes en plena vigencia. Y es tan malo
entre empresas como dentro de ellas. Imagínese dos comerciantes en un pueblo pequeño.
Cada uno de ellos puede elegir entre permanecer abiertos los siete días de la semana o
abre solo seis días a la semana, se toma el domingo libre para relajarse con sus amigos y
familia. Si ambos se toman un día libre, conservarán su mercado actual
comparte y experimenta menos estrés. Sin embargo, si un comerciante decide
abre su tienda los siete días de la semana, atraerá clientes adicionales, llevándolos
lejos de su competidor y amenazando su sustento. El Nash
el equilibrio, nuevamente, es que todos trabajen todo el tiempo.
Este problema exacto se convirtió en un punto de inflamación en los Estados Unidos durante el
Temporada de vacaciones de 2014, como minorista tras minorista, no está dispuesto a ceder participación
Página 307
a los competidores que se estaban adelantando al habitual post-Día de Acción de Gracias

la fiebre de las compras, cedió hacia el pésimo equilibrio. "Las tiendas están abriendo
antes que nunca ”, informó el International Business Times . Macy's
decidió abrir dos horas antes que el año anterior, al igual que Target. Kmart,
por su parte, abrió a las 6:00 am en la mañana de Acción de Gracias, y fue
abierto continuamente durante cuarenta y dos horas.
Entonces, ¿qué podemos hacer nosotros, como jugadores, cuando nos encontramos en tal
situación, ya sea el dilema del prisionero bipartidista, o el
¿tragedia de los comunes? En cierto sentido, nada. La misma estabilidad que estos
los malos equilibrios tienen, lo que los convierte en equilibrios, se convierte en
detestable. En general, no podemos cambiar las estrategias dominantes de
dentro de. Pero esto no significa que no se puedan arreglar los malos equilibrios. Es solo
significa que la solución tendrá que venir de otra parte.
Diseño de mecanismos: cambia el juego
No odies al jugador, odia el juego.

-HIELO T
No vuelvas a tomar partido por nadie en contra de la familia, nunca más.
- EL PADRINO
El dilema del prisionero ha sido el punto focal durante generaciones de debate

y controversia sobre la naturaleza de la cooperación humana, pero la Universidad
El teórico de juegos del College London Ken Binmore ve al menos algo de eso
controversia como equivocada. Como él argumenta, es "simplemente incorrecto que el
Prisoner's Dilemma captura lo que importa sobre la cooperación humana. Sobre
por el contrario, representa una situación en la que los dados están tan cargados contra
el surgimiento de la cooperación como sea posible ".*
Bueno, si las reglas del juego fuerzan una mala estrategia, tal vez no deberíamos
Intenta cambiar de estrategia. Quizás deberíamos intentar cambiar el juego.
Página 308
Esto nos lleva a una rama de la teoría de juegos conocida como "mecanismo
diseño." Mientras que la teoría de juegos pregunta qué comportamiento surgirá dado un conjunto de
reglas, el diseño de mecanismos (a veces llamado "teoría del juego inverso") funciona
en la otra dirección, preguntando: ¿Qué reglas nos darán el comportamiento que queremos?
¿para ver? Y si las revelaciones de la teoría de juegos, como el hecho de que un equilibrio
La estrategia puede ser racional para cada jugador pero mala para todos.
contradictorio, las revelaciones del diseño de mecanismos son aún más
asi que.
Regresemos a usted y a su cómplice de robo de bancos a la celda de la cárcel por
otro aborda el dilema del prisionero, con una adición crucial: la
Padrino. Ahora tú y tu compañero ladrón son miembros de un crimen
sindicato, y el don ha dejado, digamos, demasiado claro que cualquier
los informantes dormirán con los peces. Esta alteración de los beneficios del juego
tiene el efecto de limitar las acciones que puede realizar, pero irónicamente llega lejos
Es más probable que las cosas terminen bien, tanto para ti como para tu pareja. Ya que
la deserción es ahora menos atractiva (por decirlo suavemente), ambos prisioneros son inducidos
a cooperar, y ambos se alejarán con confianza de medio millón de dólares
más rico. Menos, por supuesto, un diezmo nominal para el don.
Lo contradictorio y poderoso aquí es que podemos empeorar cada
resultado, muerte por un lado, impuestos por el otro, pero hacer que todos
vive mejor cambiando el equilibrio.
Para los comerciantes de pueblos pequeños, una tregua verbal para tomar los domingos libres
sería inestable: tan pronto como cualquiera de los comerciantes necesitara algo de dinero extra
podría violarlo, lo que provocaría que el otro comenzara a trabajar los domingos como
así para no perder cuota de mercado. Esto los llevaría de vuelta a la
mal equilibrio donde obtienen lo peor de ambos mundos: son
agotado y no obtenga ninguna ventaja competitiva por ello. Pero pueden ser
capaz de actuar como su propio don mediante la firma de un contrato legalmente vinculante con el
efecto que, digamos, cualquier producto obtenido por cualquiera de las tiendas un domingo vaya a la
otra tienda. Al empeorar el equilibrio insatisfactorio, harían un
nuevo y mejor.
Por otro lado, un cambio en las recompensas del juego que no cambia.
el equilibrio normalmente tendrá un efecto mucho menor que el deseado. los
Página 309
El director ejecutivo de la empresa de software Evernote, Phil Libin, llegó a los titulares con un
política de ofrecer a los empleados de Evernote mil dólares en efectivo por tomar un
vacaciones. Esto suena como un enfoque razonable para conseguir más empleados.
tomar vacaciones, pero desde la perspectiva de la teoría de los juegos es en realidad
equivocado. Aumentar el dinero en efectivo sobre la mesa en el dilema del prisionero, por
ejemplo, pierde el punto: el cambio no hace nada para alterar el mal
equilibrio. Si un atraco de un millón de dólares termina con ambos ladrones en la cárcel, entonces
hace un atraco de diez millones de dólares. El problema no es que las vacaciones no
atractivo; el problema es que todos quieren tomarse un poco menos de vacaciones
que sus pares, produciendo un juego cuyo único equilibrio son las vacaciones en
todos. Mil dólares endulzan el trato, pero no cambian el principio de
el juego, que consiste en tomarse tantas vacaciones como sea posible sin dejar de
percibido como un poco más leal que el próximo chico o chica, por lo tanto, obteniendo un
aumento o promoción sobre ellos que vale muchos miles de dólares.
¿Significa esto que Libin necesita ofrecer decenas de miles de dólares por
empleado por vacaciones? No. El diseño del mecanismo nos dice que Libin puede obtener
los empleados felices que quiere con el palo, en lugar de la zanahoria; él puede
obtener un mejor equilibrio sin gastar un centavo. Por ejemplo, podría
simplemente haga obligatoria una cierta cantidad mínima de vacaciones . Si no puede
cambiar la carrera, todavía puede cambiar el fondo. El diseño del mecanismo hace
poderoso argumento a favor de la necesidad de un diseñador, ya sea un director ejecutivo, un contrato
vinculando a todas las partes, o un don que hace cumplir la omertà por la carótida garrotada.
Un comisionado de liga es también este tipo de diseñador. Imagina como
un espectáculo patético que sería la NBA si no hubiera juegos como tales, y
Los equipos podrían simplemente anotar entre sí literalmente en cualquier momento entre
inicio y final de la temporada: 3:00 am el domingo, mediodía en Navidad,
nombralo. Lo que verías serían jugadores demacrados y cadavéricos, en extremo
deuda de sueño, lo que obliga a la vigilancia con estimulantes químicos, casi perdiendo su
mentes. La guerra es así. Por otro lado, incluso Wall Street, despiadado
capitalistas feroces que comercian por microsegundos en la "ciudad que nunca
duerme ", llega a un alto el fuego todos los días a las 4:00 p. m. en punto, para que los corredores
puede dormir a horas predecibles todas las noches sin ponerse demasiado mal
Página 310
emboscado por competidores que empujan hacia un equilibrio de insomnio. En esto

En ese sentido, el mercado de valores es más un deporte que una guerra.
Ampliar esta lógica da como resultado un potente argumento para el papel de
Gobierno. De hecho, muchos gobiernos tienen leyes en los libros.
exigiendo vacaciones mínimas y limitando el horario comercial. Y mientras el
Estados Unidos es una de las únicas naciones desarrolladas sin
requisitos para vacaciones pagadas, Massachusetts, Maine y Rhode Island no
tienen prohibiciones a nivel estatal sobre el comercio de Acción de Gracias.
Leyes como estas a menudo provienen de la era colonial y fueron inicialmente
de naturaleza religiosa. De hecho, la religión en sí misma proporciona una forma muy directa de
modificando la estructura de juegos de este tipo. En particular, una ley religiosa
como "Recuerda el día de reposo" resuelve perfectamente el problema al que se enfrentan
los tenderos, ya sea impuesto por un Dios todopoderoso o por los más
miembros próximos de una comunidad religiosa. Y agregando fuerza divina a
mandatos judiciales contra otros tipos de comportamiento antisocial, como el asesinato,
El adulterio y el robo son también una forma de resolver algunos de los problemas de la teoría del juego.
problemas de vivir en un grupo social. Dios resulta ser incluso mejor que
gobierno en este sentido, ya que la omnisciencia y la omnipotencia proporcionan un
garantía particularmente fuerte de que tomar malas acciones tendrá graves
Consecuencias. Resulta que no hay un padrino como Dios Padre.
La religión parece el tipo de cosas que un científico de la computación rara vez habla
sobre; de hecho, es literalmente el tema de un libro llamado Things a Computer
El científico rara vez habla de . Pero al reducir la cantidad de opciones que
la gente tiene, las limitaciones de comportamiento del tipo impuestas por la religión no
simplemente hacen que ciertos tipos de decisiones sean menos desafiantes computacionalmente:
también puede producir mejores resultados.
Diseño de mecanismos por Evolution
Por más egoísta que pueda suponerse el hombre, evidentemente hay algunos
principios de su naturaleza, que le interesan en la fortuna de los demás, y
Página 311
hacen necesaria su felicidad, aunque no deriva nada

de ella, excepto el placer de verla.
—ADAM SMITH, LA TEORÍA DE LOS SENTIMIENTOS MORALES
El corazón tiene sus razones de las que la razón no sabe nada.

—BLAISE PASCAL
Las secuoyas de California son algunas de las más antiguas y majestuosas
cosas del planeta. Sin embargo, desde el punto de vista de la teoría de juegos, son
algo así como una tragedia. La única razón por la que son tan altos es que lo están intentando
ser más altos que los demás, hasta el punto en que los daños de
la sobreextensión son finalmente incluso peores que los daños de quedar sombreado.
Como dice Richard Dawkins,
El dosel se puede considerar como un prado aéreo, como una pradera ondulada, pero
levantado sobre pilotes. El dosel está acumulando energía solar al mismo ritmo que un pastizal.
la pradera lo haría. Pero una parte sustancial de la energía se "desperdicia" al ser alimentada directamente al
zancos, que no hacen nada más útil que el "prado" alto en el aire, donde se levanta
exactamente la misma cosecha de fotones que obtendría, a un costo mucho menor, si se
suelo.
Si el bosque pudiera aceptar de alguna manera una especie de tregua, el ecosistema

podría disfrutar de la generosidad fotosintética sin la carrera armamentista de la fabricación de madera
desperdiciarlo todo. Pero, como hemos visto, los buenos resultados en estos escenarios tienden
sólo para surgir en el contexto de una autoridad fuera del juego: alguien
cambiando las recompensas de arriba hacia abajo. Parecería como si en la naturaleza,
entonces, simplemente no hay forma de establecer buenos equilibrios entre
individuos.
Por otro lado, si la cooperación realmente conduce a mejores resultados en
ciertos juegos, entonces esperaríamos que las especies de mentalidad cooperativa
prevalecerán evolutivamente. Pero entonces, ¿de dónde vendría la cooperación si
¿Es solo racional a nivel de grupo, no a nivel individual? Talves esto
tendría que provenir de algo que los individuos no pueden controlar por completo.
Algo, por ejemplo, como emociones .
Página 312
Considere dos escenarios aparentemente no relacionados: (1) Un hombre compra una aspiradora
más limpio, se rompe en unas pocas semanas y pasa diez minutos en línea
dejando una reseña vengativa. (2) Una mujer comprando en una tienda de conveniencia.
se da cuenta de que alguien roba la billetera de un anciano y corre hacia la puerta; ella
aborda al ladrón y le quita la billetera.
Aunque el último protagonista parece claramente heroico, y el primero
simplemente enojado, lo que estas viñetas tienen en común, aunque en muy
diferentes formas — es el altruismo involuntario. El consumidor infeliz no es
tratando de que le reemplacen la aspiradora o le devuelvan el dinero; él está detrás de un
tipo de retribución altamente indirecta, de la cual, en un juego racional,
sentido teórico: se espera que obtenga poco más que la satisfacción rencorosa
de escribir la reseña en sí. En la tienda de conveniencia, la heroica mujer
imparte justicia vigilante a un costo personal enorme; ella se arriesga a lesionarse o
incluso la muerte para devolver, digamos, 40 dólares a un hombre que es un completo extraño para ella.
ella quería ayudar, simplemente podría haber sacado dos veinte de su
propio bolsillo y se los dio sin arriesgar un viaje a la sala de emergencias! En esto
sentido, ambos protagonistas están actuando irracionalmente. Por otro lado, su
acciones son buenas para su sociedad: todos queremos vivir en un mundo en el que
los carteristas no pagan y en qué empresas que venden productos de mala calidad
los productos tienen mala reputación.
Quizás cada uno de nosotros, individualmente, estaría mejor siendo el tipo de
persona que siempre puede tomar una decisión imparcial y calculada por su cuenta
mejor interés, no estar dispuesto a perder el tiempo echando humo por un costo hundido, y mucho meno
un diente de más de $ 40. Pero todos estamos mejor viviendo en una sociedad en la que
tales posiciones desafiantes son comunes.
Entonces, ¿qué ha actuado en estas personas, en ausencia de un
autoridad, para hacerlos oponerse al equilibrio egoísta? Ira, por un lado.
Ya sea provocado por un negocio de mala calidad o por un pequeño ladrón, la indignación puede
anular la racionalidad. Y en estos casos, puede ser que la mano de
La evolución ha hecho lo que de otro modo habría llevado a una autoridad exterior
el juego para lograr.
La naturaleza está llena de ejemplos de individuos esencialmente secuestrados para
sirven a los objetivos de otra especie. La platija del hígado lanceta ( Dicrocoelium
Página 313
dendriticum ), por ejemplo, es un parásito que hace que las hormigas trepen deliberadamente
las puntas de las briznas de hierba para que las ovejas se las coman; la
anfitrión preferido. Asimismo, el parásito Toxoplasma gondii hace que los ratones
pierden permanentemente el miedo a los gatos, con resultados similares.
Emoción, para el consumidor amargado y vengativo y por la conveniencia.
héroe de la tienda por igual, nuestra propia especie se hace cargo de los controles durante un minuto.
“La moralidad es un instinto gregario en el individuo”, escribió Nietzsche. Parafraseando
ligeramente, podríamos arriesgarnos a que la emoción sea un mecanismo de diseño en la especie.
Precisamente porque los sentimientos son involuntarios, posibilitan contratos que necesitan
sin aplicación externa. La venganza casi nunca funciona a favor del
uno que lo busca, y sin embargo alguien que responde con "irracional"
vehemencia de ser aprovechado es por esa misma razón más probable
para conseguir un trato justo. Como dice el economista de Cornell, Robert Frank, "Si la gente
Esperamos que respondamos irracionalmente al robo de nuestra propiedad, rara vez lo haremos.
necesitan , porque no les conviene robarlo. Estar predispuesto
responder irracionalmente sirve mucho mejor aquí que ser guiado solo por
interés propio material ".
(Para que no piense que los humanos modernos civilizados tienen contratos legales y
Estado de derecho en lugar de retribución, recuerde que a menudo es más trabajo y
sufrir para demandar o enjuiciar a alguien de lo que la víctima podría esperar
recuperar en términos materiales. Los juicios son los medios para auto-destructiva
represalia en una sociedad desarrollada, no el sustituto).
En cuanto a la ira, también lo es la compasión y la culpa, y el amor.
Por extraño que parezca, el dilema del prisionero también tiene mucho que decirnos.
sobre el matrimonio. En nuestra discusión sobre problemas óptimos de frenado, como el
problema de la secretaria, en el capítulo 1, analizamos tanto las citas como las
búsqueda de apartamentos como casos en los que debemos comprometernos con
posibles opciones futuras aún no vistas. Sin embargo, tanto en el amor como en la vivienda,
continuar encontrando más opciones incluso después de nuestra parada óptima
se toma la decisión, entonces, ¿por qué no estar listo para abandonar el barco? Por supuesto, sabiendo
que la otra parte (ya sea el cónyuge o el propietario) está a su vez preparada para saltar
barco evitaría muchas de las inversiones a largo plazo (tener hijos
Página 314
juntos, o moviéndose laboriosamente en las propias pertenencias) que hacen que esos
acuerdos que valen la pena.
En ambos casos, este llamado problema de compromiso puede ser al menos parcialmente
abordado por un contrato. Pero la teoría de juegos sugiere que en el caso de las citas,
Los vínculos voluntarios de la ley son menos relevantes para una asociación duradera.
que los lazos involuntarios del amor mismo. Como dice Robert Frank, "El
preocuparse de que las personas abandonen las relaciones porque más tarde puede convertirse en
racional para ellos hacerlo se borra en gran medida si no es una evaluación racional
que los une en primer lugar ". El explica:
Sí, las personas buscan características objetivas que les interesan. Todo el mundo quiere a alguien
que es amable, inteligente, interesante y saludable y tal vez físicamente atractivo, bueno
poder adquisitivo, toda la lista de funciones, pero ese es el primer paso ... Después de haber gastado
suficiente tiempo juntos, no son esas cosas las que te hacen querer estar juntos. Es solo el hecho
que es esa persona en particular, eso es lo que es valioso para usted, por lo que realmente no necesita el
contrae tanto como necesita un sentimiento que hace que no quiera separarse, aunque
objetivamente, podría haber una mejor opción disponible para usted.
Dicho de otra manera: el amor es como el crimen organizado. Cambia la estructura de

el juego del matrimonio para que el equilibrio se convierta en el resultado que funcione
lo mejor para todos.
El dramaturgo George Bernard Shaw escribió una vez sobre el matrimonio que "si el
El prisionero es feliz, ¿por qué encerrarlo? Si no lo es, ¿por qué fingir que lo es?
La teoría de juegos ofrece una respuesta sutil a este acertijo en particular. La felicidad es
La cerradura.
Un argumento de la teoría de juegos a favor del amor destacaría un punto más:
el matrimonio es el dilema del prisionero en el que puedes elegir a la persona
con quien estás confabulado. Esto puede parecer un pequeño cambio, pero
potencialmente tiene un gran efecto en la estructura del juego que estás jugando. Si
Sabías que, por alguna razón, tu cómplice sería miserable si
no estabas cerca, el tipo de miseria que ni siquiera un millón de dólares
curar, entonces te preocuparías mucho menos de que ellos deserten y te dejen a ti
pudrirse en la cárcel.
Página 315
Entonces, el argumento racional a favor del amor es doble: las emociones del apego
no solo evitar que pienses demasiado de forma recursiva en las intenciones de tu pareja,
pero al cambiar las recompensas, en realidad, se logra un mejor resultado.
Es más, poder enamorarte involuntariamente te convierte, a su vez, en un
socio más atractivo para tener. Tu capacidad de angustia, de dormir
con los peces emocionales, es la misma cualidad que te hace tan confiable
cómplice.
Cascadas de información: la trágica racionalidad de las burbujas
Siempre que te encuentres del lado de la mayoría, es hora de

pausa y reflexiona.
-MARK TWAIN
Parte de la razón por la que es una buena idea prestar atención al comportamiento de
otros es que al hacerlo, puedes agregar su información sobre el mundo
a la tuya. Un restaurante popular probablemente sea bueno; un concierto medio vacío
pasillo es probablemente una mala señal; y si alguien con quien hablas te da un tirón
su mirada hacia algo que usted no puede ver, probablemente no sea una mala idea
voltea tu cabeza también.
Por otro lado, aprender de los demás no siempre parece
particularmente racional. Las modas y las modas son el resultado de seguir las reglas de los demás.
comportamiento sin estar anclado a ninguna verdad objetiva subyacente sobre el
mundo. Lo que es peor, la suposición de que las acciones de otras personas son útiles
guía puede conducir al tipo de seguimiento de rebaños que precipita la economía
desastre. Si todos los demás están invirtiendo en bienes raíces, parece una buena
idea de comprar una casa; después de todo, el precio solo va a subir. ¿No es así?
Un aspecto interesante de la crisis hipotecaria de 2007-2009 es que
todos los involucrados parecían sentir que fueron castigados injustamente por
simplemente haciendo lo que se suponía que debían hacer. Una generación de estadounidenses que
Creció creyendo que las casas eran inversiones a prueba de fallas, y quién vio
todos los que los rodean comprando casas a pesar de (o debido a) el rápido aumento
Página 316
precios, se quemaron gravemente cuando esos precios finalmente comenzaron a caer.

Mientras tanto, los banqueros sintieron que se les culpaba injustamente por hacer lo que
siempre lo había hecho: ofrecer oportunidades que sus clientes pudieran aceptar
o declinar. A raíz de un colapso abrupto del mercado, la tentación es
siempre para culpar. Aquí la teoría de juegos ofrece una perspectiva aleccionadora:
catástrofes como esta pueden ocurrir incluso cuando nadie tiene la culpa.
La apreciación adecuada de la mecánica de las burbujas financieras comienza con
comprensión de las subastas. Si bien las subastas pueden parecer rincones de nicho de la
economía, evocando pinturas al óleo de un millón de dólares en Sotheby's y
Christie's o Beanie Babies y otros artículos de colección en eBay, en realidad
potencia una parte sustancial de la economía. Google, por ejemplo, hace
más del 90% de sus ingresos de la venta de anuncios, y todos esos anuncios se venden a través de
subastas. Mientras tanto, los gobiernos utilizan subastas para vender derechos a bandas del
espectro de telecomunicaciones (como transmisión de teléfonos móviles
frecuencias), recaudando decenas de miles de millones de dólares en ingresos. De hecho, muchos
Los mercados globales, en todo, desde hogares hasta libros y tulipanes, operan a través de
subastas de varios estilos.
Uno de los formatos de subasta más simples hace que cada participante escriba
su oferta en secreto, y el cuya oferta es más alta gana el artículo para
cualquier precio que anotaron. Esto se conoce como "oferta sellada de primer precio
subasta ", y desde la perspectiva de la teoría de juegos algorítmicos hay una gran
problema con él, en realidad, varios. Por un lado, hay un sentido en el que
el ganador siempre paga de más: si valora un artículo en $ 25 y yo lo valoro en
$ 10, y ambos ofertamos nuestras verdaderas valoraciones ($ 25 y $ 10), entonces terminas
comprándolo por $ 25 cuando podrías haberlo tenido por solo un cabello de más de $ 10. Esta
problema, a su vez, lleva a otro, que es que para pujar correctamente
Es decir, para no pagar de más, es necesario predecir la verdadera valoración de
los otros jugadores en la subasta y "sombrear" su oferta en consecuencia. Esa es
lo suficientemente malo, pero los otros jugadores no van a ofrecer sus verdaderas valoraciones
tampoco, porque están sombreando sus ofertas según la predicción de la suya.
Estamos de vuelta en la tierra de la recursividad.
Otro formato de subasta clásico, la "subasta holandesa" o "descendente
subasta ”, reduce gradualmente el precio de un artículo hasta que alguien está dispuesto a comprarlo.
Página 317
El nombre hace referencia a la subasta de flores de Aalsmeer, la flor más grande

subasta en el mundo, que se lleva a cabo a diario en los Países Bajos, pero los holandeses
las subastas son más frecuentes de lo que podría parecer inicialmente. Una marca de tienda
por sus artículos no vendidos, y los propietarios que enumeran los apartamentos al precio más alto
piensan que el mercado soportará, ambos comparten su cualidad básica: el vendedor es
Es probable que comience con optimismo y empuje el precio hacia abajo hasta que un comprador esté
fundar. La subasta descendente se asemeja a la subasta de primer precio en que
es más probable que ganes pagando cerca de la parte superior de tu rango (es decir,
estar preparado para ofertar cuando el precio caiga a $ 25) y, por lo tanto, querrá sombrear
su oferta por una cantidad complejamente estratégica. ¿Compras a $ 25 o te quedas?
su mano y tratar de esperar un precio más bajo? Cada dólar que ahorras riesgos
perdiendo por completo.
La inversa de una subasta holandesa o descendente es lo que se conoce como
"Subasta inglesa" o "subasta ascendente": la subasta más conocida
formato. En una subasta en inglés, los postores se alternan subiendo el precio hasta que todos menos
uno de ellos abandona. Esto parece ofrecer algo más cercano a lo que
quiero: aquí, si valora un artículo en $ 25 y yo lo valoro en $ 10, lo ganará por
poco más de $ 10 sin tener que ir hasta los $ 25 o desaparecer
por la estratégica madriguera del conejo.
Tanto la subasta holandesa como la subasta inglesa introducen un nivel extra de
complejidad en comparación con una subasta de oferta sellada, sin embargo. Involucran
no solo la información privada que tiene cada postor sino también la pública
flujo de comportamiento de licitación. (En una subasta holandesa, es la ausencia de una oferta lo que
revela información, al dejar en claro que ninguno de los otros postores valora
el artículo al nivel de precio actual). Y en las circunstancias adecuadas, este
La mezcla de datos públicos y privados puede resultar tóxica.
Imagine que los postores dudan de sus propias estimaciones de la
valor de un lote de subasta, digamos, el derecho a perforar en busca de petróleo en alguna parte del
Oceano. Como señala el teórico de juegos de University College London Ken Binmore,
"La cantidad de aceite en un tracto es la misma para todos, pero los compradores"
Las estimaciones de cuánto petróleo es probable que haya en un tracto dependerán de su
diferentes estudios geológicos. Estas encuestas no solo son caras, sino
notoriamente poco confiable ". En tal situación, parece natural mirar de cerca
Página 318
a petición de sus oponentes, para aumentar su propia escasa información privada

con la información pública.
Pero esta información pública podría no ser tan informativa como
parece. En realidad, no llega a conocer las creencias de los otros postores, solo sus
acciones . Y es muy posible que su comportamiento se base en el tuyo,
así como su comportamiento está siendo influenciado por el de ellos. Es fácil imaginar un
un grupo de personas que caen juntas por un precipicio porque "todos los demás" estaban
actuando como si todo estuviera bien, cuando en realidad cada persona tenía escrúpulos,
pero los reprimió debido a la aparente confianza de todos los demás en
el grupo.
Al igual que con la tragedia de los comunes, este fracaso no es necesariamente
culpa de los jugadores. Un artículo enormemente influyente de los economistas Sushil
Bikhchandani, David Hirshleifer e Ivo Welch han demostrado que
en las circunstancias adecuadas, un grupo de agentes que se comportan
perfectamente racional y perfectamente apropiadamente puede, no obstante, ser presa de
lo que es efectivamente desinformación infinita. Esto ha llegado a conocerse como
una "cascada de información".
Para continuar con el escenario de los derechos de extracción de petróleo, imagine que hay diez
empresas que podrían ofertar por los derechos de un terreno determinado. Uno de ellos tiene un
estudio geológico que sugiere que el tracto es rico en petróleo; la encuesta de otro es
poco concluyente; el reconocimiento de los otros ocho sugiere que es estéril. Pero
siendo competidores, por supuesto, las empresas no comparten su encuesta
resultados entre sí y, en cambio, solo pueden observar las acciones de los demás.
Cuando comienza la subasta, la primera empresa, con el informe prometedor,
hace una oferta inicial alta. La segunda empresa, animada por esta apuesta por
tienen una visión optimista de su propia encuesta ambigua, ofertas aún más altas.
La tercera empresa tiene una encuesta débil, pero ahora no confía en ella a la luz de
lo que consideran dos encuestas independientes que sugieren que es una mina de oro,
por lo que hacen una nueva oferta alta. La cuarta empresa, que también tiene un
deslucido, ahora se inclina aún más a ignorarlo, ya que
Parece que tres de sus competidores piensan que es un ganador. Entonces ellos también pujaron.
El "consenso" se desprende de la realidad. Se ha formado una cascada.
Página 319
Ningún postor ha actuado de manera irracional, pero el resultado neto es una catástrofe.
Como dice Hirshleifer, "Algo muy importante sucede una vez que alguien
decide seguir ciegamente a sus predecesores independientemente de su propio
señal de información, y es que su acción deja de ser informativa para todos
posteriores tomadores de decisiones. Ahora el grupo público de información ya no es
creciente. Ese beneficio de bienestar de tener información pública ... ha cesado ".
Para ver lo que sucede en el mundo real cuando una cascada de información
se hace cargo, y los postores no tienen casi nada más que el comportamiento de los demás
para estimar el valor de un artículo, no busque más allá de Peter A. Lawrence
texto de biología del desarrollo The Making of a Fly , que en abril de 2011 fue
se vende por $ 23,698,655.93 (más $ 3.99 de envío) en un tercero de Amazon
mercado. ¿Cómo y por qué este libro, ciertamente respetado, llegó
un precio de venta de más de $ 23 millones? Resulta que dos de los vendedores
establecían sus precios algorítmicamente como fracciones constantes entre sí:
uno siempre lo establecía en 0,99830 veces el precio de la competencia, mientras que el
competidor estaba fijando automáticamente su propio precio en 1.27059 veces el
otros. Aparentemente, ninguno de los vendedores pensó en establecer ningún límite en el resultado
números y, finalmente, el proceso se salió de control por completo.
Es posible que un mecanismo similar estuviera en juego durante el enigmático
y controvertida "caída repentina" del mercado de valores del 6 de mayo de 2010, cuando, en un
cuestión de minutos, el precio de varias empresas aparentemente al azar en el
El S&P 500 subió a más de 100.000 dólares por acción, mientras que otros cayeron
precipitadamente, a veces hasta $ 0.01 por acción. Casi $ 1 billón de valor
instantáneamente se convirtió en humo. Como Jim Cramer de CNBC informó en vivo,
estupefacto, “Eso ... no puede estar allí. Ese no es un precio real. Oh bien,
¡Solo ve a comprar Procter! Solo ve a comprar Procter & Gamble, informaron una decente
trimestre, solo ve a comprarlo ... quiero decir, esto es ridi, esta es una buena oportunidad ".
La incredulidad de Cramer es su información privada que se opone al público.
información. Aparentemente es la única persona en el mundo dispuesta a pagar, en
En este caso, $ 49 por una acción que el mercado aparentemente está valorando en menos de $ 40,
pero a él no le importa; ha visto los informes trimestrales, está seguro de lo que
sabe.
Página 320
Se dice que los inversores se dividen en dos grandes campos: inversores "fundamentales",
que negocian con lo que perciben como el valor subyacente de una empresa, y
Inversores "técnicos", que negocian con las fluctuaciones del mercado. El aumento
del trading algorítmico de alta velocidad ha alterado el equilibrio entre estos dos
estrategias, y con frecuencia se queja de que las computadoras, desancladas a la
valor de los bienes en el mundo real, sin preocuparse por el precio de un libro de texto a decenas de
millones de dólares y acciones de primera a un centavo, empeoran la irracionalidad
del mercado. Pero aunque esta crítica se dirige típicamente a las computadoras,
la gente también hace lo mismo, ya que cualquier cantidad de burbujas de inversión
puede testificar. Una vez más, la culpa no suele ser de los jugadores, sino del juego.
sí mismo.
Las cascadas de información ofrecen una teoría racional no solo de las burbujas, sino también
de las modas y el comportamiento del rebaño en general. Ofrecen un relato de cómo es
fácilmente posible que cualquier mercado aumente y colapse, incluso en ausencia de
irracionalidad, malevolencia o malversación. Las conclusiones son varias. Para
Uno, tenga cuidado con los casos en los que la información pública parece exceder la información privad
información, donde sabe más sobre lo que hacen las personas que por qué
lo están haciendo, donde a usted le preocupa más que sus juicios encajen
el consenso que ajustarse a los hechos. Cuando estás mirando principalmente a los demás
para establecer un rumbo, es posible que te estén mirando para hacer lo mismo.
En segundo lugar, recuerde que las acciones no son creencias; las cascadas son causadas en parte
cuando malinterpretamos lo que otros piensan basándonos en lo que hacen . Deberíamos
ser especialmente reacios a anular nuestras propias dudas, y si lo hacemos, podríamos
queremos encontrar alguna forma de transmitir esas dudas incluso a medida que avanzamos,
para que otros no logren distinguir la desgana en nuestras mentes de la implícita
entusiasmo en nuestras acciones. Por último, debemos recordar del prisionero
dilema de que a veces un juego puede tener reglas irremediablemente pésimas. Allí
Puede que no haya nada que podamos hacer una vez que estemos en él, pero la teoría de la información
las cascadas pueden ayudarnos a evitar ese juego en primer lugar.
Y si eres el tipo de persona que siempre hace lo que crees que es
bien, no importa lo loco que otros piensen que es, anímate. La mala noticia es que
que va a estar mal con más frecuencia que los seguidores de la manada. La buena noticia es
que apegarse a sus convicciones crea una externalidad positiva, permitiendo que la gente
Página 321
Haga inferencias precisas de su comportamiento. Puede llegar un momento en que

salvarás a toda la manada del desastre.
Para tu propio autocomputado
La aplicación de la informática a la teoría de juegos ha revelado que ser

la obligación de elaborar estrategias es en sí misma una parte, a menudo una gran parte, del precio que p
en competir entre sí. Y como las dificultades de la recursividad
demostrar, en ninguna parte ese precio es tan alto como cuando estamos obligados a obtener
dentro de la cabeza del otro. Aquí, la teoría algorítmica de juegos nos da una forma de
repensar el diseño del mecanismo: tener en cuenta no solo el resultado de la
juegos, sino también el esfuerzo computacional requerido de los jugadores.
Hemos visto cómo mecanismos de subasta aparentemente inocuos, por ejemplo,
puede encontrarse con todo tipo de problemas: pensar demasiado, pagar de más, huir
cascadas. Pero la situación no es del todo desesperada. De hecho, hay uno
diseño de subasta en particular que elimina la carga de la recursividad mental
como un cuchillo caliente a través de la mantequilla. Se llama la subasta de Vickrey.
Nombrado en honor al economista ganador del Premio Nobel William Vickrey, el
La subasta de Vickrey, al igual que la subasta de primer precio, es una subasta de "oferta sellada"
proceso. Es decir, cada participante simplemente escribe un solo número en
secreto, y el mejor postor gana. Sin embargo, en una subasta de Vickrey, el
El ganador termina pagando no el monto de su propia oferta, sino el de la
postor en segundo lugar. Es decir, si pujas $ 25 y yo pujo $ 10, ganas
el artículo a mi precio: solo tienes que pagar $ 10.
Para un teórico de juegos, una subasta de Vickrey tiene una serie de atractivos
propiedades. Y para un teórico de juegos algorítmicos en particular, una propiedad
Destaca especialmente: los participantes están incentivados a ser honestos. De hecho,
no hay mejor estrategia que simplemente ofertar su "valor real" por el artículo:
exactamente lo que crees que vale el artículo. Pujando más que tu verdadero
El valor es obviamente una tontería, ya que podría terminar comprando algo por
más de lo que crees que vale. Y pujando menos que tu verdadero valor
(es decir, sombrear su oferta) corre el riesgo de perder la subasta sin una buena razón, ya que
no le ahorra dinero, porque si gana, solo pagará el
Página 322
valor de la segunda oferta más alta, independientemente del valor de la suya. Esta
hace que la subasta de Vickrey sea lo que los diseñadores de mecanismos denominan "a prueba de estrat
o simplemente "veraz". En la subasta de Vickrey, la honestidad es literalmente la mejor política.
Aún mejor, la honestidad sigue siendo la mejor política independientemente de si el
otros postores son honestos ellos mismos. En el dilema del prisionero, vimos cómo
la deserción resultó ser la estrategia "dominante", el mejor movimiento no
importa si su pareja desertó o cooperó. En una subasta de Vickrey,
por otro lado, la honestidad es la estrategia dominante. Este es el mecanismo
santo grial del diseñador. No es necesario elaborar estrategias ni recurrir.
Ahora, parece que la subasta de Vickrey le costaría al vendedor
dinero en comparación con la subasta de primer precio, pero esto no es necesariamente cierto. En
una subasta
pagar de másde enprimer precio,
la subasta cada postor
de Vickrey está sombreando
de segundo precio, nosu
esoferta paraen
necesario, evitar
una
sentido, la subasta en sí está sombreando de manera óptima su oferta para ellos . De hecho, un
principio de la teoría del juego llamado "equivalencia de ingresos" establece que sobre
tiempo, el precio de venta promedio esperado en una subasta de primer precio convergerá
exactamente lo mismo que en una subasta de Vickrey. Así, el equilibrio de Vickrey
implica que el mismo postor gane el artículo por el mismo precio, sin ningún tipo de
elaboración de estrategias por parte de cualquiera de los postores. Como dice Tim Roughgarden
sus estudiantes de Stanford, la subasta de Vickrey es "increíble".
Para el teórico de juegos algorítmicos de la Universidad Hebrea Noam Nisan, esto
la genialidad tiene un aire que es casi utópico. "Te gustaría conseguir
algún tipo de reglas de la sociedad donde no vale la pena mentir, y luego
la gente no mentirá tanto, ¿verdad? Ésa es la idea básica. Desde mi punto de
vista, lo asombroso de Vickrey es que no esperarías eso en
en general, es posible hacer eso, ¿verdad? Especialmente en cosas como una subasta,
donde por supuesto quiero pagar menos, ¿cómo se puede jamás Get-Y luego todavía
Vickrey muestra, esta es la manera de hacerlo. Creo que es realmente fantástico ".
De hecho, la lección aquí va mucho más allá de las subastas. En un hallazgo histórico
llamado el "principio de la revelación", el premio Nobel Roger Myerson demostró que
cualquier juego que requiera enmascarar estratégicamente la verdad puede transformarse
en un juego que no requiere nada más que honestidad. Paul Milgrom,
El colega de Myerson en ese momento, reflexiona: “Es uno de esos resultados que, como
Página 323
lo miras desde diferentes lados, por un lado, es absolutamente

impactante y sorprendente, y por otro lado, es trivial. Y eso es totalmente
maravilloso, es tan asombroso: así es como sabes que estás mirando a uno de
las mejores cosas que puedes ver ".
El principio de la revelación puede parecer difícil de aceptar a primera vista, pero su
La prueba es bastante intuitiva. Imagina que tienes un agente o un abogado
quién jugará el juego por ti. Si confía en ellos para representar a su
intereses, simplemente les dirá exactamente lo que quiere y dejará
ellos manejan todo el sombreado de ofertas estratégicas y la estrategia recursiva
en su nombre. En la subasta de Vickrey, el juego en sí realiza este
función. Y el principio de revelación simplemente expande esta idea: cualquier juego que
puede ser jugado para usted por agentes a quienes les dirá la verdad, dice,
conviértase en un juego de honestidad es mejor si el comportamiento que desea de su agente
se incorpora a las reglas del juego en sí. Como dice Nisan, "El básico
Lo que pasa es que si no quiere que sus clientes optimicen en su contra, será mejor que
optimizar para ellos. Esa es toda la prueba ... Si diseño un algoritmo que
ya optimiza para usted, no hay nada que pueda hacer ".
La teoría algorítmica de juegos ha hecho enormes contribuciones a una serie de
aplicaciones prácticas en los últimos veinte años: ayudándonos a comprender
enrutamiento de paquetes en Internet, mejorando las subastas de espectro de la FCC que
asignar bienes públicos preciosos (aunque invisibles) y mejorar la correspondencia
algoritmos que emparejan a estudiantes de medicina con hospitales, entre otros. Y esto
es probable que sea solo el comienzo de una transformación mucho mayor. "Solo somos
rascando la superficie ”, dice Nisan. "Incluso en la teoría , apenas estamos comenzando
para entenderlo. Y hay otra generación probablemente hasta lo que yo
comprender completamente hoy teóricamente se aplicará con éxito a
humanos. Es una generación; No pienso más que eso. Tomará un
Generacion."
El filósofo existencialista francés Jean-Paul Sartre escribió que
"Infierno es otras personas." No quiso decir que otros son intrínsecamente maliciosos
o desagradables, sino que complican nuestros propios pensamientos y creencias:
Página 324
Cuando pensamos en nosotros mismos, cuando tratamos de conocernos a nosotros mismos ... usamos nuestro conocimiento
que otras personas ya tienen. Nos juzgamos a nosotros mismos con los medios que tienen otras personas y
nos has dado para juzgarnos a nosotros mismos. En lo que sea que diga sobre mí, el juicio de otra persona
siempre entra. En lo que sea que siento dentro de mí, entra el juicio de otra persona ... Pero eso
no significa en absoluto que uno no pueda tener relaciones con otras personas. Simplemente saca a relucir el
capital importancia de todas las demás personas para cada uno de nosotros.
Quizás, dado lo que hemos visto en este capítulo, podríamos esforzarnos por
revisar la declaración de Sartre. Interactuar con los demás no tiene por qué ser una
pesadilla, aunque en el juego equivocado seguramente puede serlo. Como Keynes
observado, la popularidad es complicada, intratable, una recursiva sala de espejos;
pero la belleza, a los ojos del espectador, no lo es. Adoptar una estrategia que
no requiere anticipar, predecir, leer o cambiar de rumbo
debido a las tácticas de los demás es una forma de cortar el nudo gordiano de
recursividad. Y, a veces, esa estrategia no solo es fácil, es óptima.
Si cambiar de estrategia no ayuda, puede intentar cambiar el juego. Y
si eso no es posible, al menos puede ejercer algún control sobre qué
juegos que elijas jugar. El camino al infierno está pavimentado con intratable
recursiones, malos equilibrios y cascadas de información. Busque juegos donde
la honestidad es la estrategia dominante. Entonces sé tú mismo.
Página 325
*De hecho, es el origen de todas las computadoras modernas; fue el problema que se detuvo lo que inspiró a Turing a
definir formalmente la computación, a través de lo que ahora llamamos la máquina de Turing.
Página 326
*Binmore agrega otra idea: juegos como el dilema del prisionero aparentemente borran a Immanuel
El argumento de Kant de que la racionalidad consiste en lo que él llamó el "imperativo categórico", actuando como
la forma en que desearía que todos los demás actuaran. El imperativo categórico nos daría un mejor resultado en
el dilema del prisionero que la estrategia de equilibrio, pero no hay forma de evitar el hecho de que esta
el resultado no es estable.
Página 327
Conclusión
Bondad computacional
Creo firmemente que las cosas importantes de los humanos son sociales en
carácter y ese alivio por las máquinas de muchos de nuestro presente
Las funciones intelectuales exigentes finalmente le darán tiempo a la raza humana.
e incentivo para aprender a vivir bien juntos.
—MERRILL FLOOD
Cualquier sistema dinámico sujeto a las limitaciones de espacio y tiempo ha terminado.

contra un conjunto básico de problemas fundamentales e inevitables. Estas
Los problemas son de naturaleza computacional, lo que hace que las computadoras no solo sean nuestra
herramientas, sino también a nuestros camaradas. De esto surgen tres simples piezas de sabiduría.
Primero, hay casos en los que los informáticos y los matemáticos han
identificó buenos enfoques algorítmicos que simplemente pueden transferirse
a los problemas humanos. La regla del 37%, el criterio menos utilizado recientemente para
manejo de cachés desbordados, y el límite de confianza superior como guía
a la exploración son todos ejemplos de esto.
En segundo lugar, saber que está utilizando un algoritmo óptimo debería ser una
alivio incluso si no obtiene los resultados que estaba buscando. La regla del 37%
falla el 63% del tiempo. Mantener su caché con LRU no garantiza
que siempre encontrarás lo que buscas; de hecho, tampoco lo haría
clarividencia. Usando el enfoque de límite de confianza superior para
explorar / exploit compensación no significa que va a tener ningún remordimiento, sólo que
Página 328
esos lamentos se acumularán cada vez más lentamente a medida que avance la vida. Incluso
la mejor estrategia a veces produce malos resultados, razón por la cual la computadora
Los científicos se preocupan por distinguir entre "proceso" y "resultado". Si tu
ha seguido el mejor proceso posible, entonces ha hecho todo lo posible y
No debería culparse a sí mismo si las cosas no salieron como desea.
Los resultados aparecen en los titulares de las noticias; de hecho, hacen que el mundo en que vivimos
en, por lo que es fácil obsesionarse con ellos. Pero los procesos son lo que tenemos
control sobre. Como dijo Bertrand Russell, "parece que debemos tomar
cuenta de la probabilidad al juzgar la rectitud objetiva ... El objetivo
El acto correcto es el que probablemente será más afortunado. Definiré esto
como el acto más sabio ". Podemos tener la esperanza de ser afortunados, pero debemos esforzarnos por
sabio. Llámelo una especie de estoicismo computacional.
Finalmente, podemos trazar una línea clara entre los problemas que admiten
soluciones sencillas y problemas que no lo hacen. Si terminas atrapado en
un escenario intratable, recuerde que las heurísticas, aproximaciones y
El uso estratégico de la aleatoriedad puede ayudarlo a encontrar soluciones viables. Un tema
que surgió una y otra vez en nuestras entrevistas con científicos informáticos
era: a veces "suficientemente bueno" realmente es suficientemente bueno. Además, estar
consciente de la complejidad puede ayudarnos a elegir nuestros problemas: si tenemos control sobre
qué situaciones enfrentamos, debemos elegir las que son manejables.
Pero no solo elegimos los problemas que nos planteamos. Nosotros también
elegir los problemas que nos planteamos, ya sea la forma en que diseñamos una ciudad
o la forma en que hacemos una pregunta. Esto crea un puente sorprendente desde
ciencia de la computación a la ética, en la forma de un principio que llamamos
bondad computacional .
***
Hay una cierta paradoja que observamos los dos cuando se trataba de
programar las entrevistas incluidas en este libro. Nuestros entrevistados fueron
en promedio, es más probable que esté disponible cuando solicitamos una reunión, digamos,
"El próximo martes entre la 1:00 p. M. Y las 2:00 p. M. PST" que "a una hora conveniente
esta semana que viene ". Al principio esto parece absurdo, como los célebres estudios
donde la gente, en promedio, dona más dinero para salvar la vida de un pingüino
Página 329
que ocho mil pingüinos, o afirman estar más preocupados por morir en
un acto de terrorismo que morir por cualquier causa, incluido el terrorismo. En
En el caso de las entrevistas, parece que la gente prefirió recibir una
problema restringido, incluso si las restricciones fueron sacadas de la nada,
que uno abierto de par en par. Aparentemente fue menos difcil para ellos
adaptarse a nuestras preferencias y limitaciones que calcular una mejor
opción basada en la suya. Los científicos de la computación asentirían a sabiendas aquí,
citando la brecha de complejidad entre "verificación" y "búsqueda", que es
tan grande como la brecha entre conocer una buena canción cuando la escuchas
y escribiendo uno en el acto.
Uno de los principios implícitos de la informática, por extraño que parezca
suena, es que la computación es mala : la directiva subyacente de cualquier bien
algoritmo es minimizar el trabajo del pensamiento. Cuando interactuamos con otros
personas, les presentamos problemas computacionales, no solo explícitos
solicitudes y demandas, pero desafíos implícitos como interpretar nuestra
intenciones, nuestras creencias y nuestras preferencias. Es lógico, por lo tanto,
que una comprensión computacional de tales problemas arroja luz sobre el
naturaleza de la interacción humana. Podemos ser "computacionalmente amables" con los demás al
enmarcar los problemas en términos que hacen que el problema computacional subyacente
más fácil. Esto es importante porque muchos problemas, especialmente los sociales, como
que hemos visto, son intrínseca e inextricablemente difíciles.
Considere este escenario tan común. Un grupo de amigos está parado
alrededor, tratando de averiguar dónde ir a cenar. Cada uno de ellos tiene claramente
algunas preferencias, aunque potencialmente débiles. Pero ninguno de ellos quiere
expresar esas preferencias explícitamente, de modo que naveguen cortésmente por las
peligros con conjeturas y medias indirectas.
Bien pueden llegar a una resolución que satisfaga a todos. Pero esto
El procedimiento puede salir mal fácilmente. El verano después de la universidad, por ejemplo, Brian
y dos amigos hicieron un viaje a España. Negociaron el itinerario del viaje en
la mosca, y en un momento se hizo evidente que no tendrían tiempo de ir
a la corrida de toros que habían investigado y planeado. Solo entonces, como cada uno de los
tres intentaron consolar a los demás, ¿descubrieron de repente que, de hecho,
ninguno de ellos había querido ver la corrida en primer lugar. Cada uno acababa de
Página 330
adoptaron valientemente lo que habían percibido como el nivel de entusiasmo de los demás,
produciendo así el nivel de entusiasmo que los demás adoptaron valientemente en
girar.
Del mismo modo, lenguaje aparentemente inocuo como "Oh, soy flexible" o
"¿Qué quieres hacer esta noche?" tiene un oscuro vientre computacional
eso debería hacerte pensar dos veces. Tiene un barniz de bondad, pero
hace dos cosas profundamente alarmantes. Primero, pasa la pelota cognitiva:
"Aquí hay un problema, usted lo maneja". En segundo lugar, al no indicar sus preferencias,
invita a los demás a simularlos o imaginarlos. Y como hemos visto, el
La simulación de las mentes de los demás es uno de los mayores
desafíos que una mente (o una máquina) puede enfrentar.
En tales situaciones, la amabilidad computacional y la etiqueta convencional
divergir. Retener cortésmente sus preferencias pone la computacional
problema de inferirlos sobre el resto del grupo. En contraste, cortésmente
afirmar sus preferencias ("Personalmente, me inclino por x . ¿Qué
¿crees? ”) ayuda a asumir la carga cognitiva de mover al grupo hacia
resolución.
Alternativamente, puede intentar reducir, en lugar de maximizar, el número
de opciones que ofrece a otras personas, por ejemplo, ofrecer una opción entre dos
o tres restaurantes en lugar de diez. Si cada persona del grupo elimina
su opción menos preferida, que facilita la tarea a todos. Y si
está invitando a alguien a almorzar o programando una reunión, ofreciendo
una o dos propuestas concretas que puedan aceptar o rechazar es una buena
punto de partida.
Ninguna de estas acciones es necesariamente "cortés", pero todas pueden
reducir significativamente el costo computacional de la interacción.
***
La bondad computacional no es solo un principio de comportamiento; también es un diseño

principio.
En 2003, el científico informático de la Universidad de Waterloo, Jeffrey Shallit
investigó la cuestión de qué moneda, si se pone en circulación en los Estados Unidos
Estados, ayudaría más a minimizar la cantidad de monedas necesarias en promedio
Página 331
para hacer el cambio. Encantadoramente, la respuesta resultó ser una moneda de 18 centavos.
—Pero a Shallit se le impidió hacer una recomendación de política
por preocupaciones computacionales.
En la actualidad, realizar cambios es muy simple: para cualquier cantidad dada, solo
use tantos centavos como pueda sin pasarse, luego tantos centavos como
posible, y así sucesivamente en las denominaciones. Por ejemplo, cincuenta y cuatro centavos
son dos cuartos, luego cuatro centavos. Con una moneda de 18 centavos, así de simple
El algoritmo ya no es óptimo: es mejor hacer cincuenta y cuatro centavos con tres
Monedas de 18 centavos, y ninguna moneda de veinticinco centavos. De hecho, Shallit observó que
denominaciones desgarbadas convierten el cambio en algo "al menos como
difícil ... como el problema del viajante de comercio ". Es mucho pedirle a un cajero.
Si se tiene en cuenta la facilidad de cálculo, concluyó Shallit, ¿cuál
La oferta monetaria de EE. UU. Que podría aprovechar mejor es una moneda de 2 centavos o de 3 centav
pieza. No es tan emocionante como una moneda de 18 centavos, pero casi tan buena y
computacionalmente más amable por mucho.
El punto más profundo es que los cambios sutiles en el diseño pueden cambiar radicalmente la
tipo de problema cognitivo planteado a los usuarios humanos. Arquitectos y urbanos
los planificadores, por ejemplo, tienen opciones sobre cómo construir nuestra
medio ambiente, lo que significa que tienen opciones sobre cómo
estructurar los problemas computacionales que tenemos que resolver.
Considere un estacionamiento grande, con una variedad de carriles diferentes, del tipo
a menudo se encuentra en estadios y centros comerciales. Puede conducir en un carril
hacia el destino, ver un lugar, decidir dejarlo ir a favor de (con suerte)
uno mejor más adelante, pero luego, al no encontrar tal suerte, alcanza el
destino y diríjase por un carril vecino. Después de una cierta cantidad
de conducir, debe decidir si otro espacio es lo suficientemente bueno para ocupar,
o tan lejos que intente buscar en un tercer carril en su lugar.
Una perspectiva algorítmica aquí es útil no solo para el conductor sino también
para el arquitecto. Contrasta el complicado y complicado problema de decisión que plantea uno.
de esos lotes a un solo camino lineal que se aleja del destino de uno. En
En ese caso, uno simplemente toma el primer espacio disponible, sin teoría de juegos, sin
análisis, no se necesita una regla de mirar y luego saltar. Algunos estacionamientos son
estructurado de esta manera, con una sola hélice que se enrolla hacia arriba desde el suelo
Página 332
nivel. Su carga computacional es cero: uno simplemente avanza hasta que el

Aparece el primer espacio, luego lo toma. Cualesquiera que sean los otros factores posibles para y
en contra de este tipo de construcción, definitivamente podemos decir que es cognitivamente
humano para sus impulsores, computacionalmente amable.
Uno de los principales objetivos del diseño debería ser proteger a las personas de
tensión, fricción y trabajo mental innecesarios. (Esto no es solo un resumen
preocupación; cuando el estacionamiento en un centro comercial se convierte en una fuente de estrés, po
los
y loscompradores pueden gastar
arquitectos sopesan menos dinero
habitualmente cómoylos
regresar con diseños
diferentes menos frecuencia).
de lotes utilizarán los recursos
como espacio, materiales y dinero limitados. Pero rara vez explican la
la forma en que sus diseños gravan los recursos computacionales de las personas que utilizan
ellos. Reconociendo los fundamentos algorítmicos de nuestra vida diaria, en este
caso, parada óptima, no solo permitiría a los conductores hacer lo mejor
decisiones cuando se encuentran en un escenario particular, pero también animan a los planificadores
ser más reflexivo sobre los problemas a los que están obligando a los conductores en el
primer lugar.
Hay una serie de otros casos en los que los diseños computacionalmente más amables
se sugieren a sí mismos. Por ejemplo, considere las políticas de asientos del restaurante. Algunos
Los restaurantes tienen una política de "asientos abiertos", en la que los clientes en espera simplemente
Desplácese hasta que se abra una mesa y el primero en sentarse se quede con la mesa. Otros
tomará su nombre, le permitirá tomar una copa en el bar y le notificará cuando un
la mesa está lista. Estos enfoques para la gestión de los escasos recursos compartidos
Los recursos reflejan la distinción en informática entre "girar"
y "bloqueo". Cuando un hilo de procesamiento solicita un recurso y no puede obtener
, la computadora puede permitir que ese hilo "gire", que continúe
buscando el recurso en un perpetuo "¿Ya está listo?" bucle, o puede
"Bloquear": detener ese hilo, trabajar en otra cosa y luego volver
siempre que el recurso se vuelva gratuito. Para un informático, esto es
una compensación práctica: sopesar el tiempo perdido al girar contra el tiempo perdido
en el cambio de contexto. Pero en un restaurante, no todos los recursos son
intercambiados son los suyos. Una política de "girar" llena las tablas vacías más rápido, pero
mientras tanto, las CPU que se están agotando son las mentes de sus clientes,
atrapado en una tediosa pero absorbente vigilancia.
Página 333
Como ejemplo paralelo, considere el problema computacional planteado por un

parada de autobús. Si hay una pantalla en vivo que dice que el próximo autobús está "llegando en 10
minutos ", entonces puedes decidir una vez si esperar, en lugar de tomar
el autobús continúa sin venir como un flujo de evidencia inferencial, momento
momento, y tener que redecidir y redecidir. Además, puedes tomar
su atención lejos de entrecerrar los ojos por la carretera, girar, para esos diez
minutos seguidos. (Para ciudades que no están a la altura de la implementación necesaria
para predecir la próxima llegada, vimos cómo la inferencia bayesiana puede incluso hacer
sabiendo cuándo el último autobús dejó un proxy útil.) Tales actos sutiles de
la bondad computacional podría hacer tanto por el número de pasajeros, si no más, como
Subsidiar las tarifas: considérelo como un subsidio cognitivo .
***
Si podemos ser más amables con los demás, también podemos ser más amables con nosotros mismos. No
computacionalmente más amable: todos los algoritmos e ideas que hemos discutido
ayudará con eso. Pero también más indulgente.
El estándar intuitivo para la toma de decisiones racional es cuidadosamente
considerando todas las opciones disponibles y tomando la mejor. A primera vista,
las computadoras parecen modelos de este enfoque, abriéndose camino
a través de cálculos complejos durante el tiempo que sea necesario para obtener respuestas perfectas.
Pero, como hemos visto, esa es una imagen obsoleta de lo que hacen las computadoras: es una
lujo proporcionado por un problema fácil. En los casos difíciles, los mejores algoritmos
se trata de hacer lo que tiene más sentido en el menor tiempo posible,
que de ninguna manera implica prestar una cuidadosa consideración a cada factor
y persiguiendo cada cálculo hasta el final. La vida es demasiado complicada para
ese.
En casi todos los dominios que hemos considerado, hemos visto cómo cuanto más
factores del mundo real que incluimos, ya sea que tenga información incompleta
al entrevistar a los solicitantes de empleo, lidiar con un mundo cambiante cuando
tratando de resolver el dilema explorar / explotar, o tener ciertas tareas
depender de los demás cuando intentamos hacer las cosas; es más probable que
van a terminar en una situación en la que encontrar la solución perfecta requiere
irrazonablemente largo. Y, de hecho, la gente casi siempre se enfrenta a lo que
Página 334
la informática considera los casos difíciles. Frente a casos tan duros,

Los algoritmos efectivos hacen suposiciones, muestran un sesgo hacia
soluciones, compensar los costos del error con los costos de la demora, y tomar
posibilidades.
Estas no son las concesiones que hacemos cuando no podemos ser racionales.
Son lo que significa ser racional.
Página 335
Notas
Tenga en cuenta que algunos de los enlaces a los que se hace referencia ya no funcionan.
Los números de página de las notas que aparecieron en la versión impresa de este
el título no está en su libro electrónico. Utilice la función de búsqueda en su e-
dispositivo de lectura para buscar los pasajes relevantes documentados o discutidos.
INTRODUCCIÓN
al-Jabr wa'l-Muqābala : Al-Jabr wa'l-Muqābala trajo consigo una tecnología verdaderamente disruptiva: la
Sistema decimal indio, y el hecho de que nos referimos a este sistema de forma algo errónea como árabe
numerals es testimonio de la influencia del libro. La introducción de números arábigos y la
algoritmos que apoyan, dio inicio a un enfrentamiento medieval entre los defensores de este novedoso
matemáticas (los "algoristas") y contadores más tradicionales que favorecían los números romanos respaldados por
un ábaco (los "abacistas"). Se puso bastante intenso: la ciudad de Florencia aprobó una ley en 1399 que prohibía
el uso de números arábigos por parte de los bancos. Irónicamente, los números romanos eran en sí mismos un controvertido
innovación cuando se ofrecieron como una alternativa a simplemente escribir números con palabras, siendo
declarado "no apto para mostrar una suma, ya que los nombres se han inventado para tal fin". Ver Murray,
Capítulos de la historia de la contabilidad .
Tablilla de arcilla sumeria de cuatro mil años: un análisis detallado aparece en Knuth, “Ancient
Algoritmos babilónicos ". Más información sobre la historia de los algoritmos, con énfasis en
algoritmos matemáticos, aparece en Chabert, Barbin y Weeks, A History of Algorithms .
Golpes con la punta de una cornamenta: esta técnica se conoce como "percusión de martillo suave".
“La ciencia es una forma de pensar”: Sagan, Broca's Brain .
la forma en que pensamos sobre la racionalidad humana: las limitaciones de una concepción clásica de la racionalidad
—Que asume una capacidad computacional infinita y un tiempo infinito para resolver un problema— fueron
famoso por el psicólogo, economista y pionero de la inteligencia artificial Herbert
Simon en la década de 1950 (Simon, Models of Man ), lo que finalmente llevó a un Premio Nobel. Simon argumentó que
Página 336
La “racionalidad limitada” podría proporcionar una mejor explicación del comportamiento humano. La intuición de Simon ha sido
se hizo eco en las matemáticas y la informática. El colega de Alan Turing, IJ Good (famoso por la
concepto de “la singularidad” y por asesorar a Stanley Kubrick sobre HAL 9000 para 2001: un espacio
Odyssey ) llamó a este tipo de pensamiento "Racionalidad Tipo II". Mientras que el Tipo I clásico y pasado de moda
La racionalidad solo se preocupa por obtener la respuesta correcta, la racionalidad de tipo II tiene en cuenta el costo
de obtener esa respuesta, reconociendo que el tiempo es una moneda tan importante como la precisión. Ver bien,
Buen pensamiento .
Los expertos en inteligencia artificial del siglo XXI también han argumentado que
Optimality ”, elegir el algoritmo que mejor compensa el tiempo y el error, es la clave para desarrollar
agentes inteligentes funcionales. Este es un punto planteado por, por ejemplo, el científico informático de UC Berkeley
Stuart Russell, quien literalmente coescribió el libro sobre inteligencia artificial (el libro de texto más vendido
Inteligencia artificial: un enfoque moderno ), y por Eric Horvitz, director gerente de Microsoft
Investigar. Véase, por ejemplo, Russell y Wefald, Do the Right Thing , y Horvitz y Zilberstein,
"Compensaciones computacionales bajo recursos acotados". Tom y sus colegas han utilizado este
enfoque para desarrollar modelos de cognición humana; véase Griffiths, Lieder y Goodman, “Rational Use
de recursos cognitivos ".
analogía con un matemático humano: en la sección 9 de Turing, "Sobre números computables", Turing
justifica las decisiones tomadas al definir lo que ahora llamamos una máquina de Turing comparándolas con
operaciones que una persona podría realizar: una hoja de papel bidimensional se convierte en una
cinta dimensional, el estado mental de la persona se convierte en el estado de la máquina, y los símbolos son
escrito y leído a medida que la persona o la máquina se mueven sobre el papel. La computación es lo que
la computadora lo hace, y en ese momento las únicas "computadoras" eran personas.
somos irracionales y propensos a cometer errores: por ejemplo, véase Gilovich, How We Know What Isn't So ; Ariely
y Jones, predeciblemente irracional ; y Marcus, Kluge .
1. PARADA ÓPTIMA
"Aunque todos los cristianos comienzan": De la carta de Kepler a "un noble desconocido" el 23 de octubre,
1613; véase, por ejemplo, Baumgardt, Johannes Kepler .
un fenómeno tan común: la gota de pavo se menciona, entre muchos otros lugares, en
http://www.npr.org/templates/story/story.php?storyId=120913056 y
http://jezebel.com/5862181/technology-cant-stop-the-turkey-drop .
En cualquier problema de parada óptima: Para obtener más información sobre las matemáticas de la parada óptima, Ferguson,
Detenciones y aplicaciones óptimas , es una maravillosa referencia.
El rompecabezas más famoso de la parada óptima: un tratamiento detallado de la naturaleza y los orígenes de la
El problema de la secretaria aparece en Ferguson, "¿Quién resolvió el problema de la secretaria?"
su primera aparición impresa: sobre lo que escribe Gardner es sobre un juego de salón llamado "Juego de
Googol ”, aparentemente ideado en 1958 por John Fox del regulador de Minneapolis-Honeywell
Company y Gerald Marnie del MIT. Así es como Fox lo describió en su carta original a
Gardner el 11 de mayo de 1959 (todas las cartas a Gardner que citamos son de los artículos de Martin Gardner en
Universidad de Stanford, serie 1, caja 5, carpeta 19):
El primer jugador escribe tantos números positivos únicos en diferentes hojas de papel como
el desea. Luego los baraja y les da la vuelta de uno en uno. Si el segundo jugador dice
Página 337
que se detenga en un cierto resbalón y el número en ese boleto es el número más grande de la colección
entonces el segundo jugador gana. Si no, el primer jugador gana.
Fox señaló además que el nombre del juego proviene del hecho de que el número "uno googol" es
a menudo escrito en uno de los resbalones (presumiblemente para engañar al oponente haciéndole creer que es el más grande
número, con "dos googol" apareciendo en otro lugar). Luego afirmó que la estrategia óptima para
el segundo jugador debía esperar hasta que la mitad de los papeles se hubiera volteado y luego elegir la primera
número mayor que el más grande en la primera mitad, convergiendo en un 34,7% de posibilidades de ganar.
Gardner le escribió a Leo Moser, un matemático de la Universidad de Alberta, para obtener más
información sobre el problema. Moser había escrito un artículo en una revista en 1956 que trataba de cerca
problema relacionado (Moser, "Sobre un problema de Cayley"), propuesto originalmente en 1875 por el influyente
El matemático británico Arthur Cayley (Cayley, "Mathematical Questions"; Cayley, Collected
Artículos matemáticos ). Aquí está la versión propuesta por Cayley:
La lotería se organiza de la siguiente manera: Hay n boletos que representan a , b , c libras respectivamente.
Una persona dibuja una vez; mira su boleto; y si quiere, vuelve a dibujar (del resto
n - 1 entradas); mira su boleto y, si le place, vuelve a dibujar (de los n - 2 restantes
Entradas); y así sucesivamente, dibujando en total no más de k veces; y recibe el valor de la última
billete dibujado. Suponiendo que regula sus dibujos de la manera más ventajosa para
él de acuerdo con la teoría de probabilidades, ¿cuál es el valor de su expectativa?
Moser agregó una información más: que las entradas tenían la misma probabilidad de adquirir algún valor.
entre 0 y 1.
En el problema de Cayley y la ligera reformulación del mismo de Moser (a veces denominado colectivamente como
el problema de Cayley-Moser), la recompensa es el valor del boleto elegido y el desafío es encontrar
la estrategia que da el mayor rendimiento promedio. Es aquí donde el problema explorado por Cayley y
Moser se diferencia del problema de la secretaria (y el Juego de Googol) al centrarse en maximizar la
valor promedio del número elegido, en lugar de la probabilidad de encontrar el número más grande
(cuando nada más que lo mejor servirá). El artículo de Moser de 1956 es notable no solo por la elegante solución que
proporciona a este problema, sino también porque es el primer lugar donde vemos mención del mundo real
consecuencias de una parada óptima. Moser habla de dos posibles escenarios:
1. El problema del turista: un turista que viaja en automóvil quiere pasar la noche en uno de los n moteles
indicado en su guía de carreteras. Busca el alojamiento más cómodo pero, naturalmente, lo hace
No quiero volver sobre ninguna parte de su viaje. ¿Qué criterio debería utilizar para detenerse?
2. El dilema del soltero: un soltero conoce a una chica que está dispuesta a casarse con él y cuya
"Vale" que puede estimar. Si él la rechaza, ella no tendrá nada de él más tarde, pero es probable que él
conocer a otras chicas en el futuro y estima que tendrá n oportunidades en total. Bajo que
circunstancias en que debería casarse?
La idea de entretener a una serie de pretendientes —con los sexos de los protagonistas invertidos— debidamente formulada
una aparición en la columna de 1960 de Gardner sobre el Juego de Googol.
Moser proporcionó la solución correcta, la regla del 37%, a Gardner, pero su carta del 26 de agosto,
1959, sugirió que el problema podría tener un origen anterior: “También encontré en algunas notas que R.
E. Gaskell (de Boeing Aircraft en Seattle) distribuido en enero de 1959. Él atribuye el problema al Dr.
G. Marsaglia ”.
Página 338
La interpretación caritativa de Gardner fue que Fox y Marnie reclamaban la creación del
juego específico de Googol, no del problema más amplio del que ese juego era una instancia, un punto
que fue cuidadosamente elaborado en su columna. Pero recibió una variedad de cartas que citaban ejemplos anteriores de
problemas similares, y está claro que el problema se transmitió entre los matemáticos.
Los orígenes del problema son sorprendentemente misteriosos: incluso Gilbert y Mosteller, "Recognizing the
Máximo de una secuencia ”, uno de los artículos científicos más autorizados sobre el problema de la secretaria,
admite que "los esfuerzos por descubrir el origen de este problema no han tenido éxito". Ferguson,
"¿Quién resolvió el problema de la secretaria?" Proporciona una historia divertida y matemáticamente detallada de
el problema de la secretaria, incluidas algunas de sus variantes. Ferguson argumentó que, de hecho, el problema
descrito por Gardner no se había resuelto. Ya debería estar claro que mucha gente resolvió el
Problema de secretaria de maximizar la probabilidad de seleccionar al mejor de una secuencia de solicitantes.
distinguido sólo por sus rangos relativos, pero Ferguson señaló que este no es en realidad el
Problema planteado en el Juego de Googol. En primer lugar, el reproductor de Googol conoce los valores observados en
cada trozo de papel. En segundo lugar, es un juego competitivo: un jugador intenta seleccionar números y un
secuencia que engañará al otro. Ferguson tiene su propia solución para este problema más desafiante,
¡pero es lo suficientemente complejo como para que tengas que leer el documento tú mismo!
Mosteller recordó haber oído hablar del problema: Gilbert y Mosteller, "Recognizing the Maximum
de una secuencia ".
Roger Pinkham de Rutgers escribió: Carta de Roger Pinkham a Martin Gardner, 29 de enero de
1960.
Influencia de Flood en la informática: véase Cook, In Pursuit of the Travelling Salesman ;
Poundstone, el dilema del prisionero ; y Flood, "Soft News".
considerando el problema desde 1949: Flood hizo esta afirmación en una carta que escribió a Gardner en mayo
5 de mayo de 1960. Adjuntaba una carta del 5 de mayo de 1958, en la que proporcionaba la solución correcta, aunque
También indicó que se rumoreaba que Andrew Gleason, David Blackwell y Herbert Robbins tenían
resuelto el problema en los últimos años.
En una carta a Tom Ferguson fechada el 12 de mayo de 1988, Flood entró en más detalles sobre el origen de
el problema. (La carta está archivada en el archivo Merrill Flood de la Universidad de Michigan).
hija, recién graduada de la escuela secundaria, había entablado una relación seria con un hombre mayor,
y Flood y su esposa lo desaprobaron. Su hija estaba tomando las minutas en una conferencia en George
Washington University en enero de 1950, y Flood presentó lo que llamó el "problema del prometido"
allí. En sus palabras, "No intenté resolver el problema en ese momento, pero lo presenté simplemente
porque esperaba que [ella] pensara un poco en esos términos y sonaba como si fuera un poco agradable
problema matemático fácil ". Flood indica que Herbert Robbins proporcionó una solución aproximada
unos años más tarde, antes de que el propio Flood descubriera la solución exacta.
parece estar en un artículo de 1964: el artículo es de Chow et al., "Selección óptima basada en
Rango."
lo mejor que ha visto hasta ahora: en la literatura, se hace referencia a lo que llamamos solicitantes "mejores hasta ahora" (nosotros
pensar de forma algo confusa) como "candidatos".
se asienta en el 37% del grupo: La regla del 37% se deriva haciendo el mismo análisis para n solicitantes:
calcular la probabilidad de que establecer un estándar basado en los primeros k solicitantes resulte en elegir
el mejor solicitante en general. Esta probabilidad se puede expresar en términos de la relación de k a n , que nos
Página 339
puede llamar p . A medida que n aumenta, la probabilidad de elegir al mejor candidato converge a la
función matemática - p log p . Esto se maximiza cuando p = 1 / e . El valor de e es 2 . 71828 …, entonces 1 / e
es 0 . 367879441 …, o poco menos del 37%. Y la coincidencia matemática: que la probabilidad de
el éxito es lo mismo que p — surge porque log e es igual a 1. Entonces, si p = 1 / e , - p log p es solo 1 / e . Un bien
La versión explicada de la derivación completa aparece en Ferguson, "¿Quién resolvió el problema de la secretaria?"
una de las curiosas simetrías matemáticas del problema: los matemáticos John Gilbert y
Frederick Mosteller llama a esta simetría "divertida" y la discute con un poco más de detalle en Gilbert
y Mosteller, "Reconociendo el máximo de una secuencia".
“La pasión entre los sexos”: Malthus, Ensayo sobre el principio de población .
"Se casó con el primer hombre que besé": atribuido por muchas fuentes, por ejemplo, Thomas, Front Row en el
Casa Blanca .
un estudiante graduado que busca el amor: la publicación del blog de Michael Trick sobre el encuentro con su esposa es "Finding
Love Optimally ”, blog de investigación de operaciones de Michael Trick , 27 de febrero de 2011,
http://mat.tepper.cmu.edu/blog/?p=1392.
el número de solicitantes o el tiempo : la regla del 37% se aplica directamente al período de tiempo de uno
buscar solo cuando los solicitantes estén distribuidos uniformemente a lo largo del tiempo. De lo contrario, querrás apuntar
más precisamente para el 37% de la distribución a lo largo del tiempo. Véase Bruss, “Un enfoque unificado para una clase de
Problemas con las mejores opciones ".
la Regla del 37% dio 26,1 años de edad: El análisis de esperar hasta al menos 26 años para proponer (37% de
el camino de 18 a 40) aparece por primera vez en Lindley, "Programación dinámica y teoría de la decisión",
que es presumiblemente donde Trick encontró esta idea.
cortejando a un total de once mujeres: la historia de Kepler se cubre en detalle en Koestler, The Watershed ,
y en Baumgardt, Johannes Kepler , así como en Connor, la bruja de Kepler . La mayor parte de lo que sabemos
sobre la búsqueda de Kepler de una segunda esposa proviene de una carta en particular, que Kepler escribió a
"Un noble desconocido" de Linz, Austria, el 23 de octubre de 1613.
proponer temprano y con frecuencia: Smith, "Un problema de secretaria con empleo incierto", mostró que si
la probabilidad de que una propuesta sea rechazada es q , entonces la estrategia que maximiza la probabilidad de
encontrar el mejor solicitante es mirar una proporción de solicitantes igual a q 1 / (1− q ) y luego hacer
ofrece a cada solicitante mejores que las vistas hasta ahora. Esta proporción es siempre menor que 1 / e , por lo que
está mejorando sus posibilidades al hacer más ofertas. Desafortunadamente, esas posibilidades siguen siendo
peor que si no te rechazaran, la probabilidad de terminar con el mejor candidato es
también q 1 / (1− q ) , y por lo tanto menor que el dado por la regla del 37%.
hasta que haya visto el 61% de los solicitantes: si se permiten propuestas retrasadas, la estrategia óptima depende
sobre la probabilidad de que se acepte una propuesta inmediata, q , y la probabilidad de un retraso
propuesta aceptada, pág . La proporción de candidatos que inicialmente pasan por alto viene dada por el
fórmula desalentadora . Esta fórmula integrada para el rechazo y el recuerdo proviene de
Petruccelli, "Problemas de mejor elección que involucran incertidumbre", aunque recordar a los candidatos anteriores fue
considerado anteriormente por Yang, "Reconociendo el máximo de una secuencia aleatoria".
Esta fórmula se simplifica cuando hacemos elecciones particulares para q y p . Si p = 0, tan retrasado
Las propuestas siempre son rechazadas, recuperamos la regla para el problema de la secretaria con el rechazo. Como nosotros
enfoque q = 1, con propuestas inmediatas siempre aceptadas, la proporción en la que comenzar
Página 340
hacer ofertas tiende hacia e p −1 , que siempre es mayor que 1 / e (que puede reescribirse como e −1 ).
Esto significa que tener el potencial de hacer ofertas a los solicitantes que han sido pasados por alto debería
resultan en pasar más tiempo pasando por alto a los solicitantes, algo que es bastante intuitivo. En general
texto asumimos que las propuestas inmediatas son siempre aceptadas ( q = 1) pero las propuestas retrasadas son
rechazado la mitad del tiempo ( p = 0 . 5). Entonces debe pasar más del 61% de los solicitantes y hacer una oferta para
el mejor hasta ahora, quien sigue, regresando al final y haciendo una oferta al mejor en general si es necesario.
Otra posibilidad considerada por Petruccelli es que la probabilidad de rechazo aumenta con
tiempo, a medida que disminuye el ardor de los solicitantes. Si la probabilidad de que una oferta sea aceptada por un
solicitante es qp s , donde s es el número de "pasos" en el pasado necesarios para llegar a ese solicitante, entonces
la estrategia óptima depende de q , p , y del número de solicitantes, n . Si q / (1 - p ) es mayor que n - 1
entonces es mejor jugar a esperar, observar a todos los solicitantes y luego hacer una oferta al mejor.
De lo contrario, observe una proporción igual a q 1 / (1− q ) y haga una oferta al próximo solicitante mejor que
los vistos hasta ahora. Curiosamente, esta es exactamente la misma estrategia (con la misma probabilidad de éxito)
como que cuando p = 0, lo que significa que si la probabilidad de rechazo aumenta con el tiempo, no hay beneficio
a poder volver a un candidato anterior.
“No se necesita acumular experiencia”: Gilbert y Mosteller, “Reconociendo el máximo de un

Secuencia."
utilizar la regla de umbral: la estrategia general para resolver problemas de frenado óptimos como el
El juego de información consiste en comenzar por el final y razonar hacia atrás, un principio que se llama
inducción." Por ejemplo, imagina un juego en el que lanzas un dado y tienes la opción de pegar
con ese número o tira de nuevo un máximo de k veces (tomamos este ejemplo de Hill, "Sabiendo
Cuándo parar ”). ¿Cuál es la estrategia óptima? Podemos resolverlo trabajando hacia atrás. Si k = 0,
no tienes una opción, tienes que ceñirte a tu tirada y obtendrás un promedio de 3.5 puntos (la
valor medio de una tirada de dado, (1 + 2 + 3 + 4 + 5 + 6) / 6). Si k = 1, entonces solo debes mantener un rollo que
supera ese promedio, un 4 o más. Si obtiene un 1, 2 o 3, es mejor que arriesgue la tirada final.
Siguiendo esta estrategia, hay un 50% de probabilidad de que te detengas con un 4, 5 o 6 (para un promedio de 5) y un
50% de probabilidad de pasar a la tirada final (para un promedio de 3,5). Entonces, su puntaje promedio en k = 1 es 4.25,
y solo debe mantener una tirada en k = 2 si supera ese puntaje, un 5 o más. Etcétera.
La inducción hacia atrás responde así a una antigua pregunta. "Más vale pájaro en mano que dos en
bush ”, decimos, pero es 2 . 0 el coeficiente correcto aquí? Las matemáticas sugieren que el número correcto de aves
en el monte depende en realidad de la calidad del pájaro en la mano. Reemplazo de pájaros con dados para
conveniencia, una tirada de 1, 2 o 3 ni siquiera vale tanto como un solo dado "en la selva". Pero un rollo de 4
vale un dado en el monte, mientras que una tirada de 5 vale dos, tres o incluso cuatro dados en el monte. Y un
la tirada de 6 vale incluso más que el contenido completo de un arbusto de dados infinitamente grande , sea lo que sea
es.
Gilbert y Mosteller utilizaron el mismo enfoque para derivar la serie de umbrales que deberían ser
utilizado en el problema de la secretaria de información completa. Los umbrales en sí mismos no están descritos por un
fórmula matemática simple, pero algunas aproximaciones aparecen en su artículo. Lo más simple
aproximación da un umbral de t k = 1 / (1 + 0 . 804 / k + 0,183 / k 2 ) para el solicitante n - k . Si el
probabilidad de que un solicitante aleatorio sea mejor que el solicitante n - k es menor que t k , entonces debe
tome ese solicitante. Debido a que el denominador aumenta, a una tasa creciente, a medida que aumenta k ,
debería estar bajando rápidamente su umbral a medida que pasa el tiempo.
Página 341
muchas más variantes del problema de la secretaria: Freeman, “El problema de la secretaria y su
Extensiones ”resume una gran cantidad de estas variantes. Aquí hay un recorrido rápido por algunos de los
resultados útiles.
Si es igualmente probable que el número de solicitantes sea cualquier número de 1 an , entonces la regla óptima es
para ver el primer n / e 2 (que es aproximadamente el 13,5% de n ) y tomar el siguiente candidato mejor que el
mejor visto hasta ahora, con una probabilidad de éxito de 2 / e 2 (Presman y Sonin, "The Best Choice Problem for
un número aleatorio de objetos ”).
Si el número de solicitantes es potencialmente infinito, pero la búsqueda se detiene después de cada solicitante con
probabilidad p , la regla óptima es ver los primeros 0.18 / p solicitantes, con un 23.6% de probabilidad de éxito
(ibídem.).
Imagina que quieres encontrar la mejor secretaria, pero el valor de hacerlo disminuye cuanto más tiempo
buscar. Si la recompensa por encontrar la mejor secretaria después de ver k solicitantes es d k , entonces la estrategia
que maximiza la recompensa esperada establece un umbral basado en un número de solicitantes que es
garantizado que sea inferior a 1 / (1 - d ) ya que el número total de solicitantes aumenta (Rasmussen y
Pliska, "Elegir el máximo"). Si d está cerca de 1, entonces una aproximación a la estrategia óptima es
para ver los primeros solicitantes de −0,4348 / log d y luego elegir el siguiente candidato mejor que cualquiera visto hasta ahora.
Seguir esta estrategia puede resultar en ver solo un puñado de solicitantes, independientemente del tamaño de la
piscina.
Una forma en que la vida real difiere de los escenarios de reclutamiento idealizados es que el objetivo puede no ser
sea maximizar la probabilidad de conseguir la mejor secretaria. Se han
explorado. Chow et al., "Selección óptima basada en el rango relativo", mostró que si el objetivo es
maximizar el rango promedio del candidato seleccionado, se aplica un tipo diferente de estrategia. En vez de
un solo umbral en el rango relativo del solicitante, hay una secuencia de umbrales. Estas
Los umbrales aumentan a medida que se observan más candidatos, y el entrevistador se vuelve menos estricto
tiempo extraordinario. Por ejemplo, con cuatro solicitantes, el rango mínimo relativo que un candidato debe tener
detener la búsqueda es 0 para el primer solicitante (nunca se detenga en el primero), 1 para el segundo (deténgase solo si
son mejores que el primero), 2 para el tercero (detente si es mejor o segundo mejor), y 4 para el cuarto (simplemente detente
¡ya!). Siguiendo esta estrategia se obtiene un rango promedio esperado de 1 7 ⁄ 8 , mejor que el
(1 + 2 + 3 + 4) / 4 = 2 1 ⁄ 2 que resultaría de elegir un solicitante al azar. La frmula para el
Los umbrales óptimos se encuentran por inducción hacia atrás y son complicados; recomendamos a los lectores interesados
al papel original.
Puedes pensar en la diferencia entre el problema clásico de la secretaria y el rango promedio
caso en términos de cómo asignan pagos a diferentes rangos. En el problema clásico, obtienes una recompensa.
de 1 para elegir lo mejor y 0 para todos los demás. En el caso de rango promedio, obtienes una recompensa igual a
el número de solicitantes menos el rango del solicitante seleccionado. Hay formas obvias de
generalizar esto, y estrategias de múltiples umbrales similares a la que maximiza el rango promedio
trabajar para cualquier función de pago que disminuya a medida que aumenta el rango del solicitante (Mucci, “On a
Clase de problemas de secretaria ”). Otra interesante generalización, con importantes implicaciones para
amantes exigentes, es que si la recompensa es 1 por elegir el mejor, pero -1 por elegir a alguien más
(con 0 para no hacer ninguna elección), debe pasar por una proporción de solicitantes dada por
, luego tome a la primera persona mejor que todas las vistas hasta ahora (o a nadie si todas fallan en esta
criterio) (Sakaguchi, “Juegos secuenciales bilaterales”). Así que piensa bien en tu función de pago
antes de prepararse para comprometerse!
Página 342
Pero, ¿qué pasa si no solo te importa encontrar a la mejor persona, sino cuánto tiempo tienes?
¿juntos? Ferguson, Hardwick y Tamaki, en "Maximizar la duración de poseer un
Best Object ”, examinó varias variantes de este problema. Si solo te importa maximizar el tiempo
gasta con la mejor persona en su conjunto de n , entonces debería mirar los primeros 0,204 n + 1,33
gente y salta para la siguiente persona mejor que todos ellos. Pero si le interesa maximizar la
la cantidad de tiempo que pasa con alguien que es la mejor de todas las personas vistas hasta ahora, debe
basta con mirar una proporción correspondiente a 1 / e 2 ≈ 13,5%. Estos períodos de búsqueda más cortos son
particularmente relevante en contextos, como las citas, donde la búsqueda de una pareja puede tomar un
proporción significativa de su vida.
Resulta que es más difícil encontrar a la segunda mejor persona que encontrar a la mejor. El óptimo
La estrategia es pasar por encima de la primera mitad de los solicitantes y luego elegir al siguiente solicitante que sea el segundo.
mejor en relación con los vistos hasta ahora (Rose, "Un problema de elección y asignación óptimas"). los
la probabilidad de éxito es solo 1/4 (en contraposición a 1 / e en el mejor de los casos). Así que es mejor que no intentes
resolver.
Por último, también existen variantes que reconocen el hecho de que mientras se busca una secretaria,
sus propios candidatos están buscando trabajo. La simetría agregada, que es particularmente
relevante cuando el escenario se refiere a las citas, hace que el problema sea aún más complicado. Peter Todd,
un científico cognitivo de la Universidad de Indiana, ha explorado esta complejidad (y cómo simplificarla) en
detalle. Véase Todd y Miller, "From Pride and Prejudice to Persuasion Satisficing in Mate Search",
y Todd, "Coevolved Cognitive Mechanisms in Mate Search".
Vender una casa es similar: el problema de vender una casa se analiza en Sakaguchi, “Dynamic
Programación de algún diseño de muestreo secuencial ”; Chow y Robbins, “Un sistema martingala
Teorema y aplicaciones ”; y Chow y Robbins, "Sobre las reglas de parada óptimas". Nos enfocamos en el
caso en el que potencialmente hay infinitas ofertas, pero estos autores también proporcionan
estrategias cuando la cantidad de ofertas potenciales es conocida y finita (que son menos conservadoras, usted
debe tener un umbral más bajo si solo tiene un número finito de oportunidades). En el caso infinito, tu
debe establecer un umbral basado en el valor esperado de esperar otra oferta y aceptar la primera oferta
que supera ese umbral.
precio de parada en función del costo de espera: expresando tanto el precio de oferta p como el costo de
esperando otra oferta c como fracciones de nuestro rango de precios (con 0 como la parte inferior del rango y 1 como
la parte superior), la probabilidad de que nuestra próxima oferta sea mejor que p es simplemente 1 - p . Si (o cuando) una oferta mejor
llega, la cantidad promedio que esperaríamos ganar en relación con p es solo (1− p ) ⁄ 2 . Multiplicando estos juntos
nos da el resultado esperado de recibir otra oferta, y esta debería ser mayor o igual que
al costo c vale la pena hacerlo. Esta ecuación (1 - p ) ( (1− p ) ⁄ 2 ) ≥ c se puede simplificar a ,
y resolverlo para p nos da la respuesta , como se muestra en la tabla aquí .
“La primera oferta que recibimos fue excelente”: Laura Albert McLay, entrevista personal, 16 de septiembre de 2014.
para modelar cómo la gente busca trabajo: la formulación de la búsqueda de trabajo como un problema de parada óptimo es
tratado en Stigler, "The Economics of Information", y Stigler, "Information in the Labor
Mercado." McCall, "Economía de la información y la búsqueda de empleo", propuso utilizar un modelo equivalente a
la solución al problema de la venta de viviendas, y Lippman y McCall, "The Economics of Job Search",
analiza varias extensiones de este modelo. Así como el problema de la secretaria ha inspirado una amplia gama de
variantes, los economistas han perfeccionado este modelo simple de diversas formas para hacerlo más realista:
permitiendo que lleguen múltiples ofertas el mismo día, ajustando los costos para el vendedor e incorporando
Página 343
fluctuación en la economía durante la búsqueda. Una buena revisión de la parada óptima en una búsqueda de empleo.
El contexto se puede encontrar en Rogerson, Shimer y Wright, Modelos teóricos de búsqueda del trabajo
Mercado .
no estará por encima de su umbral ahora: como dice una encuesta sobre el problema de la búsqueda de empleo: "Suponga
ofertas rechazadas anteriormente no se pueden retirar, aunque en realidad esto no es restrictivo porque el
el problema es estacionario, por lo que una oferta que no es aceptable hoy no será aceptable mañana "
(ibídem.).
"Estacionamiento para la facultad": Clark Kerr, como se cita en "Educación: Vista desde el puente" , Time ,
17 de noviembre de 1958.
“Plan sobre el tráfico esperado”: Donald Shoup, correspondencia personal, junio de 2013.
implementado en el centro de San Francisco: Más información sobre el sistema SFpark desarrollado por
SFMTA, y sus precios dinámicos inspirados en Shoup, se pueden encontrar en http://sfpark.org/how-it-
obras / precios / . (El propio Shoup está involucrado en un papel de asesor). Este programa comenzó a tener efecto en
2011, y es el primer proyecto de este tipo en el mundo. Para un análisis reciente de los efectos de la
programa, consulte Millard-Ball, Weinberger y Hampshire, "Is the Curb 80% Full or 20% Empty?"
cuando la ocupación pasa del 90% al 95%: Donald Shoup, entrevista personal, 7 de junio de 2013. Para ser
Precisamente, el aumento del 90% al 95% de ocupación refleja un aumento del 5,555… por ciento.
Suponga que está en un camino infinitamente largo: el problema básico de estacionamiento, como se formula aquí, era
presentado como un problema en DeGroot, Optimal Statistical Decisions . La solución es tomar la primera
lugar vacío a menos de −log 2 / log (1− p ) lugares desde el destino, donde p es la probabilidad de cualquier
dado que el espacio está disponible.
no es necesario que empieces a buscar seriamente: Capítulo 17 de El alto costo del estacionamiento gratuito de Shoup
analiza la estrategia óptima de estacionamiento en la vía cuando el precio crea un promedio de un espacio libre por
bloque, que, como señala Shoup, "depende del conflicto entre la codicia y la pereza" (personal
correspondencia). La cuestión de si "navegar" por lugares baratos en la calle o pagar por servicios privados
los espacios de estacionamiento se tratan en el capítulo 13 de Shoup.
una variedad de ajustes a este escenario básico: Tamaki, "Enfoque adaptativo a algunas paradas
Problemas ”, permitía que la probabilidad de que un lugar estuviera disponible variara según la ubicación y se considerara
cómo se pueden estimar estas probabilidades sobre la marcha. Tamaki, "Parada óptima en el estacionamiento
Problema con los cambios de sentido ”, agregó la posibilidad de cambios de sentido. Tamaki, "Un problema de estacionamiento óptimo",
considerado una extensión del modelo de DeGroot donde no se supone que las oportunidades de estacionamiento sean un
conjunto discreto de manchas. Sakaguchi y Tamaki, "Sobre el problema de estacionamiento óptimo en qué espacios
Aparece aleatoriamente ”, utilizó esta formulación continua y permitió que se desconociera el destino.
MacQueen y Miller, "Políticas de persistencia óptima", consideró de forma independiente una
versión del problema que permite rodear el bloque.
“Voy en bicicleta”: Donald Shoup, entrevista personal, 7 de junio de 2013.
La revista Forbes identificó a Boris Berezovsky: Forbes , “World's Billionaires”, 28 de julio de 1997, p.
174.
uno de una nueva clase de oligarcas: Paul Klebnikov, "The Rise of an Oligarch" , Forbes , 9 de septiembre de
2000.
Página 344
“Golpear una sola vez, pero en la cabeza”: Vladimir Putin, entrevista con el diario francés Le
Figaro , 26 de octubre de 2000.
libro enteramente dedicado al problema de la secretaria: Berezovsky y Gnedin, Problemas de la mejor elección .
analizado bajo varias formas diferentes: Hay varias formas de abordar el problema de la
dejar de fumar cuando está por delante. El primero es maximizar la duración de una secuencia de victorias. Asume que eres
lanzar una moneda que tenga una probabilidad p de salir cara. Pagas c dólares por cada oportunidad de voltear
la moneda, y obtienes $ 1.00 cuando sale cara, pero pierdes todas tus ganancias acumuladas cuando
sale colas. ¿Cuándo debería dejar de lanzar la moneda? La respuesta, como lo muestra Norman Starr en
1972, es detenerse después de r caras, donde r es el número más pequeño tal que p r +1 ≤ c . Entonces, si es un regular
moneda con p = 1/2, y cuesta $ 0.10 lanzar la moneda, debe detenerse tan pronto como obtenga cuatro caras
una fila. El análisis de corridas de cabezas aparece en Starr, "Cómo ganar una guerra si es necesario", donde se encuentra
presentado como un modelo para ganar una guerra de desgaste. Un análisis más completo se presenta en
Ferguson, "Detener una suma durante una ejecución exitosa".
Maximizar la duración de una racha de cabezas es una analogía bastante buena para algunos tipos de negocios.
situaciones: para una secuencia de acuerdos que cuestan c para establecer, tienen una probabilidad p de funcionar y pagan
d en el éxito, pero aniquila sus ganancias en el fracaso, debe dejar de fumar después de ganar r dólares de tal manera que
p r / d +1 ≤ c / d . Traficantes de drogas ambiciosos, tomen nota.
En el problema de los ladrones discutido en el texto, suponga la cantidad promedio ganada de cada
robo es my la probabilidad de salirse con la suya es q . Pero si atrapan al ladrón,
lo que sucede con probabilidad 1 - q , lo pierde todo. La solución: dejar de fumar cuando el acumulado
las ganancias son mayores o iguales que mq / (1 - q ). El problema de los ladrones aparece en Haggstrom, "Optimal
Procedimientos secuenciales cuando se requiere más de una parada ”, como parte de un problema más complejo
en el que el ladrón también está tratando de decidir a qué ciudad mudarse.
encontrado por un guardaespaldas: ver, por ejemplo, "Boris Berezovsky 'Encontrado con una ligadura alrededor del cuello'",
BBC News , 28 de marzo de 2013, http://www.bbc.com/news/uk-21963080 .
conclusión oficial de un examen post mortem: ver, por ejemplo, Reuters, “Berezovsky Death
Consistent with Hanging: Police ”, 25 de marzo de 2013, http://www.reuters.com/article/2013/03/25/us-
gran bretaña-rusia-berezovsky-postmortem-idUSBRE92O12320130325 .
"Berezovsky no se daría por vencido": Hoffman, The Oligarchs , p. 128.

no es ninguna regla de parada óptima: Una condición para una parada óptima regla de existir es que la
La recompensa promedio por detenerse en el mejor punto posible sea finita (ver Ferguson, Parada óptima y
Aplicaciones ). El juego de "triple o nada" viola esta condición, si sale cara k veces
seguido de una cola, el mejor jugador posible obtiene 3 k - 1 como recompensa, deteniéndose justo antes de esa cola.
La probabilidad de esto es 1/2 k +1 . Por tanto, el promedio sobre k es infinito.
Si está pensando que esto podría resolverse asumiendo que las personas valoran menos el dinero cuanto más
que tienen, que triplicar la recompensa monetaria puede no triplicar la utilidad que la gente asigna a ese
dinero, entonces hay una solución simple: todavía obtienes un juego sin una regla de detención óptima, solo
ofreciendo recompensas que triplican su utilidad. Por ejemplo, si la utilidad que asigna al dinero
aumenta como una función logarítmica de la cantidad de dinero, entonces el juego se convierte en "cubo o
nada ”: la cantidad de dinero que podría recibir en la próxima apuesta se eleva a la potencia de tres
cada vez que ganes.
Página 345
Curiosamente, si bien no existe una regla de detención óptima para "triple o nada",
la fortuna siempre está en juego, no obstante, existen buenas estrategias para jugar juegos como este cuando
puede elegir la cantidad de su bankroll para apostar. El llamado esquema de apuestas de Kelly, que lleva el nombre de J.
L. Kelly Jr. y descrito por primera vez en Kelly, "Una nueva interpretación de la tasa de información", es un ejemplo.
En este esquema, un jugador puede maximizar su tasa de rendimiento apostando una proporción de ( p ( b +1) −1) ⁄ b de su
bankroll en cada una de una secuencia de apuestas que pagan b + 1 veces la apuesta original con probabilidad p .
Para nuestro juego de triple o nada, b = 2 yp = 0 . 5, por lo que deberíamos apostar una cuarta parte de nuestro bankroll cada
tiempo, no todo, lo que inevitablemente conduce a la quiebra. Una historia accesible de Kelly
las apuestas aparecen en Poundstone, la fórmula de Fortune .
"Pasar por este mundo una sola vez": La procedencia de esta cita no es completamente segura, aunque
se ha citado como un dicho cuáquero desde la segunda mitad del siglo XIX, y parece
se han atribuido a Grellet desde al menos 1893. Para obtener más información, consulte W. Gurney Benham, Benham's Book
de Citas, Proverbios y Palabras Domésticas , 1907.
“Pase la tarde”: Dillard, Pilgrim en Tinker Creek .
sigue más de cerca el clásico problema de la secretaria: Seale y Rapoport, “Sequential Decision
Haciendo con rangos relativos ".
saltó antes de lo debido: Ibid. El lugar típico donde la gente pasa de mirar a
el salto fue de 13 solicitantes de 40 y 21 de 80, o 32% y 26%, respectivamente.
“Por naturaleza soy muy impaciente”: Amnon Rapoport, entrevista personal, 11 de junio de 2013.
Seale y Rapoport mostraron: Seale y Rapoport, “Toma de decisiones secuencial con relación
Rangos ".
"No es irracional aburrirse": Neil Bearden, correspondencia personal, 26 de junio de 2013. Véase también
Bearden, "Un nuevo problema de secretaria".
convierte toda la toma de decisiones en una parada óptima: este tipo de argumento fue realizado por primera vez por Herbert
Simon, y fue una de las contribuciones por las que recibió el Premio Nobel. Simon comenzó su
notable carrera como politólogo, escribiendo una disertación sobre el tema quizás poco prometedor de
comportamiento administrativo. Mientras investigaba el problema de comprender cómo se componían las organizaciones
de personas reales que toman decisiones, experimentó una creciente insatisfacción con los modelos abstractos de
toma de decisiones ofrecida por la economía matemática: modelos que se alinean con la intuición de que
la acción racional requiere una consideración exhaustiva de nuestras opciones.
La investigación de Simon sobre cómo se toman realmente las decisiones en las organizaciones le dejó en claro
que estas suposiciones eran incorrectas. Se necesitaba una alternativa. Como lo expresó en "A Behavioural
Model of Rational Choice ”,“ la tarea es reemplazar la racionalidad global del hombre económico con una especie de
de comportamiento racional que sea compatible con el acceso a la información y la computación
capacidades que realmente poseen los organismos, incluido el hombre, en los tipos de entornos en
que existen tales organismos ".
El tipo de solución que Simon propuso como una explicación más realista de la elección humana: lo que él
denominado "satisfactorio": utiliza la experiencia para establecer un umbral para una satisfacción satisfactoria, "suficientemente buena"
resultado, luego toma la primera opción para exceder ese umbral. Este algoritmo tiene el mismo carácter que
las soluciones a los problemas de parada óptimos que hemos considerado aquí, donde el umbral es
determinado por dedicar algún tiempo a tener una idea de la gama de opciones (como en el secretario
problema) o basado en conocer la probabilidad de diferentes resultados. De hecho, uno de los ejemplos
Página 346
Simon usó en su argumento fue el de vender una casa, con un tipo de solución similar a eso.
presentado aquí.
el libro de texto definitivo sobre parada óptima: eso es Ferguson, parada óptima y aplicaciones .
2. EXPLORAR / EXPLOTAR
"Haz nuevos amigos": Joseph Parry, "Nuevos amigos y viejos amigos", en Los mejores poemas amados de la
Pueblo americano , ed. Hazel Felleman (Garden City, NY: Doubleday, 1936), pág. 58.
"La vida tan rica y rara": Helen Steiner Rice, "El jardín de la amistad", en Los poemas y las oraciones
de Helen Steiner Rice , ed. Virginia J. Ruehlmann (Grand Rapids, MI: Fleming H. Revell), 47 años.
“Intentas encontrar espacios”: Scott Plagenhoef, entrevista personal, 5 de septiembre de 2013.
El nombre extraño proviene de: En una carta a Merrill Flood fechada el 14 de abril de 1955 (disponible en el
Merrill Flood en la Universidad de Michigan), Frederick Mosteller cuenta la historia del origen
del nombre. Mosteller y su colaborador Robert Bush estaban trabajando en modelos matemáticos de
aprendizaje: uno de los primeros casos de lo que se conoció como psicología matemática,
informando la investigación que Tom hace hoy. Estaban particularmente interesados en una serie de
experimentos que se habían hecho con un laberinto en forma de T, donde los animales se colocan en el laberinto en el
parte inferior de la T y luego tienes que decidir si ir hacia la izquierda o hacia la derecha. La comida, la recompensa, puede o puede
no aparecer en ninguno de los lados del laberinto. Para explorar este comportamiento con los humanos, encargaron un
máquina con dos palancas que la gente podía tirar, que Mosteller apodó el bandido de dos brazos. Él
luego presentó la forma matemática del problema a sus colegas, y finalmente se convirtió en
generalizado al bandido de múltiples brazos.
En Berry y Fristed, Bandit aparece una introducción completa a los bandidos con varios brazos.
Problemas . Nuestro enfoque en este capítulo está en los bandidos donde cada brazo produce una recompensa o no,
con diferentes probabilidades pero la misma cantidad de pago en todas las armas. Esto se conoce como Bernoulli
bandido en la literatura, ya que la distribución de probabilidad que describe un lanzamiento de moneda se llama Bernoulli
distribución (según el matemático suizo del siglo XVII Jacob Bernoulli). Otros tipos de
Los bandidos con múltiples brazos también son posibles, con distribuciones desconocidas de diferentes tipos que caracterizan
las recompensas de cada brazo.
qué tan buena podría ser la segunda máquina: la estrategia "miope" de tirar del brazo con
El valor esperado más alto es realmente óptimo en algunos casos. Bradt, Johnson y Karlin, "On Sequential
Diseños para maximizar la suma de N observaciones ”, mostró que si las probabilidades de una recompensa por
un bandido de dos brazos (con p 1 para un brazo, p 2 para el otro) satisface p 1 + p 2 = 1, entonces esta estrategia es
óptimo. Conjeturaron que esto también es válido para pares de probabilidades donde ( p 1 , p 2 ) o bien toman
los valores ( a, b ) o ( b, a ) (es decir, si p 1 es a , entonces p 2 es b , y viceversa). Esto fue demostrado por
Feldman, "Contribuciones al problema del 'bandido de dos brazos'". Berry y Fristed, Bandit Problems ,
tiene más detalles sobre las estrategias miopes, incluido un resultado que muestra que elegir el más alto
El valor esperado es óptimo cuando p 1 y p 2 están restringidos para tomar solo dos valores posibles (por ejemplo,
cualquiera o ambos de p 1 o p 2 podrían ser 0.4 o 0.7, pero no sabemos cuál de estas posibilidades es verdadera).
“Encarna en forma esencial”: Whittle, Optimización en el tiempo .
"Come, bebe y diviértete": "Come, bebe y diviértete, porque mañana moriremos", un modismo en común
lenguaje y en la cultura pop (p. ej., formar el coro de "Tripping Billies" de Dave Matthews
Band, entre muchas otras referencias), parece ser una combinación de dos versículos bíblicos: Eclesiastés
Página 347
8:15 (“No hay mejor cosa debajo del sol que el hombre que comer, beber y divertirse”) y
Isaías 22:13 (“Comamos y bebamos, que mañana moriremos”).
“¿Por qué correr el riesgo?”: Chris Stucchio, entrevista personal, 15 de agosto de 2013.
"Una sexta ración de X-Men": Nick Allen, "Hollywood hace de 2013 el año de la secuela"
http://www.telegraph.co.uk/culture/film/film-news/9770154/Hollywood-makes-2013-the-year-of-the-
sequel.html . Consulte también http://www.shortoftheweek.com/2012/01/05/has-hollywood-lost-its-way/ y
http://boxofficemojo.com/news/?id=3063 .
Los beneficios de los estudios cinematográficos más grandes disminuyeron: "Entre 2007 y 2011, los beneficios antes de impuestos de los cinco
estudios controlados por grandes conglomerados de medios (Disney, Universal, Paramount, Twentieth Century
Fox y Warner Bros) cayeron alrededor del 40%, dice Benjamin Swinburne de Morgan Stanley ”. En
“Hollywood: Split Screens” , Economist , 23 de febrero de 2013,
http://www.economist.com/news/business/21572218-tale-two-tinseltowns-split-screens.
la venta de entradas ha disminuido: estadísticas de http://pro.boxoffice.com/statistics/yearly y

http://www.the-numbers.com/market/ . Véase también Max Willens, “Venta de entradas en taquilla 2014:
Los ingresos se desploman a su nivel más bajo en tres años ”, International Business Times , 5 de enero de 2015.
"Squeezed between aumento de costos": "Hollywood: Split Screens" , Economist , 23 de febrero de 2013,
http://www.economist.com/news/business/21572218-tale-two-tinseltowns-split-screens.
"El último instrumento de sabotaje intelectual": el comentario de Whittle sobre la dificultad del bandido
problemas aparece en su discusión de Gittins, "Bandit Processes and Dynamic Allocation Indices".
Robbins demostró en 1952: Robbins, "Algunos aspectos del diseño secuencial de experimentos"
introduce el algoritmo Win-Stay, Lose-Shift.
Siguiendo a Robbins, una serie de artículos: Bradt, Johnson y Karlin, "On Sequential Designs for
Maximizar la suma de N observaciones ", mostró que" permanecer en un ganador "siempre es cierto cuando el
La probabilidad de una recompensa es desconocida para un brazo, pero conocida para el otro. Berry, “A Bernoulli Two-
Bandido armado ”, demostró que el principio siempre es cierto para un bandido de dos brazos. Generalizaciones de
este resultado (y una caracterización de los casos en los que no aplica) aparece en Berry y Fristed,
Problemas de bandidos .
exactamente cuántas opciones y oportunidades: esta solución a la versión de "horizonte finito" de la

El problema de los bandidos con múltiples brazos se presenta en la obra maestra de Bellman Dynamic Programming , un libro
que es impresionante como punto de partida (y a veces punto final) de una serie de temas en
optimización y aprendizaje automático. Entre otros usos, la programación dinámica puede resolver eficientemente
problemas que requieren inducción hacia atrás, que también encontramos brevemente en el capítulo 1 de la
contexto del juego de información completa.
“Un sinónimo de intransigencia”: Introducción a Gittins, “Procesos de bandidos y asignación dinámica

Índices."
“Sería una aproximación bastante buena”: John Gittins, entrevista personal, 27 de agosto de 2013.
Deal or No Deal : las muchas encarnaciones mundiales de este programa de juegos comenzaron con el programa holandés
Miljoenenjacht , que se emitió por primera vez en 2000.
El problema de los bandidos armados múltiples no es diferente: los investigadores anteriores también habían encontrado soluciones para
este problema de "bandido con un solo brazo" durante un intervalo fijo (Bellman, "A Problem in the Sequential
Página 348
Diseño de experimentos"; Bradt, Johnson y Karlin, "Sobre diseños secuenciales para maximizar la
Suma de N observaciones ”).
maximizar una sola cantidad que represente ambos: las ideas detrás del índice de Gittins fueron las primeras
presentado en una conferencia en 1972 y apareció en las actas como Gittins y Jones, "A Dynamic
Índice de asignación para el diseño secuencial de experimentos ", pero la presentación canónica es Gittins,
"Procesos de bandidos e índices de asignación dinámica".
proporcionamos los valores del índice de Gittins: La tabla de puntuaciones del índice de Gittins para el bandido de Bernoulli fue
tomado de Gittins, Glazebrook y Weber, índices de asignación de bandidos de armas múltiples , que es un
guía completa del tema. Supone una total ignorancia sobre la probabilidad de una recompensa.
nos impulsa hacia la novedad: Tomando esto como un resultado extremas en una estrategia simple llamado el Menor
Regla de fallas : elija siempre la opción que haya fallado la menor cantidad de veces. Entonces, aterrizando en un
nueva ciudad, elija un restaurante al azar. Si es bueno, quédate con él. Tan pronto como no satisfaga, elija
al azar de los otros restaurantes. Continúe este proceso hasta que todos los restaurantes no hayan podido satisfacer
una vez, luego regrese al restaurante con más noches de cenas exitosas y repita. Esta
La estrategia se basa en el principio de ganar-quedarse, y es precisamente lo que produce el índice de Gittins si eres el
tipo paciente que valora la recompensa de mañana como esencialmente tan buena como la de hoy. (La regla aparece
en Kelly, “Bandidos de armas múltiples con factor de descuento cercano a uno”; formalmente, es óptimo bajo
descuento geométrico en el límite a medida que la tasa de descuento se acerca a 1.) En una gran ciudad con muchos nuevos
restaurantes que abren todo el tiempo, una política de mínimos fallos dice simplemente que si alguna vez se le permite
abajo, hay mucho más por ahí; no regreses.
una variedad de experimentos en economía del comportamiento: ver, por ejemplo, Kirby, "Bidding on the
Futuro."
si hay un costo por cambiar: este caso se analiza en Banks y Sundaram, "Costos de cambio y
el índice de Gittins ".
“Lamenta, he tenido algunos”: Frank Sinatra, “My Way”, de My Way (1969), letra de Paul Anka.
"En lo que a mí respecta, soy optimista": discurso del primer ministro Winston Churchill, banquete del alcalde,
Londres, 9 de noviembre de 1954. Impreso en Churchill, Winston S. Churchill: His Complete Speeches .
“Probar y fallar es al menos aprender”: Barnard, Las funciones del ejecutivo .
“Quería proyectarme hacia los 80 años”: Jeff Bezos, entrevista con la Academia de
Logro, 4 de mayo de 2001, http://www.achievement.org/autodoc/page/bez0int-3.
varios puntos clave sobre el arrepentimiento: Lai y Robbins, “Asymptotically Efficient Adaptive Allocation
Normas."
la garantía de un arrepentimiento mínimo: Ibid. ofreció los primeros algoritmos de este tipo, que fueron refinados por
Katehakis y Robbins, "Elección secuencial de varias poblaciones"; Agrawal, "Media de la muestra
Políticas basadas en índices ”; y Auer, Cesa-Bianchi y Fischer, “Finite-Time Analysis of the
Problema del bandido multiarmado ”, entre otros. Este último presenta quizás la estrategia más simple de este
tipo, que consiste en asignar al brazo j una puntuación de , donde s j es el número de éxitos de
n j juega en ese brazo, y n = Σ j n j es el número total de jugadas de todos los brazos. Este es un límite superior en
la probabilidad de una recompensa exitosa (que es solo s j / n j ). Elegir el brazo con la puntuación más alta
Página 349
garantiza arrepentimiento logarítmico (aunque hay ajustes en esta puntuación que dan como resultado un mejor rendimiento
en la práctica).
conocido como el "intervalo de confianza": los intervalos de confianza se originan con Neyman, "Esquema de un
Teoría de la estimación estadística ”.
"Optimismo frente a la incertidumbre": Kaelbling, Littman y Moore, "Reinforcement Learning".
"Robots optimistas": Leslie Kaelbling, entrevista personal, 22 de noviembre de 2013. Véase Kaelbling,
Aprendizaje en sistemas embebidos .
$ 57 millones en donaciones adicionales: Siroker y Koomen, A / B Testing .
Las pruebas A / B funcionan de la siguiente manera: Christian, "The A / B Test". También informado por Steve Hanov, personal
entrevista, 30 de agosto de 2013, y Noel Welsh, entrevista personal, 27 de agosto de 2013.
En el caso de la página de donaciones de Obama: Dan Siroker, "Cómo usamos los datos para ganar la presidencia
Election ”(conferencia), Universidad de Stanford, 8 de mayo de 2009, disponible en https://www.youtube.com/watch?
v = 71bH8z6iqSc . Véase también, Siroker, "How Obama Raised $ 60 Million",
https://blog.optimizely.com/2010/11/29/how-obama-raised-60-million-by-running-a-simple-
experimento / .
pruebas A / B en vivo de sus usuarios: la primera prueba A / B de Google se ejecutó el 27 de febrero de 2000. Consulte, por ejemplo,
Christian, "La prueba A / B".
Las empresas A / B prueba su sitio de navegación: Véase, por ejemplo, Siroker y Koomen, las pruebas A / B .
probó cuarenta y un tonos de azul: Laura M. Holson, "Poner una cara más atrevida en Google", Nueva York
Times , 28 de febrero de 2009.
"Cómo hacer que las personas hagan clic en los anuncios": Ashlee Vance, "Esta burbuja tecnológica es diferente", Bloomberg
Businessweek , 14 de abril de 2011.
http://www.bloomberg.com/bw/magazine/content/11_17/b4225060960537.htm .
"Destruido por la locura": Ginsberg, Howl y otros poemas .

$ 50 mil millones en ingresos anuales: las finanzas de Google se detallan en sus informes trimestrales de accionistas.
Los ingresos por publicidad reportados en 2013 fueron de $ 50.6 mil millones, aproximadamente el 91% de los ingresos totales de $ 55.6 mil millones.
Ver https://investor.google.com/financial/2013/tables.html.
El comercio en línea comprende cientos de miles de millones: Ventas en línea estimadas por Forrester Research.
Consulte, por ejemplo, “Las ventas minoristas en línea de EE. UU. Alcanzarán los $ 370 mil millones para 2017; 191.000 millones de euros en Europa ”
14/3/2013, http://www.forbes.com/sites/forrester/2013/03/14/us-online-retail-sales-to-reach-370b-by-
2017-e191b-en-europa / .
Los mejores algoritmos para usar siguen siendo muy controvertidos: Chris Stucchio, por ejemplo, escribió un recorte
artículo titulado "Por qué los algoritmos Bandit de brazos múltiples son superiores a las pruebas A / B", que luego se
contrarrestado por un artículo igualmente cortante llamado "No use algoritmos de bandidos; probablemente no
Trabaja para ti ”, también escrito por Chris Stucchio. Ver
https://www.chrisstucchio.com/blog/2012/bandit_algorithms_vs_ab.html y
https://www.chrisstucchio.com/blog/2015/dont_use_bandits.html. La publicación de Stucchio de 2012 fue escrita
en parte en referencia a un artículo de Paras Chopra titulado "¿Por qué el algoritmo de bandidos de brazos múltiples no es
'Mejor' que las pruebas A / B ”(https://vwo.com/blog/multi-armed-bandit-algorithm/ ), que era en sí mismo
Página 350
escrito en parte en referencia a un artículo de Steve Hanov titulado “20 líneas de código que superarán a A / B
probando cada vez ”( http://stevehanov.ca/blog/index.php?id=132).
apareció en el Washington Star : Jean Heller, "Los pacientes con sífilis murieron sin tratamiento", Washington
Star , 25 de julio de 1972.
documento conocido como Informe Belmont: Informe Belmont: Principios y directrices éticas
para la protección de sujetos humanos de investigación , 18 de abril de 1979. Disponible en
http://www.hhs.gov/ohrp/humansubjects/guidance/belmont.html.
propuso realizar pruebas "adaptativas": consulte Zelen, "Juegue la regla del ganador y el control
Ensayo clínico." Si bien esta fue una idea radical, Zelen no fue el primero en proponerla. Ese honor es para
William R. Thompson, instructor de la Escuela de Patología de Yale, quien formuló el problema
de identificar si un tratamiento es más efectivo que otro, y propuso su propia solución,
en 1933 (Thompson, "Sobre la probabilidad de que una probabilidad desconocida supere a otra").
La solución que propuso Thompson: opciones de muestreo aleatorio, donde la probabilidad de
La elección de una opción corresponde a la probabilidad de que sea la mejor basada en la evidencia observada, por lo que
hasta ahora, es la base de gran parte del trabajo reciente sobre este problema en el aprendizaje automático (volvemos a la
usos algorítmicos de la aleatoriedad y el muestreo en el capítulo 9).
Ni Frederick Mosteller ni Herbert Robbins parecían estar al tanto del trabajo de Thompson cuando
empezaron a trabajar en el problema de los bandidos de dos brazos. Richard Bellman encontró el "poco conocido
documentos "unos años más tarde, y señaló que" Confesamos que encontramos estos documentos de la manera estándar,
es decir, mientras hojea un diario que contiene otro artículo de interés "(Bellman," A
Problema en el diseño secuencial de experimentos ”).
ECMO salvó la vida de una niña recién nacida: Departamento de Cirugía de la Universidad de Michigan, “'Hope'
para bebés ECMO " http://surgery.med.umich.edu/giving/stories/ecmo.shtml .
ahora ha celebrado su cuadragésimo cumpleaños: University of Michigan Health System, “UM Health
El equipo de System ECMO trata a su paciente número 2.000 ”, 1 de marzo de 2011,
http://www.uofmhealth.org/news/ECMO%202000th%20patient.
estudios iniciales en adultos: Zapol et al., “Oxigenación de membrana extracorpórea en casos graves agudos
Insuficiencia respiratoria."
un estudio en recién nacidos: Bartlett et al., "Circulación extracorpórea en insuficiencia respiratoria neonatal".
"No justificó el uso rutinario de ECMO": Cita de Ware, "Investigating Therapies of

Potencialmente gran beneficio: ECMO ”, refiriéndose a las conclusiones de Ware y Epstein,“ Comentarios sobre
'Circulación extracorpórea en insuficiencia respiratoria neonatal' ”, que a su vez es un comentario sobre Bartlett
et al., "Circulación extracorpórea en insuficiencia respiratoria neonatal".
“Difícil de defender éticamente una mayor aleatorización”: Ware, “Investigating Therapies of

Potencialmente gran beneficio: ECMO ".
uno de los principales expertos del mundo: fue Berry, en su tesis doctoral de 1971, quien demostró que
permanecer en un ganador es óptimo. El resultado se publicó como Berry, "A Bernoulli Two-Armed Bandit".
É
"El estudio de Ware no debería haberse realizado": Berry, "Comentario: Ética y ECMO".
casi doscientos bebés en el Reino Unido: UK Collaborative ECMO Group, “The
Ensayo colaborativo de ECMO en el Reino Unido ".
Página 351
ensayos clínicos para una variedad de tratamientos contra el cáncer: Don Berry, entrevista personal, 22 de agosto de 2013.
la FDA publicó un documento de "orientación": "Ensayos clínicos de diseño adaptativo para medicamentos" de la FDA
and Biologics ”de febrero de 2010 se puede encontrar en
http://www.fda.gov/downloads/Drugs/Guidances/ucm201790.pdf .
se muestra un cuadro con dos luces en él: El estudio aparece en Tversky y Edwards, "Información versus
Recompensa en opciones binarias ".
dos aerolíneas: Meyer y Shi, "Sequential Choice Under Ambiguity".
un experimento con un bandido de cuatro brazos: Steyvers, Lee y Wagenmakers, "A Bayesian Analysis
de la toma de decisiones humanas sobre los problemas de los bandidos ".
lo que se ha denominado un "bandido inquieto": los bandidos inquietos fueron presentados por Whittle, "Restless
Bandits ”, que analiza una estrategia similar al índice de Gittins que se puede utilizar en algunos casos. los
desafíos computacionales planteados por bandidos inquietos, y el consiguiente pesimismo sobre la eficiencia
soluciones óptimas — se discuten en Papadimitriou y Tsitsiklis, “La complejidad de las soluciones óptimas
Control de red en cola ".
cuando el mundo puede cambiar: Navarro y Newell, “Información versus recompensa en un cambio
World ”, proporciona resultados recientes que respaldan la idea de que la sobreexploración humana es el resultado de
asumiendo que el mundo está inquieto.
"De hecho, hay una especie de armonía": Thoreau, "Walking".
“Una Coca-Cola es una Coca-Cola”: Warhol, La filosofía de Andy Warhol .
"Una forma de desarrollo de resolver la compensación de exploración / explotación": Alison Gopnik, personal
entrevista, 22 de agosto de 2013. Véase también Gopnik, The Scientist in the Crib .
"Una coyuntura en mi vida lectora": Lydia Davis, "Alguien que lee un libro", No puede y no quiere:
Historias .
desafiando nuestras ideas preconcebidas sobre el envejecimiento: Carstensen, “Social and Emotional Patterns in
La edad adulta ”presenta la“ teoría de la selectividad socioemocional ”básica que discutimos en esta sección, también
como parte de la evidencia para ello.
“Procesos de selección a lo largo de la vida”: Ibid.
a punto de mudarse por todo el país: Fredrickson y Carstensen, "Choosing Social Partners".
sus preferencias se volvieron indistinguibles: Fung, Carstensen y Lutz, "Influence of Time on

Preferencias sociales ".
Las personas mayores generalmente están más satisfechas: Evidencia de mejoras en el bienestar emocional con
sobre el envejecimiento se analizan en Charles y Carstensen, "Envejecimiento social y emocional".
3. CLASIFICACIÓN
“Nowe if the word”: Cawdrey, A Table Alphabeticall , es el primer diccionario monolingüe de inglés.
Para obtener más información sobre la historia de la clasificación frente a la búsqueda, consulte Knuth, The Art of Computer
Programación , §6.2.1. Para obtener más información sobre la invención del orden alfabético, consulte Daly, Contribuciones a un
Historia de la alfabetización .
El compañero de cuarto sacó un calcetín: Hillis, The Pattern on the Stone .
Página 352
publicado en el sitio web de programación Stack Overflow: "¿Emparejar calcetines de una pila de manera eficiente?"
Enviado por el usuario "amit" a Stack Overflow el 19 de enero de 2013,
http://stackoverflow.com/questions/14415881/pair-socks-from-a-pile-efficiently.
Como escribe "amit" (nombre real Amit Gross, un estudiante de posgrado en el Technion): "Ayer estuve
emparejando los calcetines de la ropa limpia, y descubrí que la forma en que lo estaba haciendo no es muy eficiente. I
estaba haciendo una búsqueda ingenua, eligiendo un calcetín y 'iterando' la pila para encontrar su par. Esta
requiere iterar sobre n / 2 x n / 4 = n 2 /8 calcetines en promedio. Como científico de la computación, estaba pensando en lo que
¿Yo podría hacer?"
La pregunta de Amit generó una serie de respuestas, pero la que recibió más apoyo de
sus compañeros programadores iban a hacer un Radix Sort: identificar las dimensiones a lo largo de las cuales varían los calcetines
(por ejemplo, color, patrón) y clasificarlos en montones en cada una de estas dimensiones. Cada tipo requiere solo uno
pasa por todos los calcetines, y el resultado es un conjunto de montones más pequeños. Incluso si tienes que pasar por todo
los calcetines en esas pilas para encontrar fósforos, la cantidad de tiempo que esto toma es proporcional al cuadrado de
el tamaño de la pila más grande en lugar del cuadrado del número total de calcetines. (Vea la nota al final a continuación
sobre cómo clasificar una baraja de cartas para obtener más información sobre Radix Sort).
Pero si la razón por la que estamos emparejando calcetines es para que sea más fácil encontrar un par de calcetines cuando lo necesitemos
ellos, podemos reducir la necesidad de ordenar mediante la adopción de un mejor procedimiento de búsqueda.
Digamos que sus calcetines difieren en una sola dimensión, el color, y tiene tres colores diferentes.
de calcetines sueltos, sin emparejar en su cajón de calcetines. Entonces tiene la garantía de encontrar un par coincidente si
saca cuatro calcetines del cajón al azar. (Para ver por qué, imagine el peor de los casos: cada uno de
los tres primeros calcetines que se han sacado son de un color diferente. Cuando vuelves por un cuarto,
tiene que coincidir con uno de los tres que ya ha sacado.) No importa cuántos colores tenga,
sacar un calcetín más que el número de colores siempre te garantiza un par a juego. Así que no
molestarse en emparejarlos si está dispuesto a que su mañana corra un poco más lento.
Esta elegante solución al problema de emparejar calcetines es cortesía del Principio de Pigeonhole, un
idea matemática simple pero poderosa atribuida al matemático alemán del siglo XIX
Peter Gustave Lejeune Dirichlet. (Rittaud y Heeffer, "The Pigeonhole Principle", traza la historia
del principio del casillero, incluyendo a Dirichlet, así como lo que parecen ser referencias incluso anteriores).
La idea es simple: si un grupo de palomas aterriza en un conjunto de nidos y hay más palomas
que los agujeros, al menos un agujero debe contener más de una paloma. En informática, el
El principio de casillero se utiliza para establecer hechos básicos sobre las propiedades teóricas de los algoritmos.
Por ejemplo, es imposible hacer un algoritmo que comprima cualquier archivo posible sin pérdida
de información, porque hay más archivos largos que cortos.
La aplicación del principio del casillero sugiere una solución permanente al problema del emparejamiento de calcetines:
solo compre un tipo de calcetín. Si todos tus calcetines son iguales, nunca necesitas emparejarlos, porque
Siempre puedes conseguir un par sacando dos calcetines del cajón. Para muchos informáticos (incluidos
algunos de los programadores que respondieron a la pregunta de Amit) este es el enfoque más elegante:
redefiniendo el problema para que pueda resolverse de manera eficiente.
Sin embargo, una última advertencia: cuando compre ese tipo de calcetín, tenga cuidado con el
calcetines que compras. La razón por la que Ron Rivest tiene problemas particulares con los calcetines es que usa calcetines
que son diferentes para el pie derecho e izquierdo. Esto frustra el principio del casillero: garantizar una coincidencia
con calcetines como ese, tendrá que sacar un calcetín más que el número total de pares.
“¡Los calcetines me confunden!”: Ronald Rivest, entrevista personal, 25 de julio de 2013.
"Vuélvete ciego y loco": Martin, "Contando una nación por la electricidad".
Página 353
“Infaliblemente como los molinos de los dioses”: Ibid.
“Nadie lo usará más que los gobiernos”: Citado en austriaco, Herman Hollerith .
La firma de Hollerith se fusionó con varias otras: austriaca, Herman Hollerith .
primer código escrito para una computadora con "programa almacenado": "Escrito", aquí, significa literalmente escrito
a mano: cuando el renombrado matemático John von Neumann anotó el programa de clasificación
en 1945, la computadora para la que estaba destinada aún estaba a varios años de completarse. A pesar de que
Los programas informáticos en general se remontan a los escritos de Ada Lovelace en 1843 sobre la propuesta
“Analytical Engine” de Charles Babbage, el programa de von Neumann fue el primero diseñado para ser
almacenado en la memoria de la propia computadora; Las primeras máquinas informáticas estaban destinadas a ser guiadas por
tarjetas perforadas introducidas en ellos o cableadas para cálculos específicos. Véase Knuth, "Von Neumann's First
Programa de computadora."
supere las máquinas clasificadoras de tarjetas dedicadas de IBM: Ibid.
una cuarta parte de los recursos informáticos del mundo: Knuth, The Art of Computer Programming , p.
3.
"El costo unitario de clasificación, en lugar de disminuir, aumenta": Hosken, "Evaluación de los métodos de clasificación".
el récord para clasificar una baraja de cartas: si bien no pudimos encontrar un video de la actuación de Bradáč,
Hay muchos videos en línea de personas que intentan superarlo. Tienden a clasificar las cartas en cuatro palos,
y luego clasifique los números dentro de cada palo. "¡Pero hay una forma más rápida de hacer el truco!" insta Donald
Knuth en The Art of Computer Programming : Primero, reparta las cartas en 13 montones según su
valor nominal (con una pila que contiene todos los 2, la siguiente todos los 3, etc.). Entonces, después de reunir todos
las pilas, reparte las cartas en los cuatro palos. El resultado será una pila para cada palo, con las cartas.
ordenados dentro de cada uno. Este es un ordenamiento por radix y está relacionado con el algoritmo de ordenamiento de cubos que discutimos más
en el capítulo. Consulte Knuth, The Art of Computer Programming , §5.2.5.
completamente ordenados por casualidad: ordenar las cosas al azar y esperar lo mejor es
en realidad un algoritmo con un nombre: Bogosort , parte de la ciencia de la computación sólo parcialmente irónica
subcampo de "diseño de algoritmo pesimal". La pesimismo es para la optimalidad lo que el pesimismo es para el optimismo;
Los diseñadores de algoritmos pesimistas compiten para superarse entre sí por la peor computación posible.
rendimiento.
Investigando el asunto más a fondo, los diseñadores de algoritmos pesimistas han llegado a la conclusión de que Bogosort es
en realidad, demasiado delgado y eficiente. De ahí su "mejora" Bogobogosort , que comienza por
Ordenar incrementalmente los dos primeros elementos, luego los tres primeros, y así sucesivamente. Si en cualquier momento de
Cuando la lista se desordena, Bogobogosort comienza de nuevo. Entonces el algoritmo no completará una especie de
cuatro cartas, por ejemplo, hasta que lanza las dos primeras al aire, ve que han aterrizado correctamente,
luego lanza los primeros tres al aire, ve que han aterrizado correctamente, y por fin lanza los primeros cuatro
en el aire y los encuentra en el orden correcto también. Todo en una fila. De lo contrario, comienza de nuevo. Uno de los
ingenieros para escribir primero sobre los informes de Bogobogosort ejecutándolo en su computadora durante la noche y
incapaz de ordenar una lista de siete elementos, antes de que finalmente apagara la electricidad por piedad.
Los ingenieros posteriores han sugerido que Bogobogosort ni siquiera es el fondo del pozo, y
han propuesto obtener aún más meta y Bogosordenar el programa en lugar de los datos: aleatoriamente
voltear bits en la memoria de la computadora hasta que da la casualidad de que toma la forma de un programa de clasificación
que ordena los elementos. Los límites de tiempo de tal monstruosidad aún se están explorando. La búsqueda de
la pesimismo continúa.
Página 354
La informática ha desarrollado una taquigrafía: la notación Big-O se originó en el libro Die de 1894
analytische zahlentheorie de Paul Bachmann. Véase también Donald Knuth, The Art of Computer
Programación , §1.2.11.1. Formalmente, decimos que el tiempo de ejecución de un algoritmo es O ( f ( n )) si es menor que
o igual a un múltiplo (con un coeficiente que es una constante positiva) de f ( n ). También están los parientes
Notación "Big-Omega", con Ω ( f ( n )) que indica que el tiempo de ejecución es mayor o igual a un múltiplo
de f ( n ) y notación "Big-Theta", con Θ ( f ( n )) que significa que el tiempo de ejecución es tanto O ( f ( n )) como Ω ( f ( n )).
"Me tenía en Bubble Sort": este ingeniero es Dan Siroker, a quien conocimos anteriormente en el capítulo 2. Mira,
por ejemplo, "La prueba A / B: dentro de la tecnología que está cambiando las reglas del negocio" , Wired , mayo
2012.
El procesamiento de información comenzó en los censos de EE. UU .: Para obtener más detalles, consulte Knuth, The Art of
Programación de computadoras , §5.5.
para demostrar el poder de la computadora con programa almacenado: la computadora era la EDVAC
máquina, y en ese momento el programa de von Neumann se clasificó como inteligencia militar ultrasecreta.
Véase Knuth, "El primer programa informático de Von Neumann".
“Mergesort es tan importante en la historia de la clasificación”: Katajainen y Träff, “A Meticulous

Análisis de programas Mergesort ”.
Problemas de clasificación industrial a gran escala: los registros actuales para la clasificación se encuentran alojados en
http://sortbenchmark.org/ . A partir de 2014, un grupo de Samsung tiene el récord de clasificar la mayor cantidad
datos en un minuto: la friolera de 3,7 terabytes de datos. Eso es el equivalente a casi 37 mil millones jugando
tarjetas, suficientes para llenar quinientos Boeing 747 a su capacidad, poniendo el récord humano de Zdeněk Bradáč en
clasificación de tarjetas en perspectiva.
167 libros por minuto: dice el gerente de envíos Tony Miranda, "Procesaremos, creo que nuestro más alto es
—250 totes en una hora. Nuestro promedio es de aproximadamente 180 bolsas en una hora. Tenga en cuenta que cada bolso tiene
alrededor de 40 artículos dentro de él ". De "KCLS AMH Tour", 6 de noviembre de 2007,
https://www.youtube.com/watch?v=4fq3CWsyde4.
85.000 por día: "Reducir los costos operativos" , Revista American Libraries , 31 de agosto de 2010,
http://www.americanlibrariesmagazine.org/aldirect/al-direct-september-1-2010.
"Fuhgeddaboutit": vea a Matthew Taub, "Brooklyn y Manhattan vencieron al estado de Washington en el cuarto lugar
Annual 'Battle of the Book Sorters' ”, Brooklyn Brief , 29 de octubre de 2014,
http://brooklynbrief.com/4th-annual-battle-book-sorters-pits-brooklyn-washington-state/ .
lo mejor que podemos esperar lograr: un conjunto de n elementos puede tener precisamente n ! ordenaciones distintas, por lo que una especie
produce exactamente log n ! bits de información, que es aproximadamente n log n bits. ¡Recuerda que n ! es n ×
( n - 1) ×… × 2 × 1, que es el producto de n números, de los cuales n es el mayor. En consecuencia, n ! <
n n , entonces log n ! <log n n , que luego nos da log n ! < n log n . Esta aproximación de n log n para log n ! es
llamado "aproximación de Stirling", llamado así por el matemático escocés del siglo XVIII James
Stirling. Debido a que una sola comparación por pares produce como máximo un bit de información, n log n
Se necesitan comparaciones para resolver completamente nuestra incertidumbre acerca de cuál de los n ! posibles pedidos de nuestro
n cosas es la correcta. Para obtener más detalles, consulte Knuth, The Art of Computer Programming , §5.3.1.
“Lo sé por experiencia”: Jordan Ho, entrevista personal, 15 de octubre de 2013.
un documento sobre "sobrecarga de correo electrónico": Whittaker y Sidner, "Sobrecarga de correo electrónico".
Página 355
“Desperdició una parte de su vida”: Steve Whittaker, entrevista personal, 14 de noviembre de 2013.
"En un torneo de tenis sobre césped": Dodgson, "Torneos de tenis sobre césped".
una interpretación incómoda de la triple eliminación: para una crítica informática científica de la
propuesta de torneo, consulte la discusión de Donald Knuth sobre la "selección de comparación mínima" en The Art
de Programación de Computadoras , §5.3.3.
no produce un pedido completo: un algoritmo que, en lugar de clasificar todos los elementos, identifica
uno de ellos como el más grande o el segundo más grande o la mediana, etc., se conoce como algoritmo de "selección",
en lugar de un algoritmo de clasificación.
programadores para Major League Baseball: Trick trabaja como parte del Sports Scheduling Group, que
él cofundó. De 1981 a 2004, el calendario de las Grandes Ligas fue elaborado por
mano, por el notable equipo de marido y mujer de Henry y Holly Stephenson. ESPN narrado
la historia de los Stephensons en un cortometraje dirigido por Joseph Garner titulado The Schedule Makers .
“La incertidumbre se demora en su resolución”: Michael Trick, entrevista personal, 26 de noviembre de 2013.
“Prácticamente sin importar quiénes sean”: Ibid.
"Una puntuación de 3: 2 le da al equipo ganador": Tom Murphy, "¿Sintoniza Noise?" Publicado el 22 de junio de
2014 en el blog "Do the Math": http://physics.ucsd.edu/do-the-math/2014/06/tuning-in-on-noise/
reconociendo las virtudes de la robustez en los algoritmos: Ackley, "Beyond Efficiency".
"El tipo de burbuja no tiene características redimidoras aparentes": Knuth, The Art of Computer Programming ,
§5.5.
El ganador de ese honor en particular: Dave Ackley, entrevista personal, 26 de noviembre de 2013. Ver
Jones y Ackley, "Comparison Criticality in Sorting Algorithms" y Ackley, "Beyond Efficiency".
Para obtener más información sobre el ordenamiento por recuento comparativo (también conocido como ordenamiento por turnos), consulte Knuth,
El arte de la programación informática , §5.2.
"Habilidad más importante como jugador de póquer profesional": Isaac Haxton, entrevista personal, febrero
20 de 2014.
“Imagina dos monos”: Christof Neumann, entrevista personal, 29 de enero de 2014.
“Actos agresivos por gallina aumentados”: Craig, Comportamiento agresivo de los pollos .
Hay una carga computacional significativa: Jessica Flack, entrevista personal, 10 de septiembre,
2014. Véase también DeDeo, Krakauer y Flack, “Evidence of Strategic Periodicities in Collective
Dinámica del conflicto ”; Daniels, Krakauer y Flack, "Código disperso de conflicto en una sociedad de primates";
Brush, Krakauer y Flack, “Una familia de algoritmos para el consenso informático sobre el estado de nodo
de datos de red ". Para obtener una descripción más amplia del trabajo de Flack, consulte Flack, “Life's Information
Jerarquía."
Este concurso deportivo es el maratón: el maratón tiene un análogo en el mundo de la clasificación
algoritmos. Uno de los más intrigantes (Wikipedia usaba la palabra "esotérico" antes de que se publicara el artículo
eliminado por completo) los desarrollos en la teoría de la clasificación más allá de la comparación surgieron de uno de los
lugares inverosímiles: el notorio foro de mensajes de Internet 4chan. A principios de 2011, una publicación anónima allí
proclamó: “Hombre, soy un genio. Echa un vistazo a este algoritmo de clasificación que acabo de inventar ". Los posters
"Algoritmo de clasificación" - Clasificación por sueño: crea un hilo de procesamiento para cada elemento sin clasificar, indicando a cada uno
Página 356
subproceso para "dormir" el número de segundos de su valor, y luego "despertar" y salir a sí mismo. El final
la salida debería, de hecho, ser ordenada. Dejando de lado los detalles de implementación que revelan las grietas en
La lógica de Sleep Sort y simplemente tomando Sleep Sort en su valor nominal, parece prometer algo bastante
intoxicante: un tipo cuyo tiempo de ejecución no depende en absoluto de la cantidad de elementos, sino más bien de
su tamaño . (Por lo tanto, todavía no es tan bueno como un tipo de tiempo constante O (1) directo ).
"Usted va al dinero": esto es articulado por el empresario británico Alexander Dean en

https://news.ycombinator.com/item?id=8871524.
"El más grande es el dominante": la Ley del Arqueo Bruto, al parecer, realmente gobierna el
Oceano. Esto no quiere decir que los peces sean completamente pacifistas. Vale la pena señalar que lucharán ...
agresivamente, cuando sus tamaños son similares.
4. CACHING
“En el uso práctico de nuestro intelecto”: James, Psicología .
Ahora tienes dos problemas: esta construcción hace referencia a un famoso chiste de programación acuñado por primera vez por
Jamie Zawinski, ingeniero de Netscape, en una publicación de Usenet el 12 de agosto de 1997: "Algunas personas, cuando
enfrentado a un problema, piense 'Lo sé, usaré expresiones regulares'. Ahora tienen dos
problemas."
“¿Cuánto tiempo lo tengo?”: Stewart, Manual de limpieza del hogar de Martha Stewart .
“Cuelga todas tus faldas juntas”: Jay, The Joy of Less .
“Los artículos se ordenarán por tipo”: Mellen, ¡ Desentraña tu vida!
“Una conciencia muy aguda pero casi sin memoria”: Davis, Casi sin memoria .
uno de los principios fundamentales de la informática: nuestra historia de almacenamiento en caché se basa en lo proporcionado
por Hennessy y Patterson, Computer Architecture , que también tiene un gran tratamiento de la modernidad
métodos de almacenamiento en caché en el diseño de computadoras.
un "órgano de memoria" eléctrico: Burks, Goldstine y von Neumann, Discusión preliminar de la

Diseño lógico de un instrumento informático electrónico .
una supercomputadora en Manchester, Inglaterra, llamada Atlas: Kilburn et al., "One-Level Storage
Sistema."
"Acumula automáticamente palabras": Wilkes, "Slave Memories and Dynamic Storage

Asignación."
implementado en la supercomputadora IBM 360/85: Conti, Gibson y Pitkowsky, “Structural

Aspectos del Sistema / 360 Modelo 85 ".
El número de transistores en las CPU se duplicaría cada dos años: la predicción inicial de 1965 de Moore en
“Colocar más componentes en circuitos integrados” se duplicaba cada año; en 1975 él
luego revisó esto en “Progreso en electrónica digital integrada” para duplicarlo cada dos años.
jerarquía de memoria de seis capas: registros; Cachés L1, L2 y L3; RAM; y disco. Para más sobre el
"Muro de la memoria", véase, por ejemplo, Wulf y McKee, "Golpeando el Muro de la memoria".
“No dejar que los hechos inútiles se distorsionen con los útiles”: Conan Doyle, “Un estudio en escarlata: el
Reminiscencias de John H. Watson ".
Página 357
"Las palabras no se pueden conservar indefinidamente": Wilkes, "Slave Memories and Dynamic Storage
Asignación."
Bélády nació en 1928 en Hungría: la historia personal de Bélády se basa en una historia oral
entrevista que realizó con Philip L. Frana en 2002 (disponible en
https://conservancy.umn.edu/bitstream/107110/1/oh352lab.pdf). Su análisis de los algoritmos de almacenamiento en caché
y los resultados se presentan en Bélády, “Un estudio de algoritmos de reemplazo para un almacenamiento virtual
Computadora."
la pieza de investigación en ciencias de la computación más citada durante quince años: Del mismo Bélády: “Mi
El artículo escrito en 1965 se convirtió en el artículo más referenciado del índice de citas en el campo del software durante un período de tiempo.
Período de 15 años ". JAN Lee, "Laszlo A. Belady", en Computer Pioneers ,
http://history.computer.org/pioneers/belady.html.
LRU realizó consistentemente lo más cercano a la clarividencia: un par de años después, Bélády también
mostró que FIFO tiene algunos inconvenientes adicionales curiosos, en particular, casos raros en los que el aumento
el tamaño de la caché puede empeorar el rendimiento, un fenómeno conocido como anomalía de Bélády. Bélády,
Nelson y Shedler, "An Anomaly in Space-Time Characteristics of Certain Programs Running in a
Paging Machine ".
"El equivalente digital de barajar papeles": Aza Raskin, "Resolver el problema de Alt-Tab",
http://www.azarask.in/blog/post/solving-the-alt-tab-problem/.
La literatura sobre políticas de desalojo: si está interesado en probar un algoritmo de almacenamiento en caché más complejo,
Algunas variantes populares de LRU son las siguientes:
• LRU- K : O'Neil, O'Neil y Weikum, “El algoritmo de reemplazo de página LRU- K para
Almacenamiento en búfer de disco de base de datos ”, que analiza el tiempo transcurrido desde el K -th uso más reciente
(que es el máximo para los elementos de la caché que no se han utilizado K veces). Esto introduce un
sesgo de frecuencia. LRU-2, que se centra en el penúltimo uso, es el más común.
• 2T: Johnson y Shasha, “2T: Una gestión de búfer de alto rendimiento y gastos generales bajos
Algoritmo de reemplazo ", que organiza los elementos en dos" colas "separadas para capturar un poco
poco de información de frecuencia. Los elementos comienzan en la primera cola y ascienden a la segunda
cola si se hace referencia a ellos de nuevo mientras están en la caché. Los artículos se expulsan de este
segunda cola de nuevo a la primera cola utilizando LRU, que también se utiliza para desalojar elementos de la
primera cola.
• LRFU: Lee et al., “LRFU: Un espectro de políticas que subsume las menos usadas recientemente y
Políticas de uso menos frecuente ”, que combina la actualidad y la frecuencia mediante la asignación de
puntuación numérica para cada elemento que se incrementa cuando se usa el elemento, pero que disminuye gradualmente
tiempo extraordinario.
• La caché de reemplazo adaptable (ARC): Megiddo y Modha, "superando a LRU con una
"Adaptive Replacement Cache Algorithm", que utiliza dos colas de forma similar a 2Q
pero adapta la longitud de las colas en función del rendimiento.
Se ha demostrado que todos estos algoritmos superan a LRU en pruebas de gestión de caché
rendimiento.
favorito abrumador de los científicos de la computación: por ejemplo, Pavel Panchekha escribió un artículo en
2012 para el blog de Dropbox, donde expone el razonamiento de Dropbox para usar LRU, en
https://tech.dropbox.com/2012/10/caching-in-theory-and-practice/.
Página 358
En lo profundo de las pilas subterráneas de Gardner: para aquellos que tengan curiosidad por saber exactamente qué es UC
Los estudiantes de Berkeley habían estado leyendo cuando visitamos: Walden de Thoreau ; textos críticos sobre el Cantar de los
Yo mismo , Cormac McCarthy, James Merrill, Thomas Pynchon, Elizabeth Bishop, JD Salinger, Anaïs
Nin y Susan Sontag; Drown de Junot Díaz; Telegraph Avenue y The Yiddish Policemen's Union
por Michael Chabon; Bad Dirt y Bird Cloud de Annie Proulx; Sr. y Sra. Baby de Mark Strand;
El hombre en el castillo alto de Philip K. Dick; la poesía y la prosa recopiladas de William Carlos
Williams; Tabaco de Chuck Palahniuk; Sula de Toni Morrison; Árbol de humo de Denis Johnson; los
Conexión de todas las personas con pulmones por Juliana Spahr; El sueño del campo unificado de Jorie
Graham; Desnudo , yo hablo bonito un día y viste a tu familia con pana y mezclilla de David
Sedaris; Ariel de Sylvia Plath y Oleanna de David Mamet; Biografía de DT Max de David Foster
Wallace; Como algo que vuela hacia atrás , traducciones del evangelio de regreso a lenguas y
Deepstep Come Shining por CD Wright; la prosa de TS Eliot; Eureka de Edgar Allan Poe; Porra
Budd, Sailor y una colección de obras breves de poesía y prosa de Herman Melville; El Aspern
Documentos , El retrato de una dama y La vuelta del tornillo de Henry James; Harold Bloom sobre Billy
Budd , Benito Cereno y “Bartleby the Scrivener”; las obras de Eugene O'Neill; Stardust de Neil
Gaiman; Reservation Blues de Sherman Alexie; No es país para viejos de Cormac McCarthy; y
más.
“Doce años, ese es el límite”: Elizabeth Dupuis, entrevista personal, 16 de septiembre de 2014.
“¡En la escala de una milla por milla!”: Concluyeron Carroll, Sylvie y Bruno .
Una cuarta parte de todo el tráfico de Internet: Stephen Ludin, “Akamai: Por qué una cuarta parte de Internet es más rápida
y más seguro que el resto ”, conferencia, 19 de marzo de 2014, Instituto Internacional de Ciencias de la Computación,
Berkeley, California. Como afirma Akamai en su propio sitio, "Akamai ofrece entre el 15% y el 30% de todos
Tráfico web" (http://www.akamai.com/html/about/facts_figures.html ).
"La distancia importa": Ludin, "Akamai".
evitar cualquier tipo de organización comprensible para los humanos: el sistema de "almacenamiento caótico" de Amazon
descrito aquí: http://www.ssi-schaefer.de/blog/en/order-picking/chaotic-storage-amazon/ .
A Amazon se le otorgó una patente: la patente sobre el envío previo de artículos comúnmente solicitados es la patente de EE. UU.
No. 8,615,473, otorgado el 24 de diciembre de 2013, “Método y sistema para envío anticipado de paquetes”
por Joel R. Spiegel, Michael T. McKenna, Girish S. Lakshman y Paul G. Nordstrom, en nombre de
Amazon Technologies Inc.
que la prensa aprovechó: ver, por ejemplo, Connor Simpson, "Amazon Will Sell You Things Before
Sabes que quieres comprarlos ”, The Wire , 20 de enero de 2014,
http://www.thewire.com/technology/2014/01/amazon-thinks-it-can-predict-your-future/357188/;
Chris Matyszczyk, "¿Amazon enviará cosas antes de que hayas pensado en comprarlas?"
CNET , 19 de enero de 2014, http://www.cnet.com/news/amazon-to-ship-things-before-youve-even-
pensado-en-comprarlos / .
"Favoritos locales" de cada estado de Netflix: Micah Mertes, "Los Estados Unidos de Netflix Local
Favoritos ”, 10 de julio de 2011, http://www.slacktory.com/2011/07/united-states-netflix-local-favorites/ .
los enormes archivos que componen el video HD de larga duración: en 2012, Netflix anunció que
cansado de pagar a empresas como Akamai y había comenzado a construir su propia CDN global. Ver Eric Savitz,
"Netflix cambia el tráfico a su propia CDN" , Forbes , 5 de junio de 2012,
Página 359
http://www.forbes.com/sites/ericsavitz/2012/06/05/netflix-shifts-traffic-to-its-own-cdn-akamai-
candelero-shrs-hit / . Puede encontrar más información sobre Open Connect CDN de Netflix en
https://www.netflix.com/openconnect .
“El almacenamiento en caché es algo tan obvio”: John Hennessy, entrevista personal, 9 de enero de 2013.
“Una caja en el piso del armario de mi abrigo delantero”: Morgenstern, Organizing from the Inside Out .
“Bolsas extra para aspiradoras detrás del sofá”: Jones, Keeping Found Things Found .
motores de búsqueda desde una perspectiva cognitiva: consulte Belew, Finding Out About .
recomendó el uso de un puesto de valet: Rik Belew, entrevista personal, 31 de octubre de 2013.
“Un principio muy fundamental en mi método”: Yukio Noguchi, entrevista personal, 17 de diciembre,
2013.
nació el "super" sistema de archivo: el sistema de archivo de Noguchi se describe en su libro Super
Método organizado , y fue presentado inicialmente en inglés por el traductor William Lise. El blog
El artículo que describe el sistema ya no está disponible en el sitio de Lise, pero aún se puede visitar a través del
Archivo de Internet en
https://web.archive.org/web/20031223072329/http://www.lise.jp/honyaku/noguchi.html. Más lejos
La información proviene de Yukio Noguchi, entrevista personal, 17 de diciembre de 2013.
El artículo definitivo sobre listas autoorganizadas: Sleator y Tarjan, “Amortized Efficiency of List
Reglas de actualización y paginación ”, que también proporcionó los resultados más claros sobre las propiedades teóricas de
el principio LRU.
“El algoritmo de Dios, si se quiere”: Robert Tarjan, entrevista personal, 17 de diciembre de 2013.
si sigue el principio LRU: Esta aplicación del principio LRU a listas autoorganizadas es
conocido como el algoritmo Move-to-Front .
no meramente eficiente. Es realmente óptimo: esto no significa que deba renunciar por completo a
categorización. Si desea hacer las cosas un poco más llamativas y acelerar el proceso de búsqueda,
Noguchi sugiere colocar pestañas de colores en los archivos que pertenecen a diferentes categorías. De esa manera si tu
sabe que está buscando, digamos, cuentas, puede restringir su búsqueda lineal a esos elementos. Y
todavía estarán ordenados de acuerdo con la Regla de movimiento al frente dentro de cada categoría.
los sistemas de recuperación de información de las bibliotecas universitarias: los hallazgos de Anderson sobre la memoria humana
se publican en Anderson y Milson, "Human Memory", y en el libro The Adaptive Character
del pensamiento . Este libro ha sido influyente para diseñar una estrategia para analizar la cognición cotidiana.
en términos de soluciones ideales, utilizadas por Tom y muchos otros en su investigación. Anderson y Milson,
"Human Memory", a su vez, se basa en un estudio estadístico sobre el préstamo de bibliotecas que aparece en Burrell,
"Un modelo estocástico simple para préstamos para bibliotecas".
la pieza que falta en el estudio de la mente: la exploración inicial de Anderson de las conexiones entre
la recuperación de información por computadoras y la organización de la memoria humana se llevó a cabo en una era
cuando la mayoría de la gente nunca había interactuado con un sistema de recuperación de información, y los sistemas en uso
eran bastante primitivos. A medida que la investigación de los motores de búsqueda ha superado los límites de la información
que los sistemas de recuperación pueden hacer, ha creado nuevas oportunidades para descubrir paralelismos entre mentes y
máquinas. Por ejemplo, Tom y sus colegas han demostrado cómo las ideas detrás del PageRank de Google
Página 360
Los algoritmos son relevantes para comprender la memoria semántica humana. Ver Griffiths, Steyvers y Firl,
"Google y la mente".
“Vi ese marco presentado ante mí”: Anderson, The Adaptive Character of Thought .
analizó tres entornos humanos: El análisis del entorno de la memoria humana es

presentado en Anderson y Schooler, "Reflejos del medio ambiente en la memoria".
la realidad misma tiene una estructura estadística: "La memoria humana refleja, con un grado notable de
fidelidad, la estructura que existe en el entorno ”. Ibídem.
“No apreciamos la tarea antes que la memoria humana”: Ibid.
"Un libro grande es una gran molestia": la cita en griego es "μέγα βιβλίον μέγα κακόν" ( mega
biblion, mega kakon ), que también se ha traducido como "Libro grande, gran mal". La referencia original
tiene la intención de menospreciar la poesía épica, pero presumiblemente ser un erudito en un momento en que los libros
tenían la forma de pergaminos de decenas de pies de largo, lo que significaba que los libros grandes eran una molestia en más formas
que estético. Hay una razón por la que la práctica de la cita y la cita no comenzó correctamente hasta
los libros venían en códices con páginas numeradas. Para un excelente recuento de esta historia, vea
Boorstin, Los Descubridores .
“Si haces una ciudad más grande”: John Hennessy, entrevista personal, 9 de enero de 2014.
una consecuencia inevitable de la cantidad de información: Ramscar et al., “The Myth of

Deterioro cognitivo."
“Las mentes son dispositivos naturales de procesamiento de información”: Michael Ramscar, “Exclusivo para proveedores:
Michael Ramscar sobre el 'mito' del declive cognitivo ”, entrevista con Bill Myers, 19 de febrero,
2014. http://www.providermagazine.com/news/Pages/0214/Provider-Exclusive-Michael-Ramscar-
Sobre el mito del declive cognitivo.aspx .
5. PROGRAMACIÓN
“Cómo pasamos nuestros días”: Dillard, The Writing Life .
"Escribir libros, como hacer la guerra": Lawler, "Old Stories".
“Somos lo que hacemos repetidamente”: de hecho, esta frase, frecuentemente atribuida al propio Aristóteles,
se originó con el erudito Will Durant, como un resumen (en palabras de Durant) del pensamiento de Aristóteles. Ver
Durant, La historia de la filosofía .
cualquier tarea de dos minutos o menos: Allen, Getting Things Done .
comenzando con la tarea más difícil: ¡ Tracy, Eat That Frog! El libro atribuye su cita titular
- "Cómete una rana viva a primera hora de la mañana y no te pasará nada peor el resto del día".
día ”—a Mark Twain, aunque esta atribución puede ser apócrifa. El sitio web de Quote Investigator
cita al escritor francés del siglo XVIII Nicolas Chamfort como la fuente más probable. Ver
http://quoteinvestigator.com/2013/04/03/eat-frog/ para obtener más información.
primero programar los compromisos sociales de uno: Fiore, The Now Habit .
"El eterno aferrarse a una tarea incompleta": William James, en una carta a Carl Stumpf,
1 de enero de 1886.
deliberadamente no hacer las cosas de inmediato: Partnoy, Wait .
Página 361
desarrolló los diagramas de Gantt: El papel de Taylor y Gantt en la historia de la programación es

resumido en Herrmann, "Las perspectivas de Taylor, Gantt y Johnson". Biográfico adicional
los detalles sobre Taylor son de Kanigel, The One Best Way .
firmas como Amazon, IKEA y SpaceX: la empresa de software de diagramas de Gantt LiquidPlanner se jacta
Amazon, IKEA y SpaceX entre sus clientes en la URL (contraria a la intuición)
http://www.liquidplanner.com/death-to-gantt-charts/.
primer indicio de que este problema incluso podría resolverse: el resultado seminal de Johnson (en lo que ahora se llama
Programación de "flowhop", donde los trabajos fluyen de una máquina a otra) aparece en "Optimal Two- and
Programas de producción de tres etapas con tiempos de instalación incluidos ".
comenzar con la tarea que vence antes: la fecha de vencimiento más temprana (EDD), también conocida como la regla de Jackson, fue
derivado en Jackson, programación de una línea de producción para minimizar la tardanza máxima . James R.
Jackson creció en Los Ángeles en la década de 1930 y, a través de su trabajo con Logistics Research de UCLA
Project pasó un tiempo visitando talleres mecánicos administrados por varias empresas aeroespaciales de la zona. Su
pensar en cómo los trabajos se movían de una máquina a otra lo llevó finalmente a desarrollar un
matemáticas para analizar los "flujos de red", trabajo que luego se utilizaría en el diseño de
algoritmos para enrutar el flujo de tráfico en Internet. Aparece una breve biografía en Producción y
Sociedad de Gestión de Operaciones, "James R. Jackson".
Algoritmo de Moore: presentado en Moore, "An N Job, One Machine Sequencing Algorithm for
Minimizar el número de trabajos atrasados ". En el artículo, Moore reconoció una simplificación y
optimización que le había sugerido Thom J. Hodgson. Hoy en día, los términos "Moore's
Algoritmo ”,“ Algoritmo de Hodgson ”y el“ Algoritmo de Moore-Hodgson ”a veces se utilizan
indistintamente.
hacer la tarea más rápida que pueda: se demostró que el tiempo de procesamiento más corto (SPT), o la regla de Smith,
minimizar la suma de los tiempos de finalización en Smith, "Varios optimizadores para la producción de una sola etapa".
aparece en los estudios de búsqueda de alimento de animales: Stephens y Krebs, Teoría de la búsqueda de alimento .
conocida como la "bola de nieve de la deuda": en la esfera popular, el autor y orador Dave Ramsey es quizás
el divulgador y defensor más conocido de la estrategia de la "bola de nieve de la deuda", y ha obtenido muchos
simpatizantes y detractores por igual. En el aspecto académico, un artículo de 2012 de investigadores de escuelas de negocios en
Northwestern, Gal y McShane, "¿Pueden las pequeñas victorias ayudar a ganar la guerra?" y un artículo de 2014 de
economistas de Texas A&M Brown y Lahey, Small Victories , por ejemplo, han analizado el impacto
de "pequeñas victorias" para ayudar a las personas a salir de la deuda de los consumidores.
un vampiro obsesivo-compulsivo: este episodio es la temporada 5, episodio 12, "Bad Blood", que
Se emitió originalmente el 22 de febrero de 1998.
"Una tendencia a pre-crastinación": Rosenbaum, Gong y Potts, "Pre-crastinación".
Reeves culparía del error a las "presiones de los plazos": esto proviene de un correo electrónico con fecha de diciembre
15, 1997, de Glenn Reeves a sus colegas, línea de asunto "¿Qué sucedió realmente en Marte?"
disponible en línea en http://research.microsoft.com/en-
us / um / people / mbj / Mars_Pathfinder / Authoritative_Account.html.
"Si eres inflamable y tienes piernas": la historia de Hedberg se puede encontrar en su álbum de comedia de 1999
Ubicaciones estratégicas de parrilla .
Página 362
"Cosas que más importan": la primera aparición de esta cita en inglés parece estar en
Covey, How to Succeed with People , donde se atribuye a Goethe sin citarlo.
“Así es como hago las cosas todos los días”: Laura Albert McLay, entrevista personal, 16 de septiembre,
2014.
“Gene estaba posponiendo algo”: Jan Karel Lenstra, entrevista personal, 2 de septiembre de 2014; y
correspondencia personal.
Lawler tomó una ruta intrigantemente tortuosa: la biografía de Lawler está extraída de Lawler, “Old
Stories ”y Lenstra,“ El poder místico de Twoness ”.
“La conciencia social” del departamento de informática : Richard Karp, “A Personal View of
Ciencias de la Computación en Berkeley ”, Departamento de EECS, Universidad de California, Berkeley,
http://www.eecs.berkeley.edu/BEARS/CS_Anniversary/karp-talk.html.
un premio a nombre de Lawler: Verhttp://awards.acm.org/lawler/.
construir el cronograma al revés: el análisis de Lawler de las restricciones de precedencia para el máximo
El problema de la tardanza se encuentra en Lawler, "Secuenciación óptima de una sola máquina sujeta a precedencia
Restricciones ".
es lo que el campo llama "intratable": este análisis está en Lawler, "Secuenciación de trabajos para minimizar
Tiempo total ponderado de finalización sujeto a restricciones de precedencia ". Más precisamente, el problema es
“ NP -hard”, lo que significa que no tiene una solución eficiente conocida y es posible que nunca la tenga.
una búsqueda para mapear todo el panorama de la teoría de la programación: la búsqueda surgió una tarde en
1975, mientras Lawler, Lenstra y sus colegas Richard Karp y Ben Lageweg se sentaban a hablar
teoría de la programación en el Mathematisch Centrum en Amsterdam. Quizás fueron los "olores acre de
malta y lúpulo ”en el aire de la cervecería Amstel de al lado, pero algo inspiró al grupo a
decidir que un libro que contiene una lista de todos los problemas de programación y si se han resuelto
haría un buen regalo para su amigo y colega Alexander Rinnooy Kan, que estaba a punto de
defender su tesis. (Esta historia aparece en Lawler, "Old Stories" y Lenstra, "The Mystical Power of
Twoness. ”) Rinnooy Kan continuaría haciendo importantes contribuciones no solo a la academia sino también
a la economía holandesa, miembro de la junta directiva de ING y nombrado por el periódico De
Volkskrant como la persona más influyente en los Países Bajos, tres años seguidos. Ver "Rinnooy Kan
weer invloedrijkste Nederlander ”, De Volkskrant , 4 de diciembre de 2009, http://nos.nl/artikel/112743-
rinnooy-kan-weer-invloedrijkste-nederlander.html .
Lageweg escribió un programa de computadora que generó la lista, enumerando unos 4.536 diferentes
permutaciones del problema de programación: cada combinación posible de métricas (retraso máximo,
número de trabajos atrasados, suma de tiempos de finalización, etc.) y restricciones (pesos, precedencia, horas de inicio,
y así sucesivamente) que pudieran pensar. Durante una serie de apasionantes días, el grupo “tuvo el placer de
eliminando un tipo de problema oscuro tras otro en rápida sucesión ".
Su esquema organizativo para describir el zoológico de problemas de programación era un lenguaje "entrelazado
con taquigrafía ", que llamaron" Schedulese "(Graham et al.," Optimización y aproximación
en secuenciación determinista ”). La idea básica es que los problemas de programación se describen mediante tres
variables: la naturaleza de las máquinas involucradas, la naturaleza de los trabajos y el objetivo de la programación.
Estas tres variables se especifican en ese orden, con códigos estándar que describen factores como
restricciones de precedencia, preferencia, tiempos de lanzamiento y el objetivo. Por ejemplo, 1 | r j | ∑ C j (pronunciado
Página 363
"One-arejay-sum-ceejay") representa una sola máquina, tiempos de lanzamiento y el objetivo de minimizar el

suma de tiempos de finalización. Como relata Eugene Lawler:
Una recompensa inmediata fue la facilidad consumada con la que pudimos comunicar el problema.
tipos. Los visitantes de nuestras oficinas a veces se quedaban desconcertados al escuchar intercambios como: "Dado que uno-
arejay-sum-ceejay es NP-difícil, ¿eso implica que una- preferencia -arejay-sum-ceejay es NP-
duro, también? "No, eso es fácil, ¿recuerdas?" "Bueno, un deejay-sum-ceejay es fácil y eso
implica uno- preferencia -deejay-sum-ceejay es fácil, entonces, ¿qué sabemos sobre uno-
preemption-arejay-deejay-sum-ceejay? " "Nada."
(En notación formal: "Dado que 1 | r j | ∑ C j es NP-duro, ¿eso implica que 1 | pmtn, r j | ∑ C j también es NP-duro?"
"No, eso es fácil, ¿recuerdas?" “Bueno, 1 | d j | ∑ C j es fácil y eso implica 1 | pmtn, d j | ∑ C j es fácil, entonces, ¿qué
sabemos acerca de 1 | pmtn, r j , d j | ∑ C j ? " “Nada” [Lawler et al., “¡Un regalo para Alexander!”; ver también
Lawler, "Old Stories"].)
el problema se vuelve intratable: de hecho, es equivalente al "problema de la mochila", la computadora

el problema más famoso de la ciencia sobre cómo llenar el espacio. La conexión entre esto
problema de programación y el problema de la mochila aparece en Lawler, Programación de una sola máquina para
Minimice el número de trabajos atrasados .
un cierto tiempo para comenzar algunas de sus tareas: lo que llamamos "horas de inicio" se refiere en el
literatura (pensamos de forma algo ambigua) como "tiempos de publicación". Lenstra, Rinnooy Kan y Brucker,
"La complejidad de los problemas de programación de la máquina" mostró que tanto la minimización de la suma de finalización
Los tiempos y minimizar el retraso máximo con tiempos de liberación arbitrarios son NP -difíciles. El caso de
La minimización del número de trabajos atrasados con tiempos de liberación arbitrarios se analiza en Lawler, “Programación de una
Una sola máquina para minimizar el número de trabajos atrasados ".
Una encuesta reciente: Lawler et al., "Secuenciación y programación". La versión más reciente de esta lista es
disponible en http://www.informatik.uni-osnabrueck.de/knust/class/ .
con una modificación bastante sencilla: el efecto de la preferencia en la minimización de

La tardanza con los tiempos de liberación se analiza en Baker et al., "Programación preventiva de una sola máquina".
El problema de minimizar la suma de los tiempos de finalización con los tiempos de liberación y la preferencia es
analizado en Schrage, “Una prueba de la optimización del tiempo de procesamiento restante más corto
Disciplina ”y Baker, Introducción a la secuenciación y programación .
sigue siendo la versión preventiva de la fecha de vencimiento más temprana: el resultado de minimizar el máximo esperado
La tardanza al elegir el trabajo con la fecha de vencimiento más temprana se analiza en Pinedo, Programación .
la versión preventiva del tiempo de procesamiento más corto: la eficacia de elegir el trabajo con
el tiempo de procesamiento esperado más corto ponderado para minimizar la suma de los tiempos de finalización ponderados
en un entorno dinámico (siempre que la estimación del tiempo para completar un trabajo no aumente en el
duración trabajada en ese trabajo) fue mostrado por Sevcik, "Programación para pérdida total mínima usando
Distribuciones de tiempo de servicio ”, como parte de una estrategia más general para la programación dinámica.
suma de los retrasos ponderados de esos trabajos: Pinedo, "Programación estocástica con fechas de lanzamiento y
Fechas de vencimiento ”, mostró que este algoritmo es óptimo para estos problemas bajo el (bastante fuerte)
el supuesto de que los tiempos de los trabajos siguen una distribución sin memoria, lo que significa que su estimación
de cuánto tiempo tomarán permanece constante sin importar cuánto tiempo los haya estado haciendo. En
Página 364
programación estocástica, los algoritmos óptimos no serán necesariamente ideales para todas las cargas de trabajo posibles, pero
en lugar de minimizar los valores esperados de sus métricas relevantes.
"Reemplace 'plan' con 'conjetura'": Jason Fried, "Llamemos a los planes como son: conjeturas", 14 de julio,
2009, https://signalvnoise.com/posts/1805-lets-just-call-plans-what-they-are-guesses .
"No debe bajarse del tren": Ullman, "Fuera de tiempo".
puede incluir retrasos y errores: Monsell, "Task Switching".
“En su lugar, solo hago recados”: Kirk Pruhs, entrevista personal, 4 de septiembre de 2014.
“Tienes parte de mi atención”: The Social Network , guión de Aaron Sorkin; Columbia
Imágenes, 2010.
“Nadie sabía nada de eso”: Peter Denning, entrevista personal, 22 de abril de 2014.
"Provocó un colapso completo del servicio": Denning, "Thrashing: sus causas y prevención".
"Los cachés son cálidos para la carga de trabajo actual": Peter Zijlstra, entrevista personal, 17 de abril,
2014.
cualquier situación en la que el sistema se detenga: Thrashing también puede tener lugar en sistemas de bases de datos,
donde la competencia entre diferentes procesos para adquirir "bloqueos" para acceder a la base de datos puede
inundar la capacidad del sistema para permitir que los procesos que actualmente mantienen las cerraduras hagan cualquier cosa.
De manera similar, la paliza puede aparecer en contextos de redes, donde una cacofonía de diferentes señales
Competir por el canal de la red puede evitar que pase nada. Tomaremos un
Observe más de cerca el último escenario en el capítulo 10.
reemplazó su programador: el " Programador O ( n )" utilizado por Linux a partir de la versión 2.4 en 2001
ordenó todos los procesos por prioridad, lo que llevó más tiempo cuantos más procesos había. Esto fue desechado
a favor del " Programador O (1)" a partir de Linux 2.6 en 2003, que clasificaba todos los procesos por cubos
en un número predeterminado de depósitos, independientemente de cuántos procesos hubiera. Sin embargo,
hacer este tipo de cubeta requirió computar heurísticas complejas, y comenzando con Linux 2.6.23 en
2007, el " Programador O (1)" fue reemplazado por el aún más sencillo "Completely Fair
Programador ".
En Linux, este segmento mínimo útil: este valor se define en la sección "Completely Fair
Scheduler ”en la variable sysctl_sched_min_granularity.
Métodos como "timeboxing" o "pomodoros": Se ha escrito mucho sobre el timeboxing en el

contexto de la gestión de equipos de desarrollo de software; el término "timeboxing" parece
se originan con Zahniser, "Timeboxing para el mejor rendimiento del equipo". La "Técnica Pomodoro",
cuyo nombre proviene de un temporizador de cocina en forma de tomate (la palabra italiana para tomate es
pomodoro ), fue ideado por Francesco Cirillo a fines de la década de 1980 y ha sido enseñado por Cirillo comenzando
en 1998. Ver, por ejemplo, Cirillo, The Pomodoro Technique .
Los programadores han recurrido a la psicología: por ejemplo, Peter Zijlstra, entrevista personal, 17 de abril de 2014.
Las propias computadoras hacen algo como esto: Linux agregó soporte para la fusión de temporizadores en 2007;
Microsoft lo incluyó en Windows a partir de Windows 7 en 2009; y Apple hizo lo mismo en OS X
Mavericks en 2013.
“Solo un error de una línea en su algoritmo”: Peter Norvig, entrevista personal, 17 de septiembre de 2014.
Página 365
“No cambio de entrada y salida”: Shasha y Lazere, Out of Their Minds , pág. 101.
"Mi función es estar al tanto de las cosas": Donald Knuth, "Knuth versus correo electrónico", http: // www-cs-
faculty.stanford.edu/~uno/email.html .
6. REGLA DE BAYES
“Todo conocimiento humano es incierto”: Bertrand Russell, Conocimiento humano: su alcance y límites ,
1948, pág. 527.
Allí vio el Muro de Berlín: Gott, “Implicaciones del principio copernicano para nuestro futuro
Prospectos ".
"La efectividad irrazonable de los datos": la charla se derivó de Halevy, Norvig y

Pereira, "La efectividad irrazonable de los datos".
"Estos argumentos deben ser sólo probables": Investigación sobre el entendimiento humano , § IV,
"Dudas escépticas acerca de las operaciones del entendimiento".
La propia historia de Bayes: nuestra breve biografía se basa en Dale, A History of Inverse Probability , y
Bellhouse, "El reverendo Thomas Bayes".
en 1746, '47, '48 o '49: el legendario artículo de Bayes, sin fecha, había sido archivado entre un par de
artículos fechados en 1746 y 1749. Véase, por ejemplo, McGrayne, The Theory That Would Not Die .
defensa del novedoso "cálculo" de Newton: una introducción a la doctrina de las fluxiones, y
Defensa de los matemáticos frente a las objeciones del autor del analista, en la medida en que sean
asignados para afectar sus métodos generales de razonamiento .
"Merece ser preservado": Introducción a Bayes, "Un ensayo para resolver un problema en el
Doctrina de las posibilidades ".
“La proporción de espacios en blanco con respecto a los premios ”: Apéndice de ibid.
necesitamos primera razón hacia adelante : Para ser precisos, Bayes estaba argumentando que las hipótesis dada h y
algunos datos observados d , debemos evaluar esas hipótesis calculando la probabilidad p ( d | h ) para
cada h . (La notación p ( d | h ) significa la "probabilidad condicional" de d dada h , es decir, la probabilidad
de observar d si h es verdadera.) Para convertir esto nuevamente en una probabilidad de que cada h sea verdadera, entonces
dividir por la suma de estas probabilidades.
Laplace nació en Normandía: para más detalles sobre la vida y obra de Laplace, consulte Gillispie, Pierre-
Simon Laplace .
destilado en una sola estimación: la ley de Laplace se deriva trabajando a través del cálculo
sugerido por Bayes; la parte complicada es la suma de todas las hipótesis, lo que implica una aplicación divertida
de integración por partes. Puede ver una derivación completa de la ley de Laplace en Griffiths, Kemp y
Tenenbaum, "Modelos bayesianos de cognición". Desde la perspectiva de las estadísticas bayesianas modernas,
La ley de Laplace es la media posterior de la tasa binomial utilizando un a priori uniforme.
Si lo intentas solo una vez y funciona: tal vez recuerdes que en nuestra discusión sobre bandidos armados múltiples
y el dilema explorar / explotar en el capítulo 2, también abordamos las estimaciones de la tasa de éxito de un
proceso — una máquina tragamonedas — basado en un conjunto de experiencias. El trabajo de Bayes y Laplace undergirds
muchos de los algoritmos que discutimos en ese capítulo, incluido el índice de Gittins. Como la ley de Laplace,
los valores del índice de Gittins que presentamos allí asumieron que cualquier probabilidad de éxito es igualmente
Página 366
probable. Esto implícitamente toma la tasa de ganancias general esperada para una máquina tragamonedas con un récord de 1 a 0 para ser
dos tercios.
"No más coherente o concebible que el resto": una investigación sobre humanos
Entendimiento , §IV, "Dudas escépticas acerca de las operaciones del entendimiento".
El verdadero trabajo pesado lo hizo Laplace: Para ser justos, un influyente artículo de 1950 (Bailey,
Procedimientos de credibilidad ) se refirió a la "Generalización de Laplace de la regla de Bayes", pero no
palo. Los descubrimientos que llevan el nombre de alguien que no sea su descubridor es un
Fenómeno que el estadístico e historiador Stephen Stigler ha afirmado que debe considerarse
una ley empírica: la ley de la eponimia de Stigler. Por supuesto, Stigler no fue la primera persona en descubrir
esta; asigna el mérito al sociólogo Robert K. Merton. Véase Stigler, "Stigler's Law of Eponymy".
multiplicar sus probabilidades juntos: para los matemáticos inclinados, aquí está la versión completa de
Regla de Bayes. Queremos calcular la probabilidad de asignar una hipótesis h dados los datos d . Nosotros
tener creencias previas sobre la probabilidad de que esa hipótesis sea cierta, expresada en una distribución previa
p ( h ). Lo que queremos calcular es la distribución "posterior", p ( h | d ), que indica cómo debemos
actualizar nuestra distribución anterior a la luz de la evidencia proporcionada por d . Esto viene dado por
donde h ′ abarca el conjunto completo de hipótesis en consideración.
"Especialmente sobre el futuro": Los orígenes inciertos de este dicho se describen en detalle en Cita
Investigador , "Es difícil hacer predicciones, especialmente sobre el futuro",
http://quoteinvestigator.com/2013/10/20/no-predict/.
sorprendente si hubiera incluso una ciudad de Nueva York: la portada de The New Yorker es Richard McGuire, "Time
Warp ”, 24 de noviembre de 2014. Para un análisis fascinante y más detallado de la esperanza de vida de
ciudades y corporaciones, consulte el trabajo de Geoffrey West y Luis Bettencourt; por ejemplo, Bettencourt et al.,
"Crecimiento, innovación, escalamiento y ritmo de vida en las ciudades".
una ráfaga de correspondencia crítica: por ejemplo, ver Garrett y Coles, "Bayesian Inductive
Inferencia y principios antrópicos ”y Buch,“ Discusión de perspectivas futuras ”.
una rifa en la que entras sin saber nada: el estadístico Harold Jeffreys sugeriría más tarde,
en lugar de ( w +1) ⁄ ( n +2) de Laplace , usando más bien ( w +0.5) ⁄ ( n +1) , que resulta de usar un "no informativo"
antes que el "uniforme" a priori (Jeffreys, Teoría de la probabilidad ; Jeffreys, "An Invariant Form
para la probabilidad previa en problemas de estimación ”). Un método para definir a priori más informativos
resulta en predicciones de la forma ( w + w ′ +1) ⁄ ( n + n ′ +2) , donde w ′ y n ′ son el número de victorias y
intentos de procesos similares en su experiencia pasada (para obtener detalles, consulte Griffiths, Kemp y
Tenenbaum, "Modelos bayesianos de cognición"). Usando esta regla, si ha visto previamente 100 loterías
sorteos con solo 10 boletos ganadores ( w = 10, n = 100), su estimación después de ver un solo ganador
El sorteo de esta nueva lotería sería un 12/103 mucho más razonable (no muy lejos del 10%). Variantes en
La ley de Laplace se utiliza ampliamente en lingüística computacional, donde proporciona una forma de
estimar las probabilidades de palabras que nunca se han visto antes (Chen y Goodman, "An
Estudio empírico de técnicas de suavizado para modelado de lenguajes ”).
Página 367
o durar cinco milenios: para una cantidad como una duración, que va de 0 a ∞, el
anterior no informativo en los tiempos t es la densidad de probabilidad p ( t ) ∝ 1 / t . Cambiar la escala: definir un
nueva cantidad s que es un múltiplo de t ; no cambia la forma de esta distribución: si s = ct , entonces p ( s )
∝ p ( t = s / c ) ∝ 1 / s . Esto significa que es invariante en escala. Mucha más información sobre desinformativo
a priors aparece en Jeffreys, Theory of Probability , y Jeffreys, "An Invariant Form for the Prior
Probabilidad en problemas de estimación ".
surge el Principio Copernicano: Esto fue demostrado por Gott, "Future Prospects Discussed", en
respondiendo a Buch, "Prospectos futuros discutidos".
determinar el número de tranvías: Jeffreys, Teoría de la probabilidad , §4.8. Créditos de Jeffreys

matemático Max Newman por llamar su atención sobre el problema.
trató de estimar el número de tanques: esto ha llegado a conocerse como el "tanque alemán
Problema ”, y se ha documentado en varias fuentes. Véase, por ejemplo, Gavyn Davies, "How a
Fórmula estadística ganó la guerra ” , The Guardian , 19 de julio de 2006,
http://www.theguardian.com/world/2006/jul/20/secondworldwar.tvandradio.
frutas en un huerto: por ejemplo, la Asociación Anual de Productores de Aguacates de Nueva Zelanda de 2002
El informe de investigación encontró que “en abril, los perfiles de tamaño de la fruta estaban distribuidos normalmente y permanecían así
durante el resto del período supervisado ".
La población promedio de una ciudad: esta cifra proviene de Clauset, Shalizi y Newman, “Power-
Distribuciones de leyes en datos empíricos ”, que a su vez cita el censo de EE. UU. De 2000.
puede variar plausiblemente en muchas escalas: La forma general de una distribución de ley de potencias en una cantidad t
es p ( t ) ∝ t - γ , donde el valor de γ describe la rapidez con la que la probabilidad de t disminuye a medida que t aumenta .
Al igual que con el prior no informativo, la forma de la distribución no cambia si tomamos s = ct ,
cambiando la escala.
un dominio lleno de leyes de poder: la observación de que la riqueza se distribuye de acuerdo con una ley de poder
La función se atribuye a Pareto, Cours d'économie politique . Otra buena discusión sobre el poder
distribuciones legales de poblaciones e ingresos es Simon, "On a Class of Skew Distribution Functions".
El ingreso medio en Estados Unidos: el ingreso bruto ajustado individual (AGI), derivado de
Declaraciones del IRS, se estimó en $ 55,688 para el año fiscal 2009, el año más reciente para el cual un
la estimación estaba disponible; ver el documento de trabajo de 2011 “Evaluación del uso de la nueva corriente
Preguntas complementarias sociales y económicas anuales de la Encuesta de población en el Impuesto de la Oficina del Censo
Model ”, disponible en https://www.census.gov/content/dam/Census/library/working-
papers / 2011 / demo / 2011_SPM_Tax_Model.pdf , que a su vez cita datos del censo de EE. UU.
Suplemento social y económico anual de la Encuesta sobre la población actual de 2010 de la Oficina.
dos tercios de la población de EE. UU. ganan menos que el ingreso medio: el límite para el 40% más rico de
El AGI en 2012 fue de $ 47,475 y el límite para el 30% superior fue de $ 63,222, de lo cual podemos inferir que
un ingreso bruto ajustado de $ 55,688 aterriza aproximadamente en el 33% superior. Véase Adrian Dungan, “Individual Income Tax
Shares, 2012 ”, Boletín de Estadísticas de Ingresos del IRS , primavera de 2015, disponible en
https://www.irs.gov/pub/irs-soi/soi-a-ints-id1506.pdf.
el 1% superior hace casi diez veces la media: el límite para el 1% superior fue un AGI de $ 434,682 en
2012, y el límite para el 0.01% superior fue $ 12,104,014. Ibídem.
Página 368
el proceso de "apego preferencial": una buena discusión de la audiencia general sobre la idea de
Las distribuciones de la ley de poder que surgen del apego preferencial se pueden encontrar en Barabási, Linked .
“'¿Podría continuar para siempre' en el buen sentido?”: Lerner, The Lichtenberg Figures .
La estrategia de predicción apropiada es una regla multiplicativa: todas las reglas de predicción discutidas en este
se derivan de Griffiths y Tenenbaum, "Predicciones óptimas en la cognición cotidiana".
los poemas siguen algo más cercano a una ley de potencia: Ibid.
formalizó la extensión de los intervalos: Erlang primero modeló la tasa de llamadas telefónicas que aparecen en un
red utilizando una distribución de Poisson en "La teoría de las probabilidades y las conversaciones telefónicas",
y, a su vez, desarrolló la distribución homónima de Erlang para modelar los intervalos entre la llegada
llama en "Solución de algunos problemas en la teoría de probabilidades de significación en automático
Intercambios telefónicos ". Para obtener más detalles sobre la vida de Erlang, consulte Heyde, "Agner Krarup Erlang".
probabilidades de que sean de 20 a 1: Para ser precisos, las probabilidades de que se le reparta una mano de blackjack en el
juego del mismo nombre son exactamente 2.652 a 128, o alrededor de 20,7 a 1. Para ver la derivación de por qué esto lleva
a una expectativa de jugar 20.7 manos antes de conseguirlo, podemos definir nuestra expectativa de forma recursiva:
O conseguimos blackjack con un resultado de 1, o no lo hacemos (en cuyo caso volvemos a donde empezamos una
mano más tarde). Si x es nuestra expectativa, x = 1 + (2524/2652) x , donde 2524/2652 es nuestra probabilidad de no
recibir blackjack. Resolver para x da aproximadamente 20,7.
conocido por los estadísticos como "sin memoria": Técnicamente, el tiempo para el próximo blackjack sigue un
distribución geométrica (similar a la distribución exponencial para una cantidad continua), que es
en constante disminución, en lugar de la distribución de Erlang más parecida a un ala que describimos en la
texto. Sin embargo, ambos pueden producir predicciones sin memoria en las circunstancias adecuadas. Si nos encontramos
un fenómeno particular en algún punto aleatorio de su duración, como asumió Gott con respecto al Berlín
Wall, luego el Erlang con forma de ala nos da predicciones de la regla aditiva sin memoria. Y si nosotros
observar continuamente un fenómeno que tiene una distribución geométrica, como en un juego de
blackjack, resulta el mismo tipo de predicciones de la regla aditiva.
Kenny Rogers aconsejó: "The Gambler" es mejor conocido como lo canta Kenny Rogers en su
Álbum de 1978 del mismo nombre, pero originalmente fue escrito e interpretado por Don Schlitz. los
La grabación de la canción por parte de Rogers llegaría al primer lugar en las listas de países de Billboard, y
ganó el Grammy de 1980 a la Mejor Interpretación Vocal Masculina de Country.
"Solté un largo suspiro de alivio": Gould, "La mediana no es el mensaje".
pedirle a la gente que haga predicciones: Griffiths y Tenenbaum, “Optimal Predictions in Everyday
Cognición."
distribuciones previas de las personas en una amplia franja: los estudios han examinado, por ejemplo, cómo
lograr identificar formas en movimiento a partir de los patrones de luz que caen sobre la retina, inferir causal
relaciones de las interacciones entre objetos y aprender el significado de nuevas palabras después de ver
ellos solo unas pocas veces. Véase, respectivamente, Weiss, Simoncelli y Adelson, “Motion Illusions as
Percepciones óptimas ”; Griffiths y col., "Bayes and Blickets"; Xu y Tenenbaum, "Word Learning as
Inferencia bayesiana."
famosa "prueba de malvavisco": Mischel, Ebbesen y Raskoff Zeiss, "Cognitive and Attentional
Mecanismos en el retraso de la gratificación ".
Página 369
todo depende de qué tipo de situación: McGuire y Kable, "Decision Makers Calibrate Behavioural
Persistencia sobre la base de la experiencia en intervalos de tiempo ”, y McGuire y Kable,“ Rational Temporal
Las predicciones pueden ser la base de los fracasos aparentes para retrasar la gratificación ".
se convirtieron en adultos jóvenes que tuvieron más éxito: Mischel, Shoda y Rodríguez, “Delay of
Gratificación en los niños ".
cómo las experiencias anteriores pueden afectar el comportamiento: Kidd, Palmeri y Aslin, "Rational Snacking".
Carnegie Hall incluso medio lleno: según cifras de la Aviation Safety Network (personal
correspondencia), el número de muertes "a bordo de aviones de propiedad estadounidense que son capaces de transportar
Más de 12 pasajeros, incluidos también jets corporativos y aviones de transporte militar ”durante el período 2000–
2014 fue de 1369, y sumar la cifra de 2014 nuevamente para estimar las muertes en 2015 arroja una estimación total de
1.393 hasta finales de 2015. El famoso Auditorio Isaac Stern del Carnegie Hall tiene capacidad para 2.804; ver
http://www.carnegiehall.org/Information/Stern-Auditorium-Perelman-Stage/ .
mayor que toda la población de Wyoming: según el National Highway Traffic Safety
Administración, 543,407 personas murieron en accidentes automovilísticos en los Estados Unidos en los años 2000-2013.
Ver http://www-fars.nhtsa.dot.gov . Repitiendo la cifra de 2013 para estimar las muertes en 2014 y 2015
arroja una estimación de 608,845 muertes hasta finales de 2015. La población de Wyoming en 2014, como
estimada por la Oficina del Censo de los Estados Unidos, fue de 584,153. Ver
http://quickfacts.census.gov/qfd/states/56000.html.
violencia armada en las noticias estadounidenses: Glassner, "Narrative Techniques of Fear Mongering".
7. SOBREAJUSTE
"Casarse — casarse — casarse QED": esta nota de Darwin está fechada el 7 de abril de 1838; ver, por ejemplo, Darwin,
La correspondencia de Charles Darwin, volumen 2: 1837–1843 .
“Álgebra moral o prudencial”: carta de Franklin a Joseph Priestley, Londres, 19 de septiembre de 1772.
"Cualquier cosa que puedas hacer, yo puedo hacerlo mejor": "Anything You Can Do", compuesta por Irving Berlin, en
Annie, consigue tu pistola , 1946.
lo que sabe y lo que no: en el lenguaje de los investigadores de aprendizaje automático: el

"Entrenamiento" y la "prueba".
un estudio reciente realizado en Alemania: Lucas et al., “Reexamining Adaptation and the Set Point
Modelo de felicidad ".
nuestro trabajo es descubrir la fórmula: para los aficionados a las matemáticas, estamos tratando de encontrar el mejor polinomio
función para capturar esta relación. Tomando el tiempo desde el matrimonio para ser xy la satisfacción para ser y ,
el modelo de un predictor es y = ax + b . El modelo de dos predictores es y = ax 2 + bx + c , y el modelo de nueve
El modelo predictor encuentra los mejores coeficientes para todos los valores de x hasta x 9 , estimando un polinomio de
grado 9.
a través de todos y cada uno de los puntos del gráfico: de hecho, es una verdad matemática que siempre puede
Dibuja un polinomio de grado n - 1 a través de n puntos cualesquiera .
nivel básico de satisfacción de las personas: Lucas et al., “Reexaminar la adaptación y el punto de ajuste
Modelo de felicidad ".
Página 370
no siempre es mejor utilizar un modelo más complejo: los estadísticos se refieren a los diversos factores en el
modelo como "predictores". Un modelo que es demasiado simple, como una línea recta que intenta ajustarse a una curva, es
se dice que exhibe "sesgo". El tipo opuesto de error sistémico, donde un modelo se complica demasiado
y, por lo tanto, gira violentamente debido a pequeños cambios en los datos, se conoce como "varianza".
La sorpresa es que estos dos tipos de errores, sesgo y varianza, pueden ser complementarios .
Reducir el sesgo (hacer que el modelo sea más flexible y complicado) puede aumentar la varianza. Y
El aumento del sesgo (simplificando el modelo y ajustando los datos con menos precisión) a veces puede reducir
diferencia.
Como el famoso principio de incertidumbre de Heisenberg de la física de partículas, que dice que cuanto más
sabe sobre el momento de una partícula cuanto menos sepa sobre su posición, el llamado sesgo-
La compensación de la varianza expresa un límite profundo y fundamental sobre qué tan bueno puede ser un modelo, en qué
es posible conocer y predecir. Esta noción se encuentra en varios lugares del aprendizaje automático.
literatura. Véase, por ejemplo, Geman, Bienenstock y Doursat, "Neural Networks and the
Dilema de sesgo / varianza ”, y Grenander,“ Sobre el análisis espectral empírico de los procesos estocásticos ”.
en el Libro de los Reyes: La serpiente de bronce, conocida como Nehushtan, es destruida en 2 Reyes 18: 4.
“Pague mucho dinero para quitarse los tatuajes”: Gilbert, Stumbling on Happiness .
duelos hace menos de cincuenta años: si no eres demasiado pusilánime, puedes ver el video de un duelo
en 1967 en http: //passerelle-production.u-
bourgogne.fr/web/atip_insulte/Video/archive_duel_france.swf.
a medida que los atletas sobreajustan sus tácticas: para un ejemplo interesante de sobreajuste deliberado de la esgrima,
ver Harmenberg, Epee 2.0 .
"Las estructuras de incentivos funcionan": Brent Schlender, "The Lost Steve Jobs Tapes", Fast Company , mayo
2012, http://www.fastcompany.com/1826869/lost-steve-jobs-tapes.
"Lo que el CEO decida medir": Sam Altman, "Bienvenida, e Ideas, Productos, Equipos y
Execution Part I ”, Stanford CS183B, otoño de 2014,“ How to Start a Startup ”,
http://startupclass.samaltman.com/courses/lec01/.
Ridgway catalogó una serie de tales: Ridgway, "Consecuencias disfuncionales del desempeño
Mediciones."
En una empresa de colocación laboral: en esta historia, el propio Ridgway cita a Blau, The Dynamics of
Burocracia .
"Los amigos no permiten que los amigos midan las visitas a la página": Avinash Kaushik, "Eres lo que mides,
¡Elija sabiamente sus KPI (incentivos)! " http://www.kaushik.net/avinash/measure-choose-
kpis-incentivos-inteligentes / .
“Se encontraron policías muertos”: Grossman y Christensen, On Combat . Ver

http://www.killology.com/on_combat_ch2.htm.
El oficial agarró instintivamente el arma: Ibid.
"Si no puede explicarlo simplemente": esta cita se atribuye con frecuencia a Albert Einstein, aunque
es probable que esta atribución sea apócrifa.
Tikhonov propuso una respuesta: véase, por ejemplo, Tikhonov y Arsenin, Solución de problemas mal planteados .
Página 371
inventado en 1996 por el bioestadístico Robert Tibshirani: Tibshirani, “Regression Shrinkage and
Selección a través del lazo ".
el cerebro humano quema alrededor de una quinta parte: para obtener más información sobre el consumo de energía del cerebro humano, consu
Raichle y Gusnard, "Appraising the Brain's Energy Budget", que a su vez cita, por ejemplo, Clarke y
Sokoloff, "Circulación y metabolismo energético del cerebro".
cerebros intentan minimizar la cantidad de neuronas: utilizando esta estrategia de inspiración neuronal (conocida como
"Codificación escasa"), los investigadores han desarrollado neuronas artificiales que tienen propiedades similares a las
que se encuentra en la corteza visual. Véase Olshausen y Field, “Emergencia del campo receptivo de células simples
Propiedades ”.
innovadora "optimización de la cartera de varianza media" : el trabajo para el que Markowitz fue
galardonado con el Premio Nobel aparece en su artículo “Portfolio Selection” y en su libro Portfolio Selection:
Diversificación eficiente de inversiones .
"Dividí mis contribuciones al cincuenta por ciento": Harry Markowitz, citado en Jason Zweig, "How the Big
Brains Invest at TIAA – CREF ”, Money 27 (1): 114, enero de 1998.
"Menos información, cálculo y tiempo": Gigerenzer y Brighton, "Homo Heuristicus".
más que cuadriplicado desde mediados de la década de 1990 hasta 2013: de la Asociación de Alimentos de Soja del Norte
America, "Sales and Trends", http://www.soyfoods.org/soy-products/sales-and-trends, que a su vez
cita una investigación "realizada por Katahdin Ventures".
"Las nueces están de moda ahora": Vanessa Wong, "Drinkable Almonds", Bloomberg Businessweek , agosto
21 de 2013.
asombroso trescientas veces desde 2004: Lisa Roolant, “Why Coconut Water Is Now $ 1
Billion Industry ”, TransferWise, https://transferwise.com/blog/2014-05/why-coconut-water-is-now-a-
Mil millones de industria / .
"Saltó de lo invisible a lo inevitable": David Segal, "Por Coconut Waters, una lucha callejera por
Shelf Space ”, New York Times , 26 de julio de 2014.
el mercado de la col rizada creció un 40%: "Las ventas de la col rizada se disparan mientras los chefs famosos destacan los beneficios para la salud"
The Telegraph , 25 de marzo de 2013
Pizza Hut, que lo incluyó en sus barras de ensaladas: Ayla Withee, “Kale: One Easy Way to Add More
Superalimentos para su dieta ”, Boston Magazine , 31 de mayo de 2012.
los cuerpos de los primeros vertebrados se torcieron 180 grados: Kinsbourne, "Somatic Twist". Discusión adicional de
La estructura del cuerpo y los órganos de los vertebrados primitivos se puede encontrar en Lowe et al., “Dorsoventral
Patrones en hemicordados ". Una descripción general más accesible es Kelly Zalocusky, "Pregunte a un
Neurocientífico: ¿Por qué se debilita el sistema nervioso? ” Stanford Neuroblog , 12 de diciembre,
2013, https://neuroscience.stanford.edu/news/ask-neuroscientist-why-does-nervous-system-
decusar .
los huesos de la mandíbula aparentemente fueron reutilizados: Ver, por ejemplo, "Jaws to Ears in the Ancestors of
Mammals, ”Understanding Evolution, http://evolution.berkeley.edu/evolibrary/article/evograms_05.
"La premisa de que no podemos medir lo que importa": "El mundo aterrador del Sr. Mintzberg",
entrevista con Simon Caulkin, Guardian , 25 de enero de 2003,
Página 372
http://www.theguardian.com/business/2003/jan/26/theobserver.observerbusiness11.
“La vida entera como una abeja neutra”: Darwin, La correspondencia de Charles Darwin, Volumen 2:
1837–1843 .
"¿Cuando? Tarde o temprano ”: Ibid.
8. RELAJACIÓN
"Diseñar con éxito un inhibidor peptídico": Meghan Peterson (de soltera Bellows), entrevista personal,
23 de septiembre de 2014.
alrededor de 11107 posibles planes de asientos: más precisamente, habría 11107 posibilidades si tuviéramos
elegir una asignación de mesa para cada persona de forma independiente. El número es un poco menor una vez que tomamos
teniendo en cuenta la limitación de que sólo 10 personas pueden sentarse en cada mesa. Pero sigue siendo enorme.
Bellows estaba satisfecho con los resultados de la computadora: el marco formal que Meghan Bellows
utilizado para resolver el cuadro de asientos de su boda se describe en Bellows y Peterson, "Encontrar un óptimo
Plano de la sala."
Lincoln trabajó como "abogado de la pradera": puede leer más sobre el circuito de Lincoln en Fraker, "The
Autopista Lincoln real ".
"El problema del mensajero postal": Menger, "Das botenproblem", contiene una conferencia impartida por Menger
sobre el tema en Viena el 5 de febrero de 1930. Para una historia más completa del problema del viajante
consulte Schrijver, "Sobre la historia de la optimización combinatoria", así como el libro muy legible de Cook
En busca del vendedor ambulante .
compañero matemático Merrill Flood: Flood, "El problema del viajante-vendedor".
El nombre icónico apareció por primera vez impreso: Robinson, On the Hamiltonian Game .
"Los resultados de imposibilidad también serían valiosos": Flood, "El problema del vendedor ambulante".
"No hay un buen algoritmo para el problema del viajante de comercio": Edmonds, "Optimum Branchings".
qué hace que un problema sea factible: Cobham, "The Intrinsic Computational Difficulty of Functions",
considera explícitamente la cuestión de qué debe considerarse un algoritmo "eficiente". Similar,
Edmonds, "Senderos, árboles y flores", explica por qué es importante una solución a un problema difícil
y, al defender esta solución en particular, establece un marco general para lo que hace
buenos algoritmos.
el marcador de fuera de límites de facto del campo: hay, de hecho, algoritmos que se ejecutan más lento que
tiempo polinomial pero más rápido que el tiempo exponencial; estos tiempos de ejecución "superpolinomiales" también los ponen
fuera del conjunto de algoritmos eficientes.
que se resuelvan de manera eficiente o no: el conjunto de problemas que se pueden resolver de manera eficiente en ciencias de la computación es
llamado P , abreviatura de "tiempo polinomial". El controvertido conjunto de problemas liminales, mientras tanto, es
conocido como NP , para "polinomio no determinista". Los problemas en NP pueden tener sus soluciones verificadas
de manera eficiente una vez encontrado, pero si todos los problemas que se pueden verificar fácilmente también se pueden
resuelto es desconocido. Por ejemplo, si alguien le muestra una ruta y dice que es menos de 1,000
millas, el reclamo es fácil de verificar, pero encontrar una ruta de menos de 1,000 millas o probar que es
imposible, es otra hazaña por completo. La cuestión de si P = NP (es decir, si es posible
Página 373
saltar de manera eficiente a las soluciones de problemas NP ) es el mayor misterio sin resolver en la computadora
Ciencias.
El principal avance hacia una solución ha sido la demostración de que existen ciertos problemas
con un estado especial: si uno de ellos puede resolverse de manera eficiente, entonces cualquier problema en NP se puede resolver
eficientemente y P = NP (Cook, "La complejidad de los procedimientos de demostración de teoremas"). Estos son conocidos
como problemas “ NP- difíciles”. En ausencia de una respuesta a si P = NP , los problemas en NP no se pueden resolver.
resuelto de manera eficiente, por lo que nos referimos a ellos como "intratables". (En "Una propuesta terminológica",
Donald Knuth sugirió esto como una etiqueta apropiada para NP -problemas difíciles, además de ofrecer una
pavo vivo a cualquiera que pudiera probar P = NP .) Los problemas de programación intratables que Eugene
Lawler encontrado en el capítulo 5 cae en esta categoría. Un problema NP- difícil que está en sí mismo en NP es
conocido como " NP -completo". Ver Karp, "Reducibilidad entre problemas combinatorios", para el clásico
resultado que muestra que una versión del problema del viajante es NP -completo, y ahora, el
Golden Ticket: P, NP y la búsqueda de lo imposible , para una introducción accesible a P y NP .
la mayoría de los científicos informáticos creen que no hay ninguno: en una encuesta de 2002 de cien
informáticos teóricos, sesenta y un pensaron P ≠ NP y sólo nueve pensaron P = NP (Gasarch,
“La P =? Encuesta NP ”). Si bien se puede demostrar que P = NP se puede hacer exhibiendo un polinomio-tiempo
algoritmo para un problema NP -completo, demostrar que P ≠ NP requiere hacer argumentos complejos sobre
los límites de los algoritmos de tiempo polinomial, y no hubo mucho acuerdo entre la gente
encuestados sobre exactamente qué tipo de matemáticas se necesitarán para resolver este problema. Pero sobre
la mitad de ellos pensaba que el problema se resolvería antes de 2060.
Además, muchos otros problemas de optimización: esto incluye versiones de cobertura de vértices y conjunto
cubrir — dos problemas identificados como pertenecientes a NP en Karp, “Reducibilidad entre combinaciones
Problemas ”, donde se demostró que veintiún problemas estaban en este conjunto. Por el final de la
1970, los científicos de la computación habían identificado unos trescientos problemas NP- completos (Garey y
Johnson, Computers and Intractability ), y la lista ha crecido significativamente desde entonces. Éstos incluyen
algunos problemas que son muy familiares para los humanos. En 2003, se demostró que el Sudoku era NP -completo
(Yato y Seta, "Complejidad e integridad"), así como maximizar el número de filas despejadas en
Tetris, incluso con un conocimiento perfecto de piezas futuras (Demaine, Hohenberger y Liben-Nowell,
“Tetris es difícil, incluso aproximado”). En 2012, determinar si existe un camino hacia el final
del nivel en juegos de plataformas como Super Mario Brothers se agregó oficialmente a la lista (Aloupis,
Demaine y Guo, "Los juegos clásicos de Nintendo son ( NP -) difíciles").
“Todavía tienes que luchar”: Jan Karel Lenstra, entrevista personal, 2 de septiembre de 2014.
“Lo perfecto es enemigo de lo bueno”: pareado de Voltaire Dans ses écrits, un sage Italien / Dit que
le mieux est l'ennemi du bien (“En sus escritos, un sabio italiano / Dice que lo perfecto es enemigo de la
bueno ”) aparece al comienzo de su poema“ La Bégueule ”. Voltaire había citado anteriormente al italiano
expresión “Le meglio è l'inimico del bene” en su Dictionnaire philosophique de 1764 .
sus mentes también se vuelven hacia la relajación: Shaw, Introducción a los métodos de relajación ; Henderson,
Técnicas de relajación discretas . Lector de advertencia : las matemáticas son lo suficientemente intensas como para
de lectura relajante.
para el circuito judicial de Lincoln: las ciudades del circuito judicial de Lincoln se derivan del 1847–
Mapa de 1853 del Octavo Circuito Judicial en la Revista de la Asociación Abraham Lincoln . Ver
http: //quod.lib.u mich.edu/j/jala/images/fraker_fig01a.jpg.
Página 374
prácticamente nada de tiempo: bueno, está bien, un poco de tiempo, lineal en el número de ciudades si estás
afortunado, linearítmico si no lo eres. Pettie y Ramachandran, “Un árbol de expansión mínimo óptimo
Algoritmo."
el árbol de expansión, con su retroceso libre: abordar el problema del vendedor ambulante a través de la
El árbol de expansión mínimo se analiza en Christofides, Worst-Case Analysis of a New Heuristic .
visita todas las ciudades de la Tierra: para obtener más información sobre el estado del arte en las ciudades de todo el mundo que viajan
problema del vendedor (el llamado "TSP mundial"), se puede encontrar un informe actualizado en
http://www.math.uwaterloo.ca/tsp/world/. Para obtener más información sobre el problema del viajante de comercio en general,
Cook, In Pursuit of the Travelling Salesman , es una buena referencia general, y Lawler et al., The
Viajero Problema del Vendedor , satisfará a aquellos que quieran profundizar.
Encontrar el conjunto mínimo de ubicaciones: este clásico problema de optimización discreta se conoce como el
Problema de "establecer cubierta".
“Cuando no puedes hacer la mitad de esto”: Laura Albert McLay, entrevista personal, 16 de septiembre de 2014.
le permite lamer la menor cantidad de sobres: En ciencias de la computación, esto se conoce como el problema de la “cobertura de vértices”.
Es una especie de primo del problema de la cobertura del set, donde en lugar de buscar el menor número de disparos
estaciones cuya cobertura incluye a todos, el objetivo es encontrar el menor número de personas que estén
conectado con todos los demás.
resolver las versiones continuas de estos problemas: hay ciertos tipos de

problemas de optimización que se pueden resolver en tiempo polinomial; el ejemplo más destacado es lineal
problemas de programación, en los que tanto la métrica a optimizar como las limitaciones de la solución
se puede expresar como una función lineal de las variables involucradas. Véase Khachiyan, “Polynomial
Algoritmos en programación lineal ”y Karmarkar,“ Un nuevo algoritmo de tiempo polinomial para
Programación lineal." Sin embargo, la optimización continua no es una panacea: también hay clases de
problemas de optimización continua que son intratables. Por ejemplo, vea Pardalos y Schnitger,
"Comprobar la optimización local en la programación cuadrática restringida es NP- difícil".
como máximo el doble de invitaciones: Khot y Regev, "Vertex Cover podría ser difícil de aproximar
dentro de 2- ε ".
rápidamente nos coloca dentro de un límite cómodo: para obtener más información sobre estas aproximaciones, consulte Vazirani,
Algoritmos de aproximación .
no es una bala mágica: sigue siendo una pregunta abierta dentro del campo si la relajación continua incluso
ofrece la mejor aproximación posible para el problema de cobertura mínima de vértices (invitaciones a fiestas), o
si se pueden encontrar mejores aproximaciones.
“¡Inconcebible!”: La princesa prometida , guión de William Goldman; 20th Century Fox, 1987.
técnica computacional llamada Relajación Lagrangiana : Relajación Lagrangiana (inicialmente deletreada

"Lagrangean") recibió su nombre de Arthur M. Geoffrion de UCLA en "Lagrangean Relaxation for
Programación de enteros ". Se considera que la idea en sí surgió en la obra de Michael Held (de
IBM) y Richard Karp (de UC Berkeley) sobre el problema del viajante de comercio en 1970; ver Held y
Karp, "El problema del vendedor ambulante y los árboles de expansión mínima", y Held y Karp, "El
Problema del vendedor ambulante y árboles de expansión mínima: Parte II ". Los precursores anteriores, sin embargo,
también existen, por ejemplo, Lorie y Savage, "Tres problemas en el racionamiento del capital"; Everett III,
“Método multiplicador de Lagrange generalizado”; y Gilmore y Gomory, "A Linear Programming
Página 375
Enfoque del problema del material de corte, parte II ". Para obtener una descripción general y reflexiones, consulte Fisher, “The
Método de relajación lagrangiana para resolver problemas de programación de enteros ”, así como Geoffrion,
"Relajación lagrangiana para la programación de enteros".
"Si terminas con juegos fraccionarios": Michael Trick, entrevista personal, 26 de noviembre de 2013.
"La fantasía nunca se puede reconciliar": Christopher Booker, "What Happens When the Great
¿Las fantasías, como la energía eólica o la Unión Europea, chocan con la realidad? ” , The Telegraph , 9 de abril de
2011.
9. ALEATORIA
"Por qué y cómo es absolutamente misterioso": Citado en Shasha y Rabin, "Una entrevista con
Michael Rabin ".
utiliza un algoritmo aleatorio: los algoritmos aleatorios se discuten en detalle en Motwani y

Raghavan, algoritmos aleatorios y Mitzenmacher y Upfal, probabilidad y computación .
Karp proporciona introducciones más breves pero más antiguas, "Una introducción a los algoritmos aleatorios",
y Motwani y Raghavan, "Algoritmos aleatorios".
un interesante análisis probabilístico: Buffon, "Essai d'arithmétique morale".
simplemente dejando caer agujas sobre el papel: Laplace, Théorie analytique des probabilités .
Lazzarini supuestamente hizo 3.408 lanzamientos: Lazzarini, “Un'applicazione del calcolo della
probabilità. "
hace que el informe de Lazzarini parezca sospechoso: para una discusión más detallada de los resultados de Lazzarini, ver
Gridgeman, "Probabilidad geométrica y el número π ", y Badger, "Lazzarini's Lucky
Aproximación de π ”.
había contraído encefalitis: la historia de Ulam aparece en Ulam, Adventures of a Mathematician .
"La prueba de una inteligencia de primer nivel": Fitzgerald, "The Crack-Up". Posteriormente recopilado con otros ensayos
en The Crack-Up .
“Puede ser mucho más práctico”: Ulam, Adventures of a Mathematician , págs. 196-197. Calculador
las probabilidades de ganar para el solitario Klondike siguen siendo un área activa de investigación hasta el día de hoy, impulsada principalmente
por simulación de Monte Carlo. Para ver un ejemplo de trabajo reciente en el área, vea Bjarnason, Fern y
Tadepalli, "Solitario Klondike de límite inferior con planificación de Montecarlo".
Metropolis nombró este enfoque: Metropolis reclama los derechos de denominación en una carta que aparece en
Hurd, "Note on Early Monte Carlo Computations".
descendiente de una larga línea de rabinos: Shasha y Lazere, fuera de sus mentes .
múltiples caminos que podría seguir: el artículo clave de Rabin aquí, en coautoría con Dana Scott, fue "Finite
Autómatas y sus problemas de decisión ". Ya hemos encontrado una de las formas en que esto
concepto se convirtió en central para la informática teórica en nuestra discusión de la clase de complejidad de
el problema del viajante en el capítulo 8; La noción de Rabin de computación "no determinista" es la
“ N ” de NP .
“Una de las ramas más evidentemente inútiles”: la cita es de Hardy, “Prime Numbers”; ver
también Hardy, Collected Works . Para obtener más información sobre la influencia de los números primos en la criptografía, consulte
por ejemplo, Schneier, Applied Cryptography .
Página 376
En el cifrado moderno, por ejemplo: un algoritmo ampliamente utilizado que se basa en la multiplicación
de números primos es RSA, que significa las iniciales de sus inventores: Ron Rivest, Adi Shamir y
Leonard Adleman. Consulte Rivest, Shamir y Adleman, “Un método para obtener firmas digitales
y criptosistemas de clave pública ". Otros sistemas criptográficos, por ejemplo, Diffie-Hellman, también utilizan
números primos; consulte Diffie y Hellman, "New Directions in Cryptography".
El problema, sin embargo, son los falsos positivos: el posible avance, o la falta de él, en Miller's
El enfoque se reduciría a la facilidad con la que estos falsos positivos podrían descartarse. Cuantos valores
de x ¿necesita verificar para estar seguro acerca de un número dado n ? Miller demostró que si el "generalizado
Hipótesis de Riemann ”eran verdaderas, el número mínimo de testigos potenciales que necesitarían ser
marcado es O ((log n ) 2 ), mucho menos que el requerido por algoritmos como el Tamiz de Erastothenes.
Pero aquí estaba el problema: la hipótesis generalizada de Riemann no estaba —y sigue estando— sin demostrar.
(La hipótesis de Riemann, ofrecida por primera vez por el matemático alemán Bernhard Riemann en 1859,
se refiere a las propiedades de una función matemática compleja llamada función zeta de Riemann. Esta
La función está íntimamente relacionada con la distribución de números primos y, en particular, con qué regularidad
esos números aparecen en la recta numérica. Si la hipótesis es cierta, entonces los números primos son suficientemente buenos
se comportó como para garantizar la eficiencia del algoritmo de Miller. Pero nadie sabe si es verdad. De hecho,
La hipótesis de Riemann es uno de los seis principales problemas abiertos en matemáticas cuyas soluciones
Clay Mathematics Institute otorgará un "Premio del Milenio" de $ 1 millón. La pregunta de si
P = NP , que vimos en el capítulo 8, también es un problema del Premio del Milenio).
“Michael, este es Vaughan”: Rabin cuenta esta historia en Shasha y Lazere, Out of Their Minds .
identificar rápidamente incluso los números primos gigantes: el artículo de Rabin sobre su prueba de primalidad, "Probabilistic
Algoritmo para probar la primordialidad ”, apareció unos años más tarde. Paralelamente, Robert Solovay y Volker
Strassen había desarrollado un algoritmo probabilístico similar basado en un conjunto diferente de ecuaciones que
los primos deben obedecer, aunque su algoritmo fue menos eficiente; véase Solovay y Strassen, "A Fast
Prueba de Monte-Carlo para la primacía ".
menos de uno en un millón de billones de billones: la documentación de OpenSSL especifica una función para
"Realizar una prueba de primalidad probabilística Miller-Rabin con ... una serie de iteraciones utilizadas ... que produce
una tasa de falsos positivos de como máximo 2 −80 para entrada aleatoria ”; ver
https://www.openssl.org/docs/crypto/BN_generate_prime.html . Asimismo, la información federal de EE. UU.
El estándar de procesamiento (FIPS) especifica que su estándar de firma digital (DSS) acepta el error
probabilidad de 2 −80 (para claves de 1.024 bits, al menos); consulte Gallagher y Kerry, Estándar de firma digital .
Cuarenta pruebas de Miller-Rabin son suficientes para lograr este límite, y el trabajo de la década de 1990 ha sugerido
que en muchos casos bastará con tan solo tres pruebas de Miller-Rabin. Vea Damgård, Landrock y
Pomerance, "Estimaciones de error de caso promedio para la prueba de prima probable fuerte"; Burthe Jr., “Más
Investigaciones con la prueba de prima probable fuerte ”; y Menezes, Van Oorschot y Vanstone,
Handbook of Applied Cryptography , así como una discusión más reciente en
http://security.stackexchange.com/questions/4544/how-many-iterations-of-rabin-miller-should-be-
usado-para-generar-seguridad-criptográfica .
para el número de granos de arena: El número de granos de arena en la Tierra se estima a partir de varios
fuentes entre 10 18 y 10 24 .
si alguna vez habrá un algoritmo eficiente: aquí, por "eficiente", estamos utilizando el campo
definición estándar, que es "tiempo polinomial", como se discutió en el capítulo 8.
Página 377
se descubrió uno de esos métodos: Agrawal, Kayal y Saxena, "PRIMES Is in P ".
generar algunas xs aleatorias y conectarlas: Uno de los resultados clave sobre el papel de la aleatoriedad en
La prueba de identidad polinomial es lo que se llama el "lema de Schwartz-Zippel". Véase Schwartz, "Fast
Algoritmos probabilísticos para la verificación de identidades polinomiales ”; Zippel, “Algoritmos probabilísticos
para polinomios dispersos ”; y DeMillo y Lipton, “A Probabilistic Remark on Algebraic Program
Pruebas."
el único práctico que tenemos: ¿ habrá un algoritmo determinista eficiente para la identidad polinomial
¿Alguna vez se han encontrado pruebas? En términos más generales, ¿ tiene que existir un algoritmo determinista eficiente en cualquier lugar?
encontramos uno bueno al azar? ¿O podría haber problemas que los algoritmos aleatorios puedan resolver?
eficientemente pero que los algoritmos deterministas simplemente no pueden? Es un problema interesante en teoría
informática, y la respuesta a ella aún se desconoce.
Uno de los enfoques que se ha utilizado para explorar la relación entre aleatorizado y
Los algoritmos deterministas se denominan desaleatorización , básicamente , tomar algoritmos aleatorios y
quitando la aleatoriedad de ellos. En la práctica, es difícil para una computadora acceder a
aleatoriedad, por lo que cuando las personas implementan un algoritmo aleatorizado, a menudo usan un determinista
procedimiento para generar números que obedezcan a ciertas propiedades estadísticas de verdadera aleatoriedad.
La desaleatorización hace esto explícito, examinando lo que sucede cuando la aleatoriedad en aleatorización
los algoritmos son reemplazados por la salida de algún otro proceso computacional complejo.
El estudio de la desaleatorización muestra que es posible convertir algoritmos aleatorizados eficientes en
algoritmos deterministas eficientes, siempre que pueda encontrar una función que sea lo suficientemente compleja como para
su salida parece aleatoria pero lo suficientemente simple como para que se pueda calcular de manera eficiente. Para (detallado)
detalles, consulte Impagliazzo y Wigderson, " P = BPP si E requiere circuitos exponenciales", y
Impagliazzo y Wigderson, "Randomness vs. Time".
llamó el "velo de la ignorancia": El velo de la ignorancia se introduce en Rawls, A Theory of Justice .
Críticos filosóficos de Rawls: El más destacado entre los críticos de Rawls fue el economista John Harsanyi;
ver, por ejemplo, Harsanyi, “¿Puede el principio de Maximin servir como base para la moralidad? Una crítica de Juan
Teoría de Rawls ".
la civilización de Omelas: Le Guin, "Los que se alejan de Omelas".
Estas son críticas valiosas: para obtener más información sobre lo que a veces se llama "la conclusión repugnante", consulte
Parfit, Reasons and Persons , así como, por ejemplo, Arrhenius, “An Impossibility Theorem in
Axiología de la población ".
" Preocupación de los ingenieros más que de los filósofos": Aaronson, "Why Philosophers Should Care
Acerca de la complejidad computacional ".
"Notó algo que no ve a menudo": Rebecca Lange, "¿Por qué tan pocas historias?"
blog, 12 de noviembre de 2014, https://www.givedirectly.org/blog-post.html?id=2288694352161893466 .
"Me refiero a capacidad negativa": John Keats, carta a George y Thomas Keats, 21 de diciembre,
1817.
"Seguridad suficiente para los propósitos de la vida humana": John Stuart Mill, On Liberty (1859).
“Debería haber un juego de beber”: Michael Mitzenmacher, entrevista personal. 22 de noviembre

2013.
Página 378
más de un billón de URL distintas: "Sabíamos que la Web era grande ..." 25 de julio de 2008,
http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html.
pesa alrededor de setenta y siete caracteres: Kelvin Tan, "Longitud promedio de una URL (Parte 2)",
16 de agosto de 2010, http://www.supermind.org/blog/740/average-length-of-a-url-part-2 .
la URL se ingresa en un conjunto de ecuaciones: Bloom, "Compensación de espacio / tiempo en codificación hash con
Errores permitidos ".
enviado con varios navegadores web recientes: Google Chrome hasta al menos 2012 usaba un Bloom
filtro: consulte http://blog.alexyakunin.com/2010/03/nice-bloom-filter-application.html y
https://chromiumcodereview.appspot.com/10896048/ .
parte de criptomonedas como Bitcoin: Gavin Andresen, "Informe de estado de desarrollo principal n. ° 1",
1 de noviembre de 2012, https://bitcoinfoundation.org/2012/11/core-development-status-report-1/.
“El río serpentea”: Richard Kenney, “Hidrología; Lacrimación ”, en The One-Strand River:
Poems, 1994-2007 (Nueva York: Knopf, 2008).
utilice este enfoque cuando intente descifrar códigos: consulte Berg-Kirkpatrick y Klein, “Decipherment
con un millón de reinicios aleatorios ".
llamado algoritmo de Metropolis: a veces también conocido como el algoritmo de Metropolis-Hastings,

esta técnica se describe en Metropolis et al., “Ecuación de cálculos de estado por computación rápida
Machines ”y Hastings,“ Métodos de Monte Carlo que utilizan cadenas de Markov y sus aplicaciones ”.
El algoritmo de Metropolis fue desarrollado por Nicholas Metropolis y los dos esposos
equipos de Marshall y Arianna Rosenbluth y Edward y Augusta Teller en la década de 1950. Metrópoli
fue el primer autor del artículo que describió el algoritmo, por lo que hoy se conoce como Metropolis
Algoritmo, que es doblemente irónico. Por un lado, Metropolis aparentemente hizo poca contribución a
el desarrollo del algoritmo, siendo catalogado como autor por cortesía, como jefe de la
laboratorio de computación (ver Rosenbluth, Marshall Rosenbluth, entrevistado por Kai-Henrik Barth ).
Es más, al propio Metropolis le gustaba dar nombres ilustrativos a las cosas: afirmó haber nombrado
los elementos químicos tecnecio y astato, así como el ordenador MANIAC y el Monte
La propia técnica de Carlo (Hurd, "Nota sobre los primeros cálculos de Monte Carlo").
"Cultivo de un solo cristal a partir de una fusión": Kirkpatrick, Gelatt y Vecchi, "Optimización por
Recocido simulado ".
“El tipo que fue el mejor en IBM”: Scott Kirkpatrick, entrevista personal, 2 de septiembre de 2014.
Por último nos gustaría empezar a ir solamente subiendo: Si esta idea-empezando estar dispuesto a moverse
entre las opciones y, a continuación, centrarse más en las buenas; suena familiar, debería: optimizar
una función compleja requiere enfrentarse al intercambio de exploración / explotación. Y la aleatoriedad resulta ser un
fuente de estrategias bastante buenas para resolver problemas como bandidos armados múltiples, así como el tipo de
problemas de optimización en los que se centró Kirkpatrick.
Si recuerdas, el bandido de múltiples brazos nos ofrece varias opciones diferentes (brazos que podemos tirar) que
proporcionar beneficios diferentes y desconocidos. El desafío es encontrar el equilibrio entre probar nuevas opciones
(explorar) y buscar la mejor opción encontrada hasta ahora (explotar). Ser más optimista y más
Lo mejor es explorar desde el principio, volverse más exigente y explotar más después. Persiguiendo tal
La estrategia de disminuir gradualmente el optimismo acerca de las alternativas promete el mejor resultado posible.
Página 379
esperanza para: acumular arrepentimientos a un ritmo decreciente, con su arrepentimiento total aumentando como un logarítmico
función del tiempo.
La aleatoriedad proporciona una estrategia alternativa al optimismo. Intuitivamente, si el problema es uno de
equilibrando la exploración y la explotación, ¿por qué no hacerlo de forma explícita? Gasta una cantidad de tu
tiempo explorando y algo de explotación. Y esa es exactamente la estrategia que ese bandido de múltiples brazos
los expertos llaman a Epsilon Greedy .
Epsilon Greedy tiene dos partes: Epsilon y Greedy. La parte de Epsilon es que algunos pequeños
proporción del tiempo (los matemáticos usan la letra épsilon para denotar un número pequeño),
elija al azar entre sus opciones. La parte codiciosa es que el resto del tiempo te tomas el
la mejor opción que has encontrado hasta ahora. Así que entra al restaurante y lanza una moneda (o tira un dado, según
sobre su valor de épsilon) para decidir si probar algo nuevo. Si dice que sí, cierra los ojos y
apuntar al menú. Si no, disfruta
Desafortunadamente, de tu favoritode
a los investigadores actual.
bandidos con múltiples brazos no les gusta especialmente Epsilon Greedy. Parece
derrochador: se le garantiza que dedicará una parte de su tiempo a probar cosas nuevas, incluso si lo mejor
se aclara muy rápidamente. Si sigues a Epsilon Greedy, entonces tu arrepentimiento aumenta linealmente en el
número de veces que juegas. Cada vez que cenas, existe la posibilidad de que elijas
algo diferente a lo mejor, por lo que su arrepentimiento promedio aumenta en la misma cantidad cada vez. Esta
El crecimiento lineal es mucho peor que el arrepentimiento logarítmico garantizado por algoritmos deterministas basados
en optimismo debidamente calibrado.
Pero si la sencillez de Epsilon Greedy es atractiva, hay buenas noticias. Hay una variante simple
de este algoritmo, lo que llamamos Epsilon-Over- N Greedy , que garantiza logarítmica
lamenta, y funciona bien en la práctica (véase Auer, Cesa-Bianchi y Fischer, “Finite-Time Analysis of
el problema del bandido multiarmado ”). El truco consiste en reducir la posibilidad de probar algo nuevo
tiempo. La primera vez que hace una elección, elige al azar con probabilidad 1/1 (también conocido como siempre). Si
esa opción es buena, entonces la segunda vez que elijas al azar con probabilidad 1/2 (también conocido como voltear una
moneda: cara toma la misma opción, cruz prueba algo nuevo). En la visita tres, debe elegir
lo mejor con probabilidad 2/3, y pruebe algo nuevo con probabilidad 1/3. En el N º visita a
el restaurante, eliges al azar con probabilidad 1 / N , en caso contrario tomando la mejor opción
descubierto hasta ahora. Al disminuir gradualmente la probabilidad de probar algo nuevo, llega al dulce
lugar entre exploración y explotación.
También hay otro algoritmo más sofisticado para interpretar al bandido de múltiples brazos que
también hace uso de la aleatoriedad. Se llama Thompson Sampling , llamado así por William R.
Thompson, el médico de Yale que planteó por primera vez el problema (en 1933) de cómo elegir entre
dos tratamientos (Thompson, "Sobre la probabilidad de que una probabilidad desconocida supere a otra").
La solución de Thompson era simple: usando la regla de Bayes, calcule la probabilidad de que cada tratamiento sea
lo mejor. Luego elija ese tratamiento con esa probabilidad . Para empezar no sabes nada, y tu
tienen la misma probabilidad de elegir cualquiera de los tratamientos. A medida que se acumulan los datos, favorece a uno sobre el
otros, pero algunas veces todavía elige el tratamiento que no prefiere y tiene la oportunidad de cambiar
tu mente. A medida que esté más seguro de que un tratamiento es mejor, casi siempre terminará
usando ese tratamiento. Thompson Sampling equilibra la exploración y la explotación con elegancia, y también
garantiza que el arrepentimiento aumentará sólo logarítmicamente (ver Agrawal y Goyal, "Análisis de
Muestreo de Thompson ”).
La ventaja de Thompson Sampling sobre otros algoritmos para resolver bandidos de múltiples brazos
problemas es su flexibilidad. Incluso si las suposiciones del problema cambian, tiene información
sugiriendo que una opción es mejor que las otras, las opciones dependen unas de otras, las opciones cambian
Página 380
tiempo: la estrategia de Thompson de buscar opciones con una probabilidad que refleje su sensación de que
son los mejores actualmente disponibles que aún funcionan. Entonces, en lugar de tener que derivar un nuevo algoritmo en cada uno de
En estos casos, podemos simplemente aplicar la regla de Bayes y usar los resultados. En la vida real, esos bayesianos
Los cálculos pueden ser difíciles (el propio Thompson necesitó varias páginas de intrincadas matemáticas para resolver
el problema con solo dos opciones). Pero tratando de elegir la mejor opción y permitiendo una cantidad de
la aleatoriedad de sus elecciones que se ve atenuada por su grado de certeza es un algoritmo que se
Es poco probable que te lleve por mal camino.
citó la friolera de treinta y dos mil veces: El libro de texto de IA predominante, Inteligencia artificial:
A Modern Approach , declara que el recocido simulado “es ahora un campo en sí mismo, con cientos de
artículos publicados cada año ”(p. 155).
uno de los enfoques de optimización más prometedores: Curiosamente, un artículo de 2014 parece
demostrar que las medusas utilizan el recocido simulado en la búsqueda de alimento; ver Reynolds, “Firmas de
Búsqueda de Lévy optimizada activa y pasiva en medusas ".
“Yo mismo no soy un jugador”: Luria, Una máquina tragamonedas, un tubo de ensayo roto , p. 75. También discutido en
Garfield, "Reconociendo el papel del azar".
acuñó el término "serendipia": En Horace Walpole, carta a Horace Mann (fechada el 28 de enero de 1754).
"Un paralelo notable": James, "Grandes hombres, grandes pensamientos y el medio ambiente".
"Un proceso de variación ciega y retención selectiva": Campbell, "Variación ciega y selectiva
Retencion."
“Newton, Mozart, Richard Wagner y otros”: Citado en ibid.
“Formas de sacarte del encuadre”: Brian Eno, entrevistado por Jools Holland, en Later ...
con Jools Holland , mayo de 2001.
"Deseo vago y constante": la palabra es saudade , y la definición citada proviene de Bell, en
Portugal .
"Es estúpido sacudirlo más": Tim Adams, "Dicing with Life" , Guardian , 26 de agosto de 2000.
10. REDES
"La conexión tiene una amplia variedad de significados": Cerf y Kahn, "Un protocolo para redes de paquetes
Intercomunicación."
“Solo conéctese”: Forster, Howards End .
“Teléfono celular real, portátil y de mano”: Martin Cooper, “Inventor del teléfono celular: sabíamos
Algún día todos tendrían uno ”, entrevista con Tas Anjarwalla, CNN, 9 de julio de 2010.
El mensaje era "iniciar sesión", o habría sido: Leonard Kleinrock cuenta la historia en un video de 2014
entrevista realizada por Charles Severence y disponible en “Len Kleinrock: The First Two Packets
en Internet ”, https://www.youtube.com/watch?v=uY7dUJT7OsU.
portentoso y del Antiguo Testamento a su pesar: dice Leonard Kleinrock de UCLA, "No planeamos
eso, pero no podríamos haber encontrado un mensaje mejor: breve y profético ". Las baldosas del suelo de
Boelter Hall de UCLA, si sus colores se interpretan como 0 y 1 binarios y se analizan como ASCII
personajes, deletree la frase "¡LO Y HE AQUÍ!" El crédito de este homenaje es para el arquitecto Erik
Hagen. Véase, por ejemplo, Alison Hewitt, "Descubra el mensaje codificado oculto en los azulejos del suelo del campus",
Página 381
Sala de prensa de UCLA , 3 de julio de 2013, http://newsroom.ucla.edu/stories/a-coded-message-hidden-in-floor-

247232 .
enraizado en el griego protokollon : Ver, por ejemplo, el Diccionario de Etimología en línea,

http://www.etymonline.com/index.php?term=protocol .
“¡Se disparan! y están callados ”: Leonard Kleinrock,“ Computing Conversations: Len Kleinrock
sobre la teoría de los paquetes ”, entrevista con Charles Severance (2013). Ver
https://www.youtube.com/watch?v=qsgrtrwydjw así como
http://www.computer.org/csdl/mags/co/2013/08/mco2013080006.html.
"Herejía absoluta": Jacobson, "Una nueva forma de ver las redes".
"Así que el niño se fue": Kleinrock, "Computing Conversations".
se conocería como conmutación de paquetes : el término "conmutación de paquetes" proviene de Donald W.

Davies del Laboratorio Nacional de Física, otro contribuyente clave a la investigación de conmutación de paquetes en
el tiempo.
"Una ilusión consensuada entre los dos puntos finales": Stuart Cheshire, entrevista personal, febrero
26 de diciembre de 2015.
las comunicaciones podrían sobrevivir a un ataque nuclear: Baran, "On Distributed Communications".
una red en crecimiento se convierte en una virtud: para la elaboración de este punto, y una reflexión más amplia sobre el
historia de las redes (incluidos sus problemas actuales), consulte Jacobson, “A New Way to Look at
Redes."
una red de conmutación de paquetes a través de "Avian Carriers": consulte Waitzman, A Standard for the
Transmisión de Datagramas IP en Avian Carriers , Waitzman, IP sobre Avian Carriers con Calidad de
Service , y Carpenter and Hinden, Adaptación de RFC 1149 para IPv6 para descripciones de aves
protocolo y ver http://www.blug.linux.no/rfc1149 para obtener detalles de la implementación real
realizado en Bergen, Noruega, el 28 de abril de 2001.
“Ninguna transmisión puede ser 100% confiable”: Cerf y Kahn, “Un protocolo para redes de paquetes
Intercomunicación."
el "problema de los generales bizantinos": Lamport, Shostak y Pease, "Los generales bizantinos
Problema."
señal de que la secuencia se ha restaurado: el proceso que se describe aquí se conoce como
retransmitir ".
casi el 10% del tráfico ascendente de Internet: Jon Brodkin, "Netflix ocupa el 9,5% del tráfico ascendente
en Internet de América del Norte: los paquetes ACK hacen de Netflix un monstruo de carga durante los picos de visualización
horas ”, Ars Technica , 20 de noviembre de 2014. Brodkin, a su vez, cita datos de Sandvine's Global
Informe de fenómenos de Internet , https://www.sandvine.com/trends/global-internet-phenomena/ .
“¿Se ha estrellado el receptor? ¿Son lentos? ”: Tyler Treat,“ No puedes tener exactamente una vez
Delivery ”, Brave New Geek: Introspections of a software engineer , 25 de marzo de 2015,
http://bravenewgeek.com/you-cannot-have-exactly-once-delivery/.
"Retransmisiones de extremo a extremo para recuperar": Vint Cerf, entrevistado por Charles Severance,
“Computación de conversaciones: Vint Cerf sobre la historia de los paquetes”, 2012.
Página 382
“Simplemente diga, 'Dígalo de nuevo'”: Ibid.
“La palabra más difícil de traducir del mundo”: Oliver Conway, “Congo Word 'Most
Untranslatable '”, BBC News , 22 de junio de 2004.
“Si al principio no tiene éxito”: Thomas H. Palmer, Teacher's Manual (1840), atestiguado en The
Diccionario Oxford de Proverbios , 2009.
tratando de vincular los siete campus de la universidad: Abramson, "The ALOHA System".
por encima de un mero 18,6% de utilización media: Ibid. De hecho, esta cifra es 1 ⁄ 2 e , exactamente la mitad de n ⁄ e , o
“37%”, cifra dada en la discusión de la parada óptima en el capítulo 1.
"Solo un esquema tiene alguna esperanza de funcionar": Jacobson, "Congestion Avoidance and Control".
un programa piloto llamado HOPE: El programa HOPE se evalúa en Hawken y Kleiman,

Manejo de personas en libertad condicional involucradas en drogas .
"Qué forma más loca de intentar cambiar": Para obtener más información, consulte, por ejemplo, "Un nuevo programa de libertad condicional
en Hawaii Beats the Statistics ”, PBS NewsHour , 2 de febrero de 2014.
"Esta repentina caída del factor de mil": Jacobson, "Congestion Avoidance and Control".
"Luego de repente se vino abajo": Jacobson, "Van Jacobson: The Slow-Start Algorithm", entrevista con
Charles Severance (2012), https://www.youtube.com/watch?v=QP4A6L7CEqA.
aumentar su velocidad de transmisión de forma agresiva: este procedimiento inicial: un paquete único tentativo
seguido de una aceleración dos por uno, se conoce en TCP como inicio lento. Este nombre es parcial
Nombre inapropiado: Slow Start es "lento" al comenzar con un solo primer paquete tentativo, pero no en su
crecimiento exponencial a partir de entonces.
"Control sin jerarquía": consulte, por ejemplo, Gordon, "Control sin jerarquía".
La solución de las hormigas es similar: los hallazgos que relacionan la búsqueda de alimento con algoritmos de control de flujo como Slow
Comience a aparecer en Prabhakar, Dektar y Gordon, "The Regulation of Ant Colony Forraging Activity
sin información espacial ".
"Tiende a elevarse a su nivel de incompetencia": Peter y Hull, The Peter Principle .
“Todo servidor público debería ser degradado”: este aforismo ampliamente reproducido, en el original
En español, dice: "Todos los empleados públicos deben descender a su inmediato inferior,
porque han sido ascendidos hasta volverse incompetentes ”.
ideado por el bufete de abogados líder Cravath, Swaine & Moore: el sistema Cravath es oficialmente
documentado en el sitio web de la propia firma: http://www.cravath.com/cravathsystem/ . El "arriba o fuera"
El componente del Sistema Cravath no se discute explícitamente allí, pero se hace referencia ampliamente
en otros lugares, por ejemplo, por la American Bar Association: "En la década de 1920, Cravath, Swaine & Moore se
el primer bufete de abogados registrado en contratar abiertamente de las facultades de derecho con el entendimiento expreso de que
muchos de los abogados jóvenes que contrató no se asociaron. Aquellos asociados que no hicieron
Se esperaba que su socio con el resto de su clase abandonara la empresa. Sin embargo, aquellos considerados mejores
entre los asociados, que hicieron el trabajo necesario y se mantuvieron en el camino para el número requerido de
años, podría esperar convertirse en accionistas, obtener aumentos paralelos en la compensación y disfrutar
empleo de por vida en la empresa ". (Janet Ellen Raasch, "Haciendo socio, o no: ¿está dentro, arriba o más
en el siglo XXI? ” Law Practice 33, número 4, junio de 2007.)
Página 383
las Fuerzas Armadas de EE. UU. adoptaron: Ver, por ejemplo, Rostker et al., Defense Officer Personnel Management
Ley de 1980 .
persiguieron lo que ellos llaman "control de dotación": ver, por ejemplo, Michael Smith, "Army Corporals Forced Out
'to Save Pension Cash' ” , Telegraph , 29 de julio de 2002.
como si toda comunicación fuera texto escrito: como Bavelas, Coates y Johnson, “Listeners as Co-
Narradores ”, dice,“ los oyentes tienen, en el mejor de los casos, un punto de apoyo débil en la mayoría de las teorías. En el extremo
los oyentes se consideran inexistentes o irrelevantes porque la teoría no los menciona o
los trata como periféricos. Esta omisión puede atribuirse, en parte, al uso implícito de texto escrito
como el prototipo para todos los usos lingüísticos ".
“Simultáneamente participando tanto en hablar como en escuchar”: Yngve, “On Getting a Word in
De canto."
"Narradores que contaron historias cercanas a oyentes distraídos": Bavelas, Coates y Johnson,
"Oyentes como co-narradores".
regular el flujo de información de un hablante a otro: Tolins y Fox Tree, “Addressee

Los backchannels dirigen el desarrollo narrativo ".
“Los 'malos narradores' pueden, al menos en parte, culpar a su audiencia”: Jackson Tolins, personal
correspondencia, 15 de enero de 2015.
"Conceptos erróneos sobre la causa y el significado de las colas": Nichols y Jacobson, "Controlling
Retraso en cola ".
la especificación HTTP todavía en uso hoy: Eso es HTTP 1.1, como se articula en el RFC 2616
documento de junio de 1999, disponible en http://tools.ietf.org/html/rfc2616 .
"Resultó que estaba copiando o sincronizando": Jim Gettys, "Bufferbloat: Dark Buffers in the Internet",
Google Tech Talk, 26 de abril de 2011.
“¡No 'Eureka!' pero 'Eso es gracioso' ”: esta cita ha aparecido en innumerables publicaciones con un
atribución a Isaac Asimov, pero su autoría real y procedencia siguen siendo difíciles de alcanzar. Parece tener
aparecido por primera vez, con la atribución de Asimov, como parte del programa "fortuna" de UNIX,
que muestra citas o refranes en el estilo de una galleta de la fortuna. Ver
http://quoteinvestigator.com/2015/03/02/eureka-funny/ . Asimov escribió un ensayo sobre "La
Eureka Phenomenon ”, pero esta frase no aparece allí.
cuando se ponen a cero de forma rutinaria: consulte Nichols y Jacobson, "Control del retraso de la cola".
que su estado natal de California tiene personas: la estimación de 2015 de la Oficina del Censo de EE. UU.
La población de California era 39.144.818. Ver
http://www.census.gov/popest/data/state/totals/2015/index.html.
"No hay una forma realmente buena de dejar mensajes a la gente": Ray Tomlinson, entrevistado por Jesse Hicks,
“Ray Tomlinson, el inventor del correo electrónico: 'Veo que el correo electrónico se usa, en general, exactamente de la manera en que
Envisioned '” , Verge , 2 de mayo de 2012, http://www.theverge.com/2012/5/2/2991486/ray-tomlinson-email-
inventor-entrevista-veo-correo-electrónico-siendo-utilizado .
simplemente rechazar todos los mensajes entrantes: uno de esos enfoques fue adoptado, por ejemplo, por la Universidad
del científico cognitivo de Sheffield, Tom Stafford. Durante su año sabático de 2015, su correo electrónico automatizado
Página 384
la respuesta decía: “Ahora estoy de año sabático hasta el 12 de junio. El correo electrónico enviado a t.stafford@shef.ac.uk ha sido
eliminado ".
Notificación de congestión explícita, o ECN: el documento de solicitud de comentarios (RFC) para ECN es
Ramakrishnan, Floyd y Black, The Addition of Explicit Congestion Notification (ECN) a IP ,
que es una revisión de Ramakrishnan y Floyd, una propuesta para agregar una notificación de congestión explícita
(ECN) a IP . Aunque la propuesta original data de la década de 1990, ECN sigue sin implementarse en
hardware de red estándar en la actualidad (Stuart Cheshire, entrevista personal, 26 de febrero de 2015).
“Este es un pantano a largo plazo”: Jim Gettys, entrevista personal, 15 de julio de 2014.
"¿Diría que un Boeing 747 es tres veces más 'más rápido'": Esto proviene del famoso
1996 "despotricar" "Es la latencia, estúpido". Verhttp://stuartcheshire.org/rants/Latency.html. Veinte años
más tarde, el sentimiento es solo más cierto.
11. TEORÍA DEL JUEGO

"Creo que los humanos son nobles y honorables": Steve Jobs, entrevista con Gary Wolf, Wired ,
Febrero de 1996.
hombre contra naturaleza: Apropiadamente, los escolares del siglo XXI aprenden cada vez más sobre
"Persona contra naturaleza", "persona contra sí mismo", "persona contra persona" y "persona contra sociedad".
"Un hombre inteligente pondría el veneno en su propia copa": La princesa prometida , guión de
William Goldman; 20th Century Fox, 1987.
"Anticipar las anticipaciones de los demás": atribuido a Keynes en Gregory Bergman, Isms , Adams
Medios, 2006.
fue el problema de la detención lo que inspiró a Turing: Alan Turing considera el problema de la detención y
propone la máquina de Turing en "Sobre números computables, con una aplicación a la
Entscheidungsproblem ”y“ On Computable Numbers, with a Application to the
Entscheidungsproblem. Una corrección ".
“Los jugadores de póquer lo llaman 'nivelación'”: Dan Smith, entrevista personal, 11 de septiembre de 2014.
"No tienes dos, siete": esto tuvo lugar en el "Full Tilt Poker Durrrr Million Dollar
Challenge ”, que se llevó a cabo en Les Ambassadeurs Club en Londres, del 17 al 19 de noviembre de 2009, y fue televisado
en Sky Sports.
"Solo quiero jugar un nivel por encima de tu oponente": Vanessa Rousso, "Leveling Wars",
https://www.youtube.com/watch?v=Yt5ALnFrwR4.
“Saber o tratar de saber qué es Nash”: Dan Smith, entrevista personal, 11 de septiembre de 2014.
un así llamado equilibrio : el concepto de un equilibrio de teoría de juegos y, para el caso, juego
teoría en sí misma, proviene de John von Neumann y Oskar Morgenstern de Princeton en Theory of
Juegos y comportamiento económico .
En piedra-papel-tijeras, por ejemplo: para una apariencia colorida en piedra-papel-tijeras ("RPS")

juego de torneo, incluido un glosario de los diversos "gambitos" de tres movimientos del juego, como el
Avalanche (RRR), el Bureaucrat (PPP) y Fistful o 'Dollars (RPP): recomendamos
http://worldrps.com . Para echar un vistazo al juego de RPS en computadora , echa un vistazo a Rock Paper Scissors
Concurso de programación: http://www.rpscontest.com .
Página 385
elegir uno de los gestos con las manos del mismo nombre completamente al azar: una estrategia, como ésta, que
incorpora aleatoriedad se denomina estrategia "mixta". La alternativa es una estrategia "pura", que
siempre implica tomar exactamente la misma opción; esto claramente no funcionaría por mucho tiempo en piedra-papel-
tijeras. Las estrategias mixtas aparecen como parte del equilibrio en muchos juegos, especialmente en "suma cero"
juegos, donde los intereses de los jugadores se enfrentan directamente entre sí.
cada juego de dos jugadores tiene al menos un equilibrio: Nash, “Equilibrium Points in N -Person
Juegos"; Nash, "Juegos no cooperativos".
el hecho de que siempre existe un equilibrio de Nash: Para ser más precisos, ibid. demostró que cada juego
con un número finito de jugadores y un número finito de estrategias tiene al menos una estrategia mixta
equilibrio.
“Ha tenido un impacto fundamental y generalizado”: Myerson, “Nash Equilibrium and the History of
Teoría económica."
"La principal preocupación de un científico informático": Papadimitriou, "Prólogo".
“ Danos algo que podamos usar”: Tim Roughgarden, “Teoría algorítmica de juegos, lección 1
(Introducción) ”, otoño de 2013, https://www.youtube.com/watch?v=TM_QFmQU_VA.
Se ha demostrado que todos son problemas insolubles: Gilboa y Zemel, "Nash and Correlated Equilibria".
simplemente encontrar equilibrios de Nash es intratable: Específicamente, se demostró que la búsqueda de equilibrios de Nash
pertenecen a una clase de problemas llamados PPAD , que (como NP ) se cree que es intratable. los
El vínculo entre los equilibrios de Nash y el PPAD se estableció en Daskalakis, Goldberg y Papadimitriou,
"La complejidad de calcular un equilibrio de Nash" y Goldberg y Papadimitriou, "Reducibilidad
Between Equilibrium Problems ”, que luego Chen y Deng extendieron a juegos de dos jugadores,
"Resolver la complejidad del equilibrio de Nash de dos jugadores", y luego generalizado en
Daskalakis, Goldberg y Papadimitriou, "The Complexity of Computing a Nash Equilibrium".
PPAD significa "Argumentos de paridad polinomial en gráficos dirigidos"; Papadimitriou, quien nombró a esto
clase de problemas en "Sobre la complejidad como racionalidad limitada", insiste en que cualquier parecido con su nombre es
una coincidencia. (Christos Papadimitriou, entrevista personal, 4 de septiembre de 2014.)
PPAD contiene otros problemas interesantes, como el problema del sándwich de jamón: dados n conjuntos de 2 n
puntos en n dimensiones, encuentre un plano que divida cada conjunto de puntos exactamente por la mitad. (Con n = 3, este
implica averiguar el camino que tendría que recorrer un cuchillo para cortar tres conjuntos de puntos por la mitad; si esos
Los conjuntos de puntos corresponden a dos piezas de pan y una pieza de jamón, el resultado es un perfectamente bisecado.
sándwich.) Encontrar los equilibrios de Nash es en realidad PPAD -completo, lo que significa que si hubiera un
algoritmo eficiente para resolverlo, entonces todos los demás problemas en la clase también podrían resolverse de manera eficiente
(incluida la preparación de los mejores sándwiches del mundo). Pero ser PPAD -completo no es tan malo como
siendo NP -completo. P , la clase de problemas que se pueden resolver de manera eficiente, podría ser igual a PPAD sin
siendo igual a NP . En el momento de escribir estas líneas, el jurado aún está deliberando: teóricamente es posible que alguien
podría idear un algoritmo eficiente para encontrar los equilibrios de Nash, pero la mayoría de los expertos no están sosteniendo sus
aliento.
“Gran parte de su credibilidad como predicción”: Christos Papadimitriou, “The Complexity of Finding
Equilibrios de Nash ”, en Nisan et al., Teoría de juegos algorítmicos .
"También debe considerarse relevante": Aaronson, "Why Philosophers Should Care About
Complejidad computacional."
Página 386
“Si su computadora portátil no puede encontrarlo”: En Christos Papadimitriou, “La complejidad de encontrar a Nash
Equilibria ”, en Nisan et al., Teoría de juegos algorítmicos , p. 30.
"El dilema del prisionero": El dilema del prisionero fue concebido por primera vez por Merrill Flood (de
problema de secretaria y problema de vendedor ambulante) y Melvin Drescher en RAND
Corporación. En enero de 1950, organizaron un juego entre Armen Alchian de UCLA y RAND
John D. Williams que tenía el dilema del prisionero, como recompensas (Flood, “Some Experimental Games”).
Albert Tucker de Princeton estaba intrigado por este experimento, y al prepararse para discutirlo en mayo de
en una conferencia en Stanford, le dio al problema su ahora famosa formulación carcelaria y su nombre. A
Historia detallada de los orígenes de la teoría de juegos y su desarrollo en el trabajo de RAND.
Corporation se puede encontrar en Poundstone, Prisoner's Dilemma .
un precio de la anarquía que es solo 4/3: Roughgarden y Tardos, "¿Qué tan malo es el enrutamiento egoísta?"
El doctorado en Cornell de 2002 de Roughgarden también aborda el tema del enrutamiento egoísta.
“El pesimista teme que esto sea cierto”: Cabell, The Silver Stallion .
imagínese un "bien común" del césped público: Hardin, "La tragedia de los comunes".
“Había una cosa llamada gasolina con plomo”: Avrim Blum, entrevista personal, 17 de diciembre,
2014.
El titular planteó el problema de manera sucinta: Scott K. Johnson, “El clima estable demanda la mayoría de los combustibles fósiles
Permanecer en el suelo, pero ¿de quién? ” Ars Technica , 8 de enero de 2015.
“En ninguna parte es más alto el valor del trabajo”: “En busca del tiempo perdido” , Economist , 20 de diciembre de 2014.
El 15% no toma vacaciones en absoluto: el estudio es de Glassdoor y se hace referencia en ibid.
“La gente dudará en tomarse unas vacaciones”: Mathias Meyer, “De abierto (ilimitado) a mínimo
Política de vacaciones ”, 10 de diciembre de 2014, http://www.paperplanes.de/2014/12/10/from-open-to-
política-de-vacaciones-mínimas.html .
"Las tiendas abren antes que nunca": Nicole Massabrook, "Las tiendas abren el Día de Acción de Gracias
2014: Walmart, Target, Best Buy y otros horarios de las tiendas en el Día de Turquía ”, Negocios internacionales
Times , 26 de noviembre de 2014.
"No odies al jugador, odia el juego": Ice-T, "No odies la playa", El séptimo pecado mortal ,
1999.
"Nunca te pongas del lado de nadie en contra de la familia": El Padrino , guión de Mario Puzo
y Francis Ford Coppola, Paramount Pictures, 1972.
"Cargado contra el surgimiento de la cooperación": esta cita de Binmore aparece en un número
de fuentes, incluyendo Binmore, Natural Justice y Binmore, Game Theory . El "categórico" de Kant
imperativo ”se origina en su Fundamento de la metafísica de la moral de 1785 y se discute en su
1788 Crítica de la razón práctica .
mil dólares en efectivo por tomarse unas vacaciones: Libin analiza las motivaciones de las mil
dólares en, por ejemplo, una entrevista con Adam Bryant, "Los teléfonos están fuera, pero el robot está dentro",
New York Times , 7 de abril de 2012.
hacer obligatoria una cierta cantidad mínima de vacaciones : las vacaciones obligatorias ya son un
práctica estándar en finanzas, aunque por motivos de detección de fraude más que por motivos de moral. Para más sobre
Página 387
vacaciones obligatorias y fraude ver, por ejemplo, Philip Delves Broughton, "Take Those Two Weeks Off — or
Else ”, Wall Street Journal , 28 de agosto de 2012.
sin requisitos federales para vacaciones pagadas: Rebecca Ray, Milla Sanes y John Schmitt,
“No-Vacation Nation Revisited”, Center for Economic Policy and Research , mayo de 2013,
http://www.cepr.net/index.php/publications/reports/no-vacation-nation-2013 .
Cosas de las que rara vez habla un informático : Donald E. Knuth.
“El corazón tiene sus razones”: como lo expresó Pascal en Pascal, Pensées sur la religion et sur quelques
autres sujets , §277: "Le cœur a ses raisons, que la raison ne connaît point".
“Se puede pensar en el dosel como un prado aéreo”: Dawkins, The Evidence for Evolution .
hace que los ratones pierdan permanentemente el miedo a los gatos: Ingram et al., “Mice Infected with Low-Virulence
Cepas de Toxoplasma Gondii ".
“La moralidad es instinto gregario en el individuo”: The Gay Science , §116, trad. Walter Kaufmann.
“Si la gente espera que respondamos de manera irracional”: Frank, Pasiones dentro de la razón .
“La preocupación de que la gente deje las relaciones”: Ibid.
“Necesitas un sentimiento que te haga no querer separarte”: Robert Frank, entrevista personal, abril
13, 2015. Frank, "If Homo Economicus Could Choose", contiene esta idea, aunque como se apresura a
reconocer, se basa en trabajos como Schelling, The Strategy of Conflict ; Schelling, “Altruismo,
Mezquindad y otros comportamientos potencialmente estratégicos ”; Akerlof, "Filtros de fidelidad"; Hirshleifer, "On
las emociones como garantes de amenazas y promesas ”; Sen, “Metas, compromiso e identidad”; y
Gauthier, Moral por acuerdo . Frank trata las ideas con la extensión de un libro en Pasiones dentro de la razón .
“Si el prisionero está feliz, ¿por qué encerrarlo?”: Shaw, Man y Superman .
obtiene más del 90% de sus ingresos de la venta de anuncios: los ingresos por publicidad de Google en 2014, como
detallado en su informe de accionistas, fue de $ 59,6 mil millones, aproximadamente el 90,3% de sus ingresos totales de $ 66 mil millones.
Ver https://investor.google.com/financial/tables.html .
recaudando decenas de miles de millones de dólares en ingresos: la subasta AWS-3 que se cerró el 29 de enero de 2015,
resultó en licitaciones ganadoras por un total de $ 44,899 mil millones. Ver http://wireless.fcc.gov/auctions/default.htm?
job = Auction_factsheet & id = 97 .
están sombreando sus ofertas según su predicción de la suya: la estrategia de equilibrio para un
La subasta de primer precio de oferta sellada con dos jugadores consiste en ofertar exactamente la mitad de lo que cree que vale el artículo.
De manera más general, en este formato de subasta con n jugadores, debe ofertar exactamente ( n −1) ⁄ n veces lo que
creo que el artículo vale la pena. Tenga en cuenta que esta estrategia es el equilibrio de Nash pero no es una estrategia dominante;
es decir, nada es mejor si todos los demás también lo hacen, pero no es necesariamente óptimo en todos
circunstancias. Caveat emptor. Además, si no conoce el número de postores en la subasta, el
la estrategia óptima se complica rápidamente; ver, por ejemplo, An, Hu y Shum, "Estimación primero-
Subastas de precios con un número desconocido de postores: un enfoque de clasificación errónea ". De hecho, incluso
los resultados aparentemente limpios— ( n −1) ⁄ n —requieren algunas suposiciones serias, a saber, que los postores son
"Neutral al riesgo" y que sus diferentes valores para el artículo se distribuyen uniformemente entre algunos
distancia. El resultado ( n −1) ⁄ n aquí proviene de Vickrey, "Contraespeculación, subastas y competencia
Licitaciones Selladas ”, quien advierte,“ Si se abandona el supuesto de homogeneidad entre los oferentes,
las matemáticas de un tratamiento completo se vuelven intratables ".
Página 388
la subasta de flores más grande del mundo: para obtener más información sobre la subasta de flores de Aalsmeer, consulte
http://www.floraholland.com/en/about-floraholland/visit-the-flower-auction/ .
un grupo de personas que caen juntas por un acantilado: a veces, estos acantilados son demasiado literales. El nuevo
York Times , por ejemplo, informó sobre la muerte de varios esquiadores de travesía experimentados en
Estado de Washington. Los relatos de los supervivientes muestran cómo terminó un grupo de esquiadores extremadamente hábiles
haciendo algo sobre lo que casi todos los miembros individuales tenían un mal presentimiento.
"Si fuera por mí, nunca habría ido a esquiar fuera de pista con doce personas", dijo uno.
sobreviviente. “Eso es demasiado. Pero hubo una especie de dinámica social de eso, donde yo
no quería ser el que dijera, ya sabes, 'Oye, este es un grupo demasiado grande y no deberíamos estar haciendo
esta.'"
"No hay forma de que todo este grupo pueda tomar una decisión que no sea inteligente", se dijo otro.
“Por supuesto que está bien, si vamos todos. Tiene que estar bien ".
“Todo en mi mente se estaba apagando, queriendo decirles que se detuvieran”, dijo un tercero.
"Pensé: Oh, sí, ese es un mal lugar para estar", relató un cuarto miembro del grupo. "Eso es un
mal lugar para estar con tanta gente. Pero no dije nada. No quería ser el idiota ".
Como resumió el Times : “Todos los lugareños del grupo supusieron que sabían lo que eran los demás
pensando. Ellos no." Ver Branch, "Caída de nieve".
conocida como una "cascada de información": Bikhchandani, Hirshleifer y Welch, "A Theory of Fads".
Véase también Bikhchandani, Hirshleifer y Welch, "Learning from the Behavior of Others".
“La reserva pública de información ya no crece” : David Hirshleifer, entrevista personal,

27 de agosto de 2014.
un precio de venta de más de $ 23 millones: el precio de este título particular de Amazon se notó y
informado por el biólogo Michael Eisen de UC Berkeley; consulte el "libro de Amazon de 23.698.655,93 dólares sobre
moscas ”, 23 de abril de 2011 en el blog de Eisen NO es basura , http://www.michaeleisen.org/blog/?p=358 .
empeorar la irracionalidad del mercado: ver, por ejemplo, las reacciones de la Universidad de Columbia
economista Rajiv Sethi inmediatamente después de la crisis repentina. Sethi, “Trading algorítmico y
Volatilidad de precios."
salvar a toda la manada del desastre: esto también se puede pensar en términos de diseño de mecanismos y
evolución. En promedio, es mejor que cualquier individuo en particular sea un rebaño algo cauteloso
seguidor, sin embargo, todos se benefician de la presencia de algunos miembros del grupo que son testarudos
inconformistas. De esta manera, el exceso de confianza se puede considerar como una forma de altruismo. Para más sobre el
"Proporción socialmente óptima" de tales miembros del grupo, ver Bernardo y Welch, "On the Evolution of
Exceso de confianza y emprendedores ”.
una forma de repensar el diseño de mecanismos: la frase "diseño de mecanismos algorítmicos" entró por primera vez en
literatura técnica en Nisan y Ronen, "Algorithmic Mechanism Design".
Se llama la subasta de Vickrey: consulte Vickrey, "Contraespeculación, subastas y competencia

Licitaciones Selladas ".
"A prueba de estrategia" o simplemente "veraz": los juegos "a prueba de estrategia" también se conocen como
compatible." Consulte Noam Nisan, "Introducción al diseño de mecanismos (para científicos informáticos)", en
Nisan et al., Eds., Teoría de juegos algorítmicos .
Página 389
la honestidad es la estrategia dominante: en términos de teoría de juegos, esto hace que la subasta de Vickrey sea
estrategia compatible con incentivos ”(DSIC). Y un resultado importante en la teoría algorítmica de juegos, conocido como
"Myerson Lemma", afirma que solo hay un mecanismo de pago DSIC posible. Esto significa
que la subasta de Vickrey no es solo una forma de evitar un comportamiento estratégico, recursivo o deshonesto, es el
única manera. Consulte Myerson, "Optimal Auction Design".
un principio
se originó conde teoría"Contraespeculación,
Vickrey, de juegos llamado "equivalencia de ingresos":
subastas y licitaciones el teorema
cerradas de equivalencia
competitivas" y fue de ingresos
generalizado en Myerson, "Optimal Auction Design" y Riley y Samuelson, "Optimal Auctions".
la subasta de Vickrey es "impresionante": Tim Roughgarden, "Teoría algorítmica de juegos, Conferencia 3

(Lema de Myerson) ”, publicado el 2 de octubre de 2013, https://www.youtube.com/watch?
v = 9qZwchMuslk .
“Creo que es realmente fantástico”: Noam Nisan, entrevista personal, 13 de abril de 2015.
“Una de las mejores cosas que puedes ver”: Paul Milgrom, entrevista personal, 21 de abril de 2015.
“El infierno es otra gente”: Sartre, No Exit .
CONCLUSIÓN
"Para aprender a vivir bien juntos": Flood, "¿Qué futuro hay para las máquinas inteligentes?"
"Define esto como el acto más sabio ": Russell, "Los elementos de la ética".
una especie de estoicismo computacional: véase, por ejemplo, Baltzly, "Estoicismo".
saber una buena canción cuando la escuchas: también es la diferencia entre P y NP . Para
rumiaciones filosóficas más deliciosas de esta naturaleza, véase Aaronson, "Reasons to Believe", y
Wigderson, "Conocimiento, creatividad y P versus NP".
ninguno de ellos había querido ver la corrida de toros: Escenarios como éste a veces se llaman
“La paradoja de Abilene”; ver Harvey, "The Abilene Paradox".
moviendo al grupo hacia la resolución: Este punto también ha sido señalado por Tim Ferriss, quien escribe,
“Deja de pedir sugerencias o soluciones y empieza a proponerlas. Empiece por las cosas pequeñas.
En lugar de preguntar cuándo le gustaría a alguien reunirse la próxima semana, proponga sus momentos ideales y
segundas opciones. Si alguien pregunta: '¿Dónde deberíamos comer?', '¿Qué película deberíamos ver?'
¿deberíamos hacer esta noche? 'o algo similar, no lo refleje con' Bueno, ¿qué / cuándo / dónde
tú quieres…?' Ofrezca una solución. Detén el ir y venir y toma una decisión ". Ver Ferriss, The 4-
Horas semanales .
ofreciendo una o dos propuestas concretas: Idealmente, uno querría conocer los valores que cada
La persona del grupo asigna todas las opciones y adopta una política razonable para tomar una decisión.
basado en esos. Un enfoque potencial es simplemente seleccionar la opción que maximiza el producto de
los valores asignados por todos, lo que también permite que cualquiera vete una opción asignándole un valor de
cero. Hay argumentos de economía de que esta es una buena estrategia, que se remonta a John
Nash. Véase Nash, "The Bargaining Problem".
minimizar la cantidad de monedas: Deberá, "Lo que este país necesita es una pieza de 18 ¢".
denominaciones desgarbadas dan vuelta a la realización de cambios: Lueker, “Two NP -Complete Problems in
Programación de enteros no negativos ”, mostró que bajo ciertos supuestos, hacer cambios con el
Página 390
El menor número de monedas es NP -duro. Este resultado es válido si las monedas están denominadas en binario o en
familiar base diez, pero no si están denominados en unario (base uno), que sí tiene un eficiente
solución, como se muestra en Wright, "El problema de hacer cambios". Para más información sobre computacional
complejidad de realizar cambios, consulte también Kozen y Zaks, “Optimal Bounds for the Change-Making
Problema."
Considere un estacionamiento grande: Cassady y Kobza, "A Probabilistic Approach to Evaluate Strategies
para seleccionar un espacio de estacionamiento ", compara" Elija una fila, espacio más cercano (PRCS) "y" Ciclismo
(CYC) ”algoritmos de búsqueda de espacios de estacionamiento. El CYC más complicado incluye una parada óptima
regla, mientras que PRCS comienza en el destino, apuntando hacia afuera, y simplemente toma el primer espacio. Cuanto mas
CYC agresivo encontró mejores espacios en promedio, pero el PRCS más simple realmente ganó en términos de total
tiempo usado. Los conductores que siguieron el algoritmo CYC dedicaron más tiempo a encontrar mejores espacios que los
mejores espacios los salvaron en el tiempo de caminata. Los autores señalan que la investigación de esta naturaleza podría ser útil
en el diseño de estacionamientos. Los modelos computacionales de estacionamiento también se exploran en, por ejemplo, Benenson,
Martens y Birfir, "PARKAGENT: Un modelo de estacionamiento en la ciudad basado en agentes".
"Girar" y "bloquear": para ver en profundidad cuándo girar y cuándo bloquear, consulte, por ejemplo,
Boguslavsky et al., "Estrategias óptimas para girar y bloquear". (Tenga en cuenta que esto es lo mismo
Leonid Boguslavsky que encontramos brevemente en el capítulo 1 en un viaje de esquí acuático).
Página 391
Bibliografía
Aaronson, Scott. “Reasons to Believe” Shtetl-Optimized (blog), 4 de septiembre de 2006.

http://www.scottaaronson.com/blog/?p=122/.
______. "Por qué los filósofos deberían preocuparse por la complejidad computacional". preimpresión arXiv
arXiv: 1108.1791 , 2011.
Abramson, Norman. "El sistema ALOHA: otra alternativa para las comunicaciones informáticas". En
Proceedings of the November 17-19, 1970, Fall Joint Computer Conference , 1970, 281-285.
Ackley, David H. "Más allá de la eficiencia". Comunicaciones del ACM 56, no. 10 (2013): 38–40.
Agrawal, Manindra, Neeraj Kayal y Nitin Saxena. "PRIMES está en P ". Anales de Matemáticas 160
(2004): 781–793.
Agrawal, Rajeev. “Muestra de políticas de índice basado en la media con O (log n ) Lamento por las
Problema de los bandidos ". Advances in Applied Probability 27 (1995): 1054-1078.
Agrawal, Shipra y Navin Goyal. "Análisis del muestreo de Thompson para el bandido de múltiples brazos
Problema." En Actas de la 25a Conferencia Anual sobre Teoría del Aprendizaje , 2012.
Akerlof, George A. "Filtros de lealtad". American Economic Review 1983, 54–63.
Allen, David. Hacer las cosas: el arte de la productividad sin estrés . Nueva York: Penguin, 2002.
Aloupis, Greg, Erik D. Demaine y Alan Guo. "Los juegos clásicos de Nintendo son ( NP -) difíciles". arXiv
preimpresión arXiv: 1203.1895 , 2012.
An, Yonghong, Yingyao Hu y Matthew Shum. "Estimación de subastas de primer precio con un desconocido
Número de licitadores: un enfoque de clasificación errónea ". Revista de Econometría 157, no. 2 (2010):
328–341.
Anderson, John R. El carácter adaptativo del pensamiento . Hillsdale, Nueva Jersey: Erlbaum, 1990.
Anderson, John R. y Robert Milson. "Memoria humana: una perspectiva adaptativa". Psicológico
Revisión 96, no. 4 (1989): 703–719.
Anderson, John R. y Lael J. Schooler. “Reflexiones del medio ambiente en la memoria”.
Ciencia psicológica 2, no. 6 (1991): 396–408.
Ariely, Dan y Simon Jones. Previsiblemente irracional . Nueva York: HarperCollins, 2008.
Arrhenius, Gustaf. “Un teorema de imposibilidad en axiología poblacional con ordenamiento débil
Supuestos ". Estudios filosóficos 49 (1999): 11-21.
Auer, Peter, Nicolò Cesa-Bianchi y Paul Fischer. “Análisis en tiempo finito del bandido de brazos múltiples
Problema." Machine Learning 47 (2002): 235–256.
Página 392
Austen, Jane. Emma . Londres: John Murray, 1815.

Austriaco, Geoffrey D. Herman Hollerith: Gigante olvidado del procesamiento de la información . Nueva York:
Prensa de la Universidad de Columbia, 1982.
Bachmann, Paul. Die analytische zahlentheorie . Leipzig: Teubner, 1894.
Badger, Lee. "Aproximación afortunada de Lazzarini de π ". Revista de matemáticas 67 (1994): 83–91.
Procedimientos de credibilidad de Bailey, Arthur L .: La generalización de Laplace de la regla de Bayes y la
Combinación de conocimiento colateral con datos observados . Nueva York: seguro del estado de Nueva York
Departamento, 1950.
Baker, Kenneth R. Introducción a la secuenciación y programación . Nueva York: Wiley, 1974.
Baker, Kenneth R., Eugene L. Lawler, Jan Karel Lenstra y Alexander HG Rinnooy Kan.
“Programación preventiva de una sola máquina para minimizar el costo máximo sujeto a publicación
Restricciones de fechas y precedencia ". Investigación de operaciones 31, no. 2 (1983): 381–386.
Baltzly, Dirk. "Estoicismo." En The Stanford Encyclopedia of Philosophy (edición de primavera de 2014). Editado
por Edward N. Zalta. http://plato.stanford.edu/archives/spr2014/entries/stoicism/.
Banks, Jeffrey S. y Rangarajan K Sundaram. "Costos de cambio y el índice de Gittins".
Econometrica 62 (1994): 687–694.
Barabási, Albert-László. Vinculado: cómo todo está conectado con todo lo demás y para qué
Medios para los negocios, la ciencia y la vida cotidiana . Nueva York: Penguin, 2002.
Baran, Paul. "Sobre comunicaciones distribuidas". Volúmenes I a XI, investigación de RAND Corporation
Documentos, agosto de 1964, 637–648.
Barnard, Chester I. Las funciones del ejecutivo . Cambridge, MA: Harvard University Press, 1938.
Bartlett, Robert H., Dietrich W. Roloff, Richard G. Cornell, Alice French Andrews, Peter W. Dillon,
y Joseph B. Zwischenberger. “Circulación extracorpórea en insuficiencia respiratoria neonatal: A
Estudio prospectivo aleatorizado ". Pediatría 76, no. 4 (1985): 479–487.
Baumgardt, Carola. Johannes Kepler: Vida y letras . Nueva York: Philosophical Library, 1951.
Bavelas, Janet B., Linda Coates y Trudy Johnson. "Oyentes como co-narradores". Diario de
Personalidad y psicología social 79, no. 6 (2000): 941–952.
Bayes, Thomas. "Un ensayo para resolver un problema en la doctrina de las oportunidades". Filosófico
Transactions 53 (1763): 370–418.
Bearden, Neil. "Un nuevo problema de secretaria con la selección basada en rangos y las recompensas cardinales".
Revista de Psicología Matemática 50 (2006): 58–59.
Bélády, Laszlo A. "Un estudio de algoritmos de reemplazo para una computadora de almacenamiento virtual". IBM
Systems Journal 5 (1966): 78–101.
Bélády, Laszlo A., Robert A Nelson y Gerald S. Shedler. "Una anomalía en el espacio-tiempo
Características de ciertos programas que se ejecutan en una máquina de localización ". Comunicaciones de la ACM
12, no. 6 (1969): 349–353.
Belew, Richard K. Descubriendo: una perspectiva cognitiva sobre la tecnología de los motores de búsqueda y
la WWW . Cambridge, Reino Unido: Cambridge University Press, 2000.
Bell, Aubrey FG en Portugal . Nueva York: John Lane, 1912.
Bellhouse, David R. “El reverendo Thomas Bayes, FRS: Una biografía para celebrar el tricentenario
de su nacimiento ". Ciencia estadística 19 (2004): 3–43.
Bellman, Richard. Programación dinámica . Princeton, Nueva Jersey: Princeton University Press, 1957.
______. "Un problema en el diseño secuencial de experimentos". Sankhyā: El diario indio de
Statistics 16 (1956): 221–229.

Página 393
Bellows, Meghan L. y JD Luc Peterson. "Encontrar una tabla de asientos óptima". Anales de
Investigación improbable (2012).
Benenson, Itzhak, Karel Martens y Slava Birfir. "PARKAGENT: un modelo basado en agentes de
Estacionamiento en la Ciudad ". Informática, medio ambiente y sistemas urbanos 32, no. 6 (2008): 431–439.
Berezovsky, Boris y Alexander V. Gnedin. Problemas de mejor elección (en ruso). Moscú:
Akademia Nauk, 1984.
Berg-Kirkpatrick, Taylor y Dan Klein. "Descifrado con un millón de reinicios aleatorios". En
Actas de la Conferencia sobre métodos empíricos en el procesamiento del lenguaje natural (2013):
874–878.
Bernardo, Antonio E. e Ivo Welch. "Sobre la evolución del exceso de confianza y los emprendedores".
Revista de Economía y Estrategia de Gestión 10, no. 3 (2001): 301–330.
Berry, Donald A. "Un bandido de dos brazos de Bernoulli". Annals of Mathematical Statistics 43 (1972):
871–897.
______. "Comentario: Ética y ECMO". Ciencia estadística 4 (1989): 306–310.
Berry, Donald A. y Bert Fristed. Problemas de bandidos: asignación secuencial de experimentos . Nuevo
York: Chapman y Hall, 1985.
Bettencourt, Luís MA, José Lobo, Dirk Helbing, Christian Kühnert y Geoffrey B. West.
"Crecimiento, innovación, escalamiento y ritmo de vida en las ciudades". Procedimientos de la Nacional
Academia de Ciencias 104, no. 17 (2007): 7301–7306.
Bikhchandani, Sushil, David Hirshleifer e Ivo Welch. “Una teoría de las modas, la moda, las costumbres y
Cambio cultural como cascadas informativas ”. Revista de Economía Política 100, no. 5 (1992):
992–1026.
______. "Aprender del comportamiento de los demás: conformidad, modas y cascadas informativas".
Revista de perspectivas económicas 12, no. 3 (1998): 151-170.

Binmore, Ken. Teoría de juegos: una introducción muy breve . Nueva York: Oxford University Press, 2007.
______. Justicia natural . Nueva York: Oxford University Press, 2005.
Bjarnason, Ronald, Alan Fern y Prasad Tadepalli. "Solitario Klondike de límite inferior con
Planificación de Montecarlo ". En las actas de la XIX Conferencia Internacional sobre Automatización
Planificación y programación, ICAPS 2009 .
Blau, Peter Michael. La dinámica de la burocracia: un estudio de las relaciones interpersonales en dos
Agencias gubernamentales . Chicago: University of Chicago Press, 1955.
Bloom, Burton H. "Compensación de espacio / tiempo en la codificación hash con errores permitidos". Comunicaciones
del ACM 13, no. 7 (1970): 422–426.
Boguslavsky, Leonid, Karim Harzallah, A. Kreinen, K. Sevcik y Alexander Vainshtein. "Óptimo
Estrategias para girar y bloquear ". Revista de Computación Paralela y Distribuida 21, no. 2
(1994): 246-254.
Boorstin, Daniel J. Los descubridores: una historia de la búsqueda del hombre para conocer su mundo y a sí mismo .
Nueva York: Random House, 1983.
Bradt, Russell N., SM Johnson y Samuel Karlin. "Sobre diseños secuenciales para maximizar la
Suma de N observaciones ". Annals of Mathematical Statistics 27 (1956): 1060–1074.
Branch, John. "Snow Fall: The Avalanche at Tunnel Creek". New York Times , 20 de diciembre de 2012.
Brown, Alexander L. y Joanna N. Lahey. Pequeñas victorias: crear una motivación intrínseca en los ahorros
y reducción de la deuda . Reporte técnico. Cambridge, MA: Oficina Nacional de Investigación Económica,
2014.
Página 394
Brush, Eleanor R., David C. Krakauer y Jessica C. Flack. “Una familia de algoritmos para la informática
Consenso sobre el estado del nodo a partir de los datos de la red ". PLoS Computational Biology 9, no. 7 (2013).
Bruss, F. Thomas. “Un enfoque unificado para una clase de problemas de mejor elección con un
Número de opciones ". Annals of Probability 12 (1984): 882–889.
Buch, P. "Future Prospects Discussed". Nature 368 (1994): 107–108.
Buffon, Georges-Louis Leclerc, Comte de. "Essai d'arithmétique moral". Supplément à l'Histoire
naturelle, générale et particuliére 4 (1777): 46-148.
Burks, Arthur W., Herman H. Goldstine y John von Neumann. Discusión preliminar del
Diseño lógico de un instrumento informático electrónico . Princeton, Nueva Jersey: Institute for Advanced
Estudio, 1946.
Burrell, Quentin. "Un modelo estocástico simple para préstamos para bibliotecas". Revista de documentación 36, no.
2 (1980): 115-132.
Burthe Jr., Ronald. "Investigaciones adicionales con la prueba de prima probable fuerte". Matemáticas de
Computación de la American Mathematical Society 65, no. 213 (1996): 373–381.
Cabell, rama de James. El semental plateado . Nueva York: Robert M. McBride, 1926.
Campbell, Donald T. “Variación ciega y retención selectiva en el pensamiento creativo como en otros
Procesos de conocimiento ". Psychological Review 67 (1960): 380–400.
Carpenter, Brian y Robert Hinden. Adaptación de RFC 1149 para IPv6 . Reporte técnico. RFC 6214,
Abril de 2011.
Carroll, Lewis. Sylvie y Bruno concluyeron . Londres: Macmillan, 1893.
Carstensen, Laura L. “Patrones sociales y emocionales en la edad adulta: apoyo para
Teoría de la selectividad ". Psychology and Aging 7 (1992): 331–338.
Cassady, C. Richard y John E. Kobza. "Un enfoque probabilístico para evaluar estrategias para
Seleccionar una plaza de aparcamiento ". Ciencia del transporte 32, no. 1 (1998): 30–42.
Cawdrey, Robert. Una tabla alfabética, conteniendo y enseñando la verdadera escritura, y
comprensión de las palabras duras del inglés vsuall, tomadas del hebreo, griego, latín o
Francés, etc. Con la interpretación del mismo por palabras sencillas en inglés, reunidas para el beneficio y
ayuda de damas, caballeros o cualquier otra persona vnskilfull. Por lo que pueden ser más fáciles
y comprenderán mejor muchas palabras duras en inglés, que oirán o leerán en las Escrituras,
Sermones, o en otros lugares, y también ser capaces de ver los mismos adecuadamente entre sí. Londres: Edmund
Weaver, 1604.
Cayley, Arthur. "Preguntas matemáticas con sus soluciones". Tiempos educativos 23 (1875): 18–
19.
______. Los artículos matemáticos recopilados de Arthur Cayley 10: 587–588. Cambridge, Reino Unido:
Prensa de la Universidad de Cambridge, 1896.

Cerf, Vinton G. y Robert E. Kahn. "Un protocolo para la intercomunicación de red de paquetes". IEEE
Transacciones sobre Comunicaciones 22, no. 5 (1974): 637–648.
Chabert, Jean-Luc, Evelyne Barbin y Christopher John Weeks. Una historia de algoritmos: desde el
Guijarro al Microchip . Berlín: Springer, 1999.
Charles, Susan T. y Laura L. Carstensen. "Envejecimiento social y emocional". Revisión anual de
Psychology 61 (2010): 383–409.
Chen, Stanley F. y Joshua Goodman. “Un estudio empírico de técnicas de suavizado para
Modelado de idiomas ". En Actas de la 34a Reunión Anual de la Asociación de
Lingüística computacional , 1996, 310–318.
Página 395
Chen, Xi y Xiaotie Deng. "Resolver la complejidad del equilibrio de Nash de dos jugadores". En
Fundamentos de la informática , 2006, 261–272.
Chow, YS y Herbert Robbins. "Un teorema y aplicaciones del sistema martingala". En
Actas del cuarto simposio de Berkeley sobre estadística matemática y probabilidad .
Berkeley: Prensa de la Universidad de California, 1961.
______. "Sobre las reglas de parada óptimas". Teoría de la probabilidad y campos relacionados 2 (1963): 33–49.
Chow, YS, Sigaiti Moriguti, Herbert Robbins y SM Samuels. "Selección óptima basada en
Rango relativo (el 'Problema de la secretaria') ". Revista de Matemáticas de Israel 2 (1964): 81–90.
Christian, Brian. "La prueba A / B: dentro de la tecnología que está cambiando las reglas del negocio".
Revista cableada 20, no. 5 (2012).
Christofides, Nicos. Análisis del peor caso de una nueva heurística para el problema del vendedor ambulante .
Informe técnico 388. Pittsburgh: Graduate School of Industrial Administration, Carnegie Mellon
Universidad, 1976.
Churchill, Winston. Winston S. Churchill: Sus discursos completos, 1897–1963 . Editado por Robert
Rhodes James. Londres: Chelsea House, 1974.
Cirillo, Francesco. La técnica Pomodoro . Raleigh, Carolina del Norte: Lulu, 2009.
Clarke, Donald D. y Louis Sokoloff. "Circulación y metabolismo energético del cerebro". En Básico
Neurochemistry: Molecular, Cellular and Medical Aspects , 6a ed., Editado por George J. Siegel,
Bernard W. Agranoff, R. Wayne Albers, Stephen K. Fisher y Michael D. Uhler. Filadelfia:
Lippincott-Raven, 1999, 637–669.
Clauset, Aaron, Cosma Rohilla Shalizi y Mark EJ Newman. "Distribuciones de ley de potencias en
Datos empiricos." Revista SIAM 51, no. 4 (2009): 661–703.
Cobham, Alan. "La dificultad computacional intrínseca de las funciones". En Actas de 1964
Congreso de Lógica, Metodología y Filosofía de la Ciencia . Amsterdam: Holanda Septentrional, 1964.
Conan Doyle, Arthur. "Un estudio en escarlata: las reminiscencias de John H. Watson". En Beeton's
Anual de Navidad , vol. 29. Londres: Ward, Lock, 1887.
Connor, La bruja de James A. Kepler: el descubrimiento de un orden cósmico por parte de un astrónomo en medio de una guerra religiosa,
Intriga política y el juicio por herejía de su madre . Nueva York: HarperCollins, 2004.
Conti, Carl J., Donald H. Gibson y Stanley H. Pitkowsky. “Aspectos Estructurales del Sistema / 360
Modelo 85, I: Organización general ”. IBM Systems Journal 7 (1968): 2-14.
Cook, Stephen A. "La complejidad de los procedimientos de demostración de teoremas". En Actas de la Tercera
Simposio anual de ACM sobre teoría de la computación , 1971, 151-158.
Cook, William. En busca del vendedor ambulante: Matemáticas en los límites de la computación .
Princeton, Nueva Jersey: Princeton University Press, 2012.
Covey, Stephen R. Cómo tener éxito con las personas . Salt Lake City: Montaña de las Sombras, 1971.
Craig, JV Comportamiento agresivo de los pollos: algunos efectos de los entornos social y físico .
Presentado en la 27a Mesa Redonda Nacional Anual de Criadores, 11 de mayo, Kansas City, MO, 1978.
Dale, Andrew I. Una historia de la probabilidad inversa: de Thomas Bayes a Karl Pearson . Nueva York:
Springer, 1999.
Daly, Lloyd W. Contribuciones a la historia de la alfabetización en la antigüedad y la Edad Media .
Bruselas: Latomus, 1967.
Damgård, Ivan, Peter Landrock y Carl Pomerance. "Estimaciones de error de caso promedio para los
Probable Prime Test. " Matemáticas de la Computación 61, no. 203 (1993): 177-194.
Daniels, Bryan C., David C. Krakauer y Jessica C. Flack. "Código de conflicto escaso en un primate
Sociedad." Actas de la Academia Nacional de Ciencias 109, no. 35 (2012): 14259–14264.
Página 396
Darwin, Charles. La correspondencia de Charles Darwin, volumen 2: 1837–1843 . Editado por

Frederick Burkhardt y Sydney Smith. Cambridge, Reino Unido: Cambridge University Press, 1987.
Daskalakis, Constantinos, Paul W. Goldberg y Christos H. Papadimitriou. “La complejidad de
Calcular un equilibrio de Nash ". Simposio ACM sobre Teoría de la Computación, 2006, 71–78.
______. "La complejidad de calcular un equilibrio de Nash". Revista SIAM de Computación 39, no. 1
(2009): 195-259.
Davis, Lydia. Casi sin memoria: Historias . Nueva York: Farrar, Straus & Giroux, 1997.
Dawkins, Richard. La evidencia de la evolución, el espectáculo más grande de la Tierra . Nueva York: Free Press,
2009.
DeDeo, Simon, David C. Krakauer y Jessica C. Flack. “Evidencia de periodicidades estratégicas en
Dinámica de conflictos colectivos ". Revista de The Royal Society Interface , 2011.
DeGroot, Morris H. Decisiones estadísticas óptimas . Nueva York: McGraw-Hill, 1970.
Demaine, Erik D., Susan Hohenberger y David Liben-Nowell. "Tetris es difícil, incluso
Aproximado." En Computación y combinatoria , 351–363. Nueva York: Springer, 2003.
DeMillo, Richard A. y Richard J. Lipton. “Una observación probabilística sobre el programa algebraico
Pruebas." Cartas de procesamiento de información 7, no. 4 (1978): 193-195.
Denning, Peter J. "Golpes: sus causas y prevención". En Actas del 9 al 11 de diciembre,
1968, Conferencia Conjunta de Computación de Otoño, Parte I , 1968, 915–922.
Diffie, Whitfield y Martin E. Hellman. "Nuevas direcciones en criptografía". Teoría de la información,
Transacciones IEEE el 22, no. 6 (1976): 644–654.
Dillard, Annie. Peregrino en Tinker Creek . Nueva York: Harper's Magazine Press, 1974.
______. La vida de la escritura . Nueva York: Harper & Row, 1989.
Dodgson, Charles Lutwidge. "Torneos de tenis sobre hierba: el verdadero método de asignar premios con
una prueba de la falacia del método actual ". St. James's Gazette , 1 de agosto de 1883: 5–6.
Durant, Will. La historia de la filosofía: las vidas y opiniones de los grandes filósofos . Nuevo
York: Simon & Schuster, 1924.
Edmonds, Jack. "Ramificaciones óptimas". Revista de investigación de la Oficina Nacional de Normas
71B, no. 4 (1967): 233–240.
______. "Caminos, árboles y flores". Revista Canadiense de Matemáticas 17, no. 3 (1965): 449–467.
Erlang, Agner Krarup. “Solución de algunos problemas en la teoría de probabilidades de significancia en
Intercambios telefónicos automáticos ”. Elektrotkeknikeren 13 (1917): 5–13.
______. "La teoría de las probabilidades y las conversaciones telefónicas". Nyt Tidsskrift para Matematik B
20, nos. 33–39 (1909): 16.

Everett III, Hugh. “Método multiplicador de Lagrange generalizado para resolver problemas de óptimo
Asignación de recursos." Investigación de operaciones 11, no. 3 (1963): 399–417.
Feldman, Dorian. "Contribuciones al problema del 'bandido de dos brazos'". Anales de Matemática
Statistics 33 (1962): 847–856.
Ferguson, Thomas S. Parada y aplicaciones óptimas . Disponible en
http://www.math.ucla.edu/~tom/Stopping/.
______. "Detener una suma durante una ejecución exitosa". Annals of Statistics 4 (1976): 252–264.
______. "¿Quién resolvió el problema de la secretaria?" Ciencia estadística 4 (1989): 282–289.
Ferguson, Thomas S., Janis P. Hardwick y Mitsushi Tamaki. "Maximizar la duración de la propiedad
un objeto relativamente mejor ". En Estrategias para la búsqueda secuencial y la selección en tiempo real , 37–57.
Página 397
Providence: American Mathematical Society, 1992.

Ferriss, Timothy. La semana laboral de 4 horas . Nueva York: Crown, 2007.
Fiore, Neil A. El hábito del ahora: un programa estratégico para superar la procrastinación y disfrutar
Juego libre de culpa . Nueva York: Penguin, 2007.
Fisher, Marshall L. “El método de relajación lagrangiana para resolver la programación de enteros
Problemas." Management Science 27, no. 1 (1981): 1–18.
Fitzgerald, F. Scott. "The Crack-Up". Esquire 5, núms. 2-4 (1936).
______. El crack con otras piezas no recolectadas . Nueva York: New Directions, 1956.
Flood, Merrill M. "Soft News". Datamation 30, no. 20 (1984): 15–16.

______. "Algunos juegos experimentales". En el memorando de investigación RM-789 . Santa Mónica, CA:
RAND, 1952.
______. "El problema del vendedor ambulante". Investigación de operaciones 4, no. 1 (1956): 61–75.
______. "¿Qué futuro hay para las máquinas inteligentes?" Revisión de comunicación audiovisual 11,
no. 6 (1963): 260–270.

Forster, Edward M. Howards End . Londres: Edward Arnold, 1910.
Ahora, Lance. El boleto de oro: P, NP y la búsqueda de lo imposible . Princeton, Nueva Jersey:
Prensa de la Universidad de Princeton, 2013.
Fraker, Guy C. "La verdadera Lincoln Highway: Los marcadores olvidados del circuito de Lincoln". Diario de la
Asociación Abraham Lincoln 25 (2004): 76–97.
Frank, Robert H. “Si el Homo Economicus pudiera elegir su propia función de utilidad, ¿querría
¿Uno con conciencia? American Economic Review 1987, 593–604.
______. Pasiones dentro de la razón: el papel estratégico de las emociones . Nueva York: Norton, 1988.
Fredrickson, Barbara L. y Laura L. Carstensen. “Elección de interlocutores sociales: cómo la vejez y

Los finales anticipados hacen que las personas sean más selectivas ". Psychology and Aging 5 (1990): 335–347.
Freeman, PR "El problema de la secretaria y sus extensiones: una revisión". Estadística internacional
Review 51 (1983): 189–206.
Fung, Helene H., Laura L. Carstensen y Amy M. Lutz. “Influencia del tiempo en las preferencias sociales:
Implicaciones para el desarrollo de la vida útil ". Psychology and Aging 14 (1999): 595–604.
Gal, David y Blakeley B. McShane. “¿Pueden las pequeñas victorias ayudar a ganar la guerra? Evidencia de
Gestión de la deuda del consumidor ". Journal of Marketing Research 49 (2012): 487–501.
Gallagher, P. y C. Kerry. Estándar de firma digital . FIPS PUB 186-4, 2013.
Garey, Michael R. y David S. Johnson. Computadoras e intratabilidad: una guía para NP-
Integridad . Nueva York: WH Freeman, 1979.
Garfield, Eugene. "Reconociendo el papel del azar". Científico 2, no. 8 (1988): 10.
Garrett, AJM y P. Coles. “La inferencia inductiva bayesiana y la cosmología antrópica
Principio." Comentarios sobre Astrofísica. 17 (1993): 23–47.
Gasarch, William I. “¿La P =? NP Poll ". SIGACT News 33, no. 2 (2002): 34–47.
Gauthier, David P. Moral por acuerdo . Nueva York: Oxford University Press, 1985.
Geman, Stuart, Elie Bienenstock y René Doursat. "Redes neuronales y el sesgo / varianza
Dilema." Computación neuronal 4, no. 1 (1992): 1–58.
Geoffrion, Arthur M. "Lagrangean Relaxation for Integer Programming". Matemático
Estudio de programación 2 (1974): 82-114.
Página 398
______. "Relajación lagrangiana para la programación de enteros". En 50 años de programación de enteros
1958–2008: Desde los primeros años hasta el estado del arte . Editado por Michael Juenger, Thomas M.
Liebling, Denis Naddef, George L. Nemhauser, William R. Pulleyblank, Gerhard Reinelt,
Giovanni Rinaldi y Laurence A. Wolsey. Berlín: Springer, 2010, 243–281.
Gigerenzer, Gerd y Henry Brighton. "Homo Heuristicus: Por qué las mentes sesgadas mejoran
Inferencias ". Temas de ciencia cognitiva 1, no. 1 (2009): 107–143.
Gilbert, Daniel. Tropezando con la felicidad . Nueva York: Knopf, 2006.
Gilbert, John P. y Frederick Mosteller. "Reconociendo el máximo de una secuencia". Diario de la
Asociación Estadounidense de Estadística 61 (1966): 35–75.
Gilboa, Itzhak y Eitan Zemel. “Nash y los equilibrios correlacionados: cierta complejidad
Consideraciones ". Juegos y comportamiento económico 1, no. 1 (1989): 80–93.
Gillispie, Charles Coulston. Pierre-Simon Laplace, 1749–1827: Una vida en ciencia exacta . Princeton,
Nueva Jersey: Princeton University Press, 2000.
Gilmore, Paul C. y Ralph E. Gomory. “Un enfoque de programación lineal para el material de corte
Problema, Parte II ". Investigación de operaciones 11, no. 6 (1963): 863–888.
Gilovich, Thomas. Cómo sabemos lo que no es así . Nueva York: Simon & Schuster, 2008.
Ginsberg, Allen. Aullidos y otros poemas . San Francisco: Libros de luces de la ciudad, 1956.
Gittins, John C. "Procesos de bandidos e índices de asignación dinámica". Diario de la estadística real
Sociedad, Serie B (Metodológica) 41 (1979): 148-177.
Gittins, John C., Kevin Glazebrook y Richard Weber. Índices de asignación de bandidos de armas múltiples , segundo
ed. Chichester, Reino Unido: Wiley, 2011.
Gittins, John C. y D. Jones. “Un índice de asignación dinámica para el diseño secuencial de
Experimentos ". En progreso en estadística . Amsterdam: Holanda Septentrional, 1974, 241–266.
Glassner, Barry. "Técnicas narrativas de infundir miedo". Social Research 71 (2004): 819–826.
Goldberg, Paul W. y Christos H. Papadimitriou. "Reducibilidad entre problemas de equilibrio".
Simposio ACM sobre Teoría de la Computación 2006, 62–70.
Bien, Irving John. Buen pensamiento: los fundamentos de la probabilidad y sus aplicaciones .
Minneapolis, MN: University of Minnesota Press, 1983.
Gopnik, Alison, Andrew N. Meltzoff y Patricia K. Kuhl. El científico en la cuna . Nueva York:
Morrow, 1999.
Gordon, Deborah M. "Control sin jerarquía". Nature 446, no. 7132 (2007): 143.
Gott, JR "Futuros prospectos discutidos". Nature 368 (1994): 108.
______. "Implicaciones del principio copernicano para nuestras perspectivas futuras". Nature 363 (1993):
315–319.
Gould, Stephen Jay. "La mediana no es el mensaje". Descubre 6, no. 6 (1985): 40–42.
Graham, Ronald L., Eugene L. Lawler, Jan Karel Lenstra y Alexander HG Rinnooy Kan.
"Optimización y aproximación en secuenciación y programación deterministas: una encuesta".
Annals of Discrete Mathematics 5 (1979): 287–326.
Grenander, Ulf. "Sobre el análisis espectral empírico de procesos estocásticos". Arkiv para Matematik 1,
no. 6 (1952): 503–531.
Gridgeman, T. "Probabilidad geométrica y el número π ". Scripta Mathematika 25, no. 3 (1960):
183-195.
Griffiths, Thomas L., Charles Kemp y Joshua B. Tenenbaum. "Modelos bayesianos de cognición". En
El Manual de Cambridge de Modelado Cognitivo Computacional . Editado por Ron Sun.
Página 399
Cambridge, Reino Unido: Cambridge University Press, 2008.
Griffiths, Thomas L., Falk Lieder y Noah D. Goodman. “Uso racional de los recursos cognitivos:
Niveles de análisis entre lo computacional y lo algorítmico ". Temas de ciencia cognitiva
7 (2015): 217–229.
Griffiths, Thomas L., David M. Sobel, Joshua B. Tenenbaum y Alison Gopnik. "Bayes y
Blickets: Efectos del conocimiento sobre la inducción causal en niños y adultos ”. Ciencia cognitiva
35 (2011): 1407–1455.
Griffiths, Thomas L., Mark Steyvers y Alana Firl. "Google y la mente: predecir la fluidez con
Rango de página." Psychological Science 18 (2007): 1069–1076.
Griffiths, Thomas L. y Joshua B. Tenenbaum. "Predicciones óptimas en la cognición cotidiana".
Psychological Science 17 (2006): 767–773.
Grossman, Dave y LW Christensen. En combate . Belleville, IL: Publicaciones de investigación de PPCT,
2004.
Haggstrom, Gus W. "Procedimientos secuenciales óptimos cuando se requiere más de una parada".
Annals of Mathematical Statistics 38 (1967): 1618–1626.
Halevy, Alon, Peter Norvig y Fernando Pereira. "La efectividad irrazonable de los datos".
Sistemas inteligentes, IEEE 24, no. 2 (2009): 8–12.
Hardin, Garrett. "La tragedia de los comunes." Ciencia 162, no. 3859 (1968): 1243-1248.
Hardy, GH Obras completas . Vol. II. Oxford, Reino Unido: Oxford University Press, 1967.
______. "Números primos." Informe de la Asociación Británica 10 (1915): 350–354.
Harmenberg, J. Epee 2.0: El nacimiento del nuevo paradigma de la esgrima . Nueva York: SKA Swordplay
Libros, 2007.
Harsanyi, John C. “¿Puede el principio de Maximin servir como base para la moralidad? Una crítica de Juan
Teoría de Rawls ". The American Political Science Review 69, no. 2 (1975): 594–606.
Harvey, Jerry B. "La paradoja de Abilene: la gestión del acuerdo". Dinámica organizacional
3, no. 1 (1974): 63–80.
Hastings, WK "Métodos de Monte Carlo que utilizan cadenas de Markov y sus aplicaciones". Biometrika
57 (1970): 97–109.
Hawken, Angela y Mark Kleiman. Manejo de personas en libertad condicional involucradas con drogas con Swift and Certain
Sanciones: Evaluación de la ESPERANZA de Hawái . Informe presentado al Instituto Nacional de Justicia.
2009. http://www.ncjrs.gov/pdffiles1/nij/grants/229023.pdf .
Held, Michael y Richard M. Karp. “El problema del vendedor ambulante y la extensión mínima
Árboles." Investigación de operaciones 18, no. 6 (1970): 1138-1162.
______. "El problema del vendedor ambulante y los árboles de expansión mínima: parte II". Matemático
Programación 1, no. 1 (1971): 6–25.

Henderson, T. Técnicas discretas de relajación . Oxford, Reino Unido: Oxford University Press, 1989.
Hennessy, John L. y David A. Patterson. Arquitectura informática: un enfoque cuantitativo . Nuevo
York: Elsevier, 2012.
Herrmann, Jeffrey W. “Las perspectivas de Taylor, Gantt y Johnson: cómo mejorar la producción
Planificación." Revista Internacional de Operaciones y Gestión de la Calidad 16 (2010): 243–254.
Heyde, CC "Agner Krarup Erlang". En Estadísticos de los siglos . Editado por CC Heyde, E.
Seneta, P. Crepel, SE Fienberg y J. Gani, 328–330. Nueva York: Springer, 2001.
Hill, Theodore. "Saber cuándo parar". American Scientist 97 (2009): 126-131.
Página 400
Hillis, W. Daniel. El patrón en la piedra: las ideas simples que hacen que las computadoras funcionen . Nuevo
York: Basic Books, 1998.
Hirshleifer, Jack. "Sobre las emociones como garantes de amenazas y promesas". En The Latest on the
Mejor: Ensayos sobre evolución y optimización . Editado por John Dupre, 307–326. Cambridge, MA: MIT
Prensa, 1987.
Hoffman, David. Los oligarcas: riqueza y poder en la nueva Rusia . Nueva York: Asuntos Públicos,
2003.
Horvitz, Eric y Shlomo Zilberstein. "Compensaciones computacionales bajo recursos acotados".
Inteligencia artificial 126 (2001): 1–4.
Hosken, James C. "Evaluación de los métodos de clasificación". En artículos y debates presentados en el
7 al 9 de noviembre de 1955, Conferencia sobre informática conjunta AIEE-IRE del este: Computadoras en los negocios y
Sistemas industriales , 39–55.
Hurd, Cuthbert C. "Una nota sobre los primeros cálculos de Monte Carlo y reuniones científicas". IEEE
Annals of the
Impagliazzo, History
Russell ofWigderson.
y Avi Computing "7,Pno. 2 (1985):
= BPP 141-155.circuitos exponenciales:
si E requiere
Desaleatorizar el lema XOR ". En las actas del vigésimo noveno simposio anual de ACM
on Theory of Computing , 1997, 220–229.
______. "Aleatoriedad frente a tiempo: desaleatorización bajo un supuesto uniforme". en Actas
del 39º Simposio anual sobre fundamentos de la informática , 1998, 734–743.
Ingram, Wendy Marie, Leeanne M. Goodrich, Ellen A. Robey y Michael B. Eisen. "Ratones infectados
con cepas de baja virulencia de Toxoplasma gondii pierden su aversión innata a la orina de gato, incluso
Después de una amplia eliminación de parásitos ". PLOS ONE , no. 9 (2013): e75246.
Jackson, James R. Programación de una línea de producción para minimizar la tardanza máxima . Reporte técnico
43. Proyecto de investigación en ciencias de la gestión, Universidad de California, Los Ángeles, 1955.
Jacobson, Van. "Evitación y control de la congestión". En comunicación informática ACM SIGCOMM
Revisión 18, no. 4 (1988): 314–329.
______. "Una nueva forma de ver las redes". Conferencia en Google, Mountain View, CA, agosto
2006. https://www.youtube.com/watch?v=oCZMoY3q2uM.
James, William. "Grandes hombres, grandes pensamientos y el medio ambiente". Atlantic Monthly 46 (1880):
441–459.
______. Psicología: Curso Breve . Nueva York: Holt, 1892.
Jay, Francine. The Joy of Less: A Minimalist Living Guide: Cómo ordenar, organizar y simplificar
Tu vida . Medford, Nueva Jersey: Anja Press, 2010.
Jeffreys, Harold. "Una forma invariante para la probabilidad previa en problemas de estimación". Actas
de la Royal Society de Londres. Serie A. Ciencias físicas y matemáticas 186 (1946): 453–
461.
______. Teoría de la probabilidad , 3ª ed. Oxford, Reino Unido: Oxford University Press, 1961.
Johnson, Selmer Martin. “Programas de producción óptimos de dos y tres etapas con tiempos de configuración
Incluido." Naval Research Logistics Quarterly 1, no. 1 (1954): 61–68.
Johnson, Theodore y Dennis Shasha. "2Q: un búfer de alto rendimiento con gastos generales bajos
Algoritmo de sustitución de la gestión ". VLDB '94 Actas de la 20a Internacional
Conferencia sobre bases de datos muy grandes , 1994, 439–450.
Jones, Thomas B. y David H. Ackley. "Criticidad de comparación en algoritmos de clasificación". En 2014
44a Conferencia Internacional Anual IEEE / IFIP sobre redes y sistemas confiables (DSN) ,
Página 401
Junio de 2014, 726–731.

Jones, William. Mantener los objetos encontrados: el estudio y la práctica de la información personal
Gestión . Burlington, MA: Morgan Kaufmann, 2007.
Kaelbling, Leslie Pack. Aprendizaje en sistemas embebidos . Cambrige, MA: MIT Press, 1993.
Kaelbling, Leslie Pack, Michael L. Littman y Andrew W. Moore. "Aprendizaje por refuerzo: A
Encuesta." Revista de investigación de inteligencia artificial 4 (1996): 237-285.
Kanigel, Robert. The One Best Way: Frederick Winslow Taylor y el enigma de la eficiencia . Nuevo
York: Pingüino vikingo, 1997.
Kant, Emmanuel. Grundlegung zur Metaphysik der Sitten . Riga: Johann Friedrich Hartknoch, 1785.
______. Kritik der praktischen Vernunft . Riga: Johann Friedrich Hartknoch, 1788.
Karmarkar, Narendra. "Un nuevo algoritmo de tiempo polinomial para la programación lineal". En
Actas del Decimosexto Simposio Anual de ACM sobre Teoría de la Computación , 1984, 302–311.
Karp, Richard M. "Introducción a los algoritmos aleatorios". Matemáticas aplicadas discretas 34,
no. 1 (1991): 165–201.
______. "Reducibilidad entre problemas combinatorios". En la complejidad de los cálculos informáticos ,
85-103. Nueva York: Pleno, 1972.

Katajainen, Jyrki y Jesper Larsson Träff. "Un análisis meticuloso de los programas Mergesort". En
Algoritmos y complejidad: Tercera Conferencia Italiana CIAC '97 . Berlín: Springer, 1997.
Katehakis, Michael N. y Herbert Robbins. "Elección secuencial de varias poblaciones".
Actas de la Academia Nacional de Ciencias 92 (1995): 8584–8585.
Kelly, FP "Bandidos de armas múltiples con factor de descuento cercano a uno: el caso Bernoulli". Anales de
Statistics 9 (1981): 987–1001.
Kelly, John L. "Una nueva interpretación de la tasa de información". Teoría de la información, transacciones IRE en
2, no. 3 (1956): 185–189.
Khachiyan, Leonid G. "Algoritmos polinomiales en programación lineal". URSS Computacional
Matemáticas y Física Matemática 20, no. 1 (1980): 53–72.
Khot, Subhash y Oded Regev. "La cobertura de vértice puede ser difícil de aproximar dentro de 2- ε ".
Revista de Ciencias de la Computación y Sistemas 74, no. 3 (2008): 335–349.
Kidd, Celeste, Holly Palmeri y Richard N. Aslin. "Merienda racional: decisión de los niños pequeños-
La realización de la tarea Marshmallow está moderada por creencias sobre la confiabilidad ambiental ".
Cognición 126, no. 1 (2013): 109-114.
Kilburn, Tom, David BG Edwards, MJ Lanigan y Frank H. Sumner. "Almacenamiento de un nivel
Sistema." IRE Transactions on Electronic Computers (1962): 223-235.
Kinsbourne, Marcel. "Giro somático: un modelo para la evolución de la decusación". Neuropsicologia
27, no. 5 (2013): 511.
Kirby, Kris N. “Haciendo una oferta por el futuro: evidencia contra el descuento normativo de
Recompensas ". Revista de Psicología Experimental: General 126, no. 1 (1997): 54–70.
Kirkpatrick, Scott, CD Gelatt y MP Vecchi. "Optimización por recocido simulado". Ciencias
220, no. 4598 (1983): 671–680.
Knuth, Donald E. "Antiguos algoritmos babilónicos". Comunicaciones del ACM 15, no. 7 (1972):
671–677.
______. El arte de la programación informática, Volumen 1: Algoritmos fundamentales , 3ª ed. Bostón:
Addison-Wesley, 1997.
Página 402
______. El arte de la programación informática, volumen 3: clasificación y búsqueda , 3ª ed. Bostón:
Addison-Wesley, 1997.
______. "Una propuesta terminológica". ACM SIGACT News 6, no. 1 (1974): 12–18.
______. "La puesta a punto de TeX de 2014". Remolcador 35, no. 1 (2014).
______. Cosas de las que rara vez habla un informático . Stanford, CA: Centro para el estudio de
Idioma / Información, 2001.

______. "Primer programa informático de Von Neumann". Encuestas de Computación ACM (CSUR) 2, no. 4
(Diciembre de 1970): 247–260.

Koestler, Arthur. La cuenca: una biografía de Johannes Kepler . Garden City, Nueva York: Doubleday,
1960.
Kozen, Dexter y Shmuel Zaks. "Límites óptimos para el problema del cambio". En Automata,
Lenguajes y programación , 700: 150–161. Editado por Andrzej Lingas, Rolf Karlsson y
Svante Carlsson. Berlín: Springer, 1993.
Lai, Tze Leung y Herbert Robbins. "Reglas de asignación adaptable asintóticamente eficientes".
Advances in Applied Mathematics 6 (1985): 4-22.
Lamport, Leslie, Robert Shostak y Marshall Pease. "El problema de los generales bizantinos". ACM
Transacciones sobre lenguajes y sistemas de programación (TOPLAS) 4, no. 3 (1982): 382–401.
Laplace, Pierre-Simon. Un ensayo filosófico sobre probabilidades . 1812. Reimpresión, Nueva York: Dover,
1951.
______. "Memorias sobre la probabilidad de las causas de los eventos". Ciencia estadística 1 (1774/1986):
364–378.
______. Théorie analytique des probabilités . París: Mme Ve Courcier, 1812.
Lawler, Eugene L. "Historias antiguas". En Historia de la Programación Matemática. Una coleccion de

Reminiscencias personales , 97–106. Ámsterdam: CIT / Holanda Septentrional, 1991.
______. "Secuenciación óptima de una sola máquina sujeta a restricciones de precedencia". Gestión
Ciencia 19, no. 5 (1973): 544–546.

______. Programación de una sola máquina para minimizar el número de trabajos atrasados . Reporte técnico.
Berkeley: Universidad de California, 1983.

______. “Programación de una sola máquina para minimizar el número de trabajos atrasados”, núm. UCB / CSD-83-
139 (1983). http://www.eecs.berkeley.edu/Pubs/TechRpts/1983/6344.html .

______. “Secuencia de trabajos para minimizar el tiempo total ponderado de finalización sujeto a precedencia
Restricciones ". Annals of Discrete Mathematics 2 (1978): 75–90.

Lawler, Eugene L., Jan Karel Lenstra y Alexander HG Rinnooy Kan. “¡Un regalo para Alexander !: en
Juega en los campos de la teoría de la programación ". Optima 7 (1982): 1-3.
Lawler, Eugene L., Jan Karel Lenstra, Alexander HG Rinnooy Kan y David B. Shmoys.
"Secuenciación y programación: algoritmos y complejidad". En manuales de operaciones
Research and Management Science, Volumen 4: Logística de producción e inventario , editado por
SS Graves, AHG Rinnooy Kan y P. Zipkin, 445–522. Amsterdam: Holanda Septentrional, 1993.
______. El problema del vendedor ambulante: una visita guiada de optimización combinatoria . Nuevo
York: Wiley, 1985.
Página 403
Lazzarini, Mario. “Un'applicazione del calcolo della probabilità alla ricerca sperimentale di un valore
approssimato di π ”. Periodico di Matematica 4 (1901): 140-143.
Lee, Donghee, SH Noh, SL Min, J. Choi, JH Kim, Yookun Cho y Chong Sang Kim. “LRFU:
Un espectro de políticas que incluye las menos utilizadas recientemente y las menos utilizadas
Políticas ". IEEE Transactions on Computers 50 (2001): 1352-1361.
Le Guin, Ursula K. "Los que se alejan de Omelas". En nuevas dimensiones 3 . Editado por
Robert Silverberg. Nueva York: Signet, 1973.
Lenstra, Jan Karel. "El poder místico de Twoness: In Memoriam Eugene L. Lawler". Diario de
Programación 1, no. 1 (1998): 3–14.
Lenstra, Jan Karel, Alexander HG Rinnooy Kan y Peter Brucker. “Complejidad de la máquina
Problemas de programación ". Annals of Discrete Mathematics 1 (1977): 343–362.
Lerner, Ben. Las figuras de Lichtenberg . Port Townsend, WA: Copper Canyon Press, 2004.
Lindley, Denis V. "Programación dinámica y teoría de la decisión". Estadísticas aplicadas 10 (1961): 39–
51.
Lippman, Steven A. y John J. McCall. "La economía de la búsqueda de empleo: una encuesta". Económico
Investigación 14 (1976): 155–189.
Lorie, James H. y Leonard J. Savage. "Tres problemas en el racionamiento del capital". Revista de negocios
28, no. 4 (1955): 229–239.
Lowe, Christopher J., Mark Terasaki, Michael Wu, Robert M. Freeman Jr., Linda Runft, Kristen
Kwan, Saori Haigo, Jochanan Aronowicz, Eric Lander, Chris Gruber, et al. Dorsoventral
Patrones en hemicordados: conocimientos sobre la evolución temprana de los cordados ". PLoS Biology 4, no. 9
(2006): e291.
Lucas, Richard E., Andrew E. Clark, Yannis Georgellis y Ed Diener. "Reexaminando la adaptación
y el modelo de punto de ajuste de la felicidad: reacciones a los cambios en el estado civil ". Diario de
Personalidad y psicología social 84, no. 3 (2003): 527–539.
Lueker, George S. "Two NP-Complete Problems in Nonnegative Integer Programming". Técnico
Informe TR-178 , Laboratorio de Ciencias de la Computación, Universidad de Princeton, 1975.
Luria, Salvador E. Una máquina tragamonedas, un tubo de ensayo roto: una autobiografía . Nueva York: Harper &
Row, 1984.
MacQueen, J. y RG Miller. "Políticas de persistencia óptima". Investigación de operaciones 8 (1960): 362–
380.
Malthus, Thomas Robert. Ensayo sobre el principio de población . Londres: J. Johnson, 1798.
Marcus, Gary. Kluge: La evolución fortuita de la mente humana . Nueva York: Houghton Mifflin
Harcourt, 2009.
Markowitz, Harry. "Selección de cartera". Revista de Finanzas 7, no. 1 (1952): 77–91.
______. Selección de carteras: diversificación eficiente de inversiones . Nueva York: Wiley, 1959.
Martin, Thomas Commerford. "Contando una nación por electricidad". Ingeniero eléctrico 12, no. 184
(1891): 521–530.
McCall, John. "Economía de la información y la búsqueda de empleo". Revista Trimestral de Economía 84
(1970): 113–126.
McGrayne, Sharon Bertsch. La teoría que no moriría: cómo la regla de Bayes rompió el enigma
Code, caza submarinos rusos y emergió triunfante de dos siglos de
Controversia . New Haven, CT: Yale University Press, 2011.
McGuire, Joseph T. y Joseph W. Kable. "Los tomadores de decisiones calibran la persistencia del comportamiento en el
Base de la experiencia de intervalo de tiempo ". Cognición 124, no. 2 (2012): 216–226.
Página 404
______. "Las predicciones temporales racionales pueden ser la base de los fracasos aparentes para retrasar la gratificación".
Revista Psicológica 120, no. 2 (2013): 395.

Megiddo, Nimrod y Dharmendra S. Modha. “Superando a LRU con un reemplazo adaptable
Algoritmo de caché ". Computadora 37, no. 4 (2004): 58–65.
Mellen, Andrew. ¡Desentraña tu vida! Deje el hábito del desorden y organice completamente su vida para
Bueno . Nueva York: Avery, 2010.
Menezes, Alfred J., Paul C. Van Oorschot y Scott A Vanstone. Manual de aplicados
Criptografía . Boca Raton, FL: CRC Press, 1996.
Menger, Karl. "Das botenproblem". Ergebnisse eines mathischen kolloquiums 2 (1932): 11-12.
Metropolis, Nicholas, Arianna W. Rosenbluth, Marshall N. Rosenbluth, Augusta H. Teller y
Edward Teller. "Cálculos de ecuación de estado por máquinas de computación rápida". Diario de
Física química 21, no. 6 (1953): 1087–1092.
Meyer, Robert J. y Yong Shi. “Elección secuencial bajo ambigüedad: soluciones intuitivas para
Problema de bandido armado ". Management Science 41 (1995): 817–834.
Millard-Ball, Adam, Rachel R. Weinberger y Robert C. Hampshire. "¿Está el bordillo lleno al 80% o al 20%?
¿Vacío? Evaluación de los impactos del experimento de precios de estacionamiento de San Francisco ". Transporte
Parte de investigación A: Política y práctica 63 (2014): 76–92.
Mischel, Walter, Ebbe B. Ebbesen y Antonette Raskoff Zeiss. "Cognitivo y atencional
Mecanismos en el retraso de la gratificación ". Revista de Personalidad y Psicología Social 21, no. 2
(1972): 204.
Mischel, Walter, Yuichi Shoda y Monica I. Rodríguez. "Retraso de la gratificación en los niños."
Ciencia 244, no. 4907 (1989): 933–938.
Mitzenmacher, Michael y Eli Upfal. Probabilidad y computación: algoritmos aleatorios y
Análisis probabilístico . Cambridge, Reino Unido: Cambridge University Press, 2005.
Monsell, Stephen. "Cambiar de tarea." Tendencias en las ciencias cognitivas 7, no. 3 (2003): 134–140.
Moore, Gordon E. "Abarrotar más componentes en circuitos integrados". Revista Electrónica 38
(1965): 114-117.
______. "Progreso en electrónica digital integrada". En Encuentro Internacional de Dispositivos Electrónicos
1975 Technical Digest , 1975, 11-13.

Moore, J. Michael. "Un N trabajo, un algoritmo de secuenciación de una máquina para minimizar el número de
Trabajos tardíos ". Management Science 15, no. 1 (1968): 102–109.
Morgenstern, Julie. Organizar desde adentro hacia afuera: el sistema infalible para organizar su
Hogar, tu oficina y tu vida . Nueva York: Macmillan, 2004.
Moser, L. "Sobre un problema de Cayley". Scripta Mathematica 22 (1956): 289-292.
Motwani, Rajeev y Prabhakar Raghavan. Algoritmos aleatorios . Cambridge, Reino Unido: Cambridge
Prensa universitaria, 1995.
______. "Algoritmos aleatorios". Encuestas de Computación ACM (CSUR) 28, no. 1 (1996): 33–37.
Mucci, AG "Sobre una clase de problemas de secretarios". Annals of Probability 1 (1973): 417–427.
Murray, David. Capítulos de Historia de la Teneduría de libros, Contabilidad y Aritmética Comercial .
Glasgow, Reino Unido: Jackson, Wylie, 1930.
Myerson, Roger B. "El equilibrio de Nash y la historia de la teoría económica". Revista de economía
Literature 1999, 1067–1082.
______. "Diseño de subasta óptimo". Matemáticas de la investigación operativa 6, no. 1 (1981): 58–73.
Página 405
Nash, John F. "Equilibrium Points in N -Person Games". Actas de la Academia Nacional de

Ciencias 36, no. 1 (1950): 48–49.
______. "Juegos no cooperativos". Annals of Mathematics 54, no. 2 (1951): 286–295.
______. "El problema de la negociación". Econometrica 18, no. 2 (1950): 155-162.
Navarro, Daniel J. y Ben R. Newell. "Información versus recompensa en un mundo cambiante". En

Actas de la 36ª Conferencia Anual de la Sociedad de Ciencias Cognitivas , 2014, 1054–1059.
Neumann, John von y Oskar Morgenstern. Teoría de los juegos y comportamiento económico . Princeton,
Nueva Jersey: Princeton University Press, 1944.
Neyman, Jerzy. “Esquema de una teoría de la estimación estadística basada en la teoría clásica de
Probabilidad." Transacciones filosóficas de la Royal Society de Londres. Serie A, Matemática
y Ciencias Físicas 236, no. 767 (1937): 333–380.
Nichols, Kathleen y Van Jacobson. “Controlar el retraso en la cola: un AQM moderno es solo una pieza
de la solución a Bufferbloat ". Redes de cola ACM 10, no. 5 (2012): 20–34.
Nisan, Noam y Amir Ronen. "Diseño de mecanismos algorítmicos". En Proceedings of the Thirty-
Primer Simposio Anual de ACM sobre Teoría de la Computación , 1999, 129–140.
Olshausen, Bruno A. y David J. Field. “Aparición de propiedades de campo receptivo de celda simple por
Aprendiendo un código escaso para imágenes naturales ". Nature 381 (1996): 607–609.
O'Neil, Elizabeth J., Patrick E. O'Neil y Gerhard Weikum. "El reemplazo de la página LRU- K
Algoritmo para almacenamiento en búfer de disco de base de datos ”, registro 22 de ACM SIGMOD , no. 2 (1993): 297-306.
Papadimitriou, Christos. "Prefacio." En teoría algorítmica de juegos . Editado por Noam Nisan, Tim
Roughgarden, Éva Tardos y Vijay V. Vazirani. Cambridge, Reino Unido: Cambridge University Press,
2007.
Papadimitriou, Christos H. y John N. Tsitsiklis. “La complejidad de una red de cola óptima
Control." Matemáticas de la investigación operativa 24 (1999): 293-305.
Papadimitriou, Christos H. y Mihalis Yannakakis. "Sobre la complejidad como racionalidad limitada". En
Actas del vigésimo sexto simposio anual de ACM sobre teoría de la computación , 1994, 726–
733.
Pardalos, Panos M. y Georg Schnitger. "Comprobación de la optimización local en cuadrática restringida
La programación es NP -hard ". Cartas de investigación operativa 7 (1988): 33–35.
Pareto, Vilfredo. Cours d'économie politique . Lausana: F. Rouge, 1896.
Parfit, Derek. Razones y Personas . Oxford, Reino Unido: Oxford University Press, 1984.
Partnoy, Frank. Espera: el arte y la ciencia del retraso . Nueva York: Asuntos Públicos, 2012.
Pascal, Blaise. Pensées sur la religion et sur quelques autres sujets . París: Guillaume Desprez, 1670.
Peter, Laurence J. y Raymond Hull. El principio de Peter: por qué las cosas siempre salen mal . Nuevo
York: Morrow, 1969.
Petruccelli, Joseph D. “Problemas de mejor elección que involucran incertidumbre de selección y recuerdo de
Observaciones ". Journal of Applied Probability 18 (1981): 415–425.
Pettie, Seth y Vijaya Ramachandran. "Un algoritmo de árbol de expansión mínimo óptimo". diario
del ACM 49, no. 1 (2002): 16–34.
Pinedo, Michael. Programación: teoría, algoritmos y sistemas . Nueva York: Springer, 2012.
______. "Programación estocástica con fechas de lanzamiento y fechas de vencimiento". Investigación de operaciones 31, no. 3
(1983): 559–572.
Pirsig, Robert M. Zen y el arte del mantenimiento de motocicletas . Nueva York: Morrow, 1974.
Página 406
Poundstone, William. Fórmula de la fortuna: la historia no contada del sistema científico de apuestas que
Vence a los casinos y Wall Street . Nueva York: Macmillan, 2005.
______. El dilema del prisionero: John von Neumann, teoría de juegos y el rompecabezas de la bomba . Nuevo
York: Doubleday, 1992.

Prabhakar, Balaji, Katherine N. Dektar y Deborah M. Gordon. “La regulación de la colonia de hormigas
Actividad de búsqueda de alimentos sin información espacial ". PLoS Computational Biology 8, no. 8 (2012):
e1002670.
Presman, Ernst L'vovich e Isaac Mikhailovich Sonin. “El problema de la mejor elección para un
Número de objetos ". Teoriya Veroyatnostei i ee Primeneniya 17 (1972): 695–706.
Sociedad de Dirección de Producción y Operaciones. "James R. Jackson". Producción y Operaciones
Gestión 17, no. 6 (2008): i – ii.
Rabin, Michael O. "Algoritmo probabilístico para probar la primordialidad". Revista de teoría de números 12, no.
1 (1980): 128-138.
Rabin, Michael O. y Dana Scott. "Autómatas finitos y sus problemas de decisión". IBM Journal of
Investigación y desarrollo 3 (1959): 114–125.
Raichle, Marcus E. y Debra A. Gusnard. "Evaluación del presupuesto energético del cerebro". Procedimientos de
la Academia Nacional de Ciencias 99, no. 16 (2002): 10237–10239.
Ramakrishnan, Kadangode y Sally Floyd. Una propuesta para agregar una notificación de congestión explícita
(ECN) a IP . Reporte técnico. RFC 2481, enero de 1999.
Ramakrishnan, Kadangode, Sally Floyd y David Black. La adición de congestión explícita
Notificación (ECN) a IP . Reporte técnico. RFC 3168, septiembre de 2001.
Ramscar, Michael, Peter Hendrix, Cyrus Shaoul, Petar Milin y Harald Baayen. "El mito de
Declive cognitivo: dinámica no lineal del aprendizaje permanente ". Temas en Ciencias Cognitivas 6,
no. 1 (2014): 5–42.
Rasmussen, Willis T. y Stanley R. Pliska. "Elegir el máximo de una secuencia con un
Función de descuento ". Matemáticas aplicadas y optimización 2 (1975): 279-289.
Rawls, John. Una teoría de la justicia . Cambridge, MA: Harvard University Press, 1971.
Revusky, Samuel H. y Erwin W. Bedarf. “Asociación de enfermedad con ingestión previa de novela
Alimentos ". Science 155, no. 3759 (1967): 219–220.
Reynolds, Andy M. "Firmas de búsqueda Lévy optimizada activa y pasiva en medusas".
Revista de la Royal Society Interface 11, no. 99 (2014): 20140665.
Ridgway, Valentine F. "Consecuencias disfuncionales de las mediciones de rendimiento". Administrativo
Science Quarterly 1, no. 2 (1956): 240–247.
Riley, John G. y William F. Samuelson. "Subastas óptimas". American Economic Review 71, no.
3 (1981): 381–392.
Rittaud, Benoît y Albrecht Heeffer. "El principio del casillero, dos siglos antes de Dirichlet".
Intelligencer matemático 36, no. 2 (2014): 27–29.
Rivest, Ronald L., Adi Shamir y Leonard Adleman. “Un método para obtener firmas digitales
y criptosistemas de clave pública ". Comunicaciones del ACM 21, no. 2 (1978): 120–126.
Robbins, Herbert. "Algunos aspectos del diseño secuencial de experimentos". Boletín de la
Sociedad Americana de Matemáticas 58 (1952): 527–535.
Robinson, Julia. Sobre el juego hamiltoniano (un problema de vendedor ambulante) . Reporte técnico
RAND / RM-303. Santa Mónica, CA: RAND, 1949.
Rogerson, Richard, Robert Shimer y Randall Wright. Modelos teóricos de búsqueda del trabajo
Mercado: una encuesta . Reporte técnico. Cambridge, MA: Oficina Nacional de Investigación Económica,
Página 407
2004.
Rose, John S. "Un problema de elección y asignación óptimas". Investigación de operaciones 30 (1982):
172-181.
Rosenbaum, David A., Lanyun Gong y Cory Adam Potts. "Precrastinación: acelerar el subobjetivo
Finalización a expensas de un esfuerzo físico adicional ". Ciencia psicológica 25, no. 7 (2014):
1487–1496.
Rosenbluth, Marshall. Marshall Rosenbluth, entrevistado por Kai-Henrik Barth . 11 de agosto de 2003,
College Park, MD.
Rostker, Bernard D., Harry J. Thie, James L. Lacy, Jennifer H. Kawata y Susanna W. Purnell. los
Ley de gestión de personal de oficiales de defensa de 1980: una evaluación retrospectiva . Santa Mónica,
CA: RAND, 1993.
Roughgarden, Tim y Éva Tardos. "¿Qué tan grave es el enrutamiento egoísta?" Revista del ACM 49, no. 2
(2002): 236–259.
Russell, Bertrand. "Los elementos de la ética". En Philosophical Essays , 13–59. Londres: Longmans,
Verde, 1910.
Russell, Stuart y Peter Norvig. Inteligencia artificial: un enfoque moderno, 3ª ed. Sillín superior
River, Nueva Jersey: Pearson, 2009.
Russell, Stuart y Eric Wefald. Haz lo correcto . Cambridge, MA: MIT Press, 1991.
Sagan, Carl. El cerebro de Broca: reflexiones sobre el romance de la ciencia . Nueva York: Random House,
1979.
Sakaguchi, Minoru. "Juegos secuenciales bilaterales relacionados con el problema de la secretaria sin información".
Mathematica Japonica 29 (1984): 961–974.
______. "Programación dinámica de algún diseño de muestreo secuencial". Revista de Matemáticas
Análisis y aplicaciones 2 (1961): 446–466.
Sakaguchi, Minoru y Mitsushi Tamaki. “Sobre el problema del aparcamiento óptimo en qué espacios
Aparecen aleatoriamente ". Boletín de Informática y Cibernética 20 (1982): 1–10.
Sartre, Jean-Paul. Sin salida: una obra de teatro en un acto . Nueva York: Samuel French, 1958.
Schelling, Thomas C. "Altruismo, mezquindad y otros comportamientos potencialmente estratégicos". americano
Revista Económica 68, no. 2 (1978): 229–230.
______. La estrategia del conflicto . Cambridge, MA: Harvard University Press, 1960.
Schneier, Bruce. Criptografía aplicada . Nueva York: Wiley, 1994.

Schrage, Linus. "Una prueba de lo óptimo de la disciplina de tiempo de procesamiento restante más corto".
Investigación de operaciones 16, no. 3 (1968): 687–690.
Schrijver, Alexander. "Sobre la historia de la optimización combinatoria (hasta 1960)". En Manuales en
Investigación de operaciones y ciencia de la gestión: optimización discreta . Editado por Karen Aardal,
George L. Nemhauser y Robert Weismantel. Amsterdam: Elsevier, 2005, 1-68.
Schwartz, Jacob T. "Algoritmos probabilísticos rápidos para la verificación de identidades polinomiales". diario
del ACM 27, no. 4 (1980): 701–717.
Seale, Darryl A. y Amnon Rapoport. "Toma de decisiones secuencial con rangos relativos: una
Investigación experimental del 'Problema de la secretaria' ”. Comportamiento organizacional y
Decision Processes 69 (1997): 221–236.
Sen, Amartya. "Metas, compromiso e identidad". Revista de derecho, economía y organización 1
(1985): 341–355.
Página 408
Sethi, Rajiv. "Negociación algorítmica y volatilidad de precios". Rajiv Sethi (blog), 7 de mayo de 2010,
http://rajivsethi.blogspot.com/2010/05/algorithmic-trading-and-price.html.
Sevcik, Kenneth C. "Programación de pérdidas totales mínimas mediante distribuciones de tiempo de servicio".
Revista del ACM 21, no. 1 (1974): 66–75.
Lo haré, Jeffrey. "Lo que este país necesita es una pieza de 18 ¢". Inteligencia matemática 25, no. 2
(2003): 20–23.
Shasha, Dennis y Cathy Lazere. Fuera de sus mentes: las vidas y los descubrimientos de 15 grandes
Científicos informáticos . Nueva York: Springer, 1998.
Shasha, Dennis y Michael Rabin. "Una entrevista con Michael Rabin". Comunicaciones del
ACM 53, no. 2 (2010): 37–42.
Shaw, Frederick S. Introducción a los métodos de relajación . Nueva York: Dover, 1953.
Shaw, George Bernard. Hombre y Superman: una comedia y una filosofía . Cambridge, MA: Harvard
Prensa universitaria, 1903.
Shoup, Donald. El alto costo del estacionamiento gratuito . Chicago: APA Planners Press, 2005.
Simon, Herbert A. "Un modelo de comportamiento de elección racional". Revista Trimestral de Economía 69,
no. 1 (1955): 99-118.
______. Modelos de hombre . Nueva York: Wiley, 1957.
______. "En una clase de funciones de distribución sesgadas". Biometrika , 1955, 425–440.
Siroker, Dan. "Cómo Obama recaudó $ 60 millones mediante la ejecución de un experimento simple". El Optimizely
Blog: Pruebas A / B que utilizará en realidad (blog), 29 de noviembre de 2010,
https://blog.optimizely.com/2010/11/29/how-obama-raised-60-million-by-running-a-simple-
experimento / .
Siroker, Dan y Pete Koomen. Pruebas A / B: la forma más eficaz de convertir los clics en clientes .
Nueva York: Wiley, 2013.
Sleator, Daniel D. y Robert E. Tarjan. "Eficiencia amortizada de las reglas de paginación y actualización de listas".
Comunicaciones del ACM 28 (1985): 202-208.
Smith, Adam. La teoría de los sentimientos morales . Impreso para A. Millar, en el Strand; y A. Kincaid
y J. Bell, en Edimburgo, 1759.
Smith, MH "Un problema de secretaria con el empleo incierto". Journal of Applied Probability 12,
no. 3 (1975): 620–624.
Smith, Wayne E. "Varios optimizadores para la producción de una sola etapa". Logística de investigación naval
Trimestral 3, núms. 1–2 (1956): 59–66.
Solovay, Robert y Volker Strassen. "Una prueba rápida de Montecarlo para determinar la originalidad". SIAM Journal en
Computing 6 (1977): 84–85.
Starr, Norman. "Cómo ganar una guerra si es necesario: detención óptima basada en carreras exitosas". Anales
de Estadística Matemática 43, no. 6 (1972): 1884–1893.
Stephens, David W. y John R. Krebs. Teoría del forrajeo . Princeton, Nueva Jersey: Princeton University Press,
1986.
Stewart, Martha. Manual de limpieza del hogar de Martha Stewart: La guía esencial para cuidar
Todo en tu hogar . Nueva York: Clarkson Potter, 2006.
Steyvers, Mark, Michael D. Lee y Eric-Jan Wagenmakers. "Un análisis bayesiano de humanos
Toma de decisiones sobre problemas de bandidos ". Revista de Psicología Matemática 53 (2009): 168-179.
Stigler, George J. "La economía de la información". Journal of Political Economy 69 (1961): 213–
225.
Página 409
______. “Información en el mercado laboral”. Journal of Political Economy 70 (1962): 94-105.

Stigler, Stephen M. "Ley de la eponimia de Stigler". Transacciones de la Academia de Ciencias de Nueva York
39 (1980): 147-157.
Tamaki, Mitsushi. "Enfoque adaptativo a algunos problemas de frenado". Diario de probabilidad aplicada
22 (1985): 644–652.
______. "Un problema de estacionamiento óptimo". Journal of Applied Probability 19 (1982): 803–814.
______. "Parada óptima en el problema de estacionamiento con giro en U". Diario de probabilidad aplicada 25
(1988): 363–374.
Thomas, Helen. Primera fila de la Casa Blanca: mi vida y mi época . Nueva York: Simon & Schuster,
2000.
Thompson, William R. “Sobre la probabilidad de que una probabilidad desconocida supere a otra a la vista
de la evidencia de dos muestras ". Biometrika 25 (1933): 285-294.
Thoreau, Henry David. "Caminando." Atlantic Monthly 9 (1862): 657–674.
Tibshirani, Robert. "Contracción de regresión y selección a través del lazo". Diario de la Real
Sociedad estadística. Serie B (Metodológica) 58, no. 1 (1996): 267–288.
Tikhonov, AN y VY Arsenin. Solución de problemas planteados . Washington, DC: Winston, 1977.
Todd, Peter M. "Mecanismos cognitivos coevolucionados en la búsqueda de pareja". Evolución y la mente social:
Psicología evolutiva y cognición social (Nueva York) 9 (2007): 145-159.
Todd, Peter M. y GF Miller. “Del orgullo y el prejuicio a la persuasión: satisfacción en el mate
Buscar." En heurísticas simples que nos hacen inteligentes . Editado por G. Gigerenzer y PM Todd. Nuevo
York: Oxford University Press, 1999, 287–308.
Tolins, Jackson y Jean E. Fox Tree. "Los canales de retorno del destinatario dirigen el desarrollo narrativo".
Journal of Pragmatics 70 (2014): 152-164.
Tracy, Brian. ¡Come esa rana! 21 excelentes maneras de dejar de procrastinar y hacer más en menos
Tiempo . Oakland, CA: Berrett-Koehler, 2007.
Turing, Alan M. "Sobre números computables, con una aplicación al problema de Entscheidung".
Leído el 12 de noviembre de 1936. Actas de la London Mathematical Society s2-42, no. 1 (1937):
230-265.
______. "Sobre números computables, con una aplicación al problema Entscheidungs: A
Corrección." Actas de la London Mathematical Society s2-43, no. 1 (1938): 544–546.

Tversky, Amos y Ward Edwards. "Información versus recompensa en opciones binarias". Diario de
Psicología experimental 71 (1966): 680–683.
Ulam, Stanislaw M. Aventuras de un matemático . Nueva York: Scribner, 1976.
Ullman, Ellen. "Fuera de tiempo: reflexiones sobre la vida de la programación". Educom Review 31 (1996): 53–
59.
Grupo ECMO colaborativo del Reino Unido. "El ensayo ECMO colaborativo del Reino Unido: seguimiento hasta 1 año de edad".
Pediatría 101, no. 4 (1998): e1.
Vazirani, Vijay V. Algoritmos de aproximación . Nueva York: Springer, 2001.
Vickrey, William. "Contraespeculación, subastas y licitaciones cerradas competitivas". Diario de
Finanzas 16, no. 1 (1961): 8–37.
Waitzman, David. Un estándar para la transmisión de datagramas IP en aves portadoras . Técnico
reporte. RFC 1149, abril de 1990.
______. Transportistas IP sobre Aviar con Calidad de Servicio . Reporte técnico. RFC 2549, abril de 1999.
Página 410
Ware, James H. "Investigando terapias de grandes beneficios potenciales: ECMO". Ciencia estadística 4
(1989): 298-306.
Ware, James H. y Michael F. Epstein. “Comentarios sobre 'Circulación extracorpórea en neonatos
Insuficiencia respiratoria: un estudio prospectivo aleatorizado 'por RH Bartlett et al. ” Pediatría 76, no.
5 (1985): 849–851.
Warhol, Andy. La filosofía de Andy Warhol (de A a B y viceversa) . Nueva York: Harcourt
Brace Jovanovich, 1975.
Weiss, Yair, Eero P. Simoncelli y Edward H. Adelson. "Ilusiones de movimiento como percepciones óptimas".
Nature Neuroscience 5 (2002): 598–604.
Whittaker, Steve y Candace Sidner. "Sobrecarga de correo electrónico: exploración de información personal
Gestión del correo electrónico ". En Actas de la Conferencia SIGCHI sobre Factores Humanos en
Computing Systems , 1996, 276–283.
Whittaker, Steve, Tara Matthews, Julian Cerruti, Hernan Badenes y John Tang. "¿Estoy desperdiciando mi
¿Tiempo de organización del correo electrónico? Un estudio sobre el reencuentro de correo electrónico ". En Actas de la Conferencia SIGCHI
sobre factores humanos en sistemas informáticos , 2011, 3449–3458.
Whittle, Peter. Optimización en el tiempo: Programación dinámica y control estocástico . Nueva York:
Wiley, 1982.
______. "Bandidos inquietos: asignación de actividades en un mundo cambiante". Diario de probabilidad aplicada
25 (1988): 287–298.
Wigderson, Avi. "Conocimiento, creatividad y P versus NP ".
http://www.math.ias.edu/~avi/PUBLICATIONS/MYPAPERS/AW09/AW09.pdf , 2009.
Wilkes, Maurice V. "Memorias esclavas y asignación dinámica de almacenamiento". Transacciones IEEE en
Electronic Computers 14 (1965): 270-271.
Wright, JW "El problema del cambio". Revista de la Asociación de Maquinaria Informática
22 (1975): 125-128.
Wulf, William Allan y Sally A. McKee. "Golpear el muro de la memoria: implicaciones de lo obvio".
ACM SIGARCH Computer Architecture News 23, no. 1 (1995): 20–24.
Xu, Fei y Joshua B. Tenenbaum. "El aprendizaje de palabras como inferencia bayesiana". Revisión psicológica
114 (2007): 245–272.
Yang, Mark CK “Reconociendo el máximo de una secuencia aleatoria en función del rango relativo con
Solicitud hacia atrás ". Journal of Applied Probability 11 (1974): 504-512.
Yato, Takayuki y Takahiro Seta. “Complejidad e integridad de encontrar otra solución y
Su aplicación a los rompecabezas ". Transacciones de IEICE sobre fundamentos de electrónica,
Comunicaciones y Ciencias de la Computación 86, no. 5 (2003): 1052–1060.
Yngve, Victor H. "Acerca de cómo obtener una palabra en Edgewise". En Chicago Linguistics Society, sexta reunión ,
1970, 567–578.
Zahniser, Rick. "Timeboxing para el mejor rendimiento del equipo". Desarrollo de software 3, no. 3 (1995):
34–38.
Zapol, Warren M., Michael T. Snider, J. Donald Hill, Robert J. Fallat, Robert H. Bartlett, L. Henry
Edmunds, Alan H. Morris, E. Converse Peirce, Arthur N. Thomas, Herbert J. Proctor y col.
“Oxigenación de membrana extracorpórea en insuficiencia respiratoria aguda grave: una
Estudio prospectivo." Revista de la Asociación Médica Estadounidense 242, no. 20 (1979): 2193–2196.
Zelen, Marvin. "Juegue la regla del ganador y el ensayo clínico controlado". Diario del americano
Asociación de Estadística 64, no. 325 (1969): 131–146.
Página 411
Zippel, Richard. "Algoritmos probabilísticos para polinomios dispersos". En los procedimientos de EUROSAM '79
del Simposio Internacional de Computación Simbólica y Algebraica . Londres: Springer,
1979, 216-226.
Página 412
Índice
El índice que apareció en la versión impresa de este título no coincide con el

páginas de su libro electrónico. Utilice la función de búsqueda en su lectura electrónica
dispositivo para buscar términos de interés. Para su referencia, los términos que
aparecen en el índice de impresión se enumeran a continuación.
Subasta de flores de Aalsmeer

Aaronson, Scott
Abramson, normando
Pruebas A / B
Ackley, Dave
paquetes de reconocimiento (ACK)
"Ensayos clínicos de diseño adaptativo"
Aumento aditivo, disminución multiplicativa (AIMD)
Regla aditiva
envejecimiento
Agrawal, Manindra
viaje aéreo
Akamai
teoría de juegos algorítmicos. Ver también teoría de juegos
algoritmos. Ver también problemas y algoritmos específicos
definido
determinista vs aleatorizado
problemas cotidianos y
Las aventuras de Alicia en el país de las maravillas (Carroll)
al-Jabr wa'l-Muqābala (al-Khwārizmī)
Allen, Nick
Alm, Steven
leche de almendras
ALOHAnet
Altman, Sam
Página 413
Amazonas
"¿Estoy perdiendo el tiempo organizando el correo electrónico?" (Whittaker)
anarquía, precio de
Anderson, John
anécdotas, estadísticas vs.
enfado
recocido
Annie (musical)
Annie Get Your Gun (musical)
Ansari, Aziz
envío anticipado del paquete
hormigas
búsqueda de apartamento
grupo de solicitantes
Arquímedes
arquitectos
Aristóteles
ARPANET
redes neuronales artificiales
“Asociación de enfermedad con ingestión previa de nuevos alimentos” (Revusky y Bedarf)
Astley, Rick
AT&T
Atlántico mensual
Superordenador Atlas
bomba atómica
subastas
Holandés o descendiente
Inglés o ascendente
cascadas de información y
primer precio de oferta sellada
segundo precio de oferta sellada o Vickrey
Austen, Jane
Regla promedio
Compañía AvtoVAZ
canales de retorno
ruido de fondo
mutaciones bacterianas
ancho de banda, latencia vs.
caídas de ancho de banda
Baran, Paul
Barnard, Chester
Bartlett, Robert
baloncesto
procesamiento por lotes
Bavelas, Janet
Bayes, Rev. Thomas
Página 414
Regla de Bayes
definido
BBC
noticias de la BBC
Mente hermosa, A (Nasar)
belleza
Bedarf, Erwin
Bélády, László “Les”
Algoritmo de Bélády
Belew, Rik
Bell, Alexander Graham
curva de campana
Bellman, Richard
Fuelle, Meghan
Informe Belmont
puntos de referencia
Berezovsky, Boris
Berkeley, obispo George
muro de Berlín
Bernard, Claude
Berry, Don
rendimiento en el mejor de los casos
Bezos, Jeff
big data
Notación Big-O. Ver también tiempo constante; tiempo exponencial; tiempo factorial; tiempo linealitmico; lineal
tiempo; tiempo polinomial; tiempo cuadrático
Conferencia Big Ten
Bikhchandani, Sushil
horario de pago de facturas
Bing
Binmore, Ken
nacimientos, varones frente a mujeres
Bitcoin
"Variación ciega y retención selectiva" (Campbell)
bloqueo
Bloom, Burton H.
Bloomberg Businessweek
Filtro de floración
Blum, Avrim
Boguslavsky, Leonid
encuadernación
Booker, Christopher
torneos de corchetes
Bradáč, Zdeněk
rompiendo la simetría
Brighton, Henry
burbujas, financiero
Ordenamiento de burbuja
Página 415
Clasificación de cubos
bufferbloat
amortiguadores
Buffon, George-Louis Leclerc, conde de
problema de ladrones
Burks, Arthur
negocio. Ver también problema de la secretaria
sobreajuste y
promociones
reuniones semanales
Buxtun, Peter
Problema de los generales bizantinos
Cabell, rama de James

desalojo de caché
fallas de caché
cachés
definido
jerarquías y multitarea
velocidad de
almacenamiento en caché
algoritmos de almacenamiento en caché (políticas de reemplazo o desalojo)
cálculo
Callimachus
Campbell, Donald
Numeros cardinales
Opciones de carrera
Carroll, Lewis. Véase Dodgson, Charles Lutwidge
carros
accidentes y
estacionamiento
autoconducción
tráfico y
Carstensen, Laura
Casino Royale
imperativo categórico
Cawdrey, Robert
Teléfono móvil
Cerf, Vinton "Vint"
certeza. Ver también incertidumbre
caridad
Cheshire, Stuart
ajedrez
infancia
Chomsky, Noam
Churchill, Winston
Cambio de circuito
Página 416
clarividencia
ensayos clínicos
armario, organizador
Cobham, Alan
Tesis de Cobham-Edmonds
Cockcroft, George (Luke Rhinehart)
agua de coco
deterioro cognitivo
coincidencias
monedas
denominaciones
lanzamientos de dos cabezas
alzadores
problema de compromiso
comunicaciones. Ver también idioma; redes; narración
confirmación
previos y
agricultura apoyada por la comunidad (CSA)
Clasificación de recuento de comparación
sitios web de comparación de precios
complejidad
penalizando
computación, definida por Turing
bondad computacional
intervalo de confianza
confirmación
congestión
evitación de
precio de la anarquía y
Máquina de conexión
tiempo constante ( O (1))
problemas de optimización restringidos
problema restringido, preferencias por
Relajación de restricción
proyectos de construcción
redes de distribución de contenido (CDN)
cambio de contexto
problemas de optimización continua
Relajación continua
control sin jerarquía
Cooper, Martín
cooperación
Principio copernicano
Copérnico, Nicolás
marketing corporativo
análisis coste-beneficio
Cramer, Jim
Sistema Cravath
Página 417
creatividad
cola de crepes
Validación cruzada
criptografía
tiempos de espera del servicio al cliente
Darwin, Charles
datos. Consulte también Big Data; pequeños datos
idolatría de
sobreajuste y
prediciendo desde un solo punto
Fechado. Ver amor; matrimonio
Davis, Lydia
Dawkins, Richard
plazos
Sociedad de poetas muertos (película)
Deal or No Deal (programa de televisión)
avalancha de deudas
bola de nieve de la deuda
sistemas descentralizados
Toma de decisiones
bondad computacional y
Parada temprana y
sobreajuste y
atajos del mundo real
cuando pensar menos
descifrado
decusación
deserción
Ley de gestión de personal de los oficiales de defensa
ataque de denegación de servicio
Denning, Peter
búferes de dispositivo
Hombre de los dados, el (Rhinehart)
Ataque de diccionario
Dillard, Annie
función de descuento
optimización discreta
Técnicas de relajación discretas (Henderson)
desplazamiento
distribuciones. Ver también tipos específicos
Dodgson, Charles Lutwidge (Lewis Carroll)
jerarquías de dominio
estrategias dominantes
honestidad como
el dilema del prisionero y la deserción como
bolas caídas
Página 418
drogadicción
ensayos de medicamentos
Dupuis, Beth
Duvall, Bill
Dwan, Tom
asignación dinámica. Ver índice de Gittins
jerarquías dinámicas
"Consecuencias disfuncionales de las mediciones del desempeño" (Ridgway)
oreja
Fecha de vencimiento más temprana
Parada anticipada
¡Come esa rana! (Tracy)
Ebbinghaus, Hermann
ECMO (oxigenación por membrana extracorpórea)
ciencias económicas. Ver también subastas; estrategias de inversión; comportamiento del mercado
burbujas
Equilibrio de Nash y
tragedia de los comunes y
Economista
Edmonds, Jack
Evaluación Educativa
Edwards, Ward
algoritmo eficiente
problema eficiente o manejable, definido
Los reinados de los faraones egipcios
órgano de memoria eléctrica
tono de ascensor
Email
emociones
Engel, Joel
Eno, Brian
movimiento ambiental
epidemiología
igualdad
equilibrio
Erlang, Agner Krarup
Distribución de Erlang
barras de error
espacio de compensación de errores
ética
Evernote
políticas de desalojo
evolución
restricciones y
valor esperado
Notificación explícita de congestión (ECN)
Página 419
explorar / explotar la compensación

Retroceso exponencial
tiempo exponencial ( O (2 n ))
Facebook
tiempo factorial ( O ( n !))
manía
falsos positivos
FBI
Subastas de espectro de la FCC
FDA
realimentación
Esgrima
presentación
Finkel, Larry
Firefox
problema del camión de bomberos
Primero en entrar, primero en salir (FIFO)
aptitud física
Fitzgerald, F. Scott
Flack, Jessica
memoria flash
jerarquías planas
Inundación, Merrill
control de flujo
comida
manía
minimizando podrido
sobreajuste y
Forbes
olvidando la curva
perdón
Forster, EM
Lista de Fortune 500
Frank, Robert
Franklin, Benjamín
Fredrickson, Barbara
Frito, jason
juegos de información completa
parada óptima y
inversores fundamentales
futuro, descontado
Galileo
juego
teoría de juego
juego de azar
Página 420
Gantt, Henry
diagramas de Gantt
Gardner, Martín
Gaskell, RE
Gauss, Carl Friedrich
Gelatt, Dan
geografía
descuento geométrico
George, Sammy
Problema de los tanques alemanes
hacer las cosas importantes
resolviendo las cosas
Hacer las cosas (Allen)
Gettys, Jim
Gigerenzer, Gerd
Gilbert, Daniel
Ginsberg, Allen
Gittins, John
Índice de Gittins
Dar directamente
Glassner, Barry
Gleason, Andrew
máximo global
metas, explícitas
Padrino
Padrino, El (película)
Goethe, Johann Wolfgang von
Goldstine, Herman
Soluciones "suficientemente buenas"
Google
Gopnik, Alison
Gordon, Deborah
Gott, J. Richard, III
Gould, Stephen Jay
Gobierno
"Grandes hombres, grandes pensamientos y el medio ambiente" (James)
algoritmo codicioso
Grellet, Stephen
Grossman, Dave
guardián
Libro Guinness de los récords mundiales, el
la violencia armada
detener el problema
Hammerbacher, Jeff
Hansson, David Heinemeier
Hardin, Garrett
Página 421
Hardy, GH
Haxton, Isaac
la reforma de salud
Hedberg, Mitch
Hennessy, John
comportamiento de rebaño
heurística
jerarquías. Ver jerarquías de dominancia; jerarquías dinámicas; jerarquías planas
Alto costo de estacionamiento gratuito, The (Shoup)
Montañismo
Reinicio aleatorio o escopeta
Hillis, Danny
Hirshleifer, David
Ho, Jordania
Hoffman, David
Hollerith, Herman
Máquina de Hollerith
inicio, almacenamiento en caché y
honestidad
Presa Hoover
ESPERAR
Hosken, JC
tarifa por hora
venta de casa
burbuja inmobiliaria
humanos
penalización por complejidad y
creatividad y
diseño de oreja
explorar / explotar y
modas frente a tradición y
control de flujo y
la esperanza de vida de
memoria y
diseño del sistema nervioso
costos de tiempo y
Hume, David
IBM
Hielo T
"Si ..." (Kipling)
IKEA
importancia, priorizando las tareas por
imposibilidades, convertidas en penas
resultado de imposibilidad
inacción, irrevocabilidad de
estructuras de incentivos
Página 422
distribuciones de ingresos
accidentes industriales
información. Consulte también juegos de información completa; juegos sin información
cascadas de información
jerarquías de información
procesamiento de información
Tipo de inserción
Tiempos de negocios internacionales
Internet. Ver también ancho de banda, latencia vs .; redes; sitios web
conexiones rapidas
geografía de
infraestructura de
protocolos y
seguridad y
interrumpir la fusión
interrupciones
problemas intratables
definido
equilibrio y
relajación y
programación y
Introducción a los métodos de relajación, An (Shaw)
corazonadas intuitivas
estrategias de inversión
invitaciones
desinterés involuntario
Jacobson, Van
Jain, Kamal
James, William
Jarvis, Richard
Tiburón (película)
Jay, Francine
Jeffreys, Harold
Laboratorio de propulsión a chorro (JPL)
estar nervioso
Jobs, Steve
búsqueda de trabajo
Johnson, Selmer
Jones, William
Joy of Less, The (Jay)
juicio
Enfoque de "simplemente jugar el juego"
sociedad justa
Kaelbling, Leslie
Kahn, Robert "Bob"
Página 423
Kant, Emmanuel
Karels, Michael
Karp, Richard
Kaushik, Avinash
Kayal, Neeraj
Keats, John
Manteniendo las cosas encontradas encontradas (Jones)
Kenney, Richard
Kepler, Johannes
Kerr, Clark
Keynes, John Maynard
al-Khwārizmī
Sistema de bibliotecas del condado de King (KCLS)
Rey de la colina
Kipling, Rudyard
Kirkpatrick, Scott
Kleinrock, Leonard
Kline, Charley
problema de la mochila
Knuth, Donald
Koomen, Pete
Torneos de escalera
Lagrange, Joseph-Louis
Relajación Lagrangiana
Lai, Tze Leung
lanceta de duela del hígado
Lange, Rebecca
idioma
Lao Tse
Laplace, Pierre-Simon
Ley de Laplace
Lazo
latencia
tardanza, minimizando el máximo
lavandería
cumplimiento de la ley
Lawler, Eugene "Gene"
"Torneos de tenis sobre hierba" (Dodgson)
Ley de Arqueo Bruto
Lawrence, Peter A.
Laboratorio Lawrence Berkeley (LBL)
pleitos
Lazzarini, Mario
Menos usados recientemente (LRU)
Lee, Michael
regla de inserción del lado izquierdo
Página 424
Le Guin, Ursula K.
Lenstra, Jan Karel
Lerner, Ben
arrasamiento
libertad
Libin, Phil
bibliotecas
probabilidad
agrupación similar
Lincoln, Abraham
tiempo linealítmico ( O ( n log n ))
tiempo lineal ( O ( n ))
lingüística
Linux
trampa para langostas
máximo local
tasas logarítmicas
burlar
Regla de mirar y luego saltar
Los Alamos
Los Angeles Times
amor. Véase también matrimonio
citas y
teoría de juegos y
búsqueda de oro vs.
escenario de recuperación
escenario de rechazo
Ludin, Stephen
Luria, Salvador
Mach, Ernst
Magaddino, Salvatore
Liga Mayor de Béisbol
Making of a Fly, The (Lawrence)
Malthus, Thomas
Proyecto Manhattan
control de personal
maratón
locura de Marzo
derecho de paso marítimo
comportamiento del mercado. Ver también subastas; burbujas financieras; ciencias económicas; estrategias de inversión
Markowitz, Harry
matrimonio. Ver también amor
Validación cruzada y
La lista pro-contra de Darwin y
modelos de satisfacción con la vida
el dilema del prisionero y
Página 425
prueba de malvavisco
Mars Pathfinder
algoritmos de coincidencia
McLay, Laura Albert
optimización de la cartera de varianza media
reproducción mecánica
diseño de mecanismo
la honestidad como meta de
medios de comunicación
Mellen, Andrew
jerarquía de memoria
distribuciones sin memoria
gestión de la memoria
pared de la memoria
Menger, Karl
Mergesort
Mertes, Miqueas
desorden
compensación búsqueda-ordenación
autoorganizado
clasificación y
metabolismo
metatrabajo
métrica
sobreajuste y
apoderado
programación y
Metrópolis, Nicolás
Algoritmo de metrópolis
Meyer, Mathias
Meyer, Robert
Milgrom, Paul
militar
comunicaciones y
formación de cicatrices y
Molino, John Stuart
Miller, Gary
Prueba de primalidad de Miller-Rabin
rebanada mínima
árbol de expansión mínimo
Mintzberg, Henry
Mischel, Walter
Mitzenmacher, Michael
Método Monte Carlo
Moore, Gordon
Algoritmo de Moore
Ley de Moore
Morgenstern, Julie
Página 426
Morse, Samuel FB
crisis hipotecaria de
Moser, Leo
Mosteller, Frederick
películas
ingresos brutos de taquilla y
tiempos de ejecución y
secuelas y
Mozart, Wolfgang Amadeus
bandidos armados múltiples
Regla multiplicativa
multitarea
tasa de homicidios
Murphy, Tom
Myerson, Roger
algoritmo miope
Nakamura, Hikaru
Nash, John
equilibrio de Nash
Campeón Nacional de Clasificación de Bibliotecas
Naturaleza
NBA
NCAA
sistema nervioso
Netflix
redes. Ver también Internet
colas de red
Neumann, Christof
Redes neuronales
reportes de noticias
Newton, Isaac
Biblioteca Pública de Nueva York (NYPL)
New York Times
Nichols, Kathleen
Nietzsche, Friedrich
modelos de nueve factores
Nisan, Noam
Noguchi, Yukio
Sistema de archivo Noguchi
juegos sin información
ruido
distribución normal
Norvig, Peter
sin rendirse, nunca
Ahora hábito, el (Fiore)
reacciones nucleares
Página 427
guerra nuclear
Obama, Barack
Estrategias oblicuas
La navaja de Occam
tasa de ocupación
subastas de derechos petroleros
Oligarcas, el (Hoffman)
Juegos Olímpicos
modelos de un factor
función unidireccional
Sobre el origen de las especies (Darwin)
parada óptima
"Triple o nada" y
optimismo
problemas de optimización
intratable, definido
aleatoriedad y
relajación y
orden, costo de. Ver también ordenar
números ordinales
Organizar desde adentro hacia afuera (Morgenstern)
Ortega y Gasset, José
resultado, proceso vs.
sobreajuste
reconocimiento de paquetes. Ver también paquetes de acuse de recibo (ACK)

gotas de paquetes
enrutamiento de paquetes
conmutación de paquetes
fallas de página
vistas de página, midiendo
Palmer, TH
Papadimitriou, Christos
Papworth, Neil
parásitos
estacionamientos
parquímetros
búsqueda de lugar de estacionamiento
Pascal, Blaise
fallas de contraseña
jerarquías
Moho de penicillium
tamaño de la pluma
Solución perfecta
medidas de desempeño
Perry, Katy
Página 428
Peter, Laurence J.
Principio de Peter
Ensayo filosófico sobre probabilidades
pi (π), estimando el valor de
palomas
pilas, autoorganizadas
ataque de ping
Pinkham, Roger
Pirsig, Robert
Horca
Pizza Hut
Plagenhoef, Scott
algoritmos para jugar al ganador
poesía
Poincaré, Henri
póker
aviso
sin límite
campañas politicas
prueba de identidad polinomial
tiempo polinomial ( O ( n 2 ), O ( n 3 ), etc.)
pomodoros
popularidad
gestión de la cartera
apartado Postal
problema de mensajería postal
distribuciones de ley de potencias
Prabhakar, Balaji
Pratt, Vaughan
restricciones de precedencia
predicción. Véase también la regla de Bayes; Principio copernicano
toma de decisiones como
Parada temprana y
idolatría de datos y
influencia de los medios en
sobreajuste y
distribuciones anteriores y
derecho preferente de compra
creencias preexistentes
preferencias
apego preferencial
Centro de clasificación de Preston
Precio, Richard
precio de la anarquía
prueba de primalidad
testigo en contra
números primos
Página 429
Princesa prometida, la (película)

Principios de psicología (James)
herencia prioritaria
inversión de prioridad
probabilidades previas o anteriores
normal
ley de potencia
Ingeniería inversa
uniforme
poco informativo
El dilema del prisionero
violaciones de libertad condicional
problemas. Ver también problemas intratables
definiendo intratable
cosecha
proceso, resultado vs.
ciclos de procesador
dilación
gestión de proyectos
lista de pros y contras
protocolos
proverbios
Pruhs, Kirk
tarjetas perforadas
opciones de compra
Putin, Vladimir
tiempo cuadrático ( O ( n 2 ))
rompiendo la barrera
hacer cola
dejar de fumar mientras está por delante
Rabin, Michael
carrera contra lucha
problema de rifa
Ramscar, Michael
Vínculo "Artículo aleatorio"
Desalojo aleatorio
algoritmos aleatorios
aleatoriedad
cuanto usar
la creación de redes y romper la simetría y
reinicios aleatorios
Rapoport, Amnón
Raskin, Aza
Rawls, John
analítica en tiempo real
Página 430
escenario de recuperación
recetas
recursividad
atraer al oponente a
estrategias que cortan
Reddit
bosque de secuoyas
Reeves, Glenn
arrepentirse, minimizar
Regularización
rechazo
relajación
aleatoriedad vs.
leyes religiosas
políticas de reemplazo
compensación entre capacidad de respuesta y rendimiento
restaurante
elección de
asientos abiertos y
bandido inquieto
Reuttinger, Susanna
principio de revelación
venganza
principio de equivalencia de ingresos
distribuciones previas de ingeniería inversa
teoría de juegos inversa
Revusky, Samuel
Rhinehart, Luke. Ver Cockcroft, George
Ridgway, MB
Rivest, Ron
Robbins, Herbert
Robinson, Julia
robustez
lista de canciones de la banda de rock
piedra Papel tijeras
Rogers, Kenny
Romney, Mitt
Rosenbaum, David
Roughgarden, Tim
Round-Robin
Rousso, Vanessa
planificacion de la ruta. Véase también el problema del viajante de comercio; vacaciones, itinerario de
flexión de reglas
Rush, Barbara
Russell, Bertrand
Oligarcas rusos
Programa de ajedrez Rybka
Página 431
Sagan, Carl
muestreo. Ver también aleatoriedad
San Francisco
Sartre, Jean-Paul
Saxena, Nitin
diciendo que no
escala, clasificación y
distribuciones libres de escala
Planificación
Schmidt, Eric
Schmidt, Peter
Escolar, Lael
Ciencias
Científico americano
Gestión científica
Científico en el pesebre, El (Gopnik)
Seale, Darryl
búsqueda, brecha entre verificación y
los motores de búsqueda
compensación búsqueda-ordenación
listas autoorganizadas
escenario de segunda oportunidad
problema de la secretaria
variante de ladrón
variante de información completa
recordar la variante
variante de rechazo
siembra
enrutamiento egoísta
listas autoorganizadas
procesamiento secuencial de información
serenidad
Lo haré, Jeffrey
Shaw, George Bernard
Shi, Yong
Shoenfield, José
horario de la tienda
El tiempo de procesamiento más corto
no ponderado
ponderado
Shoup, Donald
Compañía petrolera Sibneft
Tamiz de Erasotenos
Silicon Valley
Recocido simulado
Sinatra, Frank
Eliminación única
programación de una sola máquina
Página 432
Siroker, Dan
Talla
jerarquías de dominación y
jerarquía de memoria y
clasificación y
Skype
Sleator, Daniel
máquinas tragamonedas
pequeños datos
como grandes datos disfrazados
Smith, Adam
Smith, Dan
fútbol
medios de comunicación social
Red social, La (película)
redes sociales
politica social
calcetines, clasificación
software, término acuñado
discos de estado sólido
solitario
clasificación
Clasificación y búsqueda (Knuth)
compensación de clasificación y búsqueda
leche de soja
compensaciones espacio-tiempo
SpaceX
hilado
Deportes
comisionado de la liga
sobreajuste y
programación de temporada
estructuras de torneo
Grupo de programación deportiva
ardillas
SRAM
pruebas estandarizadas
Ciencia estadística
estado
orden jerárquico y
carreras contra peleas y
Stewart, Martha
Steyvers, Mark
bolsa de Valores. Ver también estrategias de inversión
comercio algorítmico y
accidente repentino de 2010
almacenamiento
narración
Página 433
Stucchio, Chris
suma de tiempos de finalización
suma de tiempos de finalización ponderados
suma de los retrasos ponderados de los trabajos
super sistema de archivo
Caída de la cola
Tardos, Éva
Tarjan, Robert
cambiar de tarea
Taylor, Frederick
TCP diente de sierra. Consulte también Protocolo de control de transmisión (TCP)
enseñando a la prueba
inversores técnicos
telégrafo
teléfono
temperatura
localidad temporal
Tenenbaum, Josh
torneos de tenis
Texas Hold 'Em
mensajes de texto
"TeX Tuneup de 2012, The" (Knuth)
Comercio de Acción de Gracias
robo, respuestas irracionales y
Cosas de las que rara vez habla un informático (Knuth)
Regla del 37%
Thoreau, Henry David
paliza
enhebrar
Tres príncipes de Serendip, el
Regla de umbral
rendimiento
Tibshirani, Robert
Tikhonov, Andrey
tiempo
intervalo de
timeboxing
costos de tiempo
gestión del tiempo
compensaciones espacio-temporales
Tolins, Jackson
Tomlinson, Ray
distribuciones del tamaño de la ciudad
Toxoplasma gondii
tráfico
tragedia de los comunes
Página 434
cicatrices de entrenamiento
sistemas de tránsito
Protocolo de control de transmisión (TCP)
ACK y
canales de retorno y
control de flujo y
precio de la anarquía y
problema del vendedor ambulante
Tratar, Tyler
"Tratado sobre la probabilidad de las causas de los acontecimientos" (Laplace)
Árbol, Jean Fox
Truco, Michael
triple apretón de manos
juego de triple o nada
planificación de viajes. Ver también problema del viajante
Turing, Alan
máquina de Turing
tomar turnos
Estudio de sífilis de Tuskegee
Tversky, Amos
Twain, Mark
primos gemelos
Gorjeo
modelos de dos factores
programación de dos máquinas
UC Berkeley
Ulam, Stanislaw "Stan"
Ullman, Ellen
incertidumbre
Unilever
"Efectividad irrazonable de los datos, la" (Norvig)
Sistema "arriba o fuera"
Límite superior de confianza
planeadores urbanos
Fuerzas Armadas de EE. UU.
Censo de EE. UU.
Cámara de Representantes de EE. UU.
Servicio de Salud Pública de EE. UU.
Vueltas en U
vacaciones
correo electrónico y
itinerario de
política sobre
vacunación
Vail, Alfred
Página 435
puesto de valet
velo de ignorancia
verificación, brecha entre búsqueda y
Vickrey, William
Subasta de Vickrey
Vita Coco
mensaje de voz
transmisión de voz, Internet
Voltaire
Von Neumann, John
Wagenmakers, E.-J.
Wagner, Richard
espera, costo-beneficio de
"Caminar" (Thoreau)
Walpole, Horacio
guerra
Ware, Jim
Warhol, Andy
Estrella de Washington
poder
diseño web
sitios web. Ver también Internet
publicidad y
"Akamaized"
Retroceso exponencial y
malicioso
plan de asientos de boda
Wedgwood, Emma
estrategias ponderadas
Welch, Ivo
Whitney, Hassler
Whittaker, Steve
Whittle, Peter
Wikipedia
Wilkes, Maurice
Williams, Robin
Ganar-quedarse, perder-turno
redes inalámbricas
sabiduría
ilusiones
Wittgenstein, Ludwig
Horas laborales
Segunda Guerra Mundial
análisis del peor de los casos
Wright, Steven
Página 436
Expediente X, el (programa de televisión)
Yeltsin, Boris
Yngve, Víctor
Joven, decano
Zelen, Marvin
Algoritmo de Zelen
Zen y el arte del mantenimiento de motocicletas (Pirsig)
Zen de Python, El
suma cero
opción cero-cero
Zijlstra, Peter
Orden Z
Página 437
Expresiones de gratitud
Gracias, en primer lugar, a los investigadores, profesionales y expertos que hicieron

tiempo para sentarse con nosotros y discutir su trabajo y perspectivas más amplias:
Dave Ackley, Steve Albert, John Anderson, Jeff Atwood, Neil Bearden y Rik
Belew, Donald Berry, Avrim Blum, Laura Carstensen, Nick Chater y Stuart
Cheshire, Paras Chopra, Herbert Clark, Ruth Corbin, Robert X. Cringely,
Peter Denning, Raymond Dong, Elizabeth Dupuis, Joseph Dwyer, David
Estlund, Christina Fang, Thomas Ferguson, Jessica Flack, James Fogarty,
Jean E. Fox Tree, Robert Frank, Stuart Geman, Jim Gettys, John Gittins,
Alison Gopnik, Deborah Gordon, Michael Gottlieb, Steve Hanov, Andrew
Harbison, Isaac Haxton, John Hennessy, Geoff Hinton, David Hirshliefer,
Jordan Ho, Tony Hoare, Kamal Jain, Chris Jones, William Jones, Leslie
Kaelbling, David Karger, Richard Karp, Scott Kirkpatrick, Byron Knoll,
Con Kolivas, Michael Lee, Jan Karel Lenstra, Paul Lynch, Preston McAfee,
Jay McClelland, Laura Albert McLay, Paul Milgrom, Anthony Miranda,
Michael Mitzenmacher, Rosemarie Nagel, Christof Neumann, Noam Nisan,
Yukio Noguchi, Peter Norvig, Christos Papadimitriou, Meghan Peterson,
Scott Plagenhoef, Anita Pomerantz, Balaji Prabhakar, Kirk Pruhs, Amnon
Rapoport, Ronald Rivest, Ruth Rosenholtz, Tim Roughgarden y Stuart
Russell, Roma Shah, Donald Shoup, Steven Skiena, Dan Smith, Paul
Smolensky, Mark Steyvers, Chris Stucchio, Milind Tambe, Robert Tarjan,
Geoff Thorpe, Jackson Tolins, Michael Trick, Hal Varian, James Ware,
Página 438
Guerrero de pelo largo, Steve Whittaker, Avi Wigderson, Jacob Wobbrock, Jason
Wolfe y Peter Zijlstra.
Gracias a la Biblioteca Pública del Condado de King, la Biblioteca Pública de Seattle,
Northern Regional Library Facility y las bibliotecas de UC Berkeley para
entre bastidores pasa a sus operaciones.
Gracias a aquellos con quienes mantuvimos correspondencia, quienes nos señalaron en el
dirección de la investigación que vale la pena conocer, incluidos Sharon Goetz, Mike Jones,
Tevye Krynski, Elif Kuş, Falk Lieder, Steven A. Lippman, Philip Maughan,
Sam McKenzie, Harro Ranter, Darryl A. Seale, Stephen Stigler y Kevin
Thomson, Peter Todd, Sara M. Watson y Sheldon Zedeck.
Gracias a muchos de aquellos con quienes la conversación condujo en poco tiempo a
muchas de las ideas contenidas en este documento, y de las cuales la siguiente es una
lista: Elliot Aguilar, Ben Backus, Liat Berdugo, Dave Blei, Ben Blum, Joe
Damato, Eva de Valk, Emily Drury, Peter Eckersley, Jesse Farmer, Alan
Fineberg, Chrix Finne, Lucas Foglia, John Gaunt, Lee Gilman y Martin
Vidriero, Adam Goldstein, Sarah Greenleaf, Graff Haley, Ben Hjertmann,
Greg Jensen, Henry Kaplan, Sharmin Karim, Falk Lieder, Paul Linke, Rose
Linke, Tania Lombrozo, Brandon Martin-Anderson, Sam McKenzie, Elon
Musk, el grupo Neuwrite de la Universidad de Columbia, Hannah Newman, Abe
Othman, Sue Penney, Dillon Plunkett, Kristin Pollock, Diego Pontoriero,
Avi Press, Matt Richards, Annie Roach, Felicity Rose, Anders Sandberg,
Claire Schreiber, Gayle y Rick Shanley, Max Shron, Charly Simpson,
Najeeb Tarazi, Josh Tenenbaum, Peter Todd, Peter van Wesep, Shawn Wen,
Jered Wierzbicki, Maja Wilson y Kristen Young.
Gracias al excelente software gratuito y de código abierto que hizo
el trabajo posible: Git, LaTeX, TeXShop y TextMate 2, para empezar.
Gracias a quienes prestaron sus habilidades y esfuerzos en varios frentes: para
Lindsey Baggette, David Bourgin y Tania Lombrozo para bibliografía
e investigación de archivos.
Gracias a la Biblioteca de la Universidad de Cambridge por el permiso para imprimir
Maravillosa página del diario de Darwin, y a Michael Langan por una nítida
restauración de los mismos.
Gracias a Henry Young por un retrato nítido.
Página 439
Gracias a quienes leyeron los borradores y ofrecieron valiosos comentarios

el camino: a Ben Blum, Vint Cerf, Elizabeth Christian, Randy Christian,
Peter Denning, Peter Eckersley, Chrix Finne, Rick Fletcher y Adam
Goldstein, Alison Gopnik, Sarah Greenleaf, Graff Haley, Greg Jensen,
Charles Kemp, Raphael Lee, Rose Linke, Tania Lombrozo, Rebekah Otto,
Diego Pontoriero, Daniel Reichman, Matt Richards, Phil Richerme, Melissa
Riess James, Katia Savchuk, Sameer Shariff, Janet Silver, Najeeb Tarazi,
y Kevin Thomson. El libro es inmensamente mejor por sus movimientos sacádicos.
y pensamientos.
Gracias a nuestro agente, Max Brockman, y al equipo de Brockman Inc. por
siendo campeones astutos y exuberantes de la obra.
Gracias a nuestro editor, Grigory Tovbis, y al equipo de Henry Holt por
su trabajo perspicaz, incansable y entusiasta para hacer del libro lo mejor
podría ser y por lanzarlo con orgullo en el mundo.
Gracias a Tania Lombrozo, Viviana Lombrozo, Enrique Lombrozo,
Judy Griffiths, Rod Griffiths y Julieth Moreno, quienes tomaron el relevo
en el frente del cuidado infantil en múltiples ocasiones, y a los Lombrozo Griffiths
familia, y los miembros de UC Berkeley Computational Cognitive
Laboratorio de ciencias, y a todos los que demostraron gracia y paciencia con los libros inducidos
restricciones de programación.
Gracias a las diversas instituciones que ofrecieron directa e indirecta
apoyo. Gracias primero a la Universidad de California, Berkeley: al
Programa de becario visitante en el Instituto de Ciencias Cognitivas y Cerebrales
por un productivo período de dos años, y al Departamento de Psicología por su
Apoyo continuo. Gracias a la Biblioteca gratuita de Filadelfia, la
Universidad de California, Biblioteca de Berkeley, Biblioteca del Instituto de Mecánica,
y la Biblioteca Pública de San Francisco tanto para el espacio como para los tomos. Gracias
a la Biblioteca de Bellas Artes Fisher de la Universidad de Pensilvania por permitir una
no estudiante en las calles día tras día. Gracias a la Corporación de
Yaddo, la colonia MacDowell y la conferencia de escritores de Port Townsend
para residencias hermosas, inspiradoras y fértiles. Gracias al USPS
Tarifa de Media Mail para hacer posible un estilo de vida itinerante de tinta y pulpa.
Gracias a la Cognitive Science Society y la Association for the
Página 440
Avance de la Inteligencia Artificial para invitaciones a asistir a su anual

conferencias, en las que se hicieron muchas conexiones: interpersonales,
interdisciplinar e interhemisférico. Gracias a Borderlands Cafe por
siendo el único lugar que conocemos en San Francisco que sirve café sin
música. Que siempre prosperes.
Gracias a Rose Linke—
Gracias a Tania Lombrozo—
—Como lectores, socios, seguidores, inspiradores, como siempre.
Página 441
TAMBIÉN POR BRIAN CHRISTIAN
El ser humano más humano: lo que nos enseña la inteligencia artificial

Sobre estar vivo
Página 442
Sobre los autores

B RIAN C HRISTIAN es el autor de The Most Human Human , a Wall Street
Best seller de la revista , elección de los editores del New York Times y un neoyorquino
libro favorito del año. Su escritura ha aparecido en The New Yorker , The
Atlantic , Wired , The Wall Street Journal , The Guardian y The Paris
Revisión , así como en revistas científicas como Cognitive Science , y ha
ha sido traducido a once idiomas. Vive en San Francisco.
T OM G RIFFITHS es profesor de psicología y ciencias cognitivas en la UC

Berkeley, donde dirige el Laboratorio de Ciencias Cognitivas Computacionales. Él
ha publicado más de 150 artículos científicos sobre temas que van desde
psicología cognitiva a la evolución cultural, y ha recibido premios de
la National Science Foundation, la Sloan Foundation, la American
Asociación Psicológica y Sociedad Psiconómica, entre otras. Él
vive en Berkeley.
Página 443
Sobre el editor
Australia
HarperCollins Publishers (Australia) Pty.Ltd.
Nivel 13, 201 Elizabeth Street
Sídney, NSW 2000, Australia
http://www.harpercollins.com.au
Canadá
HarperCollins Canadá
2 Bloor Street East - Piso 20
Toronto, ON, M4W, 1A8, Canadá
http://www.harpercollins.ca
Nueva Zelanda
HarperCollins Publishers (Nueva Zelanda) Limited
Apartado de correos 1
Auckland, Nueva Zelanda
http://www.harpercollins.co.nz
Reino Unido
Página 444
HarperCollins Publishers Ltd.

1 London Bridge Street
Londres, SE1 9GF, Reino Unido
http://www.harpercollins.co.uk
Estados Unidos
HarperCollins Publishers Inc.
195 Broadway
Nueva York, NY 10007
http://www.harpercollins.com

Algoritmos para La Vida Cotidiana - Brian Chistian & Tom Griffiths

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Algoritmos para La Vida Cotidiana - Brian Chistian & Tom Griffiths

Cargado por

Copyright:

Formatos disponibles

Página 1

Copyright © 2016 por Brian Christian y Tom Griffiths

Brian Christian y Tom Griffiths afirman el derecho moral

Un registro de catálogo para este libro es

Fuente ISBN: 9780008166090

Para nuestras familias

Imagina que estás buscando un apartamento en San Francisco, posiblemente el

Hablar de algoritmos para vidas humanas puede parecer extraño

En este libro, exploramos la idea del diseño de algoritmos humanos, buscando

En el siguiente nivel, la informática nos da un vocabulario para

requieren considerar un número astronómico de posibilidades, que ahora plantean

Si prefiere al Sr. Martin a cualquier otra persona; si crees que es el

Es un fenómeno tan común que los consejeros universitarios incluso

clásico dilema de primer año, y fue sorprendentemente indiferente en su

En cualquier problema de parada óptima, el dilema crucial no es qué opción

para agarrar la imaginación del público en general. En la década de 1980, el problema y

¿De dónde el 37%?

Como resultado, seguir esta estrategia óptima finalmente nos da un 37%

Salto del amante

Antes de convertirse en profesor de investigación de operaciones en Carnegie Mellon,

previniendo el rechazo experimentado por Trick. Y no pueden ser

con el mejor candidato en este escenario de segundas oportunidades permitidas también

Saber algo bueno cuando lo ve: información completa

El primer conjunto de variantes que consideramos (rechazo y recuerdo) alteró la

necesariamente estás obligado a elegirla. Pero al mirar el siguiente

Umbrales de parada óptimos en el problema de la secretaria de información completa.

El juego de información completa ofrece, por tanto, un inesperado y algo

Si modificamos dos aspectos más del clásico problema de la secretaria, encontramos

A medida que llega cada oferta, normalmente debe decidir si la acepta o

Umbrales de detención óptimos en el problema de la venta de viviendas.

Lo fundamental a tener en cuenta en este problema es que nuestro umbral depende

Encuentro que los tres principales problemas administrativos en un campus son

Otro dominio donde abundan los problemas óptimos de frenado, y donde

actualmente ocupado. Si la tasa de ocupación es baja, es fácil encontrar un buen

Cómo encontrar aparcamiento de forma óptima.

Recordatorio a los gobiernos municipales: estacionar no es tan simple como tener un

Cuando dejar de fumar

Sorprendentemente, no darse por vencido, nunca, también aparece en el

Pasa la tarde. No puedes llevártelo contigo.

Hemos analizado casos específicos de personas que enfrentan problemas de frenado en

*Más sobre los peligros computacionales de la teoría de juegos en el capítulo 11.

Tu estómago retumba. Vas al restaurante italiano que conoces

Pero la realidad no es tan sencilla. Recordando que cada "mejor" canción y

En inglés, las palabras "explorar" y "explotar" vienen cargadas con

Encontrar algoritmos óptimos que nos digan exactamente cómo manejar el

y en el aspecto médico, un gran avance podría ayudar a las personas que

Pero quizás la parte más interesante de la tabla es la entrada superior izquierda. A

El índice de Gittins, entonces, proporciona una justificación formal y rigurosa para

En lo que a mí respecta, soy optimista. No parece ser de mucha utilidad ser

Si el índice de Gittins es demasiado complicado, o si no estás en una situación bien

La informática no puede ofrecerte una vida sin arrepentimientos. Pero puede,

posibilidades de las que sabemos menos. Como consecuencia, naturalmente inyectan un

En 2007, el director de producto de Google, Dan Siroker, se ausentó para

normalmente bloqueado en su lugar, o se convierte en el control de otra ronda de

el aullido de los millennials , lo inmortal de Allen Ginsberg, vi lo mejor

estadísticos, ingenieros y blogueros discutiendo sin cesar sobre el óptimo

Ensayos clínicos en ensayo

Entre 1932 y 1972, varios cientos de hombres afroamericanos con

El principio de beneficencia no siempre es tan inequívoco. Un problema ético difícil

La comunidad de médicos y estadísticos cree que lo estamos haciendo mal: que

negar un tratamiento no probado pero que podría salvar vidas ", y

en el estudio Ware en Statistical Science , Berry escribió que "la aleatorización

Otros estudios han arrojado conclusiones similares. En la década de 1990, Robert