Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Página 4
2
3
Derechos de autor
William Collins
Una huella de HarperCollins Publishers
1 London Bridge Street
Londres SE1 9GF
www.WilliamCollinsBooks.com
Este eBook publicado por primera vez en Gran Bretaña por William Collins en 2016
Publicado por primera vez en los Estados Unidos por Henry Holt and Company, LLC en 2016
Todos los derechos reservados bajo las convenciones internacionales y panamericanas de derechos de autor. Mediante el pago de la
tarifas requeridas, se le ha otorgado el derecho no exclusivo e intransferible de acceder y leer el
texto de este libro electrónico en pantalla. Ninguna parte de este texto puede reproducirse, transmitirse, descargarse,
descompilado, modificado por ingeniería inversa o almacenado o introducido en cualquier almacenamiento y recuperación de información
sistema, en cualquier forma o por cualquier medio, ya sea electrónico o mecánico, ahora conocido o en el futuro
inventado, sin el permiso expreso por escrito de HarperCollins.
Página 5
Dedicación
Página 6
Contenido
Cubrir
Pagina del titulo
Derechos de autor
Dedicación
Introducción
Algoritmos para vivir
1 parada óptima
Cuando dejar de mirar
2 Explorar / Explotar
Lo último frente a lo mejor
3 Clasificación
Hacer orden
4 Almacenamiento en caché
Olvídalo
5 Programación
Lo primero es lo primero
6 Regla de Bayes
Página 7
Prediciendo el futuro
7 Sobreajuste
Cuándo pensar menos
8 Relajación
Dejalo deslizar
9 Aleatoriedad
Cuándo dejarlo al azar
10 Redes
Cómo nos conectamos
11 Teoría de juegos
Las mentes de los demás
Conclusión
Bondad computacional
Notas
Bibliografía
Índice
Expresiones de gratitud
También por Brian Christian
Sobre los autores
Sobre el editor
Página 8
Introducción
Algoritmos para vivir
Página 9
establecer esa línea de base a menos que observe (y pierda ) una serie de
apartamentos? Cuanta más información recopile, mejor conocerá
oportunidad correcta cuando la ve, pero es más probable que tenga
ya lo pasó.
Entonces, ¿Qué haces? ¿Cómo se toma una decisión informada cuando el
¿El mismo acto de informarlo pone en peligro el resultado? Es una situación cruel
bordeando la paradoja.
Cuando se les presenta este tipo de problema, la mayoría de las personas intuitivamente
decir algo en el sentido de que requiere algún tipo de equilibrio entre
mirando y saltando, que debe mirar suficientes apartamentos para establecer
un estándar, luego tome lo que satisfaga el estándar que ha establecido.
Esta noción de equilibrio es, de hecho, precisamente correcta. Lo que la mayoría de la gente no
decir con certeza cuál es ese equilibrio. Afortunadamente, hay una
respuesta.
Treinta y siete por ciento.
Si quiere las mejores probabilidades de conseguir el mejor apartamento, gaste el 37% de
su búsqueda de apartamento (once días, si se ha dado un mes para la
buscar) explorando opciones sin comprometerse. Deje la chequera en casa;
solo estás calibrando. Pero después de ese punto, prepárese para
comprometerse, con depósito y todo, en el primer lugar en el que vea que supera
lo que sea que ya hayas visto. Esto no es meramente una satisfacción intuitiva
compromiso entre mirar y saltar. Es probadamente óptimo
solución.
Sabemos esto porque encontrar un apartamento pertenece a una clase de
problemas matemáticos conocidos como problemas de "parada óptima". El 37%
La regla define una serie simple de pasos, lo que los científicos de la computación llaman un
“Algoritmo”: para resolver estos problemas. Y resulta que apartamento
La caza es solo una de las formas en que la detención óptima asoma la cabeza en el día a día.
vida. Comprometerse o renunciar a una sucesión de opciones es una estructura que
aparece en la vida una y otra vez, en encarnaciones ligeramente diferentes. Cuantos
veces para rodear la cuadra antes de entrar en un espacio de estacionamiento? Que tan lejos
¿Empujar su suerte con una empresa arriesgada antes de cobrar? Cuánto tiempo
esperar una mejor oferta en esa casa o coche?
Página 10
El mismo desafío también aparece en un entorno aún más tenso: las citas.
La detención óptima es la ciencia de la monogamia en serie.
Los algoritmos simples ofrecen soluciones no solo para la búsqueda de un apartamento, sino también
todas esas situaciones en la vida en las que nos enfrentamos a la cuestión del óptimo
parada. La gente lidia con estos problemas todos los días, aunque seguramente
Los poetas han derramado más tinta sobre las tribulaciones del noviazgo que sobre el estacionamiento.
—Y lo hacen, en algunos casos, con considerable angustia. Pero la angustia
es innecesario. Matemáticamente, al menos, estos son problemas resueltos.
Cada inquilino, conductor y pretendiente agobiado que ve a su alrededor a medida que avanza
durante una semana típica es esencialmente reinventar la rueda. Ellos no necesitan
un terapeuta; necesitan un algoritmo. El terapeuta les dice que encuentren lo correcto,
cómodo equilibrio entre impulsividad y pensamiento excesivo.
El algoritmo les dice que el saldo es treinta y siete por ciento.
***
Existe un conjunto particular de problemas a los que se enfrentan todas las personas, problemas que son
resultado directo del hecho de que nuestra vida se desarrolla en un espacio y un tiempo finitos.
¿Qué debemos hacer y dejar sin hacer en un día o en una década? Qué grado
de desorden deberíamos abrazar, y ¿cuánto orden es excesivo? Qué
El equilibrio entre las nuevas experiencias y las favorecidas hace que la mayor
¿vida plena?
Estos pueden parecer problemas exclusivos de los humanos; Ellos no están. Para
más de medio siglo, los científicos de la computación han estado lidiando con y
en muchos casos resolviendo los equivalentes de estos dilemas cotidianos. Cómo
¿Debería un procesador dedicar su "atención" a realizar todo lo que el usuario pide?
de ella, con la mínima sobrecarga y en el menor tiempo posible? Cuando
¿Debería cambiar entre diferentes tareas y cuántas tareas debería tomar?
en primer lugar? ¿Cuál es la mejor forma de utilizar su memoria limitada?
¿recursos? ¿Debería recopilar más datos o tomar una acción basada en los datos que
¿ya tiene? Aprovechar el día puede ser un desafío para los humanos, pero
las computadoras que nos rodean están capturando milisegundos con facilidad. Y ahí está
mucho podemos aprender de cómo lo hacen.
Página 11
***
Pagina 12
Página 13
Página 14
Los problemas mundiales ha arrojado una serie de conocimientos. Estos preceptos duramente ganados
están en desacuerdo con nuestras intuiciones sobre la racionalidad, y no suenan
algo parecido a las estrechas prescripciones de un matemático que intenta forzar
el mundo en líneas limpias y formales. Dicen: No siempre consideres todos tus
opciones. No busque necesariamente el resultado que le parezca mejor cada vez.
En ocasiones, ensucia. Luz de viaje. Deja que las cosas esperen. Confía en tus instintos
y no lo pienses demasiado. Relajarse. Tirar una moneda. Perdona, pero no olvides. Para
tu propio yo sea sincero.
Vivir con la sabiduría de la informática no suena tan mal después
todos. Y a diferencia de la mayoría de los consejos, está respaldado por pruebas.
***
Así como el diseño de algoritmos para computadoras fue originalmente un tema que cayó
en las grietas entre disciplinas, un extraño híbrido de matemáticas y
ingeniería, por lo que también el diseño de algoritmos para humanos es un tema que
no tiene un hogar disciplinario natural. Hoy en día, el diseño de algoritmos dibuja
no solo en informática, matemáticas e ingeniería, sino también en campos afines
como las estadísticas y la investigación de operaciones. Y mientras consideramos cómo los algoritmos
diseñado para que las máquinas puedan relacionarse con las mentes humanas, también debemos buscar
ciencia cognitiva, psicología, economía y más.
Nosotros, sus autores, conocemos este territorio interdisciplinario. Brian
Estudió ciencias de la computación y filosofía antes de continuar con sus estudios de posgrado.
en inglés y una carrera en la intersección de los tres. Tom estudió
psicología y estadística antes de convertirse en profesor en UC Berkeley,
donde pasa la mayor parte de su tiempo pensando en la relación entre
cognición y computación humana. Pero nadie puede ser un experto en todos los
campos que son relevantes para diseñar mejores algoritmos para humanos. Entonces como parte
de nuestra búsqueda de algoritmos para vivir, hablamos con las personas que surgieron
con algunos de los algoritmos más famosos de los últimos cincuenta años. Y nosotros
les preguntó, a algunas de las personas más inteligentes del mundo, cómo su investigación
influyó en la forma en que abordaron sus propias vidas, desde la búsqueda de su
esposas para clasificar sus calcetines.
Página 15
Las siguientes páginas comienzan nuestro viaje a través de algunos de los más importantes
desafíos que enfrentan las computadoras y las mentes humanas: cómo administrar
espacio finito, tiempo finito, atención limitada, incógnitas desconocidas, incompleto
información y un futuro imprevisible; cómo hacerlo con gracia y
confianza; y cómo hacerlo en una comunidad con otros que son todos
simultáneamente tratando de hacer lo mismo. Aprenderemos sobre lo fundamental
estructura matemática de estos desafíos y sobre cómo las computadoras son
diseñado, a veces en contra de lo que imaginamos, para aprovechar al máximo
ellos. Y aprenderemos sobre cómo funciona la mente, sobre sus características distintas pero
formas profundamente relacionadas de abordar el mismo conjunto de problemas y hacer frente a la
mismas limitaciones. En última instancia, lo que podemos ganar no es solo un conjunto de
conclusiones para los problemas que nos rodean, no solo una nueva forma de ver el
estructuras elegantes detrás incluso de los dilemas humanos más peludos, no sólo un
reconocimiento de las tribulaciones de los humanos y las computadoras como profundamente
pero algo aún más profundo: un nuevo vocabulario para el mundo que nos rodea
nosotros, y la oportunidad de aprender algo verdaderamente nuevo sobre nosotros mismos.
Página 16
1 parada óptima
Cuando dejar de mirar
Aunque todos los cristianos comienzan una invitación de boda declarando solemnemente
su matrimonio se debe a un arreglo divino especial, yo, como
filósofo, me gustaría hablar con más detalle sobre esto ...
—JOHANNES KEPLER
Página 17
El problema de la secretaria
Página 18
Número de 1960 de Scientific American , como uno de los varios acertijos planteados en Martin
La querida columna de Gardner sobre matemáticas recreativas. Pero los orígenes de
el problema es sorprendentemente misterioso. Nuestra propia búsqueda inicial dio como resultado
poco más que especulaciones, antes de convertirse en un detective inesperadamente físico
trabajo: un viaje por carretera hasta el archivo de los papeles de Gardner en Stanford, para
sacar cajas de su correspondencia de mediados de siglo. Papel de lectura
la correspondencia es un poco como escuchar a escondidas a alguien que está al teléfono:
solo está escuchando un lado del intercambio y debe inferir el otro. En
nuestro caso, sólo teníamos las respuestas a lo que aparentemente era el propio Gardner
buscar el origen del problema hace cincuenta años. Cuanto más leemos, el
más enredada y confusa se volvió la historia.
El matemático de Harvard Frederick Mosteller recordó haber oído hablar de la
problema en 1955 de su colega Andrew Gleason, que había oído hablar
de otra persona. Leo Moser escribió desde la Universidad de Alberta para
decir que leyó sobre el problema en "algunas notas" de RE Gaskell de
Boeing, a quien él mismo acreditó a un colega. Roger Pinkham de Rutgers escribió
que escuchó por primera vez del problema en 1955 de la Universidad de Duke
matemático J. Shoenfield, “y creo que dijo que había escuchado la
problema de alguien en Michigan ".
"Alguien en Michigan" era casi con certeza alguien llamado Merrill
Inundación. Aunque en gran medida no se le ha oído hablar de las matemáticas externas, Flood's
La influencia en la informática es casi imposible de evitar. El esta acreditado
popularizar el problema del viajante de comercio (que discutimos en
más detalles en el capítulo 8), ideando el dilema del prisionero (que
discutir
Es Flooden el capítulo
quien hizo el 11), e incluso
primer con la posibilidad
descubrimiento conocidodede
acuñar el término
la Regla del 37%,"software".
en 1958,
y afirma haber estado considerando el problema desde 1949, pero
él mismo señala a varios otros matemáticos.
Baste decir que, venga de donde venga, el problema de la secretaria
demostró ser un acertijo matemático casi perfecto: simple de explicar, diabólico
para resolver, concisa en su respuesta e intrigante en sus implicaciones. Como un
Como resultado, se movió como la pólvora a través de los círculos matemáticos de la década de 1950,
difundido de boca en boca, y gracias a la columna de Gardner en 1960 llegó
Página 19
En su búsqueda de una secretaria, hay dos formas en las que puede fallar:
temprano y parando tarde. Cuando te detienes demasiado temprano, dejas lo mejor
solicitante sin descubrir. Cuando te detienes demasiado tarde, esperas un mejor
solicitante que no existe. La estrategia óptima requerirá claramente
encontrar el equilibrio adecuado entre los dos, caminar por la cuerda floja entre
buscando demasiado y no lo suficiente.
Si su objetivo es encontrar al mejor candidato, sin conformarse con nada menos,
Está claro que a medida que avanza en el proceso de entrevista, ni siquiera debería
considere contratar a alguien que no sea el mejor que haya visto hasta ahora. Sin embargo,
simplemente ser el mejor pero no es suficiente para una oferta; el primer solicitante,
por ejemplo, por supuesto, será el mejor hasta ahora por definición. De manera más general,
Es lógico pensar que la velocidad a la que nos encontramos con los solicitantes "mejores hasta ahora"
bajará a medida que avancemos en nuestras entrevistas. Por ejemplo, el segundo
Página 20
El solicitante tiene una probabilidad del 50/50 de ser el mejor que hemos visto hasta ahora, pero el quinto
el solicitante solo tiene una probabilidad de 1 en 5 de ser el mejor hasta ahora, el sexto tiene una probabi
probabilidad en 6, y así sucesivamente. Como resultado, los mejores solicitantes se convertirán constante
más impresionantes a medida que continúa la búsqueda (por definición, nuevamente, son mejores
que todos los que vinieron antes), pero también se volverán más y más
infrecuente.
Bien, sabemos que tomar el primer candidato mejor hasta ahora que encontremos
(también conocido como el primer solicitante, punto) es precipitado. Si hay cien solicitantes,
también parece apresurado hacer una oferta al siguiente que sea mejor,
porque ella era mejor que la primera. Entonces, ¿cómo procedemos?
Intuitivamente, hay algunas estrategias potenciales. Por ejemplo, hacer un
oferta la tercera vez que un solicitante supera a todos los vistos hasta ahora, o tal vez el
Cuarta Vez. O quizás aceptando al próximo mejor candidato para que lo acompañe
después de una larga "sequía", una larga racha de pobres.
Pero da la casualidad de que ninguna de estas estrategias relativamente sensatas
en la parte superior. En cambio, la solución óptima toma la forma de lo que llamaremos
la regla de mirar-luego-saltar : Usted establece una cantidad de tiempo predeterminada para
"Buscar", es decir, explorar sus opciones, recopilar datos, en los que
categóricamente no elijas a nadie, por impresionante que sea. Después
punto, ingresa a la fase de "salto", preparado para comprometerse instantáneamente con cualquier perso
que eclipsa al mejor candidato que vio en la fase de búsqueda.
Podemos ver cómo surge la regla de mirar-luego-saltar al considerar cómo
el problema de la secretaria se desarrolla en los grupos de solicitantes más pequeños. Con tan solo
una solicitante, el problema es fácil de resolver: ¡contrátela! Con dos aspirantes,
tiene un 50/50 de posibilidades de éxito sin importar lo que haga. Puedes contratar el
primer solicitante (que resultará ser el mejor en la mitad del tiempo), o descartar al
primero y, por defecto, contrata al segundo (que también es el mejor la mitad del tiempo).
Agregue un tercer solicitante y, de repente, las cosas se pondrán interesantes. los
las probabilidades si contratamos al azar son de un tercio, o el 33%. Con dos solicitantes
no podía hacer nada mejor que el azar; con tres, ¿podemos? Resulta que podemos, y
todo se reduce a lo que hacemos con el segundo entrevistado. Cuando vemos
primer solicitante, no tenemos información ; siempre parecerá ser la
mejor aún. Cuando vemos al tercer solicitante, no tenemos agencia — tenemos que
Página 21
haga una oferta al solicitante final, ya que hemos despedido a los demás. Pero
cuando vemos al segundo solicitante, tenemos un poco de ambos: sabemos
si es mejor o peor que la primera, y tenemos la libertad de
contratarla o despedirla. ¿Qué pasa cuando la contratamos si ella es
mejor que la primera demandante y despedirla si no lo es? Esto resulta
ser la mejor estrategia posible frente a tres candidatos; usando esto
enfoque es posible, sorprendentemente, hacerlo igual de bien en los tres candidatos
problema como con dos, eligiendo al mejor candidato exactamente la mitad del tiempo. *
Enumerar estos escenarios para cuatro solicitantes nos dice que deberíamos
todavía comienzan a dar un salto tan pronto como el segundo solicitante; con cinco solicitantes en
la piscina, no debemos saltar antes de la tercera.
A medida que crece el grupo de solicitantes, el lugar exacto para trazar la línea entre
mirar y saltar se asienta en el 37% de la piscina, lo que da como resultado la Regla del 37%: mira
en el primer 37% de los solicitantes * , sin elegir ninguno, luego prepárese para dar el salto
alguien mejor que todos los que has visto hasta ahora.
Página 22
Cómo elegir de manera óptima una secretaria.
Página 23
el romance como una búsqueda de "el indicado". Pero aquí está el lado positivo. Intuición
sugeriría que nuestras posibilidades de elegir al mejor candidato deberían
disminuyen constantemente a medida que crece el grupo de solicitantes. Si estuviéramos contratando al
por ejemplo, en un grupo de cien solicitantes tendríamos un 1% de posibilidades
de éxito, y en un grupo de un millón de solicitantes tendríamos un 0,0001%
oportunidad. Sin embargo, sorprendentemente, la matemática del problema de la secretaria no cambia.
Si se detiene de manera óptima, sus posibilidades de encontrar lo mejor
solicitante en un grupo de cien es el 37%. Y en un grupo de un millón, cree
lo sea o no, su probabilidad sigue siendo del 37%. Por lo tanto, cuanto más grande sea el grupo de solicita
más valioso se vuelve el conocimiento del algoritmo óptimo. Eso es verdad
es poco probable que encuentre la aguja la mayor parte del tiempo, pero es óptima
detenerse es su mejor defensa contra el pajar, no importa cuán grande sea.
La pasión entre los sexos ha aparecido en todas las épocas ser tan
casi lo mismo que siempre se puede considerar, en algebraico
lenguaje, como una cantidad dada.
—THOMAS MALTHUS
Me casé con el primer hombre al que besé. Cuando les digo esto a mis hijos
casi vomitan.
—BARBARA BUSH
Página 24
dieciocho a cuarenta, la regla del 37% dio 26,1 años como el punto en el que
cambiar de mirar a saltar. Un número que, como sucedió, era exactamente
La edad de Trick en ese momento. Así que cuando encontró a una mujer que encajaba mejor
que todos aquellos con los que había salido hasta ahora, sabía exactamente qué hacer. Saltó. "I
no sabía si ella era perfecta (las suposiciones del modelo no permiten
yo para determinar eso), pero no había duda de que cumplía con los requisitos
para este paso del algoritmo. Así que me propuse ”, escribe.
"Y ella me rechazó".
Los matemáticos han tenido problemas con el amor desde al menos el
decimoséptimo siglo. El legendario astrónomo Johannes Kepler es hoy
quizás mejor recordado por descubrir que las órbitas planetarias son elípticas
y por ser una parte crucial de la "Revolución Copernicana" que incluyó
Galileo y Newton y trastocaron el sentido de la humanidad de su lugar en el
Cielos. Pero Kepler también tenía preocupaciones terrestres. Después de la muerte de su primer
esposa en 1611, Kepler se embarcó en una larga y ardua búsqueda para volver a casarse,
finalmente cortejando a un total de once mujeres. De los primeros cuatro, a Kepler le gustaba
el cuarto el mejor ("debido a su complexión alta y cuerpo atlético") pero no
cesar su búsqueda. "Se habría resuelto", escribió Kepler, "si no hubieran
el amor y la razón me obligaron a tener una quinta mujer. Este me convenció con
amor, humilde lealtad, economía del hogar, diligencia y el amor que ella
dio a los hijastros ".
"Sin embargo", escribió, "continué".
Los amigos y parientes de Kepler siguieron haciéndole presentaciones,
y siguió mirando, pero a medias. Sus pensamientos permanecieron con
Número cinco. Después de once noviazgos en total, decidió que buscaría
No más. “Mientras me preparaba para viajar a Ratisbona, regresé al quinto
mujer, me declaré y fui aceptado ". Kepler y Susanna
Reuttinger se casó y tuvo seis hijos juntos, junto con los niños.
del primer matrimonio de Kepler. Las biografías describen el resto de Kepler
la vida doméstica como un momento particularmente pacífico y alegre.
Tanto Kepler como Trick, de maneras opuestas, experimentaron de primera mano algunos
de las formas en que el problema de la secretaria simplifica demasiado la búsqueda del amor. En
el problema clásico de la secretaria, los candidatos siempre aceptan el puesto,
Página 25
Página 26
Página 27
quién tomó la prueba: un mecanógrafo del percentil 51 está justo por encima del promedio, un
mecanógrafo percentil es mejor que tres de cada cuatro examinados, y así sucesivamente.
Suponga que nuestro grupo de solicitantes es representativo de la población en
grande y no está sesgado ni seleccionado por sí mismo de ninguna manera. Además, supongamos que
Decidimos que la velocidad de escritura es lo único que importa para nuestros solicitantes.
Luego tenemos lo que los matemáticos llaman "información completa" y todo
cambios. "No se necesita acumular experiencia para establecer un estándar", ya que
un artículo seminal de 1966 sobre el problema lo expresó, “y una opción rentable puede
a veces se hace de inmediato ". En otras palabras, si un percentil 95
El solicitante pasa a ser el primero que evaluamos, lo sabemos al instante y
puede contratarla con confianza en el lugar, es decir, por supuesto, asumiendo que no
Creo que hay un candidato del percentil 96 en el grupo.
Y ahí está el problema. Si nuestro objetivo es, nuevamente, conseguir la mejor persona para
el trabajo, todavía tenemos que sopesar la probabilidad de que haya una mayor
solicitante por ahí. Sin embargo, el hecho de que tengamos información completa nos da
todo lo que necesitamos para calcular esas probabilidades directamente. La posibilidad de que nuestro
El próximo solicitante que se encuentre en el percentil 96 o superior siempre será 1 de cada 20, para
ejemplo. Por lo tanto, la decisión de si detenerse se reduce completamente a cómo
muchos solicitantes nos quedan por ver. La información completa significa que no
Necesito mirar antes de saltar. En su lugar, podemos usar la regla de umbral , donde
Aceptamos inmediatamente a un solicitante si está por encima de cierto percentil. Nosotros
no es necesario mirar a un grupo inicial de candidatos para establecer este umbral, pero
Sin embargo, debemos ser muy conscientes de la cantidad de mirada que queda
disponible.
Las matemáticas muestran que cuando quedan muchos solicitantes en el grupo,
debería dejar pasar incluso a un muy buen candidato con la esperanza de encontrar
alguien aún mejor que eso, pero a medida que sus opciones disminuyan, debería ser
preparado para contratar a cualquiera que sea simplemente mejor que el promedio. Es familiar, si
no es exactamente inspirador, mensaje: frente a las escasas selecciones, baje su
normas. También deja claro lo contrario: con más peces en el mar, levante
ellos. En ambos casos, lo que es crucial, las matemáticas le dicen exactamente cuánto.
La forma más fácil de comprender los números de este escenario es comenzar en
al final y pensar al revés. Si te quedas con el último solicitante, por supuesto,
Página 28
Cuando Vender
Página 30
Página 31
A este resultado matemático en particular no le importa si está vendiendo un
mansión por valor de millones o un cobertizo destartalado. Lo único que le importa
es la diferencia entre las ofertas más altas y más bajas que probablemente
recibir. Al conectar algunas cifras concretas, podemos ver cómo esto
El algoritmo nos ofrece una cantidad considerable de orientación explícita. Para
Por ejemplo, digamos que el rango de ofertas que esperamos va desde $ 400,000 a
$ 500.000. Primero, si el costo de esperar es trivial, podemos estar casi
infinitamente exigente. Si el costo de obtener otra oferta es solo de un dólar,
maximizar nuestras ganancias esperando a alguien dispuesto a ofrecernos
$ 499,552.79 y ni un centavo menos. Si esperar cuesta $ 2,000 por oferta, deberíamos
aguanta hasta $ 480.000. En un mercado lento donde esperar cuesta
$ 10,000 por oferta, deberíamos aceptar cualquier valor superior a $ 455,279. Finalmente, si espera
cuesta la mitad o más de nuestro rango esperado de ofertas, en este caso, $ 50,000
entonces no hay ventaja alguna en resistir; lo haremos mejor por
tomando la primera oferta que aparece y terminando. Mendigos
no pueden elegir.
Página 32
Cuando aparcar
Página 33
Página 34
Página 35
Si esta calle infinita tiene una tasa de ocupación de la gran ciudad del 99%, con solo el 1%
de lugares vacantes, entonces debe tomar el primer lugar que vea comenzando en casi
70 lugares, a más de un cuarto de milla, de su destino. Pero si Shoup
se sale con la suya y las tasas de ocupación bajan a solo un 85%, no es necesario que empieces
mirando seriamente hasta que estés a media cuadra de distancia.
La mayoría de nosotros no conducimos por carreteras perfectamente rectas e infinitamente largas. As
con otros problemas de parada óptimos, los investigadores han considerado una variedad
de ajustes a este escenario básico. Por ejemplo, han estudiado el óptimo
estrategia de estacionamiento para casos en los que el conductor puede hacer giros en U, donde menos
los espacios de estacionamiento están disponibles a medida que uno se acerca al destino, y
donde el piloto compite contra pilotos rivales que también se dirigen a la
mismo destino. Pero cualesquiera que sean los parámetros exactos del problema, más
los lugares vacantes siempre harán la vida más fácil. Es una especie de política
Página 36
En 1997, la revista Forbes identificó a Boris Berezovsky como el hombre más rico de
Rusia, con una fortuna de aproximadamente $ 3 mil millones. Sólo diez años antes había
estado viviendo con el salario de un matemático de la Academia de
Ciencias. Hizo sus miles de millones aprovechando las relaciones industriales que había
formado a través de su investigación para fundar una empresa que facilitó la interacción
entre los fabricantes de automóviles extranjeros y el fabricante de automóviles soviético AvtoVAZ.
La empresa de Berezovky se convirtió entonces en un distribuidor a gran escala de los coches que
AvtoVAZ producido, utilizando un esquema de pago a plazos para aprovechar
de hiperinflación en el rublo. Utilizando los fondos de esta asociación,
compró la propiedad parcial de AvtoVAZ, luego la televisión ORT
red, y finalmente la empresa petrolera Sibneft. Convertirse en uno de una nueva clase
oligarcas, particip en la poltica, apoyando la religin de Boris Yeltsin
elección en 1996 y la elección de Vladimir Putin como su sucesor en 1999.
Pero fue entonces cuando cambió la suerte de Berezovsky. Poco después de la elección de Putin,
Berezovsky se opuso públicamente a las reformas constitucionales propuestas que
ampliar el poder del presidente. Su continua crítica pública a Putin
llevó al deterioro de su relación. En octubre de 2000, cuando Putin
Cuando se le preguntó acerca de las críticas de Berezovsky, respondió: “El estado tiene un
Página 37
garrote en sus manos que usas para golpear solo una vez, pero en la cabeza. No tenemos
usé este garrote todavía ... El día que nos enojemos mucho, no dudaremos ".
Berezovsky abandonó Rusia permanentemente el mes siguiente y se exilió en
Inglaterra, donde continuó criticando el régimen de Putin.
¿Cómo decidió Berezovsky que era hora de dejar Rusia? Hay alguna manera,
tal vez, pensar matemáticamente en el consejo de "dejar de fumar mientras estás
adelante"? Berezovsky en particular podría haber considerado esta misma pregunta
él mismo, ya que el tema en el que había trabajado todos esos años como un
matemático no era otro que la parada óptima; él fue el autor del primero
(y, hasta ahora, el único) libro enteramente dedicado al problema de la secretaria.
El problema de dejar de fumar mientras está por delante se ha analizado en
varias formas diferentes, pero tal vez la más apropiada para Berezovsky
caso, con disculpas a los oligarcas rusos, se conoce como el "ladrón
problema." En este problema, un ladrón tiene la oportunidad de realizar un
secuencia de robos. Cada robo proporciona alguna recompensa, y hay una
posibilidad de salirse con la suya cada vez. Pero si atrapan al ladrón,
es arrestado y pierde todas sus ganancias acumuladas. ¿Qué algoritmo debería
seguir para maximizar su toma esperada?
El hecho de que este problema tenga solución es una mala noticia para la película de atracos.
guiones: cuando el equipo está tratando de sacar al viejo ladrón de su retiro
para un último trabajo, el ladrón astuto solo necesita hacer cálculos. Es más,
los resultados son bastante intuitivos: la cantidad de robos que debes realizar
es aproximadamente igual a la posibilidad de escapar, dividida por la posibilidad de obtener
atrapó. Si eres un ladrón habilidoso y tienes un 90% de posibilidades de escapar
cada robo (y un 10% de posibilidades de perderlo todo), luego retirarse después de 90/10 = 9
robos. ¿Un aficionado torpe con un 50/50 de posibilidades de éxito? El primero
tiempo, no tienes nada que perder, pero no presiones tu suerte más de una vez.
A pesar de su experiencia en la parada óptima, la historia de Berezovsky termina tristemente.
Murió en marzo de 2013, encontrado por un guardaespaldas en el baño cerrado con llave de
su casa en Berkshire con una ligadura alrededor de su cuello. El oficial
La conclusión de un examen post mortem fue que había cometido
suicidio, ahorcándose después de perder gran parte de su riqueza a través de una serie de
casos legales de alto perfil que involucran a sus enemigos en Rusia. Quizás debería
Página 38
se detuvieron antes, acumulando solo unas pocas decenas de millones de dólares, digamos,
y no meterse en política. Pero, ay, ese no era su estilo. Uno de sus
amigos matemáticos, Leonid Boguslavsky, contaron una historia sobre Berezovsky
de cuando ambos eran investigadores jóvenes: en un viaje de esquí acuático a un
lago cerca de Moscú, el barco que habían planeado utilizar se averió. Aquí está
cómo lo cuenta David Hoffman en su libro The Oligarchs :
Mientras sus amigos iban a la playa y encendían una hoguera, Boguslavsky y Berezovsky se dirigieron a
el muelle para intentar reparar el motor ... Tres horas después, lo habían desmontado y vuelto a montar
el motor. Todavía estaba muerto. Se habían perdido la mayor parte de la fiesta, pero Berezovsky insistió en que
tenía que seguir intentándolo. "Probamos esto y aquello", recuerda Boguslavsky. Berezovsky no daría
hasta.
Siempre parando
Espero pasar por este mundo solamente una vez. Cualquier bien por tanto que yo
puedo hacer, o cualquier amabilidad que pueda mostrar a cualquier criatura semejante, permítame
Página 39
hazlo ahora. No dejes que lo posponga ni lo descuide, porque no pasaré por este camino.
de nuevo.
—STEPHEN GRELLET
Página 40
todo el tiempo que estás buscando una secretaria, no tienes una secretaria.
Además, pasa el día realizando entrevistas en lugar de
hacer su propio trabajo.
Este tipo de costo ofrece una posible explicación de por qué las personas se detienen temprano
al resolver un problema de secretaria en el laboratorio. Seale y Rapoport mostraron
que si se imagina que el costo de ver a cada solicitante es, por ejemplo, del 1%
del valor de encontrar la mejor secretaria, entonces la estrategia óptima sería
se alinean perfectamente con el lugar donde las personas realmente cambiaron de mirar a saltar
en su experimento.
El misterio es que en el estudio de Seale y Rapoport, no hubo un costo por
buscar. Entonces, ¿por qué la gente en el laboratorio podría estar actuando como si hubiera uno?
Porque para las personas siempre hay un costo de tiempo. No viene del
diseño del experimento. Viene de la vida de las personas.
Los costes de tiempo "endógenos" de la búsqueda, que no suelen
capturado por modelos de parada óptimos, podría proporcionar una explicación para
por qué la toma de decisiones humana diverge rutinariamente de las prescripciones de
esos modelos. Como dice el investigador de detenciones óptimas Neil Bearden, “Después
buscando durante un tiempo, los humanos tendemos a aburrirnos. No es irracional
aburrirse, pero es difícil modelar tan rigurosamente ".
Pero esto no hace que los problemas de frenado óptimos sean menos importantes; eso
en realidad los hace más importantes, porque el flujo del tiempo convierte a todos
toma de decisiones en una parada óptima.
“La teoría de la parada óptima se ocupa del problema de
elegir un momento para tomar una acción determinada ”, abre el libro de texto definitivo sobre
parada óptima, y es difícil pensar en una descripción más concisa de la
condición humana. Decidimos el momento adecuado para comprar acciones y el momento adecuado
venderlos, seguro; pero también el momento adecuado para abrir la botella de vino que hemos
estado esperando para una ocasión especial, el momento adecuado para interrumpir
alguien, el momento adecuado para besarlos.
Visto de esta manera, el problema de la secretaria es el más fundamental pero el más
suposición increíble: su estricta serialidad, su inexorable marcha unidireccional
—Se revela como la naturaleza del tiempo mismo. Como tal, la premisa explícita de
El problema de parada óptima es la premisa implícita de lo que debe ser
Página 41
viva. Es esto lo que nos obliga a decidir basándonos en posibilidades que aún no hemos
visto, esto nos obliga a adoptar altas tasas de fracaso incluso cuando actuamos
óptimamente. No se repite ninguna elección. Es posible que volvamos a tener opciones similares , pero nu
ese exacto. La vacilación, la inacción, es tan irrevocable como la acción. Qué
el automovilista, encerrado en el camino de un solo sentido, está al espacio, estamos al cuarto
dimensión: realmente pasamos por este camino, pero una vez.
Intuitivamente, pensamos que la toma de decisiones racional significa exhaustivamente
enumerando nuestras opciones, sopesando cada una con cuidado y luego seleccionando
lo mejor. Pero en la práctica, cuando el reloj (o el ticker) avanza, pocos
Los aspectos de la toma de decisiones (o del pensamiento en general) son tan importantes
como éste: cuándo parar.
Página 42
*Usamos negrita para indicar los algoritmos que aparecen a lo largo del libro.
Página 43
*Con esta estrategia tenemos un 33% de riesgo de despedir al mejor solicitante y un 16% de riesgo de nunca
conocerla. Para elaborar, hay exactamente seis posibles ordenamientos de los tres solicitantes: 1-2-3, 1-3-
2, 2-1-3, 2-3-1, 3-1-2 y 3-2-1. La estrategia de mirar al primer solicitante y luego saltar
quien la supere tendrá éxito en tres de los seis casos (2-1-3, 2-3-1, 3-1-2) y fracasará en el
otros tres, dos veces por ser demasiado exigente (1-2-3, 1-3-2) y una vez por no ser lo suficientemente exigente (3-2-
1).
Página 44
*En realidad, solo un cabello por debajo del 37%. Para ser precisos, la proporción matemáticamente óptima de solicitantes
mirar es 1 / e , la misma constante matemática e , equivalente a 2.71828…, que aparece en
cálculos de interés compuesto. Pero no necesita preocuparse por saber e con doce decimales
lugares: cualquier valor entre el 35% y el 40% proporciona una tasa de éxito extremadamente cercana al máximo. Para
Para más detalles matemáticos, consulte las notas al final del libro.
Página 45
2 Explorar / Explotar
Lo último frente a lo mejor
Página 47
Explorar / Explotar
Página 48
11, donde no hay más que cosas nuevas todo el tiempo. Los amantes de la música pueden
imagina trabajar en periodismo musical como un paraíso, pero cuando
Tienes que explorar constantemente lo nuevo, nunca podrás disfrutar de los frutos de tu
el conocimiento, un tipo particular de infierno. Pocas personas saben esto
experiencia tan profunda como Scott Plagenhoef, el ex editor en jefe de
Pitchfork . "Intentas encontrar espacios cuando trabajas para escuchar
algo que solo quieres escuchar ”, dice sobre la vida de un crítico. Su
Necesidades desesperadas de dejar de vadear melodías inauditas de dudosa calidad.
y escuche lo que amaba eran tan fuertes que Plagenhoef pondría
sólo música nueva en su iPod, para hacerse físicamente incapaz de
abandonando sus deberes en esos momentos en los que realmente, realmente, realmente
quería escuchar a los Smith. Los periodistas son mártires, explorando para que
otros pueden explotar.
En informática, la tensión entre exploración y explotación
toma su forma más concreta en un escenario llamado el "bandido multi-armado
problema." El nombre extraño proviene del término coloquial para una tragamonedas de casino.
máquina, el "bandido de un brazo". Imagina entrar en un casino lleno de
diferentes máquinas tragamonedas, cada una con sus propias probabilidades de obtener una recompens
Por supuesto, es que no te dicen esas probabilidades de antemano: hasta que comiences a jugar,
no tendrá idea de qué máquinas son las más lucrativas ("sueltas", como
los aficionados a las máquinas tragamonedas lo llaman) y cuáles son solo sumideros de dinero.
Naturalmente, está interesado en maximizar sus ganancias totales. Y es
claro que esto implicará una combinación de tirar de los brazos
diferentes máquinas para probarlas (explorar) y favorecer la mayoría
máquinas prometedoras que ha encontrado (explotación).
Para tener una idea de las sutilezas del problema, imagine que se enfrenta a
solo dos maquinas. Uno que hayas jugado un total de 15 veces; 9 veces pagó
y 6 veces no lo hizo. El otro lo has jugado solo dos veces, y una vez
pagó y una vez no lo hizo. ¿Cuál es más prometedor?
Simplemente dividir las ganancias por el número total de tirones le dará la
"valor esperado" de la máquina, y por este método la primera máquina claramente
sale adelante. Su registro de 9 a 6 hace un valor esperado del 60%,
mientras que el registro 1–1 de la segunda máquina arroja un valor esperado de solo
Página 49
50%. Pero hay más que eso. Después de todo, solo dos tirones no son realmente
muchisimo. Así que hay un sentido en el que todavía no sabemos qué tan bueno es el
En realidad, la segunda máquina podría serlo.
Elegir un restaurante o un álbum es, en efecto, cuestión de decidir
qué brazo tirar en el casino de la vida. Pero entendiendo el explorar / explotar
La compensación no es solo una forma de mejorar las decisiones sobre dónde comer o qué
escucha a. También proporciona información fundamental sobre cómo nuestros objetivos deben
cambian a medida que envejecemos, y por qué el curso de acción más racional no siempre
tratando de elegir lo mejor. Y resulta estar en el corazón de, entre otros
cosas, diseño web y ensayos clínicos, dos temas que normalmente no
mencionado en la misma oración.
Las personas tienden a tratar las decisiones de forma aislada, a concentrarse en encontrar cada vez
el resultado con el valor esperado más alto. Pero las decisiones son casi
nunca aislado, y el valor esperado no es el final de la historia. Si eres
pensando no solo en la próxima decisión, sino en todas las decisiones que está tomando
va a hacer aproximadamente las mismas opciones en el futuro, la exploración / explotación
La compensación es crucial para el proceso. De esta manera, escribe el matemático Peter
Whittle, el problema de los bandidos "encarna en forma esencial un conflicto evidente
en toda acción humana ".
Entonces, ¿cuál de esos dos brazos deberías tirar? Es una pregunta capciosa. Eso
depende completamente de algo que aún no hemos discutido: cuánto tiempo
planea estar en el casino.
Aprovecha el intervalo
"Carpe diem", insta a Robin Williams en una de las escenas más memorables
de la película de 1989 Dead Poets Society . Aprovechen el día, muchachos. Haz tu vida
extraordinario."
Es un consejo increíblemente importante. También es algo contradictorio en sí mismo.
Aprovechar un día y aprovechar una vida son dos esfuerzos completamente diferentes. Nosotros
tienen la expresión "Come, bebe y diviértete, porque mañana moriremos", pero
quizás también deberíamos tener su inverso: "Empiece a aprender un nuevo idioma o
un instrumento, y charlar con un extraño, porque la vida es larga, y
Página 50
quién sabe qué alegría podría florecer durante muchos años ”. Cuando
equilibrando las experiencias favoritas y las nuevas, nada importa tanto como
el intervalo durante el cual planeamos disfrutarlos.
"Es más probable que pruebe un nuevo restaurante cuando me mudo a una ciudad que
cuando me vaya ", explica el científico de datos y bloguero Chris Stucchio,
veterano de lidiar con la compensación explorar / explotar tanto en su trabajo como en
su vida. "En general, voy a restaurantes que conozco y amo ahora, porque sé
Me iré de Nueva York bastante pronto. Mientras que hace un par de años
me mudé a Pune, India, y solo comía jodidamente en todos los lugares que no
parece que me va a matar. Y cuando salía de la ciudad volví a
todos mis viejos favoritos, en lugar de probar cosas nuevas ... Incluso si encuentro un
un lugar un poco mejor, solo voy a ir allí una o dos veces, así que ¿por qué tomar
¿el riesgo?"
Una propiedad aleccionadora de probar cosas nuevas es que el valor de la exploración,
de encontrar un nuevo favorito, solo puede disminuir con el tiempo, ya que el resto
las oportunidades para saborearlo disminuyen. Descubriendo un café encantador en tu
anoche en la ciudad no te da la oportunidad de volver.
La otra cara es que el valor de la explotación solo puede aumentar con el tiempo.
El café más encantador que conoces hoy es, por definición, al menos como
encantador como el café más encantador que conociste el mes pasado. (Y si tienes
encontró otro favorito desde entonces, podría ser más. Así que explore
cuando tenga tiempo para utilizar el conocimiento resultante, explote cuando
estás listo para sacar provecho. El intervalo marca la estrategia.
Curiosamente, dado que el intervalo hace la estrategia, entonces al observar el
estrategia también podemos inferir el intervalo. Tomemos Hollywood, por ejemplo:
Entre las diez películas más taquilleras de 1981, solo dos fueron secuelas. En
1991, eran tres. En 2001, eran cinco. Y en 2011, ocho de los diez primeros
Las películas más taquilleras fueron secuelas. De hecho, 2011 estableció un récord para
mayor porcentaje de secuelas entre los principales lanzamientos de estudios. Entonces 2012
inmediatamente rompió ese récord; el próximo año volvería a romperlo. En
Diciembre de 2012, el periodista Nick Allen miraba hacia adelante con palpable fatiga
al año que viene:
Página 51
El público recibirá una sexta ración de X-Men más Fast and Furious 6 , Die Hard 5 , Scary
Película 5 y actividad paranormal 5 . También habrá Iron Man 3 , The Hangover 3 y
segundas salidas para Los Muppets , Los Pitufos , GI Joe y Bad Santa .
Desde la perspectiva de un estudio, una secuela es una película con una base de fans garantizada:
una fuente de ingresos, una cosa segura, una proeza. Y una sobrecarga de señales de cosas seguras
un enfoque a corto plazo, como con Stucchio cuando salía de la ciudad. los
es más probable que las secuelas sean éxitos este año que las películas nuevas, pero
¿De dónde vendrán las queridas franquicias del futuro? Tal secuela
el diluvio no solo es lamentable (ciertamente los críticos creen que sí); también es algo
conmovedor. Al entrar en una fase casi puramente centrada en la explotación, la película
la industria parece indicar la creencia de que está cerca del final de su intervalo.
Una mirada a la economía de Hollywood confirma esta corazonada. Beneficios de
los estudios cinematográficos más grandes se redujeron en un 40% entre 2007 y 2011, y las entradas
las ventas han disminuido en siete de los últimos diez años. Como dice The Economist ,
"Exprimidos entre el aumento de los costos y la caída de los ingresos, los grandes estudios han
respondió tratando de hacer más películas que creen que serán un éxito: por lo general
secuelas, precuelas o cualquier cosa con personajes con reconocimiento de nombre ".
En otras palabras, están tirando de los brazos de las mejores máquinas que tienen.
antes de que el casino los descarte.
Ganar-quedarse
Página 52
Robbinsyconsideró
máquinas, específicamente
propuso una el caso
solución llamada en el que
Win-Stay, hay exactamente dos ranuras
Lose-Shift
algoritmo: elige un brazo al azar y sigue tirando de él mientras se mantenga
pagando. Si el brazo no da resultado después de un tirón en particular, cambie a
el otro. Aunque esta simple estrategia está lejos de ser una solución completa,
Robbins demostró en 1952 que funciona mejor que el azar.
Siguiendo a Robbins, una serie de artículos examinó la "permanencia en un ganador"
principio más. Intuitivamente, si ya estuvieras dispuesto a tirar de un brazo, y
acaba de dar sus frutos, eso solo debería aumentar su estimación de su valor, y
solo deberías estar más dispuesto a tirar de él de nuevo. Y de hecho, ganar-quedarse gira
ser un elemento de la estrategia óptima para equilibrar la exploración y
explotación en una amplia gama de condiciones.
Pero perder el turno es otra historia. Cambiar de brazos cada vez que uno falla es un
movimiento bastante precipitado. Imagina ir a un restaurante cien veces, cada vez
tener una comida maravillosa. ¿Sería suficiente una decepción para inducir
que te rindas? Las buenas opciones no deben ser penalizadas con demasiada fuerza por
siendo imperfecto.
Más significativamente, Win-Stay, Lose-Shift no tiene ninguna noción de la
intervalo sobre el que está optimizando. Si tu restaurante favorito
te decepcionó la última vez que comiste allí, ese algoritmo siempre te dice
debería ir a otro lugar, incluso si es su última noche en la ciudad.
Aún así, el trabajo inicial de Robbins sobre el problema de los bandidos con múltiples brazos comenzó
a partir de una literatura sustancial, y los investigadores lograron un progreso significativo en
los próximos años. Richard Bellman, matemático de RAND
Corporation, encontró una solución exacta al problema para los casos en los que
saber de antemano exactamente cuántas opciones y oportunidades tendremos en
total. Al igual que con el problema de la secretaria de información completa, el truco de Bellman fue
esencialmente para trabajar hacia atrás, comenzando por imaginar el tirón final y
considerando qué máquina tragamonedas elegir dados todos los resultados posibles
de las decisiones anteriores. Habiendo descubierto eso, entonces recurrirías al
penúltima oportunidad, luego la anterior, y la anterior a esa,
todo el camino de regreso al principio.
Página 53
Las respuestas que surgen del método de Bellman son férreas, pero con
muchas opciones y una visita prolongada al casino, puede requerir una experiencia vertiginosa, o
imposible — cantidad de trabajo. Es más, incluso si somos capaces de calcular
todos los futuros posibles, por supuesto, no siempre sabemos exactamente cuántos
oportunidades (o incluso cuántas opciones) tendremos. Por estas razones, el
El problema de los bandidos armados múltiples permaneció efectivamente sin resolver. En Whittle's
palabras, "rápidamente se convirtió en un clásico y un sinónimo de intransigencia".
El índice de Gittins
Sin embargo, como sucede tan a menudo en matemáticas, lo particular es la puerta de entrada a
el universal. En la década de 1970, la corporación Unilever pidió a un joven
matemático llamado John Gittins para ayudarlos a optimizar algunos de sus medicamentos
Ensayos. Inesperadamente, lo que obtuvieron fue la respuesta a un acertijo matemático.
que había quedado sin resolver durante una generación.
Gittins, que ahora es profesor de estadística en Oxford, reflexionó sobre la
pregunta planteada por Unilever. Dados varios compuestos químicos diferentes,
¿Cuál es la forma más rápida de determinar qué compuesto es probable que sea
eficaz contra una enfermedad? Gittins trató de plantear el problema de la manera más
forma general que podía: múltiples opciones a seguir, una probabilidad diferente de
recompensa por cada opción, y una cierta cantidad de esfuerzo (o dinero, o tiempo) para
ser distribuidos entre ellos. Fue, por supuesto, otra encarnación del
Problema de bandidos con múltiples brazos.
Tanto las compañías farmacéuticas con fines de lucro como la profesión médica que
servicio se enfrentan constantemente a las demandas competitivas de los
explorar / explotar la compensación. Las empresas quieren invertir dinero en I + D en
descubrimiento de nuevos medicamentos, pero también quieren asegurarse de que su rentable corriente
las líneas de productos están floreciendo. Los médicos quieren recetar los mejores
tratamientos para que los pacientes reciban la atención que necesitan, pero también quieren
Fomentar estudios experimentales que puedan resultar incluso mejores.
En ambos casos, en particular, no está del todo claro cuál es el intervalo relevante
debería ser. En cierto sentido, tanto las compañías farmacéuticas como los médicos están interesados en
el futuro indefinido . Las empresas quieren estar teóricamente para siempre,
Página 54
Página 55
decidir a qué precio están dispuestos a tomar una cosa segura sobre la incertidumbre
del premio maletín.
Gittins (aunque muchos años antes del primer episodio de Deal or No Deal
al aire) se dio cuenta de que el problema de los bandidos con múltiples brazos no es diferente. Para
cada máquina tragamonedas de la que sabemos poco o nada, hay algunas
tasa de pago garantizada que, si se nos ofrece en lugar de esa máquina,
hacernos bastante contentos de no volver a tirar de su mango nunca más. Este número, que
Gittins llamó el "índice de asignación dinámica", y que el mundo ahora
conocido como el índice de Gittins, sugiere una estrategia obvia en el casino
piso: siempre toca el brazo con mayor índice. *
De hecho, la estrategia del índice resultó ser más que una buena
aproximación. Resuelve completamente el bandido de múltiples brazos con
pagos geométricamente descontados. La tensión entre exploración y
la explotación se resuelve en la tarea más simple de maximizar una sola cantidad
eso explica ambos. Gittins es modesto sobre el logro: "No es
bastante el último teorema de Fermat ", dice con una sonrisa, pero es un teorema
que puso fin a un importante conjunto de preguntas sobre la exploración / explotación
dilema.
Ahora, calculando realmente el índice de Gittins para una máquina específica, dado
su historial y nuestra tasa de descuento, todavía está bastante involucrado. Pero una vez
se conoce el índice de Gittins para un conjunto particular de suposiciones, se puede usar
para cualquier problema de esa forma. Fundamentalmente, ni siquiera importa cuántos
los brazos están involucrados, ya que el índice para cada brazo se calcula por separado.
En la tabla de la página siguiente, proporcionamos los valores del índice de Gittins para up
a nueve éxitos y fracasos, asumiendo que una recompensa en nuestro próximo tirón es
vale el 90% de una recompensa ahora. Estos valores se pueden utilizar para resolver una variedad de
problemas cotidianos de bandidos armados múltiples. Por ejemplo, bajo estos
suposiciones, debería, de hecho, elegir la máquina tragamonedas que tiene una pista
récord de 1 a 1 (y un valor esperado del 50%) sobre el que tiene una pista
récord de 9–6 (y un valor esperado del 60%). Buscando lo relevante
coordenadas en la tabla muestra que la máquina menos conocida tiene un índice
de 0.6346, mientras que la máquina más jugada obtiene solo 0.6300. Problema
resuelto: prueba suerte esta vez y explora.
Página 56
Al observar los valores del índice de Gittins en la tabla, hay algunos otros
observaciones interesantes. Primero, puede ver el principio de ganar-permanecer en funcionamiento:
a medida que avanza de izquierda a derecha en cualquier fila, las puntuaciones del índice siempre aume
si un brazo es el correcto para tirar, y ese tirón es un ganador, entonces
(siguiendo el cuadro de la derecha) solo puede tener más sentido tirar del
mismo brazo otra vez. En segundo lugar, puede ver dónde lo llevaría a perder el turno.
problema. Tener nueve victorias iniciales seguidas de una derrota te da un índice de
0,8695, que sigue siendo más alto que la mayoría de los demás valores de la tabla, por lo que
probablemente deberías quedarte con ese brazo durante al menos otro tirón.
Valores del índice de Gittins en función de las ganancias y las pérdidas, asumiendo que una recompensa la próxima vez vale el 90%
de una recompensa ahora.
Página 57
en última instancia, converge en 0.5000, ya que la experiencia confirma que el
de hecho, la máquina no es nada especial y quita el "bono" que estimula
exploración adicional. Pero la convergencia ocurre con bastante lentitud; los
El bono de exploración es una fuerza poderosa. De hecho, tenga en cuenta que incluso una falla en
el primer tirón, que produce un registro de 0 a 1, lo convierte en un índice de Gittins
eso todavía está por encima del 50%.
También podemos ver cómo cambia la compensación explorar / explotar a medida que cambiamos
la forma en que estamos descontando el futuro. La siguiente tabla presenta exactamente
la misma información que la anterior, pero asume que una recompensa próxima
el tiempo vale el 99% de uno ahora, en lugar del 90%. Con el futuro ponderado
casi tan fuerte como el presente, el valor de hacer un descubrimiento casual,
en relación con tomar una cosa segura, sube aún más. Aquí, un totalmente no probado
máquina con un registro 0-0 vale una probabilidad garantizada del 86,99% de
¡pagar!
Valores del índice de Gittins en función de las ganancias y las pérdidas, asumiendo que una recompensa la próxima vez vale un 99%
de una recompensa ahora.
Página 58
resultados de lo que aprendemos de la exploración. El viejo adagio nos dice que "el
el césped siempre es más verde al otro lado de la cerca ", pero las matemáticas nos dicen
por qué: lo desconocido tiene la posibilidad de ser mejor, incluso si realmente lo esperamos
que no sea diferente, o si es probable que sea peor. El novato no probado es
vale más (a principios de la temporada, de todos modos) que el veterano de aparentemente
igual capacidad, precisamente porque sabemos menos de él. Exploración en
en sí mismo tiene valor, ya que probar cosas nuevas aumenta nuestras posibilidades de encontrar el
mejor. Por lo tanto, teniendo en cuenta el futuro, en lugar de centrarse solo en el
presente, nos impulsa hacia la novedad.
El índice de Gittins proporciona una solución sorprendentemente sencilla para
el problema de los bandidos armados múltiples. Pero no necesariamente cierra el libro
en el rompecabezas, o ayúdanos a navegar por todas las ventajas y desventajas de explorar / explotar
la vida cotidiana. Por un lado, el índice de Gittins es óptimo solo bajo algunos
supuestos. Se basa en el descuento geométrico de recompensas futuras, valorando
cada tirón en una fracción constante de la anterior, que es algo que
una variedad de experimentos en economía y psicología del comportamiento sugieren
la gente no lo hace. Y si hay un costo por cambiar entre opciones, el
La estrategia de Gittins tampoco es óptima. (La hierba al otro lado de
la cerca puede parecer un poco más verde, pero eso no necesariamente garantiza
escalar la valla, y mucho menos sacar una segunda hipoteca).
lo que es más importante, es difícil calcular el índice de Gittins sobre la marcha. Si tu
Lleve consigo una tabla de valores de índice que puede optimizar sus opciones gastronómicas,
pero el tiempo y el esfuerzo involucrados pueden no valer la pena. ("Espera, puedo resolver
este argumento. Ese restaurante estuvo bien 29 de 35 veces, pero este otro
uno ha sido bueno 13 de 16 veces, por lo que los índices de Gittins son ... Oye,
¿A dónde fueron todos? ")
En el tiempo transcurrido desde el desarrollo del índice de Gittins, tales preocupaciones
han enviado informáticos y estadísticos en busca de métodos más sencillos y
Estrategias más flexibles para hacer frente a bandidos armados múltiples. Estas
Las estrategias son más fáciles de aplicar para los humanos (y las máquinas) en una variedad de
situaciones que procesar el índice de Gittins óptimo, sin dejar de proporcionar
rendimiento comparablemente bueno. También interactúan con uno de nuestros mayores
los miedos humanos con respecto a las decisiones sobre qué oportunidades tomar.
Página 59
Arrepentimiento y Optimismo
Lamenta, he tenido algunos. Pero igualmente, muy pocos como para mencionarlos.
-FRANK SINATRA
El marco que encontré, que hizo que la decisión fuera increíblemente fácil, fue lo que llamé, que
solo un nerd llamaría: un "marco de minimización de arrepentimientos". Entonces quise proyectarme
Adelante a los 80 años y diga: “Bien, ahora estoy mirando hacia atrás en mi vida. Quiero haber minimizado
la cantidad de arrepentimientos que tengo ". Sabía que a los 80 años no me iba a arrepentir de haberlo intentado
esta. No me iba a arrepentir de haber intentado participar en esta cosa llamada Internet que pensé
iba a ser un gran problema. Sabía que si fallaba no me arrepentiría, pero sabía que
una cosa de la que podría arrepentirme es no haberlo intentado nunca. Sabía que eso me perseguiría todos los días
y así, cuando lo pensé de esa manera, fue una decisión increíblemente fácil.
Página 60
arrepentirse.
El arrepentimiento es el resultado de comparar lo que realmente hicimos con lo que
han sido mejores en retrospectiva. En un bandido de múltiples brazos, Barnard's
De hecho, la "pérdida inestimable" se puede medir con precisión, y al arrepentimiento se le asigna un
número: es la diferencia entre el pago total obtenido siguiendo un
estrategia particular y la recompensa total que teóricamente podría haber sido
obtenido simplemente tirando del mejor brazo cada vez (si sólo hubiéramos sabido
desde el principio cuál fue). Podemos calcular este número para diferentes
estrategias, y busque aquellas que la minimicen.
En 1985, Herbert Robbins disparó por segunda vez contra el bandido de múltiples brazos.
problema, unos treinta años después de su trabajo inicial en Win-Stay, Lose-Shift.
Él y su colega matemático de Columbia Tze Leung Lai pudieron demostrar
varios puntos clave sobre el arrepentimiento. Primero, asumiendo que no eres omnisciente, tu
La cantidad total de arrepentimiento probablemente nunca dejará de aumentar, incluso si elige
la mejor estrategia posible, porque incluso la mejor estrategia no es perfecta
cada vez. En segundo lugar, el arrepentimiento aumentará a un ritmo más lento si elige el mejor
estrategia que si eliges a otros; es más, con una buena estrategia lamento
La tasa de crecimiento disminuirá con el tiempo, a medida que aprenda más sobre el problema.
y son capaces de tomar mejores decisiones. En tercer lugar, y más específicamente, el
El mínimo arrepentimiento posible, asumiendo nuevamente la no omnisciencia, es el arrepentimiento de
aumenta a una tasa logarítmica con cada tirón del mango.
El arrepentimiento creciente logarítmicamente significa que haremos tantos
errores en nuestros primeros diez tirones como en los siguientes noventa, y tantos en nuestro
primer año como en el resto de la década combinada. (La primera década
Los errores, a su vez, son tantos como cometeremos durante el resto del siglo).
Esa es una medida de consuelo. En general, no podemos esperar de manera realista
algún día para no tener más arrepentimientos. Pero si seguimos un arrepentimiento
minimizando el algoritmo, cada año podemos esperar tener menos arrepentimientos nuevos
que hicimos el año anterior.
Comenzando con Lai y Robbins, los investigadores de las últimas décadas han establecido
acerca de buscar algoritmos que ofrezcan la garantía de un arrepentimiento mínimo. De
los que han descubierto, los más populares se conocen como Upper
Algoritmos de Confidence Bound .
Página 61
Las presentaciones visuales de estadísticas a menudo incluyen las llamadas barras de error que se ext
por encima y por debajo de cualquier punto de datos, lo que indica incertidumbre en la medición;
las barras de error muestran el rango de valores plausibles que la cantidad
medido podría haberlo hecho. Este rango se conoce como "confianza
intervalo ", y a medida que obtenemos más datos sobre algo, el intervalo de confianza
se encogerá, reflejando una evaluación cada vez más precisa. (Por ejemplo, un
La máquina tragamonedas que ha pagado una vez de cada dos tiradas tendrá una mayor
intervalo de confianza, aunque el mismo valor esperado, como una máquina que tiene
pagó cinco veces en diez tirones.) En un problema de bandidos con múltiples brazos, un Upper
El algoritmo Confidence Bound dice, simplemente, elegir la opción para
cuál es la parte superior del intervalo de confianza más alto.
Al igual que el índice de Gittins, por lo tanto, los algoritmos de límite de confianza superior
Asigne un solo número a cada brazo del bandido de múltiples brazos. Y eso
El número se establece en el valor más alto que el brazo podría tener razonablemente, basado
sobre la información disponible hasta el momento. Así que un límite de confianza superior
al algoritmo no le importa qué brazo ha funcionado mejor hasta ahora; en cambio, es
elige el brazo que razonablemente podría funcionar mejor en el futuro. Si tu
nunca antes había estado en un restaurante, por ejemplo, entonces, por lo que sabe,
podría ser genial. Incluso si ha ido allí una o dos veces y ha probado un
algunos de sus platos, es posible que no tenga suficiente información para descartar
la posibilidad de que aún pueda resultar mejor que su favorito habitual. Igual que
el índice de Gittins, el límite superior de confianza es siempre mayor que el
valor esperado, pero cada vez menos a medida que adquirimos más experiencia con un
opción particular. (Un restaurante con una sola crítica mediocre todavía conserva una
potencial de grandeza que está ausente en un restaurante con cientos de
revisiones.) Las recomendaciones dadas por Upper Confidence Bound
Los algoritmos serán similares a los proporcionados por el índice de Gittins, pero
son significativamente más fáciles de calcular y no requieren la suposición de
descuento geométrico.
Los algoritmos de límite de confianza superior implementan un principio que
ha sido apodado "optimismo ante la incertidumbre". Optimismo, muestran
puede ser perfectamente racional. Al centrarse en lo mejor que podría ser una opción ,
Dada la evidencia obtenida hasta ahora, estos algoritmos dan un impulso a
Página 62
Bandidos en línea
Página 63
Página 64
Página 65
Página 66
proceso de obtención de esta información, las personas pueden estar expuestas al riesgo de
dañar."
Por tanto, el Informe Belmont reconoce, pero no resuelve, la
tensión que existe entre actuar sobre la base de los mejores conocimientos y recopilar
más. También deja en claro que la recopilación de conocimientos puede ser muy valiosa
que algunos aspectos de la ética médica normal pueden suspenderse. Clínico
la prueba de nuevos medicamentos y tratamientos, señala el informe, a menudo requiere arriesgarse
daño a algunos pacientes, incluso si se toman medidas para minimizar ese riesgo.
Una de las cuestiones fundamentales que ha surgido en las décadas transcurridas desde la
El Informe Belmont es si el enfoque estándar para realizar estudios clínicos
los ensayos realmente minimizan el riesgo para los pacientes. En un ensayo clínico convencional,
los pacientes se dividen en grupos, y cada grupo se asigna para recibir un
tratamiento diferente durante la duración del estudio. (Solo en casos excepcionales
¿Se detiene un ensayo antes de tiempo?) Este procedimiento se enfoca decisivamente en
resolver la cuestión de qué tratamiento es mejor, en lugar de proporcionar
el mejor tratamiento para cada paciente en el propio ensayo. De esta manera opera
exactamente como la prueba A / B de un sitio web, con una cierta fracción de personas que reciben
una experiencia durante el experimento que eventualmente resultará inferior.
Pero los médicos, al igual que las empresas de tecnología, están obteniendo información sobre
¿Qué opción es mejor mientras avanza el juicio? Información que podría ser
utilizado para mejorar los resultados no solo para los pacientes futuros más allá del ensayo, sino
para los pacientes que se encuentran actualmente en él.
Hay millones de dólares en juego en experimentos para encontrar el óptimo
configuración de un sitio web, pero en ensayos clínicos, experimentando para encontrar
los tratamientos óptimos tienen consecuencias directas de vida o muerte. Y un creciente
Página 67
Página 68
Página 69
Página 70
larga historia de apegarse a una opción en la que confían: que por fin podrían ser
dispuesto a explorar alternativas.
El mundo inquieto
Una vez que se familiarice con ellos, es fácil ver bandidos con varios brazos.
casi en todas partes donde miremos. Es raro que tomemos una decisión aislada
donde el resultado no nos proporciona ninguna información que usaremos
para tomar otras decisiones en el futuro. Así que es natural preguntar, como hicimos con
parada óptima, qué tan bien la gente generalmente tiende a resolver estos problemas—
una cuestión que ha sido ampliamente explorada en el laboratorio por
psicólogos y economistas del comportamiento.
En general, parece que la gente tiende a sobreexplorar, para favorecer la nueva
desproporcionadamente sobre los mejores. En una simple demostración de esto
fenómeno, publicado en 1966, Amos Tversky y Ward Edwards
llevó a cabo experimentos en los que a las personas se les mostró una caja con dos luces encendidas
y le dijo que cada luz se encendería en un porcentaje fijo (pero desconocido)
del tiempo. Luego se les dio 1,000 oportunidades para observar
qué luz se encendió, o apostar al resultado sin llegar a
observarlo. (A diferencia de una configuración de problema de bandidos más tradicional, aquí uno podrí
no haga un “tirón” que sea tanto una apuesta como una observación a la vez; Participantes
no sabría si sus apuestas habían valido la pena hasta el final.) Esto es puro
exploración versus explotación, enfrentando la obtención de información directamente
contra su uso. En su mayor parte, la gente adoptó una estrategia sensata de
observando por un tiempo, luego apostando en lo que parecía ser el mejor
resultado, pero constantemente pasaban mucho más tiempo observando de lo que pensaban
debería tener. Cuanto mas tiempo? En un experimento, se encendió una luz
El 60% del tiempo y el otro 40% del tiempo, una diferencia ni
particularmente descarado ni particularmente sutil. En ese caso, la gente eligió
observe 505 veces, en promedio, colocando apuestas las otras 495 veces. Pero el
las matemáticas dicen que deberían haber comenzado a apostar después de solo 38 observaciones—
dejando 962 oportunidades para sacar provecho.
Página 71
El problema estándar de los bandidos armados múltiples asume que las probabilidades
con los que los brazos se amortizan se fijan en el tiempo. Pero eso no es necesariamente
cierto en las aerolíneas, restaurantes u otros contextos en los que la gente tiene que hacer
elecciones repetidas. Si las probabilidades de una recompensa en los diferentes brazos
cambiar con el tiempo, lo que se ha denominado un "bandido inquieto", el problema
se vuelve mucho más difícil. (De hecho, es mucho más difícil que no hay
algoritmo para resolverlo por completo, y se cree que nunca lo habrá).
Parte de esta dificultad es que ya no se trata simplemente de explorar un
mientras y luego explota: cuando el mundo puede cambiar, continuar
explorar puede ser la elección correcta. Podría valer la pena volver a eso
restaurante decepcionante que no has visitado en algunos años, por si acaso es
bajo nueva dirección.
En su célebre ensayo "Walking", Henry David Thoreau reflexionó sobre
cómo prefería viajar cerca de casa, cómo nunca se cansaba de
su entorno y siempre encontraba algo nuevo o sorprendente en el
Paisaje de Massachusetts. “De hecho, hay una especie de armonía que se puede descubrir
entre las capacidades del paisaje dentro de un círculo de diez millas '
radio, o los límites de una caminata por la tarde, y los sesenta años y diez
de la vida humana ”, escribió. "Nunca te resultará muy familiar".
Vivir en un mundo inquieto requiere cierta inquietud en uno mismo. Entonces
Mientras las cosas sigan cambiando, nunca debes dejar de explorar por completo.
Aún así, las técnicas algorítmicas perfeccionadas para la versión estándar del
Los problemas de los bandidos con múltiples brazos son útiles incluso en un mundo inquieto. Estrategias
como el índice de Gittins y el límite de confianza superior proporcionan razonablemente
Buenas soluciones aproximadas y reglas generales, especialmente si las recompensas no
cambiar mucho con el tiempo. Y muchos de los beneficios del mundo son posiblemente
más estático hoy que nunca. Un parche de bayas puede ser uno maduro
semana y podrida la siguiente, pero como dijo Andy Warhol, "Una Coca-Cola es una Coca-Cola".
Tener instintos sintonizados por la evolución para un mundo en constante cambio no es
necesariamente útil en una era de estandarización industrial.
Quizás lo más importante, pensar en las versiones de los brazos múltiples
El problema de los bandidos que tienen soluciones óptimas no solo ofrece algoritmos,
también ofrece conocimientos. El vocabulario conceptual derivado del clásico
Página 73
Explorar ...
Si bien los estudios de laboratorio pueden ser esclarecedores, el intervalo de muchos de los
Los problemas más importantes que enfrentan las personas son demasiado largos para estudiarlos en el
Aprender la estructura del mundo que nos rodea y formar relaciones sociales duraderas.
las relaciones son tareas de toda la vida. Así que es instructivo ver cómo
El patrón general de exploración temprana y explotación tardía aparece a lo largo del
curso de la vida.
Una de las cosas curiosas de los seres humanos, que cualquier desarrollo
El psicólogo aspira a comprender y explicar, es que tardamos años en
llegar a ser competente y autónomo. Hay que preparar caribúes y gacelas
huir de los depredadores el día que nacen, pero los humanos necesitan más de un
año para dar sus primeros pasos. Alison Gopnik, profesora de desarrollo
psicología en UC Berkeley y autora de The Scientist in the Crib , tiene un
explicación de por qué los seres humanos tienen un período tan extenso de
dependencia: "te da una forma de desarrollo de resolver el problema
compensación de exploración / explotación ". Como hemos visto, buenos algoritmos para
jugar bandidos con múltiples brazos tienden a explorar más temprano, explotando la
conocimiento resultante más tarde. Pero como señala Gopnik, “la desventaja de
es que no obtienes buenas recompensas cuando estás en la exploración
escenario." De ahí la infancia: "La infancia te da un período en el que puedes
simplemente explore las posibilidades y no tendrá que preocuparse por las recompensas
porque las recompensas las están cuidando las mamás y los papas y los
abuelas y niñeras ".
Pensar en los niños como simplemente estar en la exploración transitoria
etapa de un algoritmo de por vida podría proporcionar algún consuelo para los padres de
niños en edad preescolar. (Tom tiene dos hijas en edad preescolar muy exploradoras,
y espera que estén siguiendo un algoritmo que tenga un mínimo de arrepentimiento).
Página 74
también proporciona nuevos conocimientos sobre la racionalidad de los niños. Puntos Gopnik
que "si miras la historia de la forma en que la gente ha pensado
acerca de los niños, por lo general han argumentado que los niños son cognitivamente
deficientes en varias formas, porque si se analizan sus capacidades de explotación,
se ven terribles. No pueden atarse los zapatos, no son buenos a largo plazo
planificando, no son buenos para enfocar la atención. Esas son todas las cosas que
los niños son realmente horribles en ". Pero presionando botones al azar, siendo muy
interesado en juguetes nuevos, y saltar rápidamente de una cosa a otra son
todas las cosas en las que los niños son realmente buenos. Y esos son exactamente lo que
debería estar haciendo si su objetivo es la exploración. Si eres un bebé, ponte cada
objeto de la casa en tu boca es como tirar cuidadosamente de todas las manijas
en el
Decasino.
manera más general, nuestras intuiciones sobre la racionalidad se basan con demasiada frecuenci
por explotación en lugar de exploración. Cuando hablamos de decisión
toma, generalmente nos enfocamos solo en la recompensa inmediata de una sola decisión
—Y si trata cada decisión como si fuera la última, entonces sólo
la explotación tiene sentido. Pero a lo largo de la vida, vas a ganar mucho
decisiones. Y es realmente racional enfatizar la exploración: la nueva
en lugar de lo mejor, lo emocionante en lugar de lo seguro, lo aleatorio en lugar de
el considerado — para muchas de esas opciones, particularmente en etapas tempranas de la vida.
Lo que consideramos el capricho de los niños puede ser más sabio de lo que creemos.
... y explotar
Había llegado a una coyuntura en mi vida lectora que es familiar para aquellos
que han estado allí: en el tiempo asignado que me queda en la tierra, ¿debería
leer más y más libros nuevos, o debería dejar de
consumo, vano porque es interminable, y empiece a releer esos
libros que me habían dado el placer más intenso en mi pasado.
—LYDIA DAVIS
Página 75
Página 76
Página 77
Página 78
*El resumen básico de esta sección: git mientras que los Gittins son buenos.
Página 79
3 Clasificación
Hacer orden
Ahora bien, si la palabra que deseas encontrar comienza con (a) entonces
Mire al principio de esta Tabla, pero si con (v) mire hacia el
fin. De nuevo, si tu palabra comienza con (ca) mira al principio del
letra (c) pero si está con (cu) entonces mire hacia el final de esa letra. Y
así de todos los demás. &C.
—ROBERT CAWDREY, UNA MESA ALFABÉTICA (1604)
Página 80
El éxtasis de la clasificación
La clasificación es la esencia misma de lo que hacen las computadoras. De hecho, de muchas formas
fue la clasificación que dio origen a la computadora.
A finales del siglo XIX, la población estadounidense crecía a
30% cada década, y el número de "sujetos de investigación" en los EE. UU.
El censo había pasado de solo cinco en 1870 a más de doscientos en 1880.
La tabulación del censo de 1880 tomó ocho años, apenas terminando en
el momento en que comenzó el censo de 1890. Como dijo un escritor en ese momento, fue un
me pregunto “los empleados que se afanaron en los irritantes trozos de papel de conteo ... no
volverse ciego y loco ". Toda la empresa amenazaba con colapsar bajo
su propio peso. Había que hacer algo.
Inspirado en los billetes de tren perforados de la época, un inventor de la
El nombre de Herman Hollerith ideó un sistema de tarjetas manila perforadas para
almacenar información, y una máquina, a la que llamó la Máquina Hollerith, para
contarlos y clasificarlos. Hollerith recibió una patente en 1889, y el
El gobierno adoptó la Máquina Hollerith para el censo de 1890. Nadie tenia
he visto algo parecido. Un observador asombrado escribió: "El aparato
funciona tan infaliblemente como los molinos de los dioses, pero los golpea hasta
velocidad." Otro, sin embargo, razonó que la invención tenía un uso limitado:
Página 81
“Como nadie lo usará más que los gobiernos, es probable que el inventor no obtenga
muy rico." Esta predicción, que Hollerith recortó y guardó, no
probar completamente correcto. La firma de Hollerith se fusionó con varias otras en 1911
para convertirse en la Compañía de Computación-Tabulación-Grabación. Unos años
más tarde se le cambió el nombre a International Business Machines o IBM.
La clasificación continuó impulsando el desarrollo de la computadora a través de la
próximo siglo. El primer código jamás escrito para una computadora con "programa almacenado"
era un programa para una clasificación eficiente. De hecho, era la capacidad de la computadora para
superan a las máquinas de clasificación de tarjetas dedicadas de IBM que convencieron a los EE. UU.
gobierno su enorme inversión financiera en un propósito general
La máquina estaba justificada. En la década de 1960, un estudio estimó que más de un
una cuarta parte de los recursos informáticos del mundo se gastaba en
clasificación. Y no es de extrañar, la clasificación es esencial para trabajar con casi cualquier
tipo de información. Ya sea para encontrar el más grande o el más pequeño, el
más común o más raro, contando, indexando, marcando duplicados o simplemente
buscando simplemente lo que desea, generalmente todos comienzan bajo el
capucha con una especie.
Pero la clasificación es incluso más omnipresente que esto. Después de todo, uno de los principales
razones por las que las cosas se ordenan es para mostrarse de forma útil a los ojos humanos,
lo que significa que la clasificación también es clave para la experiencia humana de
información. Las listas ordenadas son tan omnipresentes que, como el pez que pregunta,
“¿Qué es el agua?”, Debemos trabajar conscientemente para percibirlos. Y
luego los percibimos en todas partes.
Nuestra bandeja de entrada de correo electrónico normalmente muestra los cincuenta mensajes princ
miles, ordenados por hora de recepción. Cuando buscamos restaurantes en Yelp
se nos muestra la primera docena de cientos, ordenados por proximidad o por
clasificación. Un blog muestra una lista recortada de artículos, ordenados por fecha. El Facebook
el servicio de noticias, la transmisión de Twitter y la página de inicio de Reddit se presentan como
listas, ordenadas por alguna medida patentada. Nos referimos a cosas como Google
y Bing como "motores de búsqueda", pero es un nombre poco apropiado: son
realmente ordenar motores. ¿Qué hace que Google sea tan dominante como medio de
acceder a la información del mundo es menos que encontrar nuestro texto dentro
cientos de millones de páginas web; sus competidores de la década de 1990
Página 82
hacer esa parte lo suficientemente bien, pero que ordena esas páginas web tan bien, y solo
nos muestra los diez más relevantes.
La parte superior truncada de una inmensa lista ordenada es, en muchos sentidos, el
interfaz de usuario universal.
Las ciencias de la computación nos brindan una forma de comprender lo que sucede detrás
las escenas en todos estos casos, lo que a su vez puede ofrecernos una idea de
esos momentos en los que somos nosotros los que hacemos el pedido, con nuestras facturas, nuestras
papeles, libros, calcetines, probablemente más veces al día de lo que creemos.
Al cuantificar el vicio (y la virtud) del desorden, también nos muestra los casos
donde en realidad no deberíamos hacer ningún pedido.
Es más, cuando comenzamos a buscar, vemos que ordenar no es solo
algo que hacemos con la información. Es algo que hacemos con la gente.
Quizás el lugar donde la informática para establecer el rango es más
inesperadamente útil es en el campo deportivo y en el ring de boxeo, que
Es por eso que saber un poco sobre clasificación podría ayudar a explicar cómo los seres humanos
son capaces de vivir juntos aunque sólo ocasionalmente llegan a los golpes. Eso es para
Por ejemplo, la clasificación ofrece algunas pistas sorprendentes sobre la naturaleza de la sociedad: que
otro tipo de pedido más grande e importante que hacemos.
La agonía de la clasificación
“Para reducir los costos por unidad de producción, las personas generalmente aumentan el tamaño de su
operaciones ”, escribió JC Hosken en 1955, en el primer artículo científico
publicado sobre clasificación. Esta es la economía de escala familiar para cualquier negocio.
estudiante. Pero con la clasificación, el tamaño es una receta para el desastre: perversamente, como una
crece, "el costo unitario de clasificación, en lugar de disminuir, aumenta". Clasificación
implica empinadas dis economías de escala, violando nuestras intuiciones acerca normales
las virtudes de hacer las cosas a granel. Cocinar para dos no suele ser más difícil
que cocinar para uno, y ciertamente es más fácil que cocinar para una persona
dos veces. Pero clasificar, digamos, un estante de cien libros le llevará más tiempo que
clasificar dos estanterías de cincuenta cada una: tienes el doble de cosas para
organizar, y hay el doble de lugares a los que cada uno de ellos podría ir. los
cuanto más tomas, peor se pone.
Página 83
Esta es la primera y más fundamental idea de la teoría de la clasificación. Escala
duele.
De esto podríamos inferir que minimizar nuestro dolor y sufrimiento cuando
viene a ordenar se trata de minimizar la cantidad de cosas que tenemos que
clasificar. Es cierto: uno de los mejores preventivos contra la computación
La dificultad de clasificar los calcetines es simplemente lavar la ropa con más frecuencia. Haciendo
lavar tres veces con más frecuencia, por ejemplo, podría reducir los gastos generales de clasificación
por un factor de nueve. De hecho, si el compañero de cuarto de Hillis se quedaba con su peculiar
procedimiento, pero pasaron trece días entre lavados en lugar de catorce, que
solo le ahorraría veintiocho tirones de la cesta. (Y yendo solo
un solo día más entre lavados le costaría treinta tirones más).
Incluso con un alcance quincenal tan modesto, podemos ver la escala de clasificación
comenzando a volverse insostenible. Las computadoras, sin embargo, deben clasificar rutinariamente
millones de artículos de una sola vez. Por eso, como dice la línea de Jaws , estamos
va a necesitar un barco más grande y un algoritmo mejor.
Pero para responder a la pregunta de cómo deberíamos estar clasificando, y
qué métodos se destacan, primero tenemos que averiguar algo más:
cómo vamos a llevar la cuenta.
El Libro Guinness de los Récords Mundiales atribuye el récord de clasificación de una baraja
de cartas al mago checo Zdeněk Bradáč. El 15 de mayo de 2008, Bradáč
ordenó una baraja de 52 cartas en solo 36,16 segundos. * ¿Cómo lo hizo? Qué
¿La técnica de clasificación le entregó el título? Aunque la respuesta derramaría
interesante luz sobre la teoría de la clasificación, Bradáč se negó a comentar.
Si bien no tenemos más que respeto por la habilidad y destreza de Bradáč,
estamos 100% seguros de lo siguiente: podemos batir personalmente su récord. En
De hecho, estamos 100% seguros de que podemos lograr un récord inquebrantable . Todos nosotros
la necesidad se trata de
80,658,175,170,943,878,571,660,636,856,403,766,975,289,505,440,883,27
7,824,000,000,000,000 intentos por el título. Este número, un poco más de 80
unvigintillion, es 52 factorial, o "52!" en notación matemática, el
Página 84
varias formas en las que se puede pedir una baraja de 52 cartas. Tomando
aproximadamente tantos intentos, tarde o temprano estaremos obligados a comenzar con un
baraja barajada que de hecho está completamente ordenada por casualidad. En ese punto nosotros
puede inscribir con orgullo a Christian-Griffiths en The Guinness Book junto con un
tiempo de clase no muy lamentable de 0m00s.
Para ser justos, es casi seguro que lo intentaremos hasta la muerte por calor del
universo antes de que tuviéramos nuestro intento de récord perfecto. No obstante, esto
destaca la mayor
científicos diferencia fundamental
de la computación. entre
La gente finos en los poseedores
Guinness depreocupan
sólo se registros ymejor -case
rendimiento (y cerveza). Difícilmente son dignos de culpa, por supuesto: todos los registros
en los deportes reflejan el mejor desempeño individual. La informática, sin embargo,
casi nunca se preocupa por el mejor de los casos. En cambio, los informáticos podrían
quiere saber el tiempo medio de clasificación de alguien como Bradáč: haga que clasifique
todos los 80 pedidos de mazos de unvigintillion, o una muestra de tamaño razonable, y
puntúelo en su velocidad promedio en todos los intentos. (Puedes ver por qué
no dejes que los informáticos ejecuten estas cosas).
Además, un científico informático querría saber el peor momento.
El análisis del peor de los casos nos permite ofrecer garantías sólidas: que un proceso crítico
terminar a tiempo, los plazos no se perderán. Entonces, para el resto de este capítulo
—Y el resto de este libro, en realidad— solo discutiremos
rendimiento de los algoritmos en el peor de los casos, a menos que se indique lo contrario.
La informática ha desarrollado una abreviatura específica para medir
Escenarios algorítmicos del peor de los casos: se llama notación "Big-O". Big-O
la notación tiene una peculiaridad particular, que es que es inexacta por diseño. Es decir,
en lugar de expresar el rendimiento de un algoritmo en minutos y segundos,
La notación Big-O proporciona una forma de hablar sobre el tipo de relación que
se mantiene entre el tamaño del problema y el tiempo de ejecución del programa.
Debido a que la notación Big-O arroja deliberadamente detalles finos, lo que emerge es una
esquema para dividir problemas en diferentes clases amplias.
Imagina que estás organizando una cena con n invitados. El tiempo requerido
limpiar la casa para su llegada no depende del número de invitados
en absoluto. Esta es la clase de problemas más optimista que existe: llamada "O grande de uno",
escrito O (1), también se conoce como "tiempo constante". En particular, la notación Big-O
Página 85
Página 86
Tiempo constante, escrito O (1); tiempo lineal, escrito O (n); y tiempo cuadrático, escrito O (n 2 ).
Cuando el entonces senador Obama visitó Google en 2007, el director ejecutivo Eric Schmidt
en broma comenzó la sesión de preguntas y respuestas como una entrevista de trabajo, preguntándole: "
forma de ordenar un millón de enteros de treinta y dos bits? " Sin perder el ritmo
Obama esbozó una sonrisa irónica y respondió: "Creo que el tipo de burbuja sería
el camino equivocado a seguir ". La multitud de ingenieros de Google estalló en vítores.
"Me tenía en Bubble Sort", recordó uno más tarde.
Obama tenía razón al evitar Bubble Sort, un algoritmo que ha
convertirse en una especie de saco de boxeo para los estudiantes de informática: es
simple, intuitivo y extremadamente ineficiente.
Imagina que quieres ordenar alfabéticamente tu colección de libros sin clasificar. A
enfoque natural sería simplemente escanear a través del estante en busca de
pares de órdenes (Wallace seguido de Pynchon, por ejemplo) y voltear
ellos alrededor. Ponga a Pynchon por delante de Wallace, luego continúe su escaneo,
dando vueltas hasta el principio del estante cada vez que llega al final.
Cuando haces un pase completo sin encontrar más fuera de servicio
pares en todo el estante, entonces sabrá que el trabajo está hecho.
Página 87
La pregunta parece que se trata de productividad. Pero habla con una computadora
científico y resulta estar más cerca de la metafísica, similar a pensar en
la velocidad de la luz, el viaje en el tiempo, los superconductores o la entropía termodinámica.
¿Cuáles son las reglas y límites fundamentales del universo? ¿Que es posible?
¿Qué está permitido? De esta manera, los científicos de la computación están vislumbrando
planos tanto como los físicos de partículas y los cosmólogos.
¿Cuál es el mínimo esfuerzo requerido para realizar el pedido?
¿Podríamos encontrar un tipo de tiempo constante, O (1), uno que (como limpiar el
casa antes de que llegue el grupo de invitados) puede ordenar una lista de cualquier tamaño en el mismo
¿cantidad de tiempo? Bueno, incluso confirmando que un estante de n libros está ordenado
no se puede hacer en tiempo constante, ya que requiere verificar todos los n . Entonces
en realidad, ordenar los libros en un tiempo constante parece imposible.
¿Qué pasa con una ordenación de tiempo lineal, O ( n ), tan eficiente como pasar un plato
una tabla, donde duplicar el número de elementos para ordenar simplemente duplica el
¿trabaja? Pensando en los ejemplos anteriores, es difícil imaginar cómo eso
podría funcionar bien. El n 2 en cada caso proviene del hecho de que necesita
mover n libros, y el trabajo requerido en cada movimiento también se escala con n .
¿Cómo pasaríamos de n movimientos de tamaño n a n solo? En
Bubble Sort, nuestro tiempo de ejecución O ( n 2 ) provino de manejar cada uno de los n
libros y moverlos hasta n lugares cada uno. En Orden de inserción,
El tiempo de ejecución cuadrático provino de manejar cada uno de los n libros y
comparándolos con otros n antes de insertarlos. Un tiempo lineal
ordenar significa manipular cada libro durante un tiempo constante, independientemente de cuántos
otros necesita encontrar su lugar entre. No parece probable.
Entonces sabemos que podemos hacerlo al menos tan bien como el tiempo cuadrático, pero
probablemente no tan bien como el tiempo lineal. Quizás nuestro límite esté en alguna parte
entre tiempo lineal y tiempo cuadrático. ¿Hay algún algoritmo entre
lineal y cuadrático, entre n y n × n ?
Los hay, y se escondían a plena vista.
Como mencionamos anteriormente, el procesamiento de información comenzó en los EE. UU.
censos del siglo XIX, con el desarrollo, por Herman
Hollerith y más tarde por IBM, de dispositivos físicos de clasificación de tarjetas perforadas. En 1936,
IBM comenzó a producir una línea de máquinas llamadas "alzadoras" que podían
Página 89
fusionar dos pilas de tarjetas ordenadas por separado en una. Mientras los dos
Las pilas se clasificaron ellas mismas, el procedimiento de fusionarlas en una sola
La pila ordenada fue increíblemente sencilla y tomó un tiempo lineal: simplemente
comparar las dos cartas superiores entre sí, mover la más pequeña a la
nueva pila que está creando y repita hasta que termine.
El programa que John von Neumann escribió en 1945 para demostrar la
El poder de la computadora de programa almacenado tomó la idea de cotejar a su
hermosa y última conclusión. Clasificar dos cartas es simple: simplemente coloque el
uno más pequeño en la parte superior. Y dado un par de pilas de dos cartas, ambas
ordenados, puede clasificarlos fácilmente en una pila ordenada de cuatro. Repitiendo
este truco unas cuantas veces, construirías pilas cada vez más grandes, cada una de las
ellos ya ordenados. Muy pronto, podría recopilar una perfecta
baraja completa ordenada, con una fusión climática final, como el orden de un riffle shuffle,
creando gemelo, produciendo el resultado deseado.
Este enfoque se conoce hoy como Mergesort , uno de los legendarios
algoritmos en informática. Como lo expresó un artículo de 1997, "Mergesort es tan
importante en la historia de la clasificación como clasificación en la historia de la informática ".
El poder de Mergesort proviene del hecho de que, de hecho, termina con
una complejidad entre el tiempo lineal y cuadrático, específicamente, O ( n log n ),
conocido como tiempo "linealítmico". Cada pasada a través de las cartas duplica el tamaño
de las pilas ordenadas, por lo que para ordenar completamente n cartas tendrá que hacer como
tantas pasadas como sea necesario para que el número 2, multiplicado por sí mismo, sea igual a n : el
logaritmo en base dos, en otras palabras. Puede clasificar hasta cuatro cartas en dos
pases de clasificación, hasta ocho tarjetas con un tercer pase y hasta dieciséis tarjetas
con un cuarto. El enfoque de dividir y conquistar de Mergesort inspiró una serie de
otros algoritmos de clasificación lineal que le siguieron rápidamente. Y
decir que la complejidad linealitmica es una mejora en la cuadratica
la complejidad es una subestimación titánica. En el caso de clasificar, digamos, un censo
nivel de elementos, es la diferencia entre hacer veintinueve
pasa a través de su conjunto de datos ... y trescientos millones. No es de extrañar que sea
el método de elección para problemas de clasificación industrial a gran escala.
Mergesort también tiene aplicaciones reales en la clasificación doméstica a pequeña escala
problemas. Parte de la razón por la que se usa tan ampliamente es que puede ser fácilmente
Página 90
paralelizado. Si todavía está elaborando una estrategia sobre esa estantería, el Mergesort
La solución sería pedir una pizza e invitar a algunos amigos. Dividir el
libros de manera uniforme, y haga que cada persona clasifique su propia pila. Entonces empareja person
y haga que fusionen sus pilas. Repita este proceso hasta que solo queden
Quedan dos pilas y fusionarlas una última vez en el estante. Solo intenta
evite dejar manchas de pizza en los libros.
Un Mergesort en acción. Dado un estante de ocho libros sin clasificar, comience colocando los libros adyacentes en
pares ordenados. Luego, coteje los pares en conjuntos ordenados de cuatro y, finalmente, coteje esos conjuntos para obtener un
estante completamente clasificado.
El Preston Sort Center es uno de los centros de reserva más grandes y eficientes.
instalaciones de clasificación en el mundo. Está administrado por el Sistema de Bibliotecas del Condado d
que ha comenzado una sana rivalidad con el Nueva York igualmente equipado
Biblioteca pública, con el título yendo y viniendo más de cuatro
años disputados. "¿La biblioteca del condado de King nos está ganando este año?" dijo el
El subdirector de BookOps de NYPL, Salvatore Magaddino, antes del 2014
confrontación. "Fuhgeddaboutit".
Hay algo particularmente impresionante en el Preston Sort Center
también desde el punto de vista de un teórico. Los libros que pasan por su sistema
se ordenan en O ( n ): tiempo lineal.
En un sentido importante, el tiempo linealitmico O ( n log n ) ofrecido por
Mergesort es realmente lo mejor que podemos esperar lograr. Se ha comprobado que si
queremos ordenar completamente n elementos a través de una serie de comparaciones directas,
simplemente no hay forma de compararlos menos de O ( n log n ) veces. Es un
ley fundamental del universo, y no hay dos formas de evitarlo.
Pero esto, estrictamente hablando, no cierra el libro sobre la clasificación. Porque
a veces no necesita un conjunto completamente ordenado y, a veces, la clasificación puede
hacerse sin ninguna comparación de artículo a artículo. Estos dos principios,
tomados en conjunto, permiten tipos prácticos aproximados en más rápido que linealithmic
Página 93
tiempo. Esto está bellamente demostrado por un algoritmo conocido como Bucket
Sort, del cual el Preston Sort Center es una ilustración perfecta.
En Bucket Sort, los elementos se agrupan en una serie de
categorías, sin tener en cuenta la clasificación intracategoría más fina; que puede venir
más tarde. (En ciencias de la computación, el término "cubo" simplemente se refiere a un
datos sin clasificar, pero algunos de los usos más poderosos del mundo real de Bucket
Ordene, como en KCLS, tome el nombre completamente literalmente.) Aquí está el truco: si
desea agrupar n elementos en m cubos, la agrupación se puede hacer en
O ( nm ) tiempo: es decir, el tiempo es simplemente proporcional al número de elementos
multiplicado por la cantidad de cubos. Y siempre que el número de cubos sea
relativamente pequeño en comparación con el número de elementos, la notación Big-O
redondea eso a O ( n ), o tiempo lineal.
La clave para romper realmente la barrera linealítmica es conocer el
distribución de la que se extraen los elementos que está ordenando. Mal elegido
los baldes te dejarán un poco mejor que cuando empezaste; si todos los libros
terminan en el mismo contenedor, por ejemplo, no ha progresado en absoluto.
Sin embargo, los cubos bien elegidos dividirán sus artículos en aproximadamente
grupos de tamaño, que, dada la naturaleza fundamental de "daño de escala" de la clasificación, es
un gran paso hacia una especie completa. En el Preston Sort Center, cuyo trabajo es
ordenar los libros por su rama de destino, en lugar de alfabéticamente, el
La elección de los cubos depende de las estadísticas de circulación. Algunas ramas tienen
mayor volumen de circulación que otros, por lo que pueden tener dos contenedores asignados
para ellos, o incluso tres.
Un conocimiento similar del material también es útil para los clasificadores humanos. Para
ver a los expertos en clasificación en acción, hicimos un viaje de campo a Doe de UC Berkeley y
Bibliotecas Moffitt, donde hay no menos de cincuenta y dos millas de
estanterías para mantener en orden, y todo se hace a mano. Libros devueltos a
la biblioteca se coloca primero en un área detrás de escena, asignada a estantes
designado por los números de llamada de la Biblioteca del Congreso. Por ejemplo, un conjunto de
los estantes contienen un revoltijo de todos los libros devueltos recientemente con la llamada
números PS3000 – PS9999. Luego, los estudiantes asistentes cargan esos libros en
carros, colocando hasta 150 libros en el orden correcto para que puedan ser devueltos a la
estantes de la biblioteca. Los estudiantes reciben una formación básica en clasificación, pero desarrollan
Página 94
sus propias estrategias a lo largo del tiempo. Después de un poco de experiencia, pueden ordenar un
carro de 150 libros en menos de 40 minutos. Y gran parte de esa experiencia
implica saber qué esperar.
Jordan Ho, estudiante de Berkeley, estudiante de química y clasificador de estrellas,
nos habló a través de su proceso mientras atravesaba una impresionante pila de
libros en los estantes de PS3000 – PS9999:
Sé por experiencia que hay muchos 3500, así que quiero buscar cualquier libro que sea
por debajo de 3500 y clasifíquelos de forma aproximada. Y una vez que hago eso, los clasifico más finamente. Después de que yo
ordenar los que están por debajo de 3500, sé que 3500 en sí es una sección grande (3500–3599), así que quiero hacer
que una sección en sí. Si hay muchos de esos, me gustaría afinarlo aún más: 3510s,
3520, 3530.
Conocer todos estos algoritmos de clasificación debería ser útil la próxima vez que
decida ordenar alfabéticamente su estantería. Como el presidente Obama, lo sabrás
no utilizar Bubble Sort. En cambio, una buena estrategia, ratificada por humanos y
bibliotecarios de máquinas por igual: es ordenar por cubos hasta que se reduzca a
montones suficientes para que Insertion Sort sea razonable, o para tener una pizza Mergesort
partido.
Pero si realmente le pidiera a un científico informático que lo ayudara a implementar esto
proceso, la primera pregunta que harían es si debería ordenar
en absoluto.
La informática, como se enseña a los estudiantes universitarios, se trata de compensaciones.
Ya hemos visto esto en las tensiones entre mirar y saltar,
entre explorar y explotar. Y una de las compensaciones más importantes es
entre ordenar y buscar . El principio básico es este: el esfuerzo
Página 95
Página 96
Es posible que su estantería sin clasificar no sea una preocupación cotidiana, pero
es casi seguro que su bandeja de entrada de correo electrónico lo sea, y es otro dominio donde
buscar es mejor que clasificar cómodamente. Archivar mensajes electrónicos a mano en
carpetas toma aproximadamente la misma cantidad de tiempo que archivar documentos físicos en el
mundo real, pero los correos electrónicos se pueden buscar de manera mucho más eficiente que sus
contrapartes físicas. A medida que disminuye el costo de búsqueda, la clasificación se reduce
valioso.
Steve Whittaker es uno de los expertos mundiales en cómo las personas manejan sus
Email. Científico investigador en IBM y profesor en UC Santa Cruz,
Whittaker, durante casi dos décadas, ha estado estudiando cómo las personas manejan
informacion personal. (Escribió un artículo sobre la "sobrecarga de correo electrónico" en 1996,
antes de que muchas personas tuvieran correo electrónico.) En 2011, Whittaker dirigió un estudio de
los hábitos de búsqueda y clasificación de los usuarios de correo electrónico, lo que dio como resultado u
¿Perdiendo mi tiempo organizando el correo electrónico? Alerta de spoiler: la conclusión fue una
enfático Sí . "Es empírico, pero también experiencial", señala Whittaker.
fuera. "Cuando entrevisto a personas sobre este tipo de organización
problemas, eso es algo de lo que suelen hablar, es que
en cierto modo desperdiciaron una parte de su vida ".
La informática muestra que los peligros del desorden y los peligros de
orden son cuantificables y que sus costos se pueden medir en el mismo
moneda: tiempo. Dejar algo sin clasificar podría considerarse un acto
de procrastinación: pasar la pelota al yo futuro, que tendrá que pagar
con intereses lo que decidimos no pagar por adelantado. Pero toda la historia es
más sutil que eso. A veces, el desorden es más que una simple elección. Es el
elección óptima.
Clases y deportes
La compensación de ordenación por búsqueda sugiere que a menudo es más eficiente dejar un
desorden. Sin embargo, ahorrar tiempo no es la única razón por la que ordenamos las cosas: a veces
producir un pedido final es un fin en sí mismo. Y en ninguna parte es más claro que
en el campo deportivo.
Página 97
En un torneo de tenis sobre hierba, donde tuve la oportunidad, hace algún tiempo, de ser un espectador, el presente
El método de asignación de premios me fue informado por las lamentaciones de uno de los Jugadores,
que había sido derrotado (y por lo tanto había perdido toda posibilidad de un premio) al principio del concurso, y que había
tuvo la mortificación de ver el segundo premio arrebatado por un jugador que sabía que era bastante
inferior a él.
Página 98
los 4 mejores obtendrán sus premios adecuados es tan pequeño, que las probabilidades son de 12 a 1
en contra de que suceda! "
A pesar de los poderes de su pluma, parece que Dodgson tuvo poco impacto
en el mundo del tenis sobre hierba. Su solución, una incómoda versión de triple
eliminación donde la derrota de alguien que te había derrotado también podría
eliminarte, nunca me di cuenta. Pero si la solución de Dodgson fuera
engorroso, su crítica del problema fue, sin embargo, acertada. (Pobre de mí,
Las medallas de plata todavía se están entregando en los torneos de eliminación individual.
para este día.)
Pero también hay una visión más profunda de la lógica de Dodgson. Nosotros los humanos clasificamo
más que nuestros datos, más que nuestras posesiones. Nos clasificamos nosotros mismos .
La Copa del Mundo, los Juegos Olímpicos, la NCAA, NFL, NHL, NBA y MLB
—Todos estos implementan implícitamente procedimientos de clasificación. Sus estaciones,
las escaleras y los playoffs son algoritmos para producir el orden de clasificación.
Uno de los algoritmos más familiares en los deportes es el Round-Robin.
formato, donde cada uno de n equipos finalmente juega contra todos los otros n - 1
equipos. Si bien podría decirse que es el más completo, también es uno de los más
laborioso. Tener a todos los equipos lidiando con todos los demás es como tener
Los invitados intercambian abrazos en nuestra cena: la temida O ( n 2 ), tiempo cuadrático.
Torneos de escaleras : populares en deportes como bádminton, squash y
Ráquetbol: coloque a los jugadores en una clasificación lineal, con cada jugador permitido
emitir un desafío directo al jugador inmediatamente encima de ellos, intercambiando
lugares si prevalecen. Las escaleras son las clases de burbujas del mundo atlético y
por lo tanto, también son cuadráticas, lo que requiere que los juegos O ( n 2 ) alcancen una clasificación e
Quizás el formato de torneo más común, sin embargo, es un paréntesis.
torneo, como en el famoso baloncesto de la NCAA "March Madness", entre
muchos otros. El torneo March Madness avanza desde la “Ronda
de 64 "y la" Ronda de 32 "hasta el" Sweet 16 "," Elite Eight "," Final
Cuatro ”y la final. Cada ronda divide el campo por la mitad: ¿suena eso?
familiarmente logarítmico? Estos torneos son efectivamente Mergesort,
comenzando con pares de equipos no clasificados y cotejando, cotejando, cotejando
ellos.
Página 99
Página 100
Por ejemplo, en las Grandes Ligas, a menudo tienes carreras para ver quién va a ganar la
división. Ahora, si ignoramos la configuración divisional, algunas de esas carreras podrían resolverse de manera justa.
temprano en la temporada. Pero, en cambio, lo que hacemos es asegurarnos de que en las últimas cinco semanas,
todos juegan con todos los demás dentro de su división. El propósito de eso es que no importa
que está en una carrera divisional: tendrán que enfrentarse a su próximo oponente más cercano al menos seis
juegos en las últimas cinco semanas de la temporada. Eso permite un mayor interés en el horario o
interés en la temporada porque en este caso, la incertidumbre se retrasa en su resolución.
Otra forma, quizás incluso más importante, de entrenar una lente algorítmica
en el deporte es preguntar no qué confianza debemos tener en la medalla de plata,
pero qué confianza debemos tener en el oro .
Como explica Michael Trick, en algunos deportes, "por ejemplo, el béisbol, un equipo
va a perder el 30% de sus juegos y un equipo va a ganar el 30% de sus juegos
Página 101
juegos prácticamente sin importar quiénes sean ". Esto tiene implicaciones inquietantes
para el formato de Eliminación Única. Si los juegos de baloncesto de la NCAA, digamos, se ganan
por el equipo más fuerte el 70% del tiempo, y ganar el torneo implica
prevaleciendo en 6 juegos seguidos, entonces el mejor equipo tiene solo un 0,70 al 6
poder, menos del 12%, ¡posibilidades de ganar el torneo! Pon otro
De esta manera, el torneo coronaría al mejor equipo de la liga solo una vez al año.
década.
Puede ser que en algunos deportes, tener incluso un 70% de confianza en la
El resultado podría ser poner demasiado valor en la puntuación final. UCSD
El físico Tom Murphy aplicó técnicas de modelado numérico al fútbol.
y concluyó que los bajos puntajes del fútbol hacen que los resultados del juego estén mucho más cerca
al azar de lo que la mayoría de los fanáticos preferirían imaginar. "Una puntuación de 3: 2 da
equipo ganador solo una posibilidad de 5 en 8 de ser realmente un mejor equipo ...
Personalmente, esto no me parece muy impresionante. Incluso un reventón de 6: 1
deja un 7% de probabilidad de que haya sido una casualidad estadística ".
Los científicos informáticos llaman a este fenómeno ruido . Toda la clasificación
algoritmos que hemos considerado hasta ahora suponen perfecto, impecable,
comparaciones infalibles, que nunca estropean y juzgan erróneamente el
menor de dos cantidades es mayor. Una vez que permita una "ruidosa
comparador ", algunos de los algoritmos más consagrados de la informática se publican
la ventana, y algunos de los más difamados tienen su día de redención.
Dave Ackley, profesor de informática en la Universidad de New
México, trabaja en la intersección de la informática y la "vida artificial" -
él cree que las computadoras pueden soportar aprender algunas cosas de la biología. Para
principiantes, los organismos viven en un mundo donde pocos procesos tienen cerca
el nivel de confiabilidad del que dependen las computadoras, por lo que se construyen a partir del
molido para lo que los investigadores llaman robustez . Es hora, argumenta Ackley,
que también comenzamos a reconocer las virtudes de la robustez en los algoritmos.
Por lo tanto, mientras que el tomo de programación autorizada Ordenación y búsqueda
declara audazmente que "el tipo de burbuja no tiene características redimidoras aparentes", el
La investigación de Ackley y sus colaboradores sugiere que puede haber un lugar
para algoritmos como Bubble Sort después de todo. Su misma ineficiencia: moverse
elementos solo en una posición a la vez, lo hace bastante resistente contra el ruido, lejos
Página 102
más robusto que los algoritmos más rápidos como Mergesort, en el que cada
la comparación potencialmente mueve un elemento en gran medida. Mergesort es muy
la eficiencia lo hace quebradizo. Un error temprano en un Mergesort es como una pérdida fortuita
en la primera ronda de un torneo de Eliminación Única, que no solo puede
arruinar las esperanzas de campeonato de un equipo favorito, pero también relegar permanentemente
a la mitad inferior de los resultados. * En un torneo Ladder, por otro
mano, como en un Bubble Sort, una pérdida fortuita solo haría retroceder a un jugador una
lugar en la clasificación.
Pero, de hecho, no es Bubble Sort lo que surge como el mejor algoritmo
ante un comparador ruidoso. El ganador de ese honor en particular es un
algoritmo denominado Clasificación de recuento de comparación . En este algoritmo, cada elemento
se compara con todos los demás, generando un recuento de cuántos elementos es
más grande que. Este número se puede utilizar directamente como clasificación del artículo. Ya que
compara todos los pares, el ordenamiento de recuento de comparación es un tiempo cuadrático
algoritmo, como Bubble Sort. Por lo tanto, no es una opción popular en los
aplicaciones informáticas, pero es excepcionalmente tolerante a fallos.
El funcionamiento de este algoritmo debería sonar familiar. Recuento de comparación
Sort funciona exactamente como un torneo Round-Robin. En otras palabras,
se parece mucho a la temporada regular de un equipo deportivo, jugando todos los demás
equipo en la división y construyendo un récord de victorias y derrotas por el cual son
clasificado.
Esa clasificación de recuento de comparación es la clasificación más sólida
algoritmo conocido, cuadrático o mejor, debería ofrecer algo muy específico
para los fanáticos del deporte: si su equipo no llega a los playoffs, no se queje. los
La postemporada de Mergesort es arriesgada, pero el recuento de comparación regular
la temporada no lo es; Los anillos de campeonato no son robustos, pero la clasificación divisional es
literalmente tan robusto como sea posible. Dicho de otra manera, si su equipo es eliminado temprano
en la postemporada, es mala suerte. Pero si su equipo no logra llegar al
postemporada, es la dura verdad. Puede obtener simpatía del bar deportivo de su
otros fanáticos decepcionados, pero no obtendrás ninguno de un científico informático.
Página 103
En todos los ejemplos que hemos considerado hasta ahora, el proceso de clasificación en cada
El caso se ha impuesto de arriba hacia abajo: un bibliotecario colocando libros, el
La NCAA les dice a los equipos contra quién jugar y cuándo. Pero, ¿y si cara a cara?
las comparaciones ocurrieron solo de manera voluntaria? ¿Cómo se ve la clasificación cuando
emerge orgánicamente, de abajo hacia arriba?
Puede parecerse al póquer en línea.
A diferencia de la mayoría de los deportes, que se rigen por un organismo rector de algún tipo,
El póquer sigue siendo algo anárquico a pesar de la explosión en popularidad durante el
decada pasada. Aunque algunos torneos de alto perfil clasifican explícitamente sus
concursantes (y remunerarlos en consecuencia), una parte sustancial de
El póquer todavía se juega en lo que se conoce como "juegos de dinero", donde dos o más
los jugadores aceptan espontáneamente jugar con dinero real en la línea con cada
mano.
Prácticamente nadie conoce este mundo más profundamente que Isaac Haxton, uno
de los mejores jugadores de póquer de cash-game del mundo. En la mayoría de los deportes es suficiente
Ser lo mejor posible, y el menos consciente de sí mismo es acerca de sus habilidades.
el mejor. Pero, explica Haxton, "en cierto modo, la habilidad más importante como
un jugador de póquer profesional debe poder evaluar lo bueno que eres. Si
eres cualquier cosa menos que el mejor jugador de póquer del mundo, puedes ser
bastante seguro de ir a la quiebra si estás infinitamente dispuesto a jugar
gente mejor que tú ".
Haxton es un especialista en heads-up, sin límites: "heads-up" significa uno contra
un póquer, y "sin límite" significa solo eso: las apuestas más altas, limitadas
sólo por lo que pueden financiar y soportar. En efectivo de póquer para múltiples manos
juegos, a menudo habrá un jugador débil: un aficionado adinerado, para
ejemplo: alimentar una mesa llena de profesionales, a quienes no les importa mucho
quién de ellos es mejor que quién. En el mundo del heads-up, es
diferente. "Tiene que haber un desacuerdo entre usted y ellos sobre
quién es mejor, o alguien tiene que perder voluntariamente ".
Entonces, ¿qué sucede cuando hay un consenso bastante establecido y no
¿Está dispuesto a interpretar a alguien mejor que ellos? Obtienes algo que
se parece mucho a los jugadores que simplemente compiten por asientos. La mayoría de los sitios de póq
tener solo un número finito de tablas disponibles. "Así que si quieres jugar a la cabeza-
Página 104
sin límite, con ciegas de cincuenta y cien dólares, solo hay diez
tablas disponibles para eso ", dice Haxton," por lo que sólo el consenso diez mejores
jugadores que están fuera en este momento ... sentarse y esperar a que aparezca alguien que
quiere jugar." Y si llega un jugador superior y se sienta en uno de los
estas tablas? Si la persona sentada no está dispuesta a apostar, se largará.
“Imagínense dos monos”, dice Christof Neumann. "Uno está sentado y
alimentándose en su lugar, muy pacíficamente, y otro se acerca [a] donde
el otro chico está sentado. Y ese tipo luego se levantaba y se iba ".
Neumann no está haciendo una metáfora del póquer. Es un biólogo conductual en
la Universidad de Neuchâtel que estudia la dominancia en macacos. Que es
recién descrito se conoce como desplazamiento .
El desplazamiento ocurre cuando un animal usa su conocimiento de la
jerarquía para determinar que una confrontación en particular simplemente no vale la pena.
En muchas sociedades animales, los recursos y las oportunidades: comida, parejas,
espacios preferidos, etc., son escasos, y de alguna manera debe decidirse
quién obtiene qué. Establecer un orden con anticipación es menos violento que
llegando a los golpes cada vez que una oportunidad de apareamiento o un lugar privilegiado de hierba
se vuelve disponible. Aunque podamos encogernos cuando veamos a las criaturas girando
sus garras y picos entre sí, los biólogos tienden a pensar en picotear
órdenes como la violencia que se adelanta a la violencia.
¿Suena familiar? Es el intercambio de búsqueda y ordenación.
La creación de un orden jerárquico es una solución pugilística a un
problema fundamentalmente computacional . Por eso, dicho sea de paso,
deshuesar pollos en granjas puede ser una buena intención, pero
enfoque contraproducente: elimina la autoridad de las luchas individuales para
resolver el orden y, por lo tanto, hace que sea mucho más difícil para el rebaño correr
cualquier procedimiento de clasificación. Entonces, la cantidad de antagonismo dentro del rebaño
en muchos casos realmente aumenta.
Observando el comportamiento animal desde la perspectiva de la informática
sugiere varias cosas. Por un lado, implica que el número de hostiles
Las confrontaciones encontradas por cada individuo crecerán sustancialmente, en
al menos logarítmicamente, y quizás cuadráticamente, a medida que el grupo crece.
De hecho, los estudios de "comportamiento agonista" en gallinas han encontrado que "agresivo
Página 105
actos por gallina aumentaron a medida que aumentaba el tamaño del grupo ". Clasificando la teoría así
sugiere que la crianza ética de ganado puede incluir la limitación del tamaño de
el rebaño o la manada. (En la naturaleza, los pollos salvajes deambulan en grupos de diez a
veinte, mucho más pequeño que el tamaño de las parvadas en las granjas comerciales).
mostrar que la agresión parece desaparecer después de un período de algunas semanas,
a menos que se agreguen nuevos miembros al rebaño, lo que corrobora la idea de que el
el grupo se está ordenando a sí mismo.
La clave para pensar en la ordenación descentralizada en la naturaleza, argumenta Jessica
Flack, codirector del Centro de Complejidad y Computación Colectiva
en UW-Madison, es que las jerarquías de dominio son, en última instancia, información
jerarquías. Hay una carga computacional significativa para estos
sistemas de clasificación descentralizados, señala Flack. El número de peleas en,
digamos, un grupo de macacos se minimiza solo en la medida en que cada mono
tiene una comprensión detallada, y similar, de la jerarquía. De lo contrario
sobrevendrá la violencia.
Si se trata de lo buenos que son los protagonistas para hacer un seguimiento de
el orden actual, podríamos esperar ver menos confrontaciones como animales
ser más capaz de razonar y recordar. Y tal vez los humanos vengan
lo más cercano a una clasificación óptimamente eficiente. Como dice Haxton sobre el mundo del póquer,
"Soy uno de los mejores jugadores de heads-up, no-limit hold 'em del mundo, y en
en mi cabeza tengo una clasificación bastante específica de quiénes creo que son los veinte mejores
los jugadores son, y creo que cada uno de ellos tiene una clasificación similar en su mente. I
creo que hay un alto grado de consenso sobre el aspecto de la lista
igual que." Solo cuando estas clasificaciones difieran, se producirán los juegos de efectivo.
Ahora hemos visto dos inconvenientes separados del deseo de cualquier grupo de clasificar
sí mismo. Tienes, como mínimo, un número linealítmico de enfrentamientos,
haciendo que la vida de todos sea más combativa a medida que el grupo crece, y también
obligar a todos los competidores a realizar un seguimiento del estado en constante cambio de todos
de lo contrario, de lo contrario, se encontrarán librando batallas que no necesitaban. Eso
grava no sólo el cuerpo sino también la mente.
Página 106
Página 107
Página 108
*Esto está lejos del único registro de Bradáč: puede escapar de tres pares de esposas mientras
bajo el agua en aproximadamente la misma cantidad de tiempo.
Página 110
*En realidad, el tiempo promedio de ejecución de Bubble Sort no es mejor, ya que los libros, en promedio, serán
n / 2 posiciones lejos de donde se supone que deben terminar. Un científico informático todavía redondeará n / 2
pasa de n libros hasta O ( n 2 ).
Página 111
*En raras ocasiones, como en el boxeo, donde no es seguro desde el punto de vista médico que un boxeador vuelva a pelear después de haber sido
recientemente eliminado, en su lugar se otorgan dos bronces.
Página 112
*Es interesante notar que el torneo March Madness de la NCAA está diseñado conscientemente para mitigar
esta falla en su algoritmo. El mayor problema de la eliminación simple, como hemos dicho, parece
ser un escenario en el que el primer equipo que sea eliminado por el equipo ganador sea en realidad el segundo
mejor equipo en general, pero aterriza en la mitad inferior (sin clasificar). La NCAA soluciona esto sembrando
los equipos, de modo que los equipos mejor clasificados no puedan encontrarse en las primeras rondas. El proceso de siembra
parece ser confiable al menos en el caso más extremo, ya que un equipo decimosexto nunca ha derrotado
una primera semilla en la historia de March Madness.
Página 113
4 Almacenamiento en caché
Olvídalo
Página 114
Aparte del problema de clasificación que esto podría implicar, parece un buen consejo; eso
ciertamente parece unánime.
Excepto que hay otra industria más grande de profesionales que también
piensan obsesivamente en el almacenamiento y tienen sus propias ideas.
Tu armario presenta el mismo desafío al que se enfrenta una computadora
a la hora de gestionar su memoria: el espacio es limitado y el objetivo es salvar tanto
dinero y tiempo. Desde que ha habido computadoras, la computadora
Los científicos han lidiado con el problema dual de qué conservar y cómo
Arréglalo. Los resultados de estas décadas de esfuerzo revelan que en sus cuatro
consejos de frases sobre qué lanzar, Martha Stewart en realidad hace varios
recomendaciones diferentes y no totalmente compatibles, una de las cuales es
mucho más crítico que los demás.
La informática de la gestión de la memoria también revela exactamente cómo
su armario (y su oficina) debe estar arreglado. A primera vista,
las computadoras parecen seguir la máxima de Martha Stewart de "agrupar como
cosas juntos." Los sistemas operativos nos animan a poner nuestros archivos en
carpetas, como con like, formando jerarquías que se ramifican a medida que su contenido
llegar a ser cada vez más específico. Pero al igual que la pulcritud del escritorio de un erudito puede
ocultar el desorden de su mente, también lo hace la aparente pulcritud de un
El sistema de archivos de la computadora oscurece el caos altamente diseñado de cómo se procesan los d
en realidad se almacena debajo del revestimiento de la carpeta anidada.
Lo que realmente está sucediendo se llama almacenamiento en caché .
El almacenamiento en caché juega un papel fundamental en la arquitectura de la memoria, y
subyace en todo, desde el diseño de los chips del procesador al milímetro
escala a la geografía de Internet global. Ofrece una nueva perspectiva sobre
todos los diversos sistemas de almacenamiento y bancos de memoria de la vida humana, no solo
nuestras máquinas, pero también nuestros armarios, nuestras oficinas, nuestras bibliotecas. Y nuestras c
La jerarquía de la memoria
Página 116
Página 117
lo que significa que, en relación con el tiempo de procesamiento, el costo de acceder a la memoria
también está aumentando exponencialmente. Cuanto más rápido pueda escribir sus artículos,
Por ejemplo, mayor es la pérdida de productividad de cada viaje a la biblioteca.
Del mismo modo, una fábrica que duplica su velocidad de fabricación cada año, pero tiene
el mismo número de piezas enviadas desde el extranjero con la misma lentitud
ritmo, significará poco más que una fábrica que está dos veces más inactiva. Por un tiempo
Parecía que la Ley de Moore estaba rindiendo poco, excepto procesadores que
jugueteaban con los pulgares cada vez más rápido y cada vez más. En la década de 1990
esto comenzó a conocerse como el "muro de la memoria".
La mejor defensa de la informática contra chocar contra ese muro ha sido una
jerarquía cada vez más elaborada: cachés para cachés para cachés, hasta el final
abajo. Las computadoras portátiles, tabletas y teléfonos inteligentes de consumo modernos tienen en el
orden de una jerarquía de memoria de seis capas, y la gestión de la memoria de manera inteligente ha
nunca ha sido tan importante para la informática como lo es hoy.
Así que comencemos con la primera pregunta que me viene a la mente sobre los cachés (o
armarios, para el caso). ¿Qué hacemos cuando se llenan?
Desalojo y clarividencia
Puede estar seguro de que llega un momento en que por cada adición de
conocimiento olvidas algo que sabías antes. Es del
Por tanto, es de suma importancia no dejar que los hechos inútiles se escapen
los útiles.
-SHERLOCK HOLMES
Página 118
Página 119
todas esas ocasiones en las que estamos atrapados firmemente en el presente y solo podemos adivinar
lo que nos espera.
Podríamos probar el desalojo aleatorio , agregando nuevos datos a la caché y
sobrescribir datos antiguos al azar. Uno de los primeros resultados sorprendentes en el almacenamiento
La teoría es que, aunque está lejos de ser perfecto, este enfoque no es tan malo. Como lo
sucede, el simple hecho de tener una caché hace que un sistema sea más eficiente,
independientemente de cómo lo mantenga. Los elementos que usas con frecuencia volverán a aparecer
el caché pronto de todos modos. Otra estrategia simple es Primero en entrar, primero en salir
( FIFO ), donde desaloja o sobrescribe lo que haya estado en el caché
el más largo (como en la pregunta de Martha Stewart “¿Cuánto tiempo lo tengo?”). A
El tercer enfoque es el menos usado recientemente ( LRU ): desalojar el artículo que se ha ido
el más largo sin tocar (Stewart's "¿Cuándo fue la última vez que lo usé o usé
¿eso?").
Resulta que estos dos mantras de Stewart no solo sugieren muy
políticas diferentes, una de sus sugerencias supera claramente a la otra.
Bélády comparó el desalojo aleatorio, FIFO y variantes de LRU en un
cantidad de escenarios y descubrió que LRU realizaba consistentemente el más cercano
a la clarividencia. El principio LRU es efectivo por algo
los informáticos llaman "localidad temporal": si un programa ha solicitado un
información en particular una vez, es probable que vuelva a hacerlo en los próximos
futuro. La localidad temporal resulta en parte de la forma en que las computadoras resuelven
problemas (por ejemplo, ejecutar un bucle que hace una serie rpida de
lee y escribe), pero también surge en la forma en que las personas resuelven problemas. Si
está trabajando en su computadora, es posible que esté cambiando entre sus
correo electrónico, un navegador web y un procesador de textos. El hecho de que accediste a uno
de estos recientemente es una pista de que es probable que lo vuelva a hacer, y todas las cosas
en igualdad de condiciones, el programa que no ha estado usando durante más tiempo es
también probablemente el que no se utilizará durante algún tiempo.
De hecho, este principio está incluso implícito en la interfaz que las computadoras
mostrar a sus usuarios. Las ventanas de la pantalla de tu computadora tienen lo que
llamado "orden Z", una profundidad simulada que determina qué programas se
superpuesto sobre el cual. Los que se han usado menos recientemente terminan en la parte inferior. Com
exlíder creativo de Firefox, Aza Raskin, dice: "Gran parte de tu tiempo
Página 120
Página 121
Página 122
“De hecho, hicimos un mapa del país, a una escala de una milla al
¡milla!"
"¿Lo has usado mucho?" Pregunté.
“Todavía no se ha extendido”, dijo Mein Herr: “los agricultores
objetó: dijeron que cubriría todo el país, y cerraría el
¡luz del sol! Así que ahora usamos el país en sí, como su propio mapa, y les aseguro
usted lo hace casi tan bien ".
-LEWIS CARROLL
A menudo pensamos en Internet como una plataforma plana, independiente y débilmente conectada.
la red. De hecho, no es ninguna de esas cosas. Una cuarta parte de todo el tráfico de Internet en
presente es manejado por una sola corporación, una que logra mantenerse casi
Página 123
completamente fuera de los titulares. Esta empresa con sede en Massachusetts se llama
Akamai, y están en el negocio del almacenamiento en caché.
También pensamos en Internet como abstracto, desmaterial, posgeográfico.
Nos dicen que nuestros datos están "en la nube", lo que sugiere una
lugar distante. Nuevamente, ninguno de estos es cierto. La realidad es que Internet está
todo sobre haces de cables físicos y estantes de metal. Y es mucho mas
estrechamente vinculado a la geografía de lo que cabría esperar.
Los ingenieros piensan en la geografía a pequeña escala cuando diseñan
hardware de la computadora: la memoria más rápida generalmente se coloca más cerca del procesador,
minimizando la longitud de los cables por los que tiene que viajar la información.
Los ciclos del procesador de hoy se miden en gigahercios, es decir, son
realizar operaciones en fracciones de nanosegundos. Como referencia, esa es la
el tiempo que tarda la luz en viajar unos centímetros , por lo que el diseño físico de un
Los componentes internos de la computadora son una gran preocupación. Y aplicando lo mismo
principio a una escala dramáticamente mayor, la geografía real resulta ser
crítico para el funcionamiento de la red, donde los cables no se extienden en pulgadas sino
potencialmente miles de millas.
Si puede crear una caché de contenido de la página web físicamente,
geográficamente más cerca de las personas que lo desean, puede publicar esas páginas
más rápido. Gran parte del tráfico en Internet ahora se gestiona mediante "contenido
redes de distribución ”(CDN), que tienen computadoras en todo el mundo
que mantienen copias de sitios web populares. Esto permite a los usuarios que soliciten
páginas para obtener sus datos de una computadora cercana, sin tener que
hacer el viaje largo a través de continentes hasta el servidor original.
Akamai gestiona el mayor de estos CDN: proveedores de contenido
pagar para que sus sitios web sean "Akamaized" para un mejor rendimiento. Un
Australiano que transmite videos de la BBC, por ejemplo, probablemente sea
llegar a los servidores locales de Akamai en Sydney; la solicitud nunca llega a
Londres en absoluto. No tiene por qué ser así. Dice el arquitecto jefe de Akamai, Stephen
Ludin, “Creemos, y construimos la empresa en torno al hecho, de que
la distancia importa ".
En nuestra discusión anterior, notamos que ciertos tipos de computadora
la memoria tiene un rendimiento más rápido pero cuesta más por unidad de almacenamiento, lo que
Página 124
Página 125
cada uno de esos estados. Resultó que, abrumadoramente, a la gente le encanta mirar
películas ambientadas donde viven. Los habitantes de Washington prefieren Singles , ambientada en Sea
Los habitantes de Louisiana ven The Big Easy , ambientado en Nueva Orleans; Angelinos
como era de esperar, disfrutar de LA Story ; Los habitantes de Alaska aman Braving Alaska ; y
Montañeses, Montana Sky . * Y porque nada beneficia tanto
del almacenamiento en caché local como los enormes archivos que componen HD de larga duración
video, es seguro que Netflix lo ha organizado para que los archivos de, digamos, LA Story
vive en Los Ángeles, al igual que sus personajes y, lo que es más importante, su
aficionados.
Si bien el almacenamiento en caché comenzó como un esquema para organizar la información digital de
computadoras, está claro que es igualmente aplicable a la organización física
objetos en entornos humanos. Cuando hablamos con John Hennessy:
presidente de la Universidad de Stanford, y un arquitecto informático pionero que
ayudó a desarrollar sistemas de almacenamiento en caché modernos; inmediatamente vio el vínculo:
El almacenamiento en caché es algo tan obvio porque lo hacemos todo el tiempo. Quiero decir, la cantidad de
información que obtengo ... ciertas cosas de las que tengo que hacer un seguimiento en este momento, un montón de cosas que tengo
en mi escritorio, y luego otras cosas se archivan, y finalmente se archivan en el
sistema de archivos de la universidad donde se necesita un día entero para sacar cosas de él si quiero. Pero nosotros
utilizamos esa técnica todo el tiempo para tratar de organizar nuestras vidas.
Página 126
en los esquemas que las personas reales describen como que funcionan bien para ellos. "I
seguir corriendo y hacer ejercicio en una caja en el piso de mi chaqueta
armario ", dice una persona citada en Organizing from the
Inside Out , por ejemplo. "Me gusta tenerlo cerca de la puerta de entrada".
Un ejemplo un poco más extremo aparece en el libro Keeping Found
Cosas encontradas , de William Jones:
Un médico me habló de su enfoque para guardar las cosas. "Mis hijos piensan que soy un chiflado, pero yo pongo
cosas en las que creo que las necesitaré de nuevo más tarde, incluso si no tiene mucho sentido ". Como un
ejemplo de su sistema, me dijo que guarda bolsas de aspiradora adicionales detrás del sofá
en la sala de estar. ¿Detrás del sofá de la sala de estar? ¿Eso tiene algún sentido? ... Se vuelve
Destaca que cuando se usa la aspiradora, generalmente se usa para la alfombra en la sala de estar.…
Cuando la bolsa de una aspiradora se llena y se necesita una nueva, generalmente está en la sala de estar.
Y ahí es donde están las bolsas de la aspiradora.
Página 127
Archivar y apilar
Página 128
Página 129
Página 130
Por supuesto, ninguna discusión sobre la memoria podría estar completa sin mencionar
el "órgano de la memoria" más cercano a casa: el cerebro humano. En los últimos pocos
décadas, la influencia de la informática ha provocado algo de
una revolución en la forma en que los psicólogos piensan sobre la memoria.
Se dice que la ciencia de la memoria humana comenzó en 1879, con una
joven psicólogo de la Universidad de Berlín llamado Hermann
Ebbinghaus. Ebbinghaus quería llegar al fondo de lo humano
memoria funcionaba, y para demostrar que era posible estudiar la mente con todos los
el rigor matemático de las ciencias físicas. Entonces comenzó a experimentar
sobre sí mismo.
Cada día, Ebbinghaus se sentaba y memorizaba una lista de tonterías
sílabas. Luego se pondría a prueba en listas de días anteriores. Perseguir
este hábito en el transcurso de un año, estableció muchos de los más básicos
resultados en la investigación de la memoria humana. Confirmó, por ejemplo, que
practicar una lista varias veces hace que persista más tiempo en la memoria, y eso
el número de elementos que uno puede recordar con precisión disminuye a medida que pasa el tiempo.
Sus resultados trazaron un gráfico de cómo la memoria se desvanece con el tiempo, conocido
hoy por los psicólogos como "la curva del olvido".
Los resultados de Ebbinghaus establecieron la credibilidad de una ciencia cuantitativa
de la memoria humana, pero dejaron abierto un misterio. Por qué esto
curva particular? ¿Sugiere que la memoria humana es buena o mala?
¿Cuál es la historia subyacente aquí? Estas preguntas han estimulado
la especulación e investigación de los psicólogos durante más de cien años.
En 1987, el psicólogo e informático de Carnegie Mellon John
Anderson se encontró leyendo sobre los sistemas de recuperación de información de
bibliotecas universitarias. El objetivo de Anderson, o eso creía él, era escribir sobre
cómo el diseño de esos sistemas podría ser informado por el estudio de la
memoria. En cambio, sucedió lo contrario: se dio cuenta de que la información
la ciencia podría proporcionar la pieza que faltaba en el estudio de la mente.
"Durante mucho tiempo", dice Anderson, "había sentido que había algo
falta en las teorías existentes de la memoria humana, incluida la mía.
Página 131
Básicamente, todas estas teorías caracterizan la memoria como algo arbitrario y no
configuración óptima ... Durante mucho tiempo había sentido que los procesos básicos de la memoria
fueron bastante adaptables y quizás incluso óptimas; sin embargo, nunca había estado
capaz de ver un marco en el que hacer este punto. En la computadora
trabajo científico sobre la recuperación de información, vi ese marco establecido antes
me."
Una forma natural de pensar en el olvido es que nuestras mentes simplemente se agotan.
del espacio. La idea clave detrás del nuevo relato de la memoria humana de Anderson
es que el problema puede que no sea de almacenamiento , sino de organización .
Según su teoría, la mente tiene una capacidad esencialmente infinita para
recuerdos, pero tenemos sólo una cantidad finita de tiempo para buscar
ellos. Anderson hizo la analogía con una biblioteca con una única, arbitrariamente larga
estante: el sistema de archivos Noguchi a escala de la Biblioteca del Congreso. Puedes encajar
tantos artículos como desee en ese estante, pero cuanto más cerca esté algo de la
frente más rápido será encontrar.
La clave para una buena memoria humana se convierte entonces en la misma que la clave para
una buena caché de computadora: predecir qué elementos es más probable que se busquen
en el futuro.
Salvo la clarividencia, el mejor enfoque para hacer tales predicciones en
el mundo humano requiere comprender el mundo mismo. Con su
colaborador Lael Schooler, Anderson se propuso interpretar al estilo de Ebbinghaus
estudios no sobre la mente humana, sino sobre la sociedad humana. La pregunta era
sencillo: qué patrones caracterizan la forma en que el mundo mismo
“Olvida”: ¿la forma en que los eventos y las referencias se desvanecen con el tiempo? Anderson
y Schooler analizó tres entornos humanos: titulares de la Nueva
York Times , grabaciones de padres hablando con sus hijos y Anderson
propia bandeja de entrada de correo electrónico. En todos los dominios, encontraron que es más probabl
aparecer de nuevo justo después de que acaba de ser utilizado, y que la probabilidad de
verlo de nuevo se cae a medida que pasa el tiempo.
En otras palabras, la realidad misma tiene una estructura estadística que imita la
Curva de Ebbinghaus.
Esto sugiere algo notable. Si el patrón por el cual las cosas se desvanecen
de nuestras mentes es el patrón por el cual las cosas se desvanecen a nuestro alrededor,
Página 132
Al poner el énfasis en el tiempo, el almacenamiento en caché nos muestra que la memoria implica
compensaciones inevitables y una cierta suma cero. No puedes tener cada
libro de la biblioteca en su escritorio, cada producto en exhibición en el frente de la tienda,
cada título por encima del doblez, cada papel en la parte superior de la pila. Y en el
De la misma manera, no puede tener todos los hechos, caras o nombres al frente de su
mente.
“Mucha gente tiene el sesgo de que la memoria humana es todo menos
óptimo ”, escribieron Anderson y Schooler. “Señalan las muchas
frustrantes fallos de memoria. Sin embargo, estas críticas no logran apreciar
la tarea ante la memoria humana, que es tratar de gestionar una enorme reserva
de recuerdos. En cualquier sistema responsable de gestionar una vasta base de datos existe
debe haber fallas de recuperación. Es demasiado caro mantener el acceso a un
número ilimitado de elementos ".
Este entendimiento, a su vez, ha llevado a una segunda revelación sobre los seres humanos.
memoria. Si estas compensaciones son realmente inevitables y el cerebro parece
Página 133
estar óptimamente sintonizado con el mundo que lo rodea, entonces lo que llamamos el
El inevitable "deterioro cognitivo" que viene con la edad puede de hecho ser algo
demás.
La tiranía de la experiencia
¿Por qué no hacen todo el avión con esas cosas de caja negra?
—STEVEN WRIGHT
Cuando haces algo más grande, es inherentemente más lento, ¿verdad? Si haces una ciudad más grande,
tarda más en llegar del punto A al punto B. Si agranda una biblioteca, tardará más en encontrar
un libro en la biblioteca. Si tiene una pila de papeles más grande en su escritorio, tardará más en
encuentra el papel que estás buscando, ¿verdad? Los cachés son en realidad una solución a ese problema.… Para
Por ejemplo, ahora mismo, si va a comprar un procesador, lo que obtendrá es un caché de nivel 1 y un nivel
2 caché en el chip. La razón por la que hay (¡incluso en el chip hay dos cachés!) Es
que para mantenerse al día con la tasa de ciclo del procesador, la caché de primer nivel está limitada en
Talla.
Inevitablemente, cuanto más grande es una memoria, más tiempo lleva buscar
y extraer un poco de información de él.
Página 134
Página 135
No importa qué tan bueno sea el esquema de su organización, tener que buscar
más cosas inevitablemente tomarán más tiempo. No es que nos estemos olvidando; es
que estamos recordando. Nos estamos convirtiendo en archivos.
Una comprensión de las inevitables demandas computacionales de
La memoria, dice Ramscar, debería ayudar a las personas a aceptar los efectos
del envejecimiento en la cognición. "Creo que lo más importante y tangible que las personas mayores pue
hacer es tratar de entender la idea de que sus mentes son naturales
dispositivos de procesamiento de información ”, escribe. "Algunas cosas que pueden parecer
frustrantes a medida que envejecemos (¡como recordar nombres!) son una función de
la cantidad de cosas que tenemos que examinar ... y no son necesariamente una señal
de una mente defectuosa ". Como él mismo dice, "Mucho de lo que actualmente se llama declive es
simplemente aprendiendo ".
El almacenamiento en caché nos da el lenguaje para comprender lo que está sucediendo. Decimos
"Pedo cerebral" cuando en realidad deberíamos decir "error de caché". El desproporcionado
los retrasos ocasionales en la recuperación de información son un recordatorio de cuánto
beneficiar el resto del tiempo al tener lo que necesitamos al frente de nuestra
mentes.
Entonces, a medida que envejece y comienza a experimentar estas latencias esporádicas, tome
corazón: la duración de un retraso es en parte un indicador de la extensión de su
experiencia. El esfuerzo de recuperación es un testimonio de cuánto sabe.
Y la rareza de esos retrasos es un testimonio de lo bien que lo ha organizado:
manteniendo las cosas más importantes al alcance de la mano.
Página 136
Página 137
*También puede obligar a su computadora a que muestre sus documentos electrónicos en una pila. Ordenadores'
La interfaz de exploración de archivos predeterminada le permite hacer clic en las carpetas en orden alfabético, pero el poder
de LRU sugiere que debe anular esto y mostrar sus archivos por "Último abierto" en lugar de
"Nombre." Lo que está buscando casi siempre estará en la cima o cerca de ella.
Página 138
5 Programación
Lo primero es lo primero
Cómo pasamos nuestros días es, por supuesto, cómo pasamos nuestras vidas.
—ANNIE DILLARD
Es lunes por la mañana y aún tiene un horario en blanco y una lista larga
de tareas para completar. Algunos pueden iniciarse solo después de que otros hayan terminado (usted
no se puede cargar el lavavajillas a menos que se descargue primero), y algunos pueden
comenzó solo después de cierto tiempo (los vecinos se quejarán si pones el
basura en la acera antes del martes por la noche). Algunos tienen plazos estrictos
otras se pueden hacer en cualquier momento, y muchas se encuentran entre medias. Algunos son
urgente, pero no importante. Algunos son importantes, pero no urgentes. "Somos lo que
repetidamente lo hacemos ", parece recordar que Aristóteles dijo, ya sea fregona
piso, pasar más tiempo con la familia, presentar impuestos a tiempo, aprender francés.
Entonces, ¿qué hacer, cuándo y en qué orden? Tu vida te espera.
Aunque siempre logramos encontrar alguna forma de ordenar las cosas que hacemos
en nuestros días, por regla general, no nos consideramos particularmente buenos en eso:
Página 139
Aunque la administración del tiempo parece un problema tan antiguo como el tiempo mismo, la ciencia
La programación comenzó en los talleres mecánicos de la revolución industrial. En
1874, Frederick Taylor, hijo de un abogado adinerado, rechazó su
aceptación en Harvard para convertirse en aprendiz de maquinista en Enterprise
Obras hidráulicas en Filadelfia. Cuatro años después, completó su
aprendiz y comenz a trabajar en Midvale Steel Works, donde
ascendió en los rangos de operador de torno a capataz de taller de máquinas y
en última instancia, al ingeniero jefe. En el proceso, llegó a creer que el momento
de las máquinas (y personas) que supervisó no se estaba utilizando muy bien,
lo que lo llevó a desarrollar una disciplina que llamó "Gestión científica".
Taylor creó una oficina de planificación, en cuyo centro había un boletín
tablero que muestra el horario de la tienda para que todos lo vean. El tablero representado
cada máquina en el taller, mostrando la tarea que está llevando a cabo actualmente
esa máquina y todas las tareas que la esperan. Esta práctica se construiría
Henry Gantt, colega de Taylor, quien en la década de 1910 desarrolló el
Diagramas de Gantt que ayudarían a organizar muchos de los
ambiciosos proyectos de construcción, desde la presa Hoover hasta la interestatal
Página 140
Sistema de carreteras. Un siglo después, los diagramas de Gantt todavía adornan las paredes y
pantallas de directores de proyectos en empresas como Amazon, IKEA y SpaceX.
Taylor y Gantt hicieron de la programación un objeto de estudio y le dieron
forma visual y conceptual. Pero no resolvieron el problema fundamental
de determinar qué horarios eran los mejores. El primer indicio de que este problema
incluso podría resolverse no aparecería hasta varias décadas después, en 1954
artículo publicado por el matemático Selmer Johnson de RAND Corporation.
El escenario que examinó Johnson fue la encuadernación, donde cada libro
debe imprimirse en una máquina y luego encuadernarse en otra. Pero el
La instancia más común de esta configuración de dos máquinas está mucho más cerca de casa:
la lavandería. Cuando lavas tu ropa, tienen que pasar por el
lavadora y secadora en secuencia, y diferentes cargas necesitarán diferentes
cantidades de tiempo en cada uno. Una carga muy sucia puede tardar más en lavarse
pero el tiempo habitual para secar; una carga grande puede tardar más en secarse, pero lo habitual
hora de lavarse. Johnson preguntó, si tiene varias cargas de ropa que lavar
el mismo día, ¿cuál es la mejor manera de hacerlo?
Su respuesta fue que debes comenzar por encontrar el único paso que
toma la menor cantidad de tiempo: la carga que se lavará o secará más rápido.
Si ese paso más corto involucra a la lavadora, planee hacer esa carga primero . Si se
involucra la secadora, planee hacerlo al final . Repita este proceso para el resto
cargas, trabajando desde los dos extremos del programa hacia el medio.
Intuitivamente, el algoritmo de Johnson funciona porque independientemente de cómo
secuenciar las cargas, habrá algún tiempo al principio cuando el
La lavadora está funcionando pero no la secadora, y algún tiempo al final cuando la
la secadora está funcionando pero no la lavadora. Al tener los tiempos de lavado más cortos en
el inicio y los tiempos de secado más cortos al final, maximizas la cantidad
de superposición: cuando la lavadora y la secadora funcionan simultáneamente. Por lo tanto
puede mantener la cantidad total de tiempo dedicado a lavar la ropa al máximo
mínimo. El análisis de Johnson había producido el primer óptimo de programación
algoritmo: comience con el lavado más ligero, termine con la cesta más pequeña.
Más allá de sus aplicaciones inmediatas, el artículo de Johnson reveló dos
puntos: primero, que la programación podría expresarse algorítmicamente, y
en segundo lugar, que existían soluciones de programación óptimas. Esto dio inicio a lo que ha
Página 141
convertirse en una extensa literatura, explorando estrategias para una vasta colección de
fábricas hipotéticas con todos los números y tipos imaginables de
máquinas.
Nos centraremos en un pequeño subconjunto de esta literatura: la parte que,
a diferencia de la encuadernación o la lavandería, se ocupa de la programación de una sola máquina.
Porque el problema de programación que más importa involucra solo una
máquina: nosotros mismos.
Manejo de plazos
Con la programación de una sola máquina, nos encontramos con algo así como un problema
De buenas a primeras. El trabajo de Johnson sobre encuadernación se basó en minimizar la
tiempo total requerido para que las dos máquinas completen todos sus trabajos. En el
caso de programación de una sola máquina, sin embargo, si vamos a hacer todas las
tareas asignadas, todos los horarios tardarán el mismo tiempo en completarse; los
el orden es irrelevante.
Este es un punto suficientemente fundamental y contrario a la intuición que es
Vale la pena repetirlo. Si solo tiene una máquina, y va a hacer
todas sus tareas, entonces cualquier orden de las tareas le llevará lo mismo
cantidad de tiempo.
Así, nos encontramos con la primera lección sobre la programación de una sola máquina, literalmente
incluso antes de empezar: haz explícitos tus objetivos . No podemos declarar algunos
programe un ganador hasta que sepamos cómo llevamos la puntuación. Este es
algo así como un tema en ciencias de la computación: antes de que puedas tener un plan,
primero debe elegir una métrica. Y resulta que, ¿qué métrica elegimos aquí?
afectará directamente qué enfoques de programación obtienen mejores resultados.
Los primeros documentos sobre la programación de una sola máquina siguieron rápidamente en el
tacones del trabajo de encuadernación de Johnson y ofreció varias métricas plausibles
considerar. Para cada métrica, descubrieron una estrategia sencilla y óptima.
Por supuesto, es común, por ejemplo, que las tareas tengan una fecha de vencimiento, con
la tardanza de una tarea es cuánto se ha retrasado. Entonces podemos pensar en
el "retraso máximo" de un conjunto de tareas como el retraso de cualquier tarea
ha superado su fecha de vencimiento, el tipo de cosas que su empleador
Página 142
preocuparse en una revisión de desempeño. (O lo que les podría importar a tus clientes
en un entorno minorista o de servicios, donde la tarea "más tarde"
corresponde al cliente sometido al mayor tiempo de espera.)
Si le preocupa minimizar la tardanza máxima, entonces lo mejor
La estrategia es comenzar con la tarea que se debe realizar lo antes posible y avanzar hacia la
tarea que vence en último lugar. Esta estrategia, conocida como Fecha de vencimiento más temprana ,
(Por ejemplo, en un contexto de sector de servicios, donde cada cliente que llega "debido
cita "es efectivamente el instante en que entran por la puerta, solo significa servir
clientes en orden de llegada.) Pero algunas de sus implicaciones son sorprendentes.
Por ejemplo, el tiempo que tardará en completarse cada tarea es completamente irrelevante:
no cambia el plan, por lo que, de hecho, ni siquiera necesita saberlo. Todo lo que
lo que importa es cuándo vencen las tareas.
Es posible que ya esté utilizando la fecha de vencimiento más temprana para abordar su carga de trab
en cuyo caso probablemente no necesite la informática para decirle que es
una estrategia sensata. Sin embargo, lo que puede que no hayas sabido es que es el
estrategia óptima . Más precisamente, es óptimo asumir que solo estás
interesado en una métrica en particular: reducir su retraso máximo. Si
sin embargo, ese no es su objetivo, entonces otra estrategia podría ser más
aplicable.
Por ejemplo, considere el refrigerador. Si eres una de las muchas personas
que tienen una suscripción de agricultura apoyada por la comunidad (CSA),
cada semana o dos tienes una gran cantidad de productos frescos que llegan a tu
puerta todo a la vez. Cada producto está listo para estropearse en una fecha diferente.
—Por lo tanto, comerlos antes de la fecha de vencimiento más temprana, en orden de su programa de det
parece un punto de partida razonable. Sin embargo, no es el final del
historia. La fecha de vencimiento más temprana es óptima para reducir el retraso máximo, que
medios que minimizarán la podredumbre de la única cosa más podrida podrás
tener que comer; puede que esa no sea la métrica más apetitosa para comer.
Quizás, en cambio, queremos minimizar la cantidad de alimentos que se echan a perder.
Aquí una estrategia llamada algoritmo de Moore nos da nuestro mejor plan. De Moore
El algoritmo dice que comenzamos como con la Fecha de vencimiento más temprana: por
programar nuestros productos en orden de fecha de deterioro, el más temprano primero, un artículo
a la vez. Sin embargo, tan pronto como parezca que no podremos comer el próximo
Página 143
elemento a tiempo, hacemos una pausa, revisamos las comidas que ya hemos planeado,
y deseche el artículo más grande (es decir, el que más
días para consumir). Por ejemplo, eso podría significar renunciar a la sandía.
eso tomaría media docena de porciones para comer; ni siquiera intentarlo lo hará
significa llegar a todo lo que sigue mucho antes. Luego repetimos esto
patrón, colocando los alimentos por fecha de deterioro y tirando el más grande ya
artículo programado en cualquier momento que nos atrasemos. Una vez que todo lo que queda puede
ser comido en orden de fecha de deterioro sin que nada se eche a perder, tenemos nuestro
plan.
El algoritmo de Moore minimiza la cantidad de elementos que necesitará lanzar
lejos. Por supuesto, también puede convertir la comida en abono, donarla al
banco de alimentos local, o dáselo a tu vecino. En un industrial o burocrático
contexto en el que no se puede simplemente descartar un proyecto, sino en el que el número
—Más que la gravedad— de los proyectos tardíos sigue siendo su mayor preocupación,
El algoritmo de Moore es igualmente indiferente acerca de cómo esas tareas tardías son
manejado. Cualquier cosa que se inicie desde la parte principal de su horario puede obtener
hecho al final, en cualquier orden; no importa, como ya están todos
tarde.
Haga las cosas difíciles mientras sean fáciles y haga las grandes
mientras son pequeños.
—LAO TZU
A veces, las fechas de vencimiento no son nuestra principal preocupación y solo queremos obtener
cosas hechas: tantas cosas, lo más rápido posible. Resulta que traduciendo
este deseo aparentemente simple en una métrica de programación explícita es más difícil
de lo que parece.
Un enfoque es adoptar la perspectiva de un extraño. Hemos notado que en
programación de una sola máquina, nada de lo que hagamos puede cambiar el tiempo que llevará
nosotros para terminar todas nuestras tareas, pero si cada tarea, por ejemplo, representa un
Página 144
esperando cliente, entonces hay una manera de ocupar tan poco de su tiempo colectivo
como sea posible. Imagínese comenzar el lunes por la mañana con un proyecto de cuatro días
y un proyecto de un día en su agenda. Si entrega el proyecto más grande en
Jueves por la tarde (transcurrieron 4 días) y luego el pequeño el viernes
tarde (transcurridos 5 días), los clientes habrán esperado un total de 4 + 5 = 9
dias. Sin embargo, si invierte el orden, puede terminar el pequeño proyecto en
El lunes y el grande el viernes, con los clientes esperando un total de solo 1
+ 5 = 6 días. Es una semana laboral completa para usted de cualquier manera, pero ahora ha ahorrado
sus clientes tres días de su tiempo combinado. Los teóricos de la programación llaman a esto
métrica la "suma de los tiempos de finalización".
Minimizar la suma de los tiempos de finalización conduce a un óptimo muy simple
algoritmo llamado Tiempo de procesamiento más corto : siempre haga la tarea más rápida
usted puede.
Incluso si no tiene clientes impacientes pendiente de cada trabajo, Shortest
Tiempo de procesamiento hace que las cosas hechas . (Quizás no sea de extrañar que sea
compatible con la recomendación de Getting Things Done to
realizar inmediatamente cualquier tarea que lleve menos de dos minutos).
no hay forma de cambiar la cantidad total de tiempo que le llevará su trabajo,
pero el tiempo de procesamiento más corto puede aliviar su mente al reducir el número
de las tareas pendientes lo antes posible. Su suma de tiempos de finalización
La métrica se puede expresar de otra manera: es como centrarse sobre todo en
reduciendo la longitud de su lista de tareas pendientes. Si cada asunto pendiente es
como una espina en el costado, luego correr a través de los elementos más fáciles puede traer
alguna medida deno
Por supuesto, alivio.
todos los asuntos pendientes son iguales. Apagando un
El fuego real en la cocina probablemente debería hacerse antes de "apagar un fuego".
con un correo electrónico rápido a un cliente, incluso si el primero tarda un poco más. En
programación, esta diferencia de importancia se captura en una variable conocida como
peso . Cuando revisa su lista de tareas pendientes, este peso puede sentirse
literal: la carga que se quita de los hombros al terminar cada tarea. A
El tiempo de finalización de la tarea muestra cuánto tiempo lleva esa carga, por lo que
minimizando la suma de los tiempos de finalización ponderados (es decir, cada tarea
Página 145
simplemente para sacarlos del camino. En los círculos de reducción de la deuda, este enfoque es
conocida como la "bola de nieve de la deuda". Si la gente, en la práctica, debería
priorizar la reducción del monto en dólares de sus deudas o la cantidad de ellas
sigue siendo una controversia activa, tanto en la prensa popular como en
investigación económica.
Esto nos lleva de vuelta a la nota con la que comenzamos nuestra discusión de
programación de la máquina. Se dice que "un hombre con un reloj sabe a qué hora
está; un hombre con dos relojes nunca está seguro ". La informática nos puede ofrecer
algoritmos óptimos para varias métricas disponibles en una sola máquina
programación, pero la elección de la métrica que queremos seguir depende de nosotros. En muchos
casos, podemos decidir qué problema queremos resolver.
Esto ofrece una forma radical de repensar la procrastinación, la patología clásica.
de la gestión del tiempo. Normalmente lo consideramos un algoritmo defectuoso. Y si
es exactamente lo contrario? ¿Qué pasa si es una solución óptima para el mal?
problema ?
Hay un episodio de Expediente X donde el protagonista Mulder,
postrado en cama y a punto de ser consumido por un vampiro obsesivo-compulsivo,
derrama una bolsa de pipas de girasol en el suelo en defensa propia. El vampiro,
impotente contra su compulsión, se inclina para recogerlos uno por uno, y
finalmente, el sol sale antes de que pueda hacer una comida de Mulder. Computadora
los científicos llamarían a esto un "ataque de ping" o un ataque de "denegación de servicio": dar
un sistema una abrumadora cantidad de cosas triviales que hacer, y lo importante
las cosas se pierden en el caos.
Por lo general, asociamos la procrastinación con la pereza o la evasión.
comportamiento, pero puede surgir con la misma facilidad en personas (o computadoras, o
vampiros) que están tratando con seriedad y entusiasmo de hacer las cosas
lo más rápido posible. En un estudio de 2014 dirigido por David de Penn State
Rosenbaum, por ejemplo, se pidió a los participantes que trajeran uno de los dos
cubos pesados al extremo opuesto de un pasillo. Uno de los cubos fue
justo al lado del participante; el otro estaba en la mitad del pasillo. Al
Página 147
Página 148
suena como una cura infalible para la dilación. Pero resulta que incluso eso
no es suficiente. Y un grupo de expertos en programación informática
encontrar esta lección de la manera más dramática imaginable: en la superficie
de Marte, con el mundo entero mirando.
Era el verano de 1997 y la humanidad tenía mucho que celebrar. Por el primero
Siempre, un rover navegaba por la superficie de Marte. Los $ 150 millones
La nave espacial Mars Pathfinder se había acelerado a una velocidad de 16.000 millas por hora.
hora, viajó a través de 309 millones de millas de espacio vacío y aterrizó con
airbags de grado espacial sobre la rocosa superficie roja marciana.
Y ahora estaba procrastinando.
De vuelta en la Tierra, los ingenieros del Laboratorio de Propulsión a Chorro (JPL) estaban
preocupado y perplejo. La tarea de mayor prioridad de Pathfinder (mover datos a
y fuera de su "bus de información") estaba siendo misteriosamente descuidado como el
robot dedicó su tiempo a tareas de mediana importancia. Lo que era
pasando? ¿No sabía el robot algo mejor?
De repente, Pathfinder registró que el bus de información no había sido
tratado durante un tiempo inaceptablemente largo y, sin un recurso más sutil,
inició un reinicio completo, lo que le costó a la misión la mayor parte del día
trabaja. Más o menos un día después, volvió a ocurrir lo mismo.
Trabajando febrilmente, el equipo de JPL finalmente logró reproducir y luego
diagnosticar el comportamiento. El culpable fue un clásico peligro de programación llamado
inversión de prioridad . Lo que sucede en una inversión de prioridad es que una baja
La tarea prioritaria toma posesión de un recurso del sistema (acceso a una base de datos,
digamos) para hacer algo de trabajo, pero luego se interrumpe a la mitad de ese
funciona mediante un temporizador, que lo pausa e invoca el programador del sistema. los
El programador prepara una tarea de alta prioridad, pero no se puede ejecutar porque la base de datos
esta ocupado. Y entonces el programador se mueve hacia abajo en la lista de prioridades, ejecutando
en su lugar, varias tareas desbloqueadas de prioridad media, en lugar de las de alta
la prioridad uno (que está bloqueada), o la de baja prioridad que lo está bloqueando
(que está atascado detrás de todo el trabajo de prioridad media). En estos
Página 149
Página 150
El tope de velocidad
Página 151
Página 152
los problemas no son incontestables, per se, pero puede ser simplemente el caso de que
No existe un algoritmo sencillo que pueda encontrarle el horario óptimo.
en un período de tiempo razonable.
Esto llevó a investigadores como Lawler y Lenstra a una pregunta irresistible.
De todos modos, ¿qué proporción de los problemas de programación eran intratables?
Veinte años después de que la teoría de la programación fuera impulsada por Selmer Johnson
papel de encuadernación, la búsqueda de soluciones individuales estaba a punto de convertirse
algo mucho más grandioso y ambicioso con diferencia: una búsqueda para mapear el
todo el panorama de la teoría de la programación.
Lo que encontraron los investigadores fue que incluso el cambio más sutil en un
El problema de programación a menudo lo inclina sobre la línea fina e irregular entre
tratable e intratable. Por ejemplo, el algoritmo de Moore minimiza la
número de tareas tardías (o frutas podridas) cuando todas tienen el mismo valor, pero
si algunos son más importantes que otros, el problema se vuelve intratable
y ningún algoritmo puede proporcionar fácilmente la programación óptima. Igualmente,
tener que esperar hasta cierto tiempo para comenzar algunas de sus tareas hace que casi
todos los problemas de programación para los que, de otro modo, tendríamos eficientes
soluciones en problemas intratables. No poder sacar la basura hasta
la noche anterior a la recolección puede ser una ordenanza municipal razonable, pero
enviará su calendario de cabeza a la intratabilidad.
El trazado de las fronteras de la teoría de la programación continúa hasta el día de hoy. A
Una encuesta reciente mostró que el estado de aproximadamente el 7% de todos los problemas sigue sien
desconocido, terra incognita de la programación. Del 93% de los problemas que
entiendo, sin embargo, las noticias no son buenas: solo el 9% se puede resolver
eficientemente, y el otro 84% ha demostrado ser intratable. * En otros
En palabras, la mayoría de los problemas de programación no admiten una solución inmediata. Si intent
administrar perfectamente su calendario se siente abrumador, tal vez sea porque
en realidad lo es. No obstante, los algoritmos que hemos discutido son a menudo los
punto de partida para abordar esos problemas difíciles, si no perfectamente, entonces en
menos tan bien como se puede esperar.
Página 153
El mejor momento para plantar un árbol es hace veinte años. El segundo mejor momento
es ahora.
-PROVERBIO
Hasta ahora, hemos considerado solo los factores que dificultan la programación. Pero
hay un giro que puede hacerlo más fácil: poder detener una tarea
a la mitad y cambiar a otro. Esta propiedad, "preferencia", se convierte
para cambiar el juego dramáticamente.
Minimizar la máxima tardanza (para atender a los clientes en una cafetería)
o la suma de los tiempos de finalización (para acortar rápidamente su lista de tareas pendientes) tanto
cruzar la línea hacia la intratabilidad si algunas tareas no se pueden iniciar hasta que
una hora en particular. Pero vuelven a tener soluciones eficientes una vez
se permite la preferencia. En ambos casos, las estrategias clásicas: vencimiento más temprano
La fecha y el tiempo de procesamiento más corto, respectivamente, siguen siendo los mejores, con un
modificación bastante sencilla. Cuando llega la hora de inicio de una tarea,
compare esa tarea con la que se está realizando actualmente. Si estas trabajando por
La fecha de vencimiento más temprana y la nueva tarea vence incluso antes que la actual,
cambiar de marcha; de lo contrario, mantén el rumbo. Del mismo modo, si está trabajando con
El tiempo de procesamiento más corto, y la nueva tarea se puede terminar más rápido que el
actual, haga una pausa para ocuparse de él primero; de lo contrario, continúa con lo que
estaban haciendo.
Ahora, en una buena semana, un taller de máquinas puede saber todo lo que se espera.
de ellos en los próximos días, pero la mayoría de nosotros suele volar a ciegas, al menos
en parte. Puede que ni siquiera estemos seguros, por ejemplo, de cuándo podremos empezar
un proyecto en particular (¿cuándo tal y tal me dará una respuesta sólida sobre el
¿tal y tal?). Y en cualquier momento nuestro teléfono puede sonar o un correo electrónico puede
aparecerá con noticias de una tarea completamente nueva para agregar a nuestra agenda.
Sin embargo, resulta que incluso si no sabe cuándo comenzarán las tareas,
La fecha de vencimiento más temprana y el tiempo de procesamiento más corto siguen siendo estrategias
capaz de garantizarle (en promedio) el mejor rendimiento posible en la cara
de incertidumbre. Si las asignaciones se arrojan a su escritorio en impredecibles
momentos, la estrategia óptima para minimizar la tardanza máxima sigue siendo la
versión preventiva de la fecha de vencimiento más temprana: cambiar al trabajo que acaba
Página 154
Página 155
La teoría de la programación, por lo tanto, cuenta una historia razonablemente alentadora después de to
son algoritmos simples y óptimos para resolver muchos problemas de programación, y
esos problemas son tentadoramente cercanos a situaciones que encontramos a diario en
vidas humanas. Pero cuando se trata de realizar realmente una sola máquina
programar en el mundo real, las cosas se complican.
En primer lugar, tanto las personas como los sistemas operativos de las computadoras se enfrentan a
desafío: la máquina que está haciendo la programación y la máquina que está siendo
programados son uno y el mismo. Lo que hace que enderezar tus tareas pendientes
Incluya un elemento en su lista de tareas pendientes, que necesita, en sí mismo, ser priorizado y
programado.
En segundo lugar, la preferencia no es gratuita. Cada vez que cambia de tarea, paga una
precio, conocido en ciencias de la computación como cambio de contexto . Cuando una computadora
procesador desvía su atención de un programa dado, siempre hay un
cierta cantidad de gastos generales necesarios. Necesita marcar de manera efectiva su
colocar y dejar a un lado toda la información relacionada con ese programa. Entonces eso
necesita averiguar qué programa ejecutar a continuación. Finalmente debe sacar todo
la información relevante para ese programa, busque su lugar en el código y obtenga
engranado.
Ninguno de estos cambios de ida y vuelta es "trabajo real", es decir, nada de eso
En realidad, avanza el estado de cualquiera de los diversos programas en los que se encuentra la comput
cambiar entre. Es metatrabajo . Cada cambio de contexto es una pérdida de tiempo.
Los seres humanos también tienen costos de cambio de contexto. Los sentimos cuando
movemos papeles dentro y fuera de nuestro escritorio, cerramos y abrimos documentos en nuestro
Página 156
computadora, entrar en una habitación sin recordar lo que nos había enviado allí, o
simplemente di en voz alta: "Ahora, ¿dónde estaba?" o "¿Qué estaba diciendo?"
Los psicólogos han demostrado que, para nosotros, los efectos de cambiar de tarea pueden
incluir retrasos y errores, en una escala de minutos en lugar de
microsegundos. Para poner esa cifra en perspectiva, cualquiera que interrumpa más
de unas pocas veces por hora corre el riesgo de no hacer ningún trabajo.
Personalmente, hemos descubierto que tanto la programación como la escritura requieren
teniendo en cuenta el estado de todo el sistema, y por lo tanto llevar desmesuradamente
grandes costos de cambio de contexto. Un amigo nuestro que escribe software dice
que la semana laboral normal no se adapta bien a su flujo de trabajo, ya que para él
Los días de dieciséis horas son más del doble de productivos que los de ocho horas.
Brian, por su parte, piensa en la escritura como una especie de herrería, donde
toma un tiempo calentar el metal antes de que sea maleable. Lo encuentra
algo intil bloquear algo menos de noventa minutos para
escribiendo, ya que no pasa mucho en la primera media hora, excepto cargar un
bloque gigante de "Ahora, ¿dónde estaba?" en su cabeza. Experto en programación Kirk
Pruhs, de la Universidad de Pittsburgh, ha tenido la misma experiencia. "Si es
en menos de una hora haré recados, porque me tomará la primera
treinta y cinco minutos para averiguar realmente lo que quiero hacer y luego podría
no tengo tiempo para hacerlo ".
El célebre poema de Rudyard Kipling de 1910 "Si ..." termina con un exuberante
llame para la gestión del tiempo: "Si puede llenar el minuto implacable / Con
sesenta segundos de distancia recorrida ... "
Si solo. La verdad es que siempre hay gastos generales: tiempo perdido en metatrabajo, en
la logística de la contabilidad y la gestión de tareas. éste es uno de
compensaciones fundamentales de la programación. Y cuanto más tomas, más
arriba hay. En su extremo de pesadilla, esto se convierte en un fenómeno
llamado paliza .
Paliza
Página 157
Zuckerberg: Tienes parte de mi atención, tienes el mínimo
Monto.
- LA RED SOCIAL
Las computadoras realizan múltiples tareas a través de un proceso llamado "subprocesamiento", que pue
Piense en como hacer malabarismos con un juego de pelotas. Así como un malabarista solo lanza uno
bola a la vez en el aire pero mantiene tres en alto, una CPU solo funciona en una
programa a la vez, pero intercambiando entre ellos lo suficientemente rápido (en el
escala de diez milésimas de segundo) parece estar reproduciendo una película,
navegar por la web y alertarle sobre el correo electrónico entrante a la vez.
En la década de 1960, los informáticos comenzaron a pensar en cómo automatizar
el proceso de compartir recursos informáticos entre diferentes tareas y
usuarios. Fue un momento emocionante, cuenta Peter Denning, ahora uno de los mejores
expertos en multitarea informática, que entonces estaba trabajando en su doctorado
en el MIT. Emocionante e incierto: "¿Cómo se particiona una memoria principal?
entre un montón de trabajos que están ahí cuando algunos de ellos quieren crecer
y algunos querrán encogerse e interactuarán con cada uno
otro, tratando de robar [la memoria] y todo este tipo de cosas? ... ¿Cómo
gestionar todo ese conjunto de interacciones? Nadie sabía nada de eso ".
No es sorprendente, dado que los investigadores aún no sabían realmente qué
que estaban haciendo, el esfuerzo tropezó con dificultades. Y había uno en
particular que les llamó la atención. Como explica Denning, bajo ciertas
condiciones un problema dramático "aparece a medida que agrega más trabajos a la
mezcla multiprogramación. En algún momento pasas un umbral crítico:
impredecible exactamente donde está, pero lo sabrás cuando llegues ...
y de repente el sistema parece morir ".
Piense de nuevo en nuestra imagen de malabarista. Con una pelota en el aire, hay
suficiente tiempo libre mientras esa pelota está en el aire para que el malabarista lance otras
hacia arriba también. Pero, ¿y si el malabarista toma una pelota más de la que puede?
¿resolver? No deja caer esa pelota; deja todo . Todo el sistema
literalmente, baja. Como dice Denning, "La presencia de una
programa adicional ha provocado un colapso total del servicio.… El agudo
diferencia entre los dos casos al principio desafía la intuición, lo que podría llevar
Página 158
Página 159
para escribir todo lo que se suponía que debías estar haciendo, pero no pudiste prescindir
el tiempo, lo has goleado. Y la causa es muy parecida para las personas que para
Computadoras: cada tarea se basa en nuestros limitados recursos cognitivos. Cuando
simplemente recordar todo lo que tenemos que hacer ocupa nuestro pleno
atención, o priorizar cada tarea consume todo el tiempo que teníamos que hacer
ellos, o nuestro hilo de pensamiento se interrumpe continuamente antes de que
los pensamientos pueden traducirse en acción; se siente como pánico, como parálisis por medio de
hiperactividad. Es trepidante y las computadoras lo saben bien.
Si alguna vez ha luchado con un sistema en un estado de paliza, y si
alguna vez has estado en tal estado, entonces es posible que sientas curiosidad por la
informática para salir. En su histórico artículo de la década de 1960 sobre la
sujeto, Denning señaló que una onza de prevención vale una libra de
cura. Lo más fácil de hacer es simplemente obtener más memoria: suficiente RAM,
por ejemplo, para ajustar los conjuntos de trabajo de todos los programas en ejecución en la memoria
de una vez y reduzca el tiempo que tarda un cambio de contexto. Pero preventivo
Los consejos para la paliza no te ayudan cuando te encuentras en medio de
eso. Además, en lo que respecta a la atención humana, estamos atrapados en lo que
tiene.
Otra forma de evitar una paliza antes de que comience es aprender el arte de
diciendo que no. Denning defendía, por ejemplo, que un sistema debería simplemente
negarse a agregar un programa a su carga de trabajo si no tiene suficiente
memoria para mantener su conjunto de trabajo. Esto evita la paliza en las máquinas y es
un consejo sensato para cualquiera que tenga un plato lleno. Pero esto también puede parecer
un lujo inalcanzable para aquellos de nosotros que nos encontramos ya sobrecargados
—O de otra manera incapaz de estrangular las demandas que se nos imponen.
En estos casos, es evidente que no hay forma de trabajar más duro, pero puede
trabajo ... más tonto . Junto con las consideraciones de memoria, uno de los mayores
fuentes del metatrabajo en contextos cambiantes es el acto mismo de elegir lo que
hacer a continuación. Esto también puede, en ocasiones, hundir la realización real del trabajo.
Frente a, digamos, una bandeja de entrada desbordada de n mensajes, sabemos por ordenar
teoría de que escanearlo repetidamente en busca de la más importante para responder a continuación
tomará O ( n 2 ) operaciones: n escaneos de n mensajes cada uno. Esto significa que
Despertar con una bandeja de entrada que está tres veces más llena de lo habitual podría llevarle nueve
Página 160
veces más tiempo para procesar. Además, escaneando esos correos electrónicos
significa intercambiar cada mensaje en tu mente, uno tras otro, antes de
respondes a cualquiera de ellos: una receta infalible para la memoria.
En un estado de paliza, esencialmente no estás progresando, así que incluso
hacer las tareas en el orden incorrecto es mejor que no hacer nada. En lugar de
responder primero a los correos electrónicos más importantes, lo que requiere una evaluación de
la imagen completa que puede llevar más tiempo que el trabajo en sí, tal vez
debería esquivar esas arenas movedizas de tiempo cuadrático simplemente respondiendo los correos ele
en orden aleatorio , o en cualquier orden en que aparezcan en la pantalla.
Pensando en la misma línea, el equipo central de Linux, hace varios años,
reemplazó su programador con uno que era menos "inteligente" a la hora de calcular
prioridades del proceso, pero lo compensó con creces al tomar menos tiempo para
calcularlos.
Sin embargo, si aún desea mantener sus prioridades, hay una
y una ganga aún más interesante que puede lograr para aumentar su productividad
espalda.
Interrumpir la fusión
Parte de lo que hace que la programación en tiempo real sea tan compleja e interesante es que
es fundamentalmente una negociación entre dos principios que no están completamente
compatible. Estos dos principios se denominan capacidad de respuesta y rendimiento :
qué tan rápido puede responder a las cosas y cuánto puede hacer
en general. Cualquiera que haya trabajado alguna vez en un entorno de oficina puede
apreciar la tensión entre estas dos métricas. Es parte de la razón
hay personas cuyo trabajo es contestar el teléfono: son receptivos, por lo que
que otros puedan tener rendimiento.
Una vez más, la vida es más difícil cuando, como una computadora, debes hacer
compensación de capacidad de respuesta / rendimiento usted mismo. Y la mejor estrategia para
Paradójicamente, hacer las cosas podría ser reducir la velocidad.
Los programadores del sistema operativo normalmente definen un "período" en el que cada
El programa está garantizado para ejecutarse al menos un poco, con el sistema dando un
"Porción" de ese período a cada programa. Cuantos más programas se estén ejecutando,
Página 161
más pequeñas se vuelven esas porciones, y más cambios de contexto están ocurriendo
cada período, manteniendo la capacidad de respuesta a costa del rendimiento. Izquierda
Sin embargo, esta política de garantizar cada proceso al menos algunos
atención cada período podría conducir a una catástrofe. Con suficientes programas
en ejecución, la porción de una tarea se reduciría hasta el punto en que el sistema
gastar toda la porción en el cambio de contexto, antes de contextualizar inmediatamente
cambiando de nuevo a la siguiente tarea.
El culpable es la dura garantía de capacidad de respuesta. Funcionamiento tan moderno
de hecho, los sistemas establecen una longitud mínima para sus cortes y se negarán a
subdividir el período más finamente. (En Linux, por ejemplo, este mínimo
rebanada útil resulta ser de aproximadamente tres cuartos de milisegundo, pero en
humanos, de manera realista, podría ser al menos varios minutos.) Si más procesos
se agregan más allá de ese punto, el período simplemente se hará más largo. Esto significa
que los procesos tendrán que esperar más para obtener su turno, pero los turnos que
get será al menos lo suficientemente largo para hacer algo.
Establecer una cantidad mínima de tiempo para dedicar a cualquier tarea ayuda
para evitar que el compromiso con la capacidad de respuesta anule el rendimiento
por completo: si el segmento mínimo es más largo que el tiempo que se tarda en contextualizar
cambiar, entonces el sistema nunca puede entrar en un estado en el que el cambio de contexto sea
lo único que está haciendo. También es un principio que es fácil de traducir en un
recomendación para vidas humanas. Métodos como "timeboxing" o
"Pomodoros", donde literalmente configuras un temporizador de cocina y te comprometes a hacer un
una sola tarea hasta que se agote, son una encarnación de esta idea.
Pero, ¿a qué tamaño de rebanada debes apuntar? Ante la pregunta de cómo
mucho tiempo para esperar entre intervalos para realizar una tarea recurrente, como comprobar
su correo electrónico, la respuesta desde la perspectiva del rendimiento es simple: siempre que
como sea posible. Pero ese no es el final de la historia; mayor rendimiento, después de todo,
también significa menor capacidad de respuesta.
Para su computadora, la molesta interrupción que tiene que controlar
normalmente no es el correo electrónico, eres tú. Es posible que no mueva el mouse durante minutos
u horas, pero cuando lo hace, espera que el puntero de la pantalla se mueva
inmediatamente, lo que significa que la máquina gasta mucho esfuerzo simplemente
comprobando cómo estás. Cuanto más frecuentemente revise el mouse y
Página 162
teclado, más rápido puede reaccionar cuando hay una entrada, pero más contexto
interruptores que tiene que hacer. Entonces, la regla que siguen los sistemas operativos de las computado
al decidir cuánto tiempo pueden permitirse dedicarse a algunos
La tarea es simple: el mayor tiempo posible sin que parezca nervioso o lento para el
usuario.
Cuando los humanos salimos de casa para hacer un recado rápido, podríamos decir
algo como, "Ni siquiera notarás que me he ido". Cuando nuestras maquinas
cambio de contexto en un cálculo, deben regresar literalmente a nosotros antes de que
note que se han ido. Para encontrar este punto de equilibrio, los sistemas operativos
Los programadores han recurrido a la psicología, minando artículos en psicofísica.
el número exacto de milisegundos de retraso que tarda un cerebro humano en
registrar retraso o parpadeo. Ya no tiene sentido atender al usuario
a menudo que eso.
Gracias a estos esfuerzos, cuando los sistemas operativos funcionan correctamente,
ni siquiera se dé cuenta de lo duro que se está esforzando su computadora. Tu continua
para poder mover el mouse por la pantalla con fluidez incluso cuando su
El procesador está transportando a máxima inclinación. La fluidez le está costando algo de rendimiento,
pero esa es una compensación de diseño que ha sido hecha explícitamente por el sistema
ingenieros: su sistema pasa todo el tiempo posible lejos de
interactuando con usted, luego vuelve a dibujar el mouse justo a tiempo.
Y nuevamente, este es un principio que se puede transferir a la vida humana. los
La moraleja es que debes tratar de concentrarte en una sola tarea el mayor tiempo posible.
sin disminuir su capacidad de respuesta por debajo del mínimo aceptable
límite. Decida qué tan receptivo debe ser y luego, si desea obtener
cosas hechas, no seas más receptivo que eso.
Si te das cuenta de que cambias mucho de contexto porque estás
abordar una colección heterogénea de tareas breves, también puede emplear
otra idea de la informática: "interrumpir la fusión". Si tienes cinco
las facturas de las tarjetas de crédito, por ejemplo, no las pague a medida que llegan; cuidar de
todos de una vez cuando llegue el quinto billete. Siempre y cuando tus facturas nunca sean
vencen menos de treinta y un días después de su llegada, puede designar, digamos, el
primero de cada mes como "día de pago de facturas" y siéntese en ese momento para
procese todas las facturas en su escritorio, sin importar si fueron tres semanas o
Página 163
hace tres horas. Del mismo modo, si ninguno de sus corresponsales de correo electrónico le solicita
para responder en menos de veinticuatro horas, puede limitarse a
revisando sus mensajes una vez al día. Las propias computadoras hacen algo
así: esperan hasta un intervalo fijo y comprueban todo, en su lugar
de cambio de contexto para manejar interrupciones separadas y descoordinadas de su
varios subcomponentes. *
En ocasiones, los informáticos notan la ausencia de interrupción
fusionándose en sus propias vidas. Peter, director de investigación de Google
Norvig: "Tuve que ir al centro tres veces hoy para hacer mandados, y dije:
'Oh, bueno, eso es solo un error de una línea en su algoritmo. Deberías tener solo
esperó o lo agregó a la cola de tareas pendientes, en lugar de ejecutarlas
secuencialmente a medida que se agregaron uno a la vez '”.
A escala humana, obtenemos interrupciones que se fusionan de forma gratuita desde el correo postal
sistema, como consecuencia de su ciclo de entrega. Porque el correo recibe
entregado solo una vez al día, algo enviado por correo solo unos minutos tarde podría
Tómese veinticuatro horas adicionales para comunicarse con usted. Considerando los costos de
cambio de contexto, el lado positivo de esto ya debería ser obvio: usted
sólo puede ser interrumpido por facturas y cartas como máximo una vez al día. Qué
más, el ritmo postal de veinticuatro horas exige una capacidad de respuesta mínima
de usted: no importa si envía su respuesta cinco
minutos o cinco horas después de recibir una carta.
En el ámbito académico, mantener el horario de oficina es una forma de fusionar las interrupciones
de los estudiantes. Y en el sector privado, la fusión de interrupciones ofrece una
visión redentora de uno de los rituales de oficina más difamados: el semanario
cita. Cualesquiera que sean sus inconvenientes, las reuniones programadas regularmente son una
de nuestras mejores defensas contra la interrupción espontánea y los imprevistos
cambio de contexto.
Quizás el santo patrón del estilo de vida de cambio de contexto mínimo es el
el legendario programador Donald Knuth. “Hago una cosa a la vez”, dice.
“Esto es lo que los científicos de la computación llaman procesamiento por lotes: la alternativa es
intercambiando dentro y fuera. No cambio de entrada y salida ". Knuth no está bromeando. Sobre
El 1 de enero de 2014, se embarcó en "The TeX Tuneup of 2014", en el que
corrigió todos los errores que se habían informado en su software de composición tipográfica TeX
Página 164
durante los seis años anteriores . Su informe termina con la alegre despedida "Quédese
sintonizados para The TeX Tuneup de 2021! " Asimismo, Knuth no ha recibido un correo electrónico.
dirección desde 1990. "El correo electrónico es algo maravilloso para las personas cuyo papel en
la vida es estar al tanto de las cosas. Pero no para mí; mi papel es estar abajo
de cosas. Lo que hago toma largas horas de estudio y es ininterrumpida.
concentración." Revisa todo su correo postal cada tres meses, y todos
sus faxes cada seis.
Pero uno no necesita llevar las cosas al extremo de Knuth para desear que
La mayor parte de nuestras vidas utiliza la fusión de interrupciones como principio de diseño. El cargo
la oficina nos lo da casi por accidente; en otro lugar, tenemos que construirlo, o
exigirlo, por nosotros mismos. Nuestros dispositivos que emiten pitidos y zumbidos tienen el mensaje "N
"Molestar", que podíamos activar y desactivar manualmente en todo el
día, pero ese es un instrumento demasiado contundente. En cambio, podríamos agitarnos por
configuraciones que proporcionarían una opción explícita para interrumpir la fusión: la
lo mismo en una escala de tiempo humana que los dispositivos están haciendo internamente. Alerta
yo sólo una vez cada diez minutos, digamos; entonces cuéntamelo todo.
Página 165
*Irónicamente, el líder del equipo de software Pathfinder, Glenn Reeves, culparía del error a la "fecha límite
presiones ”, y en el hecho de que solucionar este problema en particular durante el desarrollo se había considerado un
"Menor prioridad". Entonces, la causa raíz, en cierto sentido, reflejaba el problema en sí.
Página 166
*Sin embargo, las cosas no son tan malas como podría parecerles este número, ya que incluye
problemas de programación que involucran varias máquinas, que es más como administrar un grupo de
empleados que administrar su calendario.
Página 168
*Dado que muchas computadoras tienden a mostrar descaradamente mensajes de error y diálogos que roban el cursor
cajas cada vez que quieren algo de nosotros, su comportamiento es algo hipócrita. El usuario
La interfaz exige la atención del usuario de una manera que la propia CPU rara vez toleraría.
Página 169
6 Regla de Bayes
Prediciendo el futuro
Página 170
O tal vez un amigo tuyo ha estado saliendo con alguien durante un mes y
quiere su consejo: ¿es demasiado pronto para invitarlos a una próxima
¿Boda de la familia? La relación ha tenido un buen comienzo, pero qué tan lejos
¿Es seguro hacer planes?
Una famosa presentación realizada por Peter Norvig, director de Google
investigación, llevaba el título "La eficacia irrazonable de los datos" y
entusiasmado acerca de "cómo miles de millones de puntos de datos triviales pueden conducir a
comprensión." Los medios de comunicación nos dicen constantemente que vivimos en una "era de
big data ”, cuando las computadoras pueden examinar esos miles de millones de puntos de datos y
encontrar patrones invisibles a simple vista. Pero a menudo los problemas más
relacionados con la vida humana diaria están en el extremo opuesto. Nuestros dias estan llenos
de "datos pequeños". De hecho, como Gott frente al Muro de Berlín, a menudo tenemos
para hacer una inferencia a partir de la menor cantidad de datos que podamos
tener: una sola observación.
Entonces, ¿Cómo lo hacemos? ¿Y cómo deberíamos ?
La historia comienza en la Inglaterra del siglo XVIII, en un dominio de investigación.
irresistible para las grandes mentes matemáticas de la época, incluso las del
clero: juegos de azar.
Página 171
Imaginemos entonces a una persona presente en el sorteo de una lotería, que no sabe nada de su
esquema o de la proporción de espacios en blanco a premios en él. Supongamos además que él es
obligado a inferir esto a partir del número de espacios en blanco que oye dibujados en comparación con el número de
premios ; y que se pregunte qué conclusiones en estas circunstancias puede razonablemente
hacer.
La visión crítica de Bayes fue que tratar de usar los boletos ganadores y perdedores
que vemos para averiguar el grupo de tickets general del que provienen es
esencialmente razonando al revés. Y para hacer eso, argumentó, primero debemos
razón por delante de las hipotéticas. En otras palabras, primero necesitamos
Página 172
determinar qué tan probable es que hubiéramos extraído los boletos que hicimos si
varios escenarios eran ciertos. Esta probabilidad, conocida por los modernos
estadísticos como la "probabilidad": nos da la información que necesitamos para resolver
el problema.
Por ejemplo, imagina que compramos tres boletos y los tres fueron
ganadores. Ahora bien, si el sorteo fue del tipo particularmente generoso en el que todos
los boletos son ganadores, entonces nuestra experiencia de tres por tres, por supuesto,
suceden todo el tiempo; tiene un 100% de posibilidades en ese escenario. Si, en cambio,
solo la mitad de los boletos de la rifa fueron ganadores, nuestra experiencia de tres por tres
sucedería 1 ⁄ 2 × 1 ⁄ 2 × 1 ⁄ 2 del tiempo, o en otras palabras 1 ⁄ 8 del tiempo.
Y si la rifa recompensara solo un boleto entre mil, nuestro resultado sería
han sido increíblemente improbables: 1 ⁄ 1,000 × 1 ⁄ 1,000 × 1 ⁄ 1,000 , o uno en mil millones.
Bayes argumentó que, en consecuencia, deberíamos juzgarlo como más probable
que todos los boletos de la rifa son ganadores que la mitad de ellos, y a su vez
Es más probable que la mitad de ellos lo sea que que solo uno de cada mil lo sea.
Quizás ya lo habíamos intuido, pero la lógica de Bayes nos ofrece la
capacidad para cuantificar esa intuición. En igualdad de condiciones, deberíamos imaginar
es exactamente ocho veces más probable que todos los boletos sean ganadores que eso
la mitad lo son, porque los boletos que sacamos son exactamente ocho veces
más probable (100% frente a uno de cada ocho) en ese escenario. Asimismo, es exactamente
125 millones de veces más probable que la mitad de los boletos de la rifa sean ganadores.
solo hay un boleto ganador por cada mil, que sabemos al comparar
de uno en ocho a uno en mil millones.
Este es el meollo del argumento de Bayes. Razonamiento hacia adelante desde
pasados hipotéticos sientan las bases para que luego trabajemos hacia atrás
el más probable.
Fue un enfoque ingenioso e innovador, pero no logró
dar una respuesta completa al problema de la rifa. Al presentar los resultados de Bayes a
la Royal Society, Price pudo establecer que si compra una sola rifa
boleto y es un ganador, entonces hay un 75% de probabilidad de que al menos la mitad del
los boletos son ganadores. Pero pensar en las probabilidades de las probabilidades puede
dar vueltas un poco la cabeza. Es más, si alguien nos presiona: "Bueno, está bien,
Página 173
pero ¿cuáles crees que son realmente las probabilidades de la rifa ? " todavía no lo sabríamos
quéLa
decir.
respuesta a esta pregunta: cómo destilar todos los posibles
hipótesis en una única expectativa específica, sólo se descubriría una
unos años más tarde, por el matemático francés Pierre-Simon Laplace.
Ley de Laplace
Página 174
Página 175
—DAVID HUME
Página 176
El principio copernicano
Página 177
Página 178
El smartphone tal como lo conocemos apenas tiene una década, y el copernicano
El principio nos dice que no es probable que exista en 2025, y mucho menos cinco
siglos después. Para el 2525 sería un poco sorprendente si hubiera incluso un Nuevo
Ciudad de York.
De manera más práctica, si estamos considerando un empleo en un sitio de construcción
cuya señalización indica que han pasado “7 días desde la última
accidente ", es posible que queramos mantenernos alejados, a menos que sea un trabajo particularmente
planeamos hacer. Y si un sistema de transporte municipal no puede pagar el
Señales en tiempo real increíblemente útiles pero costosas que les indican a los pasajeros cuándo
va a llegar el autobús, el principio copernicano sugiere que podría haber
una alternativa dramáticamente más simple y más barata. Simplemente mostrando cuánto tiempo
Ha pasado desde que el autobús anterior llegó a esa parada ofrece una pista sustancial
acerca de cuándo lo hará el próximo.
Pero, ¿es correcto el principio de Copérnico? Después de que Gott publicó su
conjetura en Nature , la revista recibió una oleada de críticas
correspondencia. Y es fácil ver por qué cuando intentamos aplicar la regla a
algunos ejemplos más familiares. Si conoce a un hombre de 90 años, el
El principio copernicano predice que vivirá hasta los 180 años. Cada niño de 6 años,
mientras tanto, se predice que enfrentará una muerte prematura a la tierna edad de 12 años.
Para comprender por qué funciona el principio copernicano y por qué
a veces no, tenemos que volver a Bayes. Porque a pesar de su aparente
simplicidad, el principio copernicano es realmente un ejemplo de la regla de Bayes.
Página 179
Página 180
produciendo 246 tanques cada mes, mientras que las estimaciones obtenidas por extensos
(y altamente arriesgado) reconocimiento aéreo sugirió que la figura era más como
1.400. Después de la guerra, los registros alemanes revelaron la cifra real: 245.
Reconociendo que el principio copernicano es solo la regla de Bayes con un
El previo no informativo responde a muchas preguntas sobre su validez. los
El principio copernicano parece razonable exactamente en aquellas situaciones en las que
no saben nada en absoluto, como mirar el Muro de Berlín en 1969, cuando
ni siquiera estamos seguros de cuál es la escala de tiempo adecuada. Y se siente completamente
mal en aquellos casos en los que no sabe algo sobre el tema
importar. Predecir que un hombre de 90 años vivirá hasta 180 años parece
irrazonable precisamente porque nos adentramos en el problema sabiendo ya un
mucho sobre la duración de la vida humana, por lo que podemos hacerlo mejor. Cuanto más rico es el an
información que aportamos a la regla de Bayes, más útiles serán las predicciones
puede salir de ella.
En el sentido más amplio, hay dos tipos de cosas en el mundo: cosas que
tienden a (o se agrupan en torno a) algún tipo de valor "natural", y las cosas
que no.
La esperanza de vida humana está claramente en la primera categoría. Ellos aproximadamente
seguir lo que se denomina una distribución "normal", también conocida como la
Distribución "gaussiana", según el matemático alemán Carl Friedrich
Gauss, e informalmente llamada "curva de campana" por su forma característica.
Esta forma hace un buen trabajo al caracterizar la duración de la vida humana; la media
La esperanza de vida de los hombres en los Estados Unidos, por ejemplo, se centra en aproximadamente
años, y las probabilidades caen bastante bruscamente a ambos lados. Normal
Las distribuciones tienden a tener una sola escala apropiada: una vida útil de un dígito es
considerado trágico, uno de tres dígitos extraordinario. Muchas otras cosas en el
mundo natural se distribuyen normalmente también, desde la altura humana, el peso,
y la presión arterial a la temperatura del mediodía en una ciudad y el diámetro
de frutos en un huerto.
Página 181
Página 182
La regla de Bayes nos dice que cuando se trata de hacer predicciones basadas en
evidencia limitada, pocas cosas son tan importantes como tener buenos antecedentes, que
es decir, un sentido de la distribución a partir de la cual esperamos que la evidencia tenga
venir. Por tanto, las buenas predicciones comienzan con tener buenos instintos sobre cuándo
estamos tratando con una distribución normal y cuando con una ley de potencias
distribución. Resulta que la regla de Bayes nos ofrece un método simple pero
regla empírica predictiva dramáticamente diferente para cada uno.
Página 183
posible que una película que ha recaudado $ 6 millones sea en realidad un éxito de taquilla en
su primera hora de lanzamiento, pero es mucho más probable que sea de un solo dígito
millones de películas.
Cuando aplicamos la regla de Bayes con una distribución normal a priori, en
por otro lado, obtenemos un tipo de orientación muy diferente. En lugar de un
regla multiplicativa, obtenemos una regla promedio : use la distribución "natural"
promedio, su escala única y específica, como guía. Por ejemplo, si
alguien es más joven que el promedio de vida, entonces simplemente prediga el
promedio; a medida que su edad se acerca y luego excede el promedio, predice que
vivirán unos años más. Seguir esta regla da una
predicciones para el niño de 90 años y el de 6 años: 94 y 77, respectivamente.
(El niño de 6 años obtiene una pequeña ventaja sobre el promedio de la población de 76 en virtud de
de haber sobrevivido a la infancia: sabemos que no está en la distribución
cola izquierda.)
Los tiempos de ejecución de películas, como las vidas humanas, también siguen un ritmo normal.
distribución: la mayoría de las películas se agrupan alrededor de unos cien minutos, con
un número cada vez menor de excepciones disminuyendo a ambos lados. Pero no todos
las actividades humanas se comportan muy bien. El poeta Dean Young una vez comentó
que cada vez que escucha un poema en secciones numeradas, su corazón se hunde
si el lector anuncia el inicio de la sección cuatro: si hay más de tres
partes, todas las apuestas están canceladas, y Young necesita agacharse para escuchar. Eso
resulta que la consternación de Young es, de hecho, perfectamente bayesiana. Un análisis de
poemas muestra que, a diferencia de los tiempos de proyección de películas, los poemas siguen algo
más cerca de una ley de potencia que una distribución normal: la mayoría de los poemas son cortos, pero
algunos son épicos. Entonces, cuando se trata de poesía, asegúrate de tener un
asiento cómodo. Algo distribuido normalmente que aparentemente ha sucedido
demasiado tiempo terminará pronto; pero cuanto más largo es algo en una ley de potencias
la distribución ha continuado, más tiempo puede esperar que continúe.
Entre esos dos extremos, en realidad hay una tercera categoría de cosas
en la vida: aquellos que no tienen ni más ni menos probabilidades de terminar solo porque
han continuado por un tiempo. A veces las cosas son simplemente ... invariables. los
El matemático danés Agner Krarup Erlang, que estudió tales fenómenos,
formalizó la extensión de los intervalos entre eventos independientes en el
Página 184
Página 185
Página 188
contra una distribución sin memoria, sin embargo, está atascado. El aditivo
La regla te dice que la posibilidad de ganar ahora es la misma que hace una hora,
y lo mismo que será dentro de una hora. Nada cambia. Estás
no recompensado por sobresalir y terminar con una nota alta; tampoco hay un
punto de inflexión en el que debería reducir sus pérdidas. En "El jugador",
Kenny Rogers advirtió que hay que "saber cuándo caminar
distancia / saber cuándo ejecutar”, pero para una distribución sin memoria, no es ningún
momento adecuado para dejar de fumar. Esto puede explicar en parte la adicción de estos juegos.
Saber a qué distribución se enfrenta puede hacer que todas las
diferencia. Cuando el biólogo de Harvard y prolífico divulgador de la ciencia
Stephen Jay Gould descubrió que tenía cáncer, su impulso inmediato
fue leer la literatura médica relevante. Entonces descubrió por qué su
los médicos lo habían disuadido de hacerlo: la mitad de todos los pacientes con su
forma de cáncer murió dentro de los ocho meses posteriores al descubrimiento.
Pero esa estadística, ocho meses, no le dijo nada sobre el
distribución de supervivientes. Si fuera una distribución normal, entonces el promedio
Rule daría un pronóstico bastante claro de cuánto tiempo podría esperar vivir:
unos ocho meses. Pero si fuera una ley de potencia, con una cola que se extiende mucho
hacia la derecha, entonces la situación sería muy diferente: el
La regla multiplicativa le diría que cuanto más vivía, más
evidencia que proporcionaría que viviría más tiempo. Leyendo más, Gould
descubrió que "la distribución era de hecho, fuertemente sesgada a la derecha, con un
cola larga (aunque pequeña) que se extendía durante varios años por encima de los ocho
mediana del mes. No vi ninguna razón por la que no debería estar en esa pequeña cola, y
dio un largo suspiro de alivio ". Gould seguiría viviendo durante veinte
más años después de su diagnóstico.
Josh Tenenbaum, realizó un experimento pidiendo a las personas que hicieran predicciones para un
variedad de cantidades cotidianas, como la duración de la vida humana, el
películas y el tiempo que los representantes de EE. UU. pasarían en el cargo
en un solo dato en cada caso: edad actual, dinero ganado
lejos, y años cumplidos hasta la fecha. Luego compararon las predicciones que la gente
hecho a las predicciones dadas aplicando la regla de Bayes a la realidad real
datos mundiales en cada uno de esos dominios.
Al final resultó que, las predicciones que la gente había hecho eran extremadamente
cercanos a los producidos por la Regla de Bayes. Intuitivamente, las personas hicieron diferentes
tipos de predicciones para cantidades que siguieron diferentes distribuciones—
power-law, normal y Erlang, en el mundo real. En otras palabras, mientras
es posible que no sepa o recuerde conscientemente qué situación requiere la
Regla multiplicativa, promedio o aditiva, las predicciones que hace cada
día tienden a reflejar implícitamente los diferentes casos en los que estas distribuciones
aparecen en la vida cotidiana, y las diferentes formas en que se comportan.
A la luz de lo que sabemos acerca de la regla de Bayes, este notable
El desempeño humano sugiere algo crítico que ayuda a comprender
cómo la gente hace predicciones. Los pequeños datos son grandes datos disfrazados. La razón
a menudo podemos hacer buenas predicciones a partir de una pequeña cantidad de observaciones:
o solo uno, es que nuestros antecedentes son tan ricos. Ya sea que lo sepamos o
no, parece que llevamos en la cabeza antecedentes sorprendentemente precisos
sobre los ingresos brutos de las películas y los tiempos de ejecución, la longitud de los poemas y los térmi
oficina, sin mencionar la duración de la vida humana. No necesitamos reunirlos
explícitamente; los absorbemos del mundo.
El hecho de que, en general, las corazonadas de las personas parecen coincidir
predicciones de la regla de Bayes también hace posible la ingeniería inversa de todos
tipos de distribuciones anteriores, incluso aquellas sobre las que es más difícil obtener
datos autorizados del mundo real. Por ejemplo, el cliente lo mantiene en espera
El servicio es una faceta lamentablemente común de la experiencia humana, pero no hay
Conjuntos de datos disponibles públicamente en tiempos de espera como en Hollywood.
Ingresos brutos de taquilla. Pero si las predicciones de las personas se basan en sus
experiencias, podemos utilizar la regla de Bayes para realizar un reconocimiento indirecto
sobre el mundo minando las expectativas de la gente. Cuando Tom y Josh
Página 190
pidió a la gente que prediga los tiempos de espera a partir de un solo punto de datos, los resultados
sugirió que sus sujetos estaban usando la regla multiplicativa: el total
la espera que la gente espera es una y una tercera vez del tiempo que han esperado hasta ahora.
Esto es consistente con tener una distribución de ley de potencias a priori, donde un
Es posible una amplia gama de escalas. Solo espero que no termines en el Titanic
de tiempos de espera. Durante la última década, enfoques como estos han permitido
científicos cognitivos para identificar las distribuciones previas de las personas en una amplia
franja de dominios, desde la visión hasta el lenguaje.
Sin embargo, aquí hay una advertencia crucial. En los casos en los que no tenemos
buenos antecedentes, nuestras predicciones no son buenas. En el estudio de Tom y Josh, por
Por ejemplo, hubo un tema en el que las predicciones de las personas sistemáticamente
divergía de la regla de Bayes: predecir la duración del reinado de Egipto
faraones. (Da la casualidad de que los reinados de los faraones siguen una distribución de Erlang).
La gente simplemente no tenía suficiente exposición diaria para tener una intuición
sentir el rango de esos valores, por lo que sus predicciones, por supuesto, vacilaron.
Las buenas predicciones requieren buenos antecedentes.
Esto tiene varias implicaciones importantes. Nuestros juicios traicionan nuestro
expectativas, y nuestras expectativas traicionan nuestra experiencia. Lo que proyectamos
sobre el futuro revela mucho: sobre el mundo en el que vivimos y sobre nuestro
propio pasado.
Página 191
El experimentador regresó y recibió dos golosinas como prometió. Pero quizás el más
grupo interesante comprendía los que estaban en el medio, los que manejaban
esperar un poco, pero luego se rindió y se comió la golosina.
Estos casos, en los que los niños lucharon poderosamente y sufrieron valientemente,
solo para ceder y perder el malvavisco extra de todos modos, han sido
interpretado como sugerente de una especie de irracionalidad. Si te vas a derrumbar
¿Por qué no ceder inmediatamente y evitar la tortura? Pero todo depende de
en qué tipo de situación los niños creen que se encuentran. Como la Universidad de
Joe McGuire y Joe Kable de Pensilvania han señalado, si la cantidad
El tiempo que tardan los adultos en regresar se rige por una ley de poder
distribución, con largas ausencias que sugieren esperas aún más largas por delante,
entonces, recortar las pérdidas en algún momento puede tener mucho sentido.
En otras palabras, la capacidad de resistir la tentación puede ser, al menos en parte, una
cuestión de expectativas más que de fuerza de voluntad. Si predice que los adultos tienden
para volver después de breves retrasos, algo así como una distribución normal,
debería poder aguantar. La regla promedio sugiere que después de un doloroso
espera, lo que hay que hacer es aguantar: el experimentador debería estar regresando
En cualquier momento. Pero si no tiene idea de la escala de tiempo del
desaparición, consistente con una distribución de ley de potencias, entonces es una
batalla cuesta arriba. La regla multiplicativa sugiere entonces que una espera prolongada es
solo una pequeña fracción de lo que está por venir.
Décadas después de los experimentos originales con malvaviscos, Walter Mischel
y sus colegas regresaron y observaron cómo les estaba yendo a los participantes
en la vida. Sorprendentemente, encontraron que los niños que habían esperado dos
las golosinas se convirtieron en adultos jóvenes que tuvieron más éxito que los demás,
incluso medidos por métricas cuantitativas como sus puntajes SAT. Si el
La prueba de malvavisco trata sobre la fuerza de voluntad, este es un poderoso testimonio de la
impacto que el aprendizaje del autocontrol puede tener en la vida. Pero si la prueba es menor
acerca de la voluntad que de las expectativas, entonces esto dice algo diferente, tal vez más
historia conmovedora.
Un equipo de investigadores de la Universidad de Rochester exploró recientemente
cómo las experiencias anteriores pueden afectar el comportamiento en la prueba del malvavisco.
Antes de que se mencionaran los malvaviscos, los niños del experimento
Página 192
Como si alguien fuera a comprar varios ejemplares del periódico matutino para
asegurarse de que lo que decía era verdad.
—LUDWIG WITTGENSTEIN
La mejor manera de hacer buenas predicciones, como nos muestra la regla de Bayes, es ser
informado con precisión sobre las cosas que está prediciendo. Es por eso que podemos
hacer un buen trabajo al proyectar la duración de la vida humana, pero se desempeñan mal cuando
pidió estimar los reinados de los faraones.
Página 193
personas en los Estados Unidos que murieron en accidentes automovilísticos durante ese mismo tiempo
mayor que toda la población de Wyoming.
En pocas palabras, la representación de eventos en los medios no rastrea su
frecuencia en el mundo. Como señala el sociólogo Barry Glassner, la tasa de homicidios
en los Estados Unidos disminuyó en un 20% en el transcurso de la década de 1990, sin embargo
durante ese período de tiempo la presencia de violencia armada en las noticias estadounidenses
aumentado en un 600%.
Si quiere ser un buen bayesiano intuitivo, si quiere naturalmente
hacer buenas predicciones, sin tener que pensar en qué tipo de
La regla de predicción es apropiada: necesita proteger sus antecedentes.
Contrariamente a la intuición, eso podría significar apagar las noticias.
Página 195
*Hay una cierta ironía aquí: cuando se trata de tiempo, asumiendo que no hay nada especial en nuestro
La llegada da lugar a que, después de todo, nos imaginemos a nosotros mismos en el mismo centro.
Página 196
*Esto es precisamente lo que hace la Ley de Laplace en su forma más simple: asume que tener 1% o 10% de
la probabilidad de que los boletos sean ganadores es del 50% o del 100%. La fórmula ( w +1) ⁄ ( n +2) puede parecer ingenua en
Su sugerencia de que después de comprar un solo boleto de Powerball perdedor, tiene una probabilidad de 1/3 de ganar en
el próximo, pero ese resultado refleja fielmente las probabilidades en una rifa en la que entras sabiendo
nada en absoluto.
Página 197
7 Sobreajuste
Cuándo pensar menos
mi manera es dividir la mitad de una hoja de papel por una línea en dos columnas, escribiendo sobre una Pro,
y sobre la otra Con. Luego, durante tres o cuatro días de consideración, puse debajo del
Cabezas diferentes Sugerencias breves de los diferentes Motivos que en diferentes Tiempos se me ocurren para o
contra la Medida. Cuando los he reunido todos en una sola vista, me esfuerzo por
estimar sus respectivos pesos; y donde encuentro dos, uno a cada lado, que parecen iguales, yo
tacharlos a ambos: si encuentro un profesional de la Razón igual a algunas estafas de dos Razones, tacho la
Página 198
Tres. Si considero que unas dos Razones son iguales a unas tres Razones a favor, tacho las cinco;
y procediendo así, encuentro por fin dónde se encuentra el Equilibrio; y si después de uno o dos días más
Considerando que nada nuevo que sea de importancia ocurre en ninguno de los lados, llego a un
Determinación en consecuencia.
Franklin incluso pensó en esto como algo así como un cálculo, diciendo:
“He encontrado una gran ventaja de este tipo de ecuación, en lo que puede ser
llamado Álgebra Moral o Prudencial ".
Página 200
199
Diario de Darwin, julio de 1838. Reimpreso con permiso de la Biblioteca de la Universidad de Cambridge.
Todo lo que puedas hacer, lo puedo hacer mejor; Puedo hacer cualquier cosa mejor que tú.
- ANNIE CONSIGUE TU ARMA
Página 201
dará cuenta de las experiencias que ha tenido hasta la fecha y dirá algo
sobre los futuros que estás adivinando. Una buena teoría, por supuesto, servirá
ambos. Pero el hecho de que toda predicción deba, en efecto, ejercer una doble función
crea una cierta tensión inevitable.
Como ilustración de esta tensión, veamos un conjunto de datos que podría tener
ha sido relevante para Darwin: la satisfacción con la vida de las personas durante sus primeros diez años
del matrimonio, de un estudio reciente realizado en Alemania. Cada punto en eso
el gráfico se toma del propio estudio; nuestro trabajo es encontrar la fórmula para un
línea que encajaría en esos puntos y se extendería en el futuro, lo que nos permite
hacer predicciones más allá de la marca de los diez años.
Una posible fórmula usaría un solo factor para predecir la vida.
satisfacción: el tiempo transcurrido desde el matrimonio. Esto crearía una línea recta en el
gráfico. Otra posibilidad es utilizar dos factores, tiempo y tiempo al cuadrado ; los
Página 202
La línea resultante tendría una forma de U parabólica, lo que le permitiría capturar una
relación potencialmente más compleja entre tiempo y felicidad. Y si
ampliamos la fórmula para incluir aún más factores (tiempo al cubo, etc.),
la línea adquirirá cada vez más puntos de inflexión, obteniendo cada vez más
"Flexible" y flexible. Para cuando lleguemos a una fórmula de nueve factores, podremos
capturar relaciones muy complejas de hecho.
Matemáticamente hablando, nuestro modelo de dos factores incorpora todos los
información que entra en el modelo de un factor, y tiene otro término
podría usar también. Asimismo, el modelo de nueve factores aprovecha todos los
información a disposición del modelo de dos factores, más potencialmente lotes
más.
danosSegún esta lógica,
las mejores parece que el modelo de nueve factores siempre debería
predicciones.
Resulta que las cosas no son tan sencillas.
Predicciones de satisfacción con la vida utilizando modelos con diferente número de factores.
Página 203
datos de la encuesta, y su forma curva hace una predicción diferente a largo plazo,
sugiriendo que después del declive inicial la satisfacción con la vida más o menos niveles
con el tiempo. Finalmente, el modelo de nueve factores pasa por todos y cada uno
apuntar en el gráfico; Es esencialmente un ajuste perfecto para todos los datos del
estudio.
En ese sentido, parece que la fórmula de nueve factores es de hecho nuestra mejor
modelo. Pero si miras las predicciones que hace para los años no incluidos
en el estudio, es posible que se pregunte qué tan útil es realmente: predice
miseria en el altar, un aumento vertiginoso y abrupto de satisfacción después de varios meses
del matrimonio, una montaña rusa llena de baches a partir de entonces, y una gran caída después de
año diez. Por el contrario, la nivelación predicha por el modelo de dos factores es
el pronóstico más consistente con lo que dicen los psicólogos y economistas
sobre el matrimonio y la felicidad. (Creen, dicho sea de paso, que simplemente
refleja un retorno a la normalidad, al nivel básico de satisfacción de las personas con
sus vidas, en lugar de cualquier disgusto con el matrimonio en sí).
La lección es la siguiente: de hecho, es cierto que incluir más factores en un modelo
siempre, por definición, lo hará más adecuado para los datos que ya tenemos.
Pero un mejor ajuste para los datos disponibles no significa necesariamente un mejor
predicción.
Página 204
Agregar pequeñas cantidades de "ruido" aleatorio a los datos (simulando los efectos de repetir la encuesta
con un grupo diferente de participantes) produce ondulaciones salvajes en el modelo de nueve factores, mientras que el
En comparación, los modelos de uno y dos factores son mucho más estables y consistentes en sus predicciones.
Por supuesto, un modelo que es demasiado simple, por ejemplo, la línea recta del
Fórmula de un factor: puede fallar al capturar el patrón esencial en los datos. Si
la verdad parece una curva, ninguna línea recta puede hacerlo bien. Sobre el
Por otro lado, un modelo que es demasiado complicado, como nuestro modelo de nueve factores
Página 205
Página 206
imagen o semejanza de cualquier cosa que esté en el cielo ". Y en el Libro de
Reyes, una serpiente de bronce hecha por orden de Dios se convierte en objeto de adoración
e incienso, en lugar de Dios mismo. (Dios no se divierte).
Básicamente, el sobreajuste es una especie de idolatría de los datos, consecuencia de
centrándonos en lo que hemos podido medir en lugar de en lo que importa.
Esta brecha entre los datos que tenemos y las predicciones que queremos es
prácticamente en todas partes. Al tomar una gran decisión, solo podemos adivinar
¿Qué nos complacerá más adelante al pensar en los factores importantes para nosotros?
ahora. (Como dice Daniel Gilbert de Harvard, nuestro yo futuro a menudo “paga bien
dinero para quitar los tatuajes por los que pagamos un buen dinero ”).
hacer un pronóstico financiero, solo podemos ver lo que se correlaciona con el
precio de una acción en el pasado, no lo que podría ser en el futuro. Incluso en nuestro pequeño
Actos diarios que mantiene este patrón: escribiendo un correo electrónico, usamos nuestra propia lectura
del texto para predecir el del destinatario. No menos que en las encuestas públicas, el
Por lo tanto, los datos en nuestras propias vidas también son siempre ruidosos, en el mejor de los casos u
las cosas que realmente nos importan.
Como consecuencia, considerar cada vez más factores y gastar
Un mayor esfuerzo para modelarlos puede llevarnos al error de optimizar para el
algo equivocado: ofrecer oraciones a la serpiente de bronce de datos en lugar de al
mayor fuerza detrás de él.
Página 207
Página 208
Quizás en ninguna parte, sin embargo, el sobreajuste sea tan poderoso y problemático
como en el mundo empresarial. "Las estructuras de incentivos funcionan", como dijo Steve Jobs
eso. "Por lo tanto, debe tener mucho cuidado con lo que incentiva a la gente a hacer, porque
Varias estructuras de incentivos crean todo tipo de consecuencias que no puedes
prever." Sam Altman, presidente de la incubadora de startups Y Combinator,
se hace eco de las palabras de advertencia de Jobs: “Realmente es cierto que la empresa construirá
lo que el CEO decida medir ".
De hecho, es increíblemente difícil inventar incentivos o
Medidas que no tienen ningún tipo de efecto perverso. En la década de 1950,
El profesor de administración de Cornell, VF Ridgway, catalogó una serie de
"Consecuencias disfuncionales de las mediciones del desempeño". En un trabajo
empresa de colocación, los empleados fueron evaluados en función del número de entrevistas que
llevado a cabo, lo que los motivó a ejecutar las reuniones tan rápido como
posible, sin dedicar mucho tiempo a ayudar a sus clientes a encontrar
trabajos. En una agencia federal de aplicación de la ley, los investigadores reciben mensualmente
Se encontró que las cuotas de desempeño seleccionan casos fáciles al final del mes.
en lugar de los más urgentes. Y en una fábrica, centrándonos en la producción
métricas llevaron a los supervisores a descuidar el mantenimiento y las reparaciones, estableciendo el fu
catástrofe. Tales problemas no pueden simplemente descartarse como una falla en
lograr los objetivos de gestión. Más bien, son lo contrario: los despiadados y
optimización inteligente de lo incorrecto.
El cambio del siglo XXI hacia la analítica en tiempo real solo ha hecho que
peligro de métricas más intensas. Avinash Kaushik, marketing digital
evangelista de Google, advierte que intentar que los usuarios del sitio web vean tantas
anuncios como sea posible, naturalmente, se convierte en tratar de abarrotar los sitios con anuncios: "Cu
se le paga sobre la base del [costo por cada mil impresiones] el incentivo es
descubra cómo mostrar la mayor cantidad de anuncios posibles en cada página [y] asegúrese de
el visitante ve la mayor cantidad de páginas posibles en el sitio ... Ese incentivo
quita un enfoque de la entidad importante, su cliente, y lo coloca en
la entidad secundaria, su anunciante ". El sitio web podría ganar un poco más
dinero a corto plazo, pero artículos repletos de anuncios, carga lenta de varias páginas
presentaciones de diapositivas y titulares sensacionalistas de clickbait alejarán a los lectores
Página 209
a la larga. Conclusión de Kaushik: "Los amigos no dejan que los amigos midan
Vistas de página. Siempre."
En algunos casos, la diferencia entre un modelo y el mundo real es
literalmente una cuestión de vida o muerte. En el ejército y en la aplicación de la ley,
Por ejemplo, el entrenamiento repetitivo y de memoria se considera un medio clave para inculcar
habilidades de línea de fuego. El objetivo es practicar ciertos movimientos y tácticas hasta el punto.
que se vuelven totalmente automáticos. Pero cuando el sobreajuste se arrastra, puede
resultar desastroso. Hay historias de policías que se encuentran
por ejemplo, tomarse un tiempo durante un tiroteo para poner sus casquillos gastados en
sus bolsillos: buena etiqueta en un campo de tiro. Como ex guardabosques del ejército
y el profesor de psicología de West Point, Dave Grossman, escribe: "Después de la
El humo se había asentado en muchos tiroteos reales, los oficiales se sorprendieron al descubrir
latón vacío en sus bolsillos sin ningún recuerdo de cómo llegó allí. En varios
ocasiones, policías muertos fueron encontrados con bronce en sus manos, muriendo en el
en medio de un procedimiento administrativo que se les había perforado ”.
De manera similar, el FBI se vio obligado a cambiar su entrenamiento después de que se encontraron age
disparando reflexivamente dos tiros y luego enfundando su arma, un estándar
cadencia en el entrenamiento, independientemente de si sus disparos habían dado en el blanco y
si todavía existía una amenaza. Errores como estos son conocidos por la ley.
la aplicación de la ley y el ejército como "cicatrices de entrenamiento", y reflejan el hecho
que es posible sobreajustar la propia preparación. En uno particularmente
caso dramático, un oficial instintivamente arrebató el arma de las manos de
un asaltante y luego instintivamente se lo devolvió, tal como lo había hecho
una y otra vez con sus entrenadores en la práctica.
Porque el sobreajuste se presenta inicialmente como una teoría que encaja perfectamente
datos disponibles, puede parecer insidiosamente difícil de detectar. Como podemos esperar
para distinguir entre un modelo realmente bueno y uno que es
sobreajuste? En un entorno educativo, ¿cómo podemos distinguir entre un
clase de estudiantes sobresaliendo en la materia y una clase simplemente siendo
"Enseñado para la prueba"? En el mundo empresarial, ¿cómo podemos distinguir a una estrella genuina
Página 210
serviría para realizar una validación cruzada: asegurarse de que los estudiantes
Adquirir el conocimiento que la prueba estandarizada debe medir, y
no simplemente mejorando en la realización de exámenes. Si los puntajes estandarizados de una escuela
aumentó mientras que su desempeño "no estandarizado" se movió en el sentido contrario
dirección, los administradores tendrían una clara señal de advertencia de que "enseñar a
la prueba "había comenzado, y las habilidades de los alumnos estaban comenzando a
mecánica de la prueba en sí.
La validación cruzada también ofrece una sugerencia para la aplicación de la ley y
personal militar que busca inculcar buenos reflejos sin martillar
hábitos del propio proceso de formación. Así como los ensayos y los exámenes orales pueden
Validar pruebas estandarizadas de forma cruzada, por lo que es un "entrenamiento cruzado" poco famili
Las evaluaciones pueden usarse para medir si el tiempo de reacción y el disparo
la precisión se generaliza a tareas desconocidas. Si no lo son, entonces es un
señal fuerte para cambiar el régimen de entrenamiento. Si bien nada puede realmente
preparar uno para el combate real, ejercicios como este pueden al menos advertir en
avanzar donde es probable que se hayan formado "cicatrices de entrenamiento".
Hemos visto algunas de las formas en que el sobreajuste puede levantar la cabeza, y hemos
examinó algunos de los métodos para detectarlo y medirlo. Pero que podemos
realmente hacer para aliviarlo?
Desde el punto de vista estadístico, el sobreajuste es un síntoma de estar demasiado
sensible a los datos reales que hemos visto. La solución, entonces, es
sencillo: debemos equilibrar nuestro deseo de encontrar un buen ajuste con el
complejidad de los modelos que utilizamos para hacerlo.
Una forma de elegir entre varios modelos de la competencia es el de Occam
principio de navaja, lo que sugiere que, en igualdad de condiciones, el más simple
La hipótesis posible es probablemente la correcta. Por supuesto, las cosas rara vez son
completamente iguales, por lo que no es inmediatamente obvio cómo aplicar algo
Página 212
Página 213
La ventaja de la heurística
El economista Harry Markowitz ganó el Premio Nobel de Economía en 1990
para el desarrollo de la teoría moderna de la cartera: su innovador "significado
optimización de la cartera de varianza ”mostró cómo un inversor puede hacer una
Asignación óptima entre varios fondos y activos para maximizar los rendimientos a un
determinado nivel de riesgo. Entonces, cuando llegó el momento de invertir su propia jubilación
ahorros, parece que Markowitz debería haber sido la única persona perfectamente
equipado para el trabajo. ¿Qué decidió hacer?
Debería haber calculado las covarianzas históricas de las clases de activos y dibujado una
frontera. En cambio, visualicé mi dolor si el mercado de valores subiera mucho y yo no estuviera en él, o si
bajó mucho y yo estaba completamente en él. Mi intención era minimizar mi futuro arrepentimiento.
Así que dividí mis contribuciones al cincuenta por ciento entre bonos y acciones.
Página 214
la complejidad de la vida real que una simple heurística podría de hecho ser la
solución racional.
En lo que respecta a la gestión de carteras, resulta que, a menos que esté
altamente confiado en la información que tiene sobre los mercados, puede
en realidad sería mejor ignorar esa información por completo. Aplicando
El esquema óptimo de asignación de carteras de Markowitz requiere tener buenos
estimaciones de las propiedades estadísticas de diferentes inversiones. Un error en
esas estimaciones pueden resultar en asignaciones de activos muy diferentes, potencialmente
riesgo creciente. Por el contrario, dividir su dinero de manera uniforme entre acciones y
Los bonos no se ven afectados en absoluto por los datos que ha observado. Esta estrategia
ni siquiera intenta adaptarse a la actuación histórica de aquellos
tipos de inversión, por lo que no hay forma de que se ajuste demasiado .
Por supuesto, usar una división al cincuenta por ciento no es necesariamente la complejidad
punto óptimo, pero hay algo que decir al respecto. Si por casualidad conoces
la media esperada y la varianza esperada de un conjunto de inversiones, luego use
Optimización de la cartera de varianza media: el algoritmo óptimo es óptimo para
una razón. Pero cuando las probabilidades de estimarlas todas correctamente son bajas y
el peso que el modelo pone en esas cantidades no confiables es alto,
entonces debería sonar una alarma en el proceso de toma de decisiones: es hora
regularizar.
Inspirándose en ejemplos como los ahorros para la jubilación de Markowitz, los psicólogos
Gerd Gigerenzer y Henry Brighton han argumentado que la toma de decisiones
Los atajos que la gente usa en el mundo real son, en muchos casos, exactamente el tipo de
pensar que contribuye a tomar buenas decisiones. "En contraste con la opinión generalizada
que menos procesamiento reduce la precisión ", escriben," el estudio de la heurística
muestra que menos información, cálculo y tiempo pueden, de hecho, mejorar
precisión." Una heurística que favorece respuestas más simples, con menos factores, o
Menos cálculo: ofrece precisamente estos efectos de “menos es más”.
La imposición de sanciones a la complejidad última de un modelo no es la única
forma de aliviar el sobreajuste, sin embargo. También puede empujar un modelo hacia
simplicidad controlando la velocidad con la que le permite adaptarse a
datos entrantes. Esto hace que el estudio del sobreajuste sea una guía esclarecedora para
nuestra historia, tanto como sociedad como como especie.
Página 215
El peso de la historia
Todos los alimentos que ha ingerido una rata viva, necesariamente, no la han matado.
—SAMUEL REVUSKY Y ERWIN BEDARF, “ASOCIACIÓN DE ENFERMEDADES CON INGESTIÓN PREVIA
DE ALIMENTOS NOVEDOSOS ”
El mercado de la leche de soja en los Estados Unidos se multiplicó por más de cuatro
desde mediados de la década de 1990 hasta 2013. Pero a finales de 2013, según los titulares de las noticias
ya parecía ser una cosa del pasado, un lejano segundo lugar a la almendra
Leche. Como le dijo a Bloomberg el investigador de alimentos y bebidas Larry Finkel
Businessweek : “Las nueces están de moda ahora. La soya suena más a anticuada
Comida saludable." La empresa Silk, famosa por popularizar la leche de soja (como
nombre implica), informó a finales de 2013 que sus productos de leche de almendras habían
crecido en más del 50% solo en el trimestre anterior. Mientras tanto, en otro
noticias de bebidas, la marca líder de agua de coco, Vita Coco, informó en
2014 que sus ventas se habían duplicado desde 2011 y habían aumentado un
asombroso trescientas veces desde 2004. Como dijo el New York Times ,
"El agua de coco parece haber pasado de invisible a inevitable
sin una pausa en el ámbito de lo vagamente familiar ". Mientras tanto, la col rizada
El mercado creció un 40% solo en 2013. El mayor comprador de col rizada del año
antes había sido Pizza Hut, que lo puso en sus barras de ensaladas, como decoración.
Algunos de los dominios ms fundamentales de la vida humana, como el
cuestión de lo que deberíamos poner en nuestro cuerpo, curiosamente parecen ser los
la mayoría dominada por modas pasajeras. Parte de lo que permite que estas modas tomen
el mundo por asalto es lo rápido que nuestra cultura puede cambiar. Informacion ahora
fluye a través de la sociedad más rápido que nunca, mientras que las cadenas de suministro globales
permitir a los consumidores cambiar rápidamente sus hábitos de compra en masa (y
el marketing les anima a hacerlo). Si ocurre algún estudio en particular
sugerir un beneficio para la salud de, digamos, anís estrellado, puede estar en todo el
blogosfera dentro de la semana, en la televisión la semana siguiente, y en
aparentemente todos los supermercados en seis meses, con anís estrellado dedicado
libros de cocina pronto saldrán de las prensas. Esta impresionante velocidad es a la vez un
bendición y maldición.
Página 216
Por el contrario, si observamos la forma en que los organismos, incluidos los humanos,
evolucionar, notamos algo intrigante: el cambio ocurre lentamente. Esto significa
que las propiedades de los organismos de hoy en día están determinadas no sólo por su
entornos actuales, sino también por su historia. Por ejemplo, el curiosamente
Disposición cruzada de nuestro sistema nervioso (el lado izquierdo de nuestro cuerpo
controlado por el lado derecho de nuestro cerebro y viceversa) refleja el
Historia evolutiva de los vertebrados. Este fenómeno, llamado "decusación",
Se teoriza que surgió en un punto de la evolución cuando los primeros vertebrados
cuerpos torcidos 180 grados con respecto a sus cabezas; mientras que el nervio
cordones de invertebrados como langostas y lombrices de tierra corren sobre el "vientre"
lado del animal, los vertebrados tienen sus cordones nerviosos a lo largo de la columna
en lugar de.
El oído humano ofrece otro ejemplo. Visto desde un funcional
perspectiva, es un sistema para traducir ondas de sonido en señales eléctricas
mediante amplificación a través de tres huesos: el martillo, el yunque y el estribo. Esta
El sistema de amplificación es impresionante, pero los detalles de cómo funciona
mucho que ver con las limitaciones históricas. Resulta que los reptiles solo tienen un
un solo hueso en la oreja, pero huesos adicionales en la mandíbula de los que carecen los mamíferos.
Aparentemente, esos huesos de la mandíbula se reutilizaron en la oreja de los mamíferos. Entonces el
La forma exacta y la configuración de la anatomía de nuestra oreja reflejan nuestra evolución
historia al menos tanto como el problema auditivo que se resuelve.
El concepto de sobreajuste nos da una forma de ver la virtud en tales
bagaje evolutivo. Aunque fibras nerviosas cruzadas y reutilizadas
las mandíbulas pueden parecer arreglos subóptimos, no necesariamente
quieren que la evolución optimice completamente un organismo para cada cambio en su
nicho ambiental, o, al menos, deberíamos reconocer que hacerlo
hacerlo extremadamente sensible a futuros cambios ambientales. Tener que
hacer uso de materiales existentes, por otro lado, impone una especie de utilidad
restricción. Hace que sea más difícil inducir cambios drásticos en la estructura de
organismos, más difíciles de sobreajustar. Como especie, constreñida por el pasado
nos hace menos perfectamente adaptados al presente que conocemos, pero nos ayuda a mantenernos
robusto para el futuro no lo hacemos.
Página 217
Una idea similar podría ayudarnos a resistir las rápidas modas de los humanos.
sociedad. Cuando se trata de cultura, la tradición juega el papel de
limitaciones evolutivas. Un poco de conservadurismo, un cierto sesgo a favor de
historia, puede protegernos contra el ciclo de auge y caída de las modas. Eso no
significa que debemos ignorar los datos más recientes, por supuesto. Salta hacia el
al carro, por supuesto, pero no necesariamente en él.
En el aprendizaje automático, las ventajas de moverse lentamente emergen más
concretamente en una técnica de regularización conocida como parada anticipada . Cuando
miramos los datos de la encuesta de matrimonio alemana al comienzo de la
capítulo, pasamos directamente a examinar el mejor ajuste de uno, dos y nueve
modelos factoriales. En muchas situaciones, sin embargo, ajustar los parámetros para encontrar
el mejor ajuste posible para los datos dados es un proceso en sí mismo. Qué
sucede si detenemos ese proceso antes de tiempo y simplemente no permitimos que un modelo
¿Es hora de volverse demasiado complejo? Una vez más, lo que podría parecer a primera vista
ser poco entusiasta o descuidado surge, en cambio, como una estrategia importante
en su propio derecho.
Muchos algoritmos de predicción, por ejemplo, comienzan buscando el
factor único más importante en lugar de saltar a un modelo de múltiples factores.
Solo después de encontrar ese primer factor, buscan el siguiente factor más importante.
factor para agregar al modelo, luego el siguiente, y así sucesivamente. Sus modelos pueden
Por lo tanto, evitar que se vuelva demasiado complejo simplemente deteniendo el
proceso corto, antes de que el sobreajuste haya tenido la oportunidad de introducirse.
El enfoque para calcular las predicciones considera un punto de datos a la vez, con
el modelo ajustado para tener en cuenta cada nuevo punto antes de que se acumulen más puntos
adicional; allí, también, la complejidad del modelo aumenta gradualmente, por lo que
detener el proceso brevemente puede ayudar a evitar que se sobreajuste.
Este tipo de configuración, donde más tiempo significa más complejidad,
caracteriza muchos esfuerzos humanos. Dándose más tiempo para
decidir sobre algo no significa necesariamente que harás una mejor
decisión. Pero sí garantiza que terminará considerando más factores,
más hipotéticos, más pros y contras y, por lo tanto, corre el riesgo de sobreajuste.
Tom tuvo exactamente esta experiencia cuando se convirtió en profesor. Su primera
semestre, enseñando su primera clase, pasó una gran cantidad de tiempo
Página 218
perfeccionando sus conferencias: más de diez horas de preparación por cada hora
de clase. Su segundo semestre, enseñando una clase diferente, no pudo
invirtió tanto tiempo y le preocupaba que fuera un desastre. Pero un extraño
Sucedió algo: a los estudiantes les gustó la segunda clase. De hecho les gustó
más que el primero. Resultó que esas horas extra se habían gastado
clavando los detalles esenciales que solo confundieron a los estudiantes y hirieron
hasta ser cortado de las conferencias la próxima vez que Tom enseñó la clase. los
Tom finalmente se dio cuenta de que el problema subyacente era que había estado usando su propio
el gusto y el juicio como una especie de métrica indirecta para sus estudiantes '. Este proxy
métrica funcionó razonablemente bien como una aproximación, pero no valió la pena
sobreajuste, lo que explica por qué dedicar horas extra
"Perfeccionar" todas las diapositivas había sido contraproducente.
La efectividad de la regularización en todo tipo de tareas de aprendizaje automático
sugiere que podemos tomar mejores decisiones si pensamos deliberadamente y
haciendo menos. Si es probable que los factores que se nos ocurran primero sean los más
importantes, luego, más allá de cierto punto, pensar más en un problema
no solo será una pérdida de tiempo y esfuerzo, sino que nos llevará a cosas peores
soluciones. La detención anticipada proporciona la base para un argumento razonado
contra el razonamiento, el caso de la persona pensante contra el pensamiento. Pero girando
esto en un consejo práctico requiere responder una pregunta más: cuándo
¿Deberíamos dejar de pensar?
Como ocurre con todos los problemas relacionados con el sobreajuste, qué tan pronto detenerse depende
brecha entre lo que se puede medir y lo que realmente importa. Si tienes todo
los hechos, están libres de todo error e incertidumbre, y puede directamente
evalúe lo que sea importante para usted, luego no se detenga antes. Piensa mucho y
difícil: la complejidad y el esfuerzo son los adecuados.
Pero ese casi nunca es el caso. Si tiene mucha incertidumbre y
datos limitados, entonces deténgase temprano por todos los medios. Si no tienes una lectura clara
sobre cómo será evaluado su trabajo y por quién, entonces no vale la pena
tiempo extra para hacerlo perfecto con respecto al suyo (o al de cualquier otra persona)
Página 219
conjetura idiosincrásica de lo que podría ser la perfección. Cuanto mayor sea la incertidumbre,
Cuanto mayor sea la brecha entre lo que puede medir y lo que importa, la
más debe tener cuidado con el sobreajuste, es decir, más debe
prefiera la simplicidad, y cuanto antes debe detenerse.
Cuando esté realmente en la oscuridad, los planes mejor diseñados serán los más simples.
Cuando nuestras expectativas son inciertas y los datos son ruidosos, la mejor opción es
pintar con un pincel grueso, pensar a grandes rasgos. A veces literalmente.
Como explican los empresarios Jason Fried y David Heinemeier Hansson, el
más adelante necesitan hacer una lluvia de ideas, cuanto más grueso es el bolígrafo que usan, un
forma inteligente de simplificación por tamaño de trazo:
Cuando comenzamos a diseñar algo, esbozamos ideas con un marcador Sharpie grande y grueso,
en lugar de un bolígrafo. ¿Por qué? Los puntos de la pluma son demasiado finos. Tienen una resolución demasiado alta. Ellos
animarte a preocuparte por cosas de las que no deberías preocuparte todavía, como perfeccionar el
sombreado o si utilizar una línea punteada o discontinua. Terminas enfocándote en cosas que deberían
todavía estar fuera de foco.
Un Sharpie hace que sea imposible perforar tan profundo. Solo puede dibujar formas, líneas y
cajas. Eso es bueno. El panorama general es lo único de lo que debería preocuparse al principio.
Página 220
*Para los matemáticos, esa es la suma de los valores absolutos de los coeficientes de las variables.
Página 222
8 Relajación
Dejalo deslizar
Página 223
Página 224
acuerdo que todas las partes acordaron fue un éxito, aunque la madre del
la novia no pudo resistirse a hacer unos pocos ajustes manuales.
El hecho de que toda la potencia informática de un laboratorio en Princeton no pudiera encontrar
el plan de asientos perfecto puede parecer sorprendente. En la mayoría de los dominios
que hemos discutido hasta ahora, los algoritmos sencillos podrían garantizar un óptimo
soluciones. Pero como los científicos de la computación han descubierto en los últimos
décadas, hay clases enteras de problemas donde una solución perfecta es
esencialmente inalcanzable, no importa qué tan rápido hagamos nuestras computadoras o cuán
los programamos inteligentemente. De hecho, nadie entiende tan bien como un
informático que ante un desafío aparentemente inmanejable,
no deberías esforzarte eternamente ni rendirte, pero, como veremos, prueba una tercera
cosa por completo.
La dificultad de la optimización
Página 225
Página 226
Definición de dificultad
Página 227
manos. Como nos dijo el experto en programación Jan Karel Lenstra: “Cuando el problema
es difícil, no significa que puedas olvidarlo, significa que está en
un estado diferente. Es un enemigo serio, pero aún tienes que luchar contra él ". Y
aquí es donde el campo descubrió algo invaluable, algo que podemos
todos aprenden de: cómo abordar mejor los problemas cuyas respuestas óptimas son
fuera de alcance. Cómo relajarse.
Relájate
Cuando alguien te dice que te relajes, probablemente sea porque estás tenso ...
haciendo cosas más grandes de las que debería. Cuando los informáticos
se enfrentan a un desafío formidable, sus mentes también se vuelven hacia la relajación, ya que
pasan libros como Introducción a los métodos de relajación o
Técnicas de relajación discretas . Pero no se relajan; ellos se relajan
el problema.
Una de las formas más simples de relajación en informática se conoce como
Restricción Relajación . En esta técnica, los investigadores eliminan algunos de los
limitaciones del problema y se dispusieron a resolver el problema que desearían tener.
Luego, después de haber logrado cierto progreso, intentan agregar el
restricciones. Es decir, hacen que el problema sea más fácil de resolver temporalmente.
manejar antes de devolverlo a la realidad.
Por ejemplo, puede relajar el problema del vendedor ambulante dejando que el
vendedor visita la misma ciudad más de una vez, y le permite volver sobre su
pasos gratis. Encontrar la ruta más corta bajo estas reglas más flexibles produce
lo que se llama el "árbol de expansión mínimo". (Si lo prefiere, también puede
Piense en el árbol de expansión mínimo como la menor cantidad de millas de carretera necesarias para
conectar cada ciudad con al menos otra ciudad. El viaje más corto
la ruta del vendedor y el árbol de expansión mínimo para el circuito judicial de Lincoln
se muestran a continuación). Como resultado, resolver este problema más flexible requiere un
computadora esencialmente no hay tiempo en absoluto. Y mientras que el árbol de expansión mínimo
Página 228
Página 230
Página 231
Página 232
y el problema de la invitación a la fiesta son insolubles: no hay
existe una solución para ellos. Pero, resulta que existen varios
estrategias eficientes para resolver las versiones continuas de estos problemas,
donde cualquier fracción o decimal es una posible solución. Investigadores confrontados
con un problema de optimización discreto podría mirar esas estrategias
con envidia, pero también pueden hacer más que eso. Pueden intentar relajar sus
problema discreto en uno continuo y ver qué pasa.
En el caso del problema de la invitación, relajarlo de discreto a
optimización continua significa que una solución puede indicarnos que enviemos a alguien
una cuarta parte de una invitación y otra persona dos tercios de una. Que hace
eso incluso significa? Obviamente, no puede ser la respuesta a la pregunta original,
pero, como el árbol de expansión mínimo, nos da un lugar para comenzar. Con
la solución relajada en la mano, podemos decidir cómo traducir esas fracciones
de vuelta a la realidad. Podríamos, por ejemplo, elegir simplemente redondearlos como
necesario, enviando invitaciones a todos los que recibieron "media invitación" o
más en el escenario relajado. También podríamos interpretar estas fracciones como
probabilidades, por ejemplo, lanzar una moneda por cada lugar donde el
La solución relajada nos dice que coloquemos medio camión de bomberos y, de hecho, coloquemos un ca
allí solo si aterriza cabezas. En cualquier caso, con estas fracciones invertidas
a números enteros, tendremos una solución que tenga sentido en el contexto de
nuestro problema original y discreto.
El paso final, como con cualquier relajación, es preguntarse qué tan buena es esta solución.
en comparación con la mejor solución real que podríamos haber encontrado por
Comprobando exhaustivamente todas y cada una de las posibles respuestas al problema original.
Resulta que para el problema de las invitaciones, Relajación Continua con
el redondeo nos dará una solución fácilmente calculada que no es tan mala: es
matemáticamente garantizado para llevar a todos los que quieras a la fiesta mientras
enviar como máximo el doble de invitaciones que la mejor solución
obtenible por fuerza bruta. De manera similar, en el problema del camión de bomberos, Continuous
La relajación con probabilidades puede llevarnos rápidamente dentro de un límite cómodo
de la respuesta óptima.
La relajación continua no es una fórmula mágica: todavía no nos da un
manera eficiente de llegar a las respuestas verdaderamente óptimas, solo a sus
Página 233
Vizzini: ¡Inconcebible!
Iñigo Montoya: Sigues usando esa palabra. No creo que signifique lo que
crees que significa.
- LA PRINCESA NOVIA
Un día, cuando era niño, Brian se quejaba con su madre por todos los
cosas que tenía que hacer: sus deberes, sus quehaceres… “Técnicamente, no
tengo que hacer cualquier cosa ”, respondió su madre. "No tienes que hacer lo que tu
los maestros te lo dicen. No tienes que hacer lo que te digo. Ni siquiera tienes
obedecer la ley. Hay consecuencias para todo, y llegas a
decide si quieres afrontar esas consecuencias ".
La mente de niño de Brian estaba alucinada. Fue un mensaje poderoso, un despertar
de un sentido de agencia, responsabilidad, juicio moral. Era algo más,
también: una poderosa técnica computacional llamada Relajación Lagrangiana .
La idea detrás de Lagrangian Relaxation es simple. Un problema de optimización
tiene dos partes: las reglas y el registro de resultados. En Relajación Lagrangiana,
tomar algunas de las limitaciones del problema y convertirlas en la puntuación
sistema en su lugar. Es decir, tomamos lo imposible y lo rebajamos a costoso.
(En la optimización de los asientos de una boda, por ejemplo, podríamos relajar la
restricción de que cada mesa tiene capacidad para diez personas como máximo, lo que permite que las m
con algún tipo de penalización.) Cuando se produce un problema de optimización
restricciones dicen "¡Hazlo, o de lo contrario!", La relajación lagrangiana responde, "O si no
¿qué?" Una vez que podamos colorear fuera de las líneas, aunque sea un poco, e incluso
a un costo elevado, los problemas se vuelven manejables que antes no eran manejables.
Las relajaciones lagrangianas son una gran parte de la literatura teórica sobre
El problema del viajante y otros problemas difíciles en la computadora.
Ciencias. También son una herramienta fundamental para una serie de aplicaciones prácticas.
Página 234
Página 235
eventos en sus arenas. En el caso del baloncesto de la NCAA, Trick también tiene que
considerar otras limitaciones provenientes de las cadenas de televisión que
retransmitir los juegos. Los canales de televisión definen con un año de antelación lo que
anticipan que los "juegos A" y los "juegos B" serán los juegos que atraerán
la mayor audiencia. (Duke vs. UNC es un juego A perenne, por ejemplo).
Luego, los canales esperan un juego A y un juego B cada semana, pero
nunca dos juegos A al mismo tiempo, no sea que se divida la audiencia.
Como era de esperar, dadas todas estas demandas, Trick ha descubierto que la informática
un horario deportivo a menudo se vuelve posible solo suavizando algunos de estos
restricciones duras.
Por lo general, cuando las personas acuden a nosotros por primera vez con un calendario deportivo, dirán ... "Nunca
hacemos x y nosotros nunca hacemos y ". Luego miramos sus horarios y decimos: "Bueno, dos veces lo hiciste x
y tres veces más que lo hicieron y el año pasado “. Luego “Oh, sí, bueno, está bien. Entonces, aparte de eso, nunca
hazlo." Y luego volvemos al año anterior ... En general, nos damos cuenta de que hay algunas cosas
piensan que nunca hacen que las personas no lo hacen. La gente en el béisbol cree que los Yankees y los
Los Mets nunca están en casa al mismo tiempo. Y no es verdad. Nunca ha sido verdad. Están en
en casa quizás tres juegos, quizás seis juegos en un año el mismo día. Pero en el amplio
temporada, ochenta y un partidos en casa para cada uno de los equipos, es relativamente raro, la gente se olvida
ellos.
Página 236
las opciones marcadas de uno u otro, sin un término medio, son las más típicas de ellas.
Aquí, la informática da un veredicto desalentador. Muchos discretos
Los problemas de optimización son realmente difíciles. Las mentes más brillantes del campo han llegado
vacío en cada intento de encontrar un camino fácil hacia respuestas perfectas, y en
De hecho, están cada vez más dedicados a demostrar que tales caminos no existen.
que buscarlos.
Al menos, esto debería ofrecernos algún consuelo. Si estamos en contra
un problema que parece retorcido, espinoso, intransitable, bueno, podríamos tener razón.
Y tener una computadora no necesariamente ayudará.
Al menos, no a menos que podamos aprender a relajarnos.
Hay muchas formas de relajar un problema, y hemos visto tres de las
lo más importante. El primero, la relajación de restricciones, simplemente elimina algunos
restricciones por completo y avanza en una forma más flexible del problema
antes de volver a la realidad. El segundo, Relajación Continua, gira
opciones discretas o binarias en continuos: al decidir entre té helado
y limonada, primero imagina una mezcla 50-50 "Arnold Palmer" y luego redondea
hacia arriba o hacia abajo. El tercero, la relajación lagrangiana, convierte las imposibilidades en
meras penas, enseñando el arte de doblar las reglas (o romperlas y
aceptando las consecuencias). Una banda de rock decidiendo qué canciones meter
en un conjunto limitado, por ejemplo, se enfrenta a lo que los informáticos llaman
el "problema de la mochila", un acertijo que pide a uno que decida cuál de un conjunto de
artículos de diferente volumen e importancia para envasar en un volumen reducido. En
En su formulación estricta, el problema de la mochila es famoso por su intratable, pero que
No es necesario que desanime a nuestras relajadas estrellas de rock. Como se demostró en varios
ejemplos célebres, a veces es mejor simplemente jugar un poco más allá de la ciudad
toque de queda e incurrir en las multas correspondientes que limitar el espectáculo a los disponibles
espacio. De hecho, incluso cuando no cometas la infracción, simplemente imaginando
puede ser esclarecedor.
El columnista británico conservador Christopher Booker dice que "cuando
nos embarcamos en un curso de acción que es impulsado inconscientemente por deseos
pensando, todo puede parecer ir bien por un tiempo ”, pero eso debido a que“ esto hace que
creer que nunca se puede reconciliar con la realidad ”, conducirá inevitablemente a lo que
describe como un desglose de varias etapas: "sueño", "frustración",
Página 237
Página 238
*Puede parecer extraño, dado que O ( n 2 ) parecía tan odioso en el contexto de clasificación, llamarlo "eficiente"
aquí. Pero la verdad es que incluso el tiempo exponencial con un número base modestamente pequeño, como O (2 n ),
rápidamente se vuelve infernal incluso cuando se compara con un polinomio con una base grande, como n 10 . El exponente
siempre superará al polinomio en algún tamaño de problema; en este caso, si está ordenando más de
varias docenas de elementos, n 10 comienza a parecerse a un paseo por el parque en comparación con 2 n . Desde que Cobham y
El trabajo de Edmonds, este abismo entre "polinomios" ( n -to-the-something) y "exponenciales"
(algo-a-la- n ) ha servido como el marcador de fuera de límites de facto del campo.
Página 239
9 Aleatoriedad
Cuándo dejarlo al azar
Debo admitir que después de muchos años de trabajo en esta área, la eficacia de
La aleatoriedad para tantos problemas algorítmicos es absolutamente misteriosa.
a mi. Es eficiente, funciona; pero por qué y cómo es absolutamente
misterioso.
—MICHAEL RABIN
Página 240
Muestreo
Página 241
Me di cuenta de que puede ser mucho más práctico [intentar] ... tirar las cartas o
experimentando con el proceso y simplemente observando qué proporción sale con éxito,
en lugar de tratar de calcular todas las posibilidades combinatorias que son exponencialmente
número creciente tan grande que, excepto en casos muy elementales, no hay forma de estimarlo.
Esto es intelectualmente sorprendente y, si no es exactamente humillante, le da a uno una sensación de
Página 242
modestia sobre los límites del pensamiento racional o tradicional. En un lo suficientemente complicado
problema, el muestreo real es mejor que un examen de todas las cadenas de posibilidades.
Cuando dice "mejor", tenga en cuenta que no necesariamente se refiere a que el muestreo
le ofrecerá respuestas más precisas que un análisis exhaustivo: habrá
siempre habrá algún error asociado con un proceso de muestreo, aunque puede
reducirlo asegurándose de que sus muestras sean realmente aleatorias y tomando más
y más de ellos. Lo que quiere decir es que el muestreo es mejor porque da
usted una respuesta en absoluto, en los casos en que nada más lo hará.
La idea de Ulam, que el muestreo puede tener éxito donde falla el análisis, fue
También es crucial para resolver algunos de los difíciles problemas de física nuclear que
surgió en Los Alamos. Una reacción nuclear es un proceso de ramificación, donde
Las posibilidades se multiplican tan salvajemente como en las cartas: una partícula se divide en
dos, cada uno de los cuales puede llegar a golpear a otros, haciendo que se dividan a su vez,
etcétera. Calcular exactamente las posibilidades de algún resultado particular de
Ese proceso, con muchas, muchas partículas interactuando, es difícil hasta el punto de
imposibilidad. Pero simulándolo, con cada interacción como girar
sobre una nueva tarjeta, proporciona una alternativa.
Ulam desarrolló aún más la idea con John von Neumann, y trabajó
con Nicholas Metropolis, otro de los físicos de Manhattan
Proyecto, sobre implementación del método en la computadora de Los Alamos.
Metropolis nombró este enfoque, reemplazando la probabilidad exhaustiva
cálculos con simulaciones de muestra: el método de Monte Carlo , después de la
Casino de Montecarlo en Mónaco, un lugar igualmente dependiente de los caprichos
de casualidad. El equipo de Los Alamos pudo usarlo para resolver problemas clave en
física nuclear. Hoy en día, el Método Monte Carlo es uno de los pilares
de la informática científica.
Muchos de estos problemas, como el cálculo de las interacciones de subatómicas
partículas o las posibilidades de ganar en solitario, son intrínsecamente
probabilístico, por lo que resolverlos a través de un enfoque aleatorio como Monte
Carlo tiene bastante sentido. Pero quizás la realización más sorprendente
sobre el poder de la aleatoriedad es que se puede utilizar en situaciones en las que
el azar aparentemente no juega ningún papel en absoluto. Incluso si quieres la respuesta a un
Página 243
Página 244
Página 245
Rabin se dio cuenta de que este era un lugar donde un paso fuera del
El mundo determinista de la informática podría ser valioso. Si el número n
es en realidad nonprime, ¿cuántos valores posibles de x darían un falso
positivo y declararlo un número primo? La respuesta, mostró Rabin, es no.
más de una cuarta parte. Entonces, para un valor aleatorio de x , si las ecuaciones de Miller
Si se hace realidad, solo existe una probabilidad de uno en cuatro de que n no sea realmente primo.
Y lo que es más importante, cada vez que muestreamos una nueva x aleatoria y las ecuaciones de Miller
mira, la probabilidad de que n solo parezca primo, pero en realidad no lo es, cae por
otro múltiplo de cuatro. Repita el procedimiento diez veces y la probabilidad
de un falso positivo es uno en cuatro elevado a la décima potencia, menos de uno en un
millón. ¿Aún no tienes suficiente certeza? Comprueba otras cinco veces y estás
hasta uno en mil millones.
Vaughan Pratt, otro informático del MIT, implementó el método de Rabin
algoritmo y comenzó a obtener resultados a última hora de una noche de invierno, mientras Rabin estab
en casa invitando a amigos a una fiesta de Hanukkah. Rabin recuerda
recibir una llamada alrededor de la medianoche:
Página 246
arena en la tierra. Este estándar viene después de apenas cuarenta aplicaciones del
Prueba de Miller-Rabin. Es cierto que nunca está completamente seguro, pero puede obtener
terriblemente cerca, terriblemente rápido.
Aunque es posible que nunca haya oído hablar de la prueba Miller-Rabin, su computadora portátil,
tableta y teléfono lo saben bien. Varias décadas después de su descubrimiento, todavía es
el método estándar utilizado para buscar y verificar números primos en muchos dominios. Es
trabajar detrás de escena cada vez que usa su tarjeta de crédito en línea, y
casi en cualquier momento las comunicaciones seguras se envían por aire o por
alambres.
Durante décadas después del trabajo de Miller y Rabin, no se sabía si
alguna vez habrá un algoritmo eficiente que permita probar la primalidad en
moda determinista, con absoluta certeza. En 2002, uno de esos métodos
ser descubierto por Manindra Agrawal, Neeraj Kayal y Nitin Saxena en el
Instituto Indio de Tecnología, pero algoritmos aleatorios como Miller-
Los Rabin son mucho más rápidos y, por lo tanto, siguen siendo los que se utilizan en la práctica hoy en d
Y para algunos otros problemas, la aleatoriedad todavía proporciona el único conocido
ruta hacia soluciones eficientes. Un ejemplo curioso de las matemáticas es
conocido como "prueba de identidad polinomial". Si tienes dos polinomios
expresiones, como 2 x 3 + 13 x 2 + 22 x + 8 y (2 x + 1) × ( x + 2) × ( x + 4),
averiguar si esas expresiones son de hecho la misma función, mediante
hacer todas las multiplicaciones y luego comparar los resultados, puede ser increíblemente
requiere mucho tiempo, especialmente a medida que aumenta el número de variables.
Aquí nuevamente, la aleatoriedad ofrece un camino a seguir: solo genere algunos
x s aleatorios y conéctelos. Si las dos expresiones no son iguales,
Sería una gran coincidencia si dieran la misma respuesta para algunos
entrada generada aleatoriamente. Y una coincidencia aún mayor si también dieran
respuestas idénticas para una segunda entrada aleatoria. Y una coincidencia aún mayor
si lo hicieron por tres entradas aleatorias seguidas. Dado que no se conoce
algoritmo determinista para probar eficientemente la identidad polinomial, este
método aleatorio, con múltiples observaciones que rápidamente dan lugar a
casi certeza — es la única práctica que tenemos.
Página 247
La prueba de identidad polinomial muestra que a veces nuestro esfuerzo se gasta mejor
Comprobación de valores aleatorios: muestreo de las dos expresiones que queremos
conocer — que tratar de desenredar su funcionamiento interno. Hasta cierto punto
esto parece razonablemente intuitivo. Dado un par de artilugios indescriptibles y
preguntó si son dos dispositivos diferentes o dos copias del mismo,
la mayoría de nosotros comenzaríamos a presionar botones aleatorios en lugar de abrir el
casos para examinar el cableado. Y no nos sorprende especialmente cuando, digamos,
un capo de la droga de la televisin abre algunos paquetes al azar para ser razonablemente
seguro de la calidad de todo el envío.
Sin embargo, hay casos en los que no recurrimos a la aleatoriedad y
Tal vez deberíamos.
Posiblemente el filósofo político más importante del siglo XX.
siglo fue John Rawls de Harvard, quien se propuso la ambiciosa tarea
de reconciliar dos ideas clave aparentemente opuestas en su campo: libertad y
igualdad . ¿Es una sociedad más "justa" cuando es más libre o más igualitaria? Y
¿Realmente los dos tienen que ser mutuamente excluyentes? Rawls ofreció una forma de
abordar este conjunto de preguntas que él llamó el "velo de la ignorancia".
Imagina, dijo, que estás a punto de nacer, pero no sabes quién:
hombre o mujer, rico o pobre, urbano o rural, enfermo o sano. Y antes
Al conocer su estado, tenía que elegir en qué tipo de sociedad viviría.
¿Qué te gustaría? Evaluando varios arreglos sociales desde
Tras el velo de la ignorancia, argumentó Rawls, llegaríamos más fácilmente a una
consenso sobre cómo se vería uno ideal.
Sin embargo, lo que el experimento mental de Rawls no tiene en cuenta,
es el costo computacional de dar sentido a una sociedad desde detrás de tal
velo. ¿Cómo podríamos, en este escenario hipotético, posiblemente esperar mantener todos
de la información relevante en nuestras cabezas? Deje a un lado las grandes preguntas de
justicia y equidad por un momento y tratar de aplicar el enfoque de Rawls simplemente
a, digamos, un cambio propuesto en las regulaciones del seguro médico. Toma el
probabilidad de nacer, tal vez, como alguien que crece para convertirse en un
secretario municipal en el Medio Oeste; multiplique eso por la distribución de los diferentes
Página 248
planes de atención médica disponibles para los empleados del gobierno en varios
municipios del medio oeste; multiplique eso por datos actuariales que ofrecen la
probabilidad de, por ejemplo, una fractura de tibia; multiplica eso por el promedio
factura médica por el procedimiento promedio para una tibia fracturada en un medio oeste
hospital dada la distribución de posibles planes de seguro. ... Está bien, entonces
¿La revisión propuesta del seguro sería "buena" o "mala" para la nación?
Apenas podemos esperar evaluar una sola espinilla lesionada de esta manera, y mucho menos la
vidas de cientos de millones.
Los críticos filosóficos de Rawls han discutido extensamente acerca de cómo
Se supone que debemos aprovechar la información obtenida del velo de
ignorancia. ¿Deberíamos intentar, por ejemplo, maximizar la felicidad mezquina,
¿mediana de felicidad, felicidad total o algo más? Cada uno de estos
enfoques, famoso, se abre a distopías perniciosas, como
la civilización de Omelas imaginada por la escritora Ursula K. Le Guin, en la que
abundan la prosperidad y la armonía, pero un solo niño se ve obligado a vivir en abyecta
miseria. Estas son críticas dignas, y Rawls las elude deliberadamente.
dejando abierta la cuestión de qué hacer con la información que obtenemos
desde detrás del velo. Quizás la pregunta más importante, sin embargo, es cómo reunir
esa información en primer lugar.
La respuesta bien puede provenir de la informática. Scott del MIT
Aaronson dice que está sorprendido de que los científicos informáticos aún no hayan tenido más
influencia en la filosofía. Parte de la razón, sospecha, es simplemente su " fracaso
para comunicar lo que pueden aportar al arsenal conceptual de la filosofía ”. Él
elabora:
Uno podría pensar que, una vez que sabemos que algo es computable , ya sea que tome 10 segundos o
20 segundos para calcular es obviamente una preocupación de los ingenieros más que de los filósofos. Pero eso
La conclusión no sería tan obvia, si la pregunta fuera una de 10 segundos versus 10 1010
¡segundos! Y de hecho, en la teoría de la complejidad, las brechas cuantitativas que nos preocupan suelen ser tan
enorme que hay que considerarlas también como brechas cualitativas. Piense, por ejemplo, en el
diferencia entre leer un libro de 400 páginas y leer todos los libros posibles , o entre
anotando un número de mil dígitos y contando hasta ese número.
Página 249
Página 250
Pudo hacer una casa mejor y era una casa de hojalata. También pudo comprar un
conjunto de sofás para su propia casa. Su vida ha cambiado porque solía tener un techo con goteras
empapando todo en la casa cada vez que llovía. Pero debido a la transferencia ella pudo
para hacer una mejor casa de conservas.
Página 251
Página 252
Bloom, un filtro de Bloom funciona de manera muy similar a la prueba de primalidad de Rabin-Miller:
La URL se ingresa en un conjunto de ecuaciones que esencialmente verifican
“Testigos” de su novedad. (En lugar de proclamar " n no es primo", estos
ecuaciones dicen "No he visto n antes"). Si está dispuesto a tolerar una
tasa de error de solo 1% o 2%, almacenando sus hallazgos en datos probabilísticos
estructura como un filtro Bloom le ahorrará una cantidad significativa de tiempo
y espacio. Y la utilidad de tales filtros no se limita a buscar
motores: los filtros Bloom se han incluido con varios navegadores web recientes
para comparar las URL con una lista de sitios web maliciosos conocidos, y también
una parte importante de las criptomonedas como Bitcoin.
Mitzenmacher dice: "La idea del espacio de compensación de errores, creo que
El problema es que la gente no asocia eso con la informática. Ellos piensan
se supone que las computadoras te darán la respuesta. Entonces cuando escuches en tu
clase de algoritmos, 'Se supone que te da una respuesta; puede que no sea el
respuesta correcta ', me gusta pensar que cuando [los estudiantes] escuchan eso, se enfoca
ellos. Creo que la gente no se da cuenta en su propia vida de cuánto hacen eso.
y acepta eso ".
Página 253
No se preocupe demasiado por la longitud total de la ruta, pero probablemente sí
desea minimizar el costo monetario del viaje. Lo primero a tener en cuenta aquí
es que a pesar de que diez ciudades no parece mucho, el número de
Los itinerarios posibles es diez factorial: más de tres millones y medio. En
En otras palabras, no hay una forma práctica de que puedas simplemente comprobar cada
permutación y elija el precio más bajo. Tienes que trabajar de forma más inteligente que eso.
Para su primer intento en un itinerario, puede considerar tomar el
vuelo más barato desde San Francisco (digamos que es Seattle), luego tomar el
vuelo más barato desde allí a cualquiera de las otras ciudades restantes (llámelo Los
Ángeles), luego el más barato desde allí (digamos, Nueva York), y así sucesivamente, hasta
estás en tu décima ciudad y desde allí vuelas de regreso a San Francisco. Esta
es un ejemplo del llamado algoritmo codicioso, en el que también puedes pensar
como un "algoritmo miope": uno que toma con miopía lo mejor
disponible en cada paso del camino. En la teoría de la programación, como vimos en el capítulo
5, un algoritmo codicioso, por ejemplo, siempre haciendo el trabajo más corto disponible,
sin mirar o planificar más allá, a veces puede ser un problema
requiere. En este caso, para el problema del viajante, la solución dada
por el algoritmo codicioso probablemente no sea terrible, pero es probable que esté lejos de
lo mejor que puedes hacer.
Una vez que haya elaborado un itinerario de referencia, puede probar algunos
alternativas haciendo leves perturbaciones a la secuencia de la ciudad y viendo
si eso hace una mejora. Por ejemplo, si vamos primero a Seattle,
luego a Los Ángeles, podemos intentar hacer esas ciudades en orden inverso: LA
primero, luego Seattle. Para cualquier itinerario dado, podemos hacer once de estos dos-
chanclas de la ciudad; digamos que los probamos todos y luego vamos con el que da
nosotros los mejores ahorros. A partir de aquí tenemos un nuevo itinerario con el que trabajar y
podemos empezar a permutar ese , de nuevo buscando el mejor local
mejora. Este es un algoritmo conocido como Hill Climbing, ya que
buscar en un espacio de soluciones, algunas mejores y otras peores, es
comúnmente pensado en términos de un paisaje con colinas y valles, donde
tu objetivo es alcanzar el pico más alto.
Eventualmente, terminará con una solución que es mejor que todas sus
permutaciones; no importa qué paradas adyacentes mueva, nada lo supera. Es
Página 254
aquí donde se detiene la escalada. ¿Significa esto que definitivamente has encontrado el
¿Sin embargo, el mejor itinerario posible? Tristemente no. Puede que hayas encontrado solo
un llamado "máximo local", no el máximo global de todos los
posibilidades. El paisaje montañoso es brumoso. Tu puedes saber eso
estás parado en la cima de una montaña porque el suelo se cae en todo
direcciones, pero puede haber una montaña más alta al otro lado de la siguiente
valle, escondido detrás de las nubes.
Un "panorama de errores", que describe cómo la calidad de la solución puede variar según las diferentes posibilidades.
Página 255
ejemplo, o avanzando hacia el oeste en lugar de hacia el este. Puede que necesitemos
empeorar temporalmente nuestra solución si queremos seguir buscando
Mejoras. Y la aleatoriedad proporciona una estrategia; de hecho, varias
estrategias — para hacer precisamente eso.
Página 256
diferentes ciudades. Si un ajuste generado aleatoriamente en nuestra ruta de viaje da como resultado
una mejora, entonces siempre la aceptamos y seguimos ajustando desde
allí. Pero si la alteración empeorara las cosas, todavía hay una
posibilidad de que vayamos con él de todos modos (aunque cuanto peor es la alteración, la
menor la posibilidad). De esa manera, no nos quedaremos atascados en ningún máximo local.
durante mucho tiempo: eventualmente probaremos otra solución cercana, aunque sea
más caro, y potencialmente estar en camino de crear un nuevo
y mejor plan.
Ya sea por inestabilidad, reinicios aleatorios o estar abierto a ocasionales
empeorando, la aleatoriedad es increíblemente útil para evitar los máximos locales.
El azar no es solo una forma viable de lidiar con la optimización difícil
problemas; en muchos casos, es fundamental. Sin embargo, quedan algunas preguntas.
¿Cuánta aleatoriedad debería utilizar? ¿Y cuando? Y dado que
estrategias como el algoritmo Metropolis pueden permutar nuestro itinerario bastante
mucho ad infinitum, ¿cómo sabes que has terminado? Para
investigadores que trabajan en la optimización, una respuesta sorprendentemente definitiva a
estas preguntas vendrían de otro campo completamente.
Recocido simulado
Página 257
Página 258
la variación superior siempre tiene sentido, pero solo tomaríamos inferior
unos cuando el dado muestra, digamos, un 2 o más. Después de un tiempo, lo enfriaríamos
más allá al tomar solo un cambio de precio más alto si el dado muestra un 3 o más
- luego 4, luego 5. Con el tiempo, estaríamos principalmente escalando colinas, haciendo que el
movimiento inferior solo ocasionalmente cuando el dado muestra un 6. Finalmente comenzamos
yendo solo cuesta arriba, y nos detenemos cuando alcanzamos el próximo máximo local.
Este enfoque, llamado recocido simulado , parecía un intrigante
forma de mapear la física en la resolución de problemas. Pero, ¿funcionaría? La inicial
La reacción entre los investigadores de optimización más tradicionales fue que este
Todo el enfoque parecía un poco demasiado ... metafórico. "No pude
convencer a la gente de matemáticas de que todo este lío con las temperaturas, todo esto
cosas basadas en analogías, era real ", dice Kirkpatrick," porque los matemáticos
están entrenados para desconfiar realmente de la intuición ".
Pero cualquier desconfianza con respecto al enfoque basado en la analogía pronto
desaparecer: en IBM, los algoritmos de recocido simulado de Kirkpatrick y Gelatt
comenzó a hacer mejores diseños de chips que el gurú. En lugar de guardar silencio
acerca de su arma secreta y convertirse en figuras crípticas de gurú, ellos
publicó su método en un artículo en Science , abriéndolo a otros. Sobre
las próximas décadas, ese artículo se citaría la friolera de treinta y dos
Mil veces. Hasta el día de hoy, el recocido simulado sigue siendo uno de los más
enfoques prometedores para los problemas de optimización conocidos en el campo.
En 1943, Salvador Luria no sabía que estaba a punto de hacer un descubrimiento que
conduciría a un premio Nobel; pensó que iba a un baile. Un reciente
inmigrante a los Estados Unidos desde la Italia de Mussolini, donde su sefardí
Una familia judía había vivido, Luria era una investigadora que estudiaba cómo las bacterias
desarrolló inmunidad contra virus. Pero en este momento su investigación estaba lejos
de su mente, mientras asistía a una reunión de profesores en un club de campo cerca
Universidad de Indiana.
Luria estaba viendo a uno de sus colegas jugar en una máquina tragamonedas:
Página 259
Yo no soy un jugador, me estaba burlando de él por sus pérdidas inevitables, cuando de repente golpeó el
premio mayor, unos tres dólares en monedas de diez centavos, me miró con mala cara y se alejó. Justo entonces yo
comenzó a pensar en la numerología real de las máquinas tragamonedas; al hacerlo, amaneció
En mí, las máquinas tragamonedas y las mutaciones bacterianas tienen algo que enseñarse mutuamente.
Página 260
En el momento en que James estaba escribiendo, la idea de "evolución zoológica" todavía estaba
fresco— Sobre el origen de las especies se publicó en 1859 y el Sr.
El propio Darwin sigue vivo. James discutió cómo las ideas evolutivas podrían
ser aplicado a diferentes aspectos de la sociedad humana, y hacia el final de la
artículo se centró en la evolución de las ideas:
Las nuevas concepciones, emociones y tendencias activas que evolucionan se producen originalmente en el
forma de imágenes aleatorias, fantasías, nacimientos accidentales de variación espontánea en el
actividad funcional del cerebro humano excesivamente inestable, que el entorno exterior
simplemente confirma o refuta, adopta o rechaza, conserva o destruye; selecciona , en resumen, tal como
selecciona variaciones morfológicas y sociales debidas a accidentes moleculares de tipo análogo.
Página 261
Cuando estás en medio de algo, olvidas las cosas más obvias. Tu vienes
fuera del estudio y piensas "¿por qué no nos acordamos de hacer esto o aquello?" Estas [tarjetas]
realmente son solo formas de sacarte del marco, de romper un poco el contexto, para que
no eres una banda en un estudio centrada en una canción, pero eres gente que está viva y en el
mundo y consciente de muchas otras cosas también.
Página 262
éxito. La novela clásica de culto de 1971 El hombre de los dados de Luke Rhinehart (real
nombre: George Cockcroft) proporciona una advertencia. Su narrador, un hombre que
reemplaza la toma de decisiones con tirar dados, rápidamente termina en situaciones
que a la mayoría de nosotros probablemente le gustaría evitar.
Pero tal vez sea solo un caso en el que un poco de conocimiento es algo peligroso.
Si el Hombre de los Dados hubiera tenido una comprensión más profunda de la informática, habría
tenía alguna orientación. Primero, de Hill Climbing: incluso si tienes el hábito de
a veces actuando sobre las malas ideas, siempre debe actuar sobre las buenas.
En segundo lugar, del algoritmo de Metropolis: su probabilidad de seguir un mal
La idea debe ser inversamente proporcional a su mala idea. En tercer lugar, de
Recocido simulado: debe cargar al azar la aleatoriedad, enfriar rápidamente
de un estado totalmente aleatorio, utilizando cada vez menos aleatoriedad como tiempo
continúa, demorando más a medida que se acerca al punto de congelación. Cuídese usted mismo—
literalmente.
Este último punto no pasó desapercibido para el autor de la novela. El propio Cockcroft
aparentemente se volvió, no muy diferente a su protagonista, a "cortar en cubitos" durante un tiempo en
vida, viviendo nómada con su familia en un velero mediterráneo, en un
una especie de cámara lenta browniana. En algún momento, sin embargo, su recocido
el horario se enfrió: se instaló cómodamente en un máximo local, en
un lago en el norte del estado de Nueva York. Ahora, en sus ochenta, todavía está contento allí.
"Una vez que llegabas a algún lugar, eras feliz", le dijo a The Guardian ,
Sería estúpido sacudirlo más ".
Página 264
*Curiosamente, algunos de estos experimentos parecen haber producido una estimación mucho mejor de π que
se esperaría por casualidad, lo que sugiere que pueden haber sido deliberadamente interrumpidos en un
buen punto de parada, o falsificado por completo. Por ejemplo, en 1901 el matemático italiano Mario
Lazzarini supuestamente hizo 3.408 lanzamientos y obtuvo una estimación ⁄ 113
355de π ≈= 3,1415929 (el valor real
valor de π con siete posiciones decimales es 3,1415927). Pero si la cantidad de veces que la aguja cruzó el
Si
—Lola línea se hubiera
que hace desviadode
que el informe por un solo lanzamiento,
Lazzarini la estimación
parezca sospechoso. habría
Laplace sido
podría mucho
haber menos bonita:
encontrado 3,1398
apropiado queo podamos
3,1433
utilice la regla de Bayes para confirmar que es poco probable que este resultado haya surgido de un experimento válido.
Página 265
*No es necesario verificar más allá de la raíz cuadrada, porque si un número tiene un factor mayor que su
raíz cuadrada, entonces, por definición, también debe tener un factor correspondiente más pequeño que la raíz cuadrada—
así que ya lo habrías cogido. Si busca factores de 100, por ejemplo, cada factor
que sea mayor que 10 se emparejará con un factor menor que 10:20 se emparejará con 5, 25 con 4,
etcétera.
Página 266
*Los primos gemelos son números impares consecutivos que son primos, como 5 y 7.
Página 267
*Tenga en cuenta que tomamos deliberadamente la primera historia del sitio, es decir, no leímos todos
de ellos para elegir uno para compartir, lo que habría frustrado el propósito.
Página 268
10 Redes
Cómo nos conectamos
Solo conéctate.
—EM FORSTER
Página 269
Página 270
Conmutación de paquetes
Sabía que las computadoras, cuando hablan, no hablan como yo ahora, continuamente. Ellos
vaya explosión! y están callados por un rato. Un poco más tarde, de repente se acercan y explotan.
de nuevo. Y no puede permitirse dedicar una conexión de comunicaciones a algo que es
casi nunca habla, pero cuando quiere hablar quiere acceso inmediato. Entonces tuvimos que no usar
la red telefónica, que fue diseñada para una conversación continua: el circuito de conmutación
red, pero algo más.
Página 271
Fui a AT&T, la red más grande de la época, y les expliqué que debían
Danos buenas comunicaciones de datos. Y su respuesta fue, ¿de qué estás hablando? los
Estados Unidos es una mina de cobre, está lleno de cables telefónicos, úsalo. Dije que no, no, no lo haces
comprender. Se necesitan 35 segundos para configurar una llamada, me cobra un mínimo de 3 minutos y yo
quiere enviar 100 milisegundos de datos! Y su respuesta fue: "Niño, vete". Tan pequeño
niño se fue y, con otros, desarrolló esta tecnología que se comió su almuerzo.
Página 272
Reconocimiento
“LO QUE DIOS HIZO” no fue solo el primer viaje de larga distancia
mensaje telegráfico enviado en los Estados Unidos. También fue el segundo: Alfred
Página 273
Página 274
Página 275
parte, no puedo evitar hacer un flujo constante de asentimientos, sí, sí-sí, Roger-
eso es, diez y cuatro, uh-huhs. Hacemos esto incluso cara a cara, pero en una llamada telefónica.
a veces es la única forma de saber que la llamada aún está en curso. No
me pregunto si la campaña de marketing más exitosa del siglo XXI
para un proveedor de servicios inalámbricos con control de calidad de un ingeniero de red
eslogan, repetido una y otra vez: "¿Puedes oírme ahora?"
Cuando algo sale mal en ese ida y vuelta, a menudo nos quedamos
con un signo de interrogación. Como dice el bloguero de software Tyler Treat,
Los problemas a los que se enfrentaron los generales bizantinos, como nos recuerda, “no son
complejidades de diseño, son resultados imposibles ".
Investigaciones anteriores sobre redes, señala Vint Cerf, se habían fundado “en el
suposición de que podría construir una red subyacente confiable ". En el otro
Por otro lado, "Internet se basaba en el supuesto de que ninguna red estaba
necesariamente confiable, y tuvo que hacer retransmisiones de extremo a extremo para
recuperar."
Irónicamente, una de las pocas excepciones a esto es la transmisión de la
voz. Las comunicaciones de voz en tiempo real, como Skype, normalmente no utilizan
TCP, que es la base de la mayor parte del resto de Internet. Como investigadores
descubierto en los primeros días de la creación de redes, utilizando protocolos fiables y robustos
—Con todos sus ACK y retransmisión de paquetes perdidos — para transmitir el
la voz humana es exagerada. Los humanos proporcionan la robustez ellos mismos. Como
Cerf explica: “En el caso de la voz, si pierde un paquete, simplemente diga: 'Diga
que de nuevo, me perdí algo '”.
Por este motivo, los servicios telefónicos que reducen automáticamente el fondo
ruido al silencio están haciendo un flaco favor a sus usuarios. Estática de fondo
es una garantía continua de que la llamada todavía está conectada y que cualquier silencio
es una elección deliberada de la otra parte. Sin ella, uno debe constantemente
afrontar la posibilidad de que la llamada se haya interrumpido y ofrecer constantemente
Página 276
Página 277
Hoy esperamos que nuestros dispositivos se comuniquen de forma inalámbrica incluso cuando los cables
sería fácil: nuestro teclado y mouse, por ejemplo, hablar de forma inalámbrica
con una computadora sentada a centímetros de distancia. Pero las redes inalámbricas comenzaron como
cuestión de necesidad, en un lugar donde ningún cable podría hacer el trabajo: Hawaii. En
finales de los 60 y principios de los 70, Norman Abramson de la Universidad de Hawái
en Honolulu estaba tratando de vincular los siete campus de la universidad y
muchos institutos de investigación, repartidos en cuatro islas y cientos de millas.
Se le ocurrió la idea de implementar la conmutación de paquetes por radio en lugar de
el sistema telefónico, conectando las islas con una cadena suelta de transmisores
y receptores. Este sistema se conocería como ALOHAnet.
El mayor obstáculo que tuvo que superar ALOHAnet fue
interferencia. A veces, dos estaciones transmitían al mismo tiempo,
inadvertidamente interfiriendo las señales de los demás. (Esto es, por supuesto, un familiar
también en la conversación humana) .Si ambas estaciones simplemente retransmitieran
de inmediato para tratar de transmitir su mensaje, correrían el riesgo de obtener
atrapado en interferencia perpetua para siempre. Claramente, el protocolo ALOHAnet fue
van a necesitar decirle a las señales en competencia cómo darse espacio entre sí, cómo
para ceder y dar paso el uno al otro.
Lo primero que deben hacer los remitentes aquí es lo que se llama "romper
simetría." Como cualquier peatón en la acera sabe, esquivar a la derecha como un
El caminante que se aproxima esquiva a la izquierda, y luego los dos simultáneamente
esquivar hacia el otro lado, no resuelve nada. Es la misma historia cuando
dos oradores hacen una pausa, hacen gestos de deferencia hacia el otro, y luego
empezar a hablar de nuevo al mismo tiempo; o cuando dos autos en una intersección,
cada uno se detuvo para ceder al otro, intente acelerar en sincronía. Este es
un área donde el uso de la aleatoriedad se vuelve esencial; de hecho,
la creación de redes no sería posible sin él.
Una solución sencilla es que cada estación lance una moneda. Jefes, es
retransmite; colas, espera un turno y luego retransmite. Seguramente uno de ellos lo hará
pasar sin oposición en poco tiempo. Esto funciona bastante bien cuando hay
son solo dos remitentes. Pero, ¿y si hay tres señales simultáneas? O
cuatro Se necesitaría una probabilidad de uno en cuatro para que la red obtenga incluso una
un solo paquete en ese punto (después de lo cual todavía tendrías tres
Página 278
estaciones en conflicto se fueron, y tal vez incluso más señales en competencia que lleguen
mientras tanto). A medida que aumenta aún más el número de conflictos, la red
el rendimiento podría simplemente caerse por un precipicio. Un informe de 1970 sobre ALOHAnet
dijo que por encima de un mero 18,6% de utilización promedio de las ondas de radio, "el
el canal se vuelve inestable ... y el número medio de retransmisiones
se vuelve ilimitado ". No es bueno.
¿Entonces lo que hay que hacer? ¿Hay alguna manera de hacer un sistema que pueda evitar esto?
¿destino?
El avance resultó ser el aumento de la demora promedio después de
cada falla sucesiva, específicamente, duplicando el retraso potencial antes
tratando de transmitir de nuevo. Entonces, después de una falla inicial, un remitente aleatoriamente
retransmitir uno o dos turnos más tarde; después de un segundo fracaso, intentaría
de nuevo en cualquier lugar de una a cuatro vueltas más tarde; un tercer fracaso consecutivo
significa esperar entre una y ocho vueltas, y así sucesivamente. Esta
El enfoque elegante permite que la red se adapte potencialmente a cualquier
número de señales en competencia. Dado que la duración máxima del retardo (2, 4, 8,
16…) forma una progresión exponencial, se conoce como exponencial
Retroceso .
El retroceso exponencial fue una gran parte del funcionamiento exitoso del
ALOHAnet a partir de 1971, y en la década de 1980 se convirtió en TCP,
convirtiéndose en una parte fundamental de Internet. Todas estas décadas después, todavía lo es. Como
un artículo influyente lo expresa, "Para un punto final de transporte integrado en un
red de topología desconocida y con un desconocido, incognoscible y
población en constante cambio de conversaciones en competencia, sólo una
El esquema tiene alguna esperanza de funcionar: retroceso exponencial ".
Pero son los otros usos del algoritmo los que sugieren algo más
prescriptivo y más profundo. Más allá de la simple prevención de colisiones,
El retroceso exponencial se ha convertido en la forma predeterminada de manejar casi todos
casos de falla o falta de confiabilidad de la red. Por ejemplo, cuando tu
la computadora está intentando acceder a un sitio web que parece no funcionar, utiliza
Retroceso exponencial: volver a intentarlo un segundo más tarde, de nuevo unos segundos
después de eso, y así sucesivamente. Esto es bueno para todos: evita que un servidor host
que es inferior a recibir solicitudes tan pronto como regresa
Página 279
en línea, y evita que su propia máquina desperdicie demasiado esfuerzo
tratando de sacar sangre de una piedra. Pero curiosamente, tampoco fuerza (o
permitir) que su máquina se rinda por completo.
El Backoff exponencial también es una parte crítica de la seguridad de la red, cuando
sucesivas fallas de contraseña al iniciar sesión en una cuenta son castigadas por un
período de bloqueo exponencialmente creciente. Esto evita que un hacker utilice
un "ataque de diccionario" contra una cuenta, pasando por una contraseña potencial
después de la contraseña hasta que finalmente tengan suerte. Al mismo tiempo también
resuelve otro problema: el verdadero propietario de la cuenta, por olvidadizo que sea,
nunca se bloquea permanentemente después de un corte arbitrario.
En la sociedad humana, tendemos a adoptar una política de dar a las personas algunos
número de oportunidades seguidas, y luego se rindió por completo. Tres strikes, eres
fuera. Este patrón prevalece por defecto en casi cualquier situación que requiera
perdón, indulgencia o perseverancia. En pocas palabras, tal vez lo estemos haciendo
incorrecto.
Un amigo nuestro reflexionó recientemente sobre un compañero de infancia que tuvo un
desconcertante costumbre de escatimar en los planes sociales. ¿Qué hacer? Decidir una vez
y por todo lo que finalmente había tenido suficiente y renunciando por completo a la
La relación parecía arbitraria y severa, pero continuaba persistiendo en
la reprogramación perpetua parecía ingenua, propensa a conducir a una cantidad interminable de
decepción y pérdida de tiempo. Solución: Retroceso exponencial en el
tasa de invitación. Intente reprogramar en una semana, luego dos, luego cuatro, luego ocho.
La tasa de "retransmisión" se acerca a cero, pero nunca es necesario
rendirse por completo.
Otro amigo nuestro agonizaba sobre si ofrecer refugio y
asistencia financiera a un miembro de la familia con antecedentes de adicción a las drogas.
No podía soportar perder la esperanza de que él cambiara las cosas, y
No podía soportar la idea de darle la espalda para siempre. Pero ella tambien
no se atrevía a hacer todo lo que se requería para tenerlo en su casa ...
comprarle ropa y cocinarle, reabrirle cuentas bancarias,
y llevarlo al trabajo todas las mañanas, cuando en algún momento misterioso y
En un momento abrupto, tomaría todo el dinero y desaparecería, solo para llamar
Página 280
Página 281
Página 282
Página 283
solo si sus usuarios retroceden al menos tan rápido como la velocidad a la que se está
sobrecargado. Por la misma razón, un aumento meramente aditivo ayuda a estabilizar
cosas para todos, evitando ciclos rápidos de sobrecarga y recuperación.
Aunque una distinción tan estricta entre suma y multiplicación es
el tipo de cosa que es poco probable que se encuentre en la naturaleza, el diente de sierra TCP sí encuent
resonancia en varios dominios donde la idea es tomar tanto como uno pueda
salirse con la suya con seguridad.
En una colaboración fortuita de 2012, por ejemplo, el ecologista de Stanford
Deborah Gordon y el científico informático Balaji Prabhakar descubrieron que
Las hormigas parecen haber desarrollado algoritmos de control de flujo millones de años.
antes que los humanos. Como una red de computadoras, una colonia de hormigas se enfrenta a un
problema de asignación al tratar de gestionar su "flujo", en este caso, el flujo de
hormigas que salen a buscar comida, en condiciones variables que pueden
afectan drásticamente la velocidad a la que las hormigas realizan viajes de ida y vuelta con éxito. Y
como las computadoras en Internet, las hormigas deben resolver este problema compartido sin
el beneficio de un tomador de decisiones central, en lugar de desarrollar lo que Gordon
llama "control sin jerarquía". Resulta que la solución de las hormigas es similar,
también: un ciclo de retroalimentación donde los recolectores exitosos incitan a más personas a dejar el
nido, mientras que los retornados sin éxito resultan en una disminución de la búsqueda de alimento
actividad.
Otro comportamiento animal también evoca el control de flujo de TCP, con su
característico diente de sierra. Ardillas y palomas que van tras la comida humana.
los restos se arrastrarán hacia adelante un paso a la vez, de vez en cuando saltan hacia atrás, luego
Avanzar lentamente hacia adelante de nuevo. Y puede ser que las comunicaciones humanas
ellos mismos reflejan los protocolos que los transmiten: cada mensaje de texto
o la respuesta por correo electrónico anima a otro, mientras que cada mensaje no devuelto
detiene el flujo.
En términos más generales, AIMD sugiere un enfoque de los muchos lugares de la vida
donde luchamos por asignar recursos limitados en situaciones inciertas y fluctuantes
condiciones.
El satírico "Principio de Peter", articulado en la década de 1960 por la educación
el profesor Laurence J. Peter, afirma que “todo empleado tiende a estar a la altura
nivel de incompetencia ". La idea es que en una organización jerárquica,
Página 284
Cualquiera que haga un trabajo de manera competente será recompensado con un ascenso a un
nuevo trabajo que puede implicar desafíos más complejos y / o diferentes. Cuando
el empleado finalmente alcanza un rol en el que no se desempeña bien, su
marchar hacia arriba las filas se estancarn, y permanecern en ese papel por el resto de
su carrera. Así es lógico, dice la ominosa lógica del libro de Peter.
Principio, que eventualmente todos los puntos de una organización llegarán a ser
llenado por alguien que hace mal ese trabajo. Unos cincuenta años antes de Peter
formulación, el filósofo español José Ortega y Gasset en 1910 expresó la
mismo sentimiento. “Todo servidor público debería ser degradado a
rango inmediatamente inferior ", escribió," porque fueron avanzados hasta que
se volvió incompetente ".
Algunas organizaciones han intentado remediar el Principio de Peter mediante
simplemente despedir a los empleados que no avanzan. El llamado Sistema Cravath,
ideado por el bufete de abogados líder Cravath, Swaine & Moore, implica la contratación
casi exclusivamente graduados recientes, colocándolos en los rangos inferiores,
y luego, de manera rutinaria, promoverlos o despedirlos durante los años siguientes.
En 1980, las Fuerzas Armadas de EE. UU. Adoptaron una política similar de "subir o bajar" con el
Ley de Gestión del Personal de los Oficiales de Defensa. El Reino Unido tiene
igualmente persiguió lo que ellos llaman "control de dotación", hasta gran controversia.
¿Existe alguna alternativa, algún camino intermedio entre la institucionalidad
estancamiento del Principio de Peter y la severidad draconiana de la
fuera del sistema? El algoritmo AIMD puede ofrecer tal enfoque, ya que
está diseñado explícitamente para manejar las demandas de un entorno volátil. A
la red informática debe gestionar su propia capacidad máxima de transmisión,
más las tasas de transmisión de sus clientes, todas las cuales pueden estar fluctuando
impredeciblemente. Del mismo modo, en un entorno empresarial, una empresa tiene un grupo limitado
de fondos para pagar sus operaciones, y cada trabajador o proveedor tiene un
capacidad para la cantidad de trabajo que pueden hacer y la cantidad de
responsabilidad que pueden manejar. Las necesidades, capacidades y
las asociaciones siempre están en constante cambio.
La lección del diente de sierra de TCP es que, en una situación impredecible y cambiante
medio ambiente, empujar las cosas hasta el punto de fallar es a veces el
la mejor (o la única) forma de utilizar todos los recursos al máximo. Lo que importa
Página 285
Página 286
El aumento de interés en los aspectos prácticos del lenguaje hablado reveló apenas
cuán elaborados y sutiles son los procesos que gobiernan la toma de turnos,
interrupción, y redactar una oración o historia sobre la marcha mientras se
en sintonía con las reacciones del oyente en cada paso del camino. Lo que surgió fue un
visión de la comunicación, incluso ostensiblemente unidireccional, como un acto colaborativo. Como
El lingüista Victor Yngve escribiría en 1970: “De hecho, tanto la persona que
tiene el turno y su compañero están simultáneamente involucrados en ambos
y escuchando. Esto se debe a la existencia de lo que llamo la espalda.
canal, a través del cual la persona que tiene el turno recibe mensajes cortos
como 'sí' y 'ajá' sin renunciar al turno ".
Un examen de los "canales secundarios" humanos abrió un horizonte completamente nuevo
para el campo de la lingüística, lo que provocó una reevaluación completa de la
dinámica de la comunicación, específicamente, el papel del oyente. En uno
estudio ilustrativo, un equipo dirigido por Janet Bavelas en la Universidad de Victoria
investigó qué pasaría cuando alguien escucha una historia personal
se distrajo: no lo que sucedería con la comprensión del oyente, sino
qué pasaría con la historia . Con una mala retroalimentación, descubrieron que
la historia se desmorona.
Los narradores que contaron historias cercanas a oyentes distraídos ... les dijeron menos bien en general y
particularmente mal en lo que debería haber sido la conclusión dramática. Los finales de sus historias fueron
abruptos o entrecortados, o dieron vueltas y volvieron a contar el final más de una vez, y a menudo
justificó su historia explicando el cierre obvio.
Todos hemos tenido la experiencia de hablar con alguien cuyos ojos se desviaron
a su teléfono, tal vez, haciéndonos preguntarnos si nuestro mediocre
la narración tenía la culpa. De hecho, ahora está claro que la causa y el efecto son
a menudo al revés: un mal oyente destruye la historia.
Comprender la función exacta y el significado de los canales de retorno humanos.
sigue siendo un área de investigación activa. En 2014, por ejemplo, UC Santa
Jackson Tolins y Jean Fox Tree de Cruz demostraron que esos
discretos "uh-huhs" y "sí" y "hmms" y "ohs" esa pimienta
Nuestro habla desempeña papeles distintos y precisos en la regulación del flujo de
información de un hablante a otro, tanto su velocidad como su nivel de detalle.
Página 287
De hecho, son tan críticos como los ACK en TCP. Dice Tolins,
"Realmente, aunque algunas personas pueden ser peores que otras, los 'malos narradores' pueden
culpa al menos en parte a su audiencia ". Esta comprensión ha tenido la
efecto secundario inesperado de quitar algo de la presión cuando da
conferencias, incluidas, por supuesto, conferencias sobre ese mismo resultado. "Cada vez que yo
dar estas charlas de canal secundario, siempre le digo a la audiencia que la forma en que
están retrocediendo a mi charla en este momento está cambiando lo que digo ”, bromea.
"Por lo que son responsables de lo bien que me vaya".
Era el verano de 2010 y, como muchos padres, Jim Gettys estaba preparando
frecuentes quejas de sus hijos de que la red wi-fi familiar estaba
corriendo lentamente. Sin embargo, a diferencia de la mayoría de los padres, Gettys ha trabajado en HP,
Alcatel-Lucent, el Consorcio World Wide Web e Internet
Grupo de trabajo de ingeniería. Literalmente fue el editor, en 1999, de HTTP
especificación todavía en uso hoy. Entonces, ¿dónde buscarían la mayoría de los papás geek?
el problema, Gettys investigó el problema .
Como Gettys explicaría a una sala llena de ingenieros de Google, con
La jerga del networking dando paso a una convicción urgente e inconfundible:
Sucedió que estaba copiando, o sincronizando, los viejos archivos del Consorcio X de mi casa al MIT.
en esta ruta de diez milisegundos de duración ... SmokePing [estaba] informando latencias con un buen promedio
más de un segundo, junto con una mala pérdida de paquetes, solo mientras copiaba un archivo ... Tomé Wireshark y
había estas explosiones de comportamiento realmente extraño ... Esto parecía no TCP [diente de sierra] I
esperado en absoluto. Nunca debería ocurrir de esa manera.
En un lenguaje sencillo, vio algo ... muy extraño. Como dice el refrán, "el
frase más emocionante para escuchar en la ciencia, la que presagia nuevas
descubrimientos, no es 'Eureka!' pero 'Eso es gracioso' ".
Página 288
Al principio, Gettys pensó que algo andaba mal con su módem de cable.
Lo que su familia había estado llamando un problema en Internet parecía un
atasco de tráfico en su propio enchufe de pared. Los paquetes destinados a Boston no lo eran
atascado a mitad de camino allí; se estaban quedando atrapados en la casa.
Pero cuanto más lo investigaba Gettys, más se preocupaba. los
El problema no afectó solo al enrutador y al módem de su hogar, sino a todos los
enrutador y módem. Y el problema no solo estaban en los dispositivos de red, sino que
estaba en las propias computadoras, en computadoras de escritorio, computadoras portátiles, tabletas y
teléfonos inteligentes, entretejidos en Linux, Windows y OS X. Y no fue solo en
hardware del usuario final, ya sea: tocó la infraestructura misma de Internet
sí mismo. Gettys se sentó a almorzar con jugadores clave en Comcast, Verizon,
Cisco y Google, incluidos Van Jacobson y Vint Cerf, y poco a poco
comenzó a armar el rompecabezas.
El problema estaba en todas partes. Y el problema era el bufferbloat.
Un búfer es esencialmente una cola cuya función es suavizar las ráfagas. Si
entraste en una tienda de donas aproximadamente al mismo tiempo que otra
cliente, no sería conveniente que el cajero abrumado momentáneamente
hacer que uno de ustedes salga de la tienda y vuelva en otro momento. Clientes
no lo aceptaría, por supuesto, pero tampoco la administración: tal política es
virtualmente garantizado para subutilizar al cajero. Poniendo a los clientes en un
en cambio, la cola asegura que el rendimiento promedio de la tienda se acerque
su rendimiento máximo . Eso es bueno.
Sin embargo, esta utilización superior de recursos tiene un costo muy real:
demora. Cuando Tom llevó a su hija a un festival del Cinco de Mayo en
Berkeley, puso su corazón en una crepe de plátano y chocolate, así que se pusieron en fila
y esperó. Finalmente, después de veinte minutos, Tom llegó al frente de la
línea y realizó su pedido. Pero después de pagar, tuvieron que esperar cuarenta más
minutos para obtener la crepe. (Como Jim Gettys, Tom rápidamente encontró
él mismo presentando un volumen sustancial de quejas familiares).
resultó tomar menos tiempo que hacer crepes, por lo que la cola para ordenar fue
solo la primera parte del problema. Sin embargo, al menos era visible; clientes
Sabía lo que les esperaba. La segunda cola, más larga, era invisible. Entonces en
este caso habría sido un resultado mucho más feliz para todos si la crepe
Página 289
Página 290
Considere su problema más básico como una persona soltera ... le gustas a alguien,
no te gustan de vuelta. En un momento, eso solía ser una especie de
situación incómoda. Tenías que tener una conversación, fue extraño. Ahora
¿A qué te dedicas? Le gustas a alguien, ¿no te gusta? Tu solo
finge estar ocupado ... para siempre.
—AZIZ ANSARI
Página 291
La cantante Katy Perry tiene un 107% más de seguidores en Twitter que su estado natal de
California tiene gente. La persona más seguida en Twitter, al principio
2016 cuenta con 81,2 millones de cuentas entre sus fans. Esto significa
que incluso si el 99% de sus fans nunca le envían mensajes, e incluso si la mayoría
dedicó un 1% que le enviaba mensajes que lo hicieran solo una vez al año.
2.225 mensajes al día. Todos los días.
Imagínese si Perry se comprometiera a responder a cada mensaje de los fanáticos en el
orden recibida. Si pudiera responder 100 por día, entonces la espera esperada de los fanáticos
el tiempo de respuesta pronto se medirá en décadas . Es justo imaginar
que la mayoría de los fanáticos preferirían una pequeña posibilidad de obtener una respuesta de inmedi
respuesta garantizada dentro de diez o veinte años.
Tenga en cuenta que Perry no tiene este problema cuando sale de un lugar y
Debe correr un guante de fanáticos esperando un autógrafo o unas pocas palabras. Sidra de pera
hace lo que puede, sigue adelante y las oportunidades perdidas se disipan. El cuerpo
es su propio control de flujo. No podemos estar en más de un lugar a la vez. En un
fiesta abarrotada inevitablemente participamos en menos del 5% de la conversación,
y no puede leer o ponerse al día con el resto. Fotones que pierden el
retina no están en cola para verlas más tarde. En la vida real, la pérdida de paquetes es casi
total.
Usamos el modismo de "bolas caídas" casi exclusivamente en un despectivo
sentido, lo que implica que la persona en cuestión era perezosa, complaciente o
olvidadizo. Pero el lanzamiento táctico de bolas es una parte fundamental para conseguir que las cosas
hecho bajo sobrecarga.
La crítica más frecuente de las comunicaciones modernas es que estamos
"siempre conectado." Pero el problema no es que siempre estemos conectados;
no eran. El problema es que siempre estamos protegidos . La diferencia es
enorme.
La sensación de que hay que mirar todo en Internet o leer
todos los libros posibles, o ver todos los programas posibles, es bufferbloat. Extrañas un
Página 292
episodio de tu serie favorita y míralo una hora, un día, una década después.
Te vas de vacaciones y vuelves a casa y te encuentras con una montaña de correspondencia. Eso
solía ser que la gente llamaba a tu puerta, no obtenían respuesta y se iban
lejos. Ahora están esperando en la fila cuando llegas a casa.
Diablos, el correo electrónico fue diseñado deliberadamente para superar Tail Drop. Como su
El inventor, Ray Tomlinson, lo expresa:
En ese momento, no había una forma realmente buena de dejar mensajes a las personas. El telefono funciono
hasta cierto punto, pero alguien tenía que estar allí para recibir la llamada. Y si no fuera la persona que
quería conseguir, era un asistente administrativo o un servicio de contestador o algo por el estilo
clasificar. Ese era el mecanismo por el que tenía que pasar para dejar un mensaje, por lo que todos se cerraron
sobre la idea de que podría dejar mensajes en la computadora.
Página 293
principios de la década de 2000. Pero si las redes que conectan nuestros nuevos teléfonos y
computadoras, con su almacenamiento efectivamente infinito, todavía son deliberadamente
soltar paquetes cuando las cosas se ponen rápidas y furiosas, entonces tal vez haya
Razones para pensar en Tail Drop no como la lamentable consecuencia de una limitación
espacio de memoria, sino como una estrategia intencionada por derecho propio.
En cuanto al bloqueador de búfer de red, la historia en curso es complicada pero feliz.
uno, que implica esfuerzos a gran escala por hardware y sistema operativo
fabricantes para realizar cambios fundamentales en las colas de red. Hay
también una propuesta para un nuevo backchannel para TCP, la primera modificación de este tipo
en muchos años: Notificación de congestión explícita, o ECN. Completamente excitante
Internet de bufferbloat se basará en todos estos cambios y requerirá
la paciencia de muchos años. “Este es un pantano a largo plazo”, dice Gettys.
Pero hay mucho que esperar sobre un futuro post-bufferbloat. Con
su latencia inherente, los búferes son malos para la mayoría de los procesos interactivos. Cuando
hablamos a través de Skype, por ejemplo, generalmente preferimos un ocasional
señal estática ahora para una grabación clara de lo que dijo nuestro interlocutor tres
hace segundos. Para los jugadores, incluso un retraso de 50 milisegundos podría ser la diferencia
entre fragmentarse y ser fragmentado; de hecho, los juegos son tan sensibles a
latencia que todos los premios importantes del juego todavía se disputan en persona, con
jugadores que abordan aviones para reunirse y competir en una red que sirve
solo una habitación individual. Y lo mismo es cierto para cualquier otra cosa en la que ser
en sincronía importa. "Si quieres tocar música con tus amigos, incluso en
[tu] área metropolitana, te preocupas por decenas de milisegundos ", Gettys
notas, imaginando una gran cantidad de nuevas aplicaciones y negocios que
podría surgir para aprovechar el potencial interactivo de baja
latencias. “Una generalización que saco de toda esta experiencia es que
los ingenieros deberían pensar en el tiempo como en un ciudadano de primera clase ".
Stuart Cheshire de Apple está de acuerdo en que ya es hora de que la latencia se convierta en
una de las principales prioridades para los ingenieros de redes. Le horroriza que las empresas que
anunciar conexiones de Internet "rápidas" se refieren solo a un ancho de banda alto, no a
retraso bajo. Por analogía, señala que un Boeing 737 y un Boeing 747 ambos
volar a unas quinientas millas por hora; el primero puede contener 120
pasajeros, mientras que este último transporta tres veces más. Entonces "dirías
Página 294
que un Boeing 747 es tres veces "más rápido" que un Boeing 737? Por supuesto no,"
Cheshire exclama. La capacidad importa a veces: para transferir grandes
archivos, el ancho de banda es clave. (Si tiene una gran cantidad de carga para mover, un
un buque portacontenedores bien puede superar miles de viajes en un 747).
aplicaciones, sin embargo, un tiempo de respuesta rápido es a menudo mucho más importante,
y lo que realmente necesitamos son más Concordes. Y de hecho, trayendo
latencias hacia abajo es una de las fronteras actuales de la investigación de redes, y
Será interesante ver lo que trae.
Mientras tanto, hay otras batallas que librar. Gettys chasquea su
apartar la atención por un segundo, mirando fuera del encuadre. "No está funcionando para
¿usted? Estoy hablando con alguien en este momento, y me ocuparé de eso cuando esté
finalizado. Estamos terminando aquí, uh, no, el 5 GHz está funcionando en el
En este momento, el canal de 2,4 GHz se ha colgado. Es el infame error. Yo reiniciaré
el enrutador ". Que parece un momento oportuno para despedirnos y
liberar nuestro ancho de banda a los comunes, a la miríada de flujos que hacen su
aumento aditivo.
Página 295
11 Teoría de juegos
Las mentes de los demás
Soy optimista en el sentido de que creo que los humanos son nobles y
honorables, y algunos de ellos son realmente inteligentes ... Tengo un poco
visión más pesimista de las personas en grupos.
—STEVE JOBS
Un inversor vende una acción a otro, uno está convencido de que se dirige hacia abajo y el
otros convencidos de que está subiendo; Creo que sé lo que piensas pero no tengo
idea de lo que piensas yo pienso; estalla una burbuja económica; un futuro amante
ofrece un regalo que no dice "Quiero ser más que amigos" ni "No quiero
quieren ser más que amigos ”; una mesa de comensales discute sobre quién debería
tratar a quién y por qué; alguien que intenta ser útil ofende involuntariamente;
alguien que se esfuerza por ser genial dibuja risas; alguien tratando de romper
de la manada encuentra, consternado, la manada siguiendo su ejemplo. "Te quiero,"
dice un amante a otro; “Yo también te amo”, responde el otro; y ambos
Me pregunto qué quiere decir exactamente el otro con eso.
¿Qué tiene que decir la informática sobre todo esto?
A los escolares se les enseña a concebir las tramas literarias como pertenecientes a
una de varias categorías: hombre contra naturaleza, hombre contra sí mismo, hombre contra hombre, ho
contra la sociedad. Hasta ahora en este libro hemos considerado principalmente casos en el
las dos primeras categorías, es decir, la informática ha sido hasta ahora nuestro
guía a los problemas creados por la estructura fundamental del mundo, y por
Página 296
Recursividad
Página 297
la gente piensa que vale la pena. De hecho, incluso eso no va lo suficientemente lejos. Como Keynes
dicho, haciendo una distinción crucial entre belleza y popularidad:
La inversión profesional puede compararse con los concursos de periódicos en los que el
Los competidores tienen que elegir las seis caras más bonitas de un centenar de fotografías, siendo el premio
otorgado al competidor cuya elección corresponde más cerca a las preferencias promedio de
los competidores en su conjunto; de modo que cada competidor tiene que elegir, no las caras que
él mismo encuentra las más bonitas, pero aquellas que él cree que son más probables para captar la imaginación del otro
competidores, todos los cuales ven el problema desde el mismo punto de vista. No es un
caso de elegir aquellas que, según nuestro mejor juicio, son realmente las más bonitas, ni siquiera
aquellos en los que la opinión media realmente piensa que los más bonitos. Hemos llegado al tercer grado
donde dedicamos nuestras inteligencias a anticipar lo que la opinión promedio espera el promedio
opinión a ser. Y creo que hay algunos que practican el cuarto, quinto y grados superiores.
Página 298
Página 299
anticipar todos los posibles movimientos futuros de Nakamura, quien era él mismo
simplemente haciendo el equivalente de ajedrez a juguetear con los pulgares. Cuando el
La computadora casi había agotado su tiempo y comenzó a agitarse para no perder
por el reloj, Nakamura finalmente abrió la posición y se estrelló.)
Dados los peligros de la recursividad, ¿cómo salen los profesionales del póquer?
Usan la teoría de juegos. "A veces puedes pensar en razones para hacer
jugadas [de nivelación] de explotación, pero la mayoría de las veces solo estás haciendo inferiores
juega por razones que en realidad son solo ruido ”, explica Dan Smith. "Lo intento
Es realmente difícil tener un nivel básico de comprensión de la teoría en la mayoría de las situaciones.
... Siempre empiezo por saber o tratar de saber qué es Nash ".
Entonces, ¿qué es Nash?
Alcanzando el equilibrio
Página 300
nada mejor que
más piedra, hacer
nuestro que seguir
oponente adelante.
se daría (Si rápidamente
cuenta intentamos jugar, di,
y comenzaría a jugar más papel,
lo que nos haría jugar más tijeras, y así sucesivamente hasta que ambos nos acomodáramos
en el equilibrio 1 ⁄ 3 - 1 ⁄ 3 - 1 ⁄ 3 nuevamente.)
En uno de los resultados fundamentales de la teoría de juegos, el matemático John
Nash demostró en 1951 que cada juego de dos jugadores tiene al menos una
equilibrio. Este importante descubrimiento le valdría a Nash el Premio Nobel en
Economía en 1994 (y condujo al libro y la película A Beautiful Mind , sobre
La vida de Nash). En la actualidad, este equilibrio se conoce con el nombre de "Nash
equilibrio ”, el“ Nash ”que Dan Smith siempre trata de seguir.
A primera vista, el hecho de que un equilibrio de Nash siempre exista en dos
los juegos de jugadores parecen traernos algo de alivio del salón de los espejos
recursiones que caracterizan al póquer y muchos otros concursos familiares. Cuando
nos sentimos caer por la madriguera recursiva del conejo, siempre tenemos una
opción de salir de la cabeza de nuestro oponente y buscar el equilibrio,
ir directamente a la mejor estrategia, asumiendo un juego racional. En piedra-papel-
tijeras, escudriñando la cara de tu oponente en busca de signos de lo que podrían
lanzar a continuación puede no valer la pena, si sabe que simplemente lanzar a
random es una estrategia imbatible a largo plazo.
De manera más general, el equilibrio de Nash ofrece una predicción de la estabilidad
resultado a largo plazo de cualquier conjunto de reglas o incentivos. Como tal, proporciona una
herramienta invaluable para predecir y dar forma a la política económica, así como para
política social en general. Como dice el economista premio Nobel Roger Myerson
En él, el equilibrio de Nash “ha tenido un impacto fundamental y generalizado en
economía y las ciencias sociales que es comparable a la de la
descubrimiento de la doble hélice del ADN en las ciencias biológicas ".
La informática, sin embargo, ha complicado esta historia. En términos generales, el
el objeto de estudio en matemáticas es la verdad ; el objeto de estudio en computadora
la ciencia es complejidad . Como hemos visto, no basta con que un problema tenga
una solución si ese problema es intratable.
En un contexto de teoría de juegos, saber que existe un equilibrio no
en realidad, díganos qué es o cómo llegar allí. Como computadora de UC Berkeley
El científico Christos Papadimitriou escribe, la teoría de juegos "predice a los agentes"
Página 301
comportamiento de equilibrio típicamente sin tener en cuenta las formas en que tal
se alcanzará el estado, una consideración que sería la de un científico de la computación
principal preocupación ". Tim Roughgarden de Stanford se hace eco del sentimiento de
estar insatisfecho con la prueba de Nash de que los equilibrios siempre existen. "Está bien",
dice, “pero somos científicos de la computación, ¿verdad? Danos algo que podamos usar.
No me digas simplemente que está ahí; dime cómo encontrarlo ". Y entonces, el original
campo de la teoría de juegos engendró la teoría algorítmica de juegos, es decir, el estudio de
las estrategias teóricamente ideales para los juegos se convirtieron en el estudio de cómo las máquinas
(y la gente) idean estrategias para los juegos.
Resulta que hacer demasiadas preguntas sobre los equilibrios de Nash
se mete de prisa en problemas de cálculo. A finales del vigésimo
siglo, determinando si un juego tiene más de un equilibrio, o un
equilibrio que le da a un jugador una cierta recompensa, o un equilibrio que
implica tomar una acción en particular, se ha demostrado que todos son intratables
problemas. Luego, de 2005 a 2008, Papadimitriou y sus colegas
demostró que simplemente encontrar los equilibrios de Nash también es intratable.
Los juegos simples como piedra-papel-tijera pueden tener equilibrios visibles en un
mirada, pero en juegos de complejidad del mundo real ahora está claro que no podemos tomar
por supuesto que los participantes podrán descubrir o alcanzar el juego
equilibrio. Esto, a su vez, significa que los diseñadores del juego no necesariamente
utilice el equilibrio para predecir cómo se comportarán los jugadores. los
Las ramificaciones de este aleccionador resultado son profundas: los equilibrios de Nash se han manteni
un lugar sagrado dentro de la teoría económica como una forma de modelar y predecir
comportamiento del mercado, pero ese lugar podría no ser merecido. Como Papadimitriou
explica: "Si un concepto de equilibrio no se puede calcular de manera eficiente, gran parte de
se pierde su credibilidad como predicción del comportamiento de agentes racionales ”.
Scott Aaronson del MIT está de acuerdo. "En mi opinión", dice, "si el teorema de que
La existencia de equilibrios de Nash se considera relevante para los debates sobre (digamos) libre
mercados versus la intervención del gobierno, entonces el teorema de que encontrar
esos equilibrios son [intratables] también deben considerarse relevantes ". los
Las capacidades predictivas de los equilibrios de Nash solo importan si esos equilibrios pueden
ser encontrado por los jugadores. Para citar al ex director de eBay
investigación, Kamal Jain, "Si su computadora portátil no puede encontrarlo, tampoco el mercado".
Página 302
Página 303
estrategias, por lo que ni siquiera tiene que preocuparse por entrar en sus
cabeza en absoluto. Una estrategia dominante es algo poderoso.
Pero ahora hemos llegado a la paradoja. Si todos hacen lo racional
cosa y sigue la estrategia dominante, la historia termina con los dos
sirviendo cinco años de tiempos difíciles, que, en comparación con la libertad y un buen
medio millón cada uno, es dramáticamente peor para todos los involucrados. Cómo podría
que ha pasado?
Esto ha surgido como una de las principales ideas del juego tradicional.
teoría: el equilibrio para un conjunto de jugadores, todos actuando racionalmente en su propio
interés, puede que no sea el mejor resultado para esos jugadores.
Teoría algorítmica de juegos, de acuerdo con los principios de la informática.
ciencia, ha tomado esta idea y la ha cuantificado, creando una medida llamada
"El precio de la anarquía". El precio de la anarquía mide la brecha entre
cooperación (una solución diseñada o coordinada centralmente) y competencia
(donde cada participante intenta de forma independiente maximizar el resultado
para ellos mismos). En un juego como el dilema del prisionero, este precio es
efectivamente infinito: aumentar la cantidad de efectivo en juego y alargar
las sentencias de cárcel pueden hacer que la brecha entre los posibles resultados de manera arbitraria
de ancho, incluso cuando la estrategia dominante sigue siendo la misma. No hay limite de como
Las cosas pueden resultar dolorosas para los jugadores si no se coordinan. Pero en otro
juegos, como descubrirían los teóricos de los juegos algorítmicos, el precio de la anarquía es
no tan mal.
Por ejemplo, considere el tráfico. Ya sea que se trate de viajeros individuales que intentan
para abrirse camino a través del diario de parachoques a parachoques, o los enrutadores barajando
Paquetes TCP a través de Internet, todos en el sistema simplemente quieren
lo que es más fácil para ellos personalmente. Los conductores solo quieren tomar lo más rápido
ruta, sea lo que sea, y los enrutadores solo quieren barajar sus paquetes
con un mínimo esfuerzo, pero en ambos casos esto puede resultar en hacinamiento
a lo largo de vías críticas, creando una congestión que perjudica a todos. Cómo
mucho daño, sin embargo? Sorprendentemente, Tim Roughgarden y Éva de Cornell
Tardos demostró en 2002 que el enfoque de "enrutamiento egoísta" tiene un precio de
anarquía que es solo 4/3. Es decir, una lucha libre es solo un 33% peor que
perfecta coordinación de arriba hacia abajo.
Página 304
El trabajo de Roughgarden y Tardos tiene profundas implicaciones tanto para las áreas urbanas
planificación del tráfico físico y de la infraestructura de red. Enrutamiento egoísta
El bajo precio de la anarquía puede explicar, por ejemplo, por qué Internet funciona como
así como lo hace sin ninguna autoridad central que gestione el enrutamiento de
paquetes individuales. Incluso si tal coordinación fuera posible, no agregaría
mucho.
Cuando se trata de tráfico de seres humanos, el bajo precio de la anarquía
corta en ambos sentidos. La buena noticia es que la falta de coordinación centralizada
está empeorando su viaje como máximo solo un 33%. Por otro lado, si
espera que los coches autónomos conectados en red nos traigan un
futuro de la utopía del tráfico, puede ser descorazonador saber que el egoísta de hoy,
Los controladores descoordinados ya están bastante cerca de ser óptimos. Es cierto que
conducir automóviles debe reducir el número de accidentes de tráfico y puede ser capaz de
Conducir más cerca, ambos acelerarían el tráfico. Pero de donde
Desde el punto de vista de la congestión, el hecho de que la anarquía es sólo 4/3 de la congestión
perfecta coordinación significa que los desplazamientos perfectamente coordinados solo
estar 3/4 tan congestionados como lo están ahora. Es un poco como la famosa frase de James
Branch Cabell: “El optimista proclama que vivimos en el mejor de todos
mundos posibles; y el pesimista teme que esto sea cierto ". La congestión
ser siempre un problema solucionable más por los planificadores y por la demanda general que
por las decisiones de conductores individuales, humanos o informáticos, egoístas o
cooperativa.
Cuantificar el precio de la anarquía le ha dado al campo un aspecto concreto y
forma rigurosa de evaluar los pros y los contras de los sistemas descentralizados, que
tiene amplias implicaciones en cualquier número de dominios donde las personas encuentran
ellos mismos involucrados en el juego (lo sepan o no). Un bajo
precio de la anarquía significa que el sistema es, para bien o para mal, tan bueno en
propia como sería si se gestionara con cuidado. Un alto precio de la anarquía
por otro lado, significa que las cosas tienen el potencial de salir bien si
están cuidadosamente coordinados, pero que sin algún tipo de intervención,
estamos cortejando el desastre. El dilema del prisionero es claramente de este último
escribe. Desafortunadamente, también lo son muchos de los juegos más críticos que el mundo debe
juego.
Página 305
La tragedia de los comunes
Página 306
trabajar más y el valor del ocio más bajo ". Hay pocas leyes que obliguen
que los empleadores brinden tiempo libre, e incluso cuando los empleados estadounidenses lo hacen
consiguen tiempo de vacaciones, no lo usan. Un estudio reciente mostró que el promedio
el trabajador toma sólo la mitad de los días de vacaciones que se les conceden, y una impresionante
El 15% no toma vacaciones en absoluto.
En este momento, el Área de la Bahía (donde vivimos los dos) está
tratando de remediar este lamentable estado de cosas pasando por una
cambio de paradigma en lo que respecta a la política de vacaciones, un cambio que está muy bien
significado y completamente, apocalípticamente condenado. Suena la premisa
suficientemente inocente: en lugar de medir un número arbitrario fijo de
días para cada empleado, luego desperdiciando horas-hombre de recursos humanos asegurándose de qu
supera su límite, ¿por qué no dejar libres a sus empleados? ¿Por qué no simplemente
permitirles vacaciones ilimitadas? Los informes anecdóticos hasta ahora son mixtos, pero
desde una perspectiva de teoría de juegos, este enfoque es una pesadilla. Todos
los empleados quieren, en teoría, tomarse la mayor cantidad de vacaciones posible. Pero ellos
También todos quieren tomarse un poco menos de vacaciones que los demás, para ser
percibido como más leal, más comprometido y más dedicado (por lo tanto, más
digno de promoción). Todos miran a los demás en busca de una línea de base, y
tomar solo un poco menos que eso. El equilibrio de Nash de este juego es cero .
Como escribe el director ejecutivo de la empresa de software Travis CI, Mathias Meyer,
“La gente dudará en tomarse unas vacaciones porque no quiere parecer así
persona que se toma la mayor cantidad de días de vacaciones. Es una carrera hacia el fondo ".
Ésta es la tragedia de los comunes en plena vigencia. Y es tan malo
entre empresas como dentro de ellas. Imagínese dos comerciantes en un pueblo pequeño.
Cada uno de ellos puede elegir entre permanecer abiertos los siete días de la semana o
abre solo seis días a la semana, se toma el domingo libre para relajarse con sus amigos y
familia. Si ambos se toman un día libre, conservarán su mercado actual
comparte y experimenta menos estrés. Sin embargo, si un comerciante decide
abre su tienda los siete días de la semana, atraerá clientes adicionales, llevándolos
lejos de su competidor y amenazando su sustento. El Nash
el equilibrio, nuevamente, es que todos trabajen todo el tiempo.
Este problema exacto se convirtió en un punto de inflamación en los Estados Unidos durante el
Temporada de vacaciones de 2014, como minorista tras minorista, no está dispuesto a ceder participación
Página 307
Página 308
Esto nos lleva a una rama de la teoría de juegos conocida como "mecanismo
diseño." Mientras que la teoría de juegos pregunta qué comportamiento surgirá dado un conjunto de
reglas, el diseño de mecanismos (a veces llamado "teoría del juego inverso") funciona
en la otra dirección, preguntando: ¿Qué reglas nos darán el comportamiento que queremos?
¿para ver? Y si las revelaciones de la teoría de juegos, como el hecho de que un equilibrio
La estrategia puede ser racional para cada jugador pero mala para todos.
contradictorio, las revelaciones del diseño de mecanismos son aún más
asi que.
Regresemos a usted y a su cómplice de robo de bancos a la celda de la cárcel por
otro aborda el dilema del prisionero, con una adición crucial: la
Padrino. Ahora tú y tu compañero ladrón son miembros de un crimen
sindicato, y el don ha dejado, digamos, demasiado claro que cualquier
los informantes dormirán con los peces. Esta alteración de los beneficios del juego
tiene el efecto de limitar las acciones que puede realizar, pero irónicamente llega lejos
Es más probable que las cosas terminen bien, tanto para ti como para tu pareja. Ya que
la deserción es ahora menos atractiva (por decirlo suavemente), ambos prisioneros son inducidos
a cooperar, y ambos se alejarán con confianza de medio millón de dólares
más rico. Menos, por supuesto, un diezmo nominal para el don.
Lo contradictorio y poderoso aquí es que podemos empeorar cada
resultado, muerte por un lado, impuestos por el otro, pero hacer que todos
vive mejor cambiando el equilibrio.
Para los comerciantes de pueblos pequeños, una tregua verbal para tomar los domingos libres
sería inestable: tan pronto como cualquiera de los comerciantes necesitara algo de dinero extra
podría violarlo, lo que provocaría que el otro comenzara a trabajar los domingos como
así para no perder cuota de mercado. Esto los llevaría de vuelta a la
mal equilibrio donde obtienen lo peor de ambos mundos: son
agotado y no obtenga ninguna ventaja competitiva por ello. Pero pueden ser
capaz de actuar como su propio don mediante la firma de un contrato legalmente vinculante con el
efecto que, digamos, cualquier producto obtenido por cualquiera de las tiendas un domingo vaya a la
otra tienda. Al empeorar el equilibrio insatisfactorio, harían un
nuevo y mejor.
Por otro lado, un cambio en las recompensas del juego que no cambia.
el equilibrio normalmente tendrá un efecto mucho menor que el deseado. los
Página 309
El director ejecutivo de la empresa de software Evernote, Phil Libin, llegó a los titulares con un
política de ofrecer a los empleados de Evernote mil dólares en efectivo por tomar un
vacaciones. Esto suena como un enfoque razonable para conseguir más empleados.
tomar vacaciones, pero desde la perspectiva de la teoría de los juegos es en realidad
equivocado. Aumentar el dinero en efectivo sobre la mesa en el dilema del prisionero, por
ejemplo, pierde el punto: el cambio no hace nada para alterar el mal
equilibrio. Si un atraco de un millón de dólares termina con ambos ladrones en la cárcel, entonces
hace un atraco de diez millones de dólares. El problema no es que las vacaciones no
atractivo; el problema es que todos quieren tomarse un poco menos de vacaciones
que sus pares, produciendo un juego cuyo único equilibrio son las vacaciones en
todos. Mil dólares endulzan el trato, pero no cambian el principio de
el juego, que consiste en tomarse tantas vacaciones como sea posible sin dejar de
percibido como un poco más leal que el próximo chico o chica, por lo tanto, obteniendo un
aumento o promoción sobre ellos que vale muchos miles de dólares.
¿Significa esto que Libin necesita ofrecer decenas de miles de dólares por
empleado por vacaciones? No. El diseño del mecanismo nos dice que Libin puede obtener
los empleados felices que quiere con el palo, en lugar de la zanahoria; él puede
obtener un mejor equilibrio sin gastar un centavo. Por ejemplo, podría
simplemente haga obligatoria una cierta cantidad mínima de vacaciones . Si no puede
cambiar la carrera, todavía puede cambiar el fondo. El diseño del mecanismo hace
poderoso argumento a favor de la necesidad de un diseñador, ya sea un director ejecutivo, un contrato
vinculando a todas las partes, o un don que hace cumplir la omertà por la carótida garrotada.
Un comisionado de liga es también este tipo de diseñador. Imagina como
un espectáculo patético que sería la NBA si no hubiera juegos como tales, y
Los equipos podrían simplemente anotar entre sí literalmente en cualquier momento entre
inicio y final de la temporada: 3:00 am el domingo, mediodía en Navidad,
nombralo. Lo que verías serían jugadores demacrados y cadavéricos, en extremo
deuda de sueño, lo que obliga a la vigilancia con estimulantes químicos, casi perdiendo su
mentes. La guerra es así. Por otro lado, incluso Wall Street, despiadado
capitalistas feroces que comercian por microsegundos en la "ciudad que nunca
duerme ", llega a un alto el fuego todos los días a las 4:00 p. m. en punto, para que los corredores
puede dormir a horas predecibles todas las noches sin ponerse demasiado mal
Página 310
Por más egoísta que pueda suponerse el hombre, evidentemente hay algunos
principios de su naturaleza, que le interesan en la fortuna de los demás, y
Página 311
El dosel se puede considerar como un prado aéreo, como una pradera ondulada, pero
levantado sobre pilotes. El dosel está acumulando energía solar al mismo ritmo que un pastizal.
la pradera lo haría. Pero una parte sustancial de la energía se "desperdicia" al ser alimentada directamente al
zancos, que no hacen nada más útil que el "prado" alto en el aire, donde se levanta
exactamente la misma cosecha de fotones que obtendría, a un costo mucho menor, si se
suelo.
Página 312
Considere dos escenarios aparentemente no relacionados: (1) Un hombre compra una aspiradora
más limpio, se rompe en unas pocas semanas y pasa diez minutos en línea
dejando una reseña vengativa. (2) Una mujer comprando en una tienda de conveniencia.
se da cuenta de que alguien roba la billetera de un anciano y corre hacia la puerta; ella
aborda al ladrón y le quita la billetera.
Aunque el último protagonista parece claramente heroico, y el primero
simplemente enojado, lo que estas viñetas tienen en común, aunque en muy
diferentes formas — es el altruismo involuntario. El consumidor infeliz no es
tratando de que le reemplacen la aspiradora o le devuelvan el dinero; él está detrás de un
tipo de retribución altamente indirecta, de la cual, en un juego racional,
sentido teórico: se espera que obtenga poco más que la satisfacción rencorosa
de escribir la reseña en sí. En la tienda de conveniencia, la heroica mujer
imparte justicia vigilante a un costo personal enorme; ella se arriesga a lesionarse o
incluso la muerte para devolver, digamos, 40 dólares a un hombre que es un completo extraño para ella.
ella quería ayudar, simplemente podría haber sacado dos veinte de su
propio bolsillo y se los dio sin arriesgar un viaje a la sala de emergencias! En esto
sentido, ambos protagonistas están actuando irracionalmente. Por otro lado, su
acciones son buenas para su sociedad: todos queremos vivir en un mundo en el que
los carteristas no pagan y en qué empresas que venden productos de mala calidad
los productos tienen mala reputación.
Quizás cada uno de nosotros, individualmente, estaría mejor siendo el tipo de
persona que siempre puede tomar una decisión imparcial y calculada por su cuenta
mejor interés, no estar dispuesto a perder el tiempo echando humo por un costo hundido, y mucho meno
un diente de más de $ 40. Pero todos estamos mejor viviendo en una sociedad en la que
tales posiciones desafiantes son comunes.
Entonces, ¿qué ha actuado en estas personas, en ausencia de un
autoridad, para hacerlos oponerse al equilibrio egoísta? Ira, por un lado.
Ya sea provocado por un negocio de mala calidad o por un pequeño ladrón, la indignación puede
anular la racionalidad. Y en estos casos, puede ser que la mano de
La evolución ha hecho lo que de otro modo habría llevado a una autoridad exterior
el juego para lograr.
La naturaleza está llena de ejemplos de individuos esencialmente secuestrados para
sirven a los objetivos de otra especie. La platija del hígado lanceta ( Dicrocoelium
Página 313
dendriticum ), por ejemplo, es un parásito que hace que las hormigas trepen deliberadamente
las puntas de las briznas de hierba para que las ovejas se las coman; la
anfitrión preferido. Asimismo, el parásito Toxoplasma gondii hace que los ratones
pierden permanentemente el miedo a los gatos, con resultados similares.
Emoción, para el consumidor amargado y vengativo y por la conveniencia.
héroe de la tienda por igual, nuestra propia especie se hace cargo de los controles durante un minuto.
“La moralidad es un instinto gregario en el individuo”, escribió Nietzsche. Parafraseando
ligeramente, podríamos arriesgarnos a que la emoción sea un mecanismo de diseño en la especie.
Precisamente porque los sentimientos son involuntarios, posibilitan contratos que necesitan
sin aplicación externa. La venganza casi nunca funciona a favor del
uno que lo busca, y sin embargo alguien que responde con "irracional"
vehemencia de ser aprovechado es por esa misma razón más probable
para conseguir un trato justo. Como dice el economista de Cornell, Robert Frank, "Si la gente
Esperamos que respondamos irracionalmente al robo de nuestra propiedad, rara vez lo haremos.
necesitan , porque no les conviene robarlo. Estar predispuesto
responder irracionalmente sirve mucho mejor aquí que ser guiado solo por
interés propio material ".
(Para que no piense que los humanos modernos civilizados tienen contratos legales y
Estado de derecho en lugar de retribución, recuerde que a menudo es más trabajo y
sufrir para demandar o enjuiciar a alguien de lo que la víctima podría esperar
recuperar en términos materiales. Los juicios son los medios para auto-destructiva
represalia en una sociedad desarrollada, no el sustituto).
En cuanto a la ira, también lo es la compasión y la culpa, y el amor.
Por extraño que parezca, el dilema del prisionero también tiene mucho que decirnos.
sobre el matrimonio. En nuestra discusión sobre problemas óptimos de frenado, como el
problema de la secretaria, en el capítulo 1, analizamos tanto las citas como las
búsqueda de apartamentos como casos en los que debemos comprometernos con
posibles opciones futuras aún no vistas. Sin embargo, tanto en el amor como en la vivienda,
continuar encontrando más opciones incluso después de nuestra parada óptima
se toma la decisión, entonces, ¿por qué no estar listo para abandonar el barco? Por supuesto, sabiendo
que la otra parte (ya sea el cónyuge o el propietario) está a su vez preparada para saltar
barco evitaría muchas de las inversiones a largo plazo (tener hijos
Página 314
juntos, o moviéndose laboriosamente en las propias pertenencias) que hacen que esos
acuerdos que valen la pena.
En ambos casos, este llamado problema de compromiso puede ser al menos parcialmente
abordado por un contrato. Pero la teoría de juegos sugiere que en el caso de las citas,
Los vínculos voluntarios de la ley son menos relevantes para una asociación duradera.
que los lazos involuntarios del amor mismo. Como dice Robert Frank, "El
preocuparse de que las personas abandonen las relaciones porque más tarde puede convertirse en
racional para ellos hacerlo se borra en gran medida si no es una evaluación racional
que los une en primer lugar ". El explica:
Sí, las personas buscan características objetivas que les interesan. Todo el mundo quiere a alguien
que es amable, inteligente, interesante y saludable y tal vez físicamente atractivo, bueno
poder adquisitivo, toda la lista de funciones, pero ese es el primer paso ... Después de haber gastado
suficiente tiempo juntos, no son esas cosas las que te hacen querer estar juntos. Es solo el hecho
que es esa persona en particular, eso es lo que es valioso para usted, por lo que realmente no necesita el
contrae tanto como necesita un sentimiento que hace que no quiera separarse, aunque
objetivamente, podría haber una mejor opción disponible para usted.
Entonces, el argumento racional a favor del amor es doble: las emociones del apego
no solo evitar que pienses demasiado de forma recursiva en las intenciones de tu pareja,
pero al cambiar las recompensas, en realidad, se logra un mejor resultado.
Es más, poder enamorarte involuntariamente te convierte, a su vez, en un
socio más atractivo para tener. Tu capacidad de angustia, de dormir
con los peces emocionales, es la misma cualidad que te hace tan confiable
cómplice.
Parte de la razón por la que es una buena idea prestar atención al comportamiento de
otros es que al hacerlo, puedes agregar su información sobre el mundo
a la tuya. Un restaurante popular probablemente sea bueno; un concierto medio vacío
pasillo es probablemente una mala señal; y si alguien con quien hablas te da un tirón
su mirada hacia algo que usted no puede ver, probablemente no sea una mala idea
voltea tu cabeza también.
Por otro lado, aprender de los demás no siempre parece
particularmente racional. Las modas y las modas son el resultado de seguir las reglas de los demás.
comportamiento sin estar anclado a ninguna verdad objetiva subyacente sobre el
mundo. Lo que es peor, la suposición de que las acciones de otras personas son útiles
guía puede conducir al tipo de seguimiento de rebaños que precipita la economía
desastre. Si todos los demás están invirtiendo en bienes raíces, parece una buena
idea de comprar una casa; después de todo, el precio solo va a subir. ¿No es así?
Un aspecto interesante de la crisis hipotecaria de 2007-2009 es que
todos los involucrados parecían sentir que fueron castigados injustamente por
simplemente haciendo lo que se suponía que debían hacer. Una generación de estadounidenses que
Creció creyendo que las casas eran inversiones a prueba de fallas, y quién vio
todos los que los rodean comprando casas a pesar de (o debido a) el rápido aumento
Página 316
Página 317
Página 318
Página 319
Ningún postor ha actuado de manera irracional, pero el resultado neto es una catástrofe.
Como dice Hirshleifer, "Algo muy importante sucede una vez que alguien
decide seguir ciegamente a sus predecesores independientemente de su propio
señal de información, y es que su acción deja de ser informativa para todos
posteriores tomadores de decisiones. Ahora el grupo público de información ya no es
creciente. Ese beneficio de bienestar de tener información pública ... ha cesado ".
Para ver lo que sucede en el mundo real cuando una cascada de información
se hace cargo, y los postores no tienen casi nada más que el comportamiento de los demás
para estimar el valor de un artículo, no busque más allá de Peter A. Lawrence
texto de biología del desarrollo The Making of a Fly , que en abril de 2011 fue
se vende por $ 23,698,655.93 (más $ 3.99 de envío) en un tercero de Amazon
mercado. ¿Cómo y por qué este libro, ciertamente respetado, llegó
un precio de venta de más de $ 23 millones? Resulta que dos de los vendedores
establecían sus precios algorítmicamente como fracciones constantes entre sí:
uno siempre lo establecía en 0,99830 veces el precio de la competencia, mientras que el
competidor estaba fijando automáticamente su propio precio en 1.27059 veces el
otros. Aparentemente, ninguno de los vendedores pensó en establecer ningún límite en el resultado
números y, finalmente, el proceso se salió de control por completo.
Es posible que un mecanismo similar estuviera en juego durante el enigmático
y controvertida "caída repentina" del mercado de valores del 6 de mayo de 2010, cuando, en un
cuestión de minutos, el precio de varias empresas aparentemente al azar en el
El S&P 500 subió a más de 100.000 dólares por acción, mientras que otros cayeron
precipitadamente, a veces hasta $ 0.01 por acción. Casi $ 1 billón de valor
instantáneamente se convirtió en humo. Como Jim Cramer de CNBC informó en vivo,
estupefacto, “Eso ... no puede estar allí. Ese no es un precio real. Oh bien,
¡Solo ve a comprar Procter! Solo ve a comprar Procter & Gamble, informaron una decente
trimestre, solo ve a comprarlo ... quiero decir, esto es ridi, esta es una buena oportunidad ".
La incredulidad de Cramer es su información privada que se opone al público.
información. Aparentemente es la única persona en el mundo dispuesta a pagar, en
En este caso, $ 49 por una acción que el mercado aparentemente está valorando en menos de $ 40,
pero a él no le importa; ha visto los informes trimestrales, está seguro de lo que
sabe.
Página 320
Se dice que los inversores se dividen en dos grandes campos: inversores "fundamentales",
que negocian con lo que perciben como el valor subyacente de una empresa, y
Inversores "técnicos", que negocian con las fluctuaciones del mercado. El aumento
del trading algorítmico de alta velocidad ha alterado el equilibrio entre estos dos
estrategias, y con frecuencia se queja de que las computadoras, desancladas a la
valor de los bienes en el mundo real, sin preocuparse por el precio de un libro de texto a decenas de
millones de dólares y acciones de primera a un centavo, empeoran la irracionalidad
del mercado. Pero aunque esta crítica se dirige típicamente a las computadoras,
la gente también hace lo mismo, ya que cualquier cantidad de burbujas de inversión
puede testificar. Una vez más, la culpa no suele ser de los jugadores, sino del juego.
sí mismo.
Las cascadas de información ofrecen una teoría racional no solo de las burbujas, sino también
de las modas y el comportamiento del rebaño en general. Ofrecen un relato de cómo es
fácilmente posible que cualquier mercado aumente y colapse, incluso en ausencia de
irracionalidad, malevolencia o malversación. Las conclusiones son varias. Para
Uno, tenga cuidado con los casos en los que la información pública parece exceder la información privad
información, donde sabe más sobre lo que hacen las personas que por qué
lo están haciendo, donde a usted le preocupa más que sus juicios encajen
el consenso que ajustarse a los hechos. Cuando estás mirando principalmente a los demás
para establecer un rumbo, es posible que te estén mirando para hacer lo mismo.
En segundo lugar, recuerde que las acciones no son creencias; las cascadas son causadas en parte
cuando malinterpretamos lo que otros piensan basándonos en lo que hacen . Deberíamos
ser especialmente reacios a anular nuestras propias dudas, y si lo hacemos, podríamos
queremos encontrar alguna forma de transmitir esas dudas incluso a medida que avanzamos,
para que otros no logren distinguir la desgana en nuestras mentes de la implícita
entusiasmo en nuestras acciones. Por último, debemos recordar del prisionero
dilema de que a veces un juego puede tener reglas irremediablemente pésimas. Allí
Puede que no haya nada que podamos hacer una vez que estemos en él, pero la teoría de la información
las cascadas pueden ayudarnos a evitar ese juego en primer lugar.
Y si eres el tipo de persona que siempre hace lo que crees que es
bien, no importa lo loco que otros piensen que es, anímate. La mala noticia es que
que va a estar mal con más frecuencia que los seguidores de la manada. La buena noticia es
que apegarse a sus convicciones crea una externalidad positiva, permitiendo que la gente
Página 321
Página 322
valor de la segunda oferta más alta, independientemente del valor de la suya. Esta
hace que la subasta de Vickrey sea lo que los diseñadores de mecanismos denominan "a prueba de estrat
o simplemente "veraz". En la subasta de Vickrey, la honestidad es literalmente la mejor política.
Aún mejor, la honestidad sigue siendo la mejor política independientemente de si el
otros postores son honestos ellos mismos. En el dilema del prisionero, vimos cómo
la deserción resultó ser la estrategia "dominante", el mejor movimiento no
importa si su pareja desertó o cooperó. En una subasta de Vickrey,
por otro lado, la honestidad es la estrategia dominante. Este es el mecanismo
santo grial del diseñador. No es necesario elaborar estrategias ni recurrir.
Ahora, parece que la subasta de Vickrey le costaría al vendedor
dinero en comparación con la subasta de primer precio, pero esto no es necesariamente cierto. En
una subasta
pagar de másde enprimer precio,
la subasta cada postor
de Vickrey está sombreando
de segundo precio, nosu
esoferta paraen
necesario, evitar
una
sentido, la subasta en sí está sombreando de manera óptima su oferta para ellos . De hecho, un
principio de la teoría del juego llamado "equivalencia de ingresos" establece que sobre
tiempo, el precio de venta promedio esperado en una subasta de primer precio convergerá
exactamente lo mismo que en una subasta de Vickrey. Así, el equilibrio de Vickrey
implica que el mismo postor gane el artículo por el mismo precio, sin ningún tipo de
elaboración de estrategias por parte de cualquiera de los postores. Como dice Tim Roughgarden
sus estudiantes de Stanford, la subasta de Vickrey es "increíble".
Para el teórico de juegos algorítmicos de la Universidad Hebrea Noam Nisan, esto
la genialidad tiene un aire que es casi utópico. "Te gustaría conseguir
algún tipo de reglas de la sociedad donde no vale la pena mentir, y luego
la gente no mentirá tanto, ¿verdad? Ésa es la idea básica. Desde mi punto de
vista, lo asombroso de Vickrey es que no esperarías eso en
en general, es posible hacer eso, ¿verdad? Especialmente en cosas como una subasta,
donde por supuesto quiero pagar menos, ¿cómo se puede jamás Get-Y luego todavía
Vickrey muestra, esta es la manera de hacerlo. Creo que es realmente fantástico ".
De hecho, la lección aquí va mucho más allá de las subastas. En un hallazgo histórico
llamado el "principio de la revelación", el premio Nobel Roger Myerson demostró que
cualquier juego que requiera enmascarar estratégicamente la verdad puede transformarse
en un juego que no requiere nada más que honestidad. Paul Milgrom,
El colega de Myerson en ese momento, reflexiona: “Es uno de esos resultados que, como
Página 323
Página 324
Cuando pensamos en nosotros mismos, cuando tratamos de conocernos a nosotros mismos ... usamos nuestro conocimiento
que otras personas ya tienen. Nos juzgamos a nosotros mismos con los medios que tienen otras personas y
nos has dado para juzgarnos a nosotros mismos. En lo que sea que diga sobre mí, el juicio de otra persona
siempre entra. En lo que sea que siento dentro de mí, entra el juicio de otra persona ... Pero eso
no significa en absoluto que uno no pueda tener relaciones con otras personas. Simplemente saca a relucir el
capital importancia de todas las demás personas para cada uno de nosotros.
Quizás, dado lo que hemos visto en este capítulo, podríamos esforzarnos por
revisar la declaración de Sartre. Interactuar con los demás no tiene por qué ser una
pesadilla, aunque en el juego equivocado seguramente puede serlo. Como Keynes
observado, la popularidad es complicada, intratable, una recursiva sala de espejos;
pero la belleza, a los ojos del espectador, no lo es. Adoptar una estrategia que
no requiere anticipar, predecir, leer o cambiar de rumbo
debido a las tácticas de los demás es una forma de cortar el nudo gordiano de
recursividad. Y, a veces, esa estrategia no solo es fácil, es óptima.
Si cambiar de estrategia no ayuda, puede intentar cambiar el juego. Y
si eso no es posible, al menos puede ejercer algún control sobre qué
juegos que elijas jugar. El camino al infierno está pavimentado con intratable
recursiones, malos equilibrios y cascadas de información. Busque juegos donde
la honestidad es la estrategia dominante. Entonces sé tú mismo.
Página 325
*De hecho, es el origen de todas las computadoras modernas; fue el problema que se detuvo lo que inspiró a Turing a
definir formalmente la computación, a través de lo que ahora llamamos la máquina de Turing.
Página 326
*Binmore agrega otra idea: juegos como el dilema del prisionero aparentemente borran a Immanuel
El argumento de Kant de que la racionalidad consiste en lo que él llamó el "imperativo categórico", actuando como
la forma en que desearía que todos los demás actuaran. El imperativo categórico nos daría un mejor resultado en
el dilema del prisionero que la estrategia de equilibrio, pero no hay forma de evitar el hecho de que esta
el resultado no es estable.
Página 327
Conclusión
Bondad computacional
Creo firmemente que las cosas importantes de los humanos son sociales en
carácter y ese alivio por las máquinas de muchos de nuestro presente
Las funciones intelectuales exigentes finalmente le darán tiempo a la raza humana.
e incentivo para aprender a vivir bien juntos.
—MERRILL FLOOD
Página 328
esos lamentos se acumularán cada vez más lentamente a medida que avance la vida. Incluso
la mejor estrategia a veces produce malos resultados, razón por la cual la computadora
Los científicos se preocupan por distinguir entre "proceso" y "resultado". Si tu
ha seguido el mejor proceso posible, entonces ha hecho todo lo posible y
No debería culparse a sí mismo si las cosas no salieron como desea.
Los resultados aparecen en los titulares de las noticias; de hecho, hacen que el mundo en que vivimos
en, por lo que es fácil obsesionarse con ellos. Pero los procesos son lo que tenemos
control sobre. Como dijo Bertrand Russell, "parece que debemos tomar
cuenta de la probabilidad al juzgar la rectitud objetiva ... El objetivo
El acto correcto es el que probablemente será más afortunado. Definiré esto
como el acto más sabio ". Podemos tener la esperanza de ser afortunados, pero debemos esforzarnos por
sabio. Llámelo una especie de estoicismo computacional.
Finalmente, podemos trazar una línea clara entre los problemas que admiten
soluciones sencillas y problemas que no lo hacen. Si terminas atrapado en
un escenario intratable, recuerde que las heurísticas, aproximaciones y
El uso estratégico de la aleatoriedad puede ayudarlo a encontrar soluciones viables. Un tema
que surgió una y otra vez en nuestras entrevistas con científicos informáticos
era: a veces "suficientemente bueno" realmente es suficientemente bueno. Además, estar
consciente de la complejidad puede ayudarnos a elegir nuestros problemas: si tenemos control sobre
qué situaciones enfrentamos, debemos elegir las que son manejables.
Pero no solo elegimos los problemas que nos planteamos. Nosotros también
elegir los problemas que nos planteamos, ya sea la forma en que diseñamos una ciudad
o la forma en que hacemos una pregunta. Esto crea un puente sorprendente desde
ciencia de la computación a la ética, en la forma de un principio que llamamos
bondad computacional .
***
Hay una cierta paradoja que observamos los dos cuando se trataba de
programar las entrevistas incluidas en este libro. Nuestros entrevistados fueron
en promedio, es más probable que esté disponible cuando solicitamos una reunión, digamos,
"El próximo martes entre la 1:00 p. M. Y las 2:00 p. M. PST" que "a una hora conveniente
esta semana que viene ". Al principio esto parece absurdo, como los célebres estudios
donde la gente, en promedio, dona más dinero para salvar la vida de un pingüino
Página 329
que ocho mil pingüinos, o afirman estar más preocupados por morir en
un acto de terrorismo que morir por cualquier causa, incluido el terrorismo. En
En el caso de las entrevistas, parece que la gente prefirió recibir una
problema restringido, incluso si las restricciones fueron sacadas de la nada,
que uno abierto de par en par. Aparentemente fue menos difcil para ellos
adaptarse a nuestras preferencias y limitaciones que calcular una mejor
opción basada en la suya. Los científicos de la computación asentirían a sabiendas aquí,
citando la brecha de complejidad entre "verificación" y "búsqueda", que es
tan grande como la brecha entre conocer una buena canción cuando la escuchas
y escribiendo uno en el acto.
Uno de los principios implícitos de la informática, por extraño que parezca
suena, es que la computación es mala : la directiva subyacente de cualquier bien
algoritmo es minimizar el trabajo del pensamiento. Cuando interactuamos con otros
personas, les presentamos problemas computacionales, no solo explícitos
solicitudes y demandas, pero desafíos implícitos como interpretar nuestra
intenciones, nuestras creencias y nuestras preferencias. Es lógico, por lo tanto,
que una comprensión computacional de tales problemas arroja luz sobre el
naturaleza de la interacción humana. Podemos ser "computacionalmente amables" con los demás al
enmarcar los problemas en términos que hacen que el problema computacional subyacente
más fácil. Esto es importante porque muchos problemas, especialmente los sociales, como
que hemos visto, son intrínseca e inextricablemente difíciles.
Considere este escenario tan común. Un grupo de amigos está parado
alrededor, tratando de averiguar dónde ir a cenar. Cada uno de ellos tiene claramente
algunas preferencias, aunque potencialmente débiles. Pero ninguno de ellos quiere
expresar esas preferencias explícitamente, de modo que naveguen cortésmente por las
peligros con conjeturas y medias indirectas.
Bien pueden llegar a una resolución que satisfaga a todos. Pero esto
El procedimiento puede salir mal fácilmente. El verano después de la universidad, por ejemplo, Brian
y dos amigos hicieron un viaje a España. Negociaron el itinerario del viaje en
la mosca, y en un momento se hizo evidente que no tendrían tiempo de ir
a la corrida de toros que habían investigado y planeado. Solo entonces, como cada uno de los
tres intentaron consolar a los demás, ¿descubrieron de repente que, de hecho,
ninguno de ellos había querido ver la corrida en primer lugar. Cada uno acababa de
Página 330
adoptaron valientemente lo que habían percibido como el nivel de entusiasmo de los demás,
produciendo así el nivel de entusiasmo que los demás adoptaron valientemente en
girar.
Del mismo modo, lenguaje aparentemente inocuo como "Oh, soy flexible" o
"¿Qué quieres hacer esta noche?" tiene un oscuro vientre computacional
eso debería hacerte pensar dos veces. Tiene un barniz de bondad, pero
hace dos cosas profundamente alarmantes. Primero, pasa la pelota cognitiva:
"Aquí hay un problema, usted lo maneja". En segundo lugar, al no indicar sus preferencias,
invita a los demás a simularlos o imaginarlos. Y como hemos visto, el
La simulación de las mentes de los demás es uno de los mayores
desafíos que una mente (o una máquina) puede enfrentar.
En tales situaciones, la amabilidad computacional y la etiqueta convencional
divergir. Retener cortésmente sus preferencias pone la computacional
problema de inferirlos sobre el resto del grupo. En contraste, cortésmente
afirmar sus preferencias ("Personalmente, me inclino por x . ¿Qué
¿crees? ”) ayuda a asumir la carga cognitiva de mover al grupo hacia
resolución.
Alternativamente, puede intentar reducir, en lugar de maximizar, el número
de opciones que ofrece a otras personas, por ejemplo, ofrecer una opción entre dos
o tres restaurantes en lugar de diez. Si cada persona del grupo elimina
su opción menos preferida, que facilita la tarea a todos. Y si
está invitando a alguien a almorzar o programando una reunión, ofreciendo
una o dos propuestas concretas que puedan aceptar o rechazar es una buena
punto de partida.
Ninguna de estas acciones es necesariamente "cortés", pero todas pueden
reducir significativamente el costo computacional de la interacción.
***
Página 331
para hacer el cambio. Encantadoramente, la respuesta resultó ser una moneda de 18 centavos.
—Pero a Shallit se le impidió hacer una recomendación de política
por preocupaciones computacionales.
En la actualidad, realizar cambios es muy simple: para cualquier cantidad dada, solo
use tantos centavos como pueda sin pasarse, luego tantos centavos como
posible, y así sucesivamente en las denominaciones. Por ejemplo, cincuenta y cuatro centavos
son dos cuartos, luego cuatro centavos. Con una moneda de 18 centavos, así de simple
El algoritmo ya no es óptimo: es mejor hacer cincuenta y cuatro centavos con tres
Monedas de 18 centavos, y ninguna moneda de veinticinco centavos. De hecho, Shallit observó que
denominaciones desgarbadas convierten el cambio en algo "al menos como
difícil ... como el problema del viajante de comercio ". Es mucho pedirle a un cajero.
Si se tiene en cuenta la facilidad de cálculo, concluyó Shallit, ¿cuál
La oferta monetaria de EE. UU. Que podría aprovechar mejor es una moneda de 2 centavos o de 3 centav
pieza. No es tan emocionante como una moneda de 18 centavos, pero casi tan buena y
computacionalmente más amable por mucho.
El punto más profundo es que los cambios sutiles en el diseño pueden cambiar radicalmente la
tipo de problema cognitivo planteado a los usuarios humanos. Arquitectos y urbanos
los planificadores, por ejemplo, tienen opciones sobre cómo construir nuestra
medio ambiente, lo que significa que tienen opciones sobre cómo
estructurar los problemas computacionales que tenemos que resolver.
Considere un estacionamiento grande, con una variedad de carriles diferentes, del tipo
a menudo se encuentra en estadios y centros comerciales. Puede conducir en un carril
hacia el destino, ver un lugar, decidir dejarlo ir a favor de (con suerte)
uno mejor más adelante, pero luego, al no encontrar tal suerte, alcanza el
destino y diríjase por un carril vecino. Después de una cierta cantidad
de conducir, debe decidir si otro espacio es lo suficientemente bueno para ocupar,
o tan lejos que intente buscar en un tercer carril en su lugar.
Una perspectiva algorítmica aquí es útil no solo para el conductor sino también
para el arquitecto. Contrasta el complicado y complicado problema de decisión que plantea uno.
de esos lotes a un solo camino lineal que se aleja del destino de uno. En
En ese caso, uno simplemente toma el primer espacio disponible, sin teoría de juegos, sin
análisis, no se necesita una regla de mirar y luego saltar. Algunos estacionamientos son
estructurado de esta manera, con una sola hélice que se enrolla hacia arriba desde el suelo
Página 332
Página 333
***
Si podemos ser más amables con los demás, también podemos ser más amables con nosotros mismos. No
computacionalmente más amable: todos los algoritmos e ideas que hemos discutido
ayudará con eso. Pero también más indulgente.
El estándar intuitivo para la toma de decisiones racional es cuidadosamente
considerando todas las opciones disponibles y tomando la mejor. A primera vista,
las computadoras parecen modelos de este enfoque, abriéndose camino
a través de cálculos complejos durante el tiempo que sea necesario para obtener respuestas perfectas.
Pero, como hemos visto, esa es una imagen obsoleta de lo que hacen las computadoras: es una
lujo proporcionado por un problema fácil. En los casos difíciles, los mejores algoritmos
se trata de hacer lo que tiene más sentido en el menor tiempo posible,
que de ninguna manera implica prestar una cuidadosa consideración a cada factor
y persiguiendo cada cálculo hasta el final. La vida es demasiado complicada para
ese.
En casi todos los dominios que hemos considerado, hemos visto cómo cuanto más
factores del mundo real que incluimos, ya sea que tenga información incompleta
al entrevistar a los solicitantes de empleo, lidiar con un mundo cambiante cuando
tratando de resolver el dilema explorar / explotar, o tener ciertas tareas
depender de los demás cuando intentamos hacer las cosas; es más probable que
van a terminar en una situación en la que encontrar la solución perfecta requiere
irrazonablemente largo. Y, de hecho, la gente casi siempre se enfrenta a lo que
Página 334
Notas
Tenga en cuenta que algunos de los enlaces a los que se hace referencia ya no funcionan.
Los números de página de las notas que aparecieron en la versión impresa de este
el título no está en su libro electrónico. Utilice la función de búsqueda en su e-
dispositivo de lectura para buscar los pasajes relevantes documentados o discutidos.
INTRODUCCIÓN
al-Jabr wa'l-Muqābala : Al-Jabr wa'l-Muqābala trajo consigo una tecnología verdaderamente disruptiva: la
Sistema decimal indio, y el hecho de que nos referimos a este sistema de forma algo errónea como árabe
numerals es testimonio de la influencia del libro. La introducción de números arábigos y la
algoritmos que apoyan, dio inicio a un enfrentamiento medieval entre los defensores de este novedoso
matemáticas (los "algoristas") y contadores más tradicionales que favorecían los números romanos respaldados por
un ábaco (los "abacistas"). Se puso bastante intenso: la ciudad de Florencia aprobó una ley en 1399 que prohibía
el uso de números arábigos por parte de los bancos. Irónicamente, los números romanos eran en sí mismos un controvertido
innovación cuando se ofrecieron como una alternativa a simplemente escribir números con palabras, siendo
declarado "no apto para mostrar una suma, ya que los nombres se han inventado para tal fin". Ver Murray,
Capítulos de la historia de la contabilidad .
Tablilla de arcilla sumeria de cuatro mil años: un análisis detallado aparece en Knuth, “Ancient
Algoritmos babilónicos ". Más información sobre la historia de los algoritmos, con énfasis en
algoritmos matemáticos, aparece en Chabert, Barbin y Weeks, A History of Algorithms .
Golpes con la punta de una cornamenta: esta técnica se conoce como "percusión de martillo suave".
la forma en que pensamos sobre la racionalidad humana: las limitaciones de una concepción clásica de la racionalidad
—Que asume una capacidad computacional infinita y un tiempo infinito para resolver un problema— fueron
famoso por el psicólogo, economista y pionero de la inteligencia artificial Herbert
Simon en la década de 1950 (Simon, Models of Man ), lo que finalmente llevó a un Premio Nobel. Simon argumentó que
Página 336
La “racionalidad limitada” podría proporcionar una mejor explicación del comportamiento humano. La intuición de Simon ha sido
se hizo eco en las matemáticas y la informática. El colega de Alan Turing, IJ Good (famoso por la
concepto de “la singularidad” y por asesorar a Stanley Kubrick sobre HAL 9000 para 2001: un espacio
Odyssey ) llamó a este tipo de pensamiento "Racionalidad Tipo II". Mientras que el Tipo I clásico y pasado de moda
La racionalidad solo se preocupa por obtener la respuesta correcta, la racionalidad de tipo II tiene en cuenta el costo
de obtener esa respuesta, reconociendo que el tiempo es una moneda tan importante como la precisión. Ver bien,
Buen pensamiento .
Los expertos en inteligencia artificial del siglo XXI también han argumentado que
Optimality ”, elegir el algoritmo que mejor compensa el tiempo y el error, es la clave para desarrollar
agentes inteligentes funcionales. Este es un punto planteado por, por ejemplo, el científico informático de UC Berkeley
Stuart Russell, quien literalmente coescribió el libro sobre inteligencia artificial (el libro de texto más vendido
Inteligencia artificial: un enfoque moderno ), y por Eric Horvitz, director gerente de Microsoft
Investigar. Véase, por ejemplo, Russell y Wefald, Do the Right Thing , y Horvitz y Zilberstein,
"Compensaciones computacionales bajo recursos acotados". Tom y sus colegas han utilizado este
enfoque para desarrollar modelos de cognición humana; véase Griffiths, Lieder y Goodman, “Rational Use
de recursos cognitivos ".
analogía con un matemático humano: en la sección 9 de Turing, "Sobre números computables", Turing
justifica las decisiones tomadas al definir lo que ahora llamamos una máquina de Turing comparándolas con
operaciones que una persona podría realizar: una hoja de papel bidimensional se convierte en una
cinta dimensional, el estado mental de la persona se convierte en el estado de la máquina, y los símbolos son
escrito y leído a medida que la persona o la máquina se mueven sobre el papel. La computación es lo que
la computadora lo hace, y en ese momento las únicas "computadoras" eran personas.
somos irracionales y propensos a cometer errores: por ejemplo, véase Gilovich, How We Know What Isn't So ; Ariely
y Jones, predeciblemente irracional ; y Marcus, Kluge .
1. PARADA ÓPTIMA
"Aunque todos los cristianos comienzan": De la carta de Kepler a "un noble desconocido" el 23 de octubre,
1613; véase, por ejemplo, Baumgardt, Johannes Kepler .
un fenómeno tan común: la gota de pavo se menciona, entre muchos otros lugares, en
http://www.npr.org/templates/story/story.php?storyId=120913056 y
http://jezebel.com/5862181/technology-cant-stop-the-turkey-drop .
En cualquier problema de parada óptima: Para obtener más información sobre las matemáticas de la parada óptima, Ferguson,
Detenciones y aplicaciones óptimas , es una maravillosa referencia.
El rompecabezas más famoso de la parada óptima: un tratamiento detallado de la naturaleza y los orígenes de la
El problema de la secretaria aparece en Ferguson, "¿Quién resolvió el problema de la secretaria?"
su primera aparición impresa: sobre lo que escribe Gardner es sobre un juego de salón llamado "Juego de
Googol ”, aparentemente ideado en 1958 por John Fox del regulador de Minneapolis-Honeywell
Company y Gerald Marnie del MIT. Así es como Fox lo describió en su carta original a
Gardner el 11 de mayo de 1959 (todas las cartas a Gardner que citamos son de los artículos de Martin Gardner en
Universidad de Stanford, serie 1, caja 5, carpeta 19):
El primer jugador escribe tantos números positivos únicos en diferentes hojas de papel como
el desea. Luego los baraja y les da la vuelta de uno en uno. Si el segundo jugador dice
Página 337
que se detenga en un cierto resbalón y el número en ese boleto es el número más grande de la colección
entonces el segundo jugador gana. Si no, el primer jugador gana.
Fox señaló además que el nombre del juego proviene del hecho de que el número "uno googol" es
a menudo escrito en uno de los resbalones (presumiblemente para engañar al oponente haciéndole creer que es el más grande
número, con "dos googol" apareciendo en otro lugar). Luego afirmó que la estrategia óptima para
el segundo jugador debía esperar hasta que la mitad de los papeles se hubiera volteado y luego elegir la primera
número mayor que el más grande en la primera mitad, convergiendo en un 34,7% de posibilidades de ganar.
Gardner le escribió a Leo Moser, un matemático de la Universidad de Alberta, para obtener más
información sobre el problema. Moser había escrito un artículo en una revista en 1956 que trataba de cerca
problema relacionado (Moser, "Sobre un problema de Cayley"), propuesto originalmente en 1875 por el influyente
El matemático británico Arthur Cayley (Cayley, "Mathematical Questions"; Cayley, Collected
Artículos matemáticos ). Aquí está la versión propuesta por Cayley:
La lotería se organiza de la siguiente manera: Hay n boletos que representan a , b , c libras respectivamente.
Una persona dibuja una vez; mira su boleto; y si quiere, vuelve a dibujar (del resto
n - 1 entradas); mira su boleto y, si le place, vuelve a dibujar (de los n - 2 restantes
Entradas); y así sucesivamente, dibujando en total no más de k veces; y recibe el valor de la última
billete dibujado. Suponiendo que regula sus dibujos de la manera más ventajosa para
él de acuerdo con la teoría de probabilidades, ¿cuál es el valor de su expectativa?
Moser agregó una información más: que las entradas tenían la misma probabilidad de adquirir algún valor.
entre 0 y 1.
En el problema de Cayley y la ligera reformulación del mismo de Moser (a veces denominado colectivamente como
el problema de Cayley-Moser), la recompensa es el valor del boleto elegido y el desafío es encontrar
la estrategia que da el mayor rendimiento promedio. Es aquí donde el problema explorado por Cayley y
Moser se diferencia del problema de la secretaria (y el Juego de Googol) al centrarse en maximizar la
valor promedio del número elegido, en lugar de la probabilidad de encontrar el número más grande
(cuando nada más que lo mejor servirá). El artículo de Moser de 1956 es notable no solo por la elegante solución que
proporciona a este problema, sino también porque es el primer lugar donde vemos mención del mundo real
consecuencias de una parada óptima. Moser habla de dos posibles escenarios:
1. El problema del turista: un turista que viaja en automóvil quiere pasar la noche en uno de los n moteles
indicado en su guía de carreteras. Busca el alojamiento más cómodo pero, naturalmente, lo hace
No quiero volver sobre ninguna parte de su viaje. ¿Qué criterio debería utilizar para detenerse?
2. El dilema del soltero: un soltero conoce a una chica que está dispuesta a casarse con él y cuya
"Vale" que puede estimar. Si él la rechaza, ella no tendrá nada de él más tarde, pero es probable que él
conocer a otras chicas en el futuro y estima que tendrá n oportunidades en total. Bajo que
circunstancias en que debería casarse?
La idea de entretener a una serie de pretendientes —con los sexos de los protagonistas invertidos— debidamente formulada
una aparición en la columna de 1960 de Gardner sobre el Juego de Googol.
Moser proporcionó la solución correcta, la regla del 37%, a Gardner, pero su carta del 26 de agosto,
1959, sugirió que el problema podría tener un origen anterior: “También encontré en algunas notas que R.
E. Gaskell (de Boeing Aircraft en Seattle) distribuido en enero de 1959. Él atribuye el problema al Dr.
G. Marsaglia ”.
Página 338
La interpretación caritativa de Gardner fue que Fox y Marnie reclamaban la creación del
juego específico de Googol, no del problema más amplio del que ese juego era una instancia, un punto
que fue cuidadosamente elaborado en su columna. Pero recibió una variedad de cartas que citaban ejemplos anteriores de
problemas similares, y está claro que el problema se transmitió entre los matemáticos.
Los orígenes del problema son sorprendentemente misteriosos: incluso Gilbert y Mosteller, "Recognizing the
Máximo de una secuencia ”, uno de los artículos científicos más autorizados sobre el problema de la secretaria,
admite que "los esfuerzos por descubrir el origen de este problema no han tenido éxito". Ferguson,
"¿Quién resolvió el problema de la secretaria?" Proporciona una historia divertida y matemáticamente detallada de
el problema de la secretaria, incluidas algunas de sus variantes. Ferguson argumentó que, de hecho, el problema
descrito por Gardner no se había resuelto. Ya debería estar claro que mucha gente resolvió el
Problema de secretaria de maximizar la probabilidad de seleccionar al mejor de una secuencia de solicitantes.
distinguido sólo por sus rangos relativos, pero Ferguson señaló que este no es en realidad el
Problema planteado en el Juego de Googol. En primer lugar, el reproductor de Googol conoce los valores observados en
cada trozo de papel. En segundo lugar, es un juego competitivo: un jugador intenta seleccionar números y un
secuencia que engañará al otro. Ferguson tiene su propia solución para este problema más desafiante,
¡pero es lo suficientemente complejo como para que tengas que leer el documento tú mismo!
Mosteller recordó haber oído hablar del problema: Gilbert y Mosteller, "Recognizing the Maximum
de una secuencia ".
Roger Pinkham de Rutgers escribió: Carta de Roger Pinkham a Martin Gardner, 29 de enero de
1960.
Influencia de Flood en la informática: véase Cook, In Pursuit of the Travelling Salesman ;
Poundstone, el dilema del prisionero ; y Flood, "Soft News".
considerando el problema desde 1949: Flood hizo esta afirmación en una carta que escribió a Gardner en mayo
5 de mayo de 1960. Adjuntaba una carta del 5 de mayo de 1958, en la que proporcionaba la solución correcta, aunque
También indicó que se rumoreaba que Andrew Gleason, David Blackwell y Herbert Robbins tenían
resuelto el problema en los últimos años.
En una carta a Tom Ferguson fechada el 12 de mayo de 1988, Flood entró en más detalles sobre el origen de
el problema. (La carta está archivada en el archivo Merrill Flood de la Universidad de Michigan).
hija, recién graduada de la escuela secundaria, había entablado una relación seria con un hombre mayor,
y Flood y su esposa lo desaprobaron. Su hija estaba tomando las minutas en una conferencia en George
Washington University en enero de 1950, y Flood presentó lo que llamó el "problema del prometido"
allí. En sus palabras, "No intenté resolver el problema en ese momento, pero lo presenté simplemente
porque esperaba que [ella] pensara un poco en esos términos y sonaba como si fuera un poco agradable
problema matemático fácil ". Flood indica que Herbert Robbins proporcionó una solución aproximada
unos años más tarde, antes de que el propio Flood descubriera la solución exacta.
parece estar en un artículo de 1964: el artículo es de Chow et al., "Selección óptima basada en
Rango."
lo mejor que ha visto hasta ahora: en la literatura, se hace referencia a lo que llamamos solicitantes "mejores hasta ahora" (nosotros
pensar de forma algo confusa) como "candidatos".
se asienta en el 37% del grupo: La regla del 37% se deriva haciendo el mismo análisis para n solicitantes:
calcular la probabilidad de que establecer un estándar basado en los primeros k solicitantes resulte en elegir
el mejor solicitante en general. Esta probabilidad se puede expresar en términos de la relación de k a n , que nos
Página 339
puede llamar p . A medida que n aumenta, la probabilidad de elegir al mejor candidato converge a la
función matemática - p log p . Esto se maximiza cuando p = 1 / e . El valor de e es 2 . 71828 …, entonces 1 / e
es 0 . 367879441 …, o poco menos del 37%. Y la coincidencia matemática: que la probabilidad de
el éxito es lo mismo que p — surge porque log e es igual a 1. Entonces, si p = 1 / e , - p log p es solo 1 / e . Un bien
La versión explicada de la derivación completa aparece en Ferguson, "¿Quién resolvió el problema de la secretaria?"
una de las curiosas simetrías matemáticas del problema: los matemáticos John Gilbert y
Frederick Mosteller llama a esta simetría "divertida" y la discute con un poco más de detalle en Gilbert
y Mosteller, "Reconociendo el máximo de una secuencia".
“La pasión entre los sexos”: Malthus, Ensayo sobre el principio de población .
"Se casó con el primer hombre que besé": atribuido por muchas fuentes, por ejemplo, Thomas, Front Row en el
Casa Blanca .
un estudiante graduado que busca el amor: la publicación del blog de Michael Trick sobre el encuentro con su esposa es "Finding
Love Optimally ”, blog de investigación de operaciones de Michael Trick , 27 de febrero de 2011,
http://mat.tepper.cmu.edu/blog/?p=1392.
el número de solicitantes o el tiempo : la regla del 37% se aplica directamente al período de tiempo de uno
buscar solo cuando los solicitantes estén distribuidos uniformemente a lo largo del tiempo. De lo contrario, querrás apuntar
más precisamente para el 37% de la distribución a lo largo del tiempo. Véase Bruss, “Un enfoque unificado para una clase de
Problemas con las mejores opciones ".
la Regla del 37% dio 26,1 años de edad: El análisis de esperar hasta al menos 26 años para proponer (37% de
el camino de 18 a 40) aparece por primera vez en Lindley, "Programación dinámica y teoría de la decisión",
que es presumiblemente donde Trick encontró esta idea.
cortejando a un total de once mujeres: la historia de Kepler se cubre en detalle en Koestler, The Watershed ,
y en Baumgardt, Johannes Kepler , así como en Connor, la bruja de Kepler . La mayor parte de lo que sabemos
sobre la búsqueda de Kepler de una segunda esposa proviene de una carta en particular, que Kepler escribió a
"Un noble desconocido" de Linz, Austria, el 23 de octubre de 1613.
proponer temprano y con frecuencia: Smith, "Un problema de secretaria con empleo incierto", mostró que si
la probabilidad de que una propuesta sea rechazada es q , entonces la estrategia que maximiza la probabilidad de
encontrar el mejor solicitante es mirar una proporción de solicitantes igual a q 1 / (1− q ) y luego hacer
ofrece a cada solicitante mejores que las vistas hasta ahora. Esta proporción es siempre menor que 1 / e , por lo que
está mejorando sus posibilidades al hacer más ofertas. Desafortunadamente, esas posibilidades siguen siendo
peor que si no te rechazaran, la probabilidad de terminar con el mejor candidato es
también q 1 / (1− q ) , y por lo tanto menor que el dado por la regla del 37%.
hasta que haya visto el 61% de los solicitantes: si se permiten propuestas retrasadas, la estrategia óptima depende
sobre la probabilidad de que se acepte una propuesta inmediata, q , y la probabilidad de un retraso
propuesta aceptada, pág . La proporción de candidatos que inicialmente pasan por alto viene dada por el
fórmula desalentadora . Esta fórmula integrada para el rechazo y el recuerdo proviene de
Petruccelli, "Problemas de mejor elección que involucran incertidumbre", aunque recordar a los candidatos anteriores fue
considerado anteriormente por Yang, "Reconociendo el máximo de una secuencia aleatoria".
Esta fórmula se simplifica cuando hacemos elecciones particulares para q y p . Si p = 0, tan retrasado
Las propuestas siempre son rechazadas, recuperamos la regla para el problema de la secretaria con el rechazo. Como nosotros
enfoque q = 1, con propuestas inmediatas siempre aceptadas, la proporción en la que comenzar
Página 340
hacer ofertas tiende hacia e p −1 , que siempre es mayor que 1 / e (que puede reescribirse como e −1 ).
Esto significa que tener el potencial de hacer ofertas a los solicitantes que han sido pasados por alto debería
resultan en pasar más tiempo pasando por alto a los solicitantes, algo que es bastante intuitivo. En general
texto asumimos que las propuestas inmediatas son siempre aceptadas ( q = 1) pero las propuestas retrasadas son
rechazado la mitad del tiempo ( p = 0 . 5). Entonces debe pasar más del 61% de los solicitantes y hacer una oferta para
el mejor hasta ahora, quien sigue, regresando al final y haciendo una oferta al mejor en general si es necesario.
Otra posibilidad considerada por Petruccelli es que la probabilidad de rechazo aumenta con
tiempo, a medida que disminuye el ardor de los solicitantes. Si la probabilidad de que una oferta sea aceptada por un
solicitante es qp s , donde s es el número de "pasos" en el pasado necesarios para llegar a ese solicitante, entonces
la estrategia óptima depende de q , p , y del número de solicitantes, n . Si q / (1 - p ) es mayor que n - 1
entonces es mejor jugar a esperar, observar a todos los solicitantes y luego hacer una oferta al mejor.
De lo contrario, observe una proporción igual a q 1 / (1− q ) y haga una oferta al próximo solicitante mejor que
los vistos hasta ahora. Curiosamente, esta es exactamente la misma estrategia (con la misma probabilidad de éxito)
como que cuando p = 0, lo que significa que si la probabilidad de rechazo aumenta con el tiempo, no hay beneficio
a poder volver a un candidato anterior.
utilizar la regla de umbral: la estrategia general para resolver problemas de frenado óptimos como el
El juego de información consiste en comenzar por el final y razonar hacia atrás, un principio que se llama
inducción." Por ejemplo, imagina un juego en el que lanzas un dado y tienes la opción de pegar
con ese número o tira de nuevo un máximo de k veces (tomamos este ejemplo de Hill, "Sabiendo
Cuándo parar ”). ¿Cuál es la estrategia óptima? Podemos resolverlo trabajando hacia atrás. Si k = 0,
no tienes una opción, tienes que ceñirte a tu tirada y obtendrás un promedio de 3.5 puntos (la
valor medio de una tirada de dado, (1 + 2 + 3 + 4 + 5 + 6) / 6). Si k = 1, entonces solo debes mantener un rollo que
supera ese promedio, un 4 o más. Si obtiene un 1, 2 o 3, es mejor que arriesgue la tirada final.
Siguiendo esta estrategia, hay un 50% de probabilidad de que te detengas con un 4, 5 o 6 (para un promedio de 5) y un
50% de probabilidad de pasar a la tirada final (para un promedio de 3,5). Entonces, su puntaje promedio en k = 1 es 4.25,
y solo debe mantener una tirada en k = 2 si supera ese puntaje, un 5 o más. Etcétera.
La inducción hacia atrás responde así a una antigua pregunta. "Más vale pájaro en mano que dos en
bush ”, decimos, pero es 2 . 0 el coeficiente correcto aquí? Las matemáticas sugieren que el número correcto de aves
en el monte depende en realidad de la calidad del pájaro en la mano. Reemplazo de pájaros con dados para
conveniencia, una tirada de 1, 2 o 3 ni siquiera vale tanto como un solo dado "en la selva". Pero un rollo de 4
vale un dado en el monte, mientras que una tirada de 5 vale dos, tres o incluso cuatro dados en el monte. Y un
la tirada de 6 vale incluso más que el contenido completo de un arbusto de dados infinitamente grande , sea lo que sea
es.
Gilbert y Mosteller utilizaron el mismo enfoque para derivar la serie de umbrales que deberían ser
utilizado en el problema de la secretaria de información completa. Los umbrales en sí mismos no están descritos por un
fórmula matemática simple, pero algunas aproximaciones aparecen en su artículo. Lo más simple
aproximación da un umbral de t k = 1 / (1 + 0 . 804 / k + 0,183 / k 2 ) para el solicitante n - k . Si el
probabilidad de que un solicitante aleatorio sea mejor que el solicitante n - k es menor que t k , entonces debe
tome ese solicitante. Debido a que el denominador aumenta, a una tasa creciente, a medida que aumenta k ,
debería estar bajando rápidamente su umbral a medida que pasa el tiempo.
Página 341
muchas más variantes del problema de la secretaria: Freeman, “El problema de la secretaria y su
Extensiones ”resume una gran cantidad de estas variantes. Aquí hay un recorrido rápido por algunos de los
resultados útiles.
Si es igualmente probable que el número de solicitantes sea cualquier número de 1 an , entonces la regla óptima es
para ver el primer n / e 2 (que es aproximadamente el 13,5% de n ) y tomar el siguiente candidato mejor que el
mejor visto hasta ahora, con una probabilidad de éxito de 2 / e 2 (Presman y Sonin, "The Best Choice Problem for
un número aleatorio de objetos ”).
Si el número de solicitantes es potencialmente infinito, pero la búsqueda se detiene después de cada solicitante con
probabilidad p , la regla óptima es ver los primeros 0.18 / p solicitantes, con un 23.6% de probabilidad de éxito
(ibídem.).
Imagina que quieres encontrar la mejor secretaria, pero el valor de hacerlo disminuye cuanto más tiempo
buscar. Si la recompensa por encontrar la mejor secretaria después de ver k solicitantes es d k , entonces la estrategia
que maximiza la recompensa esperada establece un umbral basado en un número de solicitantes que es
garantizado que sea inferior a 1 / (1 - d ) ya que el número total de solicitantes aumenta (Rasmussen y
Pliska, "Elegir el máximo"). Si d está cerca de 1, entonces una aproximación a la estrategia óptima es
para ver los primeros solicitantes de −0,4348 / log d y luego elegir el siguiente candidato mejor que cualquiera visto hasta ahora.
Seguir esta estrategia puede resultar en ver solo un puñado de solicitantes, independientemente del tamaño de la
piscina.
Una forma en que la vida real difiere de los escenarios de reclutamiento idealizados es que el objetivo puede no ser
sea maximizar la probabilidad de conseguir la mejor secretaria. Se han
explorado. Chow et al., "Selección óptima basada en el rango relativo", mostró que si el objetivo es
maximizar el rango promedio del candidato seleccionado, se aplica un tipo diferente de estrategia. En vez de
un solo umbral en el rango relativo del solicitante, hay una secuencia de umbrales. Estas
Los umbrales aumentan a medida que se observan más candidatos, y el entrevistador se vuelve menos estricto
tiempo extraordinario. Por ejemplo, con cuatro solicitantes, el rango mínimo relativo que un candidato debe tener
detener la búsqueda es 0 para el primer solicitante (nunca se detenga en el primero), 1 para el segundo (deténgase solo si
son mejores que el primero), 2 para el tercero (detente si es mejor o segundo mejor), y 4 para el cuarto (simplemente detente
¡ya!). Siguiendo esta estrategia se obtiene un rango promedio esperado de 1 7 ⁄ 8 , mejor que el
(1 + 2 + 3 + 4) / 4 = 2 1 ⁄ 2 que resultaría de elegir un solicitante al azar. La frmula para el
Los umbrales óptimos se encuentran por inducción hacia atrás y son complicados; recomendamos a los lectores interesados
al papel original.
Puedes pensar en la diferencia entre el problema clásico de la secretaria y el rango promedio
caso en términos de cómo asignan pagos a diferentes rangos. En el problema clásico, obtienes una recompensa.
de 1 para elegir lo mejor y 0 para todos los demás. En el caso de rango promedio, obtienes una recompensa igual a
el número de solicitantes menos el rango del solicitante seleccionado. Hay formas obvias de
generalizar esto, y estrategias de múltiples umbrales similares a la que maximiza el rango promedio
trabajar para cualquier función de pago que disminuya a medida que aumenta el rango del solicitante (Mucci, “On a
Clase de problemas de secretaria ”). Otra interesante generalización, con importantes implicaciones para
amantes exigentes, es que si la recompensa es 1 por elegir el mejor, pero -1 por elegir a alguien más
(con 0 para no hacer ninguna elección), debe pasar por una proporción de solicitantes dada por
, luego tome a la primera persona mejor que todas las vistas hasta ahora (o a nadie si todas fallan en esta
criterio) (Sakaguchi, “Juegos secuenciales bilaterales”). Así que piensa bien en tu función de pago
antes de prepararse para comprometerse!
Página 342
Pero, ¿qué pasa si no solo te importa encontrar a la mejor persona, sino cuánto tiempo tienes?
¿juntos? Ferguson, Hardwick y Tamaki, en "Maximizar la duración de poseer un
Best Object ”, examinó varias variantes de este problema. Si solo te importa maximizar el tiempo
gasta con la mejor persona en su conjunto de n , entonces debería mirar los primeros 0,204 n + 1,33
gente y salta para la siguiente persona mejor que todos ellos. Pero si le interesa maximizar la
la cantidad de tiempo que pasa con alguien que es la mejor de todas las personas vistas hasta ahora, debe
basta con mirar una proporción correspondiente a 1 / e 2 ≈ 13,5%. Estos períodos de búsqueda más cortos son
particularmente relevante en contextos, como las citas, donde la búsqueda de una pareja puede tomar un
proporción significativa de su vida.
Resulta que es más difícil encontrar a la segunda mejor persona que encontrar a la mejor. El óptimo
La estrategia es pasar por encima de la primera mitad de los solicitantes y luego elegir al siguiente solicitante que sea el segundo.
mejor en relación con los vistos hasta ahora (Rose, "Un problema de elección y asignación óptimas"). los
la probabilidad de éxito es solo 1/4 (en contraposición a 1 / e en el mejor de los casos). Así que es mejor que no intentes
resolver.
Por último, también existen variantes que reconocen el hecho de que mientras se busca una secretaria,
sus propios candidatos están buscando trabajo. La simetría agregada, que es particularmente
relevante cuando el escenario se refiere a las citas, hace que el problema sea aún más complicado. Peter Todd,
un científico cognitivo de la Universidad de Indiana, ha explorado esta complejidad (y cómo simplificarla) en
detalle. Véase Todd y Miller, "From Pride and Prejudice to Persuasion Satisficing in Mate Search",
y Todd, "Coevolved Cognitive Mechanisms in Mate Search".
Vender una casa es similar: el problema de vender una casa se analiza en Sakaguchi, “Dynamic
Programación de algún diseño de muestreo secuencial ”; Chow y Robbins, “Un sistema martingala
Teorema y aplicaciones ”; y Chow y Robbins, "Sobre las reglas de parada óptimas". Nos enfocamos en el
caso en el que potencialmente hay infinitas ofertas, pero estos autores también proporcionan
estrategias cuando la cantidad de ofertas potenciales es conocida y finita (que son menos conservadoras, usted
debe tener un umbral más bajo si solo tiene un número finito de oportunidades). En el caso infinito, tu
debe establecer un umbral basado en el valor esperado de esperar otra oferta y aceptar la primera oferta
que supera ese umbral.
precio de parada en función del costo de espera: expresando tanto el precio de oferta p como el costo de
esperando otra oferta c como fracciones de nuestro rango de precios (con 0 como la parte inferior del rango y 1 como
la parte superior), la probabilidad de que nuestra próxima oferta sea mejor que p es simplemente 1 - p . Si (o cuando) una oferta mejor
llega, la cantidad promedio que esperaríamos ganar en relación con p es solo (1− p ) ⁄ 2 . Multiplicando estos juntos
nos da el resultado esperado de recibir otra oferta, y esta debería ser mayor o igual que
al costo c vale la pena hacerlo. Esta ecuación (1 - p ) ( (1− p ) ⁄ 2 ) ≥ c se puede simplificar a ,
y resolverlo para p nos da la respuesta , como se muestra en la tabla aquí .
“La primera oferta que recibimos fue excelente”: Laura Albert McLay, entrevista personal, 16 de septiembre de 2014.
para modelar cómo la gente busca trabajo: la formulación de la búsqueda de trabajo como un problema de parada óptimo es
tratado en Stigler, "The Economics of Information", y Stigler, "Information in the Labor
Mercado." McCall, "Economía de la información y la búsqueda de empleo", propuso utilizar un modelo equivalente a
la solución al problema de la venta de viviendas, y Lippman y McCall, "The Economics of Job Search",
analiza varias extensiones de este modelo. Así como el problema de la secretaria ha inspirado una amplia gama de
variantes, los economistas han perfeccionado este modelo simple de diversas formas para hacerlo más realista:
permitiendo que lleguen múltiples ofertas el mismo día, ajustando los costos para el vendedor e incorporando
Página 343
fluctuación en la economía durante la búsqueda. Una buena revisión de la parada óptima en una búsqueda de empleo.
El contexto se puede encontrar en Rogerson, Shimer y Wright, Modelos teóricos de búsqueda del trabajo
Mercado .
no estará por encima de su umbral ahora: como dice una encuesta sobre el problema de la búsqueda de empleo: "Suponga
ofertas rechazadas anteriormente no se pueden retirar, aunque en realidad esto no es restrictivo porque el
el problema es estacionario, por lo que una oferta que no es aceptable hoy no será aceptable mañana "
(ibídem.).
"Estacionamiento para la facultad": Clark Kerr, como se cita en "Educación: Vista desde el puente" , Time ,
17 de noviembre de 1958.
“Plan sobre el tráfico esperado”: Donald Shoup, correspondencia personal, junio de 2013.
implementado en el centro de San Francisco: Más información sobre el sistema SFpark desarrollado por
SFMTA, y sus precios dinámicos inspirados en Shoup, se pueden encontrar en http://sfpark.org/how-it-
obras / precios / . (El propio Shoup está involucrado en un papel de asesor). Este programa comenzó a tener efecto en
2011, y es el primer proyecto de este tipo en el mundo. Para un análisis reciente de los efectos de la
programa, consulte Millard-Ball, Weinberger y Hampshire, "Is the Curb 80% Full or 20% Empty?"
cuando la ocupación pasa del 90% al 95%: Donald Shoup, entrevista personal, 7 de junio de 2013. Para ser
Precisamente, el aumento del 90% al 95% de ocupación refleja un aumento del 5,555… por ciento.
Suponga que está en un camino infinitamente largo: el problema básico de estacionamiento, como se formula aquí, era
presentado como un problema en DeGroot, Optimal Statistical Decisions . La solución es tomar la primera
lugar vacío a menos de −log 2 / log (1− p ) lugares desde el destino, donde p es la probabilidad de cualquier
dado que el espacio está disponible.
no es necesario que empieces a buscar seriamente: Capítulo 17 de El alto costo del estacionamiento gratuito de Shoup
analiza la estrategia óptima de estacionamiento en la vía cuando el precio crea un promedio de un espacio libre por
bloque, que, como señala Shoup, "depende del conflicto entre la codicia y la pereza" (personal
correspondencia). La cuestión de si "navegar" por lugares baratos en la calle o pagar por servicios privados
los espacios de estacionamiento se tratan en el capítulo 13 de Shoup.
una variedad de ajustes a este escenario básico: Tamaki, "Enfoque adaptativo a algunas paradas
Problemas ”, permitía que la probabilidad de que un lugar estuviera disponible variara según la ubicación y se considerara
cómo se pueden estimar estas probabilidades sobre la marcha. Tamaki, "Parada óptima en el estacionamiento
Problema con los cambios de sentido ”, agregó la posibilidad de cambios de sentido. Tamaki, "Un problema de estacionamiento óptimo",
considerado una extensión del modelo de DeGroot donde no se supone que las oportunidades de estacionamiento sean un
conjunto discreto de manchas. Sakaguchi y Tamaki, "Sobre el problema de estacionamiento óptimo en qué espacios
Aparece aleatoriamente ”, utilizó esta formulación continua y permitió que se desconociera el destino.
MacQueen y Miller, "Políticas de persistencia óptima", consideró de forma independiente una
versión del problema que permite rodear el bloque.
La revista Forbes identificó a Boris Berezovsky: Forbes , “World's Billionaires”, 28 de julio de 1997, p.
174.
uno de una nueva clase de oligarcas: Paul Klebnikov, "The Rise of an Oligarch" , Forbes , 9 de septiembre de
2000.
Página 344
“Golpear una sola vez, pero en la cabeza”: Vladimir Putin, entrevista con el diario francés Le
Figaro , 26 de octubre de 2000.
libro enteramente dedicado al problema de la secretaria: Berezovsky y Gnedin, Problemas de la mejor elección .
analizado bajo varias formas diferentes: Hay varias formas de abordar el problema de la
dejar de fumar cuando está por delante. El primero es maximizar la duración de una secuencia de victorias. Asume que eres
lanzar una moneda que tenga una probabilidad p de salir cara. Pagas c dólares por cada oportunidad de voltear
la moneda, y obtienes $ 1.00 cuando sale cara, pero pierdes todas tus ganancias acumuladas cuando
sale colas. ¿Cuándo debería dejar de lanzar la moneda? La respuesta, como lo muestra Norman Starr en
1972, es detenerse después de r caras, donde r es el número más pequeño tal que p r +1 ≤ c . Entonces, si es un regular
moneda con p = 1/2, y cuesta $ 0.10 lanzar la moneda, debe detenerse tan pronto como obtenga cuatro caras
una fila. El análisis de corridas de cabezas aparece en Starr, "Cómo ganar una guerra si es necesario", donde se encuentra
presentado como un modelo para ganar una guerra de desgaste. Un análisis más completo se presenta en
Ferguson, "Detener una suma durante una ejecución exitosa".
Maximizar la duración de una racha de cabezas es una analogía bastante buena para algunos tipos de negocios.
situaciones: para una secuencia de acuerdos que cuestan c para establecer, tienen una probabilidad p de funcionar y pagan
d en el éxito, pero aniquila sus ganancias en el fracaso, debe dejar de fumar después de ganar r dólares de tal manera que
p r / d +1 ≤ c / d . Traficantes de drogas ambiciosos, tomen nota.
En el problema de los ladrones discutido en el texto, suponga la cantidad promedio ganada de cada
robo es my la probabilidad de salirse con la suya es q . Pero si atrapan al ladrón,
lo que sucede con probabilidad 1 - q , lo pierde todo. La solución: dejar de fumar cuando el acumulado
las ganancias son mayores o iguales que mq / (1 - q ). El problema de los ladrones aparece en Haggstrom, "Optimal
Procedimientos secuenciales cuando se requiere más de una parada ”, como parte de un problema más complejo
en el que el ladrón también está tratando de decidir a qué ciudad mudarse.
encontrado por un guardaespaldas: ver, por ejemplo, "Boris Berezovsky 'Encontrado con una ligadura alrededor del cuello'",
BBC News , 28 de marzo de 2013, http://www.bbc.com/news/uk-21963080 .
conclusión oficial de un examen post mortem: ver, por ejemplo, Reuters, “Berezovsky Death
Consistent with Hanging: Police ”, 25 de marzo de 2013, http://www.reuters.com/article/2013/03/25/us-
gran bretaña-rusia-berezovsky-postmortem-idUSBRE92O12320130325 .
Página 345
Curiosamente, si bien no existe una regla de detención óptima para "triple o nada",
la fortuna siempre está en juego, no obstante, existen buenas estrategias para jugar juegos como este cuando
puede elegir la cantidad de su bankroll para apostar. El llamado esquema de apuestas de Kelly, que lleva el nombre de J.
L. Kelly Jr. y descrito por primera vez en Kelly, "Una nueva interpretación de la tasa de información", es un ejemplo.
En este esquema, un jugador puede maximizar su tasa de rendimiento apostando una proporción de ( p ( b +1) −1) ⁄ b de su
bankroll en cada una de una secuencia de apuestas que pagan b + 1 veces la apuesta original con probabilidad p .
Para nuestro juego de triple o nada, b = 2 yp = 0 . 5, por lo que deberíamos apostar una cuarta parte de nuestro bankroll cada
tiempo, no todo, lo que inevitablemente conduce a la quiebra. Una historia accesible de Kelly
las apuestas aparecen en Poundstone, la fórmula de Fortune .
"Pasar por este mundo una sola vez": La procedencia de esta cita no es completamente segura, aunque
se ha citado como un dicho cuáquero desde la segunda mitad del siglo XIX, y parece
se han atribuido a Grellet desde al menos 1893. Para obtener más información, consulte W. Gurney Benham, Benham's Book
de Citas, Proverbios y Palabras Domésticas , 1907.
sigue más de cerca el clásico problema de la secretaria: Seale y Rapoport, “Sequential Decision
Haciendo con rangos relativos ".
saltó antes de lo debido: Ibid. El lugar típico donde la gente pasa de mirar a
el salto fue de 13 solicitantes de 40 y 21 de 80, o 32% y 26%, respectivamente.
“Por naturaleza soy muy impaciente”: Amnon Rapoport, entrevista personal, 11 de junio de 2013.
Seale y Rapoport mostraron: Seale y Rapoport, “Toma de decisiones secuencial con relación
Rangos ".
"No es irracional aburrirse": Neil Bearden, correspondencia personal, 26 de junio de 2013. Véase también
Bearden, "Un nuevo problema de secretaria".
convierte toda la toma de decisiones en una parada óptima: este tipo de argumento fue realizado por primera vez por Herbert
Simon, y fue una de las contribuciones por las que recibió el Premio Nobel. Simon comenzó su
notable carrera como politólogo, escribiendo una disertación sobre el tema quizás poco prometedor de
comportamiento administrativo. Mientras investigaba el problema de comprender cómo se componían las organizaciones
de personas reales que toman decisiones, experimentó una creciente insatisfacción con los modelos abstractos de
toma de decisiones ofrecida por la economía matemática: modelos que se alinean con la intuición de que
la acción racional requiere una consideración exhaustiva de nuestras opciones.
La investigación de Simon sobre cómo se toman realmente las decisiones en las organizaciones le dejó en claro
que estas suposiciones eran incorrectas. Se necesitaba una alternativa. Como lo expresó en "A Behavioural
Model of Rational Choice ”,“ la tarea es reemplazar la racionalidad global del hombre económico con una especie de
de comportamiento racional que sea compatible con el acceso a la información y la computación
capacidades que realmente poseen los organismos, incluido el hombre, en los tipos de entornos en
que existen tales organismos ".
El tipo de solución que Simon propuso como una explicación más realista de la elección humana: lo que él
denominado "satisfactorio": utiliza la experiencia para establecer un umbral para una satisfacción satisfactoria, "suficientemente buena"
resultado, luego toma la primera opción para exceder ese umbral. Este algoritmo tiene el mismo carácter que
las soluciones a los problemas de parada óptimos que hemos considerado aquí, donde el umbral es
determinado por dedicar algún tiempo a tener una idea de la gama de opciones (como en el secretario
problema) o basado en conocer la probabilidad de diferentes resultados. De hecho, uno de los ejemplos
Página 346
Simon usó en su argumento fue el de vender una casa, con un tipo de solución similar a eso.
presentado aquí.
el libro de texto definitivo sobre parada óptima: eso es Ferguson, parada óptima y aplicaciones .
2. EXPLORAR / EXPLOTAR
"Haz nuevos amigos": Joseph Parry, "Nuevos amigos y viejos amigos", en Los mejores poemas amados de la
Pueblo americano , ed. Hazel Felleman (Garden City, NY: Doubleday, 1936), pág. 58.
"La vida tan rica y rara": Helen Steiner Rice, "El jardín de la amistad", en Los poemas y las oraciones
de Helen Steiner Rice , ed. Virginia J. Ruehlmann (Grand Rapids, MI: Fleming H. Revell), 47 años.
El nombre extraño proviene de: En una carta a Merrill Flood fechada el 14 de abril de 1955 (disponible en el
Merrill Flood en la Universidad de Michigan), Frederick Mosteller cuenta la historia del origen
del nombre. Mosteller y su colaborador Robert Bush estaban trabajando en modelos matemáticos de
aprendizaje: uno de los primeros casos de lo que se conoció como psicología matemática,
informando la investigación que Tom hace hoy. Estaban particularmente interesados en una serie de
experimentos que se habían hecho con un laberinto en forma de T, donde los animales se colocan en el laberinto en el
parte inferior de la T y luego tienes que decidir si ir hacia la izquierda o hacia la derecha. La comida, la recompensa, puede o puede
no aparecer en ninguno de los lados del laberinto. Para explorar este comportamiento con los humanos, encargaron un
máquina con dos palancas que la gente podía tirar, que Mosteller apodó el bandido de dos brazos. Él
luego presentó la forma matemática del problema a sus colegas, y finalmente se convirtió en
generalizado al bandido de múltiples brazos.
En Berry y Fristed, Bandit aparece una introducción completa a los bandidos con varios brazos.
Problemas . Nuestro enfoque en este capítulo está en los bandidos donde cada brazo produce una recompensa o no,
con diferentes probabilidades pero la misma cantidad de pago en todas las armas. Esto se conoce como Bernoulli
bandido en la literatura, ya que la distribución de probabilidad que describe un lanzamiento de moneda se llama Bernoulli
distribución (según el matemático suizo del siglo XVII Jacob Bernoulli). Otros tipos de
Los bandidos con múltiples brazos también son posibles, con distribuciones desconocidas de diferentes tipos que caracterizan
las recompensas de cada brazo.
qué tan buena podría ser la segunda máquina: la estrategia "miope" de tirar del brazo con
El valor esperado más alto es realmente óptimo en algunos casos. Bradt, Johnson y Karlin, "On Sequential
Diseños para maximizar la suma de N observaciones ”, mostró que si las probabilidades de una recompensa por
un bandido de dos brazos (con p 1 para un brazo, p 2 para el otro) satisface p 1 + p 2 = 1, entonces esta estrategia es
óptimo. Conjeturaron que esto también es válido para pares de probabilidades donde ( p 1 , p 2 ) o bien toman
los valores ( a, b ) o ( b, a ) (es decir, si p 1 es a , entonces p 2 es b , y viceversa). Esto fue demostrado por
Feldman, "Contribuciones al problema del 'bandido de dos brazos'". Berry y Fristed, Bandit Problems ,
tiene más detalles sobre las estrategias miopes, incluido un resultado que muestra que elegir el más alto
El valor esperado es óptimo cuando p 1 y p 2 están restringidos para tomar solo dos valores posibles (por ejemplo,
cualquiera o ambos de p 1 o p 2 podrían ser 0.4 o 0.7, pero no sabemos cuál de estas posibilidades es verdadera).
"Come, bebe y diviértete": "Come, bebe y diviértete, porque mañana moriremos", un modismo en común
lenguaje y en la cultura pop (p. ej., formar el coro de "Tripping Billies" de Dave Matthews
Band, entre muchas otras referencias), parece ser una combinación de dos versículos bíblicos: Eclesiastés
Página 347
8:15 (“No hay mejor cosa debajo del sol que el hombre que comer, beber y divertirse”) y
Isaías 22:13 (“Comamos y bebamos, que mañana moriremos”).
“¿Por qué correr el riesgo?”: Chris Stucchio, entrevista personal, 15 de agosto de 2013.
"Una sexta ración de X-Men": Nick Allen, "Hollywood hace de 2013 el año de la secuela"
http://www.telegraph.co.uk/culture/film/film-news/9770154/Hollywood-makes-2013-the-year-of-the-
sequel.html . Consulte también http://www.shortoftheweek.com/2012/01/05/has-hollywood-lost-its-way/ y
http://boxofficemojo.com/news/?id=3063 .
Los beneficios de los estudios cinematográficos más grandes disminuyeron: "Entre 2007 y 2011, los beneficios antes de impuestos de los cinco
estudios controlados por grandes conglomerados de medios (Disney, Universal, Paramount, Twentieth Century
Fox y Warner Bros) cayeron alrededor del 40%, dice Benjamin Swinburne de Morgan Stanley ”. En
“Hollywood: Split Screens” , Economist , 23 de febrero de 2013,
http://www.economist.com/news/business/21572218-tale-two-tinseltowns-split-screens.
"Squeezed between aumento de costos": "Hollywood: Split Screens" , Economist , 23 de febrero de 2013,
http://www.economist.com/news/business/21572218-tale-two-tinseltowns-split-screens.
"El último instrumento de sabotaje intelectual": el comentario de Whittle sobre la dificultad del bandido
problemas aparece en su discusión de Gittins, "Bandit Processes and Dynamic Allocation Indices".
Robbins demostró en 1952: Robbins, "Algunos aspectos del diseño secuencial de experimentos"
introduce el algoritmo Win-Stay, Lose-Shift.
Siguiendo a Robbins, una serie de artículos: Bradt, Johnson y Karlin, "On Sequential Designs for
Maximizar la suma de N observaciones ", mostró que" permanecer en un ganador "siempre es cierto cuando el
La probabilidad de una recompensa es desconocida para un brazo, pero conocida para el otro. Berry, “A Bernoulli Two-
Bandido armado ”, demostró que el principio siempre es cierto para un bandido de dos brazos. Generalizaciones de
este resultado (y una caracterización de los casos en los que no aplica) aparece en Berry y Fristed,
Problemas de bandidos .
“Sería una aproximación bastante buena”: John Gittins, entrevista personal, 27 de agosto de 2013.
Deal or No Deal : las muchas encarnaciones mundiales de este programa de juegos comenzaron con el programa holandés
Miljoenenjacht , que se emitió por primera vez en 2000.
El problema de los bandidos armados múltiples no es diferente: los investigadores anteriores también habían encontrado soluciones para
este problema de "bandido con un solo brazo" durante un intervalo fijo (Bellman, "A Problem in the Sequential
Página 348
Diseño de experimentos"; Bradt, Johnson y Karlin, "Sobre diseños secuenciales para maximizar la
Suma de N observaciones ”).
maximizar una sola cantidad que represente ambos: las ideas detrás del índice de Gittins fueron las primeras
presentado en una conferencia en 1972 y apareció en las actas como Gittins y Jones, "A Dynamic
Índice de asignación para el diseño secuencial de experimentos ", pero la presentación canónica es Gittins,
"Procesos de bandidos e índices de asignación dinámica".
proporcionamos los valores del índice de Gittins: La tabla de puntuaciones del índice de Gittins para el bandido de Bernoulli fue
tomado de Gittins, Glazebrook y Weber, índices de asignación de bandidos de armas múltiples , que es un
guía completa del tema. Supone una total ignorancia sobre la probabilidad de una recompensa.
nos impulsa hacia la novedad: Tomando esto como un resultado extremas en una estrategia simple llamado el Menor
Regla de fallas : elija siempre la opción que haya fallado la menor cantidad de veces. Entonces, aterrizando en un
nueva ciudad, elija un restaurante al azar. Si es bueno, quédate con él. Tan pronto como no satisfaga, elija
al azar de los otros restaurantes. Continúe este proceso hasta que todos los restaurantes no hayan podido satisfacer
una vez, luego regrese al restaurante con más noches de cenas exitosas y repita. Esta
La estrategia se basa en el principio de ganar-quedarse, y es precisamente lo que produce el índice de Gittins si eres el
tipo paciente que valora la recompensa de mañana como esencialmente tan buena como la de hoy. (La regla aparece
en Kelly, “Bandidos de armas múltiples con factor de descuento cercano a uno”; formalmente, es óptimo bajo
descuento geométrico en el límite a medida que la tasa de descuento se acerca a 1.) En una gran ciudad con muchos nuevos
restaurantes que abren todo el tiempo, una política de mínimos fallos dice simplemente que si alguna vez se le permite
abajo, hay mucho más por ahí; no regreses.
una variedad de experimentos en economía del comportamiento: ver, por ejemplo, Kirby, "Bidding on the
Futuro."
si hay un costo por cambiar: este caso se analiza en Banks y Sundaram, "Costos de cambio y
el índice de Gittins ".
“Lamenta, he tenido algunos”: Frank Sinatra, “My Way”, de My Way (1969), letra de Paul Anka.
"En lo que a mí respecta, soy optimista": discurso del primer ministro Winston Churchill, banquete del alcalde,
Londres, 9 de noviembre de 1954. Impreso en Churchill, Winston S. Churchill: His Complete Speeches .
“Quería proyectarme hacia los 80 años”: Jeff Bezos, entrevista con la Academia de
Logro, 4 de mayo de 2001, http://www.achievement.org/autodoc/page/bez0int-3.
varios puntos clave sobre el arrepentimiento: Lai y Robbins, “Asymptotically Efficient Adaptive Allocation
Normas."
la garantía de un arrepentimiento mínimo: Ibid. ofreció los primeros algoritmos de este tipo, que fueron refinados por
Katehakis y Robbins, "Elección secuencial de varias poblaciones"; Agrawal, "Media de la muestra
Políticas basadas en índices ”; y Auer, Cesa-Bianchi y Fischer, “Finite-Time Analysis of the
Problema del bandido multiarmado ”, entre otros. Este último presenta quizás la estrategia más simple de este
tipo, que consiste en asignar al brazo j una puntuación de , donde s j es el número de éxitos de
n j juega en ese brazo, y n = Σ j n j es el número total de jugadas de todos los brazos. Este es un límite superior en
la probabilidad de una recompensa exitosa (que es solo s j / n j ). Elegir el brazo con la puntuación más alta
Página 349
garantiza arrepentimiento logarítmico (aunque hay ajustes en esta puntuación que dan como resultado un mejor rendimiento
en la práctica).
conocido como el "intervalo de confianza": los intervalos de confianza se originan con Neyman, "Esquema de un
Teoría de la estimación estadística ”.
"Robots optimistas": Leslie Kaelbling, entrevista personal, 22 de noviembre de 2013. Véase Kaelbling,
Aprendizaje en sistemas embebidos .
Las pruebas A / B funcionan de la siguiente manera: Christian, "The A / B Test". También informado por Steve Hanov, personal
entrevista, 30 de agosto de 2013, y Noel Welsh, entrevista personal, 27 de agosto de 2013.
En el caso de la página de donaciones de Obama: Dan Siroker, "Cómo usamos los datos para ganar la presidencia
Election ”(conferencia), Universidad de Stanford, 8 de mayo de 2009, disponible en https://www.youtube.com/watch?
v = 71bH8z6iqSc . Véase también, Siroker, "How Obama Raised $ 60 Million",
https://blog.optimizely.com/2010/11/29/how-obama-raised-60-million-by-running-a-simple-
experimento / .
pruebas A / B en vivo de sus usuarios: la primera prueba A / B de Google se ejecutó el 27 de febrero de 2000. Consulte, por ejemplo,
Christian, "La prueba A / B".
Las empresas A / B prueba su sitio de navegación: Véase, por ejemplo, Siroker y Koomen, las pruebas A / B .
probó cuarenta y un tonos de azul: Laura M. Holson, "Poner una cara más atrevida en Google", Nueva York
Times , 28 de febrero de 2009.
"Cómo hacer que las personas hagan clic en los anuncios": Ashlee Vance, "Esta burbuja tecnológica es diferente", Bloomberg
Businessweek , 14 de abril de 2011.
http://www.bloomberg.com/bw/magazine/content/11_17/b4225060960537.htm .
El comercio en línea comprende cientos de miles de millones: Ventas en línea estimadas por Forrester Research.
Consulte, por ejemplo, “Las ventas minoristas en línea de EE. UU. Alcanzarán los $ 370 mil millones para 2017; 191.000 millones de euros en Europa ”
14/3/2013, http://www.forbes.com/sites/forrester/2013/03/14/us-online-retail-sales-to-reach-370b-by-
2017-e191b-en-europa / .
Los mejores algoritmos para usar siguen siendo muy controvertidos: Chris Stucchio, por ejemplo, escribió un recorte
artículo titulado "Por qué los algoritmos Bandit de brazos múltiples son superiores a las pruebas A / B", que luego se
contrarrestado por un artículo igualmente cortante llamado "No use algoritmos de bandidos; probablemente no
Trabaja para ti ”, también escrito por Chris Stucchio. Ver
https://www.chrisstucchio.com/blog/2012/bandit_algorithms_vs_ab.html y
https://www.chrisstucchio.com/blog/2015/dont_use_bandits.html. La publicación de Stucchio de 2012 fue escrita
en parte en referencia a un artículo de Paras Chopra titulado "¿Por qué el algoritmo de bandidos de brazos múltiples no es
'Mejor' que las pruebas A / B ”(https://vwo.com/blog/multi-armed-bandit-algorithm/ ), que era en sí mismo
Página 350
escrito en parte en referencia a un artículo de Steve Hanov titulado “20 líneas de código que superarán a A / B
probando cada vez ”( http://stevehanov.ca/blog/index.php?id=132).
apareció en el Washington Star : Jean Heller, "Los pacientes con sífilis murieron sin tratamiento", Washington
Star , 25 de julio de 1972.
documento conocido como Informe Belmont: Informe Belmont: Principios y directrices éticas
para la protección de sujetos humanos de investigación , 18 de abril de 1979. Disponible en
http://www.hhs.gov/ohrp/humansubjects/guidance/belmont.html.
propuso realizar pruebas "adaptativas": consulte Zelen, "Juegue la regla del ganador y el control
Ensayo clínico." Si bien esta fue una idea radical, Zelen no fue el primero en proponerla. Ese honor es para
William R. Thompson, instructor de la Escuela de Patología de Yale, quien formuló el problema
de identificar si un tratamiento es más efectivo que otro, y propuso su propia solución,
en 1933 (Thompson, "Sobre la probabilidad de que una probabilidad desconocida supere a otra").
La solución que propuso Thompson: opciones de muestreo aleatorio, donde la probabilidad de
La elección de una opción corresponde a la probabilidad de que sea la mejor basada en la evidencia observada, por lo que
hasta ahora, es la base de gran parte del trabajo reciente sobre este problema en el aprendizaje automático (volvemos a la
usos algorítmicos de la aleatoriedad y el muestreo en el capítulo 9).
Ni Frederick Mosteller ni Herbert Robbins parecían estar al tanto del trabajo de Thompson cuando
empezaron a trabajar en el problema de los bandidos de dos brazos. Richard Bellman encontró el "poco conocido
documentos "unos años más tarde, y señaló que" Confesamos que encontramos estos documentos de la manera estándar,
es decir, mientras hojea un diario que contiene otro artículo de interés "(Bellman," A
Problema en el diseño secuencial de experimentos ”).
ECMO salvó la vida de una niña recién nacida: Departamento de Cirugía de la Universidad de Michigan, “'Hope'
para bebés ECMO " http://surgery.med.umich.edu/giving/stories/ecmo.shtml .
ahora ha celebrado su cuadragésimo cumpleaños: University of Michigan Health System, “UM Health
El equipo de System ECMO trata a su paciente número 2.000 ”, 1 de marzo de 2011,
http://www.uofmhealth.org/news/ECMO%202000th%20patient.
estudios iniciales en adultos: Zapol et al., “Oxigenación de membrana extracorpórea en casos graves agudos
Insuficiencia respiratoria."
un estudio en recién nacidos: Bartlett et al., "Circulación extracorpórea en insuficiencia respiratoria neonatal".
uno de los principales expertos del mundo: fue Berry, en su tesis doctoral de 1971, quien demostró que
permanecer en un ganador es óptimo. El resultado se publicó como Berry, "A Bernoulli Two-Armed Bandit".
É
"El estudio de Ware no debería haberse realizado": Berry, "Comentario: Ética y ECMO".
casi doscientos bebés en el Reino Unido: UK Collaborative ECMO Group, “The
Ensayo colaborativo de ECMO en el Reino Unido ".
Página 351
ensayos clínicos para una variedad de tratamientos contra el cáncer: Don Berry, entrevista personal, 22 de agosto de 2013.
la FDA publicó un documento de "orientación": "Ensayos clínicos de diseño adaptativo para medicamentos" de la FDA
and Biologics ”de febrero de 2010 se puede encontrar en
http://www.fda.gov/downloads/Drugs/Guidances/ucm201790.pdf .
se muestra un cuadro con dos luces en él: El estudio aparece en Tversky y Edwards, "Información versus
Recompensa en opciones binarias ".
un experimento con un bandido de cuatro brazos: Steyvers, Lee y Wagenmakers, "A Bayesian Analysis
de la toma de decisiones humanas sobre los problemas de los bandidos ".
lo que se ha denominado un "bandido inquieto": los bandidos inquietos fueron presentados por Whittle, "Restless
Bandits ”, que analiza una estrategia similar al índice de Gittins que se puede utilizar en algunos casos. los
desafíos computacionales planteados por bandidos inquietos, y el consiguiente pesimismo sobre la eficiencia
soluciones óptimas — se discuten en Papadimitriou y Tsitsiklis, “La complejidad de las soluciones óptimas
Control de red en cola ".
cuando el mundo puede cambiar: Navarro y Newell, “Información versus recompensa en un cambio
World ”, proporciona resultados recientes que respaldan la idea de que la sobreexploración humana es el resultado de
asumiendo que el mundo está inquieto.
"Una forma de desarrollo de resolver la compensación de exploración / explotación": Alison Gopnik, personal
entrevista, 22 de agosto de 2013. Véase también Gopnik, The Scientist in the Crib .
"Una coyuntura en mi vida lectora": Lydia Davis, "Alguien que lee un libro", No puede y no quiere:
Historias .
desafiando nuestras ideas preconcebidas sobre el envejecimiento: Carstensen, “Social and Emotional Patterns in
La edad adulta ”presenta la“ teoría de la selectividad socioemocional ”básica que discutimos en esta sección, también
como parte de la evidencia para ello.
a punto de mudarse por todo el país: Fredrickson y Carstensen, "Choosing Social Partners".
Las personas mayores generalmente están más satisfechas: Evidencia de mejoras en el bienestar emocional con
sobre el envejecimiento se analizan en Charles y Carstensen, "Envejecimiento social y emocional".
3. CLASIFICACIÓN
“Nowe if the word”: Cawdrey, A Table Alphabeticall , es el primer diccionario monolingüe de inglés.
Para obtener más información sobre la historia de la clasificación frente a la búsqueda, consulte Knuth, The Art of Computer
Programación , §6.2.1. Para obtener más información sobre la invención del orden alfabético, consulte Daly, Contribuciones a un
Historia de la alfabetización .
Página 352
publicado en el sitio web de programación Stack Overflow: "¿Emparejar calcetines de una pila de manera eficiente?"
Enviado por el usuario "amit" a Stack Overflow el 19 de enero de 2013,
http://stackoverflow.com/questions/14415881/pair-socks-from-a-pile-efficiently.
Como escribe "amit" (nombre real Amit Gross, un estudiante de posgrado en el Technion): "Ayer estuve
emparejando los calcetines de la ropa limpia, y descubrí que la forma en que lo estaba haciendo no es muy eficiente. I
estaba haciendo una búsqueda ingenua, eligiendo un calcetín y 'iterando' la pila para encontrar su par. Esta
requiere iterar sobre n / 2 x n / 4 = n 2 /8 calcetines en promedio. Como científico de la computación, estaba pensando en lo que
¿Yo podría hacer?"
La pregunta de Amit generó una serie de respuestas, pero la que recibió más apoyo de
sus compañeros programadores iban a hacer un Radix Sort: identificar las dimensiones a lo largo de las cuales varían los calcetines
(por ejemplo, color, patrón) y clasificarlos en montones en cada una de estas dimensiones. Cada tipo requiere solo uno
pasa por todos los calcetines, y el resultado es un conjunto de montones más pequeños. Incluso si tienes que pasar por todo
los calcetines en esas pilas para encontrar fósforos, la cantidad de tiempo que esto toma es proporcional al cuadrado de
el tamaño de la pila más grande en lugar del cuadrado del número total de calcetines. (Vea la nota al final a continuación
sobre cómo clasificar una baraja de cartas para obtener más información sobre Radix Sort).
Pero si la razón por la que estamos emparejando calcetines es para que sea más fácil encontrar un par de calcetines cuando lo necesitemos
ellos, podemos reducir la necesidad de ordenar mediante la adopción de un mejor procedimiento de búsqueda.
Digamos que sus calcetines difieren en una sola dimensión, el color, y tiene tres colores diferentes.
de calcetines sueltos, sin emparejar en su cajón de calcetines. Entonces tiene la garantía de encontrar un par coincidente si
saca cuatro calcetines del cajón al azar. (Para ver por qué, imagine el peor de los casos: cada uno de
los tres primeros calcetines que se han sacado son de un color diferente. Cuando vuelves por un cuarto,
tiene que coincidir con uno de los tres que ya ha sacado.) No importa cuántos colores tenga,
sacar un calcetín más que el número de colores siempre te garantiza un par a juego. Así que no
molestarse en emparejarlos si está dispuesto a que su mañana corra un poco más lento.
Esta elegante solución al problema de emparejar calcetines es cortesía del Principio de Pigeonhole, un
idea matemática simple pero poderosa atribuida al matemático alemán del siglo XIX
Peter Gustave Lejeune Dirichlet. (Rittaud y Heeffer, "The Pigeonhole Principle", traza la historia
del principio del casillero, incluyendo a Dirichlet, así como lo que parecen ser referencias incluso anteriores).
La idea es simple: si un grupo de palomas aterriza en un conjunto de nidos y hay más palomas
que los agujeros, al menos un agujero debe contener más de una paloma. En informática, el
El principio de casillero se utiliza para establecer hechos básicos sobre las propiedades teóricas de los algoritmos.
Por ejemplo, es imposible hacer un algoritmo que comprima cualquier archivo posible sin pérdida
de información, porque hay más archivos largos que cortos.
La aplicación del principio del casillero sugiere una solución permanente al problema del emparejamiento de calcetines:
solo compre un tipo de calcetín. Si todos tus calcetines son iguales, nunca necesitas emparejarlos, porque
Siempre puedes conseguir un par sacando dos calcetines del cajón. Para muchos informáticos (incluidos
algunos de los programadores que respondieron a la pregunta de Amit) este es el enfoque más elegante:
redefiniendo el problema para que pueda resolverse de manera eficiente.
Sin embargo, una última advertencia: cuando compre ese tipo de calcetín, tenga cuidado con el
calcetines que compras. La razón por la que Ron Rivest tiene problemas particulares con los calcetines es que usa calcetines
que son diferentes para el pie derecho e izquierdo. Esto frustra el principio del casillero: garantizar una coincidencia
con calcetines como ese, tendrá que sacar un calcetín más que el número total de pares.
Página 353
“Nadie lo usará más que los gobiernos”: Citado en austriaco, Herman Hollerith .
primer código escrito para una computadora con "programa almacenado": "Escrito", aquí, significa literalmente escrito
a mano: cuando el renombrado matemático John von Neumann anotó el programa de clasificación
en 1945, la computadora para la que estaba destinada aún estaba a varios años de completarse. A pesar de que
Los programas informáticos en general se remontan a los escritos de Ada Lovelace en 1843 sobre la propuesta
“Analytical Engine” de Charles Babbage, el programa de von Neumann fue el primero diseñado para ser
almacenado en la memoria de la propia computadora; Las primeras máquinas informáticas estaban destinadas a ser guiadas por
tarjetas perforadas introducidas en ellos o cableadas para cálculos específicos. Véase Knuth, "Von Neumann's First
Programa de computadora."
supere las máquinas clasificadoras de tarjetas dedicadas de IBM: Ibid.
una cuarta parte de los recursos informáticos del mundo: Knuth, The Art of Computer Programming , p.
3.
"El costo unitario de clasificación, en lugar de disminuir, aumenta": Hosken, "Evaluación de los métodos de clasificación".
el récord para clasificar una baraja de cartas: si bien no pudimos encontrar un video de la actuación de Bradáč,
Hay muchos videos en línea de personas que intentan superarlo. Tienden a clasificar las cartas en cuatro palos,
y luego clasifique los números dentro de cada palo. "¡Pero hay una forma más rápida de hacer el truco!" insta Donald
Knuth en The Art of Computer Programming : Primero, reparta las cartas en 13 montones según su
valor nominal (con una pila que contiene todos los 2, la siguiente todos los 3, etc.). Entonces, después de reunir todos
las pilas, reparte las cartas en los cuatro palos. El resultado será una pila para cada palo, con las cartas.
ordenados dentro de cada uno. Este es un ordenamiento por radix y está relacionado con el algoritmo de ordenamiento de cubos que discutimos más
en el capítulo. Consulte Knuth, The Art of Computer Programming , §5.2.5.
completamente ordenados por casualidad: ordenar las cosas al azar y esperar lo mejor es
en realidad un algoritmo con un nombre: Bogosort , parte de la ciencia de la computación sólo parcialmente irónica
subcampo de "diseño de algoritmo pesimal". La pesimismo es para la optimalidad lo que el pesimismo es para el optimismo;
Los diseñadores de algoritmos pesimistas compiten para superarse entre sí por la peor computación posible.
rendimiento.
Investigando el asunto más a fondo, los diseñadores de algoritmos pesimistas han llegado a la conclusión de que Bogosort es
en realidad, demasiado delgado y eficiente. De ahí su "mejora" Bogobogosort , que comienza por
Ordenar incrementalmente los dos primeros elementos, luego los tres primeros, y así sucesivamente. Si en cualquier momento de
Cuando la lista se desordena, Bogobogosort comienza de nuevo. Entonces el algoritmo no completará una especie de
cuatro cartas, por ejemplo, hasta que lanza las dos primeras al aire, ve que han aterrizado correctamente,
luego lanza los primeros tres al aire, ve que han aterrizado correctamente, y por fin lanza los primeros cuatro
en el aire y los encuentra en el orden correcto también. Todo en una fila. De lo contrario, comienza de nuevo. Uno de los
ingenieros para escribir primero sobre los informes de Bogobogosort ejecutándolo en su computadora durante la noche y
incapaz de ordenar una lista de siete elementos, antes de que finalmente apagara la electricidad por piedad.
Los ingenieros posteriores han sugerido que Bogobogosort ni siquiera es el fondo del pozo, y
han propuesto obtener aún más meta y Bogosordenar el programa en lugar de los datos: aleatoriamente
voltear bits en la memoria de la computadora hasta que da la casualidad de que toma la forma de un programa de clasificación
que ordena los elementos. Los límites de tiempo de tal monstruosidad aún se están explorando. La búsqueda de
la pesimismo continúa.
Página 354
La informática ha desarrollado una taquigrafía: la notación Big-O se originó en el libro Die de 1894
analytische zahlentheorie de Paul Bachmann. Véase también Donald Knuth, The Art of Computer
Programación , §1.2.11.1. Formalmente, decimos que el tiempo de ejecución de un algoritmo es O ( f ( n )) si es menor que
o igual a un múltiplo (con un coeficiente que es una constante positiva) de f ( n ). También están los parientes
Notación "Big-Omega", con Ω ( f ( n )) que indica que el tiempo de ejecución es mayor o igual a un múltiplo
de f ( n ) y notación "Big-Theta", con Θ ( f ( n )) que significa que el tiempo de ejecución es tanto O ( f ( n )) como Ω ( f ( n )).
"Me tenía en Bubble Sort": este ingeniero es Dan Siroker, a quien conocimos anteriormente en el capítulo 2. Mira,
por ejemplo, "La prueba A / B: dentro de la tecnología que está cambiando las reglas del negocio" , Wired , mayo
2012.
El procesamiento de información comenzó en los censos de EE. UU .: Para obtener más detalles, consulte Knuth, The Art of
Programación de computadoras , §5.5.
para demostrar el poder de la computadora con programa almacenado: la computadora era la EDVAC
máquina, y en ese momento el programa de von Neumann se clasificó como inteligencia militar ultrasecreta.
Véase Knuth, "El primer programa informático de Von Neumann".
Problemas de clasificación industrial a gran escala: los registros actuales para la clasificación se encuentran alojados en
http://sortbenchmark.org/ . A partir de 2014, un grupo de Samsung tiene el récord de clasificar la mayor cantidad
datos en un minuto: la friolera de 3,7 terabytes de datos. Eso es el equivalente a casi 37 mil millones jugando
tarjetas, suficientes para llenar quinientos Boeing 747 a su capacidad, poniendo el récord humano de Zdeněk Bradáč en
clasificación de tarjetas en perspectiva.
167 libros por minuto: dice el gerente de envíos Tony Miranda, "Procesaremos, creo que nuestro más alto es
—250 totes en una hora. Nuestro promedio es de aproximadamente 180 bolsas en una hora. Tenga en cuenta que cada bolso tiene
alrededor de 40 artículos dentro de él ". De "KCLS AMH Tour", 6 de noviembre de 2007,
https://www.youtube.com/watch?v=4fq3CWsyde4.
85.000 por día: "Reducir los costos operativos" , Revista American Libraries , 31 de agosto de 2010,
http://www.americanlibrariesmagazine.org/aldirect/al-direct-september-1-2010.
"Fuhgeddaboutit": vea a Matthew Taub, "Brooklyn y Manhattan vencieron al estado de Washington en el cuarto lugar
Annual 'Battle of the Book Sorters' ”, Brooklyn Brief , 29 de octubre de 2014,
http://brooklynbrief.com/4th-annual-battle-book-sorters-pits-brooklyn-washington-state/ .
lo mejor que podemos esperar lograr: un conjunto de n elementos puede tener precisamente n ! ordenaciones distintas, por lo que una especie
produce exactamente log n ! bits de información, que es aproximadamente n log n bits. ¡Recuerda que n ! es n ×
( n - 1) ×… × 2 × 1, que es el producto de n números, de los cuales n es el mayor. En consecuencia, n ! <
n n , entonces log n ! <log n n , que luego nos da log n ! < n log n . Esta aproximación de n log n para log n ! es
llamado "aproximación de Stirling", llamado así por el matemático escocés del siglo XVIII James
Stirling. Debido a que una sola comparación por pares produce como máximo un bit de información, n log n
Se necesitan comparaciones para resolver completamente nuestra incertidumbre acerca de cuál de los n ! posibles pedidos de nuestro
n cosas es la correcta. Para obtener más detalles, consulte Knuth, The Art of Computer Programming , §5.3.1.
un documento sobre "sobrecarga de correo electrónico": Whittaker y Sidner, "Sobrecarga de correo electrónico".
Página 355
“Desperdició una parte de su vida”: Steve Whittaker, entrevista personal, 14 de noviembre de 2013.
"En un torneo de tenis sobre césped": Dodgson, "Torneos de tenis sobre césped".
una interpretación incómoda de la triple eliminación: para una crítica informática científica de la
propuesta de torneo, consulte la discusión de Donald Knuth sobre la "selección de comparación mínima" en The Art
de Programación de Computadoras , §5.3.3.
no produce un pedido completo: un algoritmo que, en lugar de clasificar todos los elementos, identifica
uno de ellos como el más grande o el segundo más grande o la mediana, etc., se conoce como algoritmo de "selección",
en lugar de un algoritmo de clasificación.
programadores para Major League Baseball: Trick trabaja como parte del Sports Scheduling Group, que
él cofundó. De 1981 a 2004, el calendario de las Grandes Ligas fue elaborado por
mano, por el notable equipo de marido y mujer de Henry y Holly Stephenson. ESPN narrado
la historia de los Stephensons en un cortometraje dirigido por Joseph Garner titulado The Schedule Makers .
“La incertidumbre se demora en su resolución”: Michael Trick, entrevista personal, 26 de noviembre de 2013.
"Una puntuación de 3: 2 le da al equipo ganador": Tom Murphy, "¿Sintoniza Noise?" Publicado el 22 de junio de
2014 en el blog "Do the Math": http://physics.ucsd.edu/do-the-math/2014/06/tuning-in-on-noise/
"El tipo de burbuja no tiene características redimidoras aparentes": Knuth, The Art of Computer Programming ,
§5.5.
El ganador de ese honor en particular: Dave Ackley, entrevista personal, 26 de noviembre de 2013. Ver
Jones y Ackley, "Comparison Criticality in Sorting Algorithms" y Ackley, "Beyond Efficiency".
Para obtener más información sobre el ordenamiento por recuento comparativo (también conocido como ordenamiento por turnos), consulte Knuth,
El arte de la programación informática , §5.2.
"Habilidad más importante como jugador de póquer profesional": Isaac Haxton, entrevista personal, febrero
20 de 2014.
“Actos agresivos por gallina aumentados”: Craig, Comportamiento agresivo de los pollos .
Hay una carga computacional significativa: Jessica Flack, entrevista personal, 10 de septiembre,
2014. Véase también DeDeo, Krakauer y Flack, “Evidence of Strategic Periodicities in Collective
Dinámica del conflicto ”; Daniels, Krakauer y Flack, "Código disperso de conflicto en una sociedad de primates";
Brush, Krakauer y Flack, “Una familia de algoritmos para el consenso informático sobre el estado de nodo
de datos de red ". Para obtener una descripción más amplia del trabajo de Flack, consulte Flack, “Life's Information
Jerarquía."
Este concurso deportivo es el maratón: el maratón tiene un análogo en el mundo de la clasificación
algoritmos. Uno de los más intrigantes (Wikipedia usaba la palabra "esotérico" antes de que se publicara el artículo
eliminado por completo) los desarrollos en la teoría de la clasificación más allá de la comparación surgieron de uno de los
lugares inverosímiles: el notorio foro de mensajes de Internet 4chan. A principios de 2011, una publicación anónima allí
proclamó: “Hombre, soy un genio. Echa un vistazo a este algoritmo de clasificación que acabo de inventar ". Los posters
"Algoritmo de clasificación" - Clasificación por sueño: crea un hilo de procesamiento para cada elemento sin clasificar, indicando a cada uno
Página 356
subproceso para "dormir" el número de segundos de su valor, y luego "despertar" y salir a sí mismo. El final
la salida debería, de hecho, ser ordenada. Dejando de lado los detalles de implementación que revelan las grietas en
La lógica de Sleep Sort y simplemente tomando Sleep Sort en su valor nominal, parece prometer algo bastante
intoxicante: un tipo cuyo tiempo de ejecución no depende en absoluto de la cantidad de elementos, sino más bien de
su tamaño . (Por lo tanto, todavía no es tan bueno como un tipo de tiempo constante O (1) directo ).
"El más grande es el dominante": la Ley del Arqueo Bruto, al parecer, realmente gobierna el
Oceano. Esto no quiere decir que los peces sean completamente pacifistas. Vale la pena señalar que lucharán ...
agresivamente, cuando sus tamaños son similares.
4. CACHING
“En el uso práctico de nuestro intelecto”: James, Psicología .
Ahora tienes dos problemas: esta construcción hace referencia a un famoso chiste de programación acuñado por primera vez por
Jamie Zawinski, ingeniero de Netscape, en una publicación de Usenet el 12 de agosto de 1997: "Algunas personas, cuando
enfrentado a un problema, piense 'Lo sé, usaré expresiones regulares'. Ahora tienen dos
problemas."
“¿Cuánto tiempo lo tengo?”: Stewart, Manual de limpieza del hogar de Martha Stewart .
“Una conciencia muy aguda pero casi sin memoria”: Davis, Casi sin memoria .
uno de los principios fundamentales de la informática: nuestra historia de almacenamiento en caché se basa en lo proporcionado
por Hennessy y Patterson, Computer Architecture , que también tiene un gran tratamiento de la modernidad
métodos de almacenamiento en caché en el diseño de computadoras.
una supercomputadora en Manchester, Inglaterra, llamada Atlas: Kilburn et al., "One-Level Storage
Sistema."
El número de transistores en las CPU se duplicaría cada dos años: la predicción inicial de 1965 de Moore en
“Colocar más componentes en circuitos integrados” se duplicaba cada año; en 1975 él
luego revisó esto en “Progreso en electrónica digital integrada” para duplicarlo cada dos años.
jerarquía de memoria de seis capas: registros; Cachés L1, L2 y L3; RAM; y disco. Para más sobre el
"Muro de la memoria", véase, por ejemplo, Wulf y McKee, "Golpeando el Muro de la memoria".
“No dejar que los hechos inútiles se distorsionen con los útiles”: Conan Doyle, “Un estudio en escarlata: el
Reminiscencias de John H. Watson ".
Página 357
"Las palabras no se pueden conservar indefinidamente": Wilkes, "Slave Memories and Dynamic Storage
Asignación."
Bélády nació en 1928 en Hungría: la historia personal de Bélády se basa en una historia oral
entrevista que realizó con Philip L. Frana en 2002 (disponible en
https://conservancy.umn.edu/bitstream/107110/1/oh352lab.pdf). Su análisis de los algoritmos de almacenamiento en caché
y los resultados se presentan en Bélády, “Un estudio de algoritmos de reemplazo para un almacenamiento virtual
Computadora."
la pieza de investigación en ciencias de la computación más citada durante quince años: Del mismo Bélády: “Mi
El artículo escrito en 1965 se convirtió en el artículo más referenciado del índice de citas en el campo del software durante un período de tiempo.
Período de 15 años ". JAN Lee, "Laszlo A. Belady", en Computer Pioneers ,
http://history.computer.org/pioneers/belady.html.
LRU realizó consistentemente lo más cercano a la clarividencia: un par de años después, Bélády también
mostró que FIFO tiene algunos inconvenientes adicionales curiosos, en particular, casos raros en los que el aumento
el tamaño de la caché puede empeorar el rendimiento, un fenómeno conocido como anomalía de Bélády. Bélády,
Nelson y Shedler, "An Anomaly in Space-Time Characteristics of Certain Programs Running in a
Paging Machine ".
"El equivalente digital de barajar papeles": Aza Raskin, "Resolver el problema de Alt-Tab",
http://www.azarask.in/blog/post/solving-the-alt-tab-problem/.
La literatura sobre políticas de desalojo: si está interesado en probar un algoritmo de almacenamiento en caché más complejo,
Algunas variantes populares de LRU son las siguientes:
• LRU- K : O'Neil, O'Neil y Weikum, “El algoritmo de reemplazo de página LRU- K para
Almacenamiento en búfer de disco de base de datos ”, que analiza el tiempo transcurrido desde el K -th uso más reciente
(que es el máximo para los elementos de la caché que no se han utilizado K veces). Esto introduce un
sesgo de frecuencia. LRU-2, que se centra en el penúltimo uso, es el más común.
• 2T: Johnson y Shasha, “2T: Una gestión de búfer de alto rendimiento y gastos generales bajos
Algoritmo de reemplazo ", que organiza los elementos en dos" colas "separadas para capturar un poco
poco de información de frecuencia. Los elementos comienzan en la primera cola y ascienden a la segunda
cola si se hace referencia a ellos de nuevo mientras están en la caché. Los artículos se expulsan de este
segunda cola de nuevo a la primera cola utilizando LRU, que también se utiliza para desalojar elementos de la
primera cola.
• LRFU: Lee et al., “LRFU: Un espectro de políticas que subsume las menos usadas recientemente y
Políticas de uso menos frecuente ”, que combina la actualidad y la frecuencia mediante la asignación de
puntuación numérica para cada elemento que se incrementa cuando se usa el elemento, pero que disminuye gradualmente
tiempo extraordinario.
• La caché de reemplazo adaptable (ARC): Megiddo y Modha, "superando a LRU con una
"Adaptive Replacement Cache Algorithm", que utiliza dos colas de forma similar a 2Q
pero adapta la longitud de las colas en función del rendimiento.
Se ha demostrado que todos estos algoritmos superan a LRU en pruebas de gestión de caché
rendimiento.
favorito abrumador de los científicos de la computación: por ejemplo, Pavel Panchekha escribió un artículo en
2012 para el blog de Dropbox, donde expone el razonamiento de Dropbox para usar LRU, en
https://tech.dropbox.com/2012/10/caching-in-theory-and-practice/.
Página 358
En lo profundo de las pilas subterráneas de Gardner: para aquellos que tengan curiosidad por saber exactamente qué es UC
Los estudiantes de Berkeley habían estado leyendo cuando visitamos: Walden de Thoreau ; textos críticos sobre el Cantar de los
Yo mismo , Cormac McCarthy, James Merrill, Thomas Pynchon, Elizabeth Bishop, JD Salinger, Anaïs
Nin y Susan Sontag; Drown de Junot Díaz; Telegraph Avenue y The Yiddish Policemen's Union
por Michael Chabon; Bad Dirt y Bird Cloud de Annie Proulx; Sr. y Sra. Baby de Mark Strand;
El hombre en el castillo alto de Philip K. Dick; la poesía y la prosa recopiladas de William Carlos
Williams; Tabaco de Chuck Palahniuk; Sula de Toni Morrison; Árbol de humo de Denis Johnson; los
Conexión de todas las personas con pulmones por Juliana Spahr; El sueño del campo unificado de Jorie
Graham; Desnudo , yo hablo bonito un día y viste a tu familia con pana y mezclilla de David
Sedaris; Ariel de Sylvia Plath y Oleanna de David Mamet; Biografía de DT Max de David Foster
Wallace; Como algo que vuela hacia atrás , traducciones del evangelio de regreso a lenguas y
Deepstep Come Shining por CD Wright; la prosa de TS Eliot; Eureka de Edgar Allan Poe; Porra
Budd, Sailor y una colección de obras breves de poesía y prosa de Herman Melville; El Aspern
Documentos , El retrato de una dama y La vuelta del tornillo de Henry James; Harold Bloom sobre Billy
Budd , Benito Cereno y “Bartleby the Scrivener”; las obras de Eugene O'Neill; Stardust de Neil
Gaiman; Reservation Blues de Sherman Alexie; No es país para viejos de Cormac McCarthy; y
más.
“Doce años, ese es el límite”: Elizabeth Dupuis, entrevista personal, 16 de septiembre de 2014.
“¡En la escala de una milla por milla!”: Concluyeron Carroll, Sylvie y Bruno .
Una cuarta parte de todo el tráfico de Internet: Stephen Ludin, “Akamai: Por qué una cuarta parte de Internet es más rápida
y más seguro que el resto ”, conferencia, 19 de marzo de 2014, Instituto Internacional de Ciencias de la Computación,
Berkeley, California. Como afirma Akamai en su propio sitio, "Akamai ofrece entre el 15% y el 30% de todos
Tráfico web" (http://www.akamai.com/html/about/facts_figures.html ).
evitar cualquier tipo de organización comprensible para los humanos: el sistema de "almacenamiento caótico" de Amazon
descrito aquí: http://www.ssi-schaefer.de/blog/en/order-picking/chaotic-storage-amazon/ .
A Amazon se le otorgó una patente: la patente sobre el envío previo de artículos comúnmente solicitados es la patente de EE. UU.
No. 8,615,473, otorgado el 24 de diciembre de 2013, “Método y sistema para envío anticipado de paquetes”
por Joel R. Spiegel, Michael T. McKenna, Girish S. Lakshman y Paul G. Nordstrom, en nombre de
Amazon Technologies Inc.
que la prensa aprovechó: ver, por ejemplo, Connor Simpson, "Amazon Will Sell You Things Before
Sabes que quieres comprarlos ”, The Wire , 20 de enero de 2014,
http://www.thewire.com/technology/2014/01/amazon-thinks-it-can-predict-your-future/357188/;
Chris Matyszczyk, "¿Amazon enviará cosas antes de que hayas pensado en comprarlas?"
CNET , 19 de enero de 2014, http://www.cnet.com/news/amazon-to-ship-things-before-youve-even-
pensado-en-comprarlos / .
"Favoritos locales" de cada estado de Netflix: Micah Mertes, "Los Estados Unidos de Netflix Local
Favoritos ”, 10 de julio de 2011, http://www.slacktory.com/2011/07/united-states-netflix-local-favorites/ .
los enormes archivos que componen el video HD de larga duración: en 2012, Netflix anunció que
cansado de pagar a empresas como Akamai y había comenzado a construir su propia CDN global. Ver Eric Savitz,
"Netflix cambia el tráfico a su propia CDN" , Forbes , 5 de junio de 2012,
Página 359
http://www.forbes.com/sites/ericsavitz/2012/06/05/netflix-shifts-traffic-to-its-own-cdn-akamai-
candelero-shrs-hit / . Puede encontrar más información sobre Open Connect CDN de Netflix en
https://www.netflix.com/openconnect .
“El almacenamiento en caché es algo tan obvio”: John Hennessy, entrevista personal, 9 de enero de 2013.
“Una caja en el piso del armario de mi abrigo delantero”: Morgenstern, Organizing from the Inside Out .
“Bolsas extra para aspiradoras detrás del sofá”: Jones, Keeping Found Things Found .
motores de búsqueda desde una perspectiva cognitiva: consulte Belew, Finding Out About .
recomendó el uso de un puesto de valet: Rik Belew, entrevista personal, 31 de octubre de 2013.
“Un principio muy fundamental en mi método”: Yukio Noguchi, entrevista personal, 17 de diciembre,
2013.
nació el "super" sistema de archivo: el sistema de archivo de Noguchi se describe en su libro Super
Método organizado , y fue presentado inicialmente en inglés por el traductor William Lise. El blog
El artículo que describe el sistema ya no está disponible en el sitio de Lise, pero aún se puede visitar a través del
Archivo de Internet en
https://web.archive.org/web/20031223072329/http://www.lise.jp/honyaku/noguchi.html. Más lejos
La información proviene de Yukio Noguchi, entrevista personal, 17 de diciembre de 2013.
El artículo definitivo sobre listas autoorganizadas: Sleator y Tarjan, “Amortized Efficiency of List
Reglas de actualización y paginación ”, que también proporcionó los resultados más claros sobre las propiedades teóricas de
el principio LRU.
“El algoritmo de Dios, si se quiere”: Robert Tarjan, entrevista personal, 17 de diciembre de 2013.
si sigue el principio LRU: Esta aplicación del principio LRU a listas autoorganizadas es
conocido como el algoritmo Move-to-Front .
no meramente eficiente. Es realmente óptimo: esto no significa que deba renunciar por completo a
categorización. Si desea hacer las cosas un poco más llamativas y acelerar el proceso de búsqueda,
Noguchi sugiere colocar pestañas de colores en los archivos que pertenecen a diferentes categorías. De esa manera si tu
sabe que está buscando, digamos, cuentas, puede restringir su búsqueda lineal a esos elementos. Y
todavía estarán ordenados de acuerdo con la Regla de movimiento al frente dentro de cada categoría.
los sistemas de recuperación de información de las bibliotecas universitarias: los hallazgos de Anderson sobre la memoria humana
se publican en Anderson y Milson, "Human Memory", y en el libro The Adaptive Character
del pensamiento . Este libro ha sido influyente para diseñar una estrategia para analizar la cognición cotidiana.
en términos de soluciones ideales, utilizadas por Tom y muchos otros en su investigación. Anderson y Milson,
"Human Memory", a su vez, se basa en un estudio estadístico sobre el préstamo de bibliotecas que aparece en Burrell,
"Un modelo estocástico simple para préstamos para bibliotecas".
la pieza que falta en el estudio de la mente: la exploración inicial de Anderson de las conexiones entre
la recuperación de información por computadoras y la organización de la memoria humana se llevó a cabo en una era
cuando la mayoría de la gente nunca había interactuado con un sistema de recuperación de información, y los sistemas en uso
eran bastante primitivos. A medida que la investigación de los motores de búsqueda ha superado los límites de la información
que los sistemas de recuperación pueden hacer, ha creado nuevas oportunidades para descubrir paralelismos entre mentes y
máquinas. Por ejemplo, Tom y sus colegas han demostrado cómo las ideas detrás del PageRank de Google
Página 360
Los algoritmos son relevantes para comprender la memoria semántica humana. Ver Griffiths, Steyvers y Firl,
"Google y la mente".
“Vi ese marco presentado ante mí”: Anderson, The Adaptive Character of Thought .
la realidad misma tiene una estructura estadística: "La memoria humana refleja, con un grado notable de
fidelidad, la estructura que existe en el entorno ”. Ibídem.
"Un libro grande es una gran molestia": la cita en griego es "μέγα βιβλίον μέγα κακόν" ( mega
biblion, mega kakon ), que también se ha traducido como "Libro grande, gran mal". La referencia original
tiene la intención de menospreciar la poesía épica, pero presumiblemente ser un erudito en un momento en que los libros
tenían la forma de pergaminos de decenas de pies de largo, lo que significaba que los libros grandes eran una molestia en más formas
que estético. Hay una razón por la que la práctica de la cita y la cita no comenzó correctamente hasta
los libros venían en códices con páginas numeradas. Para un excelente recuento de esta historia, vea
Boorstin, Los Descubridores .
“Si haces una ciudad más grande”: John Hennessy, entrevista personal, 9 de enero de 2014.
“Las mentes son dispositivos naturales de procesamiento de información”: Michael Ramscar, “Exclusivo para proveedores:
Michael Ramscar sobre el 'mito' del declive cognitivo ”, entrevista con Bill Myers, 19 de febrero,
2014. http://www.providermagazine.com/news/Pages/0214/Provider-Exclusive-Michael-Ramscar-
Sobre el mito del declive cognitivo.aspx .
5. PROGRAMACIÓN
“Cómo pasamos nuestros días”: Dillard, The Writing Life .
“Somos lo que hacemos repetidamente”: de hecho, esta frase, frecuentemente atribuida al propio Aristóteles,
se originó con el erudito Will Durant, como un resumen (en palabras de Durant) del pensamiento de Aristóteles. Ver
Durant, La historia de la filosofía .
comenzando con la tarea más difícil: ¡ Tracy, Eat That Frog! El libro atribuye su cita titular
- "Cómete una rana viva a primera hora de la mañana y no te pasará nada peor el resto del día".
día ”—a Mark Twain, aunque esta atribución puede ser apócrifa. El sitio web de Quote Investigator
cita al escritor francés del siglo XVIII Nicolas Chamfort como la fuente más probable. Ver
http://quoteinvestigator.com/2013/04/03/eat-frog/ para obtener más información.
primero programar los compromisos sociales de uno: Fiore, The Now Habit .
"El eterno aferrarse a una tarea incompleta": William James, en una carta a Carl Stumpf,
1 de enero de 1886.
Página 361
firmas como Amazon, IKEA y SpaceX: la empresa de software de diagramas de Gantt LiquidPlanner se jacta
Amazon, IKEA y SpaceX entre sus clientes en la URL (contraria a la intuición)
http://www.liquidplanner.com/death-to-gantt-charts/.
primer indicio de que este problema incluso podría resolverse: el resultado seminal de Johnson (en lo que ahora se llama
Programación de "flowhop", donde los trabajos fluyen de una máquina a otra) aparece en "Optimal Two- and
Programas de producción de tres etapas con tiempos de instalación incluidos ".
comenzar con la tarea que vence antes: la fecha de vencimiento más temprana (EDD), también conocida como la regla de Jackson, fue
derivado en Jackson, programación de una línea de producción para minimizar la tardanza máxima . James R.
Jackson creció en Los Ángeles en la década de 1930 y, a través de su trabajo con Logistics Research de UCLA
Project pasó un tiempo visitando talleres mecánicos administrados por varias empresas aeroespaciales de la zona. Su
pensar en cómo los trabajos se movían de una máquina a otra lo llevó finalmente a desarrollar un
matemáticas para analizar los "flujos de red", trabajo que luego se utilizaría en el diseño de
algoritmos para enrutar el flujo de tráfico en Internet. Aparece una breve biografía en Producción y
Sociedad de Gestión de Operaciones, "James R. Jackson".
Algoritmo de Moore: presentado en Moore, "An N Job, One Machine Sequencing Algorithm for
Minimizar el número de trabajos atrasados ". En el artículo, Moore reconoció una simplificación y
optimización que le había sugerido Thom J. Hodgson. Hoy en día, los términos "Moore's
Algoritmo ”,“ Algoritmo de Hodgson ”y el“ Algoritmo de Moore-Hodgson ”a veces se utilizan
indistintamente.
hacer la tarea más rápida que pueda: se demostró que el tiempo de procesamiento más corto (SPT), o la regla de Smith,
minimizar la suma de los tiempos de finalización en Smith, "Varios optimizadores para la producción de una sola etapa".
aparece en los estudios de búsqueda de alimento de animales: Stephens y Krebs, Teoría de la búsqueda de alimento .
conocida como la "bola de nieve de la deuda": en la esfera popular, el autor y orador Dave Ramsey es quizás
el divulgador y defensor más conocido de la estrategia de la "bola de nieve de la deuda", y ha obtenido muchos
simpatizantes y detractores por igual. En el aspecto académico, un artículo de 2012 de investigadores de escuelas de negocios en
Northwestern, Gal y McShane, "¿Pueden las pequeñas victorias ayudar a ganar la guerra?" y un artículo de 2014 de
economistas de Texas A&M Brown y Lahey, Small Victories , por ejemplo, han analizado el impacto
de "pequeñas victorias" para ayudar a las personas a salir de la deuda de los consumidores.
un vampiro obsesivo-compulsivo: este episodio es la temporada 5, episodio 12, "Bad Blood", que
Se emitió originalmente el 22 de febrero de 1998.
Reeves culparía del error a las "presiones de los plazos": esto proviene de un correo electrónico con fecha de diciembre
15, 1997, de Glenn Reeves a sus colegas, línea de asunto "¿Qué sucedió realmente en Marte?"
disponible en línea en http://research.microsoft.com/en-
us / um / people / mbj / Mars_Pathfinder / Authoritative_Account.html.
"Si eres inflamable y tienes piernas": la historia de Hedberg se puede encontrar en su álbum de comedia de 1999
Ubicaciones estratégicas de parrilla .
Página 362
"Cosas que más importan": la primera aparición de esta cita en inglés parece estar en
Covey, How to Succeed with People , donde se atribuye a Goethe sin citarlo.
“Así es como hago las cosas todos los días”: Laura Albert McLay, entrevista personal, 16 de septiembre,
2014.
“Gene estaba posponiendo algo”: Jan Karel Lenstra, entrevista personal, 2 de septiembre de 2014; y
correspondencia personal.
Lawler tomó una ruta intrigantemente tortuosa: la biografía de Lawler está extraída de Lawler, “Old
Stories ”y Lenstra,“ El poder místico de Twoness ”.
“La conciencia social” del departamento de informática : Richard Karp, “A Personal View of
Ciencias de la Computación en Berkeley ”, Departamento de EECS, Universidad de California, Berkeley,
http://www.eecs.berkeley.edu/BEARS/CS_Anniversary/karp-talk.html.
construir el cronograma al revés: el análisis de Lawler de las restricciones de precedencia para el máximo
El problema de la tardanza se encuentra en Lawler, "Secuenciación óptima de una sola máquina sujeta a precedencia
Restricciones ".
es lo que el campo llama "intratable": este análisis está en Lawler, "Secuenciación de trabajos para minimizar
Tiempo total ponderado de finalización sujeto a restricciones de precedencia ". Más precisamente, el problema es
“ NP -hard”, lo que significa que no tiene una solución eficiente conocida y es posible que nunca la tenga.
una búsqueda para mapear todo el panorama de la teoría de la programación: la búsqueda surgió una tarde en
1975, mientras Lawler, Lenstra y sus colegas Richard Karp y Ben Lageweg se sentaban a hablar
teoría de la programación en el Mathematisch Centrum en Amsterdam. Quizás fueron los "olores acre de
malta y lúpulo ”en el aire de la cervecería Amstel de al lado, pero algo inspiró al grupo a
decidir que un libro que contiene una lista de todos los problemas de programación y si se han resuelto
haría un buen regalo para su amigo y colega Alexander Rinnooy Kan, que estaba a punto de
defender su tesis. (Esta historia aparece en Lawler, "Old Stories" y Lenstra, "The Mystical Power of
Twoness. ”) Rinnooy Kan continuaría haciendo importantes contribuciones no solo a la academia sino también
a la economía holandesa, miembro de la junta directiva de ING y nombrado por el periódico De
Volkskrant como la persona más influyente en los Países Bajos, tres años seguidos. Ver "Rinnooy Kan
weer invloedrijkste Nederlander ”, De Volkskrant , 4 de diciembre de 2009, http://nos.nl/artikel/112743-
rinnooy-kan-weer-invloedrijkste-nederlander.html .
Lageweg escribió un programa de computadora que generó la lista, enumerando unos 4.536 diferentes
permutaciones del problema de programación: cada combinación posible de métricas (retraso máximo,
número de trabajos atrasados, suma de tiempos de finalización, etc.) y restricciones (pesos, precedencia, horas de inicio,
y así sucesivamente) que pudieran pensar. Durante una serie de apasionantes días, el grupo “tuvo el placer de
eliminando un tipo de problema oscuro tras otro en rápida sucesión ".
Su esquema organizativo para describir el zoológico de problemas de programación era un lenguaje "entrelazado
con taquigrafía ", que llamaron" Schedulese "(Graham et al.," Optimización y aproximación
en secuenciación determinista ”). La idea básica es que los problemas de programación se describen mediante tres
variables: la naturaleza de las máquinas involucradas, la naturaleza de los trabajos y el objetivo de la programación.
Estas tres variables se especifican en ese orden, con códigos estándar que describen factores como
restricciones de precedencia, preferencia, tiempos de lanzamiento y el objetivo. Por ejemplo, 1 | r j | ∑ C j (pronunciado
Página 363
Una recompensa inmediata fue la facilidad consumada con la que pudimos comunicar el problema.
tipos. Los visitantes de nuestras oficinas a veces se quedaban desconcertados al escuchar intercambios como: "Dado que uno-
arejay-sum-ceejay es NP-difícil, ¿eso implica que una- preferencia -arejay-sum-ceejay es NP-
duro, también? "No, eso es fácil, ¿recuerdas?" "Bueno, un deejay-sum-ceejay es fácil y eso
implica uno- preferencia -deejay-sum-ceejay es fácil, entonces, ¿qué sabemos sobre uno-
preemption-arejay-deejay-sum-ceejay? " "Nada."
(En notación formal: "Dado que 1 | r j | ∑ C j es NP-duro, ¿eso implica que 1 | pmtn, r j | ∑ C j también es NP-duro?"
"No, eso es fácil, ¿recuerdas?" “Bueno, 1 | d j | ∑ C j es fácil y eso implica 1 | pmtn, d j | ∑ C j es fácil, entonces, ¿qué
sabemos acerca de 1 | pmtn, r j , d j | ∑ C j ? " “Nada” [Lawler et al., “¡Un regalo para Alexander!”; ver también
Lawler, "Old Stories"].)
un cierto tiempo para comenzar algunas de sus tareas: lo que llamamos "horas de inicio" se refiere en el
literatura (pensamos de forma algo ambigua) como "tiempos de publicación". Lenstra, Rinnooy Kan y Brucker,
"La complejidad de los problemas de programación de la máquina" mostró que tanto la minimización de la suma de finalización
Los tiempos y minimizar el retraso máximo con tiempos de liberación arbitrarios son NP -difíciles. El caso de
La minimización del número de trabajos atrasados con tiempos de liberación arbitrarios se analiza en Lawler, “Programación de una
Una sola máquina para minimizar el número de trabajos atrasados ".
Una encuesta reciente: Lawler et al., "Secuenciación y programación". La versión más reciente de esta lista es
disponible en http://www.informatik.uni-osnabrueck.de/knust/class/ .
sigue siendo la versión preventiva de la fecha de vencimiento más temprana: el resultado de minimizar el máximo esperado
La tardanza al elegir el trabajo con la fecha de vencimiento más temprana se analiza en Pinedo, Programación .
la versión preventiva del tiempo de procesamiento más corto: la eficacia de elegir el trabajo con
el tiempo de procesamiento esperado más corto ponderado para minimizar la suma de los tiempos de finalización ponderados
en un entorno dinámico (siempre que la estimación del tiempo para completar un trabajo no aumente en el
duración trabajada en ese trabajo) fue mostrado por Sevcik, "Programación para pérdida total mínima usando
Distribuciones de tiempo de servicio ”, como parte de una estrategia más general para la programación dinámica.
suma de los retrasos ponderados de esos trabajos: Pinedo, "Programación estocástica con fechas de lanzamiento y
Fechas de vencimiento ”, mostró que este algoritmo es óptimo para estos problemas bajo el (bastante fuerte)
el supuesto de que los tiempos de los trabajos siguen una distribución sin memoria, lo que significa que su estimación
de cuánto tiempo tomarán permanece constante sin importar cuánto tiempo los haya estado haciendo. En
Página 364
programación estocástica, los algoritmos óptimos no serán necesariamente ideales para todas las cargas de trabajo posibles, pero
en lugar de minimizar los valores esperados de sus métricas relevantes.
"Reemplace 'plan' con 'conjetura'": Jason Fried, "Llamemos a los planes como son: conjeturas", 14 de julio,
2009, https://signalvnoise.com/posts/1805-lets-just-call-plans-what-they-are-guesses .
“En su lugar, solo hago recados”: Kirk Pruhs, entrevista personal, 4 de septiembre de 2014.
“Tienes parte de mi atención”: The Social Network , guión de Aaron Sorkin; Columbia
Imágenes, 2010.
“Nadie sabía nada de eso”: Peter Denning, entrevista personal, 22 de abril de 2014.
"Provocó un colapso completo del servicio": Denning, "Thrashing: sus causas y prevención".
"Los cachés son cálidos para la carga de trabajo actual": Peter Zijlstra, entrevista personal, 17 de abril,
2014.
cualquier situación en la que el sistema se detenga: Thrashing también puede tener lugar en sistemas de bases de datos,
donde la competencia entre diferentes procesos para adquirir "bloqueos" para acceder a la base de datos puede
inundar la capacidad del sistema para permitir que los procesos que actualmente mantienen las cerraduras hagan cualquier cosa.
De manera similar, la paliza puede aparecer en contextos de redes, donde una cacofonía de diferentes señales
Competir por el canal de la red puede evitar que pase nada. Tomaremos un
Observe más de cerca el último escenario en el capítulo 10.
reemplazó su programador: el " Programador O ( n )" utilizado por Linux a partir de la versión 2.4 en 2001
ordenó todos los procesos por prioridad, lo que llevó más tiempo cuantos más procesos había. Esto fue desechado
a favor del " Programador O (1)" a partir de Linux 2.6 en 2003, que clasificaba todos los procesos por cubos
en un número predeterminado de depósitos, independientemente de cuántos procesos hubiera. Sin embargo,
hacer este tipo de cubeta requirió computar heurísticas complejas, y comenzando con Linux 2.6.23 en
2007, el " Programador O (1)" fue reemplazado por el aún más sencillo "Completely Fair
Programador ".
En Linux, este segmento mínimo útil: este valor se define en la sección "Completely Fair
Scheduler ”en la variable sysctl_sched_min_granularity.
Los programadores han recurrido a la psicología: por ejemplo, Peter Zijlstra, entrevista personal, 17 de abril de 2014.
Las propias computadoras hacen algo como esto: Linux agregó soporte para la fusión de temporizadores en 2007;
Microsoft lo incluyó en Windows a partir de Windows 7 en 2009; y Apple hizo lo mismo en OS X
Mavericks en 2013.
“Solo un error de una línea en su algoritmo”: Peter Norvig, entrevista personal, 17 de septiembre de 2014.
Página 365
“No cambio de entrada y salida”: Shasha y Lazere, Out of Their Minds , pág. 101.
"Mi función es estar al tanto de las cosas": Donald Knuth, "Knuth versus correo electrónico", http: // www-cs-
faculty.stanford.edu/~uno/email.html .
6. REGLA DE BAYES
“Todo conocimiento humano es incierto”: Bertrand Russell, Conocimiento humano: su alcance y límites ,
1948, pág. 527.
Allí vio el Muro de Berlín: Gott, “Implicaciones del principio copernicano para nuestro futuro
Prospectos ".
"Estos argumentos deben ser sólo probables": Investigación sobre el entendimiento humano , § IV,
"Dudas escépticas acerca de las operaciones del entendimiento".
La propia historia de Bayes: nuestra breve biografía se basa en Dale, A History of Inverse Probability , y
Bellhouse, "El reverendo Thomas Bayes".
en 1746, '47, '48 o '49: el legendario artículo de Bayes, sin fecha, había sido archivado entre un par de
artículos fechados en 1746 y 1749. Véase, por ejemplo, McGrayne, The Theory That Would Not Die .
defensa del novedoso "cálculo" de Newton: una introducción a la doctrina de las fluxiones, y
Defensa de los matemáticos frente a las objeciones del autor del analista, en la medida en que sean
asignados para afectar sus métodos generales de razonamiento .
"Merece ser preservado": Introducción a Bayes, "Un ensayo para resolver un problema en el
Doctrina de las posibilidades ".
“La proporción de espacios en blanco con respecto a los premios ”: Apéndice de ibid.
necesitamos primera razón hacia adelante : Para ser precisos, Bayes estaba argumentando que las hipótesis dada h y
algunos datos observados d , debemos evaluar esas hipótesis calculando la probabilidad p ( d | h ) para
cada h . (La notación p ( d | h ) significa la "probabilidad condicional" de d dada h , es decir, la probabilidad
de observar d si h es verdadera.) Para convertir esto nuevamente en una probabilidad de que cada h sea verdadera, entonces
dividir por la suma de estas probabilidades.
Laplace nació en Normandía: para más detalles sobre la vida y obra de Laplace, consulte Gillispie, Pierre-
Simon Laplace .
destilado en una sola estimación: la ley de Laplace se deriva trabajando a través del cálculo
sugerido por Bayes; la parte complicada es la suma de todas las hipótesis, lo que implica una aplicación divertida
de integración por partes. Puede ver una derivación completa de la ley de Laplace en Griffiths, Kemp y
Tenenbaum, "Modelos bayesianos de cognición". Desde la perspectiva de las estadísticas bayesianas modernas,
La ley de Laplace es la media posterior de la tasa binomial utilizando un a priori uniforme.
Si lo intentas solo una vez y funciona: tal vez recuerdes que en nuestra discusión sobre bandidos armados múltiples
y el dilema explorar / explotar en el capítulo 2, también abordamos las estimaciones de la tasa de éxito de un
proceso — una máquina tragamonedas — basado en un conjunto de experiencias. El trabajo de Bayes y Laplace undergirds
muchos de los algoritmos que discutimos en ese capítulo, incluido el índice de Gittins. Como la ley de Laplace,
los valores del índice de Gittins que presentamos allí asumieron que cualquier probabilidad de éxito es igualmente
Página 366
probable. Esto implícitamente toma la tasa de ganancias general esperada para una máquina tragamonedas con un récord de 1 a 0 para ser
dos tercios.
"No más coherente o concebible que el resto": una investigación sobre humanos
Entendimiento , §IV, "Dudas escépticas acerca de las operaciones del entendimiento".
El verdadero trabajo pesado lo hizo Laplace: Para ser justos, un influyente artículo de 1950 (Bailey,
Procedimientos de credibilidad ) se refirió a la "Generalización de Laplace de la regla de Bayes", pero no
palo. Los descubrimientos que llevan el nombre de alguien que no sea su descubridor es un
Fenómeno que el estadístico e historiador Stephen Stigler ha afirmado que debe considerarse
una ley empírica: la ley de la eponimia de Stigler. Por supuesto, Stigler no fue la primera persona en descubrir
esta; asigna el mérito al sociólogo Robert K. Merton. Véase Stigler, "Stigler's Law of Eponymy".
multiplicar sus probabilidades juntos: para los matemáticos inclinados, aquí está la versión completa de
Regla de Bayes. Queremos calcular la probabilidad de asignar una hipótesis h dados los datos d . Nosotros
tener creencias previas sobre la probabilidad de que esa hipótesis sea cierta, expresada en una distribución previa
p ( h ). Lo que queremos calcular es la distribución "posterior", p ( h | d ), que indica cómo debemos
actualizar nuestra distribución anterior a la luz de la evidencia proporcionada por d . Esto viene dado por
"Especialmente sobre el futuro": Los orígenes inciertos de este dicho se describen en detalle en Cita
Investigador , "Es difícil hacer predicciones, especialmente sobre el futuro",
http://quoteinvestigator.com/2013/10/20/no-predict/.
sorprendente si hubiera incluso una ciudad de Nueva York: la portada de The New Yorker es Richard McGuire, "Time
Warp ”, 24 de noviembre de 2014. Para un análisis fascinante y más detallado de la esperanza de vida de
ciudades y corporaciones, consulte el trabajo de Geoffrey West y Luis Bettencourt; por ejemplo, Bettencourt et al.,
"Crecimiento, innovación, escalamiento y ritmo de vida en las ciudades".
una ráfaga de correspondencia crítica: por ejemplo, ver Garrett y Coles, "Bayesian Inductive
Inferencia y principios antrópicos ”y Buch,“ Discusión de perspectivas futuras ”.
una rifa en la que entras sin saber nada: el estadístico Harold Jeffreys sugeriría más tarde,
en lugar de ( w +1) ⁄ ( n +2) de Laplace , usando más bien ( w +0.5) ⁄ ( n +1) , que resulta de usar un "no informativo"
antes que el "uniforme" a priori (Jeffreys, Teoría de la probabilidad ; Jeffreys, "An Invariant Form
para la probabilidad previa en problemas de estimación ”). Un método para definir a priori más informativos
resulta en predicciones de la forma ( w + w ′ +1) ⁄ ( n + n ′ +2) , donde w ′ y n ′ son el número de victorias y
intentos de procesos similares en su experiencia pasada (para obtener detalles, consulte Griffiths, Kemp y
Tenenbaum, "Modelos bayesianos de cognición"). Usando esta regla, si ha visto previamente 100 loterías
sorteos con solo 10 boletos ganadores ( w = 10, n = 100), su estimación después de ver un solo ganador
El sorteo de esta nueva lotería sería un 12/103 mucho más razonable (no muy lejos del 10%). Variantes en
La ley de Laplace se utiliza ampliamente en lingüística computacional, donde proporciona una forma de
estimar las probabilidades de palabras que nunca se han visto antes (Chen y Goodman, "An
Estudio empírico de técnicas de suavizado para modelado de lenguajes ”).
Página 367
o durar cinco milenios: para una cantidad como una duración, que va de 0 a ∞, el
anterior no informativo en los tiempos t es la densidad de probabilidad p ( t ) ∝ 1 / t . Cambiar la escala: definir un
nueva cantidad s que es un múltiplo de t ; no cambia la forma de esta distribución: si s = ct , entonces p ( s )
∝ p ( t = s / c ) ∝ 1 / s . Esto significa que es invariante en escala. Mucha más información sobre desinformativo
a priors aparece en Jeffreys, Theory of Probability , y Jeffreys, "An Invariant Form for the Prior
Probabilidad en problemas de estimación ".
surge el Principio Copernicano: Esto fue demostrado por Gott, "Future Prospects Discussed", en
respondiendo a Buch, "Prospectos futuros discutidos".
trató de estimar el número de tanques: esto ha llegado a conocerse como el "tanque alemán
Problema ”, y se ha documentado en varias fuentes. Véase, por ejemplo, Gavyn Davies, "How a
Fórmula estadística ganó la guerra ” , The Guardian , 19 de julio de 2006,
http://www.theguardian.com/world/2006/jul/20/secondworldwar.tvandradio.
frutas en un huerto: por ejemplo, la Asociación Anual de Productores de Aguacates de Nueva Zelanda de 2002
El informe de investigación encontró que “en abril, los perfiles de tamaño de la fruta estaban distribuidos normalmente y permanecían así
durante el resto del período supervisado ".
La población promedio de una ciudad: esta cifra proviene de Clauset, Shalizi y Newman, “Power-
Distribuciones de leyes en datos empíricos ”, que a su vez cita el censo de EE. UU. De 2000.
puede variar plausiblemente en muchas escalas: La forma general de una distribución de ley de potencias en una cantidad t
es p ( t ) ∝ t - γ , donde el valor de γ describe la rapidez con la que la probabilidad de t disminuye a medida que t aumenta .
Al igual que con el prior no informativo, la forma de la distribución no cambia si tomamos s = ct ,
cambiando la escala.
un dominio lleno de leyes de poder: la observación de que la riqueza se distribuye de acuerdo con una ley de poder
La función se atribuye a Pareto, Cours d'économie politique . Otra buena discusión sobre el poder
distribuciones legales de poblaciones e ingresos es Simon, "On a Class of Skew Distribution Functions".
El ingreso medio en Estados Unidos: el ingreso bruto ajustado individual (AGI), derivado de
Declaraciones del IRS, se estimó en $ 55,688 para el año fiscal 2009, el año más reciente para el cual un
la estimación estaba disponible; ver el documento de trabajo de 2011 “Evaluación del uso de la nueva corriente
Preguntas complementarias sociales y económicas anuales de la Encuesta de población en el Impuesto de la Oficina del Censo
Model ”, disponible en https://www.census.gov/content/dam/Census/library/working-
papers / 2011 / demo / 2011_SPM_Tax_Model.pdf , que a su vez cita datos del censo de EE. UU.
Suplemento social y económico anual de la Encuesta sobre la población actual de 2010 de la Oficina.
dos tercios de la población de EE. UU. ganan menos que el ingreso medio: el límite para el 40% más rico de
El AGI en 2012 fue de $ 47,475 y el límite para el 30% superior fue de $ 63,222, de lo cual podemos inferir que
un ingreso bruto ajustado de $ 55,688 aterriza aproximadamente en el 33% superior. Véase Adrian Dungan, “Individual Income Tax
Shares, 2012 ”, Boletín de Estadísticas de Ingresos del IRS , primavera de 2015, disponible en
https://www.irs.gov/pub/irs-soi/soi-a-ints-id1506.pdf.
el 1% superior hace casi diez veces la media: el límite para el 1% superior fue un AGI de $ 434,682 en
2012, y el límite para el 0.01% superior fue $ 12,104,014. Ibídem.
Página 368
el proceso de "apego preferencial": una buena discusión de la audiencia general sobre la idea de
Las distribuciones de la ley de poder que surgen del apego preferencial se pueden encontrar en Barabási, Linked .
“'¿Podría continuar para siempre' en el buen sentido?”: Lerner, The Lichtenberg Figures .
La estrategia de predicción apropiada es una regla multiplicativa: todas las reglas de predicción discutidas en este
se derivan de Griffiths y Tenenbaum, "Predicciones óptimas en la cognición cotidiana".
los poemas siguen algo más cercano a una ley de potencia: Ibid.
formalizó la extensión de los intervalos: Erlang primero modeló la tasa de llamadas telefónicas que aparecen en un
red utilizando una distribución de Poisson en "La teoría de las probabilidades y las conversaciones telefónicas",
y, a su vez, desarrolló la distribución homónima de Erlang para modelar los intervalos entre la llegada
llama en "Solución de algunos problemas en la teoría de probabilidades de significación en automático
Intercambios telefónicos ". Para obtener más detalles sobre la vida de Erlang, consulte Heyde, "Agner Krarup Erlang".
probabilidades de que sean de 20 a 1: Para ser precisos, las probabilidades de que se le reparta una mano de blackjack en el
juego del mismo nombre son exactamente 2.652 a 128, o alrededor de 20,7 a 1. Para ver la derivación de por qué esto lleva
a una expectativa de jugar 20.7 manos antes de conseguirlo, podemos definir nuestra expectativa de forma recursiva:
O conseguimos blackjack con un resultado de 1, o no lo hacemos (en cuyo caso volvemos a donde empezamos una
mano más tarde). Si x es nuestra expectativa, x = 1 + (2524/2652) x , donde 2524/2652 es nuestra probabilidad de no
recibir blackjack. Resolver para x da aproximadamente 20,7.
conocido por los estadísticos como "sin memoria": Técnicamente, el tiempo para el próximo blackjack sigue un
distribución geométrica (similar a la distribución exponencial para una cantidad continua), que es
en constante disminución, en lugar de la distribución de Erlang más parecida a un ala que describimos en la
texto. Sin embargo, ambos pueden producir predicciones sin memoria en las circunstancias adecuadas. Si nos encontramos
un fenómeno particular en algún punto aleatorio de su duración, como asumió Gott con respecto al Berlín
Wall, luego el Erlang con forma de ala nos da predicciones de la regla aditiva sin memoria. Y si nosotros
observar continuamente un fenómeno que tiene una distribución geométrica, como en un juego de
blackjack, resulta el mismo tipo de predicciones de la regla aditiva.
Kenny Rogers aconsejó: "The Gambler" es mejor conocido como lo canta Kenny Rogers en su
Álbum de 1978 del mismo nombre, pero originalmente fue escrito e interpretado por Don Schlitz. los
La grabación de la canción por parte de Rogers llegaría al primer lugar en las listas de países de Billboard, y
ganó el Grammy de 1980 a la Mejor Interpretación Vocal Masculina de Country.
pedirle a la gente que haga predicciones: Griffiths y Tenenbaum, “Optimal Predictions in Everyday
Cognición."
distribuciones previas de las personas en una amplia franja: los estudios han examinado, por ejemplo, cómo
lograr identificar formas en movimiento a partir de los patrones de luz que caen sobre la retina, inferir causal
relaciones de las interacciones entre objetos y aprender el significado de nuevas palabras después de ver
ellos solo unas pocas veces. Véase, respectivamente, Weiss, Simoncelli y Adelson, “Motion Illusions as
Percepciones óptimas ”; Griffiths y col., "Bayes and Blickets"; Xu y Tenenbaum, "Word Learning as
Inferencia bayesiana."
famosa "prueba de malvavisco": Mischel, Ebbesen y Raskoff Zeiss, "Cognitive and Attentional
Mecanismos en el retraso de la gratificación ".
Página 369
todo depende de qué tipo de situación: McGuire y Kable, "Decision Makers Calibrate Behavioural
Persistencia sobre la base de la experiencia en intervalos de tiempo ”, y McGuire y Kable,“ Rational Temporal
Las predicciones pueden ser la base de los fracasos aparentes para retrasar la gratificación ".
se convirtieron en adultos jóvenes que tuvieron más éxito: Mischel, Shoda y Rodríguez, “Delay of
Gratificación en los niños ".
cómo las experiencias anteriores pueden afectar el comportamiento: Kidd, Palmeri y Aslin, "Rational Snacking".
Carnegie Hall incluso medio lleno: según cifras de la Aviation Safety Network (personal
correspondencia), el número de muertes "a bordo de aviones de propiedad estadounidense que son capaces de transportar
Más de 12 pasajeros, incluidos también jets corporativos y aviones de transporte militar ”durante el período 2000–
2014 fue de 1369, y sumar la cifra de 2014 nuevamente para estimar las muertes en 2015 arroja una estimación total de
1.393 hasta finales de 2015. El famoso Auditorio Isaac Stern del Carnegie Hall tiene capacidad para 2.804; ver
http://www.carnegiehall.org/Information/Stern-Auditorium-Perelman-Stage/ .
mayor que toda la población de Wyoming: según el National Highway Traffic Safety
Administración, 543,407 personas murieron en accidentes automovilísticos en los Estados Unidos en los años 2000-2013.
Ver http://www-fars.nhtsa.dot.gov . Repitiendo la cifra de 2013 para estimar las muertes en 2014 y 2015
arroja una estimación de 608,845 muertes hasta finales de 2015. La población de Wyoming en 2014, como
estimada por la Oficina del Censo de los Estados Unidos, fue de 584,153. Ver
http://quickfacts.census.gov/qfd/states/56000.html.
violencia armada en las noticias estadounidenses: Glassner, "Narrative Techniques of Fear Mongering".
7. SOBREAJUSTE
"Casarse — casarse — casarse QED": esta nota de Darwin está fechada el 7 de abril de 1838; ver, por ejemplo, Darwin,
La correspondencia de Charles Darwin, volumen 2: 1837–1843 .
“Álgebra moral o prudencial”: carta de Franklin a Joseph Priestley, Londres, 19 de septiembre de 1772.
"Cualquier cosa que puedas hacer, yo puedo hacerlo mejor": "Anything You Can Do", compuesta por Irving Berlin, en
Annie, consigue tu pistola , 1946.
un estudio reciente realizado en Alemania: Lucas et al., “Reexamining Adaptation and the Set Point
Modelo de felicidad ".
nuestro trabajo es descubrir la fórmula: para los aficionados a las matemáticas, estamos tratando de encontrar el mejor polinomio
función para capturar esta relación. Tomando el tiempo desde el matrimonio para ser xy la satisfacción para ser y ,
el modelo de un predictor es y = ax + b . El modelo de dos predictores es y = ax 2 + bx + c , y el modelo de nueve
El modelo predictor encuentra los mejores coeficientes para todos los valores de x hasta x 9 , estimando un polinomio de
grado 9.
a través de todos y cada uno de los puntos del gráfico: de hecho, es una verdad matemática que siempre puede
Dibuja un polinomio de grado n - 1 a través de n puntos cualesquiera .
nivel básico de satisfacción de las personas: Lucas et al., “Reexaminar la adaptación y el punto de ajuste
Modelo de felicidad ".
Página 370
no siempre es mejor utilizar un modelo más complejo: los estadísticos se refieren a los diversos factores en el
modelo como "predictores". Un modelo que es demasiado simple, como una línea recta que intenta ajustarse a una curva, es
se dice que exhibe "sesgo". El tipo opuesto de error sistémico, donde un modelo se complica demasiado
y, por lo tanto, gira violentamente debido a pequeños cambios en los datos, se conoce como "varianza".
La sorpresa es que estos dos tipos de errores, sesgo y varianza, pueden ser complementarios .
Reducir el sesgo (hacer que el modelo sea más flexible y complicado) puede aumentar la varianza. Y
El aumento del sesgo (simplificando el modelo y ajustando los datos con menos precisión) a veces puede reducir
diferencia.
Como el famoso principio de incertidumbre de Heisenberg de la física de partículas, que dice que cuanto más
sabe sobre el momento de una partícula cuanto menos sepa sobre su posición, el llamado sesgo-
La compensación de la varianza expresa un límite profundo y fundamental sobre qué tan bueno puede ser un modelo, en qué
es posible conocer y predecir. Esta noción se encuentra en varios lugares del aprendizaje automático.
literatura. Véase, por ejemplo, Geman, Bienenstock y Doursat, "Neural Networks and the
Dilema de sesgo / varianza ”, y Grenander,“ Sobre el análisis espectral empírico de los procesos estocásticos ”.
en el Libro de los Reyes: La serpiente de bronce, conocida como Nehushtan, es destruida en 2 Reyes 18: 4.
“Pague mucho dinero para quitarse los tatuajes”: Gilbert, Stumbling on Happiness .
duelos hace menos de cincuenta años: si no eres demasiado pusilánime, puedes ver el video de un duelo
en 1967 en http: //passerelle-production.u-
bourgogne.fr/web/atip_insulte/Video/archive_duel_france.swf.
a medida que los atletas sobreajustan sus tácticas: para un ejemplo interesante de sobreajuste deliberado de la esgrima,
ver Harmenberg, Epee 2.0 .
"Las estructuras de incentivos funcionan": Brent Schlender, "The Lost Steve Jobs Tapes", Fast Company , mayo
2012, http://www.fastcompany.com/1826869/lost-steve-jobs-tapes.
"Lo que el CEO decida medir": Sam Altman, "Bienvenida, e Ideas, Productos, Equipos y
Execution Part I ”, Stanford CS183B, otoño de 2014,“ How to Start a Startup ”,
http://startupclass.samaltman.com/courses/lec01/.
Ridgway catalogó una serie de tales: Ridgway, "Consecuencias disfuncionales del desempeño
Mediciones."
En una empresa de colocación laboral: en esta historia, el propio Ridgway cita a Blau, The Dynamics of
Burocracia .
"Los amigos no permiten que los amigos midan las visitas a la página": Avinash Kaushik, "Eres lo que mides,
¡Elija sabiamente sus KPI (incentivos)! " http://www.kaushik.net/avinash/measure-choose-
kpis-incentivos-inteligentes / .
"Si no puede explicarlo simplemente": esta cita se atribuye con frecuencia a Albert Einstein, aunque
es probable que esta atribución sea apócrifa.
Tikhonov propuso una respuesta: véase, por ejemplo, Tikhonov y Arsenin, Solución de problemas mal planteados .
Página 371
inventado en 1996 por el bioestadístico Robert Tibshirani: Tibshirani, “Regression Shrinkage and
Selección a través del lazo ".
el cerebro humano quema alrededor de una quinta parte: para obtener más información sobre el consumo de energía del cerebro humano, consu
Raichle y Gusnard, "Appraising the Brain's Energy Budget", que a su vez cita, por ejemplo, Clarke y
Sokoloff, "Circulación y metabolismo energético del cerebro".
cerebros intentan minimizar la cantidad de neuronas: utilizando esta estrategia de inspiración neuronal (conocida como
"Codificación escasa"), los investigadores han desarrollado neuronas artificiales que tienen propiedades similares a las
que se encuentra en la corteza visual. Véase Olshausen y Field, “Emergencia del campo receptivo de células simples
Propiedades ”.
innovadora "optimización de la cartera de varianza media" : el trabajo para el que Markowitz fue
galardonado con el Premio Nobel aparece en su artículo “Portfolio Selection” y en su libro Portfolio Selection:
Diversificación eficiente de inversiones .
"Dividí mis contribuciones al cincuenta por ciento": Harry Markowitz, citado en Jason Zweig, "How the Big
Brains Invest at TIAA – CREF ”, Money 27 (1): 114, enero de 1998.
más que cuadriplicado desde mediados de la década de 1990 hasta 2013: de la Asociación de Alimentos de Soja del Norte
America, "Sales and Trends", http://www.soyfoods.org/soy-products/sales-and-trends, que a su vez
cita una investigación "realizada por Katahdin Ventures".
"Las nueces están de moda ahora": Vanessa Wong, "Drinkable Almonds", Bloomberg Businessweek , agosto
21 de 2013.
asombroso trescientas veces desde 2004: Lisa Roolant, “Why Coconut Water Is Now $ 1
Billion Industry ”, TransferWise, https://transferwise.com/blog/2014-05/why-coconut-water-is-now-a-
Mil millones de industria / .
"Saltó de lo invisible a lo inevitable": David Segal, "Por Coconut Waters, una lucha callejera por
Shelf Space ”, New York Times , 26 de julio de 2014.
el mercado de la col rizada creció un 40%: "Las ventas de la col rizada se disparan mientras los chefs famosos destacan los beneficios para la salud"
The Telegraph , 25 de marzo de 2013
Pizza Hut, que lo incluyó en sus barras de ensaladas: Ayla Withee, “Kale: One Easy Way to Add More
Superalimentos para su dieta ”, Boston Magazine , 31 de mayo de 2012.
los cuerpos de los primeros vertebrados se torcieron 180 grados: Kinsbourne, "Somatic Twist". Discusión adicional de
La estructura del cuerpo y los órganos de los vertebrados primitivos se puede encontrar en Lowe et al., “Dorsoventral
Patrones en hemicordados ". Una descripción general más accesible es Kelly Zalocusky, "Pregunte a un
Neurocientífico: ¿Por qué se debilita el sistema nervioso? ” Stanford Neuroblog , 12 de diciembre,
2013, https://neuroscience.stanford.edu/news/ask-neuroscientist-why-does-nervous-system-
decusar .
los huesos de la mandíbula aparentemente fueron reutilizados: Ver, por ejemplo, "Jaws to Ears in the Ancestors of
Mammals, ”Understanding Evolution, http://evolution.berkeley.edu/evolibrary/article/evograms_05.
"La premisa de que no podemos medir lo que importa": "El mundo aterrador del Sr. Mintzberg",
entrevista con Simon Caulkin, Guardian , 25 de enero de 2003,
Página 372
http://www.theguardian.com/business/2003/jan/26/theobserver.observerbusiness11.
“La vida entera como una abeja neutra”: Darwin, La correspondencia de Charles Darwin, Volumen 2:
1837–1843 .
8. RELAJACIÓN
"Diseñar con éxito un inhibidor peptídico": Meghan Peterson (de soltera Bellows), entrevista personal,
23 de septiembre de 2014.
alrededor de 11107 posibles planes de asientos: más precisamente, habría 11107 posibilidades si tuviéramos
elegir una asignación de mesa para cada persona de forma independiente. El número es un poco menor una vez que tomamos
teniendo en cuenta la limitación de que sólo 10 personas pueden sentarse en cada mesa. Pero sigue siendo enorme.
Bellows estaba satisfecho con los resultados de la computadora: el marco formal que Meghan Bellows
utilizado para resolver el cuadro de asientos de su boda se describe en Bellows y Peterson, "Encontrar un óptimo
Plano de la sala."
Lincoln trabajó como "abogado de la pradera": puede leer más sobre el circuito de Lincoln en Fraker, "The
Autopista Lincoln real ".
"El problema del mensajero postal": Menger, "Das botenproblem", contiene una conferencia impartida por Menger
sobre el tema en Viena el 5 de febrero de 1930. Para una historia más completa del problema del viajante
consulte Schrijver, "Sobre la historia de la optimización combinatoria", así como el libro muy legible de Cook
En busca del vendedor ambulante .
El nombre icónico apareció por primera vez impreso: Robinson, On the Hamiltonian Game .
"Los resultados de imposibilidad también serían valiosos": Flood, "El problema del vendedor ambulante".
"No hay un buen algoritmo para el problema del viajante de comercio": Edmonds, "Optimum Branchings".
qué hace que un problema sea factible: Cobham, "The Intrinsic Computational Difficulty of Functions",
considera explícitamente la cuestión de qué debe considerarse un algoritmo "eficiente". Similar,
Edmonds, "Senderos, árboles y flores", explica por qué es importante una solución a un problema difícil
y, al defender esta solución en particular, establece un marco general para lo que hace
buenos algoritmos.
el marcador de fuera de límites de facto del campo: hay, de hecho, algoritmos que se ejecutan más lento que
tiempo polinomial pero más rápido que el tiempo exponencial; estos tiempos de ejecución "superpolinomiales" también los ponen
fuera del conjunto de algoritmos eficientes.
que se resuelvan de manera eficiente o no: el conjunto de problemas que se pueden resolver de manera eficiente en ciencias de la computación es
llamado P , abreviatura de "tiempo polinomial". El controvertido conjunto de problemas liminales, mientras tanto, es
conocido como NP , para "polinomio no determinista". Los problemas en NP pueden tener sus soluciones verificadas
de manera eficiente una vez encontrado, pero si todos los problemas que se pueden verificar fácilmente también se pueden
resuelto es desconocido. Por ejemplo, si alguien le muestra una ruta y dice que es menos de 1,000
millas, el reclamo es fácil de verificar, pero encontrar una ruta de menos de 1,000 millas o probar que es
imposible, es otra hazaña por completo. La cuestión de si P = NP (es decir, si es posible
Página 373
saltar de manera eficiente a las soluciones de problemas NP ) es el mayor misterio sin resolver en la computadora
Ciencias.
El principal avance hacia una solución ha sido la demostración de que existen ciertos problemas
con un estado especial: si uno de ellos puede resolverse de manera eficiente, entonces cualquier problema en NP se puede resolver
eficientemente y P = NP (Cook, "La complejidad de los procedimientos de demostración de teoremas"). Estos son conocidos
como problemas “ NP- difíciles”. En ausencia de una respuesta a si P = NP , los problemas en NP no se pueden resolver.
resuelto de manera eficiente, por lo que nos referimos a ellos como "intratables". (En "Una propuesta terminológica",
Donald Knuth sugirió esto como una etiqueta apropiada para NP -problemas difíciles, además de ofrecer una
pavo vivo a cualquiera que pudiera probar P = NP .) Los problemas de programación intratables que Eugene
Lawler encontrado en el capítulo 5 cae en esta categoría. Un problema NP- difícil que está en sí mismo en NP es
conocido como " NP -completo". Ver Karp, "Reducibilidad entre problemas combinatorios", para el clásico
resultado que muestra que una versión del problema del viajante es NP -completo, y ahora, el
Golden Ticket: P, NP y la búsqueda de lo imposible , para una introducción accesible a P y NP .
la mayoría de los científicos informáticos creen que no hay ninguno: en una encuesta de 2002 de cien
informáticos teóricos, sesenta y un pensaron P ≠ NP y sólo nueve pensaron P = NP (Gasarch,
“La P =? Encuesta NP ”). Si bien se puede demostrar que P = NP se puede hacer exhibiendo un polinomio-tiempo
algoritmo para un problema NP -completo, demostrar que P ≠ NP requiere hacer argumentos complejos sobre
los límites de los algoritmos de tiempo polinomial, y no hubo mucho acuerdo entre la gente
encuestados sobre exactamente qué tipo de matemáticas se necesitarán para resolver este problema. Pero sobre
la mitad de ellos pensaba que el problema se resolvería antes de 2060.
Además, muchos otros problemas de optimización: esto incluye versiones de cobertura de vértices y conjunto
cubrir — dos problemas identificados como pertenecientes a NP en Karp, “Reducibilidad entre combinaciones
Problemas ”, donde se demostró que veintiún problemas estaban en este conjunto. Por el final de la
1970, los científicos de la computación habían identificado unos trescientos problemas NP- completos (Garey y
Johnson, Computers and Intractability ), y la lista ha crecido significativamente desde entonces. Éstos incluyen
algunos problemas que son muy familiares para los humanos. En 2003, se demostró que el Sudoku era NP -completo
(Yato y Seta, "Complejidad e integridad"), así como maximizar el número de filas despejadas en
Tetris, incluso con un conocimiento perfecto de piezas futuras (Demaine, Hohenberger y Liben-Nowell,
“Tetris es difícil, incluso aproximado”). En 2012, determinar si existe un camino hacia el final
del nivel en juegos de plataformas como Super Mario Brothers se agregó oficialmente a la lista (Aloupis,
Demaine y Guo, "Los juegos clásicos de Nintendo son ( NP -) difíciles").
“Todavía tienes que luchar”: Jan Karel Lenstra, entrevista personal, 2 de septiembre de 2014.
“Lo perfecto es enemigo de lo bueno”: pareado de Voltaire Dans ses écrits, un sage Italien / Dit que
le mieux est l'ennemi du bien (“En sus escritos, un sabio italiano / Dice que lo perfecto es enemigo de la
bueno ”) aparece al comienzo de su poema“ La Bégueule ”. Voltaire había citado anteriormente al italiano
expresión “Le meglio è l'inimico del bene” en su Dictionnaire philosophique de 1764 .
sus mentes también se vuelven hacia la relajación: Shaw, Introducción a los métodos de relajación ; Henderson,
Técnicas de relajación discretas . Lector de advertencia : las matemáticas son lo suficientemente intensas como para
de lectura relajante.
para el circuito judicial de Lincoln: las ciudades del circuito judicial de Lincoln se derivan del 1847–
Mapa de 1853 del Octavo Circuito Judicial en la Revista de la Asociación Abraham Lincoln . Ver
http: //quod.lib.u mich.edu/j/jala/images/fraker_fig01a.jpg.
Página 374
prácticamente nada de tiempo: bueno, está bien, un poco de tiempo, lineal en el número de ciudades si estás
afortunado, linearítmico si no lo eres. Pettie y Ramachandran, “Un árbol de expansión mínimo óptimo
Algoritmo."
el árbol de expansión, con su retroceso libre: abordar el problema del vendedor ambulante a través de la
El árbol de expansión mínimo se analiza en Christofides, Worst-Case Analysis of a New Heuristic .
visita todas las ciudades de la Tierra: para obtener más información sobre el estado del arte en las ciudades de todo el mundo que viajan
problema del vendedor (el llamado "TSP mundial"), se puede encontrar un informe actualizado en
http://www.math.uwaterloo.ca/tsp/world/. Para obtener más información sobre el problema del viajante de comercio en general,
Cook, In Pursuit of the Travelling Salesman , es una buena referencia general, y Lawler et al., The
Viajero Problema del Vendedor , satisfará a aquellos que quieran profundizar.
Encontrar el conjunto mínimo de ubicaciones: este clásico problema de optimización discreta se conoce como el
Problema de "establecer cubierta".
“Cuando no puedes hacer la mitad de esto”: Laura Albert McLay, entrevista personal, 16 de septiembre de 2014.
le permite lamer la menor cantidad de sobres: En ciencias de la computación, esto se conoce como el problema de la “cobertura de vértices”.
Es una especie de primo del problema de la cobertura del set, donde en lugar de buscar el menor número de disparos
estaciones cuya cobertura incluye a todos, el objetivo es encontrar el menor número de personas que estén
conectado con todos los demás.
como máximo el doble de invitaciones: Khot y Regev, "Vertex Cover podría ser difícil de aproximar
dentro de 2- ε ".
rápidamente nos coloca dentro de un límite cómodo: para obtener más información sobre estas aproximaciones, consulte Vazirani,
Algoritmos de aproximación .
no es una bala mágica: sigue siendo una pregunta abierta dentro del campo si la relajación continua incluso
ofrece la mejor aproximación posible para el problema de cobertura mínima de vértices (invitaciones a fiestas), o
si se pueden encontrar mejores aproximaciones.
“¡Inconcebible!”: La princesa prometida , guión de William Goldman; 20th Century Fox, 1987.
Página 375
Enfoque del problema del material de corte, parte II ". Para obtener una descripción general y reflexiones, consulte Fisher, “The
Método de relajación lagrangiana para resolver problemas de programación de enteros ”, así como Geoffrion,
"Relajación lagrangiana para la programación de enteros".
"Si terminas con juegos fraccionarios": Michael Trick, entrevista personal, 26 de noviembre de 2013.
"La fantasía nunca se puede reconciliar": Christopher Booker, "What Happens When the Great
¿Las fantasías, como la energía eólica o la Unión Europea, chocan con la realidad? ” , The Telegraph , 9 de abril de
2011.
9. ALEATORIA
"Por qué y cómo es absolutamente misterioso": Citado en Shasha y Rabin, "Una entrevista con
Michael Rabin ".
simplemente dejando caer agujas sobre el papel: Laplace, Théorie analytique des probabilités .
Lazzarini supuestamente hizo 3.408 lanzamientos: Lazzarini, “Un'applicazione del calcolo della
probabilità. "
hace que el informe de Lazzarini parezca sospechoso: para una discusión más detallada de los resultados de Lazzarini, ver
Gridgeman, "Probabilidad geométrica y el número π ", y Badger, "Lazzarini's Lucky
Aproximación de π ”.
"La prueba de una inteligencia de primer nivel": Fitzgerald, "The Crack-Up". Posteriormente recopilado con otros ensayos
en The Crack-Up .
“Puede ser mucho más práctico”: Ulam, Adventures of a Mathematician , págs. 196-197. Calculador
las probabilidades de ganar para el solitario Klondike siguen siendo un área activa de investigación hasta el día de hoy, impulsada principalmente
por simulación de Monte Carlo. Para ver un ejemplo de trabajo reciente en el área, vea Bjarnason, Fern y
Tadepalli, "Solitario Klondike de límite inferior con planificación de Montecarlo".
Metropolis nombró este enfoque: Metropolis reclama los derechos de denominación en una carta que aparece en
Hurd, "Note on Early Monte Carlo Computations".
descendiente de una larga línea de rabinos: Shasha y Lazere, fuera de sus mentes .
múltiples caminos que podría seguir: el artículo clave de Rabin aquí, en coautoría con Dana Scott, fue "Finite
Autómatas y sus problemas de decisión ". Ya hemos encontrado una de las formas en que esto
concepto se convirtió en central para la informática teórica en nuestra discusión de la clase de complejidad de
el problema del viajante en el capítulo 8; La noción de Rabin de computación "no determinista" es la
“ N ” de NP .
“Una de las ramas más evidentemente inútiles”: la cita es de Hardy, “Prime Numbers”; ver
también Hardy, Collected Works . Para obtener más información sobre la influencia de los números primos en la criptografía, consulte
por ejemplo, Schneier, Applied Cryptography .
Página 376
En el cifrado moderno, por ejemplo: un algoritmo ampliamente utilizado que se basa en la multiplicación
de números primos es RSA, que significa las iniciales de sus inventores: Ron Rivest, Adi Shamir y
Leonard Adleman. Consulte Rivest, Shamir y Adleman, “Un método para obtener firmas digitales
y criptosistemas de clave pública ". Otros sistemas criptográficos, por ejemplo, Diffie-Hellman, también utilizan
números primos; consulte Diffie y Hellman, "New Directions in Cryptography".
El problema, sin embargo, son los falsos positivos: el posible avance, o la falta de él, en Miller's
El enfoque se reduciría a la facilidad con la que estos falsos positivos podrían descartarse. Cuantos valores
de x ¿necesita verificar para estar seguro acerca de un número dado n ? Miller demostró que si el "generalizado
Hipótesis de Riemann ”eran verdaderas, el número mínimo de testigos potenciales que necesitarían ser
marcado es O ((log n ) 2 ), mucho menos que el requerido por algoritmos como el Tamiz de Erastothenes.
Pero aquí estaba el problema: la hipótesis generalizada de Riemann no estaba —y sigue estando— sin demostrar.
(La hipótesis de Riemann, ofrecida por primera vez por el matemático alemán Bernhard Riemann en 1859,
se refiere a las propiedades de una función matemática compleja llamada función zeta de Riemann. Esta
La función está íntimamente relacionada con la distribución de números primos y, en particular, con qué regularidad
esos números aparecen en la recta numérica. Si la hipótesis es cierta, entonces los números primos son suficientemente buenos
se comportó como para garantizar la eficiencia del algoritmo de Miller. Pero nadie sabe si es verdad. De hecho,
La hipótesis de Riemann es uno de los seis principales problemas abiertos en matemáticas cuyas soluciones
Clay Mathematics Institute otorgará un "Premio del Milenio" de $ 1 millón. La pregunta de si
P = NP , que vimos en el capítulo 8, también es un problema del Premio del Milenio).
“Michael, este es Vaughan”: Rabin cuenta esta historia en Shasha y Lazere, Out of Their Minds .
identificar rápidamente incluso los números primos gigantes: el artículo de Rabin sobre su prueba de primalidad, "Probabilistic
Algoritmo para probar la primordialidad ”, apareció unos años más tarde. Paralelamente, Robert Solovay y Volker
Strassen había desarrollado un algoritmo probabilístico similar basado en un conjunto diferente de ecuaciones que
los primos deben obedecer, aunque su algoritmo fue menos eficiente; véase Solovay y Strassen, "A Fast
Prueba de Monte-Carlo para la primacía ".
menos de uno en un millón de billones de billones: la documentación de OpenSSL especifica una función para
"Realizar una prueba de primalidad probabilística Miller-Rabin con ... una serie de iteraciones utilizadas ... que produce
una tasa de falsos positivos de como máximo 2 −80 para entrada aleatoria ”; ver
https://www.openssl.org/docs/crypto/BN_generate_prime.html . Asimismo, la información federal de EE. UU.
El estándar de procesamiento (FIPS) especifica que su estándar de firma digital (DSS) acepta el error
probabilidad de 2 −80 (para claves de 1.024 bits, al menos); consulte Gallagher y Kerry, Estándar de firma digital .
Cuarenta pruebas de Miller-Rabin son suficientes para lograr este límite, y el trabajo de la década de 1990 ha sugerido
que en muchos casos bastará con tan solo tres pruebas de Miller-Rabin. Vea Damgård, Landrock y
Pomerance, "Estimaciones de error de caso promedio para la prueba de prima probable fuerte"; Burthe Jr., “Más
Investigaciones con la prueba de prima probable fuerte ”; y Menezes, Van Oorschot y Vanstone,
Handbook of Applied Cryptography , así como una discusión más reciente en
http://security.stackexchange.com/questions/4544/how-many-iterations-of-rabin-miller-should-be-
usado-para-generar-seguridad-criptográfica .
para el número de granos de arena: El número de granos de arena en la Tierra se estima a partir de varios
fuentes entre 10 18 y 10 24 .
si alguna vez habrá un algoritmo eficiente: aquí, por "eficiente", estamos utilizando el campo
definición estándar, que es "tiempo polinomial", como se discutió en el capítulo 8.
Página 377
generar algunas xs aleatorias y conectarlas: Uno de los resultados clave sobre el papel de la aleatoriedad en
La prueba de identidad polinomial es lo que se llama el "lema de Schwartz-Zippel". Véase Schwartz, "Fast
Algoritmos probabilísticos para la verificación de identidades polinomiales ”; Zippel, “Algoritmos probabilísticos
para polinomios dispersos ”; y DeMillo y Lipton, “A Probabilistic Remark on Algebraic Program
Pruebas."
el único práctico que tenemos: ¿ habrá un algoritmo determinista eficiente para la identidad polinomial
¿Alguna vez se han encontrado pruebas? En términos más generales, ¿ tiene que existir un algoritmo determinista eficiente en cualquier lugar?
encontramos uno bueno al azar? ¿O podría haber problemas que los algoritmos aleatorios puedan resolver?
eficientemente pero que los algoritmos deterministas simplemente no pueden? Es un problema interesante en teoría
informática, y la respuesta a ella aún se desconoce.
Uno de los enfoques que se ha utilizado para explorar la relación entre aleatorizado y
Los algoritmos deterministas se denominan desaleatorización , básicamente , tomar algoritmos aleatorios y
quitando la aleatoriedad de ellos. En la práctica, es difícil para una computadora acceder a
aleatoriedad, por lo que cuando las personas implementan un algoritmo aleatorizado, a menudo usan un determinista
procedimiento para generar números que obedezcan a ciertas propiedades estadísticas de verdadera aleatoriedad.
La desaleatorización hace esto explícito, examinando lo que sucede cuando la aleatoriedad en aleatorización
los algoritmos son reemplazados por la salida de algún otro proceso computacional complejo.
El estudio de la desaleatorización muestra que es posible convertir algoritmos aleatorizados eficientes en
algoritmos deterministas eficientes, siempre que pueda encontrar una función que sea lo suficientemente compleja como para
su salida parece aleatoria pero lo suficientemente simple como para que se pueda calcular de manera eficiente. Para (detallado)
detalles, consulte Impagliazzo y Wigderson, " P = BPP si E requiere circuitos exponenciales", y
Impagliazzo y Wigderson, "Randomness vs. Time".
Críticos filosóficos de Rawls: El más destacado entre los críticos de Rawls fue el economista John Harsanyi;
ver, por ejemplo, Harsanyi, “¿Puede el principio de Maximin servir como base para la moralidad? Una crítica de Juan
Teoría de Rawls ".
Estas son críticas valiosas: para obtener más información sobre lo que a veces se llama "la conclusión repugnante", consulte
Parfit, Reasons and Persons , así como, por ejemplo, Arrhenius, “An Impossibility Theorem in
Axiología de la población ".
" Preocupación de los ingenieros más que de los filósofos": Aaronson, "Why Philosophers Should Care
Acerca de la complejidad computacional ".
"Notó algo que no ve a menudo": Rebecca Lange, "¿Por qué tan pocas historias?"
blog, 12 de noviembre de 2014, https://www.givedirectly.org/blog-post.html?id=2288694352161893466 .
"Me refiero a capacidad negativa": John Keats, carta a George y Thomas Keats, 21 de diciembre,
1817.
"Seguridad suficiente para los propósitos de la vida humana": John Stuart Mill, On Liberty (1859).
Página 378
más de un billón de URL distintas: "Sabíamos que la Web era grande ..." 25 de julio de 2008,
http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html.
pesa alrededor de setenta y siete caracteres: Kelvin Tan, "Longitud promedio de una URL (Parte 2)",
16 de agosto de 2010, http://www.supermind.org/blog/740/average-length-of-a-url-part-2 .
la URL se ingresa en un conjunto de ecuaciones: Bloom, "Compensación de espacio / tiempo en codificación hash con
Errores permitidos ".
enviado con varios navegadores web recientes: Google Chrome hasta al menos 2012 usaba un Bloom
filtro: consulte http://blog.alexyakunin.com/2010/03/nice-bloom-filter-application.html y
https://chromiumcodereview.appspot.com/10896048/ .
parte de criptomonedas como Bitcoin: Gavin Andresen, "Informe de estado de desarrollo principal n. ° 1",
1 de noviembre de 2012, https://bitcoinfoundation.org/2012/11/core-development-status-report-1/.
“El río serpentea”: Richard Kenney, “Hidrología; Lacrimación ”, en The One-Strand River:
Poems, 1994-2007 (Nueva York: Knopf, 2008).
utilice este enfoque cuando intente descifrar códigos: consulte Berg-Kirkpatrick y Klein, “Decipherment
con un millón de reinicios aleatorios ".
"Cultivo de un solo cristal a partir de una fusión": Kirkpatrick, Gelatt y Vecchi, "Optimización por
Recocido simulado ".
“El tipo que fue el mejor en IBM”: Scott Kirkpatrick, entrevista personal, 2 de septiembre de 2014.
Por último nos gustaría empezar a ir solamente subiendo: Si esta idea-empezando estar dispuesto a moverse
entre las opciones y, a continuación, centrarse más en las buenas; suena familiar, debería: optimizar
una función compleja requiere enfrentarse al intercambio de exploración / explotación. Y la aleatoriedad resulta ser un
fuente de estrategias bastante buenas para resolver problemas como bandidos armados múltiples, así como el tipo de
problemas de optimización en los que se centró Kirkpatrick.
Si recuerdas, el bandido de múltiples brazos nos ofrece varias opciones diferentes (brazos que podemos tirar) que
proporcionar beneficios diferentes y desconocidos. El desafío es encontrar el equilibrio entre probar nuevas opciones
(explorar) y buscar la mejor opción encontrada hasta ahora (explotar). Ser más optimista y más
Lo mejor es explorar desde el principio, volverse más exigente y explotar más después. Persiguiendo tal
La estrategia de disminuir gradualmente el optimismo acerca de las alternativas promete el mejor resultado posible.
Página 379
esperanza para: acumular arrepentimientos a un ritmo decreciente, con su arrepentimiento total aumentando como un logarítmico
función del tiempo.
La aleatoriedad proporciona una estrategia alternativa al optimismo. Intuitivamente, si el problema es uno de
equilibrando la exploración y la explotación, ¿por qué no hacerlo de forma explícita? Gasta una cantidad de tu
tiempo explorando y algo de explotación. Y esa es exactamente la estrategia que ese bandido de múltiples brazos
los expertos llaman a Epsilon Greedy .
Epsilon Greedy tiene dos partes: Epsilon y Greedy. La parte de Epsilon es que algunos pequeños
proporción del tiempo (los matemáticos usan la letra épsilon para denotar un número pequeño),
elija al azar entre sus opciones. La parte codiciosa es que el resto del tiempo te tomas el
la mejor opción que has encontrado hasta ahora. Así que entra al restaurante y lanza una moneda (o tira un dado, según
sobre su valor de épsilon) para decidir si probar algo nuevo. Si dice que sí, cierra los ojos y
apuntar al menú. Si no, disfruta
Desafortunadamente, de tu favoritode
a los investigadores actual.
bandidos con múltiples brazos no les gusta especialmente Epsilon Greedy. Parece
derrochador: se le garantiza que dedicará una parte de su tiempo a probar cosas nuevas, incluso si lo mejor
se aclara muy rápidamente. Si sigues a Epsilon Greedy, entonces tu arrepentimiento aumenta linealmente en el
número de veces que juegas. Cada vez que cenas, existe la posibilidad de que elijas
algo diferente a lo mejor, por lo que su arrepentimiento promedio aumenta en la misma cantidad cada vez. Esta
El crecimiento lineal es mucho peor que el arrepentimiento logarítmico garantizado por algoritmos deterministas basados
en optimismo debidamente calibrado.
Pero si la sencillez de Epsilon Greedy es atractiva, hay buenas noticias. Hay una variante simple
de este algoritmo, lo que llamamos Epsilon-Over- N Greedy , que garantiza logarítmica
lamenta, y funciona bien en la práctica (véase Auer, Cesa-Bianchi y Fischer, “Finite-Time Analysis of
el problema del bandido multiarmado ”). El truco consiste en reducir la posibilidad de probar algo nuevo
tiempo. La primera vez que hace una elección, elige al azar con probabilidad 1/1 (también conocido como siempre). Si
esa opción es buena, entonces la segunda vez que elijas al azar con probabilidad 1/2 (también conocido como voltear una
moneda: cara toma la misma opción, cruz prueba algo nuevo). En la visita tres, debe elegir
lo mejor con probabilidad 2/3, y pruebe algo nuevo con probabilidad 1/3. En el N º visita a
el restaurante, eliges al azar con probabilidad 1 / N , en caso contrario tomando la mejor opción
descubierto hasta ahora. Al disminuir gradualmente la probabilidad de probar algo nuevo, llega al dulce
lugar entre exploración y explotación.
También hay otro algoritmo más sofisticado para interpretar al bandido de múltiples brazos que
también hace uso de la aleatoriedad. Se llama Thompson Sampling , llamado así por William R.
Thompson, el médico de Yale que planteó por primera vez el problema (en 1933) de cómo elegir entre
dos tratamientos (Thompson, "Sobre la probabilidad de que una probabilidad desconocida supere a otra").
La solución de Thompson era simple: usando la regla de Bayes, calcule la probabilidad de que cada tratamiento sea
lo mejor. Luego elija ese tratamiento con esa probabilidad . Para empezar no sabes nada, y tu
tienen la misma probabilidad de elegir cualquiera de los tratamientos. A medida que se acumulan los datos, favorece a uno sobre el
otros, pero algunas veces todavía elige el tratamiento que no prefiere y tiene la oportunidad de cambiar
tu mente. A medida que esté más seguro de que un tratamiento es mejor, casi siempre terminará
usando ese tratamiento. Thompson Sampling equilibra la exploración y la explotación con elegancia, y también
garantiza que el arrepentimiento aumentará sólo logarítmicamente (ver Agrawal y Goyal, "Análisis de
Muestreo de Thompson ”).
La ventaja de Thompson Sampling sobre otros algoritmos para resolver bandidos de múltiples brazos
problemas es su flexibilidad. Incluso si las suposiciones del problema cambian, tiene información
sugiriendo que una opción es mejor que las otras, las opciones dependen unas de otras, las opciones cambian
Página 380
tiempo: la estrategia de Thompson de buscar opciones con una probabilidad que refleje su sensación de que
son los mejores actualmente disponibles que aún funcionan. Entonces, en lugar de tener que derivar un nuevo algoritmo en cada uno de
En estos casos, podemos simplemente aplicar la regla de Bayes y usar los resultados. En la vida real, esos bayesianos
Los cálculos pueden ser difíciles (el propio Thompson necesitó varias páginas de intrincadas matemáticas para resolver
el problema con solo dos opciones). Pero tratando de elegir la mejor opción y permitiendo una cantidad de
la aleatoriedad de sus elecciones que se ve atenuada por su grado de certeza es un algoritmo que se
Es poco probable que te lleve por mal camino.
citó la friolera de treinta y dos mil veces: El libro de texto de IA predominante, Inteligencia artificial:
A Modern Approach , declara que el recocido simulado “es ahora un campo en sí mismo, con cientos de
artículos publicados cada año ”(p. 155).
uno de los enfoques de optimización más prometedores: Curiosamente, un artículo de 2014 parece
demostrar que las medusas utilizan el recocido simulado en la búsqueda de alimento; ver Reynolds, “Firmas de
Búsqueda de Lévy optimizada activa y pasiva en medusas ".
“Yo mismo no soy un jugador”: Luria, Una máquina tragamonedas, un tubo de ensayo roto , p. 75. También discutido en
Garfield, "Reconociendo el papel del azar".
acuñó el término "serendipia": En Horace Walpole, carta a Horace Mann (fechada el 28 de enero de 1754).
"Un paralelo notable": James, "Grandes hombres, grandes pensamientos y el medio ambiente".
"Un proceso de variación ciega y retención selectiva": Campbell, "Variación ciega y selectiva
Retencion."
“Formas de sacarte del encuadre”: Brian Eno, entrevistado por Jools Holland, en Later ...
con Jools Holland , mayo de 2001.
"Deseo vago y constante": la palabra es saudade , y la definición citada proviene de Bell, en
Portugal .
"Es estúpido sacudirlo más": Tim Adams, "Dicing with Life" , Guardian , 26 de agosto de 2000.
10. REDES
"La conexión tiene una amplia variedad de significados": Cerf y Kahn, "Un protocolo para redes de paquetes
Intercomunicación."
“Teléfono celular real, portátil y de mano”: Martin Cooper, “Inventor del teléfono celular: sabíamos
Algún día todos tendrían uno ”, entrevista con Tas Anjarwalla, CNN, 9 de julio de 2010.
El mensaje era "iniciar sesión", o habría sido: Leonard Kleinrock cuenta la historia en un video de 2014
entrevista realizada por Charles Severence y disponible en “Len Kleinrock: The First Two Packets
en Internet ”, https://www.youtube.com/watch?v=uY7dUJT7OsU.
portentoso y del Antiguo Testamento a su pesar: dice Leonard Kleinrock de UCLA, "No planeamos
eso, pero no podríamos haber encontrado un mensaje mejor: breve y profético ". Las baldosas del suelo de
Boelter Hall de UCLA, si sus colores se interpretan como 0 y 1 binarios y se analizan como ASCII
personajes, deletree la frase "¡LO Y HE AQUÍ!" El crédito de este homenaje es para el arquitecto Erik
Hagen. Véase, por ejemplo, Alison Hewitt, "Descubra el mensaje codificado oculto en los azulejos del suelo del campus",
Página 381
“¡Se disparan! y están callados ”: Leonard Kleinrock,“ Computing Conversations: Len Kleinrock
sobre la teoría de los paquetes ”, entrevista con Charles Severance (2013). Ver
https://www.youtube.com/watch?v=qsgrtrwydjw así como
http://www.computer.org/csdl/mags/co/2013/08/mco2013080006.html.
"Una ilusión consensuada entre los dos puntos finales": Stuart Cheshire, entrevista personal, febrero
26 de diciembre de 2015.
las comunicaciones podrían sobrevivir a un ataque nuclear: Baran, "On Distributed Communications".
una red en crecimiento se convierte en una virtud: para la elaboración de este punto, y una reflexión más amplia sobre el
historia de las redes (incluidos sus problemas actuales), consulte Jacobson, “A New Way to Look at
Redes."
una red de conmutación de paquetes a través de "Avian Carriers": consulte Waitzman, A Standard for the
Transmisión de Datagramas IP en Avian Carriers , Waitzman, IP sobre Avian Carriers con Calidad de
Service , y Carpenter and Hinden, Adaptación de RFC 1149 para IPv6 para descripciones de aves
protocolo y ver http://www.blug.linux.no/rfc1149 para obtener detalles de la implementación real
realizado en Bergen, Noruega, el 28 de abril de 2001.
“Ninguna transmisión puede ser 100% confiable”: Cerf y Kahn, “Un protocolo para redes de paquetes
Intercomunicación."
el "problema de los generales bizantinos": Lamport, Shostak y Pease, "Los generales bizantinos
Problema."
señal de que la secuencia se ha restaurado: el proceso que se describe aquí se conoce como
retransmitir ".
casi el 10% del tráfico ascendente de Internet: Jon Brodkin, "Netflix ocupa el 9,5% del tráfico ascendente
en Internet de América del Norte: los paquetes ACK hacen de Netflix un monstruo de carga durante los picos de visualización
horas ”, Ars Technica , 20 de noviembre de 2014. Brodkin, a su vez, cita datos de Sandvine's Global
Informe de fenómenos de Internet , https://www.sandvine.com/trends/global-internet-phenomena/ .
“¿Se ha estrellado el receptor? ¿Son lentos? ”: Tyler Treat,“ No puedes tener exactamente una vez
Delivery ”, Brave New Geek: Introspections of a software engineer , 25 de marzo de 2015,
http://bravenewgeek.com/you-cannot-have-exactly-once-delivery/.
"Retransmisiones de extremo a extremo para recuperar": Vint Cerf, entrevistado por Charles Severance,
“Computación de conversaciones: Vint Cerf sobre la historia de los paquetes”, 2012.
Página 382
“La palabra más difícil de traducir del mundo”: Oliver Conway, “Congo Word 'Most
Untranslatable '”, BBC News , 22 de junio de 2004.
“Si al principio no tiene éxito”: Thomas H. Palmer, Teacher's Manual (1840), atestiguado en The
Diccionario Oxford de Proverbios , 2009.
tratando de vincular los siete campus de la universidad: Abramson, "The ALOHA System".
por encima de un mero 18,6% de utilización media: Ibid. De hecho, esta cifra es 1 ⁄ 2 e , exactamente la mitad de n ⁄ e , o
“37%”, cifra dada en la discusión de la parada óptima en el capítulo 1.
"Solo un esquema tiene alguna esperanza de funcionar": Jacobson, "Congestion Avoidance and Control".
"Qué forma más loca de intentar cambiar": Para obtener más información, consulte, por ejemplo, "Un nuevo programa de libertad condicional
en Hawaii Beats the Statistics ”, PBS NewsHour , 2 de febrero de 2014.
"Esta repentina caída del factor de mil": Jacobson, "Congestion Avoidance and Control".
"Luego de repente se vino abajo": Jacobson, "Van Jacobson: The Slow-Start Algorithm", entrevista con
Charles Severance (2012), https://www.youtube.com/watch?v=QP4A6L7CEqA.
aumentar su velocidad de transmisión de forma agresiva: este procedimiento inicial: un paquete único tentativo
seguido de una aceleración dos por uno, se conoce en TCP como inicio lento. Este nombre es parcial
Nombre inapropiado: Slow Start es "lento" al comenzar con un solo primer paquete tentativo, pero no en su
crecimiento exponencial a partir de entonces.
"Control sin jerarquía": consulte, por ejemplo, Gordon, "Control sin jerarquía".
La solución de las hormigas es similar: los hallazgos que relacionan la búsqueda de alimento con algoritmos de control de flujo como Slow
Comience a aparecer en Prabhakar, Dektar y Gordon, "The Regulation of Ant Colony Forraging Activity
sin información espacial ".
“Todo servidor público debería ser degradado”: este aforismo ampliamente reproducido, en el original
En español, dice: "Todos los empleados públicos deben descender a su inmediato inferior,
porque han sido ascendidos hasta volverse incompetentes ”.
ideado por el bufete de abogados líder Cravath, Swaine & Moore: el sistema Cravath es oficialmente
documentado en el sitio web de la propia firma: http://www.cravath.com/cravathsystem/ . El "arriba o fuera"
El componente del Sistema Cravath no se discute explícitamente allí, pero se hace referencia ampliamente
en otros lugares, por ejemplo, por la American Bar Association: "En la década de 1920, Cravath, Swaine & Moore se
el primer bufete de abogados registrado en contratar abiertamente de las facultades de derecho con el entendimiento expreso de que
muchos de los abogados jóvenes que contrató no se asociaron. Aquellos asociados que no hicieron
Se esperaba que su socio con el resto de su clase abandonara la empresa. Sin embargo, aquellos considerados mejores
entre los asociados, que hicieron el trabajo necesario y se mantuvieron en el camino para el número requerido de
años, podría esperar convertirse en accionistas, obtener aumentos paralelos en la compensación y disfrutar
empleo de por vida en la empresa ". (Janet Ellen Raasch, "Haciendo socio, o no: ¿está dentro, arriba o más
en el siglo XXI? ” Law Practice 33, número 4, junio de 2007.)
Página 383
las Fuerzas Armadas de EE. UU. adoptaron: Ver, por ejemplo, Rostker et al., Defense Officer Personnel Management
Ley de 1980 .
persiguieron lo que ellos llaman "control de dotación": ver, por ejemplo, Michael Smith, "Army Corporals Forced Out
'to Save Pension Cash' ” , Telegraph , 29 de julio de 2002.
como si toda comunicación fuera texto escrito: como Bavelas, Coates y Johnson, “Listeners as Co-
Narradores ”, dice,“ los oyentes tienen, en el mejor de los casos, un punto de apoyo débil en la mayoría de las teorías. En el extremo
los oyentes se consideran inexistentes o irrelevantes porque la teoría no los menciona o
los trata como periféricos. Esta omisión puede atribuirse, en parte, al uso implícito de texto escrito
como el prototipo para todos los usos lingüísticos ".
“Simultáneamente participando tanto en hablar como en escuchar”: Yngve, “On Getting a Word in
De canto."
"Narradores que contaron historias cercanas a oyentes distraídos": Bavelas, Coates y Johnson,
"Oyentes como co-narradores".
“Los 'malos narradores' pueden, al menos en parte, culpar a su audiencia”: Jackson Tolins, personal
correspondencia, 15 de enero de 2015.
"Conceptos erróneos sobre la causa y el significado de las colas": Nichols y Jacobson, "Controlling
Retraso en cola ".
la especificación HTTP todavía en uso hoy: Eso es HTTP 1.1, como se articula en el RFC 2616
documento de junio de 1999, disponible en http://tools.ietf.org/html/rfc2616 .
"Resultó que estaba copiando o sincronizando": Jim Gettys, "Bufferbloat: Dark Buffers in the Internet",
Google Tech Talk, 26 de abril de 2011.
“¡No 'Eureka!' pero 'Eso es gracioso' ”: esta cita ha aparecido en innumerables publicaciones con un
atribución a Isaac Asimov, pero su autoría real y procedencia siguen siendo difíciles de alcanzar. Parece tener
aparecido por primera vez, con la atribución de Asimov, como parte del programa "fortuna" de UNIX,
que muestra citas o refranes en el estilo de una galleta de la fortuna. Ver
http://quoteinvestigator.com/2015/03/02/eureka-funny/ . Asimov escribió un ensayo sobre "La
Eureka Phenomenon ”, pero esta frase no aparece allí.
cuando se ponen a cero de forma rutinaria: consulte Nichols y Jacobson, "Control del retraso de la cola".
que su estado natal de California tiene personas: la estimación de 2015 de la Oficina del Censo de EE. UU.
La población de California era 39.144.818. Ver
http://www.census.gov/popest/data/state/totals/2015/index.html.
"No hay una forma realmente buena de dejar mensajes a la gente": Ray Tomlinson, entrevistado por Jesse Hicks,
“Ray Tomlinson, el inventor del correo electrónico: 'Veo que el correo electrónico se usa, en general, exactamente de la manera en que
Envisioned '” , Verge , 2 de mayo de 2012, http://www.theverge.com/2012/5/2/2991486/ray-tomlinson-email-
inventor-entrevista-veo-correo-electrónico-siendo-utilizado .
simplemente rechazar todos los mensajes entrantes: uno de esos enfoques fue adoptado, por ejemplo, por la Universidad
del científico cognitivo de Sheffield, Tom Stafford. Durante su año sabático de 2015, su correo electrónico automatizado
Página 384
la respuesta decía: “Ahora estoy de año sabático hasta el 12 de junio. El correo electrónico enviado a t.stafford@shef.ac.uk ha sido
eliminado ".
Notificación de congestión explícita, o ECN: el documento de solicitud de comentarios (RFC) para ECN es
Ramakrishnan, Floyd y Black, The Addition of Explicit Congestion Notification (ECN) a IP ,
que es una revisión de Ramakrishnan y Floyd, una propuesta para agregar una notificación de congestión explícita
(ECN) a IP . Aunque la propuesta original data de la década de 1990, ECN sigue sin implementarse en
hardware de red estándar en la actualidad (Stuart Cheshire, entrevista personal, 26 de febrero de 2015).
“Este es un pantano a largo plazo”: Jim Gettys, entrevista personal, 15 de julio de 2014.
"¿Diría que un Boeing 747 es tres veces más 'más rápido'": Esto proviene del famoso
1996 "despotricar" "Es la latencia, estúpido". Verhttp://stuartcheshire.org/rants/Latency.html. Veinte años
más tarde, el sentimiento es solo más cierto.
hombre contra naturaleza: Apropiadamente, los escolares del siglo XXI aprenden cada vez más sobre
"Persona contra naturaleza", "persona contra sí mismo", "persona contra persona" y "persona contra sociedad".
"Un hombre inteligente pondría el veneno en su propia copa": La princesa prometida , guión de
William Goldman; 20th Century Fox, 1987.
"Anticipar las anticipaciones de los demás": atribuido a Keynes en Gregory Bergman, Isms , Adams
Medios, 2006.
fue el problema de la detención lo que inspiró a Turing: Alan Turing considera el problema de la detención y
propone la máquina de Turing en "Sobre números computables, con una aplicación a la
Entscheidungsproblem ”y“ On Computable Numbers, with a Application to the
Entscheidungsproblem. Una corrección ".
“Los jugadores de póquer lo llaman 'nivelación'”: Dan Smith, entrevista personal, 11 de septiembre de 2014.
"No tienes dos, siete": esto tuvo lugar en el "Full Tilt Poker Durrrr Million Dollar
Challenge ”, que se llevó a cabo en Les Ambassadeurs Club en Londres, del 17 al 19 de noviembre de 2009, y fue televisado
en Sky Sports.
"Solo quiero jugar un nivel por encima de tu oponente": Vanessa Rousso, "Leveling Wars",
https://www.youtube.com/watch?v=Yt5ALnFrwR4.
“Saber o tratar de saber qué es Nash”: Dan Smith, entrevista personal, 11 de septiembre de 2014.
un así llamado equilibrio : el concepto de un equilibrio de teoría de juegos y, para el caso, juego
teoría en sí misma, proviene de John von Neumann y Oskar Morgenstern de Princeton en Theory of
Juegos y comportamiento económico .
Página 385
elegir uno de los gestos con las manos del mismo nombre completamente al azar: una estrategia, como ésta, que
incorpora aleatoriedad se denomina estrategia "mixta". La alternativa es una estrategia "pura", que
siempre implica tomar exactamente la misma opción; esto claramente no funcionaría por mucho tiempo en piedra-papel-
tijeras. Las estrategias mixtas aparecen como parte del equilibrio en muchos juegos, especialmente en "suma cero"
juegos, donde los intereses de los jugadores se enfrentan directamente entre sí.
cada juego de dos jugadores tiene al menos un equilibrio: Nash, “Equilibrium Points in N -Person
Juegos"; Nash, "Juegos no cooperativos".
el hecho de que siempre existe un equilibrio de Nash: Para ser más precisos, ibid. demostró que cada juego
con un número finito de jugadores y un número finito de estrategias tiene al menos una estrategia mixta
equilibrio.
“Ha tenido un impacto fundamental y generalizado”: Myerson, “Nash Equilibrium and the History of
Teoría económica."
“ Danos algo que podamos usar”: Tim Roughgarden, “Teoría algorítmica de juegos, lección 1
(Introducción) ”, otoño de 2013, https://www.youtube.com/watch?v=TM_QFmQU_VA.
Se ha demostrado que todos son problemas insolubles: Gilboa y Zemel, "Nash and Correlated Equilibria".
simplemente encontrar equilibrios de Nash es intratable: Específicamente, se demostró que la búsqueda de equilibrios de Nash
pertenecen a una clase de problemas llamados PPAD , que (como NP ) se cree que es intratable. los
El vínculo entre los equilibrios de Nash y el PPAD se estableció en Daskalakis, Goldberg y Papadimitriou,
"La complejidad de calcular un equilibrio de Nash" y Goldberg y Papadimitriou, "Reducibilidad
Between Equilibrium Problems ”, que luego Chen y Deng extendieron a juegos de dos jugadores,
"Resolver la complejidad del equilibrio de Nash de dos jugadores", y luego generalizado en
Daskalakis, Goldberg y Papadimitriou, "The Complexity of Computing a Nash Equilibrium".
PPAD significa "Argumentos de paridad polinomial en gráficos dirigidos"; Papadimitriou, quien nombró a esto
clase de problemas en "Sobre la complejidad como racionalidad limitada", insiste en que cualquier parecido con su nombre es
una coincidencia. (Christos Papadimitriou, entrevista personal, 4 de septiembre de 2014.)
PPAD contiene otros problemas interesantes, como el problema del sándwich de jamón: dados n conjuntos de 2 n
puntos en n dimensiones, encuentre un plano que divida cada conjunto de puntos exactamente por la mitad. (Con n = 3, este
implica averiguar el camino que tendría que recorrer un cuchillo para cortar tres conjuntos de puntos por la mitad; si esos
Los conjuntos de puntos corresponden a dos piezas de pan y una pieza de jamón, el resultado es un perfectamente bisecado.
sándwich.) Encontrar los equilibrios de Nash es en realidad PPAD -completo, lo que significa que si hubiera un
algoritmo eficiente para resolverlo, entonces todos los demás problemas en la clase también podrían resolverse de manera eficiente
(incluida la preparación de los mejores sándwiches del mundo). Pero ser PPAD -completo no es tan malo como
siendo NP -completo. P , la clase de problemas que se pueden resolver de manera eficiente, podría ser igual a PPAD sin
siendo igual a NP . En el momento de escribir estas líneas, el jurado aún está deliberando: teóricamente es posible que alguien
podría idear un algoritmo eficiente para encontrar los equilibrios de Nash, pero la mayoría de los expertos no están sosteniendo sus
aliento.
“Gran parte de su credibilidad como predicción”: Christos Papadimitriou, “The Complexity of Finding
Equilibrios de Nash ”, en Nisan et al., Teoría de juegos algorítmicos .
"También debe considerarse relevante": Aaronson, "Why Philosophers Should Care About
Complejidad computacional."
Página 386
“Si su computadora portátil no puede encontrarlo”: En Christos Papadimitriou, “La complejidad de encontrar a Nash
Equilibria ”, en Nisan et al., Teoría de juegos algorítmicos , p. 30.
"El dilema del prisionero": El dilema del prisionero fue concebido por primera vez por Merrill Flood (de
problema de secretaria y problema de vendedor ambulante) y Melvin Drescher en RAND
Corporación. En enero de 1950, organizaron un juego entre Armen Alchian de UCLA y RAND
John D. Williams que tenía el dilema del prisionero, como recompensas (Flood, “Some Experimental Games”).
Albert Tucker de Princeton estaba intrigado por este experimento, y al prepararse para discutirlo en mayo de
en una conferencia en Stanford, le dio al problema su ahora famosa formulación carcelaria y su nombre. A
Historia detallada de los orígenes de la teoría de juegos y su desarrollo en el trabajo de RAND.
Corporation se puede encontrar en Poundstone, Prisoner's Dilemma .
un precio de la anarquía que es solo 4/3: Roughgarden y Tardos, "¿Qué tan malo es el enrutamiento egoísta?"
El doctorado en Cornell de 2002 de Roughgarden también aborda el tema del enrutamiento egoísta.
“El pesimista teme que esto sea cierto”: Cabell, The Silver Stallion .
imagínese un "bien común" del césped público: Hardin, "La tragedia de los comunes".
“Había una cosa llamada gasolina con plomo”: Avrim Blum, entrevista personal, 17 de diciembre,
2014.
El titular planteó el problema de manera sucinta: Scott K. Johnson, “El clima estable demanda la mayoría de los combustibles fósiles
Permanecer en el suelo, pero ¿de quién? ” Ars Technica , 8 de enero de 2015.
“En ninguna parte es más alto el valor del trabajo”: “En busca del tiempo perdido” , Economist , 20 de diciembre de 2014.
“La gente dudará en tomarse unas vacaciones”: Mathias Meyer, “De abierto (ilimitado) a mínimo
Política de vacaciones ”, 10 de diciembre de 2014, http://www.paperplanes.de/2014/12/10/from-open-to-
política-de-vacaciones-mínimas.html .
"Las tiendas abren antes que nunca": Nicole Massabrook, "Las tiendas abren el Día de Acción de Gracias
2014: Walmart, Target, Best Buy y otros horarios de las tiendas en el Día de Turquía ”, Negocios internacionales
Times , 26 de noviembre de 2014.
"No odies al jugador, odia el juego": Ice-T, "No odies la playa", El séptimo pecado mortal ,
1999.
"Nunca te pongas del lado de nadie en contra de la familia": El Padrino , guión de Mario Puzo
y Francis Ford Coppola, Paramount Pictures, 1972.
"Cargado contra el surgimiento de la cooperación": esta cita de Binmore aparece en un número
de fuentes, incluyendo Binmore, Natural Justice y Binmore, Game Theory . El "categórico" de Kant
imperativo ”se origina en su Fundamento de la metafísica de la moral de 1785 y se discute en su
1788 Crítica de la razón práctica .
mil dólares en efectivo por tomarse unas vacaciones: Libin analiza las motivaciones de las mil
dólares en, por ejemplo, una entrevista con Adam Bryant, "Los teléfonos están fuera, pero el robot está dentro",
New York Times , 7 de abril de 2012.
hacer obligatoria una cierta cantidad mínima de vacaciones : las vacaciones obligatorias ya son un
práctica estándar en finanzas, aunque por motivos de detección de fraude más que por motivos de moral. Para más sobre
Página 387
vacaciones obligatorias y fraude ver, por ejemplo, Philip Delves Broughton, "Take Those Two Weeks Off — or
Else ”, Wall Street Journal , 28 de agosto de 2012.
sin requisitos federales para vacaciones pagadas: Rebecca Ray, Milla Sanes y John Schmitt,
“No-Vacation Nation Revisited”, Center for Economic Policy and Research , mayo de 2013,
http://www.cepr.net/index.php/publications/reports/no-vacation-nation-2013 .
“El corazón tiene sus razones”: como lo expresó Pascal en Pascal, Pensées sur la religion et sur quelques
autres sujets , §277: "Le cœur a ses raisons, que la raison ne connaît point".
“Se puede pensar en el dosel como un prado aéreo”: Dawkins, The Evidence for Evolution .
hace que los ratones pierdan permanentemente el miedo a los gatos: Ingram et al., “Mice Infected with Low-Virulence
Cepas de Toxoplasma Gondii ".
“La moralidad es instinto gregario en el individuo”: The Gay Science , §116, trad. Walter Kaufmann.
“Si la gente espera que respondamos de manera irracional”: Frank, Pasiones dentro de la razón .
“Necesitas un sentimiento que te haga no querer separarte”: Robert Frank, entrevista personal, abril
13, 2015. Frank, "If Homo Economicus Could Choose", contiene esta idea, aunque como se apresura a
reconocer, se basa en trabajos como Schelling, The Strategy of Conflict ; Schelling, “Altruismo,
Mezquindad y otros comportamientos potencialmente estratégicos ”; Akerlof, "Filtros de fidelidad"; Hirshleifer, "On
las emociones como garantes de amenazas y promesas ”; Sen, “Metas, compromiso e identidad”; y
Gauthier, Moral por acuerdo . Frank trata las ideas con la extensión de un libro en Pasiones dentro de la razón .
“Si el prisionero está feliz, ¿por qué encerrarlo?”: Shaw, Man y Superman .
obtiene más del 90% de sus ingresos de la venta de anuncios: los ingresos por publicidad de Google en 2014, como
detallado en su informe de accionistas, fue de $ 59,6 mil millones, aproximadamente el 90,3% de sus ingresos totales de $ 66 mil millones.
Ver https://investor.google.com/financial/tables.html .
recaudando decenas de miles de millones de dólares en ingresos: la subasta AWS-3 que se cerró el 29 de enero de 2015,
resultó en licitaciones ganadoras por un total de $ 44,899 mil millones. Ver http://wireless.fcc.gov/auctions/default.htm?
job = Auction_factsheet & id = 97 .
están sombreando sus ofertas según su predicción de la suya: la estrategia de equilibrio para un
La subasta de primer precio de oferta sellada con dos jugadores consiste en ofertar exactamente la mitad de lo que cree que vale el artículo.
De manera más general, en este formato de subasta con n jugadores, debe ofertar exactamente ( n −1) ⁄ n veces lo que
creo que el artículo vale la pena. Tenga en cuenta que esta estrategia es el equilibrio de Nash pero no es una estrategia dominante;
es decir, nada es mejor si todos los demás también lo hacen, pero no es necesariamente óptimo en todos
circunstancias. Caveat emptor. Además, si no conoce el número de postores en la subasta, el
la estrategia óptima se complica rápidamente; ver, por ejemplo, An, Hu y Shum, "Estimación primero-
Subastas de precios con un número desconocido de postores: un enfoque de clasificación errónea ". De hecho, incluso
los resultados aparentemente limpios— ( n −1) ⁄ n —requieren algunas suposiciones serias, a saber, que los postores son
"Neutral al riesgo" y que sus diferentes valores para el artículo se distribuyen uniformemente entre algunos
distancia. El resultado ( n −1) ⁄ n aquí proviene de Vickrey, "Contraespeculación, subastas y competencia
Licitaciones Selladas ”, quien advierte,“ Si se abandona el supuesto de homogeneidad entre los oferentes,
las matemáticas de un tratamiento completo se vuelven intratables ".
Página 388
la subasta de flores más grande del mundo: para obtener más información sobre la subasta de flores de Aalsmeer, consulte
http://www.floraholland.com/en/about-floraholland/visit-the-flower-auction/ .
un grupo de personas que caen juntas por un acantilado: a veces, estos acantilados son demasiado literales. El nuevo
York Times , por ejemplo, informó sobre la muerte de varios esquiadores de travesía experimentados en
Estado de Washington. Los relatos de los supervivientes muestran cómo terminó un grupo de esquiadores extremadamente hábiles
haciendo algo sobre lo que casi todos los miembros individuales tenían un mal presentimiento.
"Si fuera por mí, nunca habría ido a esquiar fuera de pista con doce personas", dijo uno.
sobreviviente. “Eso es demasiado. Pero hubo una especie de dinámica social de eso, donde yo
no quería ser el que dijera, ya sabes, 'Oye, este es un grupo demasiado grande y no deberíamos estar haciendo
esta.'"
"No hay forma de que todo este grupo pueda tomar una decisión que no sea inteligente", se dijo otro.
“Por supuesto que está bien, si vamos todos. Tiene que estar bien ".
“Todo en mi mente se estaba apagando, queriendo decirles que se detuvieran”, dijo un tercero.
"Pensé: Oh, sí, ese es un mal lugar para estar", relató un cuarto miembro del grupo. "Eso es un
mal lugar para estar con tanta gente. Pero no dije nada. No quería ser el idiota ".
Como resumió el Times : “Todos los lugareños del grupo supusieron que sabían lo que eran los demás
pensando. Ellos no." Ver Branch, "Caída de nieve".
conocida como una "cascada de información": Bikhchandani, Hirshleifer y Welch, "A Theory of Fads".
Véase también Bikhchandani, Hirshleifer y Welch, "Learning from the Behavior of Others".
un precio de venta de más de $ 23 millones: el precio de este título particular de Amazon se notó y
informado por el biólogo Michael Eisen de UC Berkeley; consulte el "libro de Amazon de 23.698.655,93 dólares sobre
moscas ”, 23 de abril de 2011 en el blog de Eisen NO es basura , http://www.michaeleisen.org/blog/?p=358 .
empeorar la irracionalidad del mercado: ver, por ejemplo, las reacciones de la Universidad de Columbia
economista Rajiv Sethi inmediatamente después de la crisis repentina. Sethi, “Trading algorítmico y
Volatilidad de precios."
salvar a toda la manada del desastre: esto también se puede pensar en términos de diseño de mecanismos y
evolución. En promedio, es mejor que cualquier individuo en particular sea un rebaño algo cauteloso
seguidor, sin embargo, todos se benefician de la presencia de algunos miembros del grupo que son testarudos
inconformistas. De esta manera, el exceso de confianza se puede considerar como una forma de altruismo. Para más sobre el
"Proporción socialmente óptima" de tales miembros del grupo, ver Bernardo y Welch, "On the Evolution of
Exceso de confianza y emprendedores ”.
una forma de repensar el diseño de mecanismos: la frase "diseño de mecanismos algorítmicos" entró por primera vez en
literatura técnica en Nisan y Ronen, "Algorithmic Mechanism Design".
"A prueba de estrategia" o simplemente "veraz": los juegos "a prueba de estrategia" también se conocen como
compatible." Consulte Noam Nisan, "Introducción al diseño de mecanismos (para científicos informáticos)", en
Nisan et al., Eds., Teoría de juegos algorítmicos .
Página 389
la honestidad es la estrategia dominante: en términos de teoría de juegos, esto hace que la subasta de Vickrey sea
estrategia compatible con incentivos ”(DSIC). Y un resultado importante en la teoría algorítmica de juegos, conocido como
"Myerson Lemma", afirma que solo hay un mecanismo de pago DSIC posible. Esto significa
que la subasta de Vickrey no es solo una forma de evitar un comportamiento estratégico, recursivo o deshonesto, es el
única manera. Consulte Myerson, "Optimal Auction Design".
un principio
se originó conde teoría"Contraespeculación,
Vickrey, de juegos llamado "equivalencia de ingresos":
subastas y licitaciones el teorema
cerradas de equivalencia
competitivas" y fue de ingresos
generalizado en Myerson, "Optimal Auction Design" y Riley y Samuelson, "Optimal Auctions".
“Creo que es realmente fantástico”: Noam Nisan, entrevista personal, 13 de abril de 2015.
“Una de las mejores cosas que puedes ver”: Paul Milgrom, entrevista personal, 21 de abril de 2015.
CONCLUSIÓN
"Para aprender a vivir bien juntos": Flood, "¿Qué futuro hay para las máquinas inteligentes?"
"Define esto como el acto más sabio ": Russell, "Los elementos de la ética".
saber una buena canción cuando la escuchas: también es la diferencia entre P y NP . Para
rumiaciones filosóficas más deliciosas de esta naturaleza, véase Aaronson, "Reasons to Believe", y
Wigderson, "Conocimiento, creatividad y P versus NP".
ninguno de ellos había querido ver la corrida de toros: Escenarios como éste a veces se llaman
“La paradoja de Abilene”; ver Harvey, "The Abilene Paradox".
moviendo al grupo hacia la resolución: Este punto también ha sido señalado por Tim Ferriss, quien escribe,
“Deja de pedir sugerencias o soluciones y empieza a proponerlas. Empiece por las cosas pequeñas.
En lugar de preguntar cuándo le gustaría a alguien reunirse la próxima semana, proponga sus momentos ideales y
segundas opciones. Si alguien pregunta: '¿Dónde deberíamos comer?', '¿Qué película deberíamos ver?'
¿deberíamos hacer esta noche? 'o algo similar, no lo refleje con' Bueno, ¿qué / cuándo / dónde
tú quieres…?' Ofrezca una solución. Detén el ir y venir y toma una decisión ". Ver Ferriss, The 4-
Horas semanales .
ofreciendo una o dos propuestas concretas: Idealmente, uno querría conocer los valores que cada
La persona del grupo asigna todas las opciones y adopta una política razonable para tomar una decisión.
basado en esos. Un enfoque potencial es simplemente seleccionar la opción que maximiza el producto de
los valores asignados por todos, lo que también permite que cualquiera vete una opción asignándole un valor de
cero. Hay argumentos de economía de que esta es una buena estrategia, que se remonta a John
Nash. Véase Nash, "The Bargaining Problem".
minimizar la cantidad de monedas: Deberá, "Lo que este país necesita es una pieza de 18 ¢".
denominaciones desgarbadas dan vuelta a la realización de cambios: Lueker, “Two NP -Complete Problems in
Programación de enteros no negativos ”, mostró que bajo ciertos supuestos, hacer cambios con el
Página 390
El menor número de monedas es NP -duro. Este resultado es válido si las monedas están denominadas en binario o en
familiar base diez, pero no si están denominados en unario (base uno), que sí tiene un eficiente
solución, como se muestra en Wright, "El problema de hacer cambios". Para más información sobre computacional
complejidad de realizar cambios, consulte también Kozen y Zaks, “Optimal Bounds for the Change-Making
Problema."
Considere un estacionamiento grande: Cassady y Kobza, "A Probabilistic Approach to Evaluate Strategies
para seleccionar un espacio de estacionamiento ", compara" Elija una fila, espacio más cercano (PRCS) "y" Ciclismo
(CYC) ”algoritmos de búsqueda de espacios de estacionamiento. El CYC más complicado incluye una parada óptima
regla, mientras que PRCS comienza en el destino, apuntando hacia afuera, y simplemente toma el primer espacio. Cuanto mas
CYC agresivo encontró mejores espacios en promedio, pero el PRCS más simple realmente ganó en términos de total
tiempo usado. Los conductores que siguieron el algoritmo CYC dedicaron más tiempo a encontrar mejores espacios que los
mejores espacios los salvaron en el tiempo de caminata. Los autores señalan que la investigación de esta naturaleza podría ser útil
en el diseño de estacionamientos. Los modelos computacionales de estacionamiento también se exploran en, por ejemplo, Benenson,
Martens y Birfir, "PARKAGENT: Un modelo de estacionamiento en la ciudad basado en agentes".
"Girar" y "bloquear": para ver en profundidad cuándo girar y cuándo bloquear, consulte, por ejemplo,
Boguslavsky et al., "Estrategias óptimas para girar y bloquear". (Tenga en cuenta que esto es lo mismo
Leonid Boguslavsky que encontramos brevemente en el capítulo 1 en un viaje de esquí acuático).
Página 391
Bibliografía
Página 392
Bellows, Meghan L. y JD Luc Peterson. "Encontrar una tabla de asientos óptima". Anales de
Investigación improbable (2012).
Benenson, Itzhak, Karel Martens y Slava Birfir. "PARKAGENT: un modelo basado en agentes de
Estacionamiento en la Ciudad ". Informática, medio ambiente y sistemas urbanos 32, no. 6 (2008): 431–439.
Berezovsky, Boris y Alexander V. Gnedin. Problemas de mejor elección (en ruso). Moscú:
Akademia Nauk, 1984.
Berg-Kirkpatrick, Taylor y Dan Klein. "Descifrado con un millón de reinicios aleatorios". En
Actas de la Conferencia sobre métodos empíricos en el procesamiento del lenguaje natural (2013):
874–878.
Bernardo, Antonio E. e Ivo Welch. "Sobre la evolución del exceso de confianza y los emprendedores".
Revista de Economía y Estrategia de Gestión 10, no. 3 (2001): 301–330.
Berry, Donald A. "Un bandido de dos brazos de Bernoulli". Annals of Mathematical Statistics 43 (1972):
871–897.
______. "Comentario: Ética y ECMO". Ciencia estadística 4 (1989): 306–310.
Berry, Donald A. y Bert Fristed. Problemas de bandidos: asignación secuencial de experimentos . Nuevo
York: Chapman y Hall, 1985.
Bettencourt, Luís MA, José Lobo, Dirk Helbing, Christian Kühnert y Geoffrey B. West.
"Crecimiento, innovación, escalamiento y ritmo de vida en las ciudades". Procedimientos de la Nacional
Academia de Ciencias 104, no. 17 (2007): 7301–7306.
Bikhchandani, Sushil, David Hirshleifer e Ivo Welch. “Una teoría de las modas, la moda, las costumbres y
Cambio cultural como cascadas informativas ”. Revista de Economía Política 100, no. 5 (1992):
992–1026.
______. "Aprender del comportamiento de los demás: conformidad, modas y cascadas informativas".
Bjarnason, Ronald, Alan Fern y Prasad Tadepalli. "Solitario Klondike de límite inferior con
Planificación de Montecarlo ". En las actas de la XIX Conferencia Internacional sobre Automatización
Planificación y programación, ICAPS 2009 .
Blau, Peter Michael. La dinámica de la burocracia: un estudio de las relaciones interpersonales en dos
Agencias gubernamentales . Chicago: University of Chicago Press, 1955.
Bloom, Burton H. "Compensación de espacio / tiempo en la codificación hash con errores permitidos". Comunicaciones
del ACM 13, no. 7 (1970): 422–426.
Boguslavsky, Leonid, Karim Harzallah, A. Kreinen, K. Sevcik y Alexander Vainshtein. "Óptimo
Estrategias para girar y bloquear ". Revista de Computación Paralela y Distribuida 21, no. 2
(1994): 246-254.
Boorstin, Daniel J. Los descubridores: una historia de la búsqueda del hombre para conocer su mundo y a sí mismo .
Nueva York: Random House, 1983.
Bradt, Russell N., SM Johnson y Samuel Karlin. "Sobre diseños secuenciales para maximizar la
Suma de N observaciones ". Annals of Mathematical Statistics 27 (1956): 1060–1074.
Branch, John. "Snow Fall: The Avalanche at Tunnel Creek". New York Times , 20 de diciembre de 2012.
Brown, Alexander L. y Joanna N. Lahey. Pequeñas victorias: crear una motivación intrínseca en los ahorros
y reducción de la deuda . Reporte técnico. Cambridge, MA: Oficina Nacional de Investigación Económica,
2014.
Página 394
Brush, Eleanor R., David C. Krakauer y Jessica C. Flack. “Una familia de algoritmos para la informática
Consenso sobre el estado del nodo a partir de los datos de la red ". PLoS Computational Biology 9, no. 7 (2013).
Bruss, F. Thomas. “Un enfoque unificado para una clase de problemas de mejor elección con un
Número de opciones ". Annals of Probability 12 (1984): 882–889.
Buch, P. "Future Prospects Discussed". Nature 368 (1994): 107–108.
Buffon, Georges-Louis Leclerc, Comte de. "Essai d'arithmétique moral". Supplément à l'Histoire
naturelle, générale et particuliére 4 (1777): 46-148.
Burks, Arthur W., Herman H. Goldstine y John von Neumann. Discusión preliminar del
Diseño lógico de un instrumento informático electrónico . Princeton, Nueva Jersey: Institute for Advanced
Estudio, 1946.
Burrell, Quentin. "Un modelo estocástico simple para préstamos para bibliotecas". Revista de documentación 36, no.
2 (1980): 115-132.
Burthe Jr., Ronald. "Investigaciones adicionales con la prueba de prima probable fuerte". Matemáticas de
Computación de la American Mathematical Society 65, no. 213 (1996): 373–381.
Cabell, rama de James. El semental plateado . Nueva York: Robert M. McBride, 1926.
Campbell, Donald T. “Variación ciega y retención selectiva en el pensamiento creativo como en otros
Procesos de conocimiento ". Psychological Review 67 (1960): 380–400.
Carpenter, Brian y Robert Hinden. Adaptación de RFC 1149 para IPv6 . Reporte técnico. RFC 6214,
Abril de 2011.
Carroll, Lewis. Sylvie y Bruno concluyeron . Londres: Macmillan, 1893.
Carstensen, Laura L. “Patrones sociales y emocionales en la edad adulta: apoyo para
Teoría de la selectividad ". Psychology and Aging 7 (1992): 331–338.
Cassady, C. Richard y John E. Kobza. "Un enfoque probabilístico para evaluar estrategias para
Seleccionar una plaza de aparcamiento ". Ciencia del transporte 32, no. 1 (1998): 30–42.
Cawdrey, Robert. Una tabla alfabética, conteniendo y enseñando la verdadera escritura, y
comprensión de las palabras duras del inglés vsuall, tomadas del hebreo, griego, latín o
Francés, etc. Con la interpretación del mismo por palabras sencillas en inglés, reunidas para el beneficio y
ayuda de damas, caballeros o cualquier otra persona vnskilfull. Por lo que pueden ser más fáciles
y comprenderán mejor muchas palabras duras en inglés, que oirán o leerán en las Escrituras,
Sermones, o en otros lugares, y también ser capaces de ver los mismos adecuadamente entre sí. Londres: Edmund
Weaver, 1604.
Cayley, Arthur. "Preguntas matemáticas con sus soluciones". Tiempos educativos 23 (1875): 18–
19.
______. Los artículos matemáticos recopilados de Arthur Cayley 10: 587–588. Cambridge, Reino Unido:
Página 395
Chen, Xi y Xiaotie Deng. "Resolver la complejidad del equilibrio de Nash de dos jugadores". En
Fundamentos de la informática , 2006, 261–272.
Chow, YS y Herbert Robbins. "Un teorema y aplicaciones del sistema martingala". En
Actas del cuarto simposio de Berkeley sobre estadística matemática y probabilidad .
Berkeley: Prensa de la Universidad de California, 1961.
______. "Sobre las reglas de parada óptimas". Teoría de la probabilidad y campos relacionados 2 (1963): 33–49.
Chow, YS, Sigaiti Moriguti, Herbert Robbins y SM Samuels. "Selección óptima basada en
Rango relativo (el 'Problema de la secretaria') ". Revista de Matemáticas de Israel 2 (1964): 81–90.
Christian, Brian. "La prueba A / B: dentro de la tecnología que está cambiando las reglas del negocio".
Revista cableada 20, no. 5 (2012).
Christofides, Nicos. Análisis del peor caso de una nueva heurística para el problema del vendedor ambulante .
Informe técnico 388. Pittsburgh: Graduate School of Industrial Administration, Carnegie Mellon
Universidad, 1976.
Churchill, Winston. Winston S. Churchill: Sus discursos completos, 1897–1963 . Editado por Robert
Rhodes James. Londres: Chelsea House, 1974.
Cirillo, Francesco. La técnica Pomodoro . Raleigh, Carolina del Norte: Lulu, 2009.
Clarke, Donald D. y Louis Sokoloff. "Circulación y metabolismo energético del cerebro". En Básico
Neurochemistry: Molecular, Cellular and Medical Aspects , 6a ed., Editado por George J. Siegel,
Bernard W. Agranoff, R. Wayne Albers, Stephen K. Fisher y Michael D. Uhler. Filadelfia:
Lippincott-Raven, 1999, 637–669.
Clauset, Aaron, Cosma Rohilla Shalizi y Mark EJ Newman. "Distribuciones de ley de potencias en
Datos empiricos." Revista SIAM 51, no. 4 (2009): 661–703.
Cobham, Alan. "La dificultad computacional intrínseca de las funciones". En Actas de 1964
Congreso de Lógica, Metodología y Filosofía de la Ciencia . Amsterdam: Holanda Septentrional, 1964.
Conan Doyle, Arthur. "Un estudio en escarlata: las reminiscencias de John H. Watson". En Beeton's
Anual de Navidad , vol. 29. Londres: Ward, Lock, 1887.
Connor, La bruja de James A. Kepler: el descubrimiento de un orden cósmico por parte de un astrónomo en medio de una guerra religiosa,
Intriga política y el juicio por herejía de su madre . Nueva York: HarperCollins, 2004.
Conti, Carl J., Donald H. Gibson y Stanley H. Pitkowsky. “Aspectos Estructurales del Sistema / 360
Modelo 85, I: Organización general ”. IBM Systems Journal 7 (1968): 2-14.
Cook, Stephen A. "La complejidad de los procedimientos de demostración de teoremas". En Actas de la Tercera
Simposio anual de ACM sobre teoría de la computación , 1971, 151-158.
Cook, William. En busca del vendedor ambulante: Matemáticas en los límites de la computación .
Princeton, Nueva Jersey: Princeton University Press, 2012.
Covey, Stephen R. Cómo tener éxito con las personas . Salt Lake City: Montaña de las Sombras, 1971.
Craig, JV Comportamiento agresivo de los pollos: algunos efectos de los entornos social y físico .
Presentado en la 27a Mesa Redonda Nacional Anual de Criadores, 11 de mayo, Kansas City, MO, 1978.
Dale, Andrew I. Una historia de la probabilidad inversa: de Thomas Bayes a Karl Pearson . Nueva York:
Springer, 1999.
Daly, Lloyd W. Contribuciones a la historia de la alfabetización en la antigüedad y la Edad Media .
Bruselas: Latomus, 1967.
Damgård, Ivan, Peter Landrock y Carl Pomerance. "Estimaciones de error de caso promedio para los
Probable Prime Test. " Matemáticas de la Computación 61, no. 203 (1993): 177-194.
Daniels, Bryan C., David C. Krakauer y Jessica C. Flack. "Código de conflicto escaso en un primate
Sociedad." Actas de la Academia Nacional de Ciencias 109, no. 35 (2012): 14259–14264.
Página 396
(2009): 195-259.
Davis, Lydia. Casi sin memoria: Historias . Nueva York: Farrar, Straus & Giroux, 1997.
Dawkins, Richard. La evidencia de la evolución, el espectáculo más grande de la Tierra . Nueva York: Free Press,
2009.
DeDeo, Simon, David C. Krakauer y Jessica C. Flack. “Evidencia de periodicidades estratégicas en
Dinámica de conflictos colectivos ". Revista de The Royal Society Interface , 2011.
DeGroot, Morris H. Decisiones estadísticas óptimas . Nueva York: McGraw-Hill, 1970.
Demaine, Erik D., Susan Hohenberger y David Liben-Nowell. "Tetris es difícil, incluso
Aproximado." En Computación y combinatoria , 351–363. Nueva York: Springer, 2003.
DeMillo, Richard A. y Richard J. Lipton. “Una observación probabilística sobre el programa algebraico
Pruebas." Cartas de procesamiento de información 7, no. 4 (1978): 193-195.
Denning, Peter J. "Golpes: sus causas y prevención". En Actas del 9 al 11 de diciembre,
1968, Conferencia Conjunta de Computación de Otoño, Parte I , 1968, 915–922.
Diffie, Whitfield y Martin E. Hellman. "Nuevas direcciones en criptografía". Teoría de la información,
Transacciones IEEE el 22, no. 6 (1976): 644–654.
Dillard, Annie. Peregrino en Tinker Creek . Nueva York: Harper's Magazine Press, 1974.
______. La vida de la escritura . Nueva York: Harper & Row, 1989.
Dodgson, Charles Lutwidge. "Torneos de tenis sobre hierba: el verdadero método de asignar premios con
una prueba de la falacia del método actual ". St. James's Gazette , 1 de agosto de 1883: 5–6.
Durant, Will. La historia de la filosofía: las vidas y opiniones de los grandes filósofos . Nuevo
York: Simon & Schuster, 1924.
Edmonds, Jack. "Ramificaciones óptimas". Revista de investigación de la Oficina Nacional de Normas
71B, no. 4 (1967): 233–240.
______. "Caminos, árboles y flores". Revista Canadiense de Matemáticas 17, no. 3 (1965): 449–467.
Erlang, Agner Krarup. “Solución de algunos problemas en la teoría de probabilidades de significancia en
Intercambios telefónicos automáticos ”. Elektrotkeknikeren 13 (1917): 5–13.
______. "La teoría de las probabilidades y las conversaciones telefónicas". Nyt Tidsskrift para Matematik B
Ferguson, Thomas S., Janis P. Hardwick y Mitsushi Tamaki. "Maximizar la duración de la propiedad
un objeto relativamente mejor ". En Estrategias para la búsqueda secuencial y la selección en tiempo real , 37–57.
Página 397
RAND, 1952.
______. "El problema del vendedor ambulante". Investigación de operaciones 4, no. 1 (1956): 61–75.
______. "¿Qué futuro hay para las máquinas inteligentes?" Revisión de comunicación audiovisual 11,
Página 398
1958–2008: Desde los primeros años hasta el estado del arte . Editado por Michael Juenger, Thomas M.
Liebling, Denis Naddef, George L. Nemhauser, William R. Pulleyblank, Gerhard Reinelt,
Giovanni Rinaldi y Laurence A. Wolsey. Berlín: Springer, 2010, 243–281.
Gigerenzer, Gerd y Henry Brighton. "Homo Heuristicus: Por qué las mentes sesgadas mejoran
Inferencias ". Temas de ciencia cognitiva 1, no. 1 (2009): 107–143.
Gilbert, Daniel. Tropezando con la felicidad . Nueva York: Knopf, 2006.
Gilbert, John P. y Frederick Mosteller. "Reconociendo el máximo de una secuencia". Diario de la
Asociación Estadounidense de Estadística 61 (1966): 35–75.
Gilboa, Itzhak y Eitan Zemel. “Nash y los equilibrios correlacionados: cierta complejidad
Consideraciones ". Juegos y comportamiento económico 1, no. 1 (1989): 80–93.
Gillispie, Charles Coulston. Pierre-Simon Laplace, 1749–1827: Una vida en ciencia exacta . Princeton,
Nueva Jersey: Princeton University Press, 2000.
Gilmore, Paul C. y Ralph E. Gomory. “Un enfoque de programación lineal para el material de corte
Problema, Parte II ". Investigación de operaciones 11, no. 6 (1963): 863–888.
Gilovich, Thomas. Cómo sabemos lo que no es así . Nueva York: Simon & Schuster, 2008.
Ginsberg, Allen. Aullidos y otros poemas . San Francisco: Libros de luces de la ciudad, 1956.
Gittins, John C. "Procesos de bandidos e índices de asignación dinámica". Diario de la estadística real
Sociedad, Serie B (Metodológica) 41 (1979): 148-177.
Gittins, John C., Kevin Glazebrook y Richard Weber. Índices de asignación de bandidos de armas múltiples , segundo
ed. Chichester, Reino Unido: Wiley, 2011.
Gittins, John C. y D. Jones. “Un índice de asignación dinámica para el diseño secuencial de
Experimentos ". En progreso en estadística . Amsterdam: Holanda Septentrional, 1974, 241–266.
Glassner, Barry. "Técnicas narrativas de infundir miedo". Social Research 71 (2004): 819–826.
Goldberg, Paul W. y Christos H. Papadimitriou. "Reducibilidad entre problemas de equilibrio".
Simposio ACM sobre Teoría de la Computación 2006, 62–70.
Bien, Irving John. Buen pensamiento: los fundamentos de la probabilidad y sus aplicaciones .
Minneapolis, MN: University of Minnesota Press, 1983.
Gopnik, Alison, Andrew N. Meltzoff y Patricia K. Kuhl. El científico en la cuna . Nueva York:
Morrow, 1999.
Gordon, Deborah M. "Control sin jerarquía". Nature 446, no. 7132 (2007): 143.
Gott, JR "Futuros prospectos discutidos". Nature 368 (1994): 108.
______. "Implicaciones del principio copernicano para nuestras perspectivas futuras". Nature 363 (1993):
315–319.
Gould, Stephen Jay. "La mediana no es el mensaje". Descubre 6, no. 6 (1985): 40–42.
Graham, Ronald L., Eugene L. Lawler, Jan Karel Lenstra y Alexander HG Rinnooy Kan.
"Optimización y aproximación en secuenciación y programación deterministas: una encuesta".
Annals of Discrete Mathematics 5 (1979): 287–326.
Grenander, Ulf. "Sobre el análisis espectral empírico de procesos estocásticos". Arkiv para Matematik 1,
no. 6 (1952): 503–531.
Gridgeman, T. "Probabilidad geométrica y el número π ". Scripta Mathematika 25, no. 3 (1960):
183-195.
Griffiths, Thomas L., Charles Kemp y Joshua B. Tenenbaum. "Modelos bayesianos de cognición". En
El Manual de Cambridge de Modelado Cognitivo Computacional . Editado por Ron Sun.
Página 399
Cambridge, Reino Unido: Cambridge University Press, 2008.
Griffiths, Thomas L., Falk Lieder y Noah D. Goodman. “Uso racional de los recursos cognitivos:
Niveles de análisis entre lo computacional y lo algorítmico ". Temas de ciencia cognitiva
7 (2015): 217–229.
Griffiths, Thomas L., David M. Sobel, Joshua B. Tenenbaum y Alison Gopnik. "Bayes y
Blickets: Efectos del conocimiento sobre la inducción causal en niños y adultos ”. Ciencia cognitiva
35 (2011): 1407–1455.
Griffiths, Thomas L., Mark Steyvers y Alana Firl. "Google y la mente: predecir la fluidez con
Rango de página." Psychological Science 18 (2007): 1069–1076.
Griffiths, Thomas L. y Joshua B. Tenenbaum. "Predicciones óptimas en la cognición cotidiana".
Psychological Science 17 (2006): 767–773.
Grossman, Dave y LW Christensen. En combate . Belleville, IL: Publicaciones de investigación de PPCT,
2004.
Haggstrom, Gus W. "Procedimientos secuenciales óptimos cuando se requiere más de una parada".
Annals of Mathematical Statistics 38 (1967): 1618–1626.
Halevy, Alon, Peter Norvig y Fernando Pereira. "La efectividad irrazonable de los datos".
Sistemas inteligentes, IEEE 24, no. 2 (2009): 8–12.
Hardin, Garrett. "La tragedia de los comunes." Ciencia 162, no. 3859 (1968): 1243-1248.
Hardy, GH Obras completas . Vol. II. Oxford, Reino Unido: Oxford University Press, 1967.
______. "Números primos." Informe de la Asociación Británica 10 (1915): 350–354.
Harmenberg, J. Epee 2.0: El nacimiento del nuevo paradigma de la esgrima . Nueva York: SKA Swordplay
Libros, 2007.
Harsanyi, John C. “¿Puede el principio de Maximin servir como base para la moralidad? Una crítica de Juan
Teoría de Rawls ". The American Political Science Review 69, no. 2 (1975): 594–606.
Harvey, Jerry B. "La paradoja de Abilene: la gestión del acuerdo". Dinámica organizacional
3, no. 1 (1974): 63–80.
Hastings, WK "Métodos de Monte Carlo que utilizan cadenas de Markov y sus aplicaciones". Biometrika
57 (1970): 97–109.
Hawken, Angela y Mark Kleiman. Manejo de personas en libertad condicional involucradas con drogas con Swift and Certain
Sanciones: Evaluación de la ESPERANZA de Hawái . Informe presentado al Instituto Nacional de Justicia.
2009. http://www.ncjrs.gov/pdffiles1/nij/grants/229023.pdf .
Held, Michael y Richard M. Karp. “El problema del vendedor ambulante y la extensión mínima
Árboles." Investigación de operaciones 18, no. 6 (1970): 1138-1162.
______. "El problema del vendedor ambulante y los árboles de expansión mínima: parte II". Matemático
Página 400
Hillis, W. Daniel. El patrón en la piedra: las ideas simples que hacen que las computadoras funcionen . Nuevo
York: Basic Books, 1998.
Hirshleifer, Jack. "Sobre las emociones como garantes de amenazas y promesas". En The Latest on the
Mejor: Ensayos sobre evolución y optimización . Editado por John Dupre, 307–326. Cambridge, MA: MIT
Prensa, 1987.
Hoffman, David. Los oligarcas: riqueza y poder en la nueva Rusia . Nueva York: Asuntos Públicos,
2003.
Horvitz, Eric y Shlomo Zilberstein. "Compensaciones computacionales bajo recursos acotados".
Inteligencia artificial 126 (2001): 1–4.
Hosken, James C. "Evaluación de los métodos de clasificación". En artículos y debates presentados en el
7 al 9 de noviembre de 1955, Conferencia sobre informática conjunta AIEE-IRE del este: Computadoras en los negocios y
Sistemas industriales , 39–55.
Hurd, Cuthbert C. "Una nota sobre los primeros cálculos de Monte Carlo y reuniones científicas". IEEE
Annals of the
Impagliazzo, History
Russell ofWigderson.
y Avi Computing "7,Pno. 2 (1985):
= BPP 141-155.circuitos exponenciales:
si E requiere
Desaleatorizar el lema XOR ". En las actas del vigésimo noveno simposio anual de ACM
on Theory of Computing , 1997, 220–229.
______. "Aleatoriedad frente a tiempo: desaleatorización bajo un supuesto uniforme". en Actas
del 39º Simposio anual sobre fundamentos de la informática , 1998, 734–743.
Ingram, Wendy Marie, Leeanne M. Goodrich, Ellen A. Robey y Michael B. Eisen. "Ratones infectados
con cepas de baja virulencia de Toxoplasma gondii pierden su aversión innata a la orina de gato, incluso
Después de una amplia eliminación de parásitos ". PLOS ONE , no. 9 (2013): e75246.
Jackson, James R. Programación de una línea de producción para minimizar la tardanza máxima . Reporte técnico
43. Proyecto de investigación en ciencias de la gestión, Universidad de California, Los Ángeles, 1955.
Jacobson, Van. "Evitación y control de la congestión". En comunicación informática ACM SIGCOMM
Revisión 18, no. 4 (1988): 314–329.
______. "Una nueva forma de ver las redes". Conferencia en Google, Mountain View, CA, agosto
2006. https://www.youtube.com/watch?v=oCZMoY3q2uM.
James, William. "Grandes hombres, grandes pensamientos y el medio ambiente". Atlantic Monthly 46 (1880):
441–459.
______. Psicología: Curso Breve . Nueva York: Holt, 1892.
Jay, Francine. The Joy of Less: A Minimalist Living Guide: Cómo ordenar, organizar y simplificar
Tu vida . Medford, Nueva Jersey: Anja Press, 2010.
Jeffreys, Harold. "Una forma invariante para la probabilidad previa en problemas de estimación". Actas
de la Royal Society de Londres. Serie A. Ciencias físicas y matemáticas 186 (1946): 453–
461.
______. Teoría de la probabilidad , 3ª ed. Oxford, Reino Unido: Oxford University Press, 1961.
Johnson, Selmer Martin. “Programas de producción óptimos de dos y tres etapas con tiempos de configuración
Incluido." Naval Research Logistics Quarterly 1, no. 1 (1954): 61–68.
Johnson, Theodore y Dennis Shasha. "2Q: un búfer de alto rendimiento con gastos generales bajos
Algoritmo de sustitución de la gestión ". VLDB '94 Actas de la 20a Internacional
Conferencia sobre bases de datos muy grandes , 1994, 439–450.
Jones, Thomas B. y David H. Ackley. "Criticidad de comparación en algoritmos de clasificación". En 2014
44a Conferencia Internacional Anual IEEE / IFIP sobre redes y sistemas confiables (DSN) ,
Página 401
Karmarkar, Narendra. "Un nuevo algoritmo de tiempo polinomial para la programación lineal". En
Actas del Decimosexto Simposio Anual de ACM sobre Teoría de la Computación , 1984, 302–311.
Karp, Richard M. "Introducción a los algoritmos aleatorios". Matemáticas aplicadas discretas 34,
no. 1 (1991): 165–201.
______. "Reducibilidad entre problemas combinatorios". En la complejidad de los cálculos informáticos ,
Página 402
Addison-Wesley, 1997.
______. "Una propuesta terminológica". ACM SIGACT News 6, no. 1 (1974): 12–18.
______. "La puesta a punto de TeX de 2014". Remolcador 35, no. 1 (2014).
______. Cosas de las que rara vez habla un informático . Stanford, CA: Centro para el estudio de
364–378.
______. Théorie analytique des probabilités . París: Mme Ve Courcier, 1812.
Página 403
Lazzarini, Mario. “Un'applicazione del calcolo della probabilità alla ricerca sperimentale di un valore
approssimato di π ”. Periodico di Matematica 4 (1901): 140-143.
Lee, Donghee, SH Noh, SL Min, J. Choi, JH Kim, Yookun Cho y Chong Sang Kim. “LRFU:
Un espectro de políticas que incluye las menos utilizadas recientemente y las menos utilizadas
Políticas ". IEEE Transactions on Computers 50 (2001): 1352-1361.
Le Guin, Ursula K. "Los que se alejan de Omelas". En nuevas dimensiones 3 . Editado por
Robert Silverberg. Nueva York: Signet, 1973.
Lenstra, Jan Karel. "El poder místico de Twoness: In Memoriam Eugene L. Lawler". Diario de
Programación 1, no. 1 (1998): 3–14.
Lenstra, Jan Karel, Alexander HG Rinnooy Kan y Peter Brucker. “Complejidad de la máquina
Problemas de programación ". Annals of Discrete Mathematics 1 (1977): 343–362.
Lerner, Ben. Las figuras de Lichtenberg . Port Townsend, WA: Copper Canyon Press, 2004.
Lindley, Denis V. "Programación dinámica y teoría de la decisión". Estadísticas aplicadas 10 (1961): 39–
51.
Lippman, Steven A. y John J. McCall. "La economía de la búsqueda de empleo: una encuesta". Económico
Investigación 14 (1976): 155–189.
Lorie, James H. y Leonard J. Savage. "Tres problemas en el racionamiento del capital". Revista de negocios
28, no. 4 (1955): 229–239.
Lowe, Christopher J., Mark Terasaki, Michael Wu, Robert M. Freeman Jr., Linda Runft, Kristen
Kwan, Saori Haigo, Jochanan Aronowicz, Eric Lander, Chris Gruber, et al. Dorsoventral
Patrones en hemicordados: conocimientos sobre la evolución temprana de los cordados ". PLoS Biology 4, no. 9
(2006): e291.
Lucas, Richard E., Andrew E. Clark, Yannis Georgellis y Ed Diener. "Reexaminando la adaptación
y el modelo de punto de ajuste de la felicidad: reacciones a los cambios en el estado civil ". Diario de
Personalidad y psicología social 84, no. 3 (2003): 527–539.
Lueker, George S. "Two NP-Complete Problems in Nonnegative Integer Programming". Técnico
Informe TR-178 , Laboratorio de Ciencias de la Computación, Universidad de Princeton, 1975.
Luria, Salvador E. Una máquina tragamonedas, un tubo de ensayo roto: una autobiografía . Nueva York: Harper &
Row, 1984.
MacQueen, J. y RG Miller. "Políticas de persistencia óptima". Investigación de operaciones 8 (1960): 362–
380.
Malthus, Thomas Robert. Ensayo sobre el principio de población . Londres: J. Johnson, 1798.
Marcus, Gary. Kluge: La evolución fortuita de la mente humana . Nueva York: Houghton Mifflin
Harcourt, 2009.
Markowitz, Harry. "Selección de cartera". Revista de Finanzas 7, no. 1 (1952): 77–91.
______. Selección de carteras: diversificación eficiente de inversiones . Nueva York: Wiley, 1959.
Martin, Thomas Commerford. "Contando una nación por electricidad". Ingeniero eléctrico 12, no. 184
(1891): 521–530.
McCall, John. "Economía de la información y la búsqueda de empleo". Revista Trimestral de Economía 84
(1970): 113–126.
McGrayne, Sharon Bertsch. La teoría que no moriría: cómo la regla de Bayes rompió el enigma
Code, caza submarinos rusos y emergió triunfante de dos siglos de
Controversia . New Haven, CT: Yale University Press, 2011.
McGuire, Joseph T. y Joseph W. Kable. "Los tomadores de decisiones calibran la persistencia del comportamiento en el
Base de la experiencia de intervalo de tiempo ". Cognición 124, no. 2 (2012): 216–226.
Página 404
______. "Las predicciones temporales racionales pueden ser la base de los fracasos aparentes para retrasar la gratificación".
Mucci, AG "Sobre una clase de problemas de secretarios". Annals of Probability 1 (1973): 417–427.
Murray, David. Capítulos de Historia de la Teneduría de libros, Contabilidad y Aritmética Comercial .
Glasgow, Reino Unido: Jackson, Wylie, 1930.
Myerson, Roger B. "El equilibrio de Nash y la historia de la teoría económica". Revista de economía
Literature 1999, 1067–1082.
______. "Diseño de subasta óptimo". Matemáticas de la investigación operativa 6, no. 1 (1981): 58–73.
Página 405
Página 406
Poundstone, William. Fórmula de la fortuna: la historia no contada del sistema científico de apuestas que
Vence a los casinos y Wall Street . Nueva York: Macmillan, 2005.
______. El dilema del prisionero: John von Neumann, teoría de juegos y el rompecabezas de la bomba . Nuevo
Página 407
2004.
Rose, John S. "Un problema de elección y asignación óptimas". Investigación de operaciones 30 (1982):
172-181.
Rosenbaum, David A., Lanyun Gong y Cory Adam Potts. "Precrastinación: acelerar el subobjetivo
Finalización a expensas de un esfuerzo físico adicional ". Ciencia psicológica 25, no. 7 (2014):
1487–1496.
Rosenbluth, Marshall. Marshall Rosenbluth, entrevistado por Kai-Henrik Barth . 11 de agosto de 2003,
College Park, MD.
Rostker, Bernard D., Harry J. Thie, James L. Lacy, Jennifer H. Kawata y Susanna W. Purnell. los
Ley de gestión de personal de oficiales de defensa de 1980: una evaluación retrospectiva . Santa Mónica,
CA: RAND, 1993.
Roughgarden, Tim y Éva Tardos. "¿Qué tan grave es el enrutamiento egoísta?" Revista del ACM 49, no. 2
(2002): 236–259.
Russell, Bertrand. "Los elementos de la ética". En Philosophical Essays , 13–59. Londres: Longmans,
Verde, 1910.
Russell, Stuart y Peter Norvig. Inteligencia artificial: un enfoque moderno, 3ª ed. Sillín superior
River, Nueva Jersey: Pearson, 2009.
Russell, Stuart y Eric Wefald. Haz lo correcto . Cambridge, MA: MIT Press, 1991.
Sagan, Carl. El cerebro de Broca: reflexiones sobre el romance de la ciencia . Nueva York: Random House,
1979.
Sakaguchi, Minoru. "Juegos secuenciales bilaterales relacionados con el problema de la secretaria sin información".
Mathematica Japonica 29 (1984): 961–974.
______. "Programación dinámica de algún diseño de muestreo secuencial". Revista de Matemáticas
Análisis y aplicaciones 2 (1961): 446–466.
Sakaguchi, Minoru y Mitsushi Tamaki. “Sobre el problema del aparcamiento óptimo en qué espacios
Aparecen aleatoriamente ". Boletín de Informática y Cibernética 20 (1982): 1–10.
Sartre, Jean-Paul. Sin salida: una obra de teatro en un acto . Nueva York: Samuel French, 1958.
Schelling, Thomas C. "Altruismo, mezquindad y otros comportamientos potencialmente estratégicos". americano
Revista Económica 68, no. 2 (1978): 229–230.
______. La estrategia del conflicto . Cambridge, MA: Harvard University Press, 1960.
Página 408
Sethi, Rajiv. "Negociación algorítmica y volatilidad de precios". Rajiv Sethi (blog), 7 de mayo de 2010,
http://rajivsethi.blogspot.com/2010/05/algorithmic-trading-and-price.html.
Sevcik, Kenneth C. "Programación de pérdidas totales mínimas mediante distribuciones de tiempo de servicio".
Revista del ACM 21, no. 1 (1974): 66–75.
Lo haré, Jeffrey. "Lo que este país necesita es una pieza de 18 ¢". Inteligencia matemática 25, no. 2
(2003): 20–23.
Shasha, Dennis y Cathy Lazere. Fuera de sus mentes: las vidas y los descubrimientos de 15 grandes
Científicos informáticos . Nueva York: Springer, 1998.
Shasha, Dennis y Michael Rabin. "Una entrevista con Michael Rabin". Comunicaciones del
ACM 53, no. 2 (2010): 37–42.
Shaw, Frederick S. Introducción a los métodos de relajación . Nueva York: Dover, 1953.
Shaw, George Bernard. Hombre y Superman: una comedia y una filosofía . Cambridge, MA: Harvard
Prensa universitaria, 1903.
Shoup, Donald. El alto costo del estacionamiento gratuito . Chicago: APA Planners Press, 2005.
Simon, Herbert A. "Un modelo de comportamiento de elección racional". Revista Trimestral de Economía 69,
no. 1 (1955): 99-118.
______. Modelos de hombre . Nueva York: Wiley, 1957.
______. "En una clase de funciones de distribución sesgadas". Biometrika , 1955, 425–440.
Siroker, Dan. "Cómo Obama recaudó $ 60 millones mediante la ejecución de un experimento simple". El Optimizely
Blog: Pruebas A / B que utilizará en realidad (blog), 29 de noviembre de 2010,
https://blog.optimizely.com/2010/11/29/how-obama-raised-60-million-by-running-a-simple-
experimento / .
Siroker, Dan y Pete Koomen. Pruebas A / B: la forma más eficaz de convertir los clics en clientes .
Nueva York: Wiley, 2013.
Sleator, Daniel D. y Robert E. Tarjan. "Eficiencia amortizada de las reglas de paginación y actualización de listas".
Comunicaciones del ACM 28 (1985): 202-208.
Smith, Adam. La teoría de los sentimientos morales . Impreso para A. Millar, en el Strand; y A. Kincaid
y J. Bell, en Edimburgo, 1759.
Smith, MH "Un problema de secretaria con el empleo incierto". Journal of Applied Probability 12,
no. 3 (1975): 620–624.
Smith, Wayne E. "Varios optimizadores para la producción de una sola etapa". Logística de investigación naval
Trimestral 3, núms. 1–2 (1956): 59–66.
Solovay, Robert y Volker Strassen. "Una prueba rápida de Montecarlo para determinar la originalidad". SIAM Journal en
Computing 6 (1977): 84–85.
Starr, Norman. "Cómo ganar una guerra si es necesario: detención óptima basada en carreras exitosas". Anales
de Estadística Matemática 43, no. 6 (1972): 1884–1893.
Stephens, David W. y John R. Krebs. Teoría del forrajeo . Princeton, Nueva Jersey: Princeton University Press,
1986.
Stewart, Martha. Manual de limpieza del hogar de Martha Stewart: La guía esencial para cuidar
Todo en tu hogar . Nueva York: Clarkson Potter, 2006.
Steyvers, Mark, Michael D. Lee y Eric-Jan Wagenmakers. "Un análisis bayesiano de humanos
Toma de decisiones sobre problemas de bandidos ". Revista de Psicología Matemática 53 (2009): 168-179.
Stigler, George J. "La economía de la información". Journal of Political Economy 69 (1961): 213–
225.
Página 409
______. "Parada óptima en el problema de estacionamiento con giro en U". Diario de probabilidad aplicada 25
(1988): 363–374.
Thomas, Helen. Primera fila de la Casa Blanca: mi vida y mi época . Nueva York: Simon & Schuster,
2000.
Thompson, William R. “Sobre la probabilidad de que una probabilidad desconocida supere a otra a la vista
de la evidencia de dos muestras ". Biometrika 25 (1933): 285-294.
Thoreau, Henry David. "Caminando." Atlantic Monthly 9 (1862): 657–674.
Tibshirani, Robert. "Contracción de regresión y selección a través del lazo". Diario de la Real
Sociedad estadística. Serie B (Metodológica) 58, no. 1 (1996): 267–288.
Tikhonov, AN y VY Arsenin. Solución de problemas planteados . Washington, DC: Winston, 1977.
Todd, Peter M. "Mecanismos cognitivos coevolucionados en la búsqueda de pareja". Evolución y la mente social:
Psicología evolutiva y cognición social (Nueva York) 9 (2007): 145-159.
Todd, Peter M. y GF Miller. “Del orgullo y el prejuicio a la persuasión: satisfacción en el mate
Buscar." En heurísticas simples que nos hacen inteligentes . Editado por G. Gigerenzer y PM Todd. Nuevo
York: Oxford University Press, 1999, 287–308.
Tolins, Jackson y Jean E. Fox Tree. "Los canales de retorno del destinatario dirigen el desarrollo narrativo".
Journal of Pragmatics 70 (2014): 152-164.
Tracy, Brian. ¡Come esa rana! 21 excelentes maneras de dejar de procrastinar y hacer más en menos
Tiempo . Oakland, CA: Berrett-Koehler, 2007.
Turing, Alan M. "Sobre números computables, con una aplicación al problema de Entscheidung".
Leído el 12 de noviembre de 1936. Actas de la London Mathematical Society s2-42, no. 1 (1937):
230-265.
______. "Sobre números computables, con una aplicación al problema Entscheidungs: A
Página 410
Ware, James H. "Investigando terapias de grandes beneficios potenciales: ECMO". Ciencia estadística 4
(1989): 298-306.
Ware, James H. y Michael F. Epstein. “Comentarios sobre 'Circulación extracorpórea en neonatos
Insuficiencia respiratoria: un estudio prospectivo aleatorizado 'por RH Bartlett et al. ” Pediatría 76, no.
5 (1985): 849–851.
Warhol, Andy. La filosofía de Andy Warhol (de A a B y viceversa) . Nueva York: Harcourt
Brace Jovanovich, 1975.
Weiss, Yair, Eero P. Simoncelli y Edward H. Adelson. "Ilusiones de movimiento como percepciones óptimas".
Nature Neuroscience 5 (2002): 598–604.
Whittaker, Steve y Candace Sidner. "Sobrecarga de correo electrónico: exploración de información personal
Gestión del correo electrónico ". En Actas de la Conferencia SIGCHI sobre Factores Humanos en
Computing Systems , 1996, 276–283.
Whittaker, Steve, Tara Matthews, Julian Cerruti, Hernan Badenes y John Tang. "¿Estoy desperdiciando mi
¿Tiempo de organización del correo electrónico? Un estudio sobre el reencuentro de correo electrónico ". En Actas de la Conferencia SIGCHI
sobre factores humanos en sistemas informáticos , 2011, 3449–3458.
Whittle, Peter. Optimización en el tiempo: Programación dinámica y control estocástico . Nueva York:
Wiley, 1982.
______. "Bandidos inquietos: asignación de actividades en un mundo cambiante". Diario de probabilidad aplicada
25 (1988): 287–298.
Wigderson, Avi. "Conocimiento, creatividad y P versus NP ".
http://www.math.ias.edu/~avi/PUBLICATIONS/MYPAPERS/AW09/AW09.pdf , 2009.
Wilkes, Maurice V. "Memorias esclavas y asignación dinámica de almacenamiento". Transacciones IEEE en
Electronic Computers 14 (1965): 270-271.
Wright, JW "El problema del cambio". Revista de la Asociación de Maquinaria Informática
22 (1975): 125-128.
Wulf, William Allan y Sally A. McKee. "Golpear el muro de la memoria: implicaciones de lo obvio".
ACM SIGARCH Computer Architecture News 23, no. 1 (1995): 20–24.
Xu, Fei y Joshua B. Tenenbaum. "El aprendizaje de palabras como inferencia bayesiana". Revisión psicológica
114 (2007): 245–272.
Yang, Mark CK “Reconociendo el máximo de una secuencia aleatoria en función del rango relativo con
Solicitud hacia atrás ". Journal of Applied Probability 11 (1974): 504-512.
Yato, Takayuki y Takahiro Seta. “Complejidad e integridad de encontrar otra solución y
Su aplicación a los rompecabezas ". Transacciones de IEICE sobre fundamentos de electrónica,
Comunicaciones y Ciencias de la Computación 86, no. 5 (2003): 1052–1060.
Yngve, Victor H. "Acerca de cómo obtener una palabra en Edgewise". En Chicago Linguistics Society, sexta reunión ,
1970, 567–578.
Zahniser, Rick. "Timeboxing para el mejor rendimiento del equipo". Desarrollo de software 3, no. 3 (1995):
34–38.
Zapol, Warren M., Michael T. Snider, J. Donald Hill, Robert J. Fallat, Robert H. Bartlett, L. Henry
Edmunds, Alan H. Morris, E. Converse Peirce, Arthur N. Thomas, Herbert J. Proctor y col.
“Oxigenación de membrana extracorpórea en insuficiencia respiratoria aguda grave: una
Estudio prospectivo." Revista de la Asociación Médica Estadounidense 242, no. 20 (1979): 2193–2196.
Zelen, Marvin. "Juegue la regla del ganador y el ensayo clínico controlado". Diario del americano
Asociación de Estadística 64, no. 325 (1969): 131–146.
Página 411
Zippel, Richard. "Algoritmos probabilísticos para polinomios dispersos". En los procedimientos de EUROSAM '79
del Simposio Internacional de Computación Simbólica y Algebraica . Londres: Springer,
1979, 216-226.
Página 412
Índice
Página 413
Amazonas
"¿Estoy perdiendo el tiempo organizando el correo electrónico?" (Whittaker)
anarquía, precio de
Anderson, John
anécdotas, estadísticas vs.
enfado
recocido
Annie (musical)
Annie Get Your Gun (musical)
Ansari, Aziz
envío anticipado del paquete
hormigas
búsqueda de apartamento
grupo de solicitantes
Arquímedes
arquitectos
Aristóteles
ARPANET
redes neuronales artificiales
“Asociación de enfermedad con ingestión previa de nuevos alimentos” (Revusky y Bedarf)
Astley, Rick
AT&T
Atlántico mensual
Superordenador Atlas
bomba atómica
subastas
Holandés o descendiente
Inglés o ascendente
cascadas de información y
primer precio de oferta sellada
segundo precio de oferta sellada o Vickrey
Austen, Jane
Regla promedio
Compañía AvtoVAZ
canales de retorno
ruido de fondo
mutaciones bacterianas
ancho de banda, latencia vs.
caídas de ancho de banda
Baran, Paul
Barnard, Chester
Bartlett, Robert
baloncesto
procesamiento por lotes
Bavelas, Janet
Bayes, Rev. Thomas
Página 414
Regla de Bayes
definido
BBC
noticias de la BBC
Mente hermosa, A (Nasar)
belleza
Bedarf, Erwin
Bélády, László “Les”
Algoritmo de Bélády
Belew, Rik
Bell, Alexander Graham
curva de campana
Bellman, Richard
Fuelle, Meghan
Informe Belmont
puntos de referencia
Berezovsky, Boris
Berkeley, obispo George
muro de Berlín
Bernard, Claude
Berry, Don
rendimiento en el mejor de los casos
Bezos, Jeff
big data
Notación Big-O. Ver también tiempo constante; tiempo exponencial; tiempo factorial; tiempo linealitmico; lineal
tiempo; tiempo polinomial; tiempo cuadrático
Conferencia Big Ten
Bikhchandani, Sushil
horario de pago de facturas
Bing
Binmore, Ken
nacimientos, varones frente a mujeres
Bitcoin
"Variación ciega y retención selectiva" (Campbell)
bloqueo
Bloom, Burton H.
Bloomberg Businessweek
Filtro de floración
Blum, Avrim
Boguslavsky, Leonid
encuadernación
Booker, Christopher
torneos de corchetes
Bradáč, Zdeněk
rompiendo la simetría
Brighton, Henry
burbujas, financiero
Ordenamiento de burbuja
Página 415
Clasificación de cubos
bufferbloat
amortiguadores
Buffon, George-Louis Leclerc, conde de
problema de ladrones
Burks, Arthur
negocio. Ver también problema de la secretaria
sobreajuste y
promociones
reuniones semanales
Buxtun, Peter
Problema de los generales bizantinos
Página 416
clarividencia
ensayos clínicos
armario, organizador
Cobham, Alan
Tesis de Cobham-Edmonds
Cockcroft, George (Luke Rhinehart)
agua de coco
deterioro cognitivo
coincidencias
monedas
denominaciones
lanzamientos de dos cabezas
alzadores
problema de compromiso
comunicaciones. Ver también idioma; redes; narración
confirmación
previos y
agricultura apoyada por la comunidad (CSA)
Clasificación de recuento de comparación
sitios web de comparación de precios
complejidad
penalizando
computación, definida por Turing
bondad computacional
intervalo de confianza
confirmación
congestión
evitación de
precio de la anarquía y
Máquina de conexión
tiempo constante ( O (1))
problemas de optimización restringidos
problema restringido, preferencias por
Relajación de restricción
proyectos de construcción
redes de distribución de contenido (CDN)
cambio de contexto
problemas de optimización continua
Relajación continua
control sin jerarquía
Cooper, Martín
cooperación
Principio copernicano
Copérnico, Nicolás
marketing corporativo
análisis coste-beneficio
Cramer, Jim
Sistema Cravath
Página 417
creatividad
cola de crepes
Validación cruzada
criptografía
tiempos de espera del servicio al cliente
Darwin, Charles
datos. Consulte también Big Data; pequeños datos
idolatría de
sobreajuste y
prediciendo desde un solo punto
Fechado. Ver amor; matrimonio
Davis, Lydia
Dawkins, Richard
plazos
Sociedad de poetas muertos (película)
Deal or No Deal (programa de televisión)
avalancha de deudas
bola de nieve de la deuda
sistemas descentralizados
Toma de decisiones
bondad computacional y
Parada temprana y
sobreajuste y
atajos del mundo real
cuando pensar menos
descifrado
decusación
deserción
Ley de gestión de personal de los oficiales de defensa
ataque de denegación de servicio
Denning, Peter
búferes de dispositivo
Hombre de los dados, el (Rhinehart)
Ataque de diccionario
Dillard, Annie
función de descuento
optimización discreta
Técnicas de relajación discretas (Henderson)
desplazamiento
distribuciones. Ver también tipos específicos
Dodgson, Charles Lutwidge (Lewis Carroll)
jerarquías de dominio
estrategias dominantes
honestidad como
el dilema del prisionero y la deserción como
bolas caídas
Página 418
drogadicción
ensayos de medicamentos
Dupuis, Beth
Duvall, Bill
Dwan, Tom
asignación dinámica. Ver índice de Gittins
jerarquías dinámicas
"Consecuencias disfuncionales de las mediciones del desempeño" (Ridgway)
oreja
Fecha de vencimiento más temprana
Parada anticipada
¡Come esa rana! (Tracy)
Ebbinghaus, Hermann
ECMO (oxigenación por membrana extracorpórea)
ciencias económicas. Ver también subastas; estrategias de inversión; comportamiento del mercado
burbujas
Equilibrio de Nash y
tragedia de los comunes y
Economista
Edmonds, Jack
Evaluación Educativa
Edwards, Ward
algoritmo eficiente
problema eficiente o manejable, definido
Los reinados de los faraones egipcios
órgano de memoria eléctrica
tono de ascensor
Email
emociones
Engel, Joel
Eno, Brian
movimiento ambiental
epidemiología
igualdad
equilibrio
Erlang, Agner Krarup
Distribución de Erlang
barras de error
espacio de compensación de errores
ética
Evernote
políticas de desalojo
evolución
restricciones y
valor esperado
Notificación explícita de congestión (ECN)
Página 419
Facebook
tiempo factorial ( O ( n !))
manía
falsos positivos
FBI
Subastas de espectro de la FCC
FDA
realimentación
Esgrima
presentación
Finkel, Larry
Firefox
problema del camión de bomberos
Primero en entrar, primero en salir (FIFO)
aptitud física
Fitzgerald, F. Scott
Flack, Jessica
memoria flash
jerarquías planas
Inundación, Merrill
control de flujo
comida
manía
minimizando podrido
sobreajuste y
Forbes
olvidando la curva
perdón
Forster, EM
Lista de Fortune 500
Frank, Robert
Franklin, Benjamín
Fredrickson, Barbara
Frito, jason
juegos de información completa
parada óptima y
inversores fundamentales
futuro, descontado
Galileo
juego
teoría de juego
juego de azar
Página 420
Gantt, Henry
diagramas de Gantt
Gardner, Martín
Gaskell, RE
Gauss, Carl Friedrich
Gelatt, Dan
geografía
descuento geométrico
George, Sammy
Problema de los tanques alemanes
hacer las cosas importantes
resolviendo las cosas
Hacer las cosas (Allen)
Gettys, Jim
Gigerenzer, Gerd
Gilbert, Daniel
Ginsberg, Allen
Gittins, John
Índice de Gittins
Dar directamente
Glassner, Barry
Gleason, Andrew
máximo global
metas, explícitas
Padrino
Padrino, El (película)
Goethe, Johann Wolfgang von
Goldstine, Herman
Soluciones "suficientemente buenas"
Google
Gopnik, Alison
Gordon, Deborah
Gott, J. Richard, III
Gould, Stephen Jay
Gobierno
"Grandes hombres, grandes pensamientos y el medio ambiente" (James)
algoritmo codicioso
Grellet, Stephen
Grossman, Dave
guardián
Libro Guinness de los récords mundiales, el
la violencia armada
detener el problema
Hammerbacher, Jeff
Hansson, David Heinemeier
Hardin, Garrett
Página 421
Hardy, GH
Haxton, Isaac
la reforma de salud
Hedberg, Mitch
Hennessy, John
comportamiento de rebaño
heurística
jerarquías. Ver jerarquías de dominancia; jerarquías dinámicas; jerarquías planas
Alto costo de estacionamiento gratuito, The (Shoup)
Montañismo
Reinicio aleatorio o escopeta
Hillis, Danny
Hirshleifer, David
Ho, Jordania
Hoffman, David
Hollerith, Herman
Máquina de Hollerith
inicio, almacenamiento en caché y
honestidad
Presa Hoover
ESPERAR
Hosken, JC
tarifa por hora
venta de casa
burbuja inmobiliaria
humanos
penalización por complejidad y
creatividad y
diseño de oreja
explorar / explotar y
modas frente a tradición y
control de flujo y
la esperanza de vida de
memoria y
diseño del sistema nervioso
costos de tiempo y
Hume, David
IBM
Hielo T
"Si ..." (Kipling)
IKEA
importancia, priorizando las tareas por
imposibilidades, convertidas en penas
resultado de imposibilidad
inacción, irrevocabilidad de
estructuras de incentivos
Página 422
distribuciones de ingresos
accidentes industriales
información. Consulte también juegos de información completa; juegos sin información
cascadas de información
jerarquías de información
procesamiento de información
Tipo de inserción
Tiempos de negocios internacionales
Internet. Ver también ancho de banda, latencia vs .; redes; sitios web
conexiones rapidas
geografía de
infraestructura de
protocolos y
seguridad y
interrumpir la fusión
interrupciones
problemas intratables
definido
equilibrio y
relajación y
programación y
Introducción a los métodos de relajación, An (Shaw)
corazonadas intuitivas
estrategias de inversión
invitaciones
desinterés involuntario
Jacobson, Van
Jain, Kamal
James, William
Jarvis, Richard
Tiburón (película)
Jay, Francine
Jeffreys, Harold
Laboratorio de propulsión a chorro (JPL)
estar nervioso
Jobs, Steve
búsqueda de trabajo
Johnson, Selmer
Jones, William
Joy of Less, The (Jay)
juicio
Enfoque de "simplemente jugar el juego"
sociedad justa
Kaelbling, Leslie
Kahn, Robert "Bob"
Página 423
Kant, Emmanuel
Karels, Michael
Karp, Richard
Kaushik, Avinash
Kayal, Neeraj
Keats, John
Manteniendo las cosas encontradas encontradas (Jones)
Kenney, Richard
Kepler, Johannes
Kerr, Clark
Keynes, John Maynard
al-Khwārizmī
Sistema de bibliotecas del condado de King (KCLS)
Rey de la colina
Kipling, Rudyard
Kirkpatrick, Scott
Kleinrock, Leonard
Kline, Charley
problema de la mochila
Knuth, Donald
Koomen, Pete
Torneos de escalera
Lagrange, Joseph-Louis
Relajación Lagrangiana
Lai, Tze Leung
lanceta de duela del hígado
Lange, Rebecca
idioma
Lao Tse
Laplace, Pierre-Simon
Ley de Laplace
Lazo
latencia
tardanza, minimizando el máximo
lavandería
cumplimiento de la ley
Lawler, Eugene "Gene"
"Torneos de tenis sobre hierba" (Dodgson)
Ley de Arqueo Bruto
Lawrence, Peter A.
Laboratorio Lawrence Berkeley (LBL)
pleitos
Lazzarini, Mario
Menos usados recientemente (LRU)
Lee, Michael
regla de inserción del lado izquierdo
Página 424
Le Guin, Ursula K.
Lenstra, Jan Karel
Lerner, Ben
arrasamiento
libertad
Libin, Phil
bibliotecas
probabilidad
agrupación similar
Lincoln, Abraham
tiempo linealítmico ( O ( n log n ))
tiempo lineal ( O ( n ))
lingüística
Linux
trampa para langostas
máximo local
tasas logarítmicas
burlar
Regla de mirar y luego saltar
Los Alamos
Los Angeles Times
amor. Véase también matrimonio
citas y
teoría de juegos y
búsqueda de oro vs.
escenario de recuperación
escenario de rechazo
Ludin, Stephen
Luria, Salvador
Mach, Ernst
Magaddino, Salvatore
Liga Mayor de Béisbol
Making of a Fly, The (Lawrence)
Malthus, Thomas
Proyecto Manhattan
control de personal
maratón
locura de Marzo
derecho de paso marítimo
comportamiento del mercado. Ver también subastas; burbujas financieras; ciencias económicas; estrategias de inversión
Markowitz, Harry
matrimonio. Ver también amor
Validación cruzada y
La lista pro-contra de Darwin y
modelos de satisfacción con la vida
el dilema del prisionero y
Página 425
prueba de malvavisco
Mars Pathfinder
algoritmos de coincidencia
McLay, Laura Albert
optimización de la cartera de varianza media
reproducción mecánica
diseño de mecanismo
la honestidad como meta de
medios de comunicación
Mellen, Andrew
jerarquía de memoria
distribuciones sin memoria
gestión de la memoria
pared de la memoria
Menger, Karl
Mergesort
Mertes, Miqueas
desorden
compensación búsqueda-ordenación
autoorganizado
clasificación y
metabolismo
metatrabajo
métrica
sobreajuste y
apoderado
programación y
Metrópolis, Nicolás
Algoritmo de metrópolis
Meyer, Mathias
Meyer, Robert
Milgrom, Paul
militar
comunicaciones y
formación de cicatrices y
Molino, John Stuart
Miller, Gary
Prueba de primalidad de Miller-Rabin
rebanada mínima
árbol de expansión mínimo
Mintzberg, Henry
Mischel, Walter
Mitzenmacher, Michael
Método Monte Carlo
Moore, Gordon
Algoritmo de Moore
Ley de Moore
Morgenstern, Julie
Página 426
Morse, Samuel FB
crisis hipotecaria de
Moser, Leo
Mosteller, Frederick
películas
ingresos brutos de taquilla y
tiempos de ejecución y
secuelas y
Mozart, Wolfgang Amadeus
bandidos armados múltiples
Regla multiplicativa
multitarea
tasa de homicidios
Murphy, Tom
Myerson, Roger
algoritmo miope
Nakamura, Hikaru
Nash, John
equilibrio de Nash
Campeón Nacional de Clasificación de Bibliotecas
Naturaleza
NBA
NCAA
sistema nervioso
Netflix
redes. Ver también Internet
colas de red
Neumann, Christof
Redes neuronales
reportes de noticias
Newton, Isaac
Biblioteca Pública de Nueva York (NYPL)
New York Times
Nichols, Kathleen
Nietzsche, Friedrich
modelos de nueve factores
Nisan, Noam
Noguchi, Yukio
Sistema de archivo Noguchi
juegos sin información
ruido
distribución normal
Norvig, Peter
sin rendirse, nunca
Ahora hábito, el (Fiore)
reacciones nucleares
Página 427
guerra nuclear
Obama, Barack
Estrategias oblicuas
La navaja de Occam
tasa de ocupación
subastas de derechos petroleros
Oligarcas, el (Hoffman)
Juegos Olímpicos
modelos de un factor
función unidireccional
Sobre el origen de las especies (Darwin)
parada óptima
"Triple o nada" y
optimismo
problemas de optimización
intratable, definido
aleatoriedad y
relajación y
orden, costo de. Ver también ordenar
números ordinales
Organizar desde adentro hacia afuera (Morgenstern)
Ortega y Gasset, José
resultado, proceso vs.
sobreajuste
Página 428
Peter, Laurence J.
Principio de Peter
Ensayo filosófico sobre probabilidades
pi (π), estimando el valor de
palomas
pilas, autoorganizadas
ataque de ping
Pinkham, Roger
Pirsig, Robert
Horca
Pizza Hut
Plagenhoef, Scott
algoritmos para jugar al ganador
poesía
Poincaré, Henri
póker
aviso
sin límite
campañas politicas
prueba de identidad polinomial
tiempo polinomial ( O ( n 2 ), O ( n 3 ), etc.)
pomodoros
popularidad
gestión de la cartera
apartado Postal
problema de mensajería postal
distribuciones de ley de potencias
Prabhakar, Balaji
Pratt, Vaughan
restricciones de precedencia
predicción. Véase también la regla de Bayes; Principio copernicano
toma de decisiones como
Parada temprana y
idolatría de datos y
influencia de los medios en
sobreajuste y
distribuciones anteriores y
derecho preferente de compra
creencias preexistentes
preferencias
apego preferencial
Centro de clasificación de Preston
Precio, Richard
precio de la anarquía
prueba de primalidad
testigo en contra
números primos
Página 429
tiempo cuadrático ( O ( n 2 ))
rompiendo la barrera
hacer cola
dejar de fumar mientras está por delante
Rabin, Michael
carrera contra lucha
problema de rifa
Ramscar, Michael
Vínculo "Artículo aleatorio"
Desalojo aleatorio
algoritmos aleatorios
aleatoriedad
cuanto usar
la creación de redes y romper la simetría y
reinicios aleatorios
Rapoport, Amnón
Raskin, Aza
Rawls, John
analítica en tiempo real
Página 430
escenario de recuperación
recetas
recursividad
atraer al oponente a
estrategias que cortan
Reddit
bosque de secuoyas
Reeves, Glenn
arrepentirse, minimizar
Regularización
rechazo
relajación
aleatoriedad vs.
leyes religiosas
políticas de reemplazo
compensación entre capacidad de respuesta y rendimiento
restaurante
elección de
asientos abiertos y
bandido inquieto
Reuttinger, Susanna
principio de revelación
venganza
principio de equivalencia de ingresos
distribuciones previas de ingeniería inversa
teoría de juegos inversa
Revusky, Samuel
Rhinehart, Luke. Ver Cockcroft, George
Ridgway, MB
Rivest, Ron
Robbins, Herbert
Robinson, Julia
robustez
lista de canciones de la banda de rock
piedra Papel tijeras
Rogers, Kenny
Romney, Mitt
Rosenbaum, David
Roughgarden, Tim
Round-Robin
Rousso, Vanessa
planificacion de la ruta. Véase también el problema del viajante de comercio; vacaciones, itinerario de
flexión de reglas
Rush, Barbara
Russell, Bertrand
Oligarcas rusos
Programa de ajedrez Rybka
Página 431
Sagan, Carl
muestreo. Ver también aleatoriedad
San Francisco
Sartre, Jean-Paul
Saxena, Nitin
diciendo que no
escala, clasificación y
distribuciones libres de escala
Planificación
Schmidt, Eric
Schmidt, Peter
Escolar, Lael
Ciencias
Científico americano
Gestión científica
Científico en el pesebre, El (Gopnik)
Seale, Darryl
búsqueda, brecha entre verificación y
los motores de búsqueda
compensación búsqueda-ordenación
listas autoorganizadas
escenario de segunda oportunidad
problema de la secretaria
variante de ladrón
variante de información completa
recordar la variante
variante de rechazo
siembra
enrutamiento egoísta
listas autoorganizadas
procesamiento secuencial de información
serenidad
Lo haré, Jeffrey
Shaw, George Bernard
Shi, Yong
Shoenfield, José
horario de la tienda
El tiempo de procesamiento más corto
no ponderado
ponderado
Shoup, Donald
Compañía petrolera Sibneft
Tamiz de Erasotenos
Silicon Valley
Recocido simulado
Sinatra, Frank
Eliminación única
programación de una sola máquina
Página 432
Siroker, Dan
Talla
jerarquías de dominación y
jerarquía de memoria y
clasificación y
Skype
Sleator, Daniel
máquinas tragamonedas
pequeños datos
como grandes datos disfrazados
Smith, Adam
Smith, Dan
fútbol
medios de comunicación social
Red social, La (película)
redes sociales
politica social
calcetines, clasificación
software, término acuñado
discos de estado sólido
solitario
clasificación
Clasificación y búsqueda (Knuth)
compensación de clasificación y búsqueda
leche de soja
compensaciones espacio-tiempo
SpaceX
hilado
Deportes
comisionado de la liga
sobreajuste y
programación de temporada
estructuras de torneo
Grupo de programación deportiva
ardillas
SRAM
pruebas estandarizadas
Ciencia estadística
estado
orden jerárquico y
carreras contra peleas y
Stewart, Martha
Steyvers, Mark
bolsa de Valores. Ver también estrategias de inversión
comercio algorítmico y
accidente repentino de 2010
almacenamiento
narración
Página 433
Stucchio, Chris
suma de tiempos de finalización
suma de tiempos de finalización ponderados
suma de los retrasos ponderados de los trabajos
super sistema de archivo
Caída de la cola
Tardos, Éva
Tarjan, Robert
cambiar de tarea
Taylor, Frederick
TCP diente de sierra. Consulte también Protocolo de control de transmisión (TCP)
enseñando a la prueba
inversores técnicos
telégrafo
teléfono
temperatura
localidad temporal
Tenenbaum, Josh
torneos de tenis
Texas Hold 'Em
mensajes de texto
"TeX Tuneup de 2012, The" (Knuth)
Comercio de Acción de Gracias
robo, respuestas irracionales y
Cosas de las que rara vez habla un informático (Knuth)
Regla del 37%
Thoreau, Henry David
paliza
enhebrar
Tres príncipes de Serendip, el
Regla de umbral
rendimiento
Tibshirani, Robert
Tikhonov, Andrey
tiempo
intervalo de
timeboxing
costos de tiempo
gestión del tiempo
compensaciones espacio-temporales
Tolins, Jackson
Tomlinson, Ray
distribuciones del tamaño de la ciudad
Toxoplasma gondii
tráfico
tragedia de los comunes
Página 434
cicatrices de entrenamiento
sistemas de tránsito
Protocolo de control de transmisión (TCP)
ACK y
canales de retorno y
control de flujo y
precio de la anarquía y
problema del vendedor ambulante
Tratar, Tyler
"Tratado sobre la probabilidad de las causas de los acontecimientos" (Laplace)
Árbol, Jean Fox
Truco, Michael
triple apretón de manos
juego de triple o nada
planificación de viajes. Ver también problema del viajante
Turing, Alan
máquina de Turing
tomar turnos
Estudio de sífilis de Tuskegee
Tversky, Amos
Twain, Mark
primos gemelos
Gorjeo
modelos de dos factores
programación de dos máquinas
UC Berkeley
Ulam, Stanislaw "Stan"
Ullman, Ellen
incertidumbre
Unilever
"Efectividad irrazonable de los datos, la" (Norvig)
Sistema "arriba o fuera"
Límite superior de confianza
planeadores urbanos
Fuerzas Armadas de EE. UU.
Censo de EE. UU.
Cámara de Representantes de EE. UU.
Servicio de Salud Pública de EE. UU.
Vueltas en U
vacaciones
correo electrónico y
itinerario de
política sobre
vacunación
Vail, Alfred
Página 435
puesto de valet
velo de ignorancia
verificación, brecha entre búsqueda y
Vickrey, William
Subasta de Vickrey
Vita Coco
mensaje de voz
transmisión de voz, Internet
Voltaire
Von Neumann, John
Wagenmakers, E.-J.
Wagner, Richard
espera, costo-beneficio de
"Caminar" (Thoreau)
Walpole, Horacio
guerra
Ware, Jim
Warhol, Andy
Estrella de Washington
poder
diseño web
sitios web. Ver también Internet
publicidad y
"Akamaized"
Retroceso exponencial y
malicioso
plan de asientos de boda
Wedgwood, Emma
estrategias ponderadas
Welch, Ivo
Whitney, Hassler
Whittaker, Steve
Whittle, Peter
Wikipedia
Wilkes, Maurice
Williams, Robin
Ganar-quedarse, perder-turno
redes inalámbricas
sabiduría
ilusiones
Wittgenstein, Ludwig
Horas laborales
Segunda Guerra Mundial
análisis del peor de los casos
Wright, Steven
Página 436
Yeltsin, Boris
Yngve, Víctor
Joven, decano
Zelen, Marvin
Algoritmo de Zelen
Zen y el arte del mantenimiento de motocicletas (Pirsig)
Zen de Python, El
suma cero
opción cero-cero
Zijlstra, Peter
Orden Z
Página 437
Expresiones de gratitud
Página 438
Guerrero de pelo largo, Steve Whittaker, Avi Wigderson, Jacob Wobbrock, Jason
Wolfe y Peter Zijlstra.
Gracias a la Biblioteca Pública del Condado de King, la Biblioteca Pública de Seattle,
Northern Regional Library Facility y las bibliotecas de UC Berkeley para
entre bastidores pasa a sus operaciones.
Gracias a aquellos con quienes mantuvimos correspondencia, quienes nos señalaron en el
dirección de la investigación que vale la pena conocer, incluidos Sharon Goetz, Mike Jones,
Tevye Krynski, Elif Kuş, Falk Lieder, Steven A. Lippman, Philip Maughan,
Sam McKenzie, Harro Ranter, Darryl A. Seale, Stephen Stigler y Kevin
Thomson, Peter Todd, Sara M. Watson y Sheldon Zedeck.
Gracias a muchos de aquellos con quienes la conversación condujo en poco tiempo a
muchas de las ideas contenidas en este documento, y de las cuales la siguiente es una
lista: Elliot Aguilar, Ben Backus, Liat Berdugo, Dave Blei, Ben Blum, Joe
Damato, Eva de Valk, Emily Drury, Peter Eckersley, Jesse Farmer, Alan
Fineberg, Chrix Finne, Lucas Foglia, John Gaunt, Lee Gilman y Martin
Vidriero, Adam Goldstein, Sarah Greenleaf, Graff Haley, Ben Hjertmann,
Greg Jensen, Henry Kaplan, Sharmin Karim, Falk Lieder, Paul Linke, Rose
Linke, Tania Lombrozo, Brandon Martin-Anderson, Sam McKenzie, Elon
Musk, el grupo Neuwrite de la Universidad de Columbia, Hannah Newman, Abe
Othman, Sue Penney, Dillon Plunkett, Kristin Pollock, Diego Pontoriero,
Avi Press, Matt Richards, Annie Roach, Felicity Rose, Anders Sandberg,
Claire Schreiber, Gayle y Rick Shanley, Max Shron, Charly Simpson,
Najeeb Tarazi, Josh Tenenbaum, Peter Todd, Peter van Wesep, Shawn Wen,
Jered Wierzbicki, Maja Wilson y Kristen Young.
Gracias al excelente software gratuito y de código abierto que hizo
el trabajo posible: Git, LaTeX, TeXShop y TextMate 2, para empezar.
Gracias a quienes prestaron sus habilidades y esfuerzos en varios frentes: para
Lindsey Baggette, David Bourgin y Tania Lombrozo para bibliografía
e investigación de archivos.
Gracias a la Biblioteca de la Universidad de Cambridge por el permiso para imprimir
Maravillosa página del diario de Darwin, y a Michael Langan por una nítida
restauración de los mismos.
Gracias a Henry Young por un retrato nítido.
Página 439
Página 441
TAMBIÉN POR BRIAN CHRISTIAN
Página 442
Página 443
Sobre el editor
Australia
HarperCollins Publishers (Australia) Pty.Ltd.
Nivel 13, 201 Elizabeth Street
Sídney, NSW 2000, Australia
http://www.harpercollins.com.au
Canadá
HarperCollins Canadá
2 Bloor Street East - Piso 20
Toronto, ON, M4W, 1A8, Canadá
http://www.harpercollins.ca
Nueva Zelanda
HarperCollins Publishers (Nueva Zelanda) Limited
Apartado de correos 1
Auckland, Nueva Zelanda
http://www.harpercollins.co.nz
Reino Unido
Página 444
Estados Unidos
HarperCollins Publishers Inc.
195 Broadway
Nueva York, NY 10007
http://www.harpercollins.com